Üzemeltető: Blogger.
2011. február 3., csütörtök

postheadericon PRC készítés házilag 1.rész - Javaslatok

Kiválló .prc gyárosunk Elminster saját tapasztalatai alapján elkészítette és monitorra(papírra) vetette az igényes és egységes .prc készítés folyamatát. 
Ezek a leírások mobil készülékekre készültek, de a Kindle DX is tökéletesen kezeli az így elkészített .prc e-book-okat.


ELŐÍRÁSOK ÉS JAVASLATOK
a
Mobipocket PRC állományok készítéséhez

Ez a rövid összefoglaló azt a célt szolgálja, hogy segítséget nyújtson a PRC konvertálásokhoz és egy bizonyos mértékig egységesítse a Kindle e-book reader és Mobipocket Reader olvasóprogramhoz készült elektronikus könyvek formátumát.
Feltételezzük, hogy a szövegszerkesztők használatában jártas vagy, így ez a leírás nem fog lépésről-lépésre (kattintásról-kattintásra) utasításokat tartalmazni. A Mobipocket Creator Publisher változatát használd a PRC állományok készítéséhez. A program többféle bemeneti formátumot elfogad, de az itt lefektetett formai követelmények teljesítése komoly szövegszerkesztői beavatkozásokat igényelnek, így erősen javasoljuk, hogy DOC formátummal dolgozzál és profi szövegszerkesztőt használj a nyersanyag felkészítéséhez. Ez a leírás a Microsoft Word működését és funkcióit veszi alapul. Természetesen használhatsz más DOC formátum-képes szövegszerkesztőt (pl. OpenOffice) de nagyban megkönnyíted az életed, ha a szövegszerkesztőd fejlett keresés-csere funkcióval rendelkezik.
A javasolt műveletek egy része a konvertálás során keletkező HTML fájlok szerkesztését is igényli, így nem árt egy kis alapvető tudás a HTML-szabványról és a használható tag-ekről. A HTML szerkesztését mindig text-es szerkesztővel végezd, mert a Word-höz hasonló szövegszerkesztők visszaraknák ugyanazokat a töltelék formázásokat, amiktől éppen megszabadulni igyekszünk. Használhatod a Windows beépített „Jegyzettömb”-jét vagy más, gyorsabb text-es szerkesztőt, amit a Creator beállításainál is megadhatsz a HTML-fájlok alapértelmezett szerkesztőjeként.

A felsorolt előírások és javaslatok tulajdonképpen a következő három szabályból származnak, és a pontok között nem említett esetek és problémák megoldásakor is javasoljuk ezek szem előtt tartását:

1. Szabály: A legszűkebb keresztmetszet
A PRC-ket a legkisebb kijelzőjű és a legkevesebb beállítással (pl. betűméret) rendelkező Series60-as olvasókhoz készítsed. Ha ezeken a mobilokon jól használható az anyag, akkor a komolyabb eszközök Reader-jei is elfogadható minőségben tudják a szöveget megjeleníteni. Ha nincs Symbian Series60-as mobilod, akkor a végeredmény ellenőrzését - bizonyos korlátok között - a Reader Emulator PC-s vagy a Mobipocket Reader programokkal teheted meg.
2. Szabály: Az olvasó kiszolgálása
Mivel a Mobipocket PRC-k tovább már nem alakíthatóak, neked, mint a konvertálást végzőnek kell minden olyan változtatást, bővítést és hibaellenőrzést a lehetőségeidhez mérten elvégezni, amely az olvasást gördülékenyebbé és a PRC fájl használatát rugalmasabbá teszi.
3. Szabály: Gondos és alapos munka
Egy konvertálást el lehet végezni 5 perc és 5 óra alatt is. Ha a szöveg olyan hibájával találkozol, amely javítása időigényes (pl. bennmaradt sorvégi elválasztójelek), akkor se sajnáld az időt ezek kézi (vagy félautomata) kijavítására. Tartsd szem előtt, hogy amit bennhagysz a PRC-ben, az miatt valaki más - az olvasó - fog bosszankodni.

Akkor most csapjunk bele! Azok az előírások, amelyeket a PRC könyvek egységesítése miatt fontosnak tartanak „(kötelező)” jelzést kaptak, kérjük ezeket tartsd be. A javasolt eljárásoknál említett kézi keresés-csere azt jelenti, hogy a keresőfunkció találatain egyenként lépkedsz végig a Következő gombbal, az automatikus csere pedig Az összes cseréje gomb használatát jelenti. A dőlt betűvel írt keresőkombinációk természetesen nem tartalmazzák a + jelet, csak a megnevezett karaktereket. A pontokba szedett javaslatok erősen ötletszerű sorrendben vannak, egyes tevékenységek azonban lehet, hogy egymásra épülve hatékonyabban végrehajthatók, így természetesen rajtad áll, hogy milyen javítási-felkészítési sorrendet alakítasz ki magadnak. És a legfontosabb: mindig tarts meg egy eredeti, módosítatlan változatot a bekonvertálandó anyagból, soha nem tudhatod mikor lesz rá szükséged a felkészítés során!

1.        Nyers-szöveget csak biztos forrásból! A neten számos helyen találhatsz TXT, DOC, RTF, HTML vagy PDF formátumú digitalizált könyveket. Beszerzési helyeket nem áll módunkban adni, de itt is igaz a bibliai idézet: „Aki keres, az talál és aki zörget, annak megnyittatik.” A megtalálható anyagok változatos minőségűek, a nyers OCR állományoktól a többször ellenőrzött fájlokig terjednek. Ha lehetőséged van, természetesen az ellenőrzött forrásból dolgozzál, könnyebb lesz a munkád.
2.        A HTML, DOC és RTF fájlformátumok esetében nem szükséges komolyabb előkészítő munka, a szövegszerkesztőbe betöltve azonnal használhatóak, és az esetek többségében átnézett szövegváltozatot tartalmaznak.
3.        A PDF formátum nagy gáz. A fájlból - ha nincs levédve - másol-beilleszt művelettel ki lehet menteni a szöveg anyagát TXT fájlba (az újabb Acrobat Reader-ek txt mentés menüponttal is rendelkeznek, de ez se ad jobb eredményt). A PDF-ből készült szövegek legnagyobb baja, hogy a txt változat minden sora bekezdésjellel (Enter) végződik és emiatt a valódi bekezdések kezdete és vége eltűnik.
Kézzel vagy keresés-cserével nagyon nagy munka a valódi bekezdések egységesítése, amelynek egyik lehetséges lépésről-lépésre megoldását a 15.pont tartalmazta. Szerencsére időközben profi OCR programokba is beintegrálták a PDF-visszakonvártálás funkcióját. Ha tehát PDF->DOC átalakításra van szükséged, akkor warez oldalakról szerezd be az ABBY Finereader-t vagy az ABBY PDF Transformer-t (de meg is veheted, ha sok pénzed van...)
Mindkét program gyakorlatilag az optikai karakterfelismeréshez hasonló elven „újradigitalizálja” a PDF lapokat, úgyhogy készüljél fel: a végeredmény számos tekintetben közelebb fog állni az OCR nyersanyagokhoz, mint a korrektúrázott DOC/RTF szövegekhez. Ennek ellenére különösen jól használható mindkét program a PDF visszakonvertálásra.
4.        A TXT fájlok gyakran a nyers, az OCR munka kimeneteként keletkező szöveget tartalmazzák. Mivel ezek semmiféle javításon nem estek még át hemzseghetnek az OCR (betű-felismerési) hibáktól és itt is érvényes, hogy a sorvégeken esetleg bekezdésjeleket találsz, amelyektől bonyolult megszabadulni. Csak akkor állj neki ilyen anyaggal dolgozni, ha komolyan gondolod, ugyanis lényegesen több munkád lesz vele! A karakterfelismerő programok számos téves karaktert tudnak bizonytalan betűkép alapján megadni, valamint a papíron lévő foltok is plusz írásjelekként (pl. aposztróf, csillag) jelentkeznek. Kis tapasztalattal kiismerhetőek a legfontosabb tévesztések (pl. 1=l, 6=ő), valamint, hogy milyen egyéb extra karaktereket kell keresni és kitörölni a szövegből.
5.        A neten találhatók speciális e-book fájlformátumú anyagok is, pl. a LIT. Ezek feldolgozásához külön konvertáló-programokat kell keresned, ha egyáltalán léteznek ilyenek. A Mobipocket PRC-hez például egyenlőre nem találtunk visszafelé működő konvertáló-programot. Ha találsz ezekhez a fájlokhoz doc-ba, html-be vagy txt-be alakító programot, akkor nyersanyagként felhasználhatod, egyébként csak a megfelelő olvasóprogrammal elolvashatod a szerzeményedet.
6.        Fájlnevek és könyvcímek (kötelező). A Creator Publisher ingyenessé válásával több lehetőségünk van a fájlnév és a könyvcím befolyásolására, mint korábban. A szabadság ellenére továbbra is be kell tartani néhány szabályt.
A Creator a DOC befordításakor a fájlnévből képzi a publikációs könyvtár és az OPF publikáció-adatfájl nevét. Nehezen birkózik meg az ékezetes magyar karakterekkel, így inkább használd a bevált web-biztos fájlnevezést: ékezetmentes, csupa kisbetűs, szünet-helyett-aláhúzásos formájú DOC fájlnevet adjál a nyersanyagodnak.
A Reader programok könyvtárlistáiba kerülő címet a Creator kitölthető metadata mezőinél adhatod meg. Ide írd be a könyv címét a magyar helyesírás szabályai szerint (kis és nagybetűk használata, szóköz és nem aláhúzás!). Ebben a címben ne szerepeljen a szerző neve vagy egyéb információ, csak a könyvcím! Ha a könyv egy regényciklus része, akkor a ciklus megnevezésével és a regény sorszámával kezdődjön a cím: pl. StarWars-03-A sith-ek bosszúja. Figyelj arra, hogy a Symbian S60-as kijelzőkön a könyvtárlista az egyes regények címének első 12-16 karakterét tudja csak megjeleníteni, tehát legalább a regényciklus neve és a sorszám bele kell, hogy férjen ebbe a mennyiségbe! Ha szükséges a regényciklus megnevezését értelemszerűen rövidítsd le, vagy válassz egy rövidebb, de jellemző másik ciklus-megnevezést.
7.        Stílusok rendberakása (kötelező). A szövegállományok, főleg ha Word-el készültek, számos korábban definiált stílusú szövegrészt tartalmazhatnak. A Mobipocket Creator a stílusokat egyénileg és önhatalmúlag értelmezi ezért a konverzió eredménye ritkán egyezik meg a várakozásoddal. Két lehetőséget kínálunk a probléma megoldására vagy megkerülésére. Egyrészt a teljes szöveget „stílustalaníthatod”, azaz az első betűtől az utolsóig „normál” stílusúra állíthatod, vagy pedig következetes „normál”+„címsor” stílusú strukturált szöveggé alakítod. A döntés rajtad áll, de a választott megoldás befolyásolni fogja a későbbi műveletek egy részét.
Azért, hogy a munkád közben te magad ne szaporítsd a felesleges stílusok számát, A Word beállításai -> Nyelvi ellenőrzés -> Automatikus javítási beállítások -> Automatikus formázás beíráskor-nál mindenképpen kapcsold ki a Stílus definiálása a formázások alapján-t! (Valami hasonló az OpenOffice-ban is van, ott is a kikapcsolása a javasolt.)
8.        A stílusmentes szöveg elkészítésére a következő eljárást javasoljuk Word2007 esetén. Első lépésben a betöltött nyersanyag Stílusok listájában a Beállítások-nál a megjelenítendő stílusokat állítsd a használatban lévőkre, a stílusként megjelenítendő formázásoknál pedig vegyél ki minden pipát. Most már valóban csak azt látod a Stílusok listájában, ami a szövegben használatra került. A Stílusok kezelése lapon válaszd az Importálás/exportálás-t, majd a bal oldali listában jelölj ki minden stílust és töröljed. A figyelmeztetések elkattintgatása után a dokumentumban csak a Word beépített stílusai maradnak.
Rakd a kurzort a szöveg első sorához, majd a biztonság kedvéért a Sílusok listájában így módosítsd a Normál stílus paramétereit (javasolt a Stílus módosítása panel bal alsó sarkában található Formátum gomb menüpontjait használni erre):
§  betűtípus: Times New Roman
§  betűméret: 10
§  betűstílus: üresen hagy (Fontos! Ha van ott valami, akkor töröld ki!)
§  térköz és pozíció alapállapotban
§  igazítás: sorkizárt
§  vázlatszint: szövegtörzs
§  behúzás-térköz: nulla
§  sortáv: szimpla
§  tabulátor minden törlése
§  nyelv: magyar
A teljes szöveg kijelölése után állítsd be a „Normál” stílust a szövegre. Még a teljes kijelölés alatt állítsd be a Times New Roman-t, a 10-es betűméretet és a kétoldalra rendezést a menüszalag formázógomjaival (a kövér-dőlt-aláhúzott gombokhoz ne nyúljál). Ha igazán biztosra akarsz menni, akkor a teljes szöveget másold át egy üres, felhasználói stílusoktól mentes lapra. A végeredményben már csak „Normál” stílusú szöveg lesz, tehát végig kell pörgetned a teljes anyagot és kézzel beállítanod a speciális sorok kinézetét, de úgy, hogy a formázásra csak a Betűtípus és a Bekezdés gombokat használod a menüszalagról. A stílustalanított szövegben csak egyféle betűméretet használj és a bekezdések elsősori behúzása is nulla legyen.
Néha előfordul, hogy felhasználói stílusokat alkalmazott valaki pl. dőltbetűs, vagy kiskapitális bekezdés megvalósítására, illetve sokszor a rosszul beállított OCR program betűstílusként alkalmazta a szimpla dőlt, vastag stb. karakterformázásokat. Az ilyen esetekben a fenti átalakítás során elveszik ez a speciális szövegkép-információ. Ha a Stílusok listában a Minta megjelenítése kipipálásával megjelennek az alap álló betűktől eltérő kinézetű minták a felhasználói stílusokban, akkor sajnos ezt a nagyon rossz megoldást használta a szövegben valaki előtted. Ilyen esetben még a stílustalanítás előtt a problémás szakaszokat érdemes kézzel rendbetenni, illetve a stílustalanítás után a kérdéses paragrafusokon csináld meg újra a szükséges formázást a „Normál” stílus megtartása mellett.
9.        Következetes strukturált szöveg előállításánál is az első lépésnél a stílusok kiirtását javasoljuk, az előző ponthoz hasonlóan. Ha a stílustalanított szöveget egy olyan üres lapra másolod át, ahol az ízlésed szerint megformázott „Normál” és „Címsor1” - „Címsor2” stb. stílussorozat már be van állítva, akkor a szöveget végigpörgetve a könyv- és fejezetcímeket a szintjüknek megfelelő címsor-stílusra állíthatod. Minden egyéb formázást, ami a szövegtörzsben található, a „Normál” stílus megtartásával a Betűtípus és a Bekezdés gombokkal végezd el. Amíg a címsor-stílusokhoz rendelt betűméret olyan lehet, amilyen neked tetszik, a szöveg maradék „Normál” stílusú részében itt is csak egyféle betűméret legyen és nulla behúzás.
Ha a címsorok használata mellett döntesz, akkor jó előre határozd meg a fejezetcímzés szintjeit és végig következetesen ragaszkodjál a rendszerhez. Fejezetekhez lehetőség szerint 2-3 szintnél többet ne használj. A Reader-ekben megjelenő betűméret miatt javasoljuk, hogy a Címsor1 és 2-őt a regénycímnek és az írónak állítsd be, a fejezetcímekhez pedig a stílussorozat alsó részéből (4-5-6) válassz. Ne bízz meg a címsor-stílusokra beállított megelőző-követő térközökben, eléje mindig, utána viszont ha szükséges, rakj üres sort vagy sorokat.
10.    Szövegszerkesztő oldaltörések eltávolítása (kötelező). A PRC-fájl folyamatos szöveg. Ami a DOC-RTF-PDF változatban tetszetős lapokra adagolt tördelés, az itt általában hibának számít. A megszüntetés első lépéseként ellenőrizd, hogy törölte-e egyáltalán valaki a papírváltozat oldal- és szakasztöréseit. Ha sűrűn, paragrafus-szöveg közben találsz oldal- vagy szakasztöréseket, akkor nincs mese: kézzel végig kell menni a szövegen és attól függő módon kitörölni ezeket, hogy az előtte-mögötte lévő szöveg egy bekezdéshez tartozik-e vagy sem.
Ha csak fejezet- vagy részcímzés előtt vannak oldaltörések, akkor egy automata cserével cseréld le bekezdésjelre. (^m => ^p^p és ^b => ^p^p). Kizárólag a fejezetcímeket megelőzően a végleges PRC-ben persze használhatsz lapdobásokat, de ezeket csakis utólag a HTML kód megfelelő módosításával kell kialakítanod.
11.    Felesleges sorok eltávolítása (kötelező). A nyersanyagból minden felesleges - a regény olvasásához szükségtelen - sort töröljél! Ez elsősorban a könyv elején vagy végén lévő impresszum anyagának törlését jelenti, de ugyanígy töröljed a szövegben lévő felesleges üres sorokat. A szövegrészek tagolására maximum két-három üres sort használj! Javasolt: egy-két üres sor a „nagybekezdések” vagy „jelenetek” között, ha az eredeti szöveg is tartalmaz ilyeneket, és két vagy három üres sor a fejezetcímek előtt. A nagyobb mennyiségű üres sorok megtalálhatók a bekezdésjel+bekezdésjel+bekezdésjel (^p^p^p) kombináció keresésével.
12.    Valami hasonló dolog de ellentétes művelettel: gyakran a „nagybekezdések” vagy „jelenetek” közötti nagyobb szünetet a szöveg eredeti szekesztője/korrektora bekezdéselőtti vagy bekezdésutáni számszerűen megadott térközzel letudja. Ez nagyon rossz megoldás, mert ez a szünet akármilyen újratördelésnél vagy átszerkesztésnél eltűnik, és a két logikailag össze nem illő „jelenet” teljesen összemosódik. Ha a bekonvertálandó nyersanyagban ilyen megoldást találsz, nincs más lehetőséged, mint kézzel végigpörgetve az eredeti szöveget, üres sorokat tűzöl be azokra a helyekre, ahol a végeredményben is szünetet szeretnél majd látni.
13.    Felesleges szóközök megszűntetése (kötelező). Néhány ritka esetet kivéve az ismétlődő szóközök hibának tekinthetők és a megszüntetésük számos további szerkesztési műveletet tesz könnyebbé. Hogy a szerző akaratából létező speciális alkalmazásokat kiszűrjed, első lépésként keressél rá három vagy négy szóközre. Ha van olyan találat, ami jelentéssel bír, mint pl. ez a párbeszéd:
- Na, disznó, akarsz még utoljára mondani valamit?
-                ?!
- Ez így nem megy. Jack szedd le róla a ragtapaszt!
akkor jelöld meg valamivel, teszem azt #-el. Ezután automata cserével két szóközt cserélj egy szóközre. Ezt néhányszor megismételve az ismételt szóközöktől megszabadultál. Ha már a felesleges szóközök pusztításával foglalkozol, töröld a sorelejei és sorvégi szóközöket is. A soreleji szóköz eltüntetéséhez használd a ^p+szóköz => ^p cserét, a sorvégieknél a szóköz+^p => ^p cserét.
Ha volt #-es bejelölésed, akkor oda most már visszaírhatsz néhány nemtörhető szóközt, de figyelj arra, hogy 5-6db-nál ne legyen több.
14.    A sorvégek rendezése (kötelező). Az OCR-programok jellemző hibája, hogy néha rosszul állapítják meg a sor- és a bekezdésvége közötti különbséget. Általános tapasztalat, hogy a kiinduló nyersanyagban esetleg bennemaradt sortörés ilyen sorvége hibára utal. Első lépésként tehát keress rá a sortörésekre ^l -el egyenként és értelemszerűen töröljed, ha a mondat közepén találod vagy cseréld bekezdésjelre, ha tényleg a sor (bekezdés) végét jelöli.
Ha a szövegedben már csak bekezdésjelek vannak, ellenőrizd, hogy azok tényleg indokoltak-e? Gyakran megesik, hogy a mondat kellős közepébe bekezdésjelet rak az OCR-program és a szöveg korábbi korrektora ezt nem is veszi észre, annak ellenére, hogy csak két egyszerű ellenőrzés lenne. Keress rá tehát egyenként a bármely betű+^p és a vessző+^p kombinációkra (Keresheted a bármely szám+^p -t is, de gyakorlatilag nulla az esélye, hogy ilyen félbehagyott sort találj.). A találatokat értelemszerűen javítsd ki. Tehát ha a mondat második fele a következő sorban van, vagy a folytatás logikailag passzol, akkor töröld a bekezdésjelet, ha viszont logikailag önálló - pláne nagybetűs - a következő sor kezdőmondata, akkor csak egy mondatvégi írásjel ( . ? ! ) hiányzott a találat helyén, amit pótoljál. Félbemaradhat a mondat elválasztó- és nagykötőjeleknél, sőt ”-nél is. Ezek közül az elsők keresése a vízszintes vonalak egységesítése után célszerű, a macskaköröm pedig egy későbbi ellenőrzés során úgyis ki fog bukni, ha hibás.
15.    Speciális eset, ha a szöveged minden sorvégén bekezdésjelet tartalmaz. Ekkor a felesleges bekezdésjelek eltüntetésével folyamatossá kell tenned a bekezdéseket, és lezáró bekezdésjelek pedig csak a bekezdések vagy a párbeszédsorok végén maradhatnak. Ilyen szöveg lehet pl. fix karakterszámra tördelt TXT vagy PDF-fájlból kimentett text változat. Az átalakítás kézimunka és időigényes, csak akkor vágj bele, ha más forrásból nem lehet a szöveget megszerezni.
Az átalakítás menete:
Első lépésként tekerd végig a szöveget és azokhoz a sorokhoz ahol új bekezdést látsz (ide tartozik a párbeszédek egy szereplőhöz tartozó sorai is) plusz üres sorokat tűzzél be. Az eredmény: ahol nem kellene bekezdésjel, ott egy darab van, ahol viszont kell, ott kettő vagy több van egymás után. Következő lépés a sorvégi elválasztójelek eltüntetése. Ez kézi keresés-csere a mínuszjel+bekezdésjel => semmi (-^p=> semmi) kombinációra. Azért kézzel és egyenként kell semmire cserélni (törölni), mert a sorvégi elválasztójelek egy része lehet, hogy olyan szókapcsolatok része, amelyeket egyébként is kötőjellel írunk (pl. egy-két, kívül-belül stb.) Ha ilyet találsz, csak töröld a bekezdésjelet, a többi találatnál viszont mínuszjel+bekezdésjel-et cseréld semmire! Harmadik lépéssel automatikusan minden bekezdésjel+bekezdésjel kombinációt cserélj sortörés+sortörés  kombinációra (^p^p => ^l^l), ezután automatikus cserével minden maradék bekezdésjelet cserélj szóközre! Ha jól dolgoztál a szövegben már csak ott maradtak sortörések, ahol egyébként a bekezdések vagy párbeszédsorok végződnek. Utolsó lépésként cseréld ezeket vissza bekezdésjelekre. A végeredmény a további munkára alkalmas szövegfájl.
16.    A Mobipocket Creator a bekezdéseket <p>...</p> tag-ekké, a sortöréseket viszont csak <br/> tag-re konvertálja. Az eltérő html-elemek miatt a kész PRC-ben az új bekezdések plusz sortávolsággal és egy rövid soreleji behúzással jelennek meg. Ha zavar, hogy a párbeszédek anyaga olyan ritka a Reader képernyőjén, mint a gereblye fogai, akkor a bekezdésjelek helyett használj sortöréseket (Enter helyett Shift+Enter). A saját konverzióinknál ezt az utat követjük, de ez a módosítás nem kötelező a számodra. Ha a csere mellet döntesz, akkor első lépésként minden bekezdésjelet cserélj sortörésre (^p => ^l), majd az üressorok miatt cserélj vissza ^l^l => ^p^p -t. Ahol egymás után több üres sor volt, ott bennmaradhatott még sortörés, ezt a szöveg kézi végigpörgetésével javítsd ki.
Mivel a sortöréssel elválasztott szövegrészek megöröklik az előző szakasz rendezését, a fenti művelet tönkreteheti az esetleg korábban megadott jobbra-középre-balra rendezésedet. Javasoljuk, hogy a bekezdésjelről sortörésre átállást a 8. pontban leírt stílustalanítás közben hajtsd végre.
Ha a bekezdésjelek hatására a PRC-ben megjelenő soreleji „behúzást” szeretnéd a sortörések esetén is látni, akkor a sortörésekkel készül újsorok elejére rakjál 2db nemtörhető szóközt ezzel az automata cserével: ^l => ^l+^s+^s. Ez a módszer szövegképileg tetszetős PRC-t eredményez, de a köztes HTML-fájl kinézete kicsit furcsa lesz az eltérő sorkezdések miatt.
17.    Olyan esetekben, amikor az újbekezdés nagyobb sortávolsága kerülendő, javasoljuk, hogy használj a bekezdésjel helyett sortörést. Ilyen lehet például a fejezetcímek formázása:
vagy a regény szövegébe illesztett tábla- és plakátfeliratok.
 18.    Szóköz és az írásjelek (kötelező). Az írásjeleket esetleg megelőző szóközöket töröljed a szövegből. A következő írásjelek előtt nem lehet üres hely: , ; . : ! ?. A probléma megoldása automatikus keresés-cserével egyszerű: szóköz+írásjel => írásjel, azonban főleg a pont és a vessző esetében javasolt az óvatosabb kézi csere. Ezek ugyanis OCR hibák eredményei is lehetnek, és a művelet után valami.ilyesmit,kapnánk. Hasonló módon a páros írásjelek és a szóközök hibáit is javítsad ki. Ezek a zárójelek valamint az egyes és dupla aposztrófok, amelyeknél a nyitó-jel mögött illetve a záró-jel előtt nem lehet szóköz. Itt is a szóköz+jel vagy jel+szóköz forma keresés-cseréjével orvosolható a probléma. Az aposztrófok ilyen hibáit a 20. pont javításánál is megteheted.
19.    Pont-pont-pont és a szóközök. Ez az írásjel speciális eset. Egyrészről létezik egy speckó karakter ami éppen három pontot tartalmaz, ezt javasoljuk automata keresés-cserével 3db különálló pontra cserélni. Ezután keressél rá 4 pontra és cseréld 3 pontra automatikusan néhányszor. A megfelelő szövegkép érdekében a sorkezdő pont-pont-pont mögött és a sorzáró pont-pont-pont előtt ne legyen szóköz. Első lépésként keressél rá szóköz+......+szóköz kombinációval is. kombinációra és kézzel javítsd ki, a helyzetének megfelelően. Második lépésként ugyanezt tedd meg a
20.    Idézőjelek ellenőrzése (kötelező). Különösen nagy a fejetlenség az ’egyes’ és „dupla” idézőjelek (aposztrófok) rendszerében. Számos kezdő és záró változat van, dőlése, alakja és helyzete alapján, valamint gyakran jelennek meg hibás OCR felismerés eredményeként. Ezek egy részét a kereső nem is tartja aposztrófnak, így mindig ellenőrizd végig a szöveget ilyen céllal. Mindkét aposztróf típus esetén elfogadható az alap, felsőírású egyenes változat ('egyes' és "dupla"), amit A Word beállításai -> Nyelvi ellenőrzés -> Automatikus javítási beállítások -> Automatikus formázás beíráskor-nál Írógép idézőjelet nyomdaira kikapcsolása után kapsz. Elfogadható továbbá az alsó-felső írásképű nyomdai változat is (’egyes’ és „dupla”), ha mindkét elemét a szövegszerkesztő keresője megismeri aposztrófként.
A feladat tehát, hogy kézi kereséssel keresd végig a szöveget dupla aposztrófra és cserélgesd le dupla aposztrófra valamint ellenőrizd, hogy megvan a feltételeknek megfelelő nyitó vagy a záró párjuk, és pótold ha hiányzik vagy cseréld le, ha a kereső nem találta meg. A művelet tulajdonképpeni célja, hogy az Írógép idézőjelet nyomdaira beállításától függően a teljes szöveg dupla aposztrófjait egységesre cseréljed.
Második lépésként tedd meg ezt a szimpla aposztrófra is, ekkor egyébként előkerülhetnek azok a változatok is, amelyek két szimpla aposztróffal imitálnak dupla idézőjelet. Ezeket természetesen cseréld le dupla aposztrófra.
Ha az idézett szövegben is aposztrófos idézet van, akkor a két szint jelölése legyen eltérő: fő idézet dupla, a belső idézet/kiemelés szimpla, de ide használhatod a » és « jeleket is. Ami fontos: a véletlenül egymás mellé került ’ és ” közé rakj egy szünetet.
21.    A magyar karakterkészletben három eltérő hosszúságú „vízszintes vonal”-karakter van: mínuszjel, gondolatjel, hosszú-gondolatjel. Mivel a konvertálás után alig lesz különbség köztük a PRC állományban megteheted, hogy az utolsó kettőt mínuszjelre cseréled automatikusan, de maximum csak kettő fajta maradjon a szövegedben. Javasoljuk, hogy a gondolatjelet és a hosszú-gondolatjelet cseréld le mínuszjelre automatikusan (^+ => - és ^= => -). Ezután minden soreleji mínuszjel mögé tűzz be egy szóközt (^p+- => ^p+-+szóköz ill. ^l+- => ^l+-+szóköz), majd a kétszóközt cseréld automatikusan egyszóközre. Ezzel elérted, hogy a soreleji mínuszjelek (gyakorlatilag a párbeszédjelek) mögött mindig egy szóköz van. Következőkben keress rá egyenként a szóköz+mínuszjel+bármely betű kombinációra (szóköz+-+^$), ugyanis kevés kivételtől eltekintve ezek hibás párbeszédjelek (pl. - A francba! -mondta Joe.). Ahol kell a mínuszjel mögé rakd ki a szükséges szünetet. Jöhet a szóvégi mínuszjel: bármely betű+mínuszjel+szóköz (^$+-+szóköz). Itt már gyakoribb a felsorolásszerű alkalmazás (pl. Hüvelyk- és mutatóujja közé szorította...), azonban itt is előfordulhat, hogy a mínuszjel előtt hiányzik egy szünet. Ha kell, pótoljad. Az utolsó változat a vesszős: bármely betű+mínuszjel+vessző (^$+-+,) ezt is végignézve, ahol a -, kombináció párbeszédhez tartozik rakd ki a megelőző szünetet. Így következetessé tetted a mínuszjel párbeszédekben való használatát.
Ha gondolod visszacserélheted gondolatjelre a soreleji mínuszokat, a szóköz+mínusz+szóköz és a szóköz+mínusz+vessző kombinációkat (^p+- => ^p^=, szóköz+-+szóköz => szóköz+^=+szóköz és szóköz+-+, => szóköz+^=+,)
22.    Macerás dolog, de ha ilyesmivel találkozol illendő lenne kijavítani a szavakban bennemaradt elválasztójeleket is. A keresési minta egyszerű (^$+-+^$), a probléma ott van, hogy ezeken egyesével kell végiglépkedni, akár több száz találaton. Ahol hibás elvá-lasztó jeleket találsz, ott töröljed. Megteheted, hogy a gyakoribb kötőjeles szókapcsolatokat ideiglenesen lecseréled teljes cserével (pl. egy-két => egy#két vagy -e+szünet => #e+szünet stb.), majd a művelet végén visszacseréled a jelzőkaraktert mínuszjelre. Azonban nagyon vigyázz a teljes akció alatt, mert akár egy figyelmetlen csere pillanatok alatt javíthatatlanul tönkrevágja a teljes szövegedet. Mielőtt belefognál mentsél és sohase feledkezz meg a visszavonás lehetőségéről!
Lényegesen egyszerűbb megszabadulni a feltételes elválasztójelektől és a nemtörhető kötőjelektől, ha bennemaradtak a szövegben. Szimplán automatikusan cseréld le a feltétele elválasztójelet semmire (^- => semmi), a nemtörhető kötőjelet pedig minuszjelre (^~ => -).
23.    Javasoljuk továbbá egyszer végigkeresni kézi kereséssel a szövegben a számjegyeket (^#). Lehet, hogy ezzel a trükkel néhány OCR-hibás karaktert megtalálsz és kijavíthatsz, esetleg eltüntetheted a véletlenül ottmaradt oldalszámokat. Ha olyan könyvvel van dolgod, amiben hemzsegnek a számok, elegendő lehet csak a bármely számjegy+bármely betű ill. a bármely betű+bármely számjegy kombinációkat ellenőrizni (^#+^$ ill. ^$+^#)
24.    Néha előfordul, hogy idegen nyelvterületen játszódó történetben magyar helyesírású személynevekkel találkozunk. Mivel a könyv digitalizálása során több alkalommal is történhetett valamiféle automata helyesírás ellenőrzés, nem szabad csodálkozni, hogy a buta számítógépek a magyarban is hasonló, de ékezetes nevek esetén Julia->Júlia, Manfred-Manfréd vagy Maria->Mária elírásokat vétettek. Ha ilyesmivel találkozol, teljeskörű cserével nyugodtan állítsd vissza az adott nyelvnek megfelelő írásmódú neveket. Továbbá, ha a szöveg felkészítése során más, hasonlóan gyakori tévesztésekkel futsz össze, ne legyél rest azokat is kijavítani automata cserével.
25.    Az OCR programok gyakran tévesztenek a magyar ékezetes nagybetűknél. A hibák egy része sajnos még az átlagos korrektúrázott szövegekben is bennemarad. Belefoghatnánk az ékezetes nagybetűk összes előfordulásának ellenőrzésébe, de ez lassú és improduktív, azonban néhány jól megválasztott kisbetűt-nagybetűt megkülönböztető kereséssel csökkenthető a hibák száma.
A egyik gyakori tévesztés a mondateleji Í->í, ezt a pont+szóköz+í => pont+ szóköz+Í nagybetű-érzékeny kézi keresés-cserével javíthatod. Hasonlóan csináld meg ? és ! jelre valamint a párbeszéd- és a sorvége-jelekre is a keresést.
Problémás az Ó, Ő, Ők(et) és Őt felismerése is. Itt az O és Ö a leggyakoribb megtalált karakter, tehát a keresésnél a szóköz+O+szóköz, szóköz+Ok+szóköz és a szóköz+Ot+szóköz kombinációkat és ezek Ö-betűs változatait javasoljuk használni. Néha ugyanez a hiba jelentkezik a személyes névmások kisbetűs írásában is, hasznos lehet gyorsan azokon is átfutni. Ú betű esetében a leggyakoribb tévesztés az Úgy->Ügy, ezt mindenképpen ellenőrizd. Mivel a hibás változat is értelmes szó, az Álma->Alma, Álmom->Almom stb. tévesztés ellen futtass le egy kézi cserét az Alm => Álm kombinációra. É betű esetén elsősorban az Erez és Ert keresését javasoljuk valamint a szóköz+En+szóköz és a szóköz+Es+szóköz kombinációk ellenőrzését.
26.    A regény cím formája (kötelező). A PRC-be kerülő szöveg első sorai legyenek a szerző és a cím, amelyet stílustalan megoldás esetén alap betűmérettel a normál/bold/italic és a kisbetűs/nagybetűs írásmód megfelelő megválasztásával emelhetsz ki. Természetesen a címsor-stílusos megoldás esetén az általad beállított Címsor1-et és Címsor2-t használd ezek megformázására.
Ha egy regényciklus egyik kötetével dolgozol, akkor a címe alá vagy fölé „Normál” stílusban írd oda a ciklus valódi címét - tehát nem mindig azt amit a metadata címmezőbe írtál - és a regény sorszámát. (pl. a metadata cím: Midkemia-13-Árulás, de a szövegben a cím alatt: [Résháború öröksége 1.] ) Egyes szerzők regényciklusainak címéről és a regények sorrendjéről a hivatalos vagy fan-weboldalakon tájékozódhatsz.
Minden esetben a regénycím alá helyezz el egy zárójelekbe írt „Tartalom” feliratú hivatkozást, ami az mbp_toc.html fájlra mutat: (Tartalom). Ez a későbbiekben a köztes HTML változat szerkesztésekor segítségedre lesz.
Abban az esetben, ha a könyv egy rövid, felütésszerű részlettel kezdődik és csak ezután található a szerző és a cím, akkor megtartva ezt a regényrészletet, eléje a legelső sorba zárójelben, normál formázással írd be a szerzőt és a címet (az előbbi példánál maradva: [Raymond E. Feist - Krondor: Árulás]), ezzel biztosítva, hogy a fájl megnyitásakor azonnal tudja az olvasó, mit tart a kezében.
27.    A regény fejezet- és részcímzésének kialakítása egyszerű, ha a címsor-stílusos megoldást választottad, ugyanis csak rá kell állítanod a formázandó címekre a szintjüknek megfelelő, előre beállított címsor stílust, valamint beszúrni eléjük egy-két üres sort. Azt, hogy az egyes szintekhez melyik sorszámú címsor-stílust használod, magad eldöntheted, de javasoljuk, hogy 3-dik szinttől lefelé válassz, illetve ha nem szeretnél a bekezdés-szövegnél több számmal nagyobb betűméretű fejezetcímeket, akkor a 4. és 5. címsor-stílust használd.
Azonban ez a megoldás is rendelkezik bizonyos korlátokkal. A Címsor# stílusokat a Creator <h#>...</h#> tag-ekké fordítja, és a kipucolt, style-októl megszabadított HTML-ekben a kinézetük nem lesz azonos a DOC-ban beállítottakkal. További problémát jelent, hogy az 5.2-es Reader generáció betűkészleteivel a strukturálisan egymás alá rendezett szintű címsorok gyakran nem logikusan csökkenő betűmérettel jelennek meg, mint ahogy az alábbi Symbian S60-as példa is mutatja:
A probléma kezelésére a konvertálás félidejében keletkező kipucolt HTML fájl kézi megszerkesztését javasoljuk. A fájl <head> részében el kell helyezni egy <h#> tag-ekre vonatkozó stílusdefiníciós sorozatot, amely beállításai felül fogják írni a Creator ízlésficamos betűméret választását. Ebben a stílusdefinícióban adhatod meg a szükséges betűméretet, betűképet és itt határozhatod meg a címsor jobbra-balra rendezését is. A saját próbálkozásaink eredményeként összeállított sorozat tetszetős képet ad a HTML szövegben és a Reader-ek többségében is. A beillesztendő stílussorozat a következő:
<style>
h1 {
       font-size: 25px;
       font-style: normal;
       font-weight: bold;
       font-variant: normal;
       text-decoration: none;
       text-align: center;
     }

h2 {
      font-size: 23px;
      font-style: normal;
      font-weight: normal;
      font-variant: normal;
      text-decoration: none;
      text-align: center;
     }

h3 {
       font-size: 19px;
       font-style: normal;
       font-weight: bold;
       font-variant: normal;
       text-decoration: none;
       text-align: center;
      }

h4 {
       font-size: 17px;
       font-style: normal;
       font-weight: normal;
       font-variant: normal;
       text-decoration: none;
       text-align: center;
      }

h5 {
       font-size: 14px;
       font-style: normal;
       font-weight: bold;
       font-variant: normal;
       text-decoration: none;
       text-align: center;
      }
h6 {
       font-size: 14px;
       font-style: italic;
       font-weight: normal;
       font-variant: normal;
       text-decoration: none;
       text-align: center;
      }
</style>
A stílussorozat alkalmazásával ugyanaz a próba-szöveg így néz ki:
28.     Ha a stílusmentes megoldást választottad, a fejezet- és részcímeket a saját belátásod szerint formázhatod meg a „Normál” stílus megtartása mellett. Még a fejezetcímek eredeti alakjához sem kötelező ragaszkodnod, de legyél végig következetes, azaz ugyanahhoz a szinthez tartozó címek hasonló kinézettel és rendezéssel rendelkezzenek. Kiemelésükhöz használj előttük egy-két üres sort. Javasolt, hogy a különböző szintű részcímek formájukban is eltérjenek, de az alap betűméreten ne változtass. Például:
Azért, hogy a stílusmentesen megformázott címekből TOC tartalomjegyzéket tudjál készíteni, javasoljuk, hogy már a szöveg végigpörgetése és a fejezetcímek beállítása közben gondoskodj a tartalomjegyzékbe kerülő részek bejelöléséről. Ehhez egy lehetséges eljárást a 36.pontban ismertetünk.
29.    Az olyan speciális szövegrészek megformázásánál, mint az ajánlás, a szövegbe illesztett levelek, fejezetcímhez kapcsolt idézetek, plakátok szövegei vagy a versidézetek, szabadon játszhatsz a jobbra-középre-balra rendezésekkel, a betűformázásokkal, a bekezdésjel vagy a sortörés használatának eredményeként megjelenő szorosabb vagy ritkább sortávolságokkal. Ne használj a formázásra kezdő tabulátorokat vagy behúzásokat, ugyanis a kisképernyős mobil-olvasókon amúgy is kevés a hely, hát még ha a szöveg csak a sor felénél kezdődik! Azonban figyeljél arra, hogy az átalakításod hatására ne változzon meg a speciális szövegrész eredeti funkciója és mondanivalója a teljes szövegösszefüggésben valamint a formázás ellenére végig megőrizd a „Normál” stílust.
A táblázatokat bekonvertálhatod táblázatként, sőt a tabulátorokkal egymás alá rendezett felsorolásos szövegrészeket is inkább jobb ha táblázattá alakítod a konvertálás előtt. Annak ellenére, hogy a Mobipocket Reader-ek úgy-ahogy megjelenítik a táblázatokat, lehet, hogy a végeredménnyel nem leszel megelégedve. Ha tehát az eredeti szövegelrendezés megtartása fontos, választhatod az adott rész képbe konvertálását és a kép beillesztését a szöveg megfelelő pontjára.
30.    Jegyzetek és lábjegyzetek belinkelése (kötelező). Egyes regények tartalmaznak jegyzeteket, amelyek a nyersanyagban lehetnek szövegköziek (elsősorban TXT), valós lábjegyzetek (DOC, RTF) vagy szövegvégi felsorolásúak (HTML és gyakran ezek már hiperlinkesek). A PRC állományokban ez utóbbi változatot kérjük megvalósítani hiperlinkes szerkezettel.
A szövegközi lábjegyzetek megtalálására elsősorban a *-ozás és a [ ] vagy ( ) zárójelek valamint a számok keresése alkalmas. A valós lábjegyzetek könnyen megtalálhatóak a Hivatkozás=>Következő lábjegyzet menüponttal. Ha jegyzetre utaló jelet találsz a szövegsorokban, akkor vagy néhány bekezdéssel később, vagy a dokumentum lábjegyzetében ott van a hozzá tartozó jegyzet. Ezeket a jegyzeteket másold át (helyezd át) a regény szövege mögé, lásd el sorszámmal, és ezt számot zárójelekkel írd be arra a helyre ahol a jegyzetre hivatkoztak. A szövegsorokba írt jegyzet hivatkozás mindig zárójelbe írt sorszám legyen, ha esetleg már a nyersanyag is hiperlinkes rendszert használt, akkor annak a hivatkozásait is ilyen formára alakítsd át.
Amikor a szöveg összes jegyzetét hátramásoltad és beszámoztad, minden jegyzetsorszámhoz rakjál egy-egy könyvjelzőt, majd a szöveg elejétől kezdve sorban keress rá a szövegközi hivatkozásokra (1, 2, 3, ....44, 45 stb.) és a megfelelő sorszámú könyvjelzővel a hiperlinket állítsd be rajtuk. Szorgalmi feladatként megcsinálhatod a hiperlinket visszafelé is, azaz rakhatsz könyvjelzőket a törzsszöveg jegyzet hivatkozásaihoz (vagy például a hivatkozást tartalmazó mondat elé) és ezeket a könyvjelzőket pedig a szövegvégi jegyzet-lista sorszámain alkalmazhatod hiperlinkként. Utolsó lépésként adjad a „Jegyzetek” vagy „Lábjegyzetek” címet a hátramásolt lábjegyzeteknek és ez a cím is kerüljön bele a tartalomjegyzékbe.
31.    Azok számára, akiknek magas a hiperlinkek kezelése következzen egy rövid leírás. Első lépésként azokra a pontokra rakd a kurzort, ahova az olvasót vezetni szeretnéd, majd Beszúrás=>Könyvjelző menüponttal rakj egy könyvjelzőt ide és adj neki egyértelmű nevet (számmal nem kezdődhet, de a könyvjelzők sorszámozása javasolt). Keresd meg vagy készítsd el azt a szövegrészt, amihez a hiperlinket kötni akarod, tehát amire rákattintva az olvasó az előbb beállított részhez ugorhat. Jelöld ki a hiperlinkre kiválasztott számot, szót vagy szakaszt és Beszúrás=>Hiperhivatkozás-sal rendeld hozzá a könyvjelzők listájából a megfelelő ugrási pontot. Ha jól dolgoztál kék aláhúzott hiperlinket kaptál, amire rákattintva a szöveg megfelelő pontjára ugorhatsz. Ha kész a teljes hiperlink-rendszered, javasoljuk ellenőrizd le, hogy minden hiperlink jó helyre mutat-e.
32.    Ha a regény más kiegészítő anyagokkal, például függelékek, szótárak vagy térképek, rendelkezik, akkor ezeket is a szövegtörzs után lehet beilleszteni. Ezeknek a plusz anyagoknak a címeit is rakd bele a következőkben ismertetett módon a tartalomjegyzékbe kerülő elemek közé. Ha valamelyik elérését még gyorsabbá szeretnéd tenni, akkor egy rá vonatkozó hivatkozást a fájl elejére a Tartalom hiperlinkje mellé is berakhatsz.
33.    A PRC állományba beillesztheted a könyv képeit, de az illusztrációk berakása nem kötelező azt az esetet kivéve, ha a szövegértelmezéshez szükséges. Ez esetben a kép közelében a szöveg is ráutaló megjegyzéseket tartalmaz. Lehetőség szerint a képek pixeles méretét csökkentsd le olyan mértékben, hogy a részletek még kivehetők legyenek, ugyanis a Creator saját maga is igyekezni fog - egy régi palmos szabvány miatt - önhatalmúlag 64k-os méretre átméretezni a képet. Ha már te magad megteszed a csökkentést, nagyobb valószínűséggel lesz jobb a végeredmény, mintha a Creatorra bízzuk. Képként illeszthetsz a szövegbe minden olyan jelet, képletet, táblázatot és a latin abc-től eltérő szövegrészt, amit a Mobipocket Reader nem tud másként megjeleníteni. Ez utóbbi esetekben jó megoldás lehet szövegszerkesztőbe betöltött forrás-dokumentum kérdéses részéről képernyőmentést készíteni (például az IrfanVieW Fényképezés... funkciójával), majd a szükséges részt kivágva lecsökkentet méretű képként az új anyagodba beilleszteni. Megfelelően kicsi méretű képeket a Reader a sorok belsejébe illesztve is meg tudja jeleníteni (mintegy a készletből hiányzó betű helyett), a nagyobbakat viszont a sorok közé sőt esetleg csak új képernyőre képes kirakni.
Annak eldöntésére, hogy melyik karaktereket érdemes képpel helyettesíteni, készítettünk egy táblázatot, ami tartalmazza a Windows-os Times-típus kiterjesztett betűkészletének mobiltelefonon (tehát a legkorlátozottabb képességű eszközön) használható jeleit.
34.    Borítókép (kötelező). A Mobipocket Creator a szöveg mellé a címlapot is be tud építeni. Minden készülő PRC-hez szerezzél be egy borítóképet az eredeti könyvről, ebben segít a Google képkeresője vagy a netes könyvesboltok katalógusai. Ha nincs más, akkor elfogadható idegen nyelvű kiadás borítója is, elsősorban az eredeti nyelvű könyv címlapja és csak másodsorban az angol vagy amerikai kiadásé. A borítókép ne legyen nagyobb függőlegesen 800 pixelnél, és nem érdemes 250 pixelnél kisebbre se méretezni. (Kivéve persze, ha eleve nem találtál nagyobb képet.) Javasolt sajátkezűleg a megfelelő 64k méretűre tömöríteni a JPG borítóképet, mivel itt is közbeszólhat a Creator túltömörítése és a végeredmény kisméretű, de kásás borítókép lehet.
35.    TOC html-tartalomjegyzék (kötelező). Az egyik legkínosabb eset, ha egy Háború és Béke méretű regény kétharmadánál valamilyen hiba miatt elszáll a könyvjelzőfájl. Szerencsétlen olvasó, megnyitva a PRC-t az első oldalon találja magát és hosszú percekig kénytelen pörgetni az oldalakat, míg megtalálja, hogy hol járt. Ezt elkerülendő a PRC-könyvedben mindig legyen tartalomjegyzék, még akkor is, ha nincsenek benne fejezetcímek!
A teljeskörű kompatibilitás miatt különálló HTML-fájlban összefoglalt tartalomjegyzék használata javasolt, amit a Creator Guide-listájába is fel kell venni toc típusú elemként. Ilyet készít a Creator Table of Contents része, tehát az igazán speciális eseteket kivéve nem kell mélyebben belemerülnöd a rendszer működésébe. A dolog lényege, hogy a tartalomjegyzékbe bekerülő fejezetcímek strukturális szint szerint egyedileg meg legyenek jelölve a köztes HTML fájlodban.
Ha a címsor-stílusos szöveg előkészítés mellett döntöttél, akkor a fejezetcímek stílusának beállításával már elérted, hogy a kérdéses sorok a Creator DOC->HTML fordítása során speciális html tag-eket kapjanak(<h3>, <h4> stb.). Ezzel szemben a stílusmentes előkészítés során magadnak kell a köztes HTML fájlban kézzel, vagy a 36. pontban ismertetett félautomata eljárással egy vagy két pár semleges tag-gel a fejezetcímeket megjelölni. Erre a feladatra javasoljuk az <y1>...</y1> és az <y2>...</y2> szabványon kívüli tag-ek bevezetését. Mivel a böngészők ezeket a jelzéseket nem használják, az <y#> tag-ekkel megtűzdelt HTML fájlok Explorerben vagy Firefoxban megnyitva pontosan ugyanúgy jelennek meg, mintha nem csináltál volna semmit sem az anyaggal.
Miután a tartalomjegyzékedbe bevenni kívánt részek mindegyike <h#> vagy <y#> tag-gel meg van jelölve, a Creator Table of Contents párbeszédablakában add meg az egyes tartalomjegyzék-szintekhez tartozó jelölőtag-eket természetesen a < > jelek nélkül. A TitleTartalom” vagy „Tartalomjegyzék” és Update-el érvényesítsd a változtatásokat. A publikációs fájl-listában megjelenő mbp_toc.html fájl megtekintésével ellenőrizheted, hogy jól dolgoztál-e, és a tartalomjegyzékbe belekerült-e minden szükséges hivatkozás. A publikáció fájlistában a TOC bejegyzését állítsd a legutolsónak, így a PRC-be fordításkor a regényszöveg mögé kerül. mezőbe írd be, hogy „
Az így létrehozott és PRC-be fordított tartalomjegyzék elérhető a Reader-ek Navigation<a href=... formára fordítódott hivatkozást, és a pontos elérési út kitörlésével egyszerűsítsd le erre: <a href="mbp_toc.html">. Végeredményül valami hasonlót kell kapnod: menüjéből, de a fájl elérését a regénycím alá beírt „Tartalom” linkre is állítsd be! Ez gyakorlatilag azt jelenti, hogy a text-es szerkesztővel megnyitott HTML regény-fájlban keresd meg a regénycím mögé korábban beírt és az
<p align="center">(<a href="mbp_toc.html">Tartalom</a>)</p>
Amennyiben a könyv a 26. pontban említett felütéssel kezdődik, egykarakteres hiperlinket, pl.: (t), az ide írt cím után is rakhatsz. Ezt szintén a HTML kód szerkesztésével, a megfelelő pontjára beszúrt következő hivatkozással teheted meg:
(<a href="mbp_toc.html" >t</a>)
36.    Kidolgoztunk egy többlépéses műveletsor, amivel egy kicsit egyszerűbben lehet a stílustalan szöveg-előkészítés során <y#> tag-ekkel megjelölni a tartalomjegyzékbe kerülő fejezetcímeket. Az eljárás egyik előnye, hogy az <y#> tag-ek nem rendelkeznek formázási információval, azaz a böngészők sem értelmezik pl. speciálisan megjelenítendő header sornak. Emiatt <y#> tag-ekkel még akkor is össze lehet állítani egy tartalomjegyzéket, ha a regény nem is tartalmaz megcímzett fejezeteket. Ilyenkor a teljes szöveget egyenközűen felosztva a legközelebbi „nagybekezdés” vagy „jelenet” első pár szavát kell bejelölni egy-egy tartalomjegyzék bejegyzés céljára.
A műveletekhez három makrót rögzítettünk, amiket te is felhasználhatsz miután a makrók közé bemásoltad innét a szövegből. (Ezek Word2000-sek, viszont Word2007-ig működőképesek. OpenOffice-ban nem biztos, hogy működnek!) Az alapelv, hogy még a szöveg-előkészítés során 2-2 alapkészletbe tartozó, de nem használt karakterrel megjelöljük a későbbi <y#> tag-ek helyét. A konvertálás egy későbbi szakaszában a jelölőkaraktereket <y#> tag-ekre lehet majd cserélni.
Az első címsor-szint bejegyzése elé-mögé ¶ és ¬ karakter beszúrása (javasoljuk Alt-a -ra konfigurálni):
Sub cim1_marker()
    Selection.Cut
    Selection.TypeText Text:="¶"
    Selection.Paste
    Selection.TypeText Text:="¬"
End Sub
A második címsor-szint bejegyzése elé-mögé ‡ és ¤ karakter beszúrása (javasoljuk Alt-í -re konfigurálni):
Sub cim2_marker()
    Selection.Cut
    Selection.TypeText Text:="‡"
    Selection.Paste
    Selection.TypeText Text:="¤"
End Sub
Egy rendező makró, hogy a DOC->HTML konvertálás után az egyes tag-párok nehogy egymást átlapolva készüljenek el (javasoljuk Alt-q -ra konfigurálni):
Sub cim_rendezes()
    Selection.Find.ClearFormatting
    Selection.Find.Replacement.ClearFormatting
    With Selection.Find
        .Text = "¶ "
        .Replacement.Text = "¶"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = "‡ "
        .Replacement.Text = "‡"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = " ¬"
        .Replacement.Text = "¬ "
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = " ¤"
        .Replacement.Text = "¤ "
        .Forward = True
        .Wrap = wdFindContinue
        .Format = False
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find.Replacement.Font
        .Bold = False
        .Italic = False
    End With
    With Selection.Find
        .Text = "¶"
        .Replacement.Text = "¶"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = True
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = "‡"
        .Replacement.Text = "‡"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = True
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = "¬"
        .Replacement.Text = "¬"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = True
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
    With Selection.Find
        .Text = "¤"
        .Replacement.Text = "¤"
        .Forward = True
        .Wrap = wdFindContinue
        .Format = True
        .MatchCase = False
        .MatchWholeWord = False
        .MatchWildcards = False
        .MatchSoundsLike = False
        .MatchAllWordForms = False
    End With
    Selection.Find.Execute Replace:=wdReplaceAll
End Sub
A módszer tehát: miközben a stílustalan szöveget végigpörgeted és a fejezetcímeket megformázod, az egyes címekből jelöld ki azt a részt, amit majd a tartalomjegyzékben szeretnél látni. Az első szint esetén nyomjál neki egy Alt-a -t vagy a második szint esetén Alt-í -t. Így a kijelölt rész elé-mögé bekerülnek a jelölőkarakterek. Amikor befejezted a fejezetcímek átnézését és bejelölését, egyszer használd a rendező makrót Alt-q -val. Gyakorlatilag ezzel megcsináltad mindazt, amit a szöveg-előkészítés során megtehetsz a TOC tartalomjegyzék generálásához. A művelet második fázisa a bekonvertálás félútján keletkező HTML fájl szerkesztése. Itt le kell cserélned a jelölőkaraktereket az <y1> és <y2> tag-ekre. Ezt a négy teljeskörű cserét hozzáírtuk egy HTML kipucoló szkripthez, tehát ha a szkriptet használod a köztes HTML fájlon, akkor nem kell kézzel elvégezned a cserét. Miután bekerültek az <y#> tag-ek a szövegbe, már használhatod a Creator Table of Contents generálását.
37.    Egyszerű HTML-kód készítése (kötelező). A Word DOC-ból készített HTML anyag embertelenül sok töltelék span és mso... formázást tartalmaz és ezek legtöbbjét a Mobipocket Creator szimplán figyelmen kívül hagyja. Akkor miért ne szabaduljunk meg tőlük? A köztes HTML fájl letisztultabb, a végeredmény PRC pedig kisebb és hibalehetőségektől mentesebb lesz. A művelethez szükséges lesz a clean_html.vbsAsztalra kirakni, hogy egyszerű ráhúzással használhassad. Az eljárás menete: szkript, amit javaslunk az
- Első lépésként Word-ben készítsd fel szöveget a fenti pontok szerint (hibajavítás, formázás, végjegyzet-linkek, címsorozás következetessé tétele és felkészítése TOC-ra).
- Második lépésként a Publisher módú Creatorba töltsd be a DOC-ot. Mindig a Creatorral készíttesd el a köztes html-változatot, ugyanis ez is pucol a html-kódon egy keveset. A wincsin keresd meg a létrehozott HTML fájlt és egyszerű áthúzással dobd rá az Asztalra rakott szkript-ikonra. Ritkán belefagy a műveletbe, de az esetek 90%-ában a szkript gyárt egy letisztázott HTML-t ugyanazzal a névvel ugyanoda. Vissza a Creatorba.
- Harmadik fázisban már csak a Creatorban nézd át a HTML fájlt, nyisd meg szerkesztésre, és végezd el a szükséges kézi html-buherálásokat. Ha tökélyre törekszel, ekkor megkeresheted a HTML-ben bennemaradt <font>...</font> valamint style bejegyzéseket és kitörölheted. Jöhet a TOC tartalomjegyzék generálás. Ellenőrizd az elkészült mbp_toc.html kinézetét, ha valami gubanc van, a HTML regény-szövegben kézzel javítsd ki, majd a TOC-ot generáld újra. Add meg a címlap-képet, töltsd ki a metadata mezőit és ezután elmentheted a kész Mobipocket publikációt.
- Negyedik lépésben Build-del készítsd el a PRC-t. Nézd át a Mobipocket Desktop Reader-rel, ha valami nem tetszik akkor vissza a Creatorba, és javítsd ki a html-szövegben vagy a metadata mezőkben, majd generáld újra a PRC-t. Ezután már gyakorlatilag addig finomíthatod a végeredmény, amíg akarod. A kész PRC mellett javasoljuk, hogy a javított szövegváltozatot tartalmazó, kipucolt-leegyszerűsített HTML-t is őrizd meg.
38.    Ha nagyon sok idővel rendelkezel és elég türelmes vagy akkor az összeállított DOC anyagon helyesírás ellenőrzést is végezhetsz. Ez igen lassú és unalmas munka, hiszen szinte minden név minden ragozott alakját hibásnak fogja találni, amelyekre állandóan nyomni kell, hogy mindet átugorja. Másrészről biztos nem fogja az összes hibát megtalálni, ugyanis gyakoriak azok az OCR hibák, amelyek még így is értelmes magyar szavakat adnak (pl. műveinek=>művelnek, Kóstolj átok meg...=>Kóstoljátok meg..., agyvizespohár=>egy vizespohár stb.).
39.    Ha a regényt azért konvertálod PRC formátumba, mert el szeretnéd olvasni, akkor jobb eredményt érhetsz el olvasás közbeni hibakereséssel. Javasoljuk, hogy az első PRC változat olvasása közben megtalált hibákat egyszerűen highlight-tal jelöld meg, ugyanis a többi Reader lehetőség (pl. a Modify) lényegesen több műveletet igényel és semmivel sem jobb. Amikor összegyűlt egy adag bejegyzés, ülj vissza a számítógép elé és egyenként menj végig a megtalált hibákon. Az összeállított DOC anyagban keress rá a megjelölt szavakra és javítsd ki a hibákat, ezután a Mobipocket Reader-ben kitörölheted ezeket a bejegyzéseket. Ha olyan hibát találsz, ami általánosítható (pl. egyik szereplő neve gyakran van elírva) kézi keresés-cserével végigfuthatsz a teljes szövegen és kijavíthatod a további előfordulásokat is. Ezután, ha gondolod, újabb PRC-t gyártva már egy hibamentesebb változat olvasását folytathatod (a könyvjelző állomány persze az új fájlhoz már nem lesz jó, úgyhogy oda kell lapoznod, ahol tartottál).
40.    A felsorolt DOC formázási és szövegszerkezeti beállításokat valamint a Creator publikáció beállításait és a köztes HTML-t tanulmányozhatod a letölthető példacsomagon is, amely a legtöbb kötelező elemet tartalmazza. Ez egyébként a brilliánsan szellemes Elveszett próféciák c. regény.

0 megjegyzés: