Új hozzászólás Aktív témák

  • cocka

    veterán

    válasz #25954560 #10246 üzenetére

    Nos a kérdeseket költőinek szántam, de ha már válaszoltál rá elmondom mit össze kell szívni az abbyyvel ahhoz, hogy egy normálisan kinéző valamit kapj. (ez is tapasztalat)

    Én mondjuk 600 dpi pontsűrűségű bmpket próbálgattam. Lényeg, hogy veszteségmentes legyen a formátum, hiszen az odalon lévő képeket úgy is tömöríti és akkor tovább romlik a minőség.

    Szóval először is ha pl. könyvet szkennelsz, akkor mint ismeretes 2 oldal kerül 1 képre bár úgy is lehet hogy 1 oldalt szkennelsz képenként csak akkor cropolgatni kell.

    Szóval a program elvileg képes arra, hogy a 2 oldal/kép típusú képeket a gerinc mentén keletkező sötét vonal mentén két külön álló képpé vágja. Már itt hibázik, mert egy kb. 300 oldalas könyvből van legalább 15 oldal amit nem képes elvágni ugyanolyan szkennelési mód mellett. Az más kérdés, hogy mennyire hajlik meg a könyv a szkennelés során, illetve gyakran erősen be kell törni, hogy jó minőségű szkennelt verziót kapj. (azt is szoktam mondani, hogy legegyszerűbb lenne kitépni vagy kivagdosni a lapokat, hogy elkerüld ezt a gerinc felé sötétedés, gyűrődés problémát, de akkor bukod a könyvet, meg egyébként sem illik ilyesmit csinálni)
    Úgyhogy ezeket kézzel kell beállítgatnod.
    Ezután jön az objektumok felismerése az oldalon. Ez általában borzasztó sok korrekcióra szorul. Sokszor az egyértelmű kép területeket sem ismeri fel vagy olyasmit ismer fel szövegként, amit képként kellett volna. A gerincmenti gyűrődéseknek hála a szövegkeret határait általában a gerinc felé képtelen rendesen felismerni, mindig utólagos igazgatásra van szükség. Az oldalszámot gyakran a fölötte lévő szöveggel egy keretbe rakja, ami megint csak gáz. Ha rettentő csúnya és kiigazíthatatlan, akkor újra szoktam rajzolni a szövegkeretet és bizony ilyen nagyon gyakran van.

    Na ha ez is megvan, akkor kezdődhet végre a szövegkeretek felismertetése, képek beszúrása. Azt már meg se említem, hogy néha minden apró oldalfelületi hibát, koszt, szöszt is karakterként ismer fel, de ami sokkal nagyobb gond, hogy azonos szedésű könyv esetén sem képes egységesíteni a formázást. Legalább 2-3 féle betűtípust, betűstílust és betűméretet használ, míg ezeket átirkálod masnit is köthetsz a szemöldöködre. :D A betűméret azért is necces téma, mert ha túl kicsinek ismeri fel, akkor a szövegobjektumnak megfelelő keret is olyan kicsi marad. Ha pl. 8-as betűmérettel ismerte fel, de eredetileg legalább 10-es kellene, akkor a szövegkeret akkora marad, mint amekkorába a 8-as betűméretű betűk még elférnek, a növelés után pedig kilógnak a nagyobb betűk a keretből.
    Ha ez megvan, akkor még mindig nincs vége a dolognak, mert pl. a gerinc felé tömörülő és egyre sűrűbb betűhalomnál a betűk térközét is megváltoztatja sűrűbbre. Ezt is nagyon "hálás" feladat utólag egységesíteni. Ezután jöhet a helyesírás ellenőrzés. Ha nincs betanítva a drága, márpedig minden egyes könyv más-más betűstílust használ és baromi sokáig kéne tanítgatni, hogy mindet jól ismerje fel, akkor következetesen mindig ugyanazokat a felismerési hibákat véti. Mert igenis vannak. A legidegesítőbb az egészben, mikor olyan karaktereket is bizonytalannak vél, ami teljesen egyértelmű és jól olvasható.

    Ezek után jön a mentés rész: 3 formátumnak van haszna is: doc vagy docx esetleg rtf, html és pdf. Ezek közül talán a pdffel van a legkevesebb probléma, de ha az oldalképet a szöveggel együtt mented, akkor meglehetősen nagy lesz az anyag. Szóval ilyenkor érdemes csak a szöveget és a képeket lementeni. A doc és társainál is van pár mentési opció pl. az, hogy oldalképhűen nézzen ki vagy sem. Ha az oldalképhűséget beállítod, akkor vagy szövegdobozokkal oldja meg a dolgot, ami rohadtul nem elegáns, sőt a hajadat téped vagy megpróbál a lehetőségekhez mérten rendezni, de ez azzal jár, hogy minden sor egy bekezdés, hiszen minden sorvég után bepakol egy enter karaktert. Ez azért szörnyű, mert ezeket is külön utólag kell kigyomlálni a doksiból és előfordulhatnak olyan malőrök pl. hogy a sorban van egy hosszú szó meg egy másik rövidebb szó és a kettő közt óriási szóközt hagy, ha sorkizárt a szöveg vagy látszólag nem is változik a balra zárt és sorkizárt rendezés. A másik esetben meg ugye elvész az oldalhűség vagyis simán berakja a szöveget, a képeket meg ahogy esik úgy puffan alapon.

    És végül ha kigyomláltad belőle ezt a sok szart, amit most itt leírtam, akkor sem lehetsz biztos benne, hogy a végeredménybe nem csúszott-e hiba vagy valami formázási anomália, amit utólag bajos átszerkeszteni.

    Lehet hogy számodra ezek a problémák nem jelentenek túl nagy gondot, de ha igényes dolgot akarsz összehozni Abbyyvel rengeteg munka van vele. Tudom mert már csináltam ilyet. Igénytelen szart bármikor csinálok vele én is. :D

    [ Szerkesztve ]

Új hozzászólás Aktív témák