Új hozzászólás Aktív témák
-
hampidampi
senior tag
A probléma ott kezdődik, hogy pdf-et akarsz konvertálni. A pdf alapvetően arra lett kitalálva, hogy kinyomtassák, így lapképet tárol, nem folyó szöveget. Valószínűleg minden sor végén bekezdésvége van. Ezt egy egyszerű kopipészt-a-wordbe művelettel ellenőrizheted.
Ráadásul az egy konténer csak, amibe bármit bele lehet dobálni. És bele is dobálnak.
Egyszóval a pdf forrás 90%-ban szívás.
- Mindenekelőtt próbálj meg más, szerkeszthető forrást találni.
- Vagy próbáld meg konvertáláskor a heurisztikus feldolgozást bekapcsolni és az ott található értékekkel játszani, különös tekintettel a sortörés ki.. és az üres sorok törlése a bekezdések között paraméterekre.
- Alternatívaként érdemes kipróbálni a pdftoepub programot. Nem túl elvetemült pdf-ekkel egész jól megbírkózik.
- Ha viszont nagyon gány a pdf (főleg a scannelt, képekből álló), akkor csak egy ocr program segíthet. Ebből a legjobb az Abbyy FineReader.
Utómunkára, átolvasásra persze mindig szükség lesz, mert szinte lehetetlen hiba nélkül rendesen pdf-et átalakítani.
Szóval még egyszer: a pdf szinte mindig szívás (nemcsak Calibre-rel)!A tartalomjegyzék generálása már egy következő "igényességi szint", ugyanis ehhez egy jól elkészített alap dokumentum szükséges. Ha pdf-ből indulsz ki, akkor előbb azt valami szerkeszthető formába konvertáld (elsősorban html, rtf vagy docx - ezeket szereti a Calibre). Ilyenkor valamilyen szövegszerkesztőben az egyes fejezeteknek megfelelő szintű címsor stílust kell beállítani. Aztán a Calibre-ben konvertáláskor a Tartalomjegyzéknél a szint beállításánál a megfelelő kifejezést kiválasztani. Pl. címsor1-nél: //h:h1. Persze a varázslóval mást is fel lehet venni, mondjuk oldaltörés figyelését stb., de az kevésbé megbízható.
-
Degeczi
nagyúr
Mert sajnos az...
Külön bekezdés minden egyes sor az anyagodban, ezért látsz fél sorokat (hiszen a más betűméret és oldalszélesség miatt kevesebb fér ki egy sorba, mint a fixre tördelt PDF-ben)
Kimondottan ez ellen való a heurisztikus feldolgozás alatt a sortöréseket eltávolító opció, ahol játszani lehet a mellett lévő számértékkel (miután nem minden bekezdést kellene összefolyatnia)
Gyakran nincs tökéletes megoldás automatikusan, csak kézi szerkesztéssel
Érdemes lehet RTF kimenetet kérve Word-ben megdolgozni a maradékot, ahol adhatsz pl. olyan Keres/Cserél kifejezést is, ami eltávolítja a sortörést, ha utána kisbetű következik
Aztán ha már úgyis kézi szerkesztésben vagy, a fejezetcímeket megjelölöd pl. "címsor 2" stílusként, a Calibre-ben pedig megadod, hogy az (//h:h2) legyen a tartalomjegyzék első szintjeHaladóbb módszerrel az oldal forrása is megnézhető a Calibre saját Search/Replace varázspálca nyomógombja alatt, ahol regexp kifejezésekkel lehet ugyanezt automatikusan megcsinálni, ha látható vmi szabályszerűség a fejezetcímekre (pl. mindig egyedi betűmérettel vannak szedve, vagy vastagon, vagy számmal is kezdődnek, stb), de ahhoz ismerni kell ezeket a kifejezéseket, amik elsőre nem túl barátságosak
Új hozzászólás Aktív témák
- Díszdobozos Lenovo Yoga Slim 7i Pro "Kis Gamer" Ultrabook 14" -40% i5-11300H 16/512 QHD+ 2,8K OLED
- Ryzen5 esport Gamer(16gb ddr4/m2 ssd/win10/Vega11)
- HP ProBook 430 G6, 13,3" FULL HD IPS, I5-8265U, 8GB DDR4, 256GB SSD, WIN 10/11, SZÁMLA, GARANCIA
- Dell Latitude 3420, 14" FULL HD IPS, I5-1145G7 CPU, 8GB DDR4, 256GB SSD, W11, Számla, Garancia
- Dell Latitude 7280, 12,5" FHD IPS Kijelző, I5-6300U, 8GB DDR4, 256GB SSD, WIN 10, Számla, garancia