PDF zrobiony w latex -> txt (lub inny)

  • 5 Odpowiedzi
  • 1767 Wyświetleń

0 użytkowników i 1 Gość przegląda ten wątek.

PDF zrobiony w latex -> txt (lub inny)
« dnia: Lipiec 27, 2006, 10:20:41 »
Mam kilka ebookow w pdfach, ktorych za chiny ludowe nie potrafie przeniesc do txt (lub innych strawnych dla pluckera formatow).

Problem jest dla mnie trudny, bo dotyczy tych ksiazek ktore na prawde lubie. Mam je w wersji papierowej, ale noszenie ze soba kilkudziesieciu ksiazek zakrawa na schize.

Ktos moze ten problem juz jakosik rozwiazal?


*

lucass

PDF zrobiony w latex -> txt (lub inny)
« Odpowiedź #2 dnia: Lipiec 28, 2006, 09:19:16 »
Osobiscie uzywam Acrobat Professional, ale przez długi czas używałem SolidConverterPDF i spełniał swoja funkcje..., jak bedziesz konvertowac to z pdf lepiej do html a potem do formatu Pluckera... napisz jakiego uzywasz sprzetu...pewnie palm os.... a po drugie jakie to ksiązki ?:P?

PDF zrobiony w latex -> txt (lub inny)
« Odpowiedź #3 dnia: Lipiec 28, 2006, 10:11:26 »
Mam Visora Neo (PalmOS 3.5). Nie jest to moze rakieta, ale spelnia swoje zadania. Problemu nie opisalem dokladnie, a zapewne dotyczy on nie tylko mnie wiec naprawie swoj blad i juz opisuje.

Niektore PDF po zdjeciu hasla i konwersji do TXT ladnie sie konwertuja i dostaje tekst z polskimi znaczkami (ewentualnie bez, zalezy jak sobie zarzycze) ale niektore pdfy konwertuja sie nastepujaco:

zamiast polskiego "a" dostaje "a,"
zamiast polskiego "e" dostaje "e,"
zamiast polskiego "z" dostaje ".z" albo "'z"

(umiejscowienie przecinkow i kropek moze byc za literka)
Czasem w takim pdfie znikaja cale literki i zostaja same przecinki i kropki.

Zauwazylem ze problem ten dotyczy PDF zrobionych z latexa i stad moje pytanie.

Jesli chodzi jakie ksiazki to rozne rozniaste, np sapkowski w pdf, albo hp, czy ostatnio agata christie. Problemu nie zauwazalem na windows, bo czytalem pod readerem, ale odkad mam Neo wole lezec nad rzeka niz przy kompie ;)

*

lucass

PDF zrobiony w latex -> txt (lub inny)
« Odpowiedź #4 dnia: Lipiec 28, 2006, 10:29:09 »
problemy które opisujesz to problem złego skanu z OCR-a , korekta po wiazce tiffów zle została zrobiona i tyle :P

PDF zrobiony w latex -> txt (lub inny)
« Odpowiedź #5 dnia: Lipiec 28, 2006, 10:58:12 »
No nie jestem ekspertem ale w PDF wyraznie widze ze sa polskie znaczki a nie kombinacje z przecinkami. dopiero po konwersji wyskakuja problem.
Troche poszperalem o latexie i dowiedzialem sie, ze ma dwa (lub wiecej, ja znalazlem info o dwoch) standardy obslugi polskich znakow diakrytycznych. I ten pierwszy, niestety bardziej nieudolny obejmuje wykorzystanie wlasnie przecinkow i kropek.

Problem jednak nadal jest nierozwiazany.

Soft jaki testowalem: pdaConverter, Transformer PDF, mobireader.

Wszedzie taki sam efekt.