Witam!
Nie danwno kupiłem sobie słownik YDP Langenscheidt niemiecko-polski, polsko-niemiecki.
Na interfejs do baz słownikowych YDP chyba jeszcze będziemy musieli poczekać. Mi się nie chciało i zacząłem kombinować.
Otworzyłem bazę YDP w notatniku i zauważyłem coś niezykle ciekawego:
L \f0\b\cf0 Aachen \par\par
\f2\b0\cf1 Akwizgran{\plain\f0\cf5 .}\par
\par
˘ {\b Aal\b0\i \cf2 m\cf0\i0 (\i -es\i0 ;\i -e\i0 )\f2 \f0 \par\par \f2\cf1 węgorz\f0\cf0 ;\line \b Aal-\b0\i in \cf2 Zssgn\f2\cf0\i0 \cf1 węgorzowy\f0\cf0 .}Ń {\b aalen\b0\i {\plain\cf2 F}\i0 :\b\i sich aalen\f2\b0\i0 \f0 \par\par \f2\cf1 wylegiwać\cf0 \cf1 się\f0\cf0 ;\i \i0 \line \i in \cf2 d.\cf0 Sonne \cf2 a.\cf0
te wszystkie znaczniki dziwnie podobne były do znaczników html.
Tak więc odkryłem, że każdy może sobie tak spreparować plik z bazą YDP, żeby można było go przeglądać w explorerze albo jeszcze lepiej w iSilo.
Wystarczy tylko w np. w Wordzie, korzystając z narzędzia Edycja -> Zmień
zamienić znaczniki "ydp" na znaczniki HTML.
Ja bym proponował tak (ważna jest kolejność):
\b0 -> </b>
\b -> <b>
\i0 -> </i>
\par -> <br>
\line -> <br>
} -> <br><hr>
Reszta znaczników, np kolorujących bym wyrzucił, bo to tylko znacznie zwiększy rozmiar pliku.
Czyli należało by wykasować:
\cf0 \cf1 \cf2 \cf5 \plain \f2 \f0 {
W wyniku powstanie mniej więcej coś takiego:
L Aachen
--------------------------------------- (tu były <hr> linie ale się nie wkleiły)
˘ Aal m ( -es ; -e )
węgorz ;
Aal- in Zssgn węgorzowy .
-------------------------------------------------
Ń aalen F
: sich aalen
wylegiwać się ;
in d. Sonne a. pławić się .
------------------------------------------------
Ń aalglatt
śliski jak węgorz ;
fig. sprytny ;
przebiegły ( przebiegle ).
Niestety będzie z tym trochę pracy, bo plik z bazą nie-pol ma ok 6 MB i jak zaczniemy zmieniać na całości, to komp nam się pewnie zamuli.
Można to najlepiej podzielić na segmenty, np. pierwszy plik będą wyrazy na A.
Potem najwyżej można to złożyć do kupy.
Jak będziemy mieć już plik html, to możemy sobie łatwo to przekonwertować do formaty pdb za pomocą iSiloX.
Nie wiem jeszcze jak się pozbyć tych literek przed hasłami, ale to już tak bardzo w korzystaniu nie powinno przeszkadzać
Jak by ktoś miał lepszy pomysł z podmianą, albo już to zrobił, to proszę się pochwalić na poście, ew. dać link to plików.
Pozdrawiam, Shakaal.