PDAclub.pl - Forum użytkowników technologii mobilnych

Windows Mobile (Classic, Professional, Standard), Windows Phone 6.x oraz 7/8.x/10 => Oprogramowanie PPC => Wątek zaczęty przez: qrees w Październik 24, 2006, 22:11:25

Tytuł: TenGO - polski słownik
Wiadomość wysłana przez: qrees w Październik 24, 2006, 22:11:25
Ostatnio szukałem jakiejś dobrej polskiej klawiatury niestety bez większych efektów. Są polskie słowniki do zwykłych klawiatur, ale wpisywanie tekstów za pomocą tak małych literek jest raczej uciążliwe. TenGO w pewnym sensie rozwiązuje ten problem, ale nie ma polskiej wersji. Po odrobinie zmagań wystrugałem polski słownik do tego programu.

Słownik jest wyciągnięty z Aspell'a. Niestety nie udało mi się zmusić polskich literek do działania, zatem wyrzyski litery typu ą, ś, ć są zamienione na a, s, c itd. (może uda się to później rozwiązać). Kolejny problem to brak odmiany słów, których wydaje się, że TenGo nie obsługuje, a wpisywanie każdej formy wyrazów zajęłoby ładnych paręnaście MB.

http://strony.aster.pl/qrees/tengo.rar
Tytuł: TenGO - polski słownik
Wiadomość wysłana przez: piopawlu w Październik 25, 2006, 09:03:30
tutaj przydalby sie raczej slownik wygenerowany na podstawie wyslanych sms'ow, a nie aspell w ktorej sa slowa nigdy nie uzywane. Dodatkowo slowa powinny byc posortowane w zaleznosci od czestosci uzywania. Na podstawie aspella ciezko uzyskac taki efekt.

Jako, ze baza to zwykly sqlite3 nie ma problemu z jej edycja czy generacja. Mam archiwum okolo 6 tys sms'ow wiec sprobuje wygenerowac na ich podstawie slownik i wrzucic do watku :)
Tytuł: TenGO - polski słownik
Wiadomość wysłana przez: qrees w Październik 25, 2006, 17:22:00
Cytat: "piopawlu"
tutaj przydalby sie raczej slownik wygenerowany na podstawie wyslanych sms'ow, a nie aspell w ktorej sa slowa nigdy nie uzywane. Dodatkowo slowa powinny byc posortowane w zaleznosci od czestosci uzywania. Na podstawie aspella ciezko uzyskac taki efekt.

Jako, ze baza to zwykly sqlite3 nie ma problemu z jej edycja czy generacja. Mam archiwum okolo 6 tys sms'ow wiec sprobuje wygenerowac na ich podstawie slownik i wrzucic do watku :)
dobry pomysł, aczkolwiek w SMS'ach mogą się zdarzyć słowa nie do końca poprawne (no chyba, że też były z jakimś słownikiem pisane).

Co do bazy, to nie wiem dlaczego ale czasem działa, a czasem nie. Mi np nie chciała działać po skompaktowaniu. Słownik oczywiście nie jest doskonały, a co do aspella, to jest on podzielony na 3 części. W podanym wyżej pliku zamieściłem wszystkie 3, ale można umieścić np tylko dwie części (jak ktoś ściągnie słownik do aspella, to mówię o plikach A, B i C).

Mimo wszystko, mi o wiele łatwiej się pisze w ten sposób.
Tytuł: TenGO - polski słownik
Wiadomość wysłana przez: kusnier w Październik 29, 2006, 00:05:35
Dobra robota.

Dla tych ktorzy chcieliby moc zmieniac slownik np polski/angielski w trakcie pracy programu nalezy:

1) skopiowac podany plik do katalogu windows pod inna nazwa np tengo.db.polski
2) wpisac w rejestrze HKLM\Software\Xrgomics\TenGO\Dictionary
   klucz "Polski" o wartosci string: "tengo.db.polski" - bez cudzysłowów oczywiscie
3) Potem mozemy juz standardowo wybierac slownik podczas pracy z TenGO.

pzdr
W.
Tytuł: TenGO - polski słownik
Wiadomość wysłana przez: piopawlu w Listopad 02, 2006, 14:30:31
Tak jak wspomnialem wczesniej, przetworzylem wiadomosci. Nie byly to jednak sms'y, a przeszlo 800 tysiecy wiadomosci wyslanych przez GG/Jabbera/ICQ itd. Wszystko przefiltrowalem przez slownik, a nastepnie posortowalem wzgledem czestosci uzytkowania slow. Powstal slownik 80 tysiecy slow. Obcialem slowa uzyte tylko raz, i otrzymalem ten oto slownik okolo 30 tysiecy slow. Zajmuje on 1MB czyli tyle co angielski slownik tenGO.

Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab

Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: Sanjuro w Kwiecień 22, 2007, 19:43:33
Tak jak wspomnialem wczesniej, przetworzylem wiadomosci. Nie byly to jednak sms'y, a przeszlo 800 tysiecy wiadomosci wyslanych przez GG/Jabbera/ICQ itd. Wszystko przefiltrowalem przez slownik, a nastepnie posortowalem wzgledem czestosci uzytkowania slow. Powstal slownik 80 tysiecy slow. Obcialem slowa uzyte tylko raz, i otrzymalem ten oto slownik okolo 30 tysiecy slow. Zajmuje on 1MB czyli tyle co angielski slownik tenGO.

Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab

Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.

Nie ma to jak odkopać wątek, ale mam do Ciebie prośbę. Masz może przygotowany słownik z polskimi znakami diakrytycznymi? Mógłbyś go udostępnić?
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: >>Devasto>> w Kwiecień 22, 2007, 21:32:03
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: Sanjuro w Kwiecień 22, 2007, 21:49:52
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Wiem, ale mam teorię jak to zmienić :P
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: qrees w Kwiecień 23, 2007, 17:25:22
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Wiem, ale mam teorię jak to zmienić :P
podziel się z nami ;)
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: Sanjuro w Kwiecień 23, 2007, 20:10:58
podziel się z nami ;)
A w zasadzie to jak ktoś to zrobi przedemną to sie nic nie stanie :P Już wstępne próby robiłem i DZIAŁA!!! Ale po kolei:
1) TenGO w słowniku korzysta tylko z małych liter (duże litery to )
2) W większości przypadków TenGO korzysta ze standardu ASCII,
3) znaki diakrytyczne TenGO koduje na własną modłę (przynajmniej ja nie znam tego standardu) który wygląda tak (znak - kod hexadecymalny):
ą - 0x7F0501
ć - 0x7F0701
ę - 0x7F1901
ł - 0x7F4201
ń - 0x7F4401
ó - 0xF3
ś - 0x7F5B01
ż - 0x7F7C01
ź - 0x7F7A01
Jak widać tylko ó ma normalny kod 8-bitowy, zgodny z ASCII.

Co trzeba z tym zrobić? Przygotować słownik tak by każdy znak diakrytyczny, a raczej jego reprezentacje bitową zmienić z reprezentacją z kodowania TenGO. Proste do bólu, potrzebuję jedynie jak ktoś ma "niedziałającą" wersję słownika do TenGO ze znakami diakrytycznymi, to resztę zrobie już sam :P

Jest jeden minus, słownik niestety trochę urośnie :(
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: qrees w Kwiecień 25, 2007, 13:21:50
podziel się z nami ;)
A w zasadzie to jak ktoś to zrobi przedemną to sie nic nie stanie :P Już wstępne próby robiłem i DZIAŁA!!! Ale po kolei:
1) TenGO w słowniku korzysta tylko z małych liter (duże litery to )
2) W większości przypadków TenGO korzysta ze standardu ASCII,
3) znaki diakrytyczne TenGO koduje na własną modłę (przynajmniej ja nie znam tego standardu) który wygląda tak (znak - kod hexadecymalny):
ą - 0x7F0501
ć - 0x7F0701
ę - 0x7F1901
ł - 0x7F4201
ń - 0x7F4401
ó - 0xF3
ś - 0x7F5B01
ż - 0x7F7C01
ź - 0x7F7A01
Jak widać tylko ó ma normalny kod 8-bitowy, zgodny z ASCII.

Co trzeba z tym zrobić? Przygotować słownik tak by każdy znak diakrytyczny, a raczej jego reprezentacje bitową zmienić z reprezentacją z kodowania TenGO. Proste do bólu, potrzebuję jedynie jak ktoś ma "niedziałającą" wersję słownika do TenGO ze znakami diakrytycznymi, to resztę zrobie już sam :P

Jest jeden minus, słownik niestety trochę urośnie :(
Problem może być jeszcze taki, że na klawiaturze nie ma znaków polskich, więc nie da się ich wpisać. Słowa z polskimi literami będzie można wybrać tylko z pojawiającej się listy. A przynajmniej tak mi się wydaje.
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: Sanjuro w Kwiecień 25, 2007, 13:34:14
Problem może być jeszcze taki, że na klawiaturze nie ma znaków polskich, więc nie da się ich wpisać. Słowa z polskimi literami będzie można wybrać tylko z pojawiającej się listy. A przynajmniej tak mi się wydaje.
Cała idea działania TenGo to to że nie masz olbrzymiej ilości klawiszy, tylko 6 i większość am załatwiać dobry słownik. Kończę właśnie budować słownik z OpenOffice, ale tylko na test, gdyż jest tam nadmiar słów, przez co TenGo nie będzie efektywne oraz rozmiar takiego słownika będzi olbrzymi. Tu pasowałby mi słownik na bazie rozmów z komunikatorów dzieki czemu słownik byłby pewnie wielkości 1-1,5MB.
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: loos w Kwiecień 25, 2007, 17:03:52
witam.

a czy problemem było by wypuścić 2 wersje słownika (z open offica, i komunikatorów) ?  (czekam z niecierpliwością i gratuluję podjęcia inicjatywy)

pzdr
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: Sanjuro w Kwiecień 25, 2007, 17:17:47
witam.

a czy problemem było by wypuścić 2 wersje słownika (z open offica, i komunikatorów) ?  (czekam z niecierpliwością i gratuluję podjęcia inicjatywy)

pzdr

Problemem by nie było :) Aktualnie robię test czy wszystko działa jak należy i zaraz pewnie zrobię edita i relase'a (jak będzie działał poprawnie).

------
EDIT

Słownik na bazie słownika OpenOffice działa i udostępniam go narazie tu: http://rapidshare.com/files/27867119/tengo.rar (http://rapidshare.com/files/27867119/tengo.rar).

Plusy:
+ działa :)
+ są polskie znaki diakrytyczne,
+ olbrzymi słownik (ok 240-250tyś wpisów)

Minusy:
- rozmiar (~9MB)
- DUŻA część wpisów jest całkowicie bezsensowna :/ lub nie potrzebna
- nie było jak ułożyć wpisów względem częstości używania,
- ... cos tu miało jeszcze być ale zapomniałem :P


Tak więc jak ktoś kto używa polskich znaczków przy komunikatorach (gg, tlen, jaber i inne) ma duża bazę rozmów to nich się podzieli nią lub zrobi słownik do TenGO :P Między czasie spróbuję zobaczyć na swoją bazę rozmów z tlena, tyle że zwykle nie stosowałem polskich znaczków i jak będzie za dużo roboty to odpada :P
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: Gorbo2004 w Wrzesień 09, 2007, 02:58:18
A powie ktoś może  jak zainstalować to tengo  ? :-D
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: kocurek w Wrzesień 14, 2007, 22:32:20

Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab

Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.

Nie bardzo działa mi ten plik .cab (ktoś wie jak to uruchamiać?)
Czy mógłbym prosić o plik .db tego słownika na maila - kocurek@post.pl - z góry dzięki.

Pozdrawiam
Tytuł: Odp: TenGO - polski słownik
Wiadomość wysłana przez: elCooL w Sierpień 18, 2008, 14:31:54
Sorry za odkopanie tematu, ale...
Zainstalowalem ostatnio Tengo dla testow. Swietna klawiatura ekranowa, 100 razy bardziej funkcjonalna od PCM Keyboard i nie sprawia u mnie problemow. Przetestowalem rowniez zamieszczony tutaj przez piopawlu polski slownik, ale mam jedno zastrzezenie. We wbudowanej angielskiej wersji slownika, jest mozliwosc wstawiania polskich znakow i nauki nowych slow z polskimi znakami poprzez skreslanie liter, np. skreslajac 's' jestesmy w stanie otrzymac 'ś' (oraz inne znaki specjalne) itd. Niestety po uaktywnieniu slownika polskiego i "przekreslaniu" liter, nie mozna juz takiego efektu uzyskac. Wiec moje pytanie jest nastepujace, czy jest mozliwosc uzupelnienia tegoz slownika o taka funkcjonalnosc. Byloby wtedy idealnie, no prawie, bo producent programu powinien sam wypuscic oficjalna polska wersje.

Pozdrawiam