PDAclub.pl - Forum użytkowników technologii mobilnych
Windows Mobile (Classic, Professional, Standard), Windows Phone 6.x oraz 7/8.x/10 => Oprogramowanie PPC => Wątek zaczęty przez: qrees w Październik 24, 2006, 22:11:25
-
Ostatnio szukałem jakiejś dobrej polskiej klawiatury niestety bez większych efektów. Są polskie słowniki do zwykłych klawiatur, ale wpisywanie tekstów za pomocą tak małych literek jest raczej uciążliwe. TenGO w pewnym sensie rozwiązuje ten problem, ale nie ma polskiej wersji. Po odrobinie zmagań wystrugałem polski słownik do tego programu.
Słownik jest wyciągnięty z Aspell'a. Niestety nie udało mi się zmusić polskich literek do działania, zatem wyrzyski litery typu ą, ś, ć są zamienione na a, s, c itd. (może uda się to później rozwiązać). Kolejny problem to brak odmiany słów, których wydaje się, że TenGo nie obsługuje, a wpisywanie każdej formy wyrazów zajęłoby ładnych paręnaście MB.
http://strony.aster.pl/qrees/tengo.rar
-
tutaj przydalby sie raczej slownik wygenerowany na podstawie wyslanych sms'ow, a nie aspell w ktorej sa slowa nigdy nie uzywane. Dodatkowo slowa powinny byc posortowane w zaleznosci od czestosci uzywania. Na podstawie aspella ciezko uzyskac taki efekt.
Jako, ze baza to zwykly sqlite3 nie ma problemu z jej edycja czy generacja. Mam archiwum okolo 6 tys sms'ow wiec sprobuje wygenerowac na ich podstawie slownik i wrzucic do watku :)
-
tutaj przydalby sie raczej slownik wygenerowany na podstawie wyslanych sms'ow, a nie aspell w ktorej sa slowa nigdy nie uzywane. Dodatkowo slowa powinny byc posortowane w zaleznosci od czestosci uzywania. Na podstawie aspella ciezko uzyskac taki efekt.
Jako, ze baza to zwykly sqlite3 nie ma problemu z jej edycja czy generacja. Mam archiwum okolo 6 tys sms'ow wiec sprobuje wygenerowac na ich podstawie slownik i wrzucic do watku :)
dobry pomysł, aczkolwiek w SMS'ach mogą się zdarzyć słowa nie do końca poprawne (no chyba, że też były z jakimś słownikiem pisane).
Co do bazy, to nie wiem dlaczego ale czasem działa, a czasem nie. Mi np nie chciała działać po skompaktowaniu. Słownik oczywiście nie jest doskonały, a co do aspella, to jest on podzielony na 3 części. W podanym wyżej pliku zamieściłem wszystkie 3, ale można umieścić np tylko dwie części (jak ktoś ściągnie słownik do aspella, to mówię o plikach A, B i C).
Mimo wszystko, mi o wiele łatwiej się pisze w ten sposób.
-
Dobra robota.
Dla tych ktorzy chcieliby moc zmieniac slownik np polski/angielski w trakcie pracy programu nalezy:
1) skopiowac podany plik do katalogu windows pod inna nazwa np tengo.db.polski
2) wpisac w rejestrze HKLM\Software\Xrgomics\TenGO\Dictionary
klucz "Polski" o wartosci string: "tengo.db.polski" - bez cudzysłowów oczywiscie
3) Potem mozemy juz standardowo wybierac slownik podczas pracy z TenGO.
pzdr
W.
-
Tak jak wspomnialem wczesniej, przetworzylem wiadomosci. Nie byly to jednak sms'y, a przeszlo 800 tysiecy wiadomosci wyslanych przez GG/Jabbera/ICQ itd. Wszystko przefiltrowalem przez slownik, a nastepnie posortowalem wzgledem czestosci uzytkowania slow. Powstal slownik 80 tysiecy slow. Obcialem slowa uzyte tylko raz, i otrzymalem ten oto slownik okolo 30 tysiecy slow. Zajmuje on 1MB czyli tyle co angielski slownik tenGO.
Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab
Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.
-
Tak jak wspomnialem wczesniej, przetworzylem wiadomosci. Nie byly to jednak sms'y, a przeszlo 800 tysiecy wiadomosci wyslanych przez GG/Jabbera/ICQ itd. Wszystko przefiltrowalem przez slownik, a nastepnie posortowalem wzgledem czestosci uzytkowania slow. Powstal slownik 80 tysiecy slow. Obcialem slowa uzyte tylko raz, i otrzymalem ten oto slownik okolo 30 tysiecy slow. Zajmuje on 1MB czyli tyle co angielski slownik tenGO.
Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab
Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.
Nie ma to jak odkopać wątek, ale mam do Ciebie prośbę. Masz może przygotowany słownik z polskimi znakami diakrytycznymi? Mógłbyś go udostępnić?
-
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
-
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Wiem, ale mam teorię jak to zmienić :P
-
ąćęłńóśżź? Z tego co pamietam, to byl/jest problem wlasnie z PL znakami dla TenGO
Wiem, ale mam teorię jak to zmienić :P
podziel się z nami ;)
-
podziel się z nami ;)
A w zasadzie to jak ktoś to zrobi przedemną to sie nic nie stanie :P Już wstępne próby robiłem i DZIAŁA!!! Ale po kolei:
1) TenGO w słowniku korzysta tylko z małych liter (duże litery to )
2) W większości przypadków TenGO korzysta ze standardu ASCII,
3) znaki diakrytyczne TenGO koduje na własną modłę (przynajmniej ja nie znam tego standardu) który wygląda tak (znak - kod hexadecymalny):
ą - 0x7F0501
ć - 0x7F0701
ę - 0x7F1901
ł - 0x7F4201
ń - 0x7F4401
ó - 0xF3
ś - 0x7F5B01
ż - 0x7F7C01
ź - 0x7F7A01
Jak widać tylko ó ma normalny kod 8-bitowy, zgodny z ASCII.
Co trzeba z tym zrobić? Przygotować słownik tak by każdy znak diakrytyczny, a raczej jego reprezentacje bitową zmienić z reprezentacją z kodowania TenGO. Proste do bólu, potrzebuję jedynie jak ktoś ma "niedziałającą" wersję słownika do TenGO ze znakami diakrytycznymi, to resztę zrobie już sam :P
Jest jeden minus, słownik niestety trochę urośnie :(
-
podziel się z nami ;)
A w zasadzie to jak ktoś to zrobi przedemną to sie nic nie stanie :P Już wstępne próby robiłem i DZIAŁA!!! Ale po kolei:
1) TenGO w słowniku korzysta tylko z małych liter (duże litery to )
2) W większości przypadków TenGO korzysta ze standardu ASCII,
3) znaki diakrytyczne TenGO koduje na własną modłę (przynajmniej ja nie znam tego standardu) który wygląda tak (znak - kod hexadecymalny):
ą - 0x7F0501
ć - 0x7F0701
ę - 0x7F1901
ł - 0x7F4201
ń - 0x7F4401
ó - 0xF3
ś - 0x7F5B01
ż - 0x7F7C01
ź - 0x7F7A01
Jak widać tylko ó ma normalny kod 8-bitowy, zgodny z ASCII.
Co trzeba z tym zrobić? Przygotować słownik tak by każdy znak diakrytyczny, a raczej jego reprezentacje bitową zmienić z reprezentacją z kodowania TenGO. Proste do bólu, potrzebuję jedynie jak ktoś ma "niedziałającą" wersję słownika do TenGO ze znakami diakrytycznymi, to resztę zrobie już sam :P
Jest jeden minus, słownik niestety trochę urośnie :(
Problem może być jeszcze taki, że na klawiaturze nie ma znaków polskich, więc nie da się ich wpisać. Słowa z polskimi literami będzie można wybrać tylko z pojawiającej się listy. A przynajmniej tak mi się wydaje.
-
Problem może być jeszcze taki, że na klawiaturze nie ma znaków polskich, więc nie da się ich wpisać. Słowa z polskimi literami będzie można wybrać tylko z pojawiającej się listy. A przynajmniej tak mi się wydaje.
Cała idea działania TenGo to to że nie masz olbrzymiej ilości klawiszy, tylko 6 i większość am załatwiać dobry słownik. Kończę właśnie budować słownik z OpenOffice, ale tylko na test, gdyż jest tam nadmiar słów, przez co TenGo nie będzie efektywne oraz rozmiar takiego słownika będzi olbrzymi. Tu pasowałby mi słownik na bazie rozmów z komunikatorów dzieki czemu słownik byłby pewnie wielkości 1-1,5MB.
-
witam.
a czy problemem było by wypuścić 2 wersje słownika (z open offica, i komunikatorów) ? (czekam z niecierpliwością i gratuluję podjęcia inicjatywy)
pzdr
-
witam.
a czy problemem było by wypuścić 2 wersje słownika (z open offica, i komunikatorów) ? (czekam z niecierpliwością i gratuluję podjęcia inicjatywy)
pzdr
Problemem by nie było :) Aktualnie robię test czy wszystko działa jak należy i zaraz pewnie zrobię edita i relase'a (jak będzie działał poprawnie).
------
EDIT
Słownik na bazie słownika OpenOffice działa i udostępniam go narazie tu: http://rapidshare.com/files/27867119/tengo.rar (http://rapidshare.com/files/27867119/tengo.rar).
Plusy:
+ działa :)
+ są polskie znaki diakrytyczne,
+ olbrzymi słownik (ok 240-250tyś wpisów)
Minusy:
- rozmiar (~9MB)
- DUŻA część wpisów jest całkowicie bezsensowna :/ lub nie potrzebna
- nie było jak ułożyć wpisów względem częstości używania,
- ... cos tu miało jeszcze być ale zapomniałem :P
Tak więc jak ktoś kto używa polskich znaczków przy komunikatorach (gg, tlen, jaber i inne) ma duża bazę rozmów to nich się podzieli nią lub zrobi słownik do TenGO :P Między czasie spróbuję zobaczyć na swoją bazę rozmów z tlena, tyle że zwykle nie stosowałem polskich znaczków i jak będzie za dużo roboty to odpada :P
-
A powie ktoś może jak zainstalować to tengo ? :-D
-
Dla wygody stworzylem instalke w CABie ktora sama konfiguruje rejestry:
http://get.piopawlu.net/file/tengo_pl.cab
Pisze sie calkiem niezle :) Duzo lepiej niz z przypadkowym ulozeniem slow, a slownik jest lzejszy.
Nie bardzo działa mi ten plik .cab (ktoś wie jak to uruchamiać?)
Czy mógłbym prosić o plik .db tego słownika na maila - kocurek@post.pl - z góry dzięki.
Pozdrawiam
-
Sorry za odkopanie tematu, ale...
Zainstalowalem ostatnio Tengo dla testow. Swietna klawiatura ekranowa, 100 razy bardziej funkcjonalna od PCM Keyboard i nie sprawia u mnie problemow. Przetestowalem rowniez zamieszczony tutaj przez piopawlu polski slownik, ale mam jedno zastrzezenie. We wbudowanej angielskiej wersji slownika, jest mozliwosc wstawiania polskich znakow i nauki nowych slow z polskimi znakami poprzez skreslanie liter, np. skreslajac 's' jestesmy w stanie otrzymac 'ś' (oraz inne znaki specjalne) itd. Niestety po uaktywnieniu slownika polskiego i "przekreslaniu" liter, nie mozna juz takiego efektu uzyskac. Wiec moje pytanie jest nastepujace, czy jest mozliwosc uzupelnienia tegoz slownika o taka funkcjonalnosc. Byloby wtedy idealnie, no prawie, bo producent programu powinien sam wypuscic oficjalna polska wersje.
Pozdrawiam