Hola, fa uns mesos vaig estar col.laborant amb l'autor d'un teclat d'android (SlideIT) per a que apareixera en català. He intentat fer ara el mateix amb un altre teclat (Keymonk), però l'autor demana un diccionari ordenat per freqüències d'aparició de les paraules.
I no sé d'on traure això o com generar-lo. Per si podieu ajudar-me, o dir-me com generar-lo. També vaig escriure un programa que conta aparicions de cada paraula a partir de textos que li puga anar "alimentant", però tampoc sé d'on traure textos que siguen significatius.
Descarrega una gran quantitat de pagines web, extreu les paraules per i les ordena per num. d'aparicions... etc. No estic d'acord amb ell pel fet de fer servir diccionaris comercials per perfeccionar la sortida, crec que podria tenir problemes legals si es vol redistribuir posteriorment.
Si algú sap con aconseguir gran quantitat de llibres, textos etc... de bones fonts em veig amb cor de fer el proces jo mateix. Haurien de ser 100% en català i corregits ortogràficament.