logo Corrector ortogràfic

Corrector ortogràfic

Col·laboreu en el projecte

Compartiu

L'objectiu d'aquest projecte és crear i mantenir un corrector ortogràfic lliure multiplataforma i multiformat que es pugui fer servir en el màxim nombre de programes possible.

En aquest projecte mantenim la llista de paraules reconegudes pels diversos correctors ortogràfics de Softcatalà, tots els quals comparteixen les mateixes dades, encara que possiblement en formats diferents. Aquest és el corrector que avui en dia usen programes com el LanguageTool, el LibreOffice, l’Abiword, els programes de Mozilla i la majoria de programari lliure.

Si voleu col·laborar en aquest projecte, continueu llegint, hi ha feina a voler per a tothom.

Diccionaris disponibles

Darreres versions estables del diccionari en diferents formats. Fem un seguiment de quines aplicacions l’inclouen.

Mozilla

LibreOffice i Apache OpenOffice

Aspell

Generalitats

Un corrector ha de fer dues funcions principals:

  • Comprovar que una paraula pertany a la llengua
  • Oferir suggeriments per a paraules incorrectes

La majoria dels correctors separen la llista de paraules del “motor”, la qual cosa permet de fer servir la mateixa llista (amb eventuals canvis de format) amb motors diferents i, alhora, que diverses llengües comparteixin un mateix motor. L’avantatge d’aquest sistema és que el treball fet en una llista o en un motor es pot aprofitar àmpliament. L’inconvenient és que no es recullen especificitats de les llengües que podrien menar a llistes més compactes i motors més potents i, en el pitjor dels casos, s’obté una inferior qualitat (normalment traduïda en suggeriments més pobres).

Versions del corrector

Es generen versions diferents de la llista de paraules. Per ara hi ha aquestes versions:

  • “català (general)”: Conté totes les entrades que formen part de l’estàndard reconegut generalment. Inclou la morfologia recollida a la gramàtica de l’IEC.
  • “català (valencià)”: A més de totes les formes de la versió “general”, n’inclou d’altres que són acceptades per molts al País Valencià. Potser s’hauria de canviar el nom de la versió.

Sens dubte, no tothom coincideix en les paraules que ha d’incloure un corrector per als usuaris valencians, balears, tortosins o barcelonins. Crec (JMo) que el més adient és posar el màxim d’entrades a la versió “general”, procedeixin d’on procedeixin, i deixar per a les altres versions les paraules sobre les quals no hi ha un acord general (segurament, ni tan sols entre els parlants d’un mateix dialecte) i les que “empobreixen” el corrector. Per exemple, telefon o francés, per als parlants que no siguin balears o valencians. En aquest moment, telefon és a la versió “general” i francés, només a la versió “avl”. Quan hi hagi una versió “balear”, s’hi haurà de desplaçar telefon. Tanmateix, els dos casos són diferents, ja que, mentre que hi ha unanimitat a acceptar la primera persona del present d’indicatiu sense desinència, no passa el mateix amb les formes que tenen e tancada en lloc de la general amb e oberta (o neutra).

Fites futures

  • Explorar jaciments de lèxic absent. Cada dia s’haurien de processar automàticament les publicacions en català disponibles a la xarxa, a la recerca de paraules absents (neologismes, topònims, cognoms) i errades.
  • Oferir accés a la base de dades a través de web. S’hauria de poder saber per què una paraula és dóna com a bona (el corrector pot explicar d’on l’ha treta) i proposar incorporacions a la llista.
  • Oferir un servei d’actualització automàtica de diccionaris.
  • Permetre que les paraules personalitzades es puguin exportar i importar, per a compartir els termes afegits entre ordinadors, i evitar la pèrdua d’informació d’una instal·lació a l’altra.

Codi i desenvolupament

Podeu baixar el codi actual amb github des de la línia d’ordres:

https://github.com/Softcatala/catalan-dict-tools

També podeu consultar la versió anterior del projecte:

https://github.com/Softcatala/corrector-ortografic

Contacte

Si voleu col·laborar en el projecte, apunteu-vos a la llista del corrector i participeu-hi.

Historial

juliol 2015

  • versió: 3.0.1
  • Canvis menors en les entrades
  • Llicència LGPL i GPL explícita

maig 2015

  • Nova versió principal: 3.0.0
  • Continguts unificats de les versions anteriors dels diccionaris hunspell i LanguageTool
  • Millores en la flexió verbal
  • Abandonat el format Aspell

11 febrer 2013

  • Més d’un centenar d’entrades noves: superlatius (tantíssim), diminutius (menudet), adverbis acabats en -ment (massivament), paraules del Termcat i d’altres diccionaris (demoscòpic, flexiseguretat), algunes formes verbals (pertanc, pertangués), etc.
  • Correccions d’errors diversos: pouï, tans, Peró, etc.
  • Addició de formes verbals valencianes formals: cantasses (1a conjugació), patesca (3a conjugació incoativa).

2 març 2009

  • S’han creat diccionaris per a aspell.

2008

  • S’ha creat la versió “avl”.
  • S’han afegit nombroses entrades procedents del Termcat.
  • S’ha creat un wrapper d’Hunspell per a .Net.
  • S’han corregit nombrosos errors i s’ha ampliat les conjugacions ‘valencianes’.

24 juliol 2007

  • S’han afegit les paraules noves de la segona edició del DIEC. S’han incorporat també paraules d’altres fonts i s’han corregit nombrosos errors.
  • S’ha creat la versió per a Hunspell dels diccionaris. Es manté encara la versió Myspell. Hunspell, una evolució de MySpell, funciona millor per a llengües flexives, com el català. Entre les millores, destaca la possibilitat d’aplicar dos prefixos consecutivament a la mateixa arrel. En català és molt útil per als pronoms proclítics, que es combinen amb formes verbals conjugades (per tant, el primer prefix fa la conjugació i el segon afegeix el pronom o pronoms).
  • S’ha reescrit el programa en C#.
  • S’ha creat un wrapper de Hunspell per a Ruby.