Projecte per a cercar, documentar i solucionar problemes relacionats amb l'ús del punt volat i la ela geminada en l'àmbit informàtic.

La finalitat d’aquest projecte és, en col·laboració amb el Projecte de normalització tipogràfica de la ela geminada, cercar, documentar i solucionar els problemes relacionats amb l’ús del punt volat i la ela geminada en l’àmbit informàtic.

Descripció del problema

Malauradament, és freqüent que el punt volat tingui un tractament informàtic incorrecte que perjudica l’ús que en fem els catalans.

Alguns dels problemes freqüents detectats són, agrupats en 5 tipus bàsics, moltes vegades inter-relacionats:

  • Problemes de segmentació de paraules (més detalls):
    • Impossibilitat de corregir l’ortografia de mots amb punt volat.
    • Recompte incorrecte de paraules (p.e.: “paral·lel” compta com 2 mots).
    • Partició de mots a final de ratlla incorrecta.
    • Detecció automàtica errònia d’URL amb punt volat, p.ex. www.l·l.cat
    • Indexació i processament incorrectes de textos, p.ex. www.google.com/translate
  • Problemes d’accés o disponibilitat del caràcter “·” (més detalls):
    • Alguns teclats d’ús comú no disposen del caràcter «·» (U+00B7)
    • Alguns teclats dificulten l’ús del caràcter «·» (U+00B7), posant-lo en un lloc difícil de trobar.
    • Alguns teclats afavoreixen l’ús dels caràcters «Ŀ» i «ŀ» (U+013F i U+0140)
  • Problemes d’ordenació (més detalls):
    • Aplicacions o SO que no ordenen correctament els mots amb «l·l».
  • Problemes de codificació (més detalls):
    • Existeixen dues codificacions a Unicode per a ela geminada, incompatibles entre elles: «L»+«·»+«L» (L+U+00B7+L) i «Ŀ»+«L» (U+013F+L).
    • En entorns de 7 bits no hi ha una codificació unificada de la ela geminada. En alguns entorns s’elideix el punt volat, en altres se substitueix per un guionet i en altres per un espai o un guió baix.
  • Visualització incorrecta de la ela geminada (més detalls):
    • Tipus de lletra mostren «l·l» molt ampla o amb el punt descentrat.

Estat de la qüestió

El problema més estès és una mala segmentació, especialment a GNOME, Mozilla i Apple.

El problema d’accessibilitat està concentrat a Android o en teclats espanyols i anglesos de noves plataformes.

  • Problemes de mala segmentació
    • Importants:
      • GNOME (GIMP, Abiword, gedit…)
      • Apple (TextEdit, Pages)
      • Aplicacions web molt usades (Gmail, Outlook, Yahoo, Twitter…)
    • Relatius:
      • Aplicacions Microsoft (IE, Word): la correcció ortogràfica funciona bé, però la selecció amb doble clic no.
      • Productes Mozilla (Firefox, Thunderbird,..) en seleccionar amb doble clic.
  • Problemes d’accessibilitat al caràcter “·”
    • Importants:
      • Al teclat català d’Android del principals fabricants i apps de teclats: Samsung, Sony, HTC, Switfkey, AOSP/Google
    • Relatius:
      • Al teclat espanyol d’iOS i Android. Aquests teclats no tenen el punt volat i seria recomanable que hi fos.
  • Problemes d’ordenació
    • No hem detectat problemes importants d’ordenació alfabètica.
  • Problemes de codificació
    • Importants:
      • a Android personalitzat de grans fabricants (Samsung, Sony…), per manca d’accessibilitat al caràcter «·» o «L·L».
      • a WindowsPhone, el teclat català ofereix el caràcter «Ŀ» i dificulta molt l’accés al caràcter «·».
      • a BB10, el teclat català ofereix el caràcter «Ŀ» i dificulta molt l’accés al caràcter «·».
      • a iOS5 (en extinció), per manca d’accessibilitat al caràcter «·»
      • als empadronaments de l’estat espanyol no hi ha possibilitat d’usar el caràcter «·». Es canvia per un guió «L·L» -> «L-L» (des de gener 2015 ja es pot fer servir la L·L, però les dades anterior no es modifiquen).
      • als carnets de conduir de l’estat espanyol no hi ha possibilitat d’usar el caràcter «·», es canvia per un espai «L·L» -> «L L»
      • a les targetes de crèdit i dèbit no es pot fer servir el caràcter «·» (això és per limitacions de l’estàndard ISO internacional que defineix aquestes targetes). Tampoc no està unificat l’aplanament de L·L. Tenim constància de targetes amb «L L» i també amb «L.L».
    • Relatius:
      • a ChromeOS i Linux amb el teclat català. Aquests teclats faciliten, excessivament, l’ús dels caràcters «Ŀ» i «ŀ» (U+013F i U+0140)

Anàlisis

També tenim anàlisis d’estat de la situació a teclats i de segmentació.

Errors reportats

En aquesta pàgina teniu recollits els errors reportats als diferents projectes, el que s’han solucionat i els que tenim pendent de solucionar.

Referències

    1. Projecte de normalització tipogràfica de la ela geminada
    2. El punt volat a la Wikipedia (en anglès)
    3. El punt volat a la Viquipèdia
    4. La ela geminada a la Viquipèdia
    5. Algorisme UAX 29 d’Unicode de segmentació de text.
    6. Algorisme UAX 31 d’Unicode de sintaxi d’identificadors i patrons.
    7. RFC 5892 que defineix els caràcters vàlids als IDNA
  1. RFC 6927 que recull els variants als caràcters no ASCII definides als IDNA.