Projectes/ElaGeminada/Codificació
La L·L a Unicode
La ela geminada té dues codificacions possibles a Unicode.
- Una, la més estesa, és mitjançant 3 caràcters L+·+L, on · és el càracter U+00B7
- L'altra, d'ús poc estès, és mitjançant 2 càracters Ŀ+L, on Ŀ és el caràcter U+013F (majúscula) i U+0140 (minúscula).
Les dues codificacions tenen cert grau de compatibilitat a Unicode, però no són canònicament equivalents nomenclatura Unicode), i no ho seran mai. Unicode, des de l'any 2007 recomana usar la codificació de 3 caràcters.
Cada codificació té pros i contres
L·L de 3 caràcters
- Pros:
- És la codificació més estesa
- El caràcter "·" es troba a tots els tipus de lletra
- El caràcter "·" es troba als jocs de caràcters de 8 bits latin1/ISO-8859-1/ISO-8859-15
- Els correctors ortogràfics la reconeixen.
- És la codificació usada en les bases de dades oficials, p.ex. DNI o Registre Civil.
- El caràcter "·" es troba accessible en el teclat més habitual dels catalans (el QWERTY espanyol) i en molts altres teclats
- Contres:
- Hi ha problemes de segmentació, associats al caràcter "·" i als algorismes de segmentació. Especialment en programes que usen un algorisme ad-hoc, diferent de l'UAX TR29
- Alguns tipus de lletra generen una L·L molt ampla. Això es pot solucionar si els tipografs fan ús de les funcions de la tipografia digital (amb excepció dels tipus de lletra mecanogràfica)
ĿL de 2 caràcters
- Pros:
- Ŀ és un caràcter alfabètic (tots els problemes de mala segmentació associats al caràcter "·" se solucionen)
- Alguns tipus de lletra generen una ĿL maca.
- Contres:
- El caràcter Ŀ no es troba als jocs de 8 bits latin1/ISO-8859-1/ISO-8859-15. Sí és troba al ISO-6937
- Alguns tipus de lletra no tenen aquest caràcter
- Alguns tipus de lletra generen una ĿL lletja
- Els correctors ortogràfics no la reconeixen.
- Les bases de dades oficials, p.ex DNI o Registre Civil, no l'accepten.
- El caràcter Ŀ no es troba accessible en la majoria de teclats.
Entorns de 7 bits
No hi ha definida com codificar la "L·L" en un entorn de 7 bits de forma unificada, com "aplanar-la".
- En alguns llocs es codifica usant un punt baix "L.L"
- En altres es perd el punt volat "LL" (zona lectura mecànica de DNI i passaports)
- En altres s'usa un guió "L-L" (dominis .cat, registre d'empadronament)
- En altres es canvia per un espai "L L" (carnet de conduir?)