Article: El Projecte Gutemberg accepta el català. Una altra mesura de la presència del català a la xarxa

Compartiu


Una altra mesura de la presència del català a la xarxa

Paco Rivière
Coordinador General de PalmCAT

Introducció

Un dels objectius de PalmCAT, a més de l’adaptació de programes lliures al català, és l’adaptació i difusió de documents, que ja estan en català, a un format adeqüat per a poder ser llegits amb un ordinador de butxaca.

Alhora de trobar documents en català, apropiats per a ser adaptats a un ordinador de butxaca, es donen moltes circumstàncies curioses. Com que el pressupost de PalmCAT és absolutament limitat, és lògic pensar que sent el català una llengua milenària, no serà tan difícil trobar documents que tinguin més de 100 anys, i per tan estiguin lliures de drets d’autor. Faré servir l’adaptació del Tirant lo Blanc a mode d’exemple.

El projecte Gutenberg

El Projecte Gutenberg és la font més antiga de llibres electrònics (eBooks o etexts) a Internet. La seva col·lecció amb més de 12.000 documents, ha estat possible gràcies a centenars de voluntaris. La majoria dels documents del Projecte Gutenberg són obres literàries antigues que han passat al domini públic als Estats Units. Tots es poden baixar, llegir i distribuïr gratuïtament, mentre no es modifiquin i es respecti la legalitat internacional, i de fet es pretén que sigui realment així. Convé en tot cas llegir en detall les condicions de la llicència de distribució del projecte.

Aquests documents estan disponibles en 36 llengües diferents, incloent – des de fa poc el català – i em sembla que el nombre de documents en aquest projecte pot ser considerat com un indicador de l’activitat d’aquestes llengues a la xarxa.

Al Projecte Gutemberg, s’hi pot trobar la versió en anglés de Tirant lo Blanc i paradoxalment no s’hi pot trobar la versió en català. També s’hi pot trobar una versió en anglés del Quixot, per a ser llegida i una altra per escoltar via MP3, i també en castellà, així com 51 obres més en castellà.

Però el Tirant lo Blanc en català no hi és al Projecte Gutemberg. De fet al Projecte Gutemberg no hi ha cap llibre en català, si exceptuem una obra en alemany que tracta de temes lingüistics catalans, i que per contenir fragments en català, ha estat classificada com a obra en alemany i en català!

De fet ha estat una sort que el seu autor l’hagi classificat així, ja que no fa tan de temps vaig creuar correspondència amb el responsable del Projecte GutembergBiblioteca Cervantes el Tirant tampoc no hi és ni en format text ni en format audio (MP3). De fet només hi ha una “versió facsímil” que necessita 10 vegades més memòria que la versió en text i que no resulta apropiada per adaptarla a un ordinador de butxaca, amb el programari en català de que disposem. (I que per cert, és molt més senzilla d’obtenir amb un escànner, que una versió text, per la que cal un sistema de reconeixement òptic – OCR – i una posterior revisió manual).

La Biblioteca Cervantes i la Constitució

És curiós que la Biblioteca Cervantes, que tan bé s’ocupa de fer efectiu l’article 9.2. de la Constitució de 1978, que diu “Correspon als poders públics de promoure les condicions per tal que la llibertat i la igualtat de l’individu i dels grups en els quals s’integra siguin reals i efectives; remoure els obstacles que n’impedeixin o en dificultin la plenitud i facilitar la participació de tots els ciutadans en la vida política, econòmica, cultural i social”. Doncs digitalitzar el Quixot és un pas per portar la cultura a tothom. D’altra banda li costa tan fer efectiu l’article 3.3 (de la mateixa Constitució!): “La riquesa de les diferents modalitats lingüístiques d’Espanya és un patrimoni cultural que serà objecte d’especial respecte i protecció.” També és curiós que justament en el cas de l’article 9.2 sigui molt més fàcil respectar-lo pel cas del castellà, que no pas del català que hauria de “ser objecte d’especial respecte i protecció” – segons l’article 3.3. O és que les institucions públiques que donen suport a la Biblioteca Cervantes és nodreixen únicament d’impostos no catalans?

Potser pagaria la pena reflexionar si és suficient que la constitució consideri una llengua mil·lenària com el català, tan sols una “modalitat lingüística d’Espanya”

Memoware

També vaig descobrir que a Memoware, la versió de butxaca del Projecte Gutemberg, amb més de 18.000 documents en format per a ordinadors de butxaca, no hi havia cap document en català. En aquest cas va ser possible – després de forces explicacions – sol·licitar la inclusió del català a la llista de llengües – a la que per cert el català és ara la primera per ordre alfabètic – i avui hi figuren una trentena de documents, a més de la versió en anglès del Tirant lo Blanc, procedent de l’adaptació al format de butxaca, de la versió del Projecte Gutemberg. Durant aquests dos anys, més de 480 internautes han baixat aquesta versió de butxaca en anglès, potser pel fet d’estar classificada com a novela medieval d’aventures.

Si cerquem “Cervantes” a Memoware, trobarem el Quixot en castellà, anglès, alemany i italià. Si cerquem “Joanot Martorell” trobaren el Tirant en anglès, i ben aviat, espero que en català.

Val a dir que és comprensible que hi hagin molts més documents en format de butxaca a Memoware, que textos al Projecte Gutemberg, ja que resulta força més agradable llegir un llibre a un ordinador de butxaca, i més “natural” en el sentit de que es sembla més a la forma tradicional de llegir un llibre, que es pot portar i llegir en qualsevol lloc.

Tarragona Internet

Fa poc vaig tenir la sorpresa de descobrir que Tinet.org ha digitalitzat la versió original del Tirant lo Blanc a la seva Biblioteca Digital. Em vaig posar en contacte amb el responsable del projecte, que em va donar tota mena de facilitats per la seva adaptació a format de butxaca. Avui es pot trobar a PalmCAT en format Plucker.

Pel que sembla, aquesta versió, es va fer amb la col·laboració de diverses escoles de Tarragona i de molts alumnes, i segons vaig saber, hi poden haver alguns errors, i encara està pendent d’una feina de correcció, que no ha trobat patrocinadors, per diversos motius.

Plucker

Plucker és un navegador sense connexió a internet (offline) i visualitzador de llibres, que inclou moltes funcions, com imatges sensibles (desplaçables i ampliables), tipus de lletra cursiva, petit i d’alta resolució, múltiples bases de dades concurrents, paràmetres de pantalla i opcions de llapis configurables (navegació per gesticulacions i pels botons del maquinari) compressió ZLIB i DOC, conductes i interfícies amb PERL i Python, i un instal·lador per a Windows totalment integrat.

PalmCAT ha adaptat aquest programa al català. De fet és un dels projectes més importants de PalmCAT i per això cercàvem un document molt especial per impulsar-lo, com el Tirant. El format Plucker és molt adeqüat per adaptar llibres que es trobin en format HTML, com el cas del Tirant de Tinet.org, ja que permet una còmoda navegació per l’index i pels capítols, a més de respectar força la tipografia i les imatges, cosa que no va ser possible en el moment que vàrem adaptar la versió anglesa, ja que ni disposavem del Plucker en català, ni aquella versió era en format HTML.

Conclusió

Hi ha diversos “baròmetres” de la presència del català a la xarxa; la majoria es basen en comptar el nombre de pàgines en català disponibles a internet. Però el que fa realment útil la xarxa, no són les pàgines en sí mateix, sinó els continguts reals als que ens donen accès. En aquest cas el màxim exponent de la nostra literatura. I la comparació resulta aclapadora: Mentre el Quixot ha disposat d’un important projecte de digitalització recolçat per institucions públiques (finançades amb impostos dels catalans) i ha donat lloc a la creació d’una gran biblioteca virtual, que ha liderat un projecte internacional en el mateix sentit, als països de llengua castellana. El Tirant ha estat digitalitzat per professors i estudiants voluntaris d’algunes escoles, i encara està pendent la seva revisió. Tot i que per la seva maduresa, la literatura catalana és rica en obres antigues de gran valor, la dificultat està en trobar versions digitalitzades.

Per cert, si en sabeu d’alguna us agrairem que us poseu en contacte amb nosaltres.

Nota

Pels convenis per promoure la llengua i la cultura catalanes a l’exterior, entre la Biblioteca Cervantes, l’Institut Ramon Llul, i la Biblioteca de Catalunya, s’ofereixen alguns textos clàssics en català. Malauradament, la pràctica totalitat d’aquests documents són en format facsímil, que com hem explicat més amunt, no és adeqüat per la seva adaptació a un ordinador de butxaca. Per si no n’hi hagués prou, aquests documents, tot i ser molts, textos antics lliures de drets d’autor, no estan disponibles per la seva reedició, com ho són els documents del Projecte Gutemberg (com ara la versió citada del Tirant en anglès) com conseqüència d’unes limitacions molt restrictives que ens obliguen a disposar d’una autorització per escrit, per tal de fer la conversió en format Plucker com hem fet per a tots els altres documents disponibles a PalmCAT, és a dir sense cap modificació. D’altra banda, mentre les planes web, tan de la Biblioteca de Catalunya, com de l’Institut Ramon Llull són en anglès i castellà, a més d’en català, la de l’Institut Cervantes segueix sent només en castellà. Curiosa manera d’entendre el bilingüisme, que dóna la raó a en Salvador Sostres, que en parlar-nos del “puto bilingüisme” escribia fa poc al diari Avui que “El bilingüisme és sempre que jo parli castellà però no és mai que tu parlis en català.”

(c) Paco Rivière – 2004 Es garanteix el permís per a copiar i distribuir aquest document complet en qualsevol mitjà si es fa de manera literal i es manté aquesta nota.

Referències

  • Projecte Gutemberg: http://www.gutenberg.net/
  • Biblioteca Cervantes: http://www.cervantesvirtual.com
  • Biblioteca de Catalunya: http://www.gencat.net/bc/
  • Institut Ramon Llull: http://www.llull.com/llull/
  • Constitució Espanyola de 1978: http://www.ub.es/mercanti/Constitucio/Directconsti.html
  • Comentari sobre el tractament fiscal de Catalunya per part d’Espanya, per Xavier Sala-i-Martin, professor d’Economia de l’Universitat de Columbia: http://www.columbia.edu/~xs23/catala/fiscalc.htm
  • Memoware: http://www.memoware.com
  • Tarragona Internet: http://www.tinet.org/
  • Tinet Biblioteca: http://www.tinetbiblioteca.org/
  • Portal del conveni entre la Biblioteca de Catalunya i la Biblioteca Cervantes http://www.cervantesvirtual.com/portal/bc/
  • Plucker: http://plkr.org
  • Baròmetre de l’ús de català a internet: http://wiccac.org/webscat.html
  • PalmCAT: http://palmcat.org

Comentaris