logo Mycroft

Mycroft

Compartiu

Projecte per a afegir el català al projecte Mycroft, un assistent de veu de programari lliure.

Mycroft és un assistent de veu de programari lliure i de codi obert que utilitza una interfície d’usuari de llenguatge natural. El codi del projecte Mycroft era anteriorment copyleft, però ara està sota una llicència permissiva Apache License 2.0.

Mycroft es pot fer servir des de Linux o amb una màquina virtual a Windows i Mac OS. Hi ha versió específica per a Rasberry Pi 3 o 4 (anomenada Picroft) i també aparells específics: Mycroft Mark I (exhaurit) i Mycroft Mark II (en desenvolupament).

Mycroft en català

S’està treballant per a afegir suport per al català a Mycroft. Per a aconseguir-ho cal incidir en 5 components:

  • Recursos del nucli de Mycroft (mycroft-core), usats en missatges comuns.
  • Biblioteca Lingua Franca, perquè Mycroft pugui entendre els nombres i dates.
  • Motor de reconeixement de la parla, perquè Mycroft entengui les ordres i consultes de veu.
  • Motor de síntesi de veu, perquè Mycroft pugui respondre amb missatges de veu.
  • Localització de les habilitats (skills) existents al català i desenvolupament de noves habilitats específiques del mercat catalonoparlant.

En referència al recursos del nucli

Es fan traduir i incorporar al nucli l’any 2017. Pendent de fer-hi una repassada.

En referència a Lingua Franca

L’ha tardor de 2020 s’ha enviat una PR per a afegir suport a Lingua Franca per al català. Pendent que ho acceptin a Mycroft.

En referència als motors de reconeixement de la parla

El motor de reconeixement de la parla predeterminat de Mycroft és el de Google, que admet el català.

També es poden usar altres motors, i evitar així la dependència de Google i augmentar la privadesa. Per a fer-ho cal instal·lar el mòdul corresponent i configurar-lo. Els mòduls que permeten reconeixement de veu en català són mycroft-stt-plugin-vosk i mycroft-stt-plugin-pocketsphinx.

En referència als motors de síntesi de veu (TTS)

El motor de síntesi de veu predeterminat de Mycroft Mimic 1 no admet el català, i aleshroes usa el motor del traductor de Goolge (espeak) però la qualitat és molt dolenta. No és acceptable.

L’estiu de 2020 es va afegir un mòdul al codi per a poder usar el motor TTS Festival, que té veus en català d’una qualitat prou bona. Només cal tenir instal·lat festival al sistema operatiu per a poder-lo usar.

La tardor de 2020 es van desenvolupar tres mòduls TTS per a fer crides a servidors TTS:

  • jarbas-tts-plugin-softcatala, que permet usar un servidor TTS basat en festival (desenvolupat per Softcatalà),
  • jarbas-tts-pugin-catotron, que permet usar servidor TTS Catotron (desenvolupat per Col·lectivaT). El mòdul de Catotron ofereix una qualitat de veu molt bona, però la latència (el temps que triga a generar l’àudio) és molt alta. Aquests dos mòduls no formen part del codi de Mycroft i cal instal·lar-los per a poder-los usar.
  • jarbas-tts-plugin-voicerss, que permet usar l’API de VoiceRSS. La qualitat és similar a festival i cal tenir un compte (pot tenir cost)

En referència a la localització de les habilitats

La tardor de 2020, gràcies a la col·laboració de cinc estudiants del màster de Tradumàtica de la UAB es va finalitzar la localització de totes les habilitats. Manca que aquestes traduccions arribin al repositori del codi font les habilitats respectives. Està sol·licitat al responsable de Mycroft, pendent que ho aprovin.

Configuració de Mycroft en català

Per a tenir Mycroft configurat en català cal:

  • Que el nucli i la biblioteca lingua franca admetin el català
  • Definir el català al fitxer mycroft.conf com a llengua de l’assistent
  • Tenir el mòdul TTS que vulguem emprar i ajustar la configuració al fitxer mycroft.conf
  • Que les habilitats tinguin els fitxers .dialog i .vocab en català. Això està pendent que els responsables de Mycroft facin l’exportació del servidor de traducció al repositori de les habilitats.

Ara mateix hi ha poques coses que funcioni de sèrie.:

Canals de comunicació

Tenim 2 canals de comunicació:

Agraïments

Aquest projecte no hauria estat possible sense l’ajuda de les següents persones:

Baybars Külebi (Col·lectivaT), Artur Vicedo, Angel Docampo, Casimiro Ferreira (jarbas) i Joan Montané.

Fem un agraïment especial a les estudiants del màster de Tradumàtica de la UAB: Marisol Oliver Pérez, Claudia Craiu Craciun, Ada Basterrica Beloqui, Carla Alvaro García i Farners Fontanils Jiménez, que van traduir al 100% les habilitats de Mycroft la tardor de 2020.