Un pic superat aquest primer objectiu, l'entitat treballa ara perarribar a llarg termini a les 10.000 hores enregistrades i validades en català, i per aconseguir més diversitat dialectal, de gènere i d'edat. Aquest repositori de veus ha de permetre que les empreses puguin incorporar el català com a llengua de reconeixement i reproducció de veus en aparells d'ús quotidià amb intel·ligència artificial.
En concret, des de dijous al vespre, els talls de veu en català ja han superat les 3.298 hores enregistrades i les 2.438 hores validades. Aquestes xifres, però, continuen lluny del nombre d'hores que es considera necessari per tenir un corpus oral complet i fiable d'una llengua, aproximadament unes 10.000. Per això, a partir d'ara l'entitat continuarà treballant per a fer créixer els enregistraments en català, així com les validacions de talls de veu, i també per fer augmentar, especialment, el nombre de gravacions de certs col·lectius i evitar, d'aquesta manera, que hi hagi biaixos i les màquines entenguin tots els parlants. En concret, es necessiten més enregistraments de veu dels grups de població més infrarepresentats: els infants i menors de 25 anys, les noies i les dones, i els parlants dels dialectes balears, septentrionals, occidentals, valencians i algueresos.
Fins ara, la Plataforma per la Llengua ha combinat actes presencials amb la comunicació a les xarxes socials per a fer conèixer el projecte i animar la població a donar la seva veu pel català. Després de presentar públicament la campanya en dos partits de bàsquet alPalau Blaugrana, davant de més de 14.000 persones, l'entitat ha difós vídeos en què diferents personalitats rellevants fan una crida a enregistrar-se llegint les frases proposades per Common Voice i a penjar-les al repositori a través del web latevaveu.cat. Els protagonistes d'aquests vídeos són els jugadors de bàsquet del Futbol Club Barcelona Oriol Paulí, Sergi Martínez i Ainhoa López.
A més, per a arribar als parlants dels dialectes més infrarepresentats, l'entitat també ha comptat amb els influenciadors Albert Pagà (@berti_iau), Jordi Calafell (@cala.mitat) i el duet d'Anam Fent (@anamfent.podcast), parlants d'alguns d'aquests dialectes, que han fet vídeos de sensibilització específics. En aquests vídeos, els creadors animen el públic a donar la veu al repositori a través del web del projecte Aina, que és la iniciativa de la Generalitat de Catalunya i el Barcelona Supercomputing Center per impulsar la llengua a Common Voice, amb el suport del Govern de les Illes Balears.
En la línia de fer créixer la presència de veus de les Balears, l'entitat també va fer un acte el 31 de maig a l'Espai Mallorca de Barcelona per a aconseguir donants de veu entre la població mallorquina de la capital catalana. En aquella ocasió, a més d'aconseguir noves veus, l'entitat va fer conèixer el projecte a persones molt involucrades en les activitats d'aquesta comunitat, fet que permetrà, per la capacitat prescriptiva d'aquestes persones, que el projecte creixi entre els seus cercles. Per a explicar bé la importància d'enregistrar-se perquè les màquines puguin entendre i expressar-se en català, l'acte va comptar amb la intervenció de Joan Montané, membre de Softcatalà, entitat impulsora de Common Voice als territoris de parla catalana. Per a aconseguir més diversitat dialectal i arribar a llarg termini a les 10.000 hores, l'entitat continuarà combinant accions comunicatives a les xarxes socials amb actes presencials amb diferents col·lectius de parlants de grups infrarepresentats.
Common Voice, una base de veus en llicència de domini públic
Common Voice és un projecte que vol forjar un repositori de talls de veu de totes les llengües del món a partir de la col·laboració voluntària de persones que facin la seva aportació de veu o validin l'enregistrament d'altres persones. Aquesta base de dades lliure està segmentada per gènere, edat i variant dialectal, i permet descarregar les veus a qui vulgui desenvolupar i millorar programaris de reconeixement de parla, com ara robots domèstics o assistents de veu. La descàrrega d'aquestes veus es pot fer de manera gratuïta i en llicència d'oferiment al domini públic sense drets d'explotació. Creat el 2017 per Mozilla Foundation i impulsat als territoris de parla catalana per Softcatalà, el repositori ja compta amb talls de veu de 136 llengües. El 2020, amb l'impuls del projecte Aina, la presència del català creix de manera significativa a la plataforma.
9 comentaris
Per a comentar és necessari estar registrat a Diari de Balears.
Els que tenen la llengua forastera com a parla única, estàn rabiosos, i és que qualsevol bona notícia del català, els fa urticària... Que mirin els seus polítics, que tot i sent monolingües, la parlant com el cul...a tall d'exemple Feijóo, Rajoy...la feina és entendre el que diuen...
@betzol,Trob que t'has posat es nom molt encertat, I veig que te segueixes alimentant de buines, que te donguin molt bon profit. Visca el català la nostra llengua, cualsevol notícia vos destrempa, anau pitjor que els puputs però amb una ferum molt pitjor. És que no ho podeu soportar i ses caguerrinas van a lloure. I pensau que això anirá cresquent. Salut i República Països Catalans.
@betzol, trob que t'has posat el nom molt encertat, i ses buinas es veu que te alimentant, bon profit. Visca el català, com vos molesta qualsevol notícia, vos destrempa anau com es puputs però en més olor encara.
fatxa prepotent !!!!!!!!!!!!!!!!!!!!!!!!!!!
De ilusiones se vive...
No hi ha dret a haver d'aguantar aquesta gentussa tan maleducada a dins de les nostres publicacions. I ara que els seus s'han ficat a dins de les institucions, per dur- se'n molts de doblers públics i fer desastres, encara estan més insuportables. Però governant el seus o sense governar, no hi ha capotiu per haver d'aguantar tanta grolleria, tanta mala educació ni tanta violència. La gent barroera no és ben rebuda.
Las moscas están en las buinas, escardabuinas. La cabra siempre tira al monte.
Tens mosques blau, pareix que te piquen. Si te posas un prebe de cirerete al forat que no i toca el sol, els espenteras i quedaràs relaxat. De res, a Deu sien dades.
Santo Dios, que noticionnnnn!!!!!! El catalan ya es la primera lengua en Common Voice.....!!!! De aquí a una estona, sera la lengua mas hablada del mundo