Ĉifromono rapidigas parolrekonon en Esperanto

Ĉiam pli ofte homoj parolas ne per siaj poŝtelefonoj, sed al la telefonoj. En Esperanto tio ankoraŭ ne eblas, ĉar mankas parolrekonaj programoj. Sed nun la evoluigo okazas multe pli rapide, ĉar donacita ĉifromono logas pliajn volontulojn, kiuj voĉlegas frazojn en Esperanto.

Jam en 2018 la usona entrepreno Lionbridge petis helpon de Universala Esperanto-Asocio por trovi helpantojn kiuj povas voĉlegi frazojn en Esperanto. Tiam oni supozis, ke la mendinto povas esti Google, kiu volas plibonigi sian voĉrekonan sistemon kaj eble aldoni Esperanton inter la uzeblaj lingvoj.

Ĝis nun nenio plia aŭdiĝis de tiu projekto, sed samtempe estis lanĉita alia kolektado de Esperantaj voĉoj, por la datumaro de la nekomerca komputa fondaĵo Mozilla kadre de la projekto Common Voice (Komuna Voĉo – KV).

La unua datumaro de KV kun pli ol unu gigabajto de registritaj voĉoj en Esperanto estis publikigita en januaro 2020, kun entute 41 horoj da registraĵoj, el kiuj 35 horoj jam estis kontrolitaj kaj aprobitaj de la kunlaborantoj de la projekto.

Tio tamen estas tro malmulte por ajnaj praktikaj uzoj, kaj la volontula kolektado progresis malrapide. Tamen ekde januaro 2021 la afero akceliĝis, kiam esperantistaj uzantoj de la ĉifromono Miriado decidis stimuli la projekton per transpagoj al voĉlegantoj.


Stefan Grotz.

Stefan Grotz, unu el la ĉefaj kontribuantoj de la Esperanta sekcio, ĝojas pro la aliĝo de ĉifromona grupo:

– La tuta projekto ege ŝanĝiĝis kiam la nova grupo komencis subteni la projekton per Miriado. Ni kolektis 100 horojn en la unuaj du jaroj, kaj en la tempo inter januaro kaj nun ni atingis 500 aldonajn horojn nur dank’ al la novaj subtenantoj.

Multaj el la novaj voĉlegantoj, logataj de ĉifromono, venas el Venezuelo kaj Burundo, kaj ne ĉiuj estas ege spertaj esperantistoj. Tio laŭ Stefan Grotz tamen ne estas grava problemo.

– Nu, la kvalito de la kontribuoj iomete malaltiĝis, sed ĉiu kontribuo estas kontrolita de minimume du aliaj personoj, do la rezulto verŝajne restas bona. Ankaŭ laŭ mia scio la teamo nun havas pli striktan sistemon por elekti voĉojn kiuj ricevas la ĉifrovaluton. Parenteze: Havi pli da afrikaj kaj sudamerikaj akĉentoj en la datumaro certe estas bona kaj grava afero.

Ja daŭre mankas virinaj voĉoj, sed tio momente ne bezonas esti problemo, laŭ Stefan Grotz:

– Ni unue volas krei sistemon kiu funkcias iel ajn, kaj poste oni povas analizi, kio en la sistemo ne bone funkcias. Sed pli da diverseco ĉiam bonas, kaj ni vere volas krei sistemon kiu bone funkcias por ĉiu uzanto. Tial ni vere ĝojus pri pli da inaj kontribuantoj, sed ankaŭ pri ĉiuj akĉentoj kaj ĉiuj aĝoj.

Esperanto nun estas unu el la grandaj lingvoj en Komuna Voĉo, kaj kun la novaj voĉoj eblos iom post iom grave plibonigi la funkciadon de Deepspeech, la parolrekona sistemo de Mozilla, por Esperanto.


La kresko de la registraĵoj en Esperanto okazis ĉefe dum la lastaj monatoj.

– Kontaktis min Tim, germana studento el Berlino. Ni kune kreis testan sistemon kun la 90 horoj de la datumaro de decembro 2020. Kun la 90 horoj da voĉoj, la sistemo havas eraroftecon de proksimume 50 elcentoj. Do ĉiu dua vorto estas ĝuste rekonita. Mi esperas, ke sistemo trejnita kun 600 horoj estos ege pli bona

La novan sistemon oni komence volas uzi por aŭtomate krei subtekstojn por videoj. La unua versio bazita sur 90 horoj da voĉoj estis jam elprovita kun la podkasto pri hejma aŭtomatigo. La proponataj tekstoj estas foje kompreneblaj, foje nur amuzaj:

Sed estas la epizodo pri certe la afero pri kiu mi neniam pensis ke mi jam interesigas kavalireca s ne estas matenmanga cifera koncesion kien ni dum jaroj eksciis pri la tempo per prevente bela edzebleco sia bazigas abe…

Efektive la parolisto diris:

Estas la epizodo pri… pri la afero pri kiu mi neniam pensis ke mi tiom interesiĝos kaj mi pensas ke estos iomete malfacile rakonti ĉion kion mi dum jaroj eksciis pri la temo kaj plej verŝajne de… la tuta epizodo estos iomete kaosa…

Do, restas spaco por plibonigo. Sed iom post iom komputiloj kun helpo de esperantistoj ja lernos kompreni parolatan Esperanton. Tamen tio ne nepre signifos, ke eblos paroli Esperanton al ajna poŝtelefono.

Apple ĝis nun ne aldonis eĉ Esperantan klavaron al siaj poŝtelefonoj, do apenaŭ kredeblas, ke Iphone baldaŭ ekkomprenus Esperanton. Google jam de jaroj multe pli favore sintenas al Esperanto, kun tradukilo kaj klavaro por Android, sed la operaciumo Android ne haveblas en Esperanto.

– Mi ne konas la planojn de grandaj firmaoj, sed Google almenaŭ jam subtenas Esperanton en aliaj kampoj, kaj mi pensas ke eble iam ili subtenos la lingvon. Tiam ili verŝajne ankaŭ uzos la datumaron de Common Voice kaj siajn proprajn datumarojn, diras Stefan Grotz.

Pli realisma celo laŭ li estas uzi liberan programaron:

–  Komuna Voĉo estas granda projekto, tial ni povas profiti de la laboro de alilingvaj programistoj. Ekzemple la libera videa redaktilo Kdenlive subtenas aŭtomatan kreadon de subtekstoj, kaj ni planas aldoni Esperanton. Anstataŭ ”Hej Guglo” aŭ “Aleksa” ni eble pli frue diros “Hej Mycroft”. Mycroft estas libera voĉa asistanto. La celo de la projekto ĉefe estas ebligi la kreadon de tiaj softvaroj. Tial ni certe ankaŭ bezonos la kreemon de aliaj programistoj se ni volas krei pli mojosajn aplikaĵojn ol nur ilon por krei subtekstojn.


Pli pri la temo: