Apertium | |
---|---|
| |
Lasta stabila versio | 3.8.3 |
Programlingvo | C++, Java |
Permesilo | Ĝenerala Publika Permesilo de GNU, versio 2.0 |
Retejo | www.apertium.org |
Apertium estas platformo de aŭtomata tradukado aŭ maŝintradukado, programar-libera kun permesilo GNU GPL. Apertium estis originale desegnita de la Universitato de Alakanto por traduki inter similaj lingvoj, kvankam poste estis vastigita por povi trakti pli malproksimajn lingvoparojn.
En septembro 2019 estas disponeblaj 49 tradukiloj por pli ol 20 lingvoj. Elstaras la forta reprezentiĝo de minoritataj lingvoj kiel la aragona, la asturia, la belorusa, la bretona, la eŭska, la galega, la kataluna, la kazaĥa, la kimra, la malta, la okcitana, la nord-samea, la sarda, la silezia, la tatara, la krime-tatara kaj la ukraina. Tradukiloj el kaj al Esperanto aperis inter la plej fruaj:
- kataluna → Esperanto (unua versio, decembro 2007)
- hispana → Esperanto (unua versio, decembro 2007)
- angla ↔ Esperanto (unua versio, februaro 2009)
- franca → Esperanto (unua versio, januaro 2011)
Pro sia programar-libera karaktero, la lingvaj datumoj, same kiel la programoj, estas libere alireblaj kaj uzeblaj ĉe .
Historio
La komenca desegno de Apertium baziĝis sur traduksistemo evoluigita de la grupo Transducens de la Universitato de Alakanto, kiu permesis la tradukon inter parencaj lingvoj kiel la kataluna kaj la hispana (interNOSTRUM) aŭ la portugala kaj la hispana (Universia). Fine de 2006 oni publikigis la version 2.0 de la traduk-motoro, kiu permesis pritrakti malpli interrilatantajn lingvoparojn, kiel la katalunan kaj la anglan, danke al pli potenca struktura transfero. La 1an de oktobro 2007, en rilato al la enkonduko de Esperanto en la sistemon, oni publikigis la version 3.0, permesantan la uzadon de Unikodo kaj per ĝi la traktadon de multaj pliaj lingvoj.
En decembro 2007 estis publikigitaj la unuaj tradukiloj al Esperanto. Temis pri du tradukiloj: el la kataluna kaj la hispana lingvoj. Ilin evoluigis la Universitata Instituto pri Aplikita Lingvistiko, ligita al la Universitato Pompeu Fabra, en Barcelono, kun kunlaboro de la Departemento pri Lingvoj kaj Komputadaj Sistemoj de la Universitato de Alakanto, kaj de Kataluna Esperanto-Asocio. La tradukilojn mendis la entrepreno ABC-Enciklopedioj, prizorganta i.a. la multlingvan portalon http://www.abc-pack.com. [1]
En februaro 2009 estis publikigita unua versio de la tradukilo el la angla al Esperanto, evoluigita de Jacob Nordfalk.[2]
Konsisto
La platformo provizas:
- lingvo-sendependan maŝintradukan motoron
- ilojn por administri la lingvajn donitaĵojn necesajn por konstrui maŝintradukan sistemon por ĉiu lingva paro
- lingvajn donitaĵojn por kreskanta nombro de lingvaj paroj.
Funkciado
Apertium uzas supraĵan transferan maŝintradukan motoron, t.e. ĝi ne faras sintaksan analizon de la tuta frazo antaŭ ol ektraduki. Krome ĝi procezas la enirtekstojn laŭstadie, kiel en ĉenstablo:
- aspektigado, t.e. traktado de la nelingvaj elementoj, kiuj rilatas al la prezentado de la teksto (grasaj aŭ kursivaj literoj, HTML-markiloj k.s.)
- morfologia analizo
- leksik-kategoria precizigo, per statistikaj analizoj surbaze de la morfologio de la ĉirkaŭaj vortoj
- malprofunda struktura transfero, t.e. uzado de reguloj ŝanĝantaj strukturajn aspektojn malsamajn inter la fonta kaj cela lingvoj
- vort-transfero
- morfologia generado
- reaspektigado, t.e. restarigo de la nelingvaj prezento-elementoj en la konvenaj lokoj (t.e. se graslitera adjektivo staris post nomo, ĝia cellingva ekvivalento, eble antaŭ la nomo, devas esti grasigita)
Ekzemple, kiam Apertium tradukas el la hispana 'canto' al Esperanto 'mi kantas' en la frazo 'canto una canción', ĝi:
- faras morfologian analizon kaj trovas, ke 'canto' povas esti la unua persono de singularo de la estanta tenso de la indikativa modo de la verbo 'cantar', aŭ la nomo 'canto'
- laŭ la kunteksto precizigas, ke temas pri verbo-formo
- sekvante strukturajn transferajn regulojn, aldonas personan pronomon de la unua persono de singularo antaŭ la verbo, ĉar ĝi ne estas uzata en la hispana, sed estas necesa en Esperanto
- transferas la leksikajn elmentojn, t.e. 'cantar' estas tradukita al 'kanti'
- fine, generas la morfologiajn formojn en Esperanto, t.e. la pronomo alprenas la formon 'mi' kaj la verbo kanti fariĝas kantas, laŭ la morfologiaj indikoj
Entute, ju pli lingvoj estas strukture similaj, des pli la struktura transfero donas trafajn rezultojn. Ĉar Apertium ne faras plenan sintaksan analizon de la frazoj (kio estas tre komplika, tre ofte plur-ebla kaj ofte malsukcesa dum analizado de la reala lingvo), la struktura transfero povas esti nur malprofunda, t.e. ĝi povas baziĝi nur sur la analizo de la ĉirkaŭaj vortoj anstataŭ de tuta frazo. Tio, ekzemple, malfaciligas, ke en katalunlingva ĉu-demando, en kiu oni ofte ekscias, ke ili estas demandaj, nur per la fina demandosigno, Apertium sukcesu generi la vorton 'ĉu' komence de la frazo dum la traduko al Esperanto.
Uzado
Eblas uzi Apertium por konstruadi maŝintradukajn sistemojn por diversaj lingvo-paroj. Tiucele, Apertium uzas simplajn XML-bazitajn normajn formatojn por kodi la bezonatajn lingvajn donitaĵojn (aŭ mane aŭ per transformado de ekzistantaj donitaĵoj), kiuj estas kompilitaj per la provizitaj iloj en la rapidajn formatojn uzatajn de la motoro.
Referencoj
Eksteraj ligiloj
Oni povas provi la sistemon en http://xixona.dlsi.ua.es/apertium/ Arkivigite je 2008-04-08 per la retarkivo Wayback Machine (stabilaj versioj)
kaj http://xixona.dlsi.ua.es/apertium-unstable Arkivigite je 2008-09-13 per la retarkivo Wayback Machine (malstabilaj versioj).