IxaKat

IxaKat programa informatikoa testuak automatikoki lantzeko hainbat tresna informatikoz osatutako multzo bat da, euskarazko testuak analizatzeko erabil daitekeena.

IxaKat
Jatorria
Sorrera-urtea2014
Ezaugarriak
Hizkuntzaeuskara
Programazio-lengoaiaC++
Egile-eskubideakcopyrightduna
LizentziaGPLv3
Euskaraz
EuskarazBai
ixa2.si.ehu.es…

Ixa Taldeak sortu zuen 2014an eta software librea da.

IxaKaten osagaiak

IxaKat multzoko tresna nagusiek sekuentzian lan egiten dute. lehenengoak kategoria morfologikoak etiketatzen ditu, horiek erabilita bigarrenak dependentzia sintaktikoak etiketatzen ditu, horiek erabilita hirugarrenak rol semantikoak etiketatzen ditu eta gero azkenak korreferentziak.

Analizatzaile morfosintaktikoa eta kategoria-etiketatzailea

ixa-pipe-pos-eu: estaldura zabaleko analizatzaile morfosintaktiko eta etiketatzaile sendoa da, Eustagger euskararako lematizatzaile/etiketatzailea egokituz sortu izan zena. C++ programazio-lengoaian inplementatuta dago. Prozesamendu linguistikoko katearen lehenengo modulua da. Testu gordina hartzen du sarrera moduan, eta irteeran token bakoitzarentzat lema, kategoria eta informazio morfologikoa idazten ditu NAF formatuan dagoen dokumentu berri batean.[1]

  • Lehenik analisi morfologikoa egiten da. Horretarako, segmentatzaileak hitz bakoitza lemetan eta morfemetan banatzen du eta osagai horien informazio morfologikoa ematen du EDBLko (Euskararen Datu Base Lexikala)[2] informazioa erabilita.
  • Analizatzaile morfosintaktikoak aurreko fasean sortutako morfemetatik abiatuz hitz-formaren interpretazio posible bakoitzarentzako ezaugarri-egitura bat eskaintzen du. Hitzaren egitura deskribatzeko, testuingururik gabeko gramatika baliatzen da[3].
  • Hitz Anitzeko Unitate Lexikalak (HAUL)[4] ere tratatzen dira morfosintaxiaren analisian. Hitz elkartuen, lokuzioen eta kolokazio murriztuen tratamendua egiten da eta, horretarako ere, EDBLko informazioa erabiltzen da. HAULak identifikatzeko HABIL tresna[5] baliatzen da eta entitateen izenak mugatzeko eta sailkatzeko, EIHERA.[6]

Dependentzia sintaktikoen etiketatzailea

ixa-pipe-dep-eu: euskarazko testuetan dependentzia sintaktikoak etiketatzen ditu.[7]

Rol semantikoen etiketatzailea

ixa-pipe-srl-eu: euskarazko testuetan rol semantikoak etiketatzen ditu.[8]

Korreferentzien etiketatzailea

ixa-pipe-coref-eu: euskarazko testuetan testuko korreferentziak ebazten ditu.[9]

IxaKat eta Ixa-pipes kateak

IXAKat katearekin lortzen den prozesamendu linguistikoa euskararako Ixa-pipes tresnekin ere osatu daiteke. Izan ere, biak IxaKat eta euskarazko Ix- pipes hizkuntzaren prozesamendurako hainbat tresna linguistikoekin osatutako kateak dira, eta badituzte euskararen prozesamendurako balio duten hainbat tresna. IxaKat eta IXA-pipes kateak modularrak direnez, eta biek NAF formatua erabiltzen dutenez sarrera/irteera formatu moduan, bi multzotako tresnak konbinatu daitezke prozesamendu-kate berean. IxaKat programarekin euskarazko testuak bakarrik landu daitezke, aldiz Ixa-pipes programarekin hainbat hizkuntza landu daitezke (euskara, herbeherera, ingelesa, frantzesa, galiziera, alemana, italiera). Euskarazko testuak prozesatzerakoan zehaztasun handixeago lortzen du IxaKatek.

Erreferentziak

  1. «ixaKat - Tresnak (morfologia eta lematiazioa)» ixa2.si.ehu.es (Noiz kontsultatua: 2018-03-07).
  2. EDBL: a General Lexical Basis for the Automatic Processing of Basque. (Noiz kontsultatua: 2019-01-07).
  3. Euskararen sintaxi konputazionalerantz. Oinarrizko baliabideak eta beren aplikazioa aditzen azpikategorizazio-informazioaren erauzketan eta erroreen tratamenduan. (Noiz kontsultatua: 2018-03-07).
  4. «Euskal lokuzioen tratamendu konputazionala» ixa2.si.ehu.es (Noiz kontsultatua: 2018-03-07).
  5. «Euskarazko hitz anitzeko unitate lexikalen tratamendu konputazionala» ixa2.si.ehu.es (Noiz kontsultatua: 2018-03-07).
  6. Robustness and customisation in an analyser/lemmatiser for Basque. (Noiz kontsultatua: 2018-03-07).
  7. «ixaKat - Tresnak (dependentzia sintaktikoak)» ixa2.si.ehu.es (Noiz kontsultatua: 2018-03-07).
  8. «ixaKat - Tresnak (rol semantikoak)» ixa2.si.ehu.es (Noiz kontsultatua: 2018-03-07).
  9. «ixaKat - Tresnak (Korrefeentzia)» ixa2.si.ehu.es (Noiz kontsultatua: 2018-03-07).

Ikus gainera

Kanpo estekak

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.