IXA pipes
IXA pipes testuak automatikoki lantzeko hainbat tresna informatikoz osatutako multzo bat da, hizkuntzaren prozesamenduan hainbat hizkuntzatarako erabil daitekeena.[1][2]
IXA pipes | |
---|---|
Jatorria | |
Sorrera-urtea | 2014 |
Ezaugarriak | |
Hizkuntza | gaztelania, euskara, nederlandera, frantsesa, galiziera, alemana eta italiera |
Programazio-lengoaia | Java |
Egile-eskubideak | copyrightduna |
Lizentzia | Apache Lizentzia 2.0. |
Euskaraz | |
Euskaraz | Bai |
http://ixa2.si.ehu.es/ixa-pipes/ |
Ixa Taldeko kide den Rodrigo Agerrik sortu zuen 2014an eta software librea da (Apache lizentzia 2.0). Euskararako Ixa pipes katearekin lortzen den prozesamendu linguistikoa bestela ere egin daiteke IxaKat tresnekin ere. Izan ere, Ixa pipes hizkuntzaren prozesamendurako hainbat tresna eleaniztunen sorta bat da, eta baditu hainbat tresna euskararen prozesamendurako. IxaKat eta IXA pipes kateak modularrak direnez, eta biek NAF formatua erabiltzen dutenez sarrera/irteera formatu moduan, bi multzotako tresnak konbinatu daitezke prozesamendu-kate berean.
Ixa-pipes multzoko tresna nagusiak hauek dira:
- ixa-pipe-tok: Tokenizatzailea eta segmentatzailea hainbat hizkuntzatarako. Testu bateko hitzak, puntuazio-markak, zenbakiak eta antzeko osagaiak banatzen dituena
- ixa-pipe-pos: Testu bateko hitz bakoitzaren lema eta kategoria lortzea (adjektibo, izen, aditz...). Ingelesez lemmatizer eta POS tagging esaten zaie tresna horiei. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, frantzesa, galiziera, alemana, italiera eta espainiera.
- ixa-pipe-nerc: Entitate izendunak errekonozitzen ditu eta testuan etiketatzen dtu. Ingelesez Named Entity Recognition tagger esaten zaie tresna horri. Erabil daiteke hizkuntza hauekin: euskara, herbeherera, ingelesa, alemana, italiera eta espainiera.
- Iritzi-helburuen erauzketa. Ingeleserako bakarrik.
- ixa-pipe-chunk: Zati sintaktiko bakoitza bereiztea. Erabil daiteke hizkuntza hauekin: euskara eta ingelesa. Estatistikoki detektatzen ditu sintagma mailako osagai sintaktiko sinpleak).
- ixa-pipe-parse: Probabilistic constituent parser for Spanish and English.
Erreferentziak
- (Ingelesez) Agerri, Rodrigo. «IXA pipes: Efficient and Ready to Use Multilingual NLP tools.» (PDF) Language Resources and Evaluation Conference (LREC2014), (Noiz kontsultatua: 2018-03-06).
- (Ingelesez) IXA pipes: ready to use NLP tools. (Noiz kontsultatua: 2018-03-06).
Kanpo estekak
- Ixa-pipes Github-en