Olatz Arregi

Olatz Arregi Uriarte (Bergara, 1963ko apirilaren 3a) Euskal Herriko Unibertsitateko irakaslea, informatikaria eta HiTZ zentroko ikertzailea da. Donostiako Informatika Fakultatean lan egiten du 1986tik Konputagailuen Arkitektura eta Teknologia sailean, non 2019an sail horretako zuzendaria izatera ailegatu zen.[1] 1986an informatikako lizentziatura bukatu zuen eta bost urte geroago aurkeztu zuen doktorego tesia, 1991n EHUko Doktorego-Sari Berezia jasoko zuena.[2][3] 2008tik EKAIA aldizkariko erredakzio batzordean dago (Euskal Herriko Unibertsitateko zientzi eta teknologi aldizkaria).

Olatz Arregi

Bizitza
JaiotzaBergara, 1963ko apirilaren 3a (60 urte)
Herrialdea Gipuzkoa, Euskal Herria
Hezkuntza
HeziketaEuskal Herriko Unibertsitatea
Donostiako Informatika Fakultatea
Tesi zuzendariaClemente Rodríguez Lafuente
Doktorego ikaslea(k)Ander Soraluze
Haritz Salaberri (en) Itzuli
Ana Zelaia Jauregi
Hizkuntzakeuskara
gaztelania
Jarduerak
Jarduerakinformatikaria eta unibertsitateko irakaslea
Enplegatzailea(k)Euskal Herriko Unibertsitatea
Lan nabarmenak
KidetzaIxa taldea
Udako Euskal Unibertsitatea

Inguma: olatz-arregi-uriarte
Artikulu hau informatikariari buruzkoa da; beste esanahietarako, ikus «Olatz Arregui».

Ikertzailea konputazio paraleloan eta hizkuntzaren prozesamenduan

Konputagailuen arkitektura

"Sistema digitalen diseinu-hastapenak" liburua (UEU, 2005)
MIkroprogramazioaren oinarriak (Olatz Arregi, UEU-1987)

Clemente Rodriguez irakaslearen zuzendaritzapean egin zuen tesiarengatik, Doktorego-Sari Berezia jasoko zuen Euskal Herriko Unibertsitatean.[3] Hardware eta software teknologiak ahalik eta hobekien erabiltzeko, ordenagailuan exekutatuko diren programen portaera sakonki aztertu zuten. Horretarako, beharrezkoa da neurri bat izatea, goi-mailako lengoaietako programen exekuzioaren eraginkortasunari buruzko hainbat estatistika lortzeko. Tesiak estatistika mota desberdinak zehazteko lengoaia bat eta iturburu-kodearen errendimendua neurtzeko sistema bat aurkeztu zituen, haiekin programek erabiltzen dituzten baliabideak aztertzeko eta, hartara, irtenbide eraginkorrak bilatzeko. Sistema horrekin, zehazki, azpirrutinek (prozedurek zein funtzioek) egiten duten erregistro-bankuaren erabilera erreala neurtu da. Azpirrutinen tratamenduan sortzen diren etenek eragin zuzena dute programen exekuzioa-denboran, eta baliabide horren kudeaketa egokiak konputagailuen errendimendua hobetu dezake.[1]

Hizkuntzaren prozesamendua

2002. urtean, Ixa ikerketa taldean hasi zen lanean, eta ikerketa jarduera handiena bertan egin du geroago.[4] Urte hauetan, hizkuntzaren prozesamenduaren alorreko 40 ikerketa proiektu baino gehiagotan hartu du parte eta 35 artikulu baino gehiago publikatu ditu aldizkari eta arloko kongresuetan. Ikerketa-lan horrek gizartean eta, batez ere, euskal komunitatean eta euskal kulturan izan duen eragina nabarmena izan da. Hori dena aitortu zen, besteak beste, Ixa Taldeak 2013an jaso zuen Abbadia Sarian.[5][6]

2018an HiTZ ikerketa-zentroa sortu zenean, Ixa eta Aholab taldeen indarrak batuz, bera izan zen zentroa sortzeko eragile nagusietako bat. Hizkuntza-teknologia ardatz duen zentro berri horretan 63 ikertzailek egiten zuten lan 2020an.

Lan aparta egin du adituak eta doktoreak formatzen hizkuntzaren prozesamenduaren arloan. Zuzendu dituen 3 tesietatik harantzago, 2012tik 2020ra arte hizkuntza-teknologien alorreko Hizkuntzaren Azterketa eta Prozesamendua (Language Analysis and Processing) masterreko koordinatzailea izan baitzen, Arantza Diaz de Ilarrazarekin lankidetzan. Guztira 55 tesi irakurri dira euskaraz lerro honetan, 1988tik hona. Master-titulu hori euskaraz eman izan da hasieratik, eta ingelesez 2014tik aurrera, Erasmus Mundus mailako master gisa. Guztira ia 200 lagun dira master horietatik sortu diren adituak.

2020an, ikerketa-lerro hauek jorratzen zituen: ikasketa automatikoa (machine learning) eta ikasketa sakona (deep learning); korreferentziaren ebazpena eta rol semantikoen eta denborazko gertaeren etiketatzea, besteak beste. Hiru doktore-tesi zuzendu ditu berak gai horien inguruan.

1998tik hainbat I+G ekintzen antolaketan hartu du parte, Horien artean zeuden Paralelismo jardunaldiak eta Informatikari Euskaldunen Bilkurak.

Kitxua hizkuntzaren prozesamendua automatikoa

UNSAAC-Hinantin ikerketa taldeko Rosemary Jimenez eta José Lozano, Ixa Taldea bisitatzen Donostian[7]

2012an Cusko hiriko UNSAAC unibertsitateko Hinantin ikerketa-taldea antolaketan parte hartu zuen Juan Cruz Tello 'Soccoo' irakaslearekin. Kitxuaren prozesamendu automatikoren lehen oinarri batzuk sortuko zituena. Lehen urrats horietan, 2011tik 2014ra bitarte adituak prestatu zituen lankidetzan Ixa taldearekin, 2012an Madrileko Kooperaziorako Ministerioko proiektu bat izan zuten, 2013an EHUrekin RUNASIMI proiektua.[8][9] Aditu horietako batzuk ziren hauek:[10]

  • Hugo Quispe: kitxuaren datu-base lexikalaren lehen bertsioa eta corpusa kontsultatzeko  web-aplikazio bat sortu zuen.[11][12]
  • Richard Alexander Castro Mamani: zuzentzailea sortu eta hizketaren tratamendua landu zuen. Geroago Itzulpen automatikoan eta normalizazioan ere ikertu du.[13][14][15][16]
  • Rosemary Jimenez: kitxuaz idatzitako testuak dialektoaren arabera automatikoki sailkatzeko programa sortu zuen.[17][10] Eta bera izan zen corpusa eratu eta kontsultatzeko aplikazioa sortu zuena.
  • José Lozano: Kitxua irakasteko sistema bat sortzen aritu zen Waldir Farfan-ekin.

Irakaslea

Irakasle agregatua da UPV/EHUn. Karrera zientifiko eta teknologikoetan gizonen eta emakumeen arteko parekotasuna benetakoa izan dadin, nesken interesa txikitatik pizteko beharra aldarrikatzen du, baita emakume erreferenteak ezagutzera ematekoa ere. Bestalde, ikerketa-taldean, eta bere argitalpen z

ientifikoetan agertzen diren egilekideak aztertuta, emakume eta gizonen arteko proportzioa oso gertu dago parekidetasunetik, ingeniaritzetan ohikoa ez bada ere.

Euskara unibertsitatean sartzeko prozesuaren barruan hainbat irakasgai irakatsi ditu euskaraz, besteak beste, Informatika Fakultateko lau hauek: Konputagailuen arkitektura II,  Konputagailuen arkitektura eta antolaketa II, Metodo induktiboak, eta Metodo induktiboak hizkuntzaren tratamendu automatikoan. Gainera aipagarria da Sistema digitalen diseinu-hastapenak. Oinarrizko kontzeptuak eta adibideak liburua idatzi zuela beste bost irakaslerekin batera (Olatz Arbelaitz, Agustin Arruabarrena, Izaskun Etxeberria Uztarroz, Amaia Ibarra, eta Txelo Ruiz).[18]

Xuxen 2020

Transferentzia: produktu erregistratuak

Ixa Taldeak hizkuntza prozesatzeko 27 produktu erregistratu ditu 27 urtetan,[19][20][21] eta produktu horietako 9 hauen garapenean parte-hartze zuzena izan du Olatz Arregik:

  • 1994: XUXEN, euskararako zuzentzaile ortografiko eta analizatzaile morfologikoa.
  • 1997: EDBL: Euskararen datu-base lexikala. Hiztegi informatiko baten moduko zerbait da, baina hitzez gain, atzizkiak-eta ere hartzen ditu bere barruan. Maiz txarto idazten diren hitzak (Hitz ez estandarrak, esaterako: *eritzi, *iharduera) eta hitz anitzeko unitate lexikalak ere (adarra jo edo Amerikako Estatu Batuak bezalakoak, esaterako) jasotzen ditu. Esanahia barik, item bakoitzaren propietate lexikal eta morfologikoak zehazten ditu sarrera bakoitzak. Informazio hori Xuxen zuzentzaile ortografikoaren eta hizkuntzaren prozesamendurako beste tresna eta aplikazio askoren oinarri lexikala da.
  • 2003: Basque WordNet / Euskal WordNet. Euskarazko lehen ezagutza-base lexikal edo hiztegi semantiko eleaniztuna da, ingelesezko WordNet eta hizkuntza anitzeko EuroWordNet-en eredua jarraitzen duena. Era honetan, euskal hitzak ingelesezko WordNet-ekoekin lotzen ditu era erdi-automatikoan. Euskal WordNet gaztelaniari, ingelesari, galizierari, portugesari eta katalanari lotuta dago, Multilingual Central Repository errepositorioan (MCR). Beste hizkuntza batzuei lotuta egoteaz gain, Euskal WordNet SUMO eta Top Ontology ontologietara mapeatuta dago. Erabiltzaile arruntei dagokienez, beste hiztegi arruntek eskaintzen dituzten itzulpen elebidunez gain, informazio gehigarria ematen du. Adibidez, pagoa hitza bilatuz gero, zuhaitz mota bat dela eta zehazki zer motatakoa den adierazten du. Sinatzaileak: Itziar Aduriz, Eneko Agirre, Iñaki Alegria, Olatz Ansa, Maxux Aranzabe, Xabier Arregi, Olatz Arregi, Bertol Arrieta, Jose Mari Arriola, Xabier Artola Zubillaga, Aitziber Atutxa, Arantza Díaz de Ilarraza, Nerea Ezeiza, Koldo Gojenola, Mikel Lersundi, Montserrat Maritxalar, David Martinez, Aingeru Mayor, Maite Oronoz, Eli Pociello, Kepa Sarasola, Aitor Soroa, Larraitz Uria eta Ruben Urizar.[22]
  • 2008: IXAti, chunker-a. Euskarako azaleko analizatzaile sintaktikoa. Sinatzaileak: Izaskun Aldezabal, Iñaki Alegria, Maxux Aranzabe, Olatz Arregi, Jose Mari Arriola, Xabier Artola Zubillaga, Kepa Bengoetxea, Klara Ceberio, Arantza Díaz de Ilarraza, Nerea Ezeiza, Koldo Gojenola, Mikel Lersundi, Maite Oronoz eta Ruben Urizar.[22]

Liburuak

Sariak eta errekonozimenduak

Hainbat sari lortu ditu Diaz de Ilarrazak koordinatzen duen Ixa Taldeak; besteak beste hauek:[25]

  • 1991: Doktorego-Sari Berezia jaso zuen EHUn.[3]

Erreferentziak

  1. Romatet Ibarguren, June. (2023-01-27). «"Ez dugu nahi makinek gizarteko bazterkeria egoerak zabaltzerik"» Gipuzkoako Hitza (Noiz kontsultatua: 2023-02-01).
  2. Arregi Uriarte, Olatz. «Irakasleak - doktoregoak - UPV/EHU» doktoregoak (Noiz kontsultatua: 2021-05-29).
  3. (Gaztelaniaz) Arregi Uriarte, Olatz. (1991). «UN LENGUAJE DE ESPECIFICACION DE ESTADISTICAS PARA LA EVALUACION DE PROGRAMAS. SU APLICACION AL DISEÑO DEL BANCO DE REGISTROS.» www.educacion.gob.es (UPV/EHU) (Noiz kontsultatua: 2021-05-29).
  4. «Olatz Arregi | Ixa taldea» ixa.si.ehu.es (Noiz kontsultatua: 2021-05-29).
  5. Press, Europa. (2013-12-02). «EHUko IXA Taldeak Anton Abbadia saria jasoko du gaur, euskararen normalizazioan egindako lanarengatik» www.europapress.es (Noiz kontsultatua: 2021-01-24).
  6. «Antton Abbadia saria jaso du gaur iluntzean EHUko Ixa Taldeak (35'50) EiTB Televisión a la carta» www.eitb.tv (EITB) (Noiz kontsultatua: 2021-01-24).
  7. Kitxua lantzeko, Cusco-ko bisitariak berriro gurean – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-04-11).
  8. «RUNASIMI. Recursos básicos para el procesamiento automático de la lengua quechua: base de datos léxica y corpus textual. | Ixa taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-04-11).
  9. (Gaztelaniaz) «CONVENIO DE COLABORACIÓN ENTRE LA UNIVERSIDAD DEL PAÍS VASCO/EUSKAL HERRIKO UNIBERTSITATEA – UPV/EHU Y LA UNSAAC» Dirección de Cooperación Técnica Internacional 2020-08-20 (Noiz kontsultatua: 2021-04-11).
  10. Juan Cruz ‘Soccoo’ hil zaigu, Peruko lankide kitxua – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-04-11).
  11. (Ingelesez) Ixa Group. «Quechua Lexical Database (QLDB). General Consultation» ixa2.si.ehu.eus (National University of San Antonio Abad of Cusco (UNSAAC) University of the Basque Country (UPV / EHU).) (Noiz kontsultatua: 2021-04-11).
  12. Quispe, Hugo. (2013). «Kitxuaren datu-base lexikala» ixa2.si.ehu.eus (Ixa taldea, Hinantin-UNSAAC) (Noiz kontsultatua: 2021-04-11).
  13. (Ingelesez) Ortega, John E.; Castro Mamani, Richard; Cho, Kyunghyun. (2020-12-XX). «Neural machine translation with a polysynthetic low resource language» Machine Translation 34 (4): 325–346.  doi:10.1007/s10590-020-09255-9. ISSN 0922-6567. (Noiz kontsultatua: 2021-04-11).
  14. Castro Mamani, Richard; Rios, Annette. (2014). Allin Qillqay! A Free Online Web Spell Checking Service for Quechua.  doi:10.5167/UZH-101905. (Noiz kontsultatua: 2021-04-11).
  15. Rios, Annette; Castro Mamani, Richard. (2014). Morphological Disambiguation and Text Normalization for Southern Quechua Varieties.  doi:10.5167/UZH-97707. (Noiz kontsultatua: 2021-04-11).
  16. (Ingelesez) Ortega, Richard ALEXANDER; Montoya, Jaime. (2020). Overcoming Resistance: The Normalization of an Amazonian Tribal Language. The 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing.
  17. (Gaztelaniaz) Jiménez Medina, Rosemary. (2013). CLASIFICACIÓN POR DIALECTO DE DOCUMENTOS ESCRITOS EN QUECHUA.. UPV-EHU, UNSAAC. Máster en "Ingeniería computacional y sistemas inteligentes".
  18. Arbelaitz Gallego, Olatz; Uriarte, Olatz Arregi; Frutos, Agustin Arruabarrena; Uztarroz, Izaskun Etxeberria; Lasa, Amaia Ibarra; Vazquez, Txelo Ruiz. (2005). Sistema digitalen diseinu-hastapenak. Oinarrizko kontzeptuak eta adibideak. UEU arg ISBN 978-84-8438-069-6. (Noiz kontsultatua: 2021-05-29).
  19. «Patenteak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  20. «Produktuak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-24).
  21. «patenteak | HiTZ Zentroa» www.hitz.eus (Noiz kontsultatua: 2021-01-24).
  22. «Patenteak | Ixa taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-05-29).
  23. Arbelaitz Gallego, Olatz; Ruiz Vazquez, Txelo; Arregi Uriarte, Olatz; Arruabarrena Frutos, Agustin; Etxeberria Uztarroz, Izaskun; Ibarra Lasa, Amaia. (2005). Sistema digitalen diseinu-hastapenak: Oinarrizko kontzeptuak eta adibideak. UEU ISBN 978-84-8438-069-6. (Noiz kontsultatua: 2023-09-19).
  24. Alegria Loinaz, Iñaki; Iparragirre, Xabier Arregi; Uriarte, Olatz Arregi; Frutos, Agustin Arruabarrena; Zubillaga, Xabier Artola; Villar, Lore Azkarate; Murua, Pili Lizaso; Beristain, Miel Loinaz et al.. (1993). Informatika hiztegia. (Noiz kontsultatua: 2018-02-27).
  25. «Sariak | Ixa Taldea» ixa.si.ehu.eus (Noiz kontsultatua: 2021-01-29).
  26. Ixa Taldea. (2013). Gipuzkoako Foru Aldundiak emandako Anton Abadia Saria, Euskararen normalkuntza lanetan izandako eraginagatik.. .
  27. Ixa Taldea, Abbadia Saria – Hizkuntza-teknologiak, Ixa Taldearen bloga. (Noiz kontsultatua: 2021-01-31).
  28. Ibilaldia 2012 omenaldia: Euskara teknologia berrietan sartzeko aintzindariak – Hizkuntza-teknologiak. (Noiz kontsultatua: 2020-02-11).

Ikus, gainera

Kanpo estekak

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.