Vigoko Unibertsitateko Corpus Linguistikoa

Vigoko Unibertsitateko Corpus Linguistikoa (CLUVI, Corpus Lingüístico da Universidade de Vigo) hainbat testu-itzulpen bildu duen corpus linguistiko paraleloa da. Vigoko Unibertsitateko Hizkuntzalaritza Informatikoaren Mintegiak sortu zuen.[1]

Vigoko Unibertsitateko Corpus Linguistikoa
Jatorria
Ezaugarriak
Ekoizpena
GaratzaileaVigoko Informatikako Hizkuntzalaritza Mintegia
sli.uvigo.es…

Ezaugarriak

CLUVI corpusa testu-bilduma irekia da, Vigoko Unibertsitateko SLI taldeak egina. 2018an 49 milioi hitz zituen, horietatik galizierazko testuak ia 12 milioi hitz ziren eta LEGA Corpusa 6 milioi hitz inguru.

CLUVIko baliabideak Galizierazko Hizkuntza-Baliabide Integratuak errepositorioan integratuta daude (RILG, Recursos Integrados da Lingua Galega).

Itzulpen motak

Bibliaren itzulpena, itzulpen juridikoa, testu informatiboen itzulpena, literatur itzulpena, azpitituluen itzulpena, softwarearen lokalizazioa, itzulpen sozioekonomikoa, itzulpen turistikoa.

Hizkuntza-konbinazioak

Galiziera - Eleanitza, Ingelesa - Galiziera, Frantsesa - Galiziera, Galiziera - Gaztelania, Galiziera - Galiziera, Portugesa - Galiziera, Portugesa - Ingelesa - Gaztelania, Portugesa - Gaztelania, Euskara - Gaztelania.

Itzulpen-hizkuntzak

Galiziera, Gaztelania, Ingelesa, Portugesa, Euskara, Katalana, Frantsesa, Bibliaren itzulpena The UNESCO Courier Literatur itzulpena: FR-GL, Txinera, Alemana, Latina, Italiera.

Corpus itzulpen-partaleloak

  • Corpus CLUVI (latin-galiziera-portugalesa-katalana-frantsesa-italiera-espainiera-txinera, Bibliako testuak)
  • Corpus CLUVI (galiziera-gaztelania, testu juridikoak)
  • Corpus CLUVI (ingeles-galiziera-frantses, Unescoren Posta-testuak)
  • Corpus CLUVI (ingeles-galiziera, programa informatikoak)
  • Corpus CLUVI (ingeles-galiziera, literatura-testuak)
  • Corpus CLUVI (frantses-galiziera, literatura-testuak)
  • Corpus CLUVI (galiziera, literatura-testuak)
  • Corpus CLUVI (galiziera-gaztelania, literatura-testuak)
  • Corpus CLUa (gaztelania-galiziera-euskara, Consumer aldizkariaren testuak)
  • Corpus CLUVI (espainiera-galiziera, turismoko testuak)
  • Corpus CLUVI (galiziera-txinera, filmen azpitituluak)
  • Corpus CLUVI (ingelesa-galiziera, filmes azpitituluak)
  • Multimedia CLUVI corpusa (ingelesa-galiziera, filmes azpitituluak)

Hiztegiak

  • Ingelesa-galiziera
  • Frantsesa-Galiziera
  • Espainiera-galiziera

Hasiera

CLUVI, 2006ko urrian, 22 milioi hitz ingurukoa zen. Honela dago osatuta CLUVI corpusa:

  • Galiziera-gaztelania LEGA corpus juridikoa (5 877 769 hitz)
  • Corpus UNESCO ingeles-galiziera-frantses zientzia-dibulgazioko espanierra (3 724 620 hitz)
  • Ingeles-galiziera softwarea aurkitzeko CORPUS LOGALIZA (1 701 834 hitz)
  • galizierazko TECTRA literatura-corpusa (1 476 020 hitz)
  • Corpus literario FEGA frantses galiziera (1 267 119 hitz)
  • Gaztelania-galiziera-euskara kontsumo-informazioa (5 586 431 hitz)
  • Corpus juridikoa LEGEA-EUSKARAZKO BI (2 384 053 hitz)

CLUVIren beste atal batzuk, arren, hauek direnak:

  • Galiziera-gaztelania ekonomiako EGAL corpusa (718.642 hitz)
  • Ingelesezko TECTRA corpus literarioa (735.529 hitz)
  • Literatura-corpusa TECTRA ing-gaztelania (122.251 hitz)
  • Corpus literarioa DEGA–galiziera (76.364 hitz)
  • Ingelesezko filmen azpitituluen VEIGA corpusa (78.032 hitz)
  • Portugalgo eta gaztelaniako literatura postkolonialeko PALOP corpusa (566.590 hitz)

Erreferentziak

  1. «Corpus CLUVI» ilg.usc.gal (Noiz kontsultatua: 2023-10-18).

Ikus, gainera

Kanpo estekak

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.