Lexikoaren Behatokiaren korpusa eguneratu dau Euskaltzaindiak

Erabiltzailearen aurpegia Bizkaie! 2016ko mar. 7a, 00:00

2015ean egindako lanaren emoitzea batuta, Lexikoaren Behatokiaren korpusaren bersino barria martxan dagoala azaldu dau Euskaltzaindiak. Hainbat hedabide eta argitaletxeren testuetatik abiatuta, erabilitako berben zerrendea batzen dau korpusak, hiztegigintzan erabilteko oinarri legez. Dagoeneko, 50 miloe testu-hitz dagoz zerrendan.

Euskaltzaindia 1980ko hamarkadan hasi zan korpus horretarako berbak jasoten. Hasikeran, batez be hedabideetan erabilten zan euskerea batzea zan asmoa baina, urteen joanean, beste esparru batzuetara be zabaldu dabe bilketea, argitaletxeetara adibidez.

Korpusak hiztegigintzan eta hizkuntzearen azterketan laguntzino handia emoten dau. Hiztegi Batua eta beste hainbat egiteko oinarrietako bat izan da, berba bakotxa eta haren aldaerak eguneroko jardun idatzian zenbat erabilten diran erakusten dauelako. Zerrendan, berba bakotxaren maiztasuna eta beste ezaugarri batzuk datoz (euskalkien markea, berba espezializadua ete dan, adibideak...). Nazinoarteko estandarren arabera dago etiketauta.

Lexikoaren Behatokiaren korpusa batzeko lanean, laguntzaile ugari daukaz Euskaltzaindiak: UZEI eta Elhuyarrek beharrezko azpiegiturea eta ezagutza teknikoa emoten dabe, korpusa behar dan moduan osotuteko. Era berean, EHUko Ixa Taldeak be laguntzen dau, informatikearen arloan.

Orain aurkeztu dan eguneratzeagaz, 2015eko testuetan jasotako berbak sartu dira korpusean. Gehienbat, euskerazko hedabideetako testuetatik jaso da materiala (Berria, EiTB eta Argia izan dira oparoenak). Ganera, Elkar lako argitaletxe batzuen testuak be aztertu dira eta HABE erakundearenak be bai.

2008an 4 miloe testu-hitz eukazan korpusak eta urteotan gorakada handia euki dau. 2015eko gaurkotzeari esker, 50 miloe testu-hitz dagoz jasota orain.

Osorik irakurri