Lexicography-Semantics

Hizkuntza-ulermenari ekarpenak: n-gramen arteko atentzio eta lerrokatzeak antzekotasun eta inferentzia interpretagarrirako

Hizkuntzaren Prozesamenduaren bitartez hezkuntzaren alorreko sistema adi-
mendunak hobetzea posible da, ikasleen eta irakasleen lan-karga nabarmenki
arinduz. Tesi honetan esaldi-mailako hizkuntza-ulermena aztertu eta propo-
samen berrien bitartez sistema adimendunen hizkuntza-ulermena areagotzen
dugu, sistemei erabiltzailearen esaldiak modu zehatzagoan interpretatzeko
gaitasuna emanez. Esaldiak modu finean interpretatzeko gaitasunak feed-
back a modu automatikoan sortzeko aukera ematen baitu.

Tesi hau garatzeko hizkuntza-ulermenean sakondu dugu antzekotasun seman-
tikoari eta inferentzia logikoari dagokien ezaugarriak eta sistemak aztertuz.
Bereziki, esaldi barneko hitzak multzotan egituratuz eta lerrokatuz esaldiak
hobeto modelatu daitezkeela erakutsi dugu. Horretarako, hitz solteak lerro-
katzen dituen aurrekarien egoerako neurona-sare sistema bat inplementatu
eta n-grama arbitrarioak lerrokatzeko moldaketak egin ditugu. Hitzen arte-
ko lerrokatzea aspalditik ezaguna bada ere, tesi honek, lehen aldiz, n-grama
arbitrarioak atentzio-mekanismo baten bitartez lerrokatzeko propo-
samenak plazaratzen ditu.

Gainera, esaldien arteko antzekotasunak eta desberdintasunak modu zeha-
tzean identifikatzeko, esaldien interpretagarritasuna areagotzeko eta ikasleei
feedback zehatza emateko geruza berri bat sortu dugu: iSTS. Antzekota-
sun semantikoa eta inferentzia logikoa biltzen dituen geruza horrekin
chunk ak lerrokatu ditugu, eta ikasleei feedback zehatza emateko gai izan
garela frogatu dugu hezkuntzaren testuinguruko bi ebaluazio-eszenariotan.

Tesi honekin batera hainbat sistema eta datu-multzo argitaratu dira etorki-
zunean komunitate zientifikoak ikertzen jarrai dezan.

Saying no but meaning yes: negation and sentiment analysis in Basque

In this work, we have analyzed the effects of negation on the semantic orientation in Basque. The analysis shows that negation markers can strengthen, weaken or have no effect on sentiment orientation of a word or a group of words. Using the Constraint Grammar formalism, we have designed and evaluated a set of linguistic rules to formalize these three phenomena. The results show that two phenomena, strengthening and no change, have been identified accurately and the third one, weakening, with acceptable results.

Euskarazko denbora-egituren azterketa eta corpusaren sorrera / Analysis of Basque temporal constructions and the creation of a corpus

Ikerketa-lan honetan euskarazko denbora-informazioaren prozesamenduan lehen urratsak egin ditugu. Horretarako, beste hizkuntzetan egin diren lanetan eta euskarazko denbora-egituren analisi linguistikoan oinarritu gara. Informazio hori baliatuta, euskarazko denbora-egiturak automatikoki tratatzeko ezaugarri linguistiko esanguratsuenak identifikatu ditugu eta horiek kodetzeko EusTimeML markaketa-lengoaia sortu dugu. Era berean, EusTimeMLri jarraituta denbora-informazioa eskuz etiketatuta duen EusTimeBank corpusa sortu dugu.

Pages

Subscribe to RSS - Lexicography-Semantics