Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN, euskaraz: Hizkuntzaren Prozesamendurako Espainiako Elkartea) irabazi asmorik gabeko elkarte zientifikoa da, eta 1983an sortu zenetik hizkuntzaren prozesamenduaren arloan jarduten du.[1][2]Felisa Verdejo irakaslea, orduan Euskal Herriko UnibertsitatekoInformatika Fakultateko irakaslea, bazkide sortzaileetako bat eta elkarteko lehen lehendakaria izan zen.
Bi jarduera nagusi ditu: hizkuntza naturalaren prozesamenduari buruzko nazioarteko kongresu bat egitea urtero, eta Procesamiento del Lenguaje Natural aldizkari zientifikoa (Lengoaia Naturalaren Prozesamendua) sei hilean behin argitaratzea. Bi jarduera horiek izan dira nazioarteko ikerketa-komunitate bat sortzeko hazia, bereziki iberiar penintsulan eta Latinoamerikan kokatua, hizkuntza naturalaren tratamendu automatikoa sustatzen duena, eta, bereziki, gaztelania, euskara, katalana eta galegoa.
Hizkuntza teknologia eta adimen artifiziala
Hizkuntzaren teknologiak (HT), giza hizkuntza prozesatzeko gai diren sistemak aztertu eta garatzeaz arduratzen denak, hainbat metodo garatu ditu testuetako informazioa esplizitu egiteko eta deskribatzen duen errealitatearekin lotzeko. Kontuan hartu behar da egunerokoan gizakiok eskura dugun informazio digital gehiena egituratu gabeko informazioa dela, testu gisa agertzen zaigu hainbat hizkuntzatan (idatzita edo hitz eginda), eta hori erronka bat da informazio hori ustiatu eta prozesatu nahi duen edozein erakunderentzat.[3]
2022an hizkuntzaren teknologia zen, seguruenik, adimen artifizialaren eremurik berritzaileena, hazkunde azkarreko eragin ekonomikoa sortzen duena. Gaur egun, duela urte batzuk aurrerapen ikaragarri eta imajinaezin zirenak errealitate bihurtzen ari dira. Hain zuzen, HTko aplikazio funtzionalen eremua garrantzitsuenetako bat da. Adimen artifizialaren % 50 baino gehiago hizkuntzaren prozesamendua dela kalkulatzen da.[3]
Hizkuntza-teknologiako komunitate bat sortzen
Hizkuntzaren Teknologiako komunitate bat osatu du SEPLN elkarteak gaztelania, euskara, katalana eta galiziera ikertzeko taldeekin. Komunitate hori Latinoamerikan eta mundu mailan erreferentea da, batez ere gaztelania eta baliabide gutxiko hizkuntzak arrakastaz lantzeko hainbat eredu sortu dituelako.[3]
Horrela, SEPLN elkartearen jardueraren eragina nabarmena da 2022an Europako hizkuntzek teknologia linguistikoan zein egoeratan zeuden aztertu zuen txostenean. Batetik espainiera hizkuntza ofizialen artean egoera onena zutenen artean zegoen, ingelesaren atzetik, noski, alemana eta frantsesaren mailan; eta bestetik, euskara, katalana eta galiziera hizkuntza ez-ofizialen artean hoberen kokatuta zeudenak ziren, galesarekin batera, eta zenbait hizkuntza ofizial edo nazional baino egoera hobean zeuden (Irlandako gaelera eta maltera baino hobeto, esaterako). Esan daiteke, ziur aski hori gertatu dela hizkuntza horretarako teknologia eta baliabideak SEPLN bezalako foroetan urte askotan landu direlako, alegia foro horretan lau hizkuntza horietarako teknologia modu sinkronizatuan garatzeak onuragarri izan dela hizkuntza horientzat.[4]
European Language Grid (2023-09-14) Hizkuntza teknologiako produktuen katalogoa
SEPLNren eragina Wikipedian itzulpen automatikoaren bidez sortu diren artikulu kopuruari begiratuta ere sumatu daiteke. Harrigarria da, zerrendako lehenengoa da Espainiera, katalana 6.a, portugesa 8.a, galegoa 21.a eta euskara 28. postuan dago. Hori gertatu ahal izan da hizkuntza horiek hizkuntza-baliabide asko sortu dituztelako, baliabide horiek funtsezkoak baitira kalitatezko itzultzaile automatiko neuronalak garatu ahal izateko. Eta hizkuntza horiek baliabide ugari dituzte, ohikoa dena baino gehiago antzeko hiztun kopuru duten beste hizkuntzekin konparatuz gero. Ziur aski hori gertatu da SEPLN bezalako foroetan teknologia eta baliabide horiek urte askotan landu direlako.[14]
Wikipedia artikuluen itzulpenak hizkuntzaka Content Translation-eko estatistikak.[14]
Postua
Ze hizkuntzara
Artikulu kopurua
Ze hizkuntzatatik
1.a
es
español
130.934
en ca fr pt it…
2.a
fr
français
107.801
en de es it...
...
6.a
ca
català
66.839
es en fr…
...
8.a
pt
português
56.335
en es…
...
21.a
gl
galego
23.841
en es…
...
28.a
eu
euskara
15.837
es en…
...
SEPLN kongresua
SEPLN elkartearen kongresua 1983tik egiten da urtero. Hizkuntzaren prozesamenduko 3 adituk, gutxienez, modu anonimoan ebaluatzen dituzte aurkeztutako artikuluak.
2022an, SNIP indizea (Source Normalized Impact per Paper, Journal Indicators) 0,93 zen, eta SJR indizea (SCImago Journal Rankings) 0,421. Gainera 3. kuartilean zegoen aplikazio informatikoetan, baita 1. kuartilean hizkuntza eta linguistikan.[28][29]
Paperezko edizioaren ISSN kodea 1135-5948 da, eta edizio elektronikoarena 1989-7553.
SEPLN sariak
SEPLN elkarteak SEPLN Saria banatzen du urtero hizkuntzaren prozesamenduaren ikerlarien artean. Hizkuntza-teknologien arloko ikerketa sustatu eta zabaltzea da sariaren helburua. 2018an XVII. saria eman eta banatu zen.
Lehendakariak
Elkartea sortu zenetik hona, hauek izan dira sozietate horren buru: