Számítógépes nyelvészet

A számítógépes nyelvészet olyan műszaki tudomány, amely a természetes nyelvű szövegek számítógépes feldolgozásával foglalkozik, de minden olyan elméleti és gyakorlati tevékenység ide tartozik, amely kapcsolatban van a természetes nyelvekkel. Egy interdiszciplína, vagyis olyan szakterület, amely több terület eredményeire és tudására épül, mint pl. az informatika, a matematika és a nyelvészet.[1]

A számítógépes nyelvészet története

A számítógépes nyelvészet az 50-es és a 60-as években a gépi fordításból indult el. A kutatást elsősorban gazdasági és politikai okok mozgatták az Amerikai Egyesült Államokban, Kínában és az akkori Szovjetunióban. Több elnevezése ismert pl. kibernetika, információelmélet vagy nyelvtechnológia. A fogalom nem összetévesztendő a programozási nyelvvel, amelynek szinonimájaként a számítógépes nyelv is használatos.

A 60-as évek végéig az általánosan használt háttértároló a mágnesszalag volt, amely nemcsak lassúsága miatt, hanem alacsony tárolókapacitása miatt sem volt alkalmas nagy mennyiségű adatok tárolására. Később a mágnesszalagot felváltotta a mágneslemez és a virtuális memória.[2] A számítógép valóságos forradalmat okozott az alkalmazott nyelvtudományban, robbanásszerűen kiszélesítette a felhasználási területeket.[3]

A számítógépes nyelvészet elsőszámú célterülete a gépi fordítás, de emellett egyre több igény jelent meg e nyelvészeti ággal szemben. Mint például az automatikus kivonatolás és statisztikai jellegű információk előállítása az előbb említett nagyhatalmak számára, egymás újságjaiból és napilapjaiból. Majd ezekből a kivonatolt információkból szöveges összefoglalók készítése.[2] Ma már a számítógépes nyelvészet jelen van a nyelvi statisztikák készítésében, a fordítás és szótárkészítés segítésében, nagy terjedelmű szövegek tárolásában a korpusznyelvészetben, a helyesírás-ellenőrző programok készítésében és az internetes keresőrendszerek létrehozásában.

Először 1954-ben, New Yorkban fordított egy IBM-701-es számítógép néhány mondatot angolról oroszra,[4] majd 1957-ben készült el az első magyar-orosz gépi fordítási program. Ez a program csak olyan válogatott mondatokat tudott lefordítani, amelyekben sok mechanikusan ismétlődő rész volt.[5] A gépi fordítási mozgalom nagy lendülete a 60-as évek elejéig tartott, mert kiderült, hogy a probléma sokkal bonyolultabb és a nyelv sokkal összetettebb struktúra annál, mint ahogy azt először gondolták.[6]

A számítógépes nyelvészet céljai és eszközei

A gép a nyelvet szövegként, sőt betűk sorozataként érzékeli, számára ezek számkódok (egyesek és nullák) sorozata, ahol az egyes számkódok betűket és írásjeleket képviselnek. Nemcsak tárolnia és megjelenítenie kell a szöveget, hanem fel kell ismernie a benne lévő nyelvi szerkezeteket is. A természetes nyelvekben szabályszerűségek vannak és ezeket kell megtalálnia. Legalapvetőbb leírási szintje a számítógépes morfológia és szintaxis, amelyeknek bonyolultsága nyelvfüggő.[1] Automatikus, használható fordítási kulcsot nem lehet létrehozni, minden esetben a felhasználó aktív közreműködése szükséges, a gép (még) nem tud az ember helyett fordítani. A fordítógépek programjaitól nem várhatunk többet, mint más nyelvtani összeállításoktól.[5][6]A szavak és mondatok valódi tartalmának felismeréséhez és megfelelő kezeléséhez világismeretre van szükség.[1]

Ma már nem is mesterséges intelligenciáról, hanem inkább nyelvtechnológiáról beszélünk, aminek a mindennapokban is használt sikerei közé tartozik például a helyesírás-ellenőrzés, a szövegkivonatolás, a bankszámlaegyenleg lekérdezése, a mozijegyrendelés és bizonyos területeken (mint például a kanadai időjárás-jelentés) a gépi fordítás. Ezek és más hasonló alkalmazások a nyelvtechnológia egyes részfeladatainak megoldásával jöhettek létre.[7]

  1. Beszédfelismerés: a hallgató szerepében a gép első feladata a felhasználó által adott akusztikus jelek felismerése és a folyamatos hanghullám nyelvi egységekre bontása.
  2. Beszédszintézis: a dialógus másik oldalán a gépnek tudnia kell beszédhangokat szintetizálni és ezeket folyamatos beszéddé alakítani.
  3. Parsing (elemzés): a nyelvelemzés során a feladat a szöveg különböző szintű elemeinek rendszerezése, az elemek közötti függőségek megállapítása. A mondatok szintjén a szavak szerveződését vizsgáljuk (pl. mi minek a jelzője, birtokosa, tárgya stb.), a szavak szintjén pedig a szótő és a toldalékok viszonya az elemzés tárgya (pl. a szavak szófajának megállapítása és a végződések kategorizálása).
  4. Szemantikai elemzés: a szöveg értelmezéséhez ismerni kell nemcsak a szavak jelentését, hanem a szöveg körülményeitől függő ún. deiktikus kifejezések utalási szándékát is. Az akkor, tegnap, ő, itt szavak például csak a szövegkörnyezethez és/vagy a fizikai környezethez viszonyítva értelmezhetők.
  5. Generálás: nyelvgenerálásnak nevezzük valamilyen tudás nyelvi kódolását, vagyis természetes nyelven – megformált mondatokban, szövegben – való kifejezését. Tekinthető ez úgy, mint a parsing és a szemantikai elemzés fordított irányú alkalmazása.
  6. Inferencia: egy bonyolultabb, háttértudással vagy tanulómemóriával rendelkező rendszer logikai következtetések levonására is alkalmas lehet, amivel input hiányában is kinyerhet új információt. Ezt a folyamatot nevezzük inferenciának.[7]

Jegyzetek

  1. a b c [[Kenesei István (nyelvész)|]] (szerk.): A nyelv és a nyelvek. Akadémiai Kiadó, Budapest, 2004.
  2. a b Prószéky Gábor: Számítógépes nyelvészet. Számítástechnika-Alkalmazási Vállalat, Budapest, 1989.
  3. Papp Ferenc: Alkalmazott nyelvtudomány: Akadémiai székfoglaló: 1986. május 19. Akadémiai Kiadó, Budapest, 1986.
  4. 701 Translator, IBM sajtóközlemény, 1954 jan. 8. - oroszról angolra
  5. a b Simigné Fenyő Sarolta: Bevezetés az alkalmazott nyelvészetbe, Miskolci Egyetem, 2003.
  6. a b Fodor István: Mire jó a nyelvtudomány? Gondolat, Budapest, 1968.
  7. a b Babarczy Anna: Számítógépes nyelvészet

Források

Külső hivatkozások

Read other articles:

Untuk aktor Indonesia kelahiran 1970, lihat Ari Wibowo. Untuk musisi Indonesia, lihat Arie Wibowo. Arry B. WibowoLahirArry Bagoes Wibowo5 Februari 1972 (umur 52)Jakarta, IndonesiaPekerjaanpengacara, direktur, pelawak tunggalKerabatAlif Rivelino (Keponakan) Arry Bagoes Wibowo, S.H., M.H. (lahir 5 Februari 1972) adalah seorang pengacara dan pelawak tunggal Indonesia. Arry yang pernah magang di kantor pengacara Oemar Seno Adji, kini dikenal publik sebagai Lawyer Comic. Semua karena di sela-...

 

 

MeuraxaKecamatanNegara IndonesiaProvinsiAcehKotaBanda AcehPemerintahan • Camat-Populasi • Total- jiwaKode pos23231-23234[1]Kode Kemendagri11.71.03 Kode BPS1171010 Desa/kelurahan16 gampong Pelabuhan Ulee Lheue Masjid Baiturrahim Kecamatan Meuraxa (ditulis juga sebagai Meuraksa) adalah salah satu kecamatan di Kota Banda Aceh. Gampong di Kecamatan Meuraksa adalah: Alue Deah Teungoh Asoe Nanggroe Baru Blang Blang Oi Cot Lamkueweuh Deah Baro Deah Glumpang Lambu...

 

 

1972 Liberal Party of Australialeadership election ← 1971 20 December 1972 1975 →   Candidate Billy Snedden Nigel Bowen Malcolm Fraser First Ballot Uncertain Uncertain Uncertain Second Ballot Uncertain Uncertain Uncertain Third Ballot Uncertain Uncertain Uncertain Fourth Ballot 29 (50.0%) 29 (50.0%) Eliminated Fifth Ballot 30 (50.9%) 29 (49.1%) Eliminated Seat Bruce (Vic.) Parramatta (NSW) Wannon (Vic.)   Candidate John Gorton James Ki...

Questa voce o sezione sull'argomento calciatori italiani non cita le fonti necessarie o quelle presenti sono insufficienti. Puoi migliorare questa voce aggiungendo citazioni da fonti attendibili secondo le linee guida sull'uso delle fonti. Segui i suggerimenti del progetto di riferimento. Renzo Garlaschelli Garlaschelli alla Lazio nella stagione 1974-1975 Nazionalità  Italia Altezza 175 cm Peso 68 kg Calcio Ruolo Attaccante Termine carriera 1984 - giocatore Carriera Squadre di clu...

 

 

Prima Categoria 1963-1964 Competizione Prima Categoria Sport Calcio Edizione 5ª Organizzatore FIGC - LNDComitato Regionale Lombardo Luogo  Italia Cronologia della competizione 1962-1963 1964-1965 Manuale Voce principale: Prima Categoria 1963-1964. Il campionato di calcio di Prima Categoria 1963-1964 è stato il V livello del campionato italiano. A carattere regionale, fu il sesto campionato dilettantistico con questo nome dopo la riforma voluta da Zauli del 1958. Questi sono i gironi o...

 

 

Voce principale: Forlì Football Club. Calcio ForlìStagione 1985-1986Sport calcio Squadra Forlì Allenatore Giancarlo Magrini Presidente Tiziano Tampellini Serie C211º posto nel girone C. Coppa ItaliaPrimo turno Maggiori presenzeCampionato: Piraccini, Tondi (33) Miglior marcatoreCampionato: Di Chio (8) StadioStadio Tullo Morgagni 1984-1985 1986-1987 Si invita a seguire il modello di voce Questa pagina raccoglie le informazioni riguardanti il Calcio Forlì nelle competizioni ufficiali ...

Northrop Delta adalah pesawat angkut penumpang bermesin tunggal Amerika tahun 1930-an. Terkait erat dengan pesawat surat Northrop Gamma, 13 di antaranya dihasilkan oleh Northrop Corporation, diikuti oleh 19 pesawat dibangun di bawah lisensi oleh Canadian Vickers Limited. Referensi The Latest Northrops: The Victoria and Delta Models. Flight, 8 February 1934. pp. 123–124. Francillon, René J. McDonnell Douglas Aircraft since 1920. London:Putnam, 1979. ISBN 0-370-00050-1. Green, William....

 

 

Medical conditionNeuromuscular diseaseCongenital nemaline myopathy (neuromuscular disorder)SpecialtyNeurology, neuromuscular medicine, physical medicine and rehabilitationCausesAutoimmune disorders,[1] genetic disorders,[2] environmental factors[3]Diagnostic methodMuscle electrophysiology tests, genetic testingTreatmentDepends on the disorder; many currently have no cure[2] A neuromuscular disease is any disease affecting the peripheral nervous system (PNS), ...

 

 

CharlevillecomuneCharleville – Veduta LocalizzazioneStato Francia RegioneGrand Est Dipartimento Marna ArrondissementÉpernay CantoneSézanne-Brie et Champagne TerritorioCoordinate48°49′N 3°40′E / 48.816667°N 3.666667°E48.816667; 3.666667 (Charleville)Coordinate: 48°49′N 3°40′E / 48.816667°N 3.666667°E48.816667; 3.666667 (Charleville) Superficie18,25 km² Abitanti265[1] (2009) Densità14,52 ab./km² Altre informazioni...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (يوليو 2020) دوري جنوب إفريقيا الممتاز لكرة القدم 2003-04 تفاصيل الموسم دوري جنوب إفريقيا الممتاز  النسخة 8  البلد جن�...

 

 

Wife of the president of Romania First Lady of RomaniaIncumbentCarmen Iohannissince 21 December 2014StyleMrs. IohannisResidenceVila Lac 3, Bucharest[1]Inaugural holderElena CeaușescuFormation28 March 1974; 50 years ago (1974-03-28) First Lady of Romania is an unofficial honorific applied to the wife of the president of Romania, concurrent with his term of office.[2][3][4] List of first ladies Image Name Term President Elena Ceaușescu 28...

 

 

2020年夏季奥林匹克运动会波兰代表團波兰国旗IOC編碼POLNOC波蘭奧林匹克委員會網站olimpijski.pl(英文)(波兰文)2020年夏季奥林匹克运动会(東京)2021年7月23日至8月8日(受2019冠状病毒病疫情影响推迟,但仍保留原定名称)運動員206參賽項目24个大项旗手开幕式:帕维尔·科热尼奥夫斯基(游泳)和马娅·沃什乔夫斯卡(自行车)[1]闭幕式:卡罗利娜·纳亚(皮划艇)&#...

Marwan Jameel Essa al-Muasher Wakil Perdana MenteriMasa jabatan3 Juli 2005 – 24 November 2005 Informasi pribadiLahir1956 (umur 67–68)Amman, YordaniaSunting kotak info • L • B Marwan al-Muasher (Arab: مروان المعشر) (kelahiran 1956) adalah seorang diplomat dan politikus Yordania yang menjadi menteri luar negeri Yordania dari 2002 sampai 2004 dan wakil perdana menteri pada 2004 dan 2005. Ia kini menjabat sebagai wakil presiden untuk kajian di Ca...

 

 

العلاقات الأردنية اللوكسمبورغية الأردن لوكسمبورغ   الأردن   لوكسمبورغ تعديل مصدري - تعديل   العلاقات الأردنية اللوكسمبورغية هي العلاقات الثنائية التي تجمع بين الأردن ولوكسمبورغ.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدول�...

 

 

Anotogaster sieboldii DewasaStatus konservasiRisiko rendahIUCN167214 TaksonomiKerajaanAnimaliaFilumArthropodaKelasInsectaOrdoOdonataFamiliCordulegastridaeGenusAnotogasterSpesiesAnotogaster sieboldii Selys, 1854 lbs Anotogaster sieboldii, yang dikenal sebagai capung bercincin emas, capung jumbo, capung Siebold atau oniyanma (オニヤンマ、鬼蜻蜓、馬大頭code: ja is deprecated ) dalam bahasa Jepang, 無霸勾蜓 dalam bahasa Tionghoa dan 장수잠자리(jang-su-jamjari, artinya 'Capun...

Cape in Clallam County, Washington, U.S. Cape Alava and Ozette Island Looking north at Cape Alava and Ozette Island, Olympic National Park. Cape Alava[pronunciation?] is a cape in the Pacific Northwest region of the United States. Located in Clallam County, Washington. The cape is situated within Olympic National Park and the Makah Indian Reservation, and is accessible via a 3-mile (5 km) boardwalk hike from a ranger station in the park. Cape Alava Trail was designated a National Recr...

 

 

Artikel ini membutuhkan rujukan tambahan agar kualitasnya dapat dipastikan. Mohon bantu kami mengembangkan artikel ini dengan cara menambahkan rujukan ke sumber tepercaya. Pernyataan tak bersumber bisa saja dipertentangkan dan dihapus.Cari sumber: Madrasah – berita · surat kabar · buku · cendekiawan · JSTOR Bagian dari seri bertopik IslamUshul fikih Sumber-sumber hukum Islam Al-Qur'an Hadis Ijmak Qiyas Istihsan Ijtihad Urf Fikih Taqlid Mazhab Bidah Mad...

 

 

Untuk kegunaan lain, lihat Palermo (disambiguasi). PalermoKomuneComune di PalermoKolase PalermoNegaraItaliaWilayahSisiliaProvinsiPalermo (PA)Didirikan736 BCPemerintahan • Wali kotaDiego CammarataLuas • Total158,9 km2 (61,4 sq mi)Ketinggian14 m (46 ft)Populasi (30 April 2009) • Total657.935 • Kepadatan4,100/km2 (11,000/sq mi)DemonimPalermitaniZona waktuUTC+1 (CET) • Musim panas (DST)UTC+2 (CEST)Kode ...

香港申辦2006年亞洲運動會標誌 香港申辦2006年第15屆亞洲運動會計劃(英語:Hong Kong 2006)是香港特别行政區政府和中國香港體育協會暨奧林匹克委員會共同申辦2006年亞洲運動會的計劃。在2000年11月12日第19屆亞洲奧林匹克理事會會議次輪投票中,香港申辦計劃獲6票,敗於卡塔爾多哈。 歷史 香港政府於1999年年底決定支持港協暨奧委會提出申辦2006年亞洲運動會的建議,以加強...

 

 

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (ديسمبر 2018) إنتر براتيسلافا تأسس عام 1 يوليو 1940 (1940-07-01) (84 سنة) الملعب ملعب باسينكي  البلد سلوفاكيا  الإدارة ال�...