Lexical Markup Framework

Lexical Markup Framework (LMF) è un progetto in corso all'interno dell'Organizzazione Internazionale per la Standardizzazione (International Organisation for Standardisation - ISO), e più in particolare all'interno di ISO/TC37, allo scopo di definire uno standard per la rappresentazione di dizionari elettronici e lessici computazionali per il trattamento automatico della lingua (TAL). Scopo del progetto è la standardizzazione dei principi e dei metodi relativi alle risorse linguistiche nel contesto della comunicazione multilingue e della diversità culturale.

Obiettivi di LMF

Gli scopi di LMF sono: fornire un modello comune per la creazione e l'uso di risorse lessicali; gestire lo scambio di dati tra queste risorse; consentire la fusione di risorse elettroniche singole per formare una vasta rete a livello globale. Tipi di singole istanziazioni di LMF possono includere risorse lessicali monolingui, bilingui o multilingui. Le stesse specifiche possono essere usate per lessici di piccole o grandi dimensioni, semplici o complessi, e per rappresentazioni lessicali scritte o parlate. Le descrizioni linguistiche comprendono informazioni morfologiche, sintattiche, semantiche e multilingui. Le lingue coperte non si limitano alle lingue europee ma coprono tutte le lingue naturali. La gamma di applicazioni di NLP non è limitata. LMF è in grado di rappresentare la maggior parte dei lessici, inclusi WordNet, EDR e PAROLE.

Storia di LMF

In passato, la standardizzazione dei lessici è stata studiata e sviluppata da una serie di progetti come GENELEX, EDR, EAGLES, MULTEXT, PAROLE, SIMPLE e ISLE. Successivamente, le delegazioni nazionali di ISO/TC37 hanno deciso di trattare standards dedicati alla rappresentazione di lessici elettronici e per TAL. Il lavoro su LMF è cominciato nell'estate 2003 per mezzo di una nuova proposta di lavoro (New work Item Proposal) avanzata dalla delegazione statunitense. Nell'autunno 2003, la delegazione francese ha emanato una proposta tecnica per un modello di dati dedicato ai lessici per TAL. All'inizio del 2004, il comitato ISO/TC37 ha deciso di formare un progetto comune ISO con Nicoletta Calzolari (Italia) come convenor e Gil Francopoulo (Francia) e Monte George (US) come editori. Da allora 13 versioni sono state scritte, inviate agli esperti nazionali, commentate e discusse durante varie riunioni tecniche ISO.

Stato attuale

Il numero ISO è 24613. La specifica di LMF è attualmente (Dicembre 2007) allo stato di DIS (Draft for International Standard). Il programma prevede di raggiungere lo stadio di FDIS (Final Draft for International Standard) in febbraio 2008 e la pubblicazione finale in settembre 2008. LMF e gli altri membri della famiglia di standard ISO/TC37 Gli standard ISO/TC37 sono attualmente elaborati come specifiche di alto livello e trattano la segmentazione delle parole (ISO 24614), annotazioni (ISO 24611 o MAF, ISO 24612 o LAF, ISO 24615 o SynAF, e ISO 24617-1 o SemAF/Time), feature structures (ISO 24610), contenitori multimediali (ISO 24616 o MLIF), and lessici (ISO 24613). Questi standard sono basati su specifiche di basso livello dedicate a costanti, ovvero data categories (revisione di ISO 12620), codici linguistici (ISO 639), scripts codes (ISO 15924), country codes (ISO 3166) e Unicode (ISO 10646). Questa organizzazione a due livelli costituisce una famiglia coerente di standard con regole comuni e semplici: 0. La specifica di alto livello fornisce gli elementi strutturali che sono integrati dalle costanti standardizzate; 0. Le specifiche di basso livello forniscono le costanti standardizzate come metadati.

Standard usati da LMF

Le costanti linguistiche come /feminine/ (“femminile”) o /transitive/ (“transitivo”) non sono definite all'interno di LMF ma sono registrate nel Registro di Data Categories (Data Category Registry, DCR), che viene mantenuto come risorsa globale da ISO/TC37 in conformità con ISO/IEC 11179-3:2003 [1]. Queste costanti sono usate per integrare gli elementi strutturali di alto livello. La specifica LMF è conforme ai principi di modellazione di UML (Unified Modeling Language), così come definiti da OMG (Object Management Group). La struttura è specificata per mezzo di diagrammi di classi UML. Gli esempi sono presentati da diagrammi di esempi (o oggetti) UML. Una DTD XML è inoltre fornita in un annesso del documento LMF.

Modello strutturale

LMF è formato dai componenti seguenti: 0. Un pacchetto centrale che rappresenta lo scheletro strutturale che descrive la gerarchia di base dell'informazione in un'entrata lessicale. 0. Estensioni del pacchetto centrale, espresse in un sistema che descrive il riutilizzo dei componenti centrali in unione con i componenti aggiuntivi richiesti per una risorsa lessicale specifica. Le estensioni sono dedicate alla morfologia, dizionari elettronici (MRD), sintassi NLP, semantica NLP, annotazioni multiligui NLP, schemi di paradigma NLP, espressioni polirematiche, e constraint expression patterns.

Un esempio

Nell'esempio seguente, l'entrata lessicale è associata ad un lemma (clergyman) e a due forme flesse (clergyman e clergymen). La codifica della lingua è effettuata per l'intera risorsa lessicale. Il valore scelto per descrivere la particolare lingua trattata è fissato per l'intero lessico, come indicato nel seguente diagramma UML.

Gli elementi Lexical Resource, Global Information, Lexicon, Lexical Entry, Lemma, e Word Form definiscono la struttura del lessico, e sono specificati nel documento LMF. Al contrario, languageCoding, language, partOfSpeech, commonNoun, writtenForm, grammaticalNumber, singular, plural sono data categories prese dal registro di data categories, e servono ad integrare la struttura. I valori ISO 639-3, clergyman, clergymen sono semplici stringhe di caratteri. Il valore eng è tratto dalla lista di lingue così come definite in ISO 639-3.

Con alcune informazioni aggiuntive come dtdVersion e feat, gli stessi dati possono essere espressi dal seguente frammento XML:

<LexicalResource dtdVersion="14">
    <GlobalInformation>
        <feat att="languageCoding" val="ISO 639-3"/>
    </GlobalInformation>
    <Lexicon>
        <feat att="language" val="eng"/>
        <LexicalEntry>
            <feat att="partOfSpeech" val="commonNoun"/>
            <Lemma>
                <feat att="writtenForm" val="clergyman"/>
            </Lemma>
            <WordForm>
                 <feat att="writtenForm" val="clergyman"/>
                 <feat att="grammaticalNumber" val="singular"/>
            </WordForm>
            <WordForm>
                <feat att="writtenForm" val="clergymen"/>
                <feat att="grammaticalNumber" val="plural"/>
            </WordForm>
        </LexicalEntry>
    </Lexicon>
</LexicalResource>

Nonostante questo esempio sia piuttosto semplice, LMF può rappresentare descrizioni linguistiche molto più complesse; in tal caso, la rappresentazione XML cresce in complessità.

Collegamenti esterni

Siti web correlati

  • Sito web di LMF, su lexicalmarkupframework.org. URL consultato il 23 gennaio 2008 (archiviato dall'url originale il 15 luglio 2017).
  • Sito web di LIRICS, su lirics.loria.fr.

Comunicazioni scientifiche su LMF

  • Gesellschaft für linguistische Datenverarbeitung GLDV-2007/Tubingen: Lexical Markup Framework ISO standard for semantic information in NLP lexicons [2]
  • Language Resources and Evaluation LREC-2006/Genoa: Lexical Markup Framework (LMF) [3]

Comunicazioni scientifiche correlate

  • Language Resources and Evaluation LREC-2006/Genoa: The relevance of standards for research infrastructures [4]

Read other articles:

Artikel ini bukan mengenai Trans Metro Bandung. Trans Metro PasundanBus-bus milik kedua operator Trans Metro Pasundan, Big Bird (kiri) dan DAMRI (kanan)Didirikan21 Desember 2021LokalBandung RayaWilayah layananKota Bandung, Kota Cimahi, Kabupaten Bandung, Kabupaten Bandung Barat, dan Kabupaten SumedangJenis layananbus raya terpaduRute5 koridor, 3 koridor milik Teman bus, 2 koridor diambil alih Dinas Perhubungan Provinsi Jawa BaratOperatorPerum DAMRI dan PT Big Bird PusakaSitus webtemanbus.com/...

 

Административное деление КНР Топонимия Китая — совокупность географических названий, включающая наименования природных и культурных объектов на территории КНР. Структура и состав топонимии обусловлены такими факторами, как состав населения, специфика историческо...

 

BilllieLogo resmi BilllieInformasi latar belakangAsalSeoul, Korea SelatanGenreK-popTahun aktif2021 (2021)—sekarangLabelMystic StorySitus webSitus web resmiAnggota Moon Sua Suhyeon Haram Tsuki Sheon Siyoon Haruna Billlie (Hangul: 빌리; terkadang digayakan sebagai Billlǃə) adalah grup vokal wanita asal Korea Selatan yang dibentuk oleh Mystic Story pada tahun 2021. Grup ini pada awalnya terdiri dari enam orang anggota: Moon Sua, Suhyeon, Haram, Tsuki, Siyoon dan Haruna. Anggo...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (أبريل 2020) هذه قائمة رؤساء تونس حسب العمر. الجدول الأول يرسم عمر كل رئيس تونسي في وقت تنصيبه الرئيس (التنصيب الأول إذا...

 

Jennifer Jason LeighLeigh di 2015 Comic-ConLahirJennifer Leigh Morrow5 Februari 1962 (umur 62)Hollywood, California, A.S.PekerjaanAktrisTahun aktif1971–sekarangSuami/istriNoah Baumbach ​ ​(m. 2005; c. 2013)​Anak1Orang tuaVic MorrowBarbara Turner Jennifer Jason Leigh (lahir 5 Februari 1962) adalah aktris Amerika Serikat. Leigh mengawali kariernya sebagai seorang remaja yang menjadi bintang tamu di beberapa acara televisi pada tahun 1...

 

Highway in Massachusetts Route 53Route 53 highlighted in redRoute informationMaintained by MassDOTLength22.138 mi[1] (35.628 km)Existed1963–presentMajor junctionsSouth end Route 3A in Kingston[1]Major intersections Route 14 in Pembroke Route 3 in Hanover North end Route 3A in Quincy LocationCountryUnited StatesStateMassachusettsCountiesPlymouth, Norfolk Highway system Massachusetts State Highway System Interstate US State ← Rout...

Piotr Feliks's Portrait Piotr Feliks (11 June 1883 in Bierówka near Jasło – 3 or 12 August 1941) was a Polish political, social and education activist. He was imprisoned and murdered during the Second World War at Auschwitz concentration camp. References Polish Biographical Dictionary Authority control databases International VIAF National Germany Poland This biographical article about a Polish politician is a stub. You can help Wikipedia by expanding it.vte This biographical article ...

 

Pour les articles homonymes, voir lunette. La grande lunette de l'Observatoire de Nice. Une lunette astronomique ou lunette de Kepler est un instrument d'optique composé de lentilles et permettant d'augmenter la luminosité et la taille apparente des objets du ciel lors de leur observation. Équipée d'un redresseur d'image, elle se comporte alors en lunette d'approche. Développée à partir de la fin du XVIe siècle, la lunette astronomique est utilisée à partir de 1609 pour faire ...

 

Questa voce sull'argomento aerei è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Grumman F11F TigerUn F11F-1 Tiger (BuNo 138614) appartenente al Naval Air Test Center presso la NAS Patuxent River, MarylandDescrizioneTipocaccia imbarcato Equipaggio1 Costruttore Grumman Data primo volo30 luglio 1954 Data entrata in servizio1956 Data ritiro dal servizio1961 (portaerei)1967 (addestramento)1969 (Blue Angels...

Vincent Kompany Kompany bermain untuk Belgia pada Piala Dunia FIFA 2018Informasi pribadiNama lengkap Vincent Jean Mpoy Kompany[1]Tanggal lahir 10 April 1986 (umur 38)Tempat lahir Uccle, Brussels, BelgiaTinggi 193 cm (6 ft 4 in)[2]Posisi bermain Bek tengahInformasi klubKlub saat ini Burnley (manajer)Karier junior2000–2003 AnderlechtKarier senior*Tahun Tim Tampil (Gol)2003–2006 Anderlecht 73 (6)2006–2008 Hamburger SV 29 (1)2008–2019 Manchester City 2...

 

Robert GravesMakam Robert Graves di Deià, Majorca, SpanyolNama penaRobert von Ranke GravesPekerjaannovelis, penyair, kritikus sastraKebangsaanInggris Robert Ranke Graves (24 Juli 1895 – 7 Desember 1985) adalah seorang novelis, kritikus sastra, dan penyair Inggris.[1] Beberapa karyanya selama masa hidupnya antara lain: 1915[2] A Boy in Church[2] A Child's Nightmare[2] A Dead Boche[2] A Pinch of Salt[2] A Slice of Wedding Ca...

 

You can help expand this article with text translated from the corresponding article in Russian. (May 2019) Click [show] for important translation instructions. Machine translation, like DeepL or Google Translate, is a useful starting point for translations, but translators must revise errors as necessary and confirm that the translation is accurate, rather than simply copy-pasting machine-translated text into the English Wikipedia. Do not translate text that appears unreliable or low-qu...

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: List of England national rugby union players – news · newspapers · books · scholar · JSTOR (April 2019) (Learn how and when to remove this message) List of England national rugby union players is a list of people who have played for the England national rugby ...

 

American college football season 2021 Texas State Bobcats footballConferenceSun Belt ConferenceDivisionWest DivisionRecord4–8 (3–5 Sun Belt)Head coachJake Spavital (3rd season)Offensive coordinatorJacob Peeler (2nd season)Offensive schemeAir raidDefensive coordinatorZac Spavital (3rd season)Base defense3–4Home stadiumBobcat StadiumSeasons← 20202022 → 2021 Sun Belt Conference football standings vte Conf Overall Team   W   L &#...

 

Lacrosse in CanadaA lacrosse game between Canada and the United States at the 2008 Men's Under-19 World Lacrosse ChampionshipsCountryCanadaGoverning bodyCanadian Lacrosse AssociationNational team(s) Men's field team Men's indoor team Women's national team First playedFirst documented in 1600sNational competitions Mann Cup Minto Cup Club competitions National Lacrosse League International competitions World Lacrosse Men's Championship World Lacrosse Women's Championship World Lacrosse Men's U...

Award presented to the winner of The Open Championship in golf from 1860 to 1870 Four-time Open championsWillie Park Sr. was the first Champion Golfer of the Year in 1860. He is wearing the Challenge Belt for winning the event.[a]Young Tom Morris wearing the Challenge Belt. After his third victory in the 1870 Open Championship, he was able to keep the belt in perpetuity.[b] The Challenge Belt was awarded to the winner of The Open Championship in golf from 1860 until 1870. It ...

 

Last King of Portugal from 1908 to 1910 This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (October 2011) (Learn how and when to remove this message) Manuel IIManuel II, c. 1909King of PortugalReign1 February 1908 – 5 October 1910Acclamation6 May 1908PredecessorCarlos ISuccessorMonarchy abolishedPrime Ministers See list João FrancoFrancisco Ferreira do A...

 

Chemical compound VCHSRIdentifiers IUPAC name 5-(4-chlorophenyl)- 3-[(E)-2-cyclohexylethenyl]-1-(2,4-dichlorophenyl)-4-methyl-1H-pyrazole ChemSpider21378331Chemical and physical dataFormulaC24H23Cl3N2Molar mass445.81 g·mol−13D model (JSmol)Interactive image SMILES C4CCCCC4C=Cc(c(C)c1-c(cc3)ccc3Cl)nn1-c2ccc(Cl)cc2Cl InChI InChI=1S/C24H23Cl3N2/c1-16-22(13-7-17-5-3-2-4-6-17)28-29(23-14-12-20(26)15-21(23)27)24(16)18-8-10-19(25)11-9-18/h7-15,17H,2-6H2,1H3/b13-7+Key:UMOLSRBHNLXWGD-NTUHNPAUS...

Sporting event delegationUnited States at the1972 Winter OlympicsFlag of the United StatesIOC codeUSANOCUnited States Olympic Committeein SapporoCompetitors103 (77 men, 26 women) in 10 sportsFlag bearerDianne Holum (speed skating)MedalsRanked 5th Gold 3 Silver 2 Bronze 3 Total 8 Winter Olympics appearances (overview)192419281932193619481952195619601964196819721976198019841988199219941998200220062010201420182022 The United States competed at the 1972 Winter Olympics in Sapporo, Japan. Med...

 

British philosopher Stephen NealeNeale in 2007Born(1958-01-09)9 January 1958EnglandAlma materUniversity College London (BA)Stanford University (PhD)EraContemporary philosophyRegionWestern philosophySchoolAnalytic philosophyMain interestsPhilosophy of language Stephen Roy Albert Neale (born 9 January 1958) is a British philosopher and specialist in the philosophy of language who has written extensively about meaning, information, interpretation, and communication, and more generally about...