Linguistik korpus

Linguistik korpus (bahasa Inggris: corpus linguistics) adalah sebuah bidang yang fokus pada prosedur atau metode untuk mempelajari atau meneliti bahasa.[1]

Definisi linguistik korpus yaitu bidang yang mempelajari bahasa melalui metode dan prosedur tertentu.

Metode linguistik ini menggunakan data dari bahan-bahan bahasa yang terkumpul dalam suatu sumber yang disebut korpus (jamak: korpora) yang berasal dari penggunaan bahasa dalam berbagai genre, ragam, dan bahan lisan maupun tertulis yang menjamin keragaman yang seluas-luasnya dan menghindari penggunaan bahasa yang sangat sempit seperti idiolek. Data-data tersebut disusun secara sistematis dan mudah diakses secara elektronis melalui komputer.

Metode ini digunakan dalam linguistik deskriptif maupun linguistik terapan, seperti penyusunan kamus, untuk menjamin bahwa data yang digunakan benar-benar berasal dari penggunaan yang luas dan terhindar dari penggunaan subjektif. Selain itu, korpus dapat membantu menyediakan, mengumpulkan, dan mengatur data linguistik untuk tujuan penelitian dan akademis lainnya, termasuk pedagogi.[2]

Sejarah dan perkembangan

Dalam sejarah kajian linguistik, istilah korpus sudah ada sebelum tahun 1950-an. Pada awal kemunculannya, korpus digunakan oleh beberapa ahli bahasa dalam metodologi penelitian linguistik dengan mengumpulkan data bahasa sebanyak-banyaknya untuk mendukung teori-teori mereka. Para leksikografer atau penyusun kamus telah mengoleksi sampel-sampel penggunaan bahasa untuk mendefinisikan sebuah kata secara akurat setidaknya sejak akhir abad ke-19. Sebelum adanya komputer, sampel-sampel ini dikumpulkan pada secarik kertas kecil dan disusun dalam sangkar merpati.[3] Meski dalam perkembangannya, korpus kembali memiliki daya tarik setelah penggunaan komputer modern dalam pengelolaannya sejak tahun 1980-an.[1]

Istilah korpus dalam linguistik korpus modern selalu dikaitkan dengan korpus berbasis komputer yang memberikan keleluasaan pada peneliti untuk mencari kata atau ekspresi kebahasaan tertentu, menyusun korpus berdasarkan urutan tertentu, menemukan kata dalam konteks tertentu, dan menghitung frekuensi kemunculan kata tertentu dalam korpus secara cepat, akurat, dan dalam skala besar. Oleh karena itu, korpus di era modern lebih ditekankan pada bentuknya yang elektronis dan unsur keterbacaannya pada mesin.[4]

Selain itu, penggunaan komputer modern juga meningkatkan jumlah dan memperluas jangkauan korpus. Jika sebelumnya jumlah korpus terbatas oleh keterbatasan manusia dalam mengoleksi dan mengelola korpus, maka dengan adanya komputer memungkinkan korpus tersedia dalam jumlah yang sangat besar dan dapat diakses dengan mudah.[4]

Saat ini di Indonesia sudah muncul beberapa aplikasi yang dapat membantu analisis korpus, seperti Korpus Indonesia dan Korpus Nusantara yang dikembangkan oleh Fakultas Bahasa dan Seni Universitas Negeri Padang. Korpus Indonesia (KOIN) adalah bagian dari program pengembangan korpus dari Badan Pengembangan dan Pembinaan Bahasa, Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi. Sementara, Korpus Nusantara (Kortara) dikembangkan oleh Prof. Dr. Ermanto, S.Pd., M.Hum., dkk.

Metode

Tognini (2001) menyatakan dua pendekatan linguistik korpus, yaitu berbasis korpus (corpus-based) dan dikendalikan korpus (corpus-driven). Keduanya memiliki perbedaan dalam memandang korpus sebagai bukti yang dapat mendukung teori. Pendekatan yang berbasis korpus bersifat deduktif, sedangkan pendekatan yang dikendalikan korpus bersifat induktif, yakni menganggap korpus sebagai bukti yang harus menjadi acuan teori.

Cara menganalisis data korpus dapat dimulai dari metadata, penanda teks, dan anotasi.

  • Metadata, yaitu memberi informasi tentang siapa yang memproduksi teks, kapan, dan penggunaan bahasa dalam teks.
  • Penanda teks atau textual markup, meliputi tanda yang digunakan dalam penulisan teks, seperti tipologi (misalnya cetak miring).
  • Anotasi, yaitu memberi informasi mengenai fitur linguistik data bahasa tersebut, seperti penambahan kelas kata. Misalnya verba, nomina, adjektiva, atau adverbia.

Hal penting lain dalam linguistik korpus adalah tersedianya alat yang memungkinkan untuk mencari korpus dalam format baris secara vertikal atau biasa disebut konkordansi. Alat berupa perangkat lunak komputer yang digunakan untuk melakukan korkodansi berkembang dari generasi ke generasi hingga generasi keempat yang kini berbasis web.

Perhitungan statistik yang dapat digunakan untuk mengolah data linguistik korpus meliputi statistik deskriptif dan tes signifikansi untuk menguji seberapa mungkin hasil tertentu merupakan sebuah kebetulan, misalnya dalam menghitung kata kunci dan kolokasi.[5]

Pendekatan

Pendekatan korpus terdiri dari 4 (empat) karakteristik utama:[3]

  1. Empiris, yaitu analisis berdasarkan pola-pola penggunaan yang aktual; Korpora terdiri atas segala tindak komunikasi, seperti kumpulan teks buku, fiksi, nonfiksi, majalah, paper, karya sastra, koran, percakapan di telepon, percakapan di ponsel, rapat, kuliah, siaran radio, dan tayangan televisi. Dengan kata lain, situasi apapun dalam konteks linguistik dapat berbentuk korpus.
  2. Menggunakan koleksi teks yang besar dan terstruktur sebagai dasar analisis; Karakteristik ini mengacu pada korpus itu sendiri yang dapat berbentuk korpus tulis, korpus lisan, dan lain-lain.
  3. Memanfaatkan penggunaan teknologi dalam analisis; Penggunaan teknologi dalam konteks ini tidak hanya berperan untuk menyimpan korpora saja, tetapi juga membantu menganalisis bahasa dalam sebuah korpus. Korpus diakses dan dianalisis oleh program korkodansi yang ada dalam komputer.
  4. Menggunakan teknik analisis kuantitatif dan kualitatif; Hasil kuantitatif yang dihasilkan dari korpus nantinya akan dianalisis secara kualitatif untuk menemukan simpulan penelitian.

Referensi

  1. ^ a b McEnery, Tony; Wilson, Andrew (1996). Corpus Linguistics (dalam bahasa Inggris). Edinburgh University Press. ISBN 978-0-7486-0482-1. 
  2. ^ Sari, Faizah (2013). "Bagaimana Teknologi dapat Membantu Metodologi" (PDF). Masyarakat Linguistik Indonesia. 31 (1): 107–110. 
  3. ^ a b Bennett, Gena R. (2010). Using Corpora in the Language Learning Classroom: Corpus Linguistics for Teachers (PDF). Michigan: Michigan ELT. 
  4. ^ a b Suhardijanto, Totok dan Arawinda Dinakaramani (2018). "Korpus Beranotasi: ke Arah Pengembangan Korpus Bahasa-bahasa di Indonesia" (PDF). Kongres Bahasa Indonesia. 
  5. ^ Waskita, Dana (2017). "Resensi Corpus Linguistics: Method, Theory and Practice" (PDF). Sosioteknologi. 16 (1): 145–147. 


Lihat pula

Read other articles:

SiaSia tahun 2006LahirSia Kate Isobelle Furler18 Desember 1975 (umur 48)Adelaide, Australia Selatan, AustraliaPekerjaanPenyanyipenulis lagusutradaraSuami/istri Erik Anders Lang ​ ​(m. 2014; c. 2016)​ Dan Bernad ​(m. 2023)​ Anak2Karier musikGenrePopelektronika[1]LabelDance PoolGo! BeatInertiaRCAMonkey PuzzleAtlanticSitus websiamusic.net Sia Kate Isobelle Furler (/ˈsiːə/ SEE-ə; lahir 18 Desember 1975)...

 

Golden Memories AsiaMusim 1Penayangan2 September 2019 - 17 Oktober 2019Juri Berlian Hutauruk Dewi Yull Harvey Malaiholo Roy Rauzan Indra Ismail Mansoor Mohammed Shahrizan Masri Jett Pangan Zeca Smith Pembawa acara Ramzi Gilang Dirga Irfan Hakim Uyaina Arshad Jirayut Afisan Zizi Kirana Indra Bekti SaluranIndosiarPeserta24Lokasi finalStudio 5 IndosiarPemenangJoy Tobing Senandungkan KenanganmuJuara duaLucky Octavian Kronologi  2019 ► Golden Memories Asia adalah suatu ajang pencarian bakat...

 

2013 studio album by Tedeschi Trucks BandMade Up MindStudio album by Tedeschi Trucks BandReleasedAugust 20, 2013 (2013-08-20)StudioSwamp Raga Studios (Jacksonville, Florida)Genre Rock R&B soul Length53:14LabelMasterworksProducer Jim Scott Derek Trucks Tedeschi Trucks Band chronology Everybody's Talkin'(2012) Made Up Mind(2013) Let Me Get By(2016) Professional ratingsAggregate scoresSourceRatingMetacritic76/100[1]Review scoresSourceRatingAmerican Songwriter&#...

Converted passenger jet Caesar's Chariot Caesar's Chariot showing Led Zeppelin's Swan Song Records logo on the tailfin Type Boeing 720 Manufacturer Boeing Construction number 18077 Manufactured December 12, 1961 Registration N7224U First flight January 16, 1962 Owners and operators United Airlines Caesars Palace Hotel and CasinoLed Zeppelin Fate Dismantled for parts[1] Caesar's Chariot was a former United Airlines Boeing 720 passenger jet which was chartered by English rock band Led Z...

 

American peer-to-peer car rental company Turo Inc.FormerlyRelayRides (2010–2015)Company typePrivateIndustryCar sharingFoundedJune 2010; 13 years ago (2010-06)Boston, Massachusetts, U.S.FounderShelby ClarkHeadquartersSan Francisco, California, U.S.Area servedUnited States, Australia, France, Canada, and the United Kingdom. [1] [2]Key peopleAndre Haddad (CEO)Revenue US$469 million (2021)[3]OwnerIAC Inc. (27%)[4]Number of employees1300 (20...

 

Coupe des confédérations 2003 Généralités Sport Football Organisateur(s) FIFA Éditions 6e Lieu(x) France Date Du 18 juin 2003 au 29 juin 2003 Participants 8 Épreuves 16 matchs disputés Affluence 491 700 (30 731 par match) Palmarès Tenant du titre France (1) Vainqueur France (2) Finaliste Cameroun Troisième Turquie Buts 37 buts (2,31 par match) Meilleur joueur Thierry Henry Meilleur(s) buteur(s) Thierry Henry (4) Navigation Corée du Sud - Japon 2001 Allemagne 2005 modifie...

Town in Chūbu, JapanTarui 垂井町TownClockwise from top: Shigekado Takenaka's Jinya, Nangu Taisha, Tairyo Shrine, Site of Morichika Chosokabe's Jinya, Mineral Spring in Tarui, Picture of Tarui Traditional Inn in Edo Period FlagSealLocation of Tarui in Gifu PrefectureTarui Coordinates: 35°22′12.9″N 136°32′37.4″E / 35.370250°N 136.543722°E / 35.370250; 136.543722CountryJapanRegionChūbuPrefectureGifuDistrictFuwaGovernment • MayorMitsuya N...

 

American gangster (1900–1954) Machine Gun KellyMugshot of KellyBornGeorge Kelly Barnes(1900-07-17)July 17, 1900Cleveland, Ohio, U.S.DiedJuly 18, 1954(1954-07-18) (aged 54)USP Leavenworth, Leavenworth, Kansas, U.S.Other namesPop Gun KellyEducationMississippi A&M (now Mississippi State University)Occupation(s)Gangster, bootlegger, kidnapper, businessmanSpouses Geneva Ramsey ​ ​(m. 1916; div. 1926)​ Kathryn Kelly ​ ​...

 

Questa voce sull'argomento calciatori peruviani è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Damián Ísmodes Nazionalità  Perù Altezza 179 cm Peso 75 kg Calcio Ruolo Centrocampista Squadra  Cienciano Carriera Squadre di club1 2006-2007 Sporting Cristal44 (4)2008 Racing Santander1 (0)2009→  Eibar3 (0)2009-2010→  Sporting Cristal35 (4)2011→  Universitario15 ...

Ski resort in Southern California For the ski area in British Columbia, Canada, see Mount Baldy Ski Area. Mt Baldy Ski LiftsJanuary 2007Mt. BaldyLocation in the United StatesShow map of the United StatesMt. BaldyLocation in CaliforniaShow map of CaliforniaLocationMount San Antonio and Telegraph Peak,California, U.S.Nearest major cityMt. Baldy,Los Angeles - 45 mi (72 km)Coordinates34°16′N 117°37′W / 34.27°N 117.62°W / 34.27; -117.62Vertical2,100 f...

 

Species of fly Platycheirus coerulescens Platycheirus_coerulescens.png map Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Arthropoda Class: Insecta Order: Diptera Family: Syrphidae Genus: Platycheirus Species: P. coerulescens Binomial name Platycheirus coerulescens(Williston, 1887) Range map 2023 Synonyms[1] Melanostoma coerulescens Williston, 1887 Platycheirus coerulescens, the Hooked Sedgesitter, is a species of syrphid fly in the family Syrphidae.[1&...

 

此條目可能包含不适用或被曲解的引用资料,部分内容的准确性无法被证實。 (2023年1月5日)请协助校核其中的错误以改善这篇条目。详情请参见条目的讨论页。 各国相关 主題列表 索引 国内生产总值 石油储量 国防预算 武装部队(军事) 官方语言 人口統計 人口密度 生育率 出生率 死亡率 自杀率 谋杀率 失业率 储蓄率 识字率 出口额 进口额 煤产量 发电量 监禁率 死刑 国债 ...

البحار الصنف دراما - رومانسي الموضوع تقوم فاطمة بِرَهْن مصوغاتها لمساعدة زوجها البحار الفقير والكثير السفر، وتقع في مكائد تدبرها صديقتها. تاريخ الصدور 19 سبتمبر 1935  مدة العرض 105 دقيقة البلد المملكة المصرية  اللغة الأصلية العربية (العامية المصرية) الطاقم المخرج توجو مز...

 

1848 revolver by Samuel Colt Colt Dragoon Revolver Third Model Dragoon, U.S. Cavalry issuedTypeRevolverPlace of originUnited StatesService historyIn service1848–1865Used byUnited StatesWarsAmerican Indian Wars, American Civil WarProduction historyDesignerSamuel ColtDesigned1848–1850ManufacturerColt FirearmsProduced1848–1860No. builtAbout 18,500 in U.S.A.VariantsWalker Transitions, First and Second ModelsSpecificationsMass4 pounds 4 ounces (1.9 kg)...

 

British credit card brand, 1972–1996 This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Access credit card – news · newspapers · books · scholar · JSTOR (March 2018) (Learn how and when to remove this message) AccessAccess credit card logoLocationUnited Kingdom and IrelandLaunched23 October 1972Technolog...

La Alianza para la Investigación en Políticas y Sistemas de Salud es una colaboración internacional con sede en Suiza, establecida por la Organización Mundial de la Salud. Desde su creación en 1999, el objetivo de la Alianza ha sido promover la generación y el uso de la política de salud y los sistemas de investigación como un medio para mejorar los sistemas de salud de los países de bajos y medianos ingresos.[1]​ Véase también Organización Mundial de la Salud Organización...

 

Voce principale: Eccellenza 2015-2016. Eccellenza Veneto 2015-2016 Competizione Eccellenza Sport Calcio Edizione 25ª Organizzatore FIGC - LNDComitato Regionale Veneto Luogo  Italia Partecipanti 32 Formula 2 gironi all'italiana con play-off e play-out. Risultati Promozioni AdriesePievigina Retrocessioni San Martino SpemeAzzurra SandrigoBonollo MestrinoGodigeseVittorio SMCFeltreseprealpi Cronologia della competizione 2014-2015 2016-2017 Manuale Il campionato italiano di calcio ...

 

Sean HannityHannity in 2016LahirSean Patrick Hannity[1]30 Desember 1961 (umur 62)New York City, New York, ASTempat tinggalCentre Island, New York, AS[2]KebangsaanAmerika SerikatPendidikanNew York UniversityUC Santa BarbaraAdelphi University(no degrees awarded)PekerjaanPenyiar radio, pemandu acara televisi, komentator politik, penulisTempat kerjaPremiere Networks, Fox News ChannelDikenal atasKomentar politik konservatif[3]Partai politikKonservatifSuami/istriJill R...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (نوفمبر 2019) الرابطة الجزائرية المحترفة الأولى 1987-1988 تفاصيل الموسم الرابطة الجزائرية المحترفة الأولى  البلد الجزا...

 

Television channel SRF infoCountrySwitzerlandProgrammingPicture format576i (16:9 SDTV)720p (16:9)OwnershipOwnerSchweizer Radio und FernsehenSister channelsSRF 1SRF zweiHistoryLaunched3 May 1999 (experimental)17 January 2001 (main launch)Former namesSFi (1999–2005) SF Replay SF info (2005–2012)LinksWebsitewww.srf.ch/tvAvailabilityTerrestrialDTTDVB-T(only for German-speaking Switzerland; ceased on 3 June 2019) SRF info is a German-language Swiss television channel owned by Schweizer Radio ...