Terjemahan mesin saraf

Terjemahan mesin saraf (NMT) adalah pendekatan penerjemahan mesin yang menggunakan jaringan saraf tiruan untuk memprediksi kemungkinan urutan kata, biasanya memodelkan dan kemudian menerjemahkan seluruh kalimat dalam satu model yang terintegrasi.

Properti

Sistem NMT hanya membutuhkan sebagian kecil dari memori yang dibutuhkan oleh model terjemahan mesin statistik (SMT) tradisional. Selain itu, tidak seperti sistem penerjemahan konvensional, semua bagian dari model penerjemahan neural dilatih secara bersama-sama (end-to-end) untuk memaksimalkan kinerja penerjemahan.[1][2][3]

Sejarah

Makalah ilmiah pertama tentang penggunaan jaringan saraf dalam penerjemahan mesin muncul pada tahun 2014 ketika Bahdanau et al.[R 1] and Sutskever et al.[R 2] mengusulkan model penerjemahan jaringan saraf tiruan ujung ke ujung dan secara resmi menggunakan frasa "penerjemahan mesin saraf" dalam penelitian mereka. Sistem NMT berskala besar pertama diluncurkan oleh Baidu pada tahun 2015. Tahun berikutnya Google dan organisasi lain meluncurkan berbagai sistem NMT.[4] Sistem ini diikuti oleh kemajuan substansial pada tahun-tahun berikutnya. Kemajuan ini meliputi: NMT kosakata besar, aplikasi untuk teks gambar, NMT subkata, NMT multibahasa, NMT multisumber, NMT tingkat karakter, NMT tanpa sumber daya, dan NMT tanpa pemotretan. Pada tahun 2015, untuk pertama kalinya sistem NMT tampil dalam dua kompetisi penerjemahan mesin publik (OpenMT'15 dan WMT'15). Tahun berikutnya, 90% pemenang di WMT adalah sistem NMT.[5]

Sejak 2017, Kantor Paten Eropa telah menggunakan terjemahan mesin saraf untuk membuat informasi dari sistem paten global dapat diakses secara instan.[6] Sistem yang dikembangkan bekerja sama dengan Google ini dipasangkan dengan 31 bahasa, dan pada tahun 2018, sistem ini telah menerjemahkan lebih dari sembilan juta dokumen.[6]

Cara kerja

Sistem NMT menggunakan pembelajaran mendalam dan pembelajaran representasi dan berangkat dari pendekatan terjemahan mesin statistik berbasis frasa yang menggunakan subkomponen yang direkayasa secara terpisah dengan mempertimbangkan keseluruhan kalimat.[7] Penerjemahan mesin saraf (NMT) mirip dengan apa yang telah dilakukan secara tradisional dalam penerjemahan mesin statistik (SMT). Perbedaan utama antara NMT dan SMT adalah penggunaan representasi vektor ("penyematan" dan "representasi ruang lanjutan") untuk kata dan status internal. Struktur model dalam sistem NMT lebih sederhana daripada model berbasis frasa. Tidak ada model bahasa, model terjemahan, dan model pengurutan ulang yang terpisah, tetapi hanya satu model urutan yang memprediksi satu kata dalam satu waktu. Namun, prediksi urutan ini dikondisikan pada seluruh kalimat sumber dan urutan target yang sudah diproduksi.

Pemodelan urutan kata dalam sistem NMT, pada awalnya, biasanya dilakukan dengan menggunakan jaringan syaraf tiruan berulang (RNN). Sebuah jaringan saraf tiruan dua arah, yang dikenal sebagai encoder, digunakan oleh jaringan saraf untuk mengkodekan kalimat sumber untuk RNN kedua, yang dikenal sebagai decoder, yang digunakan untuk memprediksi kata-kata dalam bahasa target (terjemahan).[8] RNN kesulitan untuk mengkodekan input yang panjang ke dalam satu vektor. Hal ini dapat diatasi dengan menggunakan mekanisme perhatian[9] yang memungkinkan decoder untuk fokus pada bagian input yang berbeda saat menghasilkan setiap kata. Model Cakupan lebih lanjut menangani masalah dalam mekanisme perhatian ini, seperti mengabaikan informasi penyelarasan sebelumnya yang menyebabkan terjemahan berlebih dan terjemahan kurang.[10]

Convolutional Neural Networks (CNN), pada prinsipnya, agak lebih baik untuk sekuens yang panjang dan berkesinambungan, tetapi pada awalnya tidak digunakan karena beberapa kelemahan, tetapi banyak di antaranya telah diatasi dengan pengembangan "mekanisme perhatian".[11]

Sistem Transformer[12], yang merupakan model berbasis perhatian, tetap menjadi arsitektur yang dominan untuk beberapa pasangan bahasa.[13] Lapisan perhatian diri dari model Transformer mempelajari ketergantungan antara kata-kata dalam sebuah urutan dengan memeriksa hubungan antara semua kata dalam urutan berpasangan dan dengan secara langsung memodelkan hubungan tersebut. Ini adalah pendekatan yang lebih sederhana daripada mekanisme gating yang digunakan RNN. Dan kesederhanaannya telah memungkinkan para peneliti untuk mengembangkan model penerjemahan berkualitas tinggi dengan model Transformer, bahkan dalam pengaturan sumber daya yang rendah.[14]

Penerapan

Salah satu aplikasi untuk NMT adalah terjemahan mesin dengan sumber daya rendah, ketika hanya sedikit data dan contoh yang tersedia untuk pelatihan. Salah satu kasus penggunaan tersebut adalah bahasa-bahasa kuno seperti Akkadia dan dialek-dialeknya, Babilonia dan Asyur.[15]

Catatan

  1. ^ Bahdanau D, Cho K, Bengio Y. Neural machine translation by jointly learning to align and translate. In: Proceedings of the 3rd International Conference on Learning Representations; 2015 May 7–9; San Diego, USA; 2015.
  2. ^ Sutskever I, Vinyals O, Le QV. Sequence to sequence learning with neural networks. In: Proceedings of the 27th International Conference on Neural Information Processing Systems; 2014 Dec 8–13; Montreal, QC, Canada; 2014.

Referensi

  1. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama KalchbrennerBlunsom
  2. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama sequence
  3. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama Properties
  4. ^ Haifeng Wang, Hua Wu, Zhongjun He, Liang Huang, Kenneth Ward Church Progress in Machine Translation // Engineering (2021), doi: https://doi.org/10.1016/j.eng.2021.03.023
  5. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama WMT16
  6. ^ a b Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama vid
  7. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama Medical
  8. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama align&translate
  9. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama attention
  10. ^ Tu, Zhaopeng; Lu, Zhengdong; Liu, Yang; Liu, Xiaohua; Li, Hang (2016). "Modeling Coverage for Neural Machine Translation". arΧiv:1601.04811 [cs.CL]. 
  11. ^ Kesalahan pengutipan: Tag <ref> tidak sah; tidak ditemukan teks untuk ref bernama DeepL
  12. ^ Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; Uszkoreit, Jakob; Jones, Llion; Gomez, Aidan N.; Kaiser, Lukasz; Polosukhin, Illia (2017-12-05). "Attention Is All You Need". arΧiv:1706.03762 [cs.CL]. ,
  13. ^ Barrault, Loïc; Bojar, Ondřej; Costa-jussà, Marta R.; Federmann, Christian; Fishel, Mark; Graham, Yvette; Haddow, Barry; Huck, Matthias; Koehn, Philipp; Malmasi, Shervin; Monz, Christof (August 2019). "Findings of the 2019 Conference on Machine Translation (WMT19)". Proceedings of the Fourth Conference on Machine Translation (Volume 2: Shared Task Papers, Day 1). Florence, Italy: Association for Computational Linguistics: 1–61. doi:10.18653/v1/W19-5301alt=Dapat diakses gratis. 
  14. ^ Wdowiak, Eryk (2021-09-27). "Sicilian Translator: A Recipe for Low-Resource NMT". arΧiv:2110.01938 [cs.CL]. 
  15. ^ Gutherz, Gai; Gordin, Shai; Sáenz, Luis; Levy, Omer; Berant, Jonathan (2023-05-02). Kearns, Michael, ed. "Translating Akkadian to English with neural machine translation". PNAS Nexus (dalam bahasa Inggris). 2 (5). doi:10.1093/pnasnexus/pgad096. ISSN 2752-6542. PMC 10153418alt=Dapat diakses gratis Periksa nilai |pmc= (bantuan). PMID 37143863 Periksa nilai |pmid= (bantuan). 

Read other articles:

AndalasKelurahanMasjid Raya AndalasNegara IndonesiaProvinsiSumatera BaratKotaPadangKecamatanPadang TimurKode Kemendagri13.71.02.1007 Kode BPS1371050032 Luas-Jumlah penduduk-Kepadatan- Andalas adalah salah satu kelurahan di Kecamatan Padang Timur, Padang, Sumatera Barat, Indonesia. Kelurahan Andalas merupakan penggabungan dari 2 Kelurahan Lama, yaitu Kelurahan Andalas Barat dan Kelurahan Andalas Timur. Jalan Utama di Kelurahan ini adalah Jalan Raya Andalas yang merupakan Jalan Utama pengh...

 

Bolivian news agency This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Agencia de Noticias Fides – news · newspapers · books · scholar · JSTOR (May 2022) (Le...

 

Septième croisade Saint Louis s’embarquant à Aigues-Mortes pour la septième croisade. Miniature extraite du Vie et miracles de Saint Louis (1320) de Guillaume de Saint-Pathus. Informations générales Date 1248-1254 Lieu Égypte et Palestine Casus belli Reprise de Jérusalem par les Égyptiens (1244) Issue Victoire ayyoubide Belligérants Croisés : Royaume de France Poitou Anjou Artois Flandre Bourgogne Champagne Toulouse et Provence Bretagne Bourbonnais Narbonne petits comtés et...

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article may need to be rewritten to comply with Wikipedia's quality standards. You can help. The talk page may contain suggestions. (April 2023) This article is in list format but may read better as prose. You can help by converting this article, if appropriate. Editing help is available. (April 2023) (Learn how and when to remove this ...

 

« Colonial » redirige ici. Pour le sens relatif au colonialisme français, voir Colonial (France). Tous les pays qui ont été colonisés, envahis ou sous influence française (durant différentes périodes, pas forcément toutes en même temps). Le colonialisme est une doctrine ou une idéologie justifiant la colonisation entendue comme l'extension de la souveraineté d'un État sur des territoires situés en dehors de ses frontières nationales[1],[2]. La notion intellectuelle ...

 

Al-Qadisiyya ClubCalcio Segni distintiviUniformi di gara Casa Trasferta Colori sociali Giallo, rosso Simbolicavaliere Dati societariCittàKhobar Nazione Arabia Saudita ConfederazioneAFC Federazione SAFF CampionatoPrima Divisione Fondazione1967 Proprietario Saudi Aramco Presidente Ahmed Ghodran Allenatore Míchel StadioPrincipe Saud bin Jalawi(20.000 posti) PalmarèsTitoli nazionali2 campionati sauditi Trofei nazionali1 Coppa Principe Faysal bin Fahd1 Coppa del Principe della Corona saudi...

Азиатский барсук Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:СинапсидыКласс:Мле�...

 

此條目可参照英語維基百科相應條目来扩充。 (2021年5月6日)若您熟悉来源语言和主题,请协助参考外语维基百科扩充条目。请勿直接提交机械翻译,也不要翻译不可靠、低品质内容。依版权协议,译文需在编辑摘要注明来源,或于讨论页顶部标记{{Translated page}}标签。 约翰斯顿环礁Kalama Atoll 美國本土外小島嶼 Johnston Atoll 旗幟颂歌:《星條旗》The Star-Spangled Banner約翰斯頓環礁�...

 

English footballer David Ball Ball playing for Peterborough United in 2012Personal informationFull name David Michael Ball[1]Date of birth (1989-12-14) 14 December 1989 (age 34)Place of birth Whitefield, Greater Manchester, EnglandHeight 6 ft 0 in (1.83 m)[2]Position(s) StrikerTeam informationCurrent team Wellington PhoenixNumber 10Youth career199?–1997 Prestwich Marauders1997–2009 Manchester CitySenior career*Years Team Apps (Gls)2009–2011 Manchester...

American college basketball season 1991–92 Ohio State Buckeyes men's basketballBig Ten regular season championsNCAA men's Division I tournament, Elite EightConferenceBig TenRankingCoachesNo. 3APNo. 3Record26–6 (15–3 Big Ten)Head coachRandy Ayers (3rd season)Home arenaSt. John ArenaSeasons← 1990–911992–93 → 1991–92 Big Ten Conference men's basketball standings vte Conf Overall Team W   L   PCT W   L   PCT No. 3 Ohio Stat...

 

Chinameca Localidad ChinamecaLocalización de Chinameca en México ChinamecaLocalización de Chinameca en MorelosCoordenadas 18°37′14″N 98°59′46″O / 18.620555555556, -98.996111111111Entidad Localidad • País México • Estado Morelos • Municipio AyalaAltitud   • Media 1043 m s. n. m.Población (2020)   • Total 3149 hab.[1]​Huso horario Tiempo del Centro (UTC -6) • en verano UTC -5Código INEGI 1700400...

 

Ambassador-at-Large of the United States for Global Criminal JusticeSeal of the United States Department of StateIncumbentBeth Van Schaacksince March 17, 2022Reports toUnder Secretary of State for Civilian Security, Democracy, and Human RightsNominatorPresident of the United StatesFormation1997First holderDavid Scheffer The United States Ambassador-at-Large for Global Criminal Justice is the head of the Office of Global Criminal Justice in the United States Department of State. The ambas...

Postal codes in Vietnam have five digits.[1] The exact postal code designated for local government areas, local post offices, government offices or embassies and consulates can be searched on National Postal Code Website.Regional and provincial postal codes of Viet Nam Structure The postal code system of Vietnam has officially been changed from 6 digits to 5 digits. Each country has its own separate postal code or zip code system. The postal code of Vietnam is composed of 5 digits, w...

 

Aéroport international de San DiegoSan Diego International Airport Vue du terminal 2 de l'aéroport international de San Diego. Localisation Pays États-Unis Ville San Diego (Californie) Coordonnées 32° 44′ 02″ nord, 117° 11′ 23″ ouest Altitude 5 m (17 ft) Informations aéronautiques Code IATA SAN Code OACI KSAN Code FAA SAN Type d'aéroport public Gestionnaire Autorité aéroportuaire de San Diego Pistes Direction Longueur Surface 09/27 2 865 m...

 

Location of Vosges in France Following is a list of senators of Vosges, people who have represented the department of Vosges in the Senate of France. Third Republic Senators for Vosges under the French Third Republic were:[1] Nicolas Claude (1876–1888) Claude Claudot (1876–1879) Eustache Georges (1876–1891) Christian Kiener (1882–1896) Charles Ferry (1888–1891) Jules Ferry (1891–1893) Alfred Brugnot (1891–1903) Albert Ferry en 1893) Paul Frogier de Ponlevoy (1894–1909...

  提示:此条目页的主题不是秦国。 泰王国ราชอาณาจักรไทย(泰語)Ratcha-anachak Thai 国旗 国徽 国歌:《国歌》เพลงชาติ Phleng Chat皇室颂歌:《颂圣歌》สรรเสริญพระบารมี Sansoen Phra Barami泰国的位置(绿色)东盟(深灰色)  —  [圖例放大]首都暨最大城市曼谷13°45′N 100°29′E / 13.750°N 100.483°E / 1...

 

Jonathan PanzoNazionalità Inghilterra Altezza185 cm Calcio RuoloDifensore Squadra Standard Liegi CarrieraGiovanili 2010-2018 Chelsea Squadre di club1 2018-2019 Monaco 222 (1)2019 Monaco2 (0)2019-2020→  Cercle Bruges14 (0)2020-2022 Digione22 (0)2022 Nottingham Forest1 (0)2022-2023→  Coventry City29 (1)[1]2023-2024→  Cardiff City4 (0)2024-→  Standard Liegi0 (0) Nazionale 2015-2016 Inghilterra U-1611 (0)2016-2017 Inghilterra...

 

Der Titel dieses Artikels ist mehrdeutig. Weitere Bedeutungen sind unter Österreich (Begriffsklärung) aufgeführt. Republik Österreich Flagge Wappen Lage Österreichs in der Europäischen Union Lage Österreichs in der Europäischen Union Amtssprache Deutsch[1][2]– regionale Amtssprachen:Kroatisch, Slowenisch, Ungarisch– anerkannte Minderheitssprachen:u. a. österreichische Gebärdensprache, Romani Hauptstadt Wien Staats- und Regierungsform semipräsidentiell-parl...

Pour les articles homonymes, voir Fantin et Latour. Henri Fantin-LatourAutoportrait (1861),Washington, National Gallery of Art.BiographieNaissance 25 janvier 1836Grenoble (Isère, France)Décès 25 août 1904 (à 68 ans)Buré (Orne, France)Sépulture Cimetière du MontparnasseNom de naissance Ignace Henri Jean Théodore Fantin-LatourPseudonyme Fantin-Latour, Ignace Henri Jean TheodoreNationalité France FrançaiseFormation Petite école de dessin de ParisActivité Peintre, lithographeP�...

 

Questa voce sull'argomento calciatori turchi è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Oğuz YılmazNazionalità Turchia Altezza190 cm Peso82 kg Calcio RuoloDifensore Squadra Kastamonuspor 1966 CarrieraGiovanili 2003-2010 Kartal Cevizli Gençlergücü2010-2011 Pendikspor Squadre di club1 2011-2016 Pendikspor111 (3)2016-2019 Balıkesirspor61 (3)2019-2023 Denizlispor10...