28 April 2006; 19 tahun lalu (2006-04-28) (Sebagai mesin terjemahan statistik)15 November 2016; 8 tahun lalu (2016-11-15) (sebagai mesin terjemahan neural)
Status
Aktif
Google Terjemahan (bahasa Inggris: Google Translate) adalah layanan penerjemahan statistik dan mesin neural multibahasa bahasa yang dikembangkan oleh Google, untuk menerjemahkan teks dan situs web dari satu bahasa ke bahasa lain. Google Terjemahan menawarkan antarmuka situs web, aplikasi seluler untuk Android dan iOS, dan antarmuka pemrograman aplikasi yang membantu pengembang membangun ekstensi peramban dan aplikasi perangkat lunak. Pada April 2020, Google Terjemahan menyediakan 109 bahasa di berbagai tingkatan dan hingga April 2016, mengklaim lebih dari 500 juta total pengguna, dengan lebih dari 100 miliar kata diterjemahkan setiap hari.[1]
Diluncurkan pada April 2006 sebagai layanan mesin terjemahan statistik, layanan ini menggunakan dokumen dan transkrip PBB dan Parlemen Eropa untuk mengumpulkan data-data linguistik. Alih-alih menerjemahkan bahasa secara langsung, pertama-tama menerjemahkan teks ke bahasa Inggris dan kemudian berporos ke bahasa target di sebagian besar kombinasi bahasa yang ditempatkan di barisnya,[2] dengan beberapa pengecualian termasuk Catalan-Spanyol.[3] Selama terjemahan, layanan ini mencari pola dalam jutaan dokumen untuk membantu memutuskan kata mana yang akan dipilih dan bagaimana mengaturnya dalam bahasa target.
Sejarah
Google Translate adalah layanan terjemahan komplementer yang dikembangkan oleh Google pada bulan April 2006.[4] Layanan ini menerjemahkan berbagai bentuk teks dan media seperti kata, frasa, dan halaman web.
Awalnya Google Translate dirilis sebagai layanan terjemahan mesin statistik.[4] Menerjemahkan teks yang diperlukan ke dalam bahasa Inggris sebelum menerjemahkan ke dalam bahasa yang dipilih adalah langkah wajib yang harus diambil. Karena SMT menggunakan algoritma prediksi untuk menerjemahkan teks, ia memiliki akurasi tata bahasa yang buruk. Namun, Google pada awalnya tidak mempekerjakan para ahli untuk mengatasi keterbatasan ini karena sifat bahasa yang terus berkembang.
Pada Januari 2010, Google telah memperkenalkan aplikasi Android dan versi iOS pada Februari 2011 yang berfungsi sebagai penerjemah pribadi portabel.[4] Pada Februari 2010, itu diintegrasikan ke dalam peramban seperti Chrome dan dapat mengucapkan teks, secara otomatis mengenali kata-kata dalam gambar dan menemukan teks dan bahasa yang tidak dikenal.
Pada Mei 2014, Google mengakuisisi Word Lens untuk meningkatkan kualitas terjemahan visual dan suara.[5] Google Translate dapat memindai teks atau gambar denggan perangkat Anda dan menerjemahkannya secara instan. Selain itu, sistem secara otomatis mengidentifikasi bahasa asing dan menerjemahkan ucapan tanpa mengharuskan individu untuk mengetuk tombol mikrofon setiap kali terjemahan ucapan diperlukan.[5]
Pada November 2016, Google mengubah metode penerjemahannya ke sistem yang disebut terjemahan mesin saraf.[6] Sistem ini menggunakan teknik pembelajaran mendalam untuk menerjemahkan seluruh kalimat pada satu waktu, yang telah diukur agar lebih akurat antara bahasa Inggris dan Prancis, Jerman, Spanyol, dan Tionghoa.[7] Tidak ada hasil pengukuran yang disediakan oleh peneliti Google untuk GNMT dari bahasa Inggris ke bahasa lain, bahasa lain ke bahasa Inggris, atau antara pasangan bahasa yang tidak termasuk bahasa Inggris. Pada 2018, layanan ini menerjemahkan lebih dari 100 miliar kata sehari.[6]
Fungsi alat
Google Translate dapat menerjemahkan berbagai bentuk teks dan media, yang mencakup teks, ucapan, dan teks di dalam gambar diam atau gambar bergerak. Secara khusus, fungsinya meliputi:
Terjemahan Kata-kata Tertulis: suatu fungsi yang menerjemahkan kata-kata atau teks tertulis ke bahasa asing.[8]
Penerjemahan Situs Web: fungsi yang menerjemahkan seluruh halaman web ke bahasa yang dipilih.[9]
Penerjemahan Dokumen: fungsi yang menerjemahkan dokumen yang diunggah oleh pengguna ke bahasa yang dipilih. Dokumen-dokumen harus dalam bentuk: .doc, .docx, .odf, .pdf, .pptx, .ps, .rtf, .txt, .xls, .xlsx.[9]
Terjemahan Bicara: suatu fungsi yang secara instan menerjemahkan bahasa lisan ke dalam bahasa asing yang dipilih.[10]
Terjemahan Aplikasi Seluler: pada tahun 2018, Google Translate telah memperkenalkan fitur barunya yang disebut “Ketuk untuk Menerjemahkan,” yang membuat terjemahan instan dapat diakses di dalam aplikasi apa pun tanpa keluar atau mengubahnya.[11]
Penerjemahan Gambar: fungsi yang mengidentifikasi teks dalam gambar yang diambil oleh pengguna dan menerjemahkan teks di layar secara instan dengan gambar.[12]
Terjemahan Tulisan Tangan: suatu fungsi yang menerjemahkan bahasa yang ditulis tangan pada layar ponsel atau digambar pada keyboard virtual tanpa dukungan keyboard.[12]
Untuk sebagian besar fitur-fiturnya, Google Translate menyediakan pelafalan, kamus, dan mendengarkan terjemahan. Selain itu, Google Translate telah memperkenalkan aplikasi Translate-nya sendiri, sehingga terjemahan tersedia dengan ponsel dalam mode luring.[11]
Bahasa yang didukung
249 bahasa berikut didukung oleh Google Translate pada Oktober 2024.[13]
Tahap 10 (pada tahap ini, terjemahan dapat dilakukan antara dua bahasa, menggunakan bahasa Inggris sebagai langkah perantara, jika diperlukan) (diluncurkan 8 Mei 2008)
Tahap Beta selesai. Pengguna sekarang dapat memilih untuk membuat romanisasi ditulis untuk Belarusia, Bulgaria, Tionghoa, Yunani, Hindi, Jepang, Korea, Rusia, Thailand, dan Ukraina. Untuk terjemahan dari bahasa Arab, Hindi dan Persia, pengguna dapat memasukkan transliterasi teks Latin dan teks akan ditransliterasikan ke skrip asli untuk bahasa-bahasa ini saat pengguna mengetik. Teks sekarang dapat dibaca oleh sebuah text-to-speechprogram dalam bahasa Inggris, Prancis, Jerman dan Italia.
Untuk beberapa bahasa, Google mengganti synthesizer text-to-speech dari suara robot eSpeak ke teknologi suara alami penutur asli yang dibuat oleh SVOX[18] (Tionghoa, Ceko, Denmark, Belanda, Finlandia, Yunani, Hungaria, Norwegia, Polandia, Portugis, Rusia, Swedia, Turki), dan juga versi lama Prancis, Jerman, Italia, dan Spanyol; Latin menggunakan synthesizer yang sama dengan Italia.
Program bicara diluncurkan dalam bahasa Arab, Jepang dan Korea.
Tahap 23 (diluncurkan Januari 2011)
Pilihan terjemahan berbeda untuk satu kata.
Tahap 24 (diluncurkan Juni 2011)
5 bahasa Indikator baru (dalam alfa) dan metode input transliterasi:[19]
16 bahasa tambahan dapat digunakan dengan input kamera: Bulgaria, Catalan, Kroasia, Denmark, Estonia, Finlandia, Hungaria, Indonesia, Islandia, Latvia, Lituania, Norwegia, Rumania, Slovakia, Slovenia, dan Swedia.
Google Translate tidak selalu dapat diandalkan seperti terjemahan manusia. Ketika teks terstruktur dengan baik, ditulis menggunakan bahasa formal, dengan kalimat-kalimat sederhana, berkaitan dengan topik formal yang datanya cukup banyak, sering menghasilkan konversi yang mirip dengan terjemahan manusia antara bahasa Inggris dan sejumlah bahasa sumber daya tinggi.[30] Keakuratan menurun untuk bahasa-bahasa itu ketika lebih sedikit dari kondisi-kondisi itu berlaku, misalnya ketika panjang kalimat bertambah atau teks menggunakan bahasa yang akrab atau sastra. Untuk banyak bahasa lain vis-à-vis Bahasa Inggris, ini dapat menghasilkan inti teks dalam keadaan formal tersebut.[31] Evaluasi manusia dari bahasa Inggris ke 102 bahasa menunjukkan bahwa gagasan utama sebuah teks disampaikan lebih dari 50% dari waktu untuk 35 bahasa. Untuk 67 bahasa, hasil minimal yang dapat dipahami tidak tercapai 50% dari waktu atau lebih.[32]
Ketika digunakan sebagai kamus untuk menerjemahkan satu kata, Google Translate sangat tidak akurat karena harus menebak antara kata-kata polisemik. Di antara 100 kata teratas dalam bahasa Inggris, yang merupakan lebih dari 50% dari semua bahasa Inggris tertulis, kata rata-rata memiliki lebih dari 15 pengertian.[33] yang membuat kemungkinan terjemahan yang benar sekitar 15 hingga 1 jika setiap indra memetakan kata yang berbeda dalam bahasa target. Kata-kata bahasa Inggris yang paling umum memiliki setidaknya dua indera, yang menghasilkan peluang 50/50 dalam hal kemungkinan bahwa bahasa target menggunakan kata-kata yang berbeda untuk indra yang berbeda. Peluangnya mirip dari bahasa lain dengan bahasa Inggris.
Google Terjemahan membuat perkiraan statistik yang meningkatkan kemungkinan menghasilkan kata yang paling sering, dengan konsekuensi bahwa terjemahan yang akurat tidak akan diperoleh dalam kasus yang tidak sesuai dengan mayoritas atau kemunculan corpus pluralitas. Keakuratan prediksi satu kata belum diukur untuk bahasa apa pun. Karena hampir semua pasangan bahasa non-Inggris berporos melalui bahasa Inggris, peluang untuk mendapatkan terjemahan kata tunggal yang akurat dari satu bahasa non-Inggris dapat diperkirakan dengan mengalikan jumlah indera dalam bahasa sumber dengan jumlah indra masing-masing istilah dalam bahasa Inggris. Ketika Google Translate tidak memiliki kata dalam kosakata, itu membuat hasil sebagai bagian dari algoritma.[34]
^"Ten years of Google Translate". Google (dalam bahasa Inggris). 2016-04-28. Diarsipkan dari asli tanggal 2023-06-29. Diakses tanggal 2020-04-27.
^"How GT Pivots through English". Teach You Backwards (dalam bahasa American English). Diarsipkan dari asli tanggal 2021-01-13. Diakses tanggal 2020-04-27.
^"Catalan to Spanish translations". Teach You Backwards (dalam bahasa American English). Diarsipkan dari asli tanggal 2019-12-24. Diakses tanggal 2020-04-27.
^ abMcGuire, Nick (2018-07-26). "How Accurate Is Google Translate in 2018?". Argo Translation Inc. (dalam bahasa American English). Diarsipkan dari asli tanggal 2021-01-14. Diakses tanggal 2020-04-27.
^Jakob Uszkoreit, Ingeniarius Programmandi (September 30, 2010). "Veni, Vidi, Verba Verti". Google Blog. Diarsipkan dari asli tanggal 2020-11-09. Diakses tanggal December 22, 2011.
^Brants, Thorsten (September 13, 2012). "Translating Lao". Google Translate Blog. Diarsipkan dari asli tanggal 2023-06-11. Diakses tanggal September 19, 2012.
^Alur (Dho-Alur [d̟ɔ.a.lur]) adalah bahasa Nilotik Barat yang dituturkan di wilayah Nil Barat bagian selatan Uganda dan Provinsi Ituri di timur laut Republik Demokratik Kongo. Subdialek bahasa ini adalah Jokot, Jonam/Lo-Naam (umumnya dituturkan di Republik Demokratik Kongo), Mambisa, dan Wanyoro.
^Baoulé (nama asli: wawle), juga dikenal sebagai Baule atau Bawule adalah bahasa yang dituturkan di Pantai Gading bagian tengah dan selatan oleh sekitar 5,3 juta orang. Bahasa ini merupakan bahasa Kwa dari cabang Tano Tengah, yang membentuk kontinum dialek dengan Anyin dan berkerabat dekat dengan Nzema dan Sehwi. Bahasa ini merupakan bahasa umum suku Baoulé, kelompok etnis terbesar di Pantai Gading.
^Bemba (nama aslinya dikenal sebagai Chibemba, Ichibemba, dan Chiwemba), adalah bahasa Bantu yang terutama digunakan di timur laut Zambia oleh masyarakat Bemba.
^Bahasa Dombe (atau Ndombe) adalah bahasa Bantu di Angola. Guthrie mengelompokkannya ke dalam kelompok Bantu R.10, yang, selain Umbundu Pfouts (2003), juga merupakan bagian dari cabang bahasa Bantu Kavango–Barat Daya. Meskipun tidak dibahas secara spesifik, Ndombe mungkin juga termasuk dalam cabang tersebut.
^Bahasa frisia yang digunakan disini adalah Bahasa Frisia Barat.
^Bahasa Ga adalah bahasa Kwa yang dituturkan di Ghana, di dalam dan sekitar ibu kota Accra, dan tersebar ke negara Togo, Benin, dan Nigeria bagian barat oleh suku Ga. Bahasa ini memiliki perbedaan fonemik antara tiga panjang vokal.
^Hakha Chin, atau Laiholh (Di Mizoram disebut Pawi), adalah bahasa Kuki-Chin yang dituturkan oleh 446.264 orang, sebagian besar di Myanmar. Jumlah totalnya mencakup 2.000 penutur Zokhua dan 60.100 penutur Hakha. Penutur ini sebagian besar terkonsentrasi di Negara Bagian Chin di Myanmar barat dan Mizoram di India timur, dengan sejumlah kecil penutur di Bangladesh tenggara.
^Bahasa Hunsrik (juga disebut Hunsrückisch atau Riograndenser Hunsrückisch) adalah sebuah bahasa Jermanik yang berasal dari dialek Hunsrückisch (varian dari Moselle Franconian) di barat daya Jerman, khususnya wilayah Hunsrück, Rheinland-Pfalz. Bahasa ini dibawa ke Brasil oleh para imigran Jerman pada abad ke-19 dan berkembang menjadi bentuk tersendiri yang kini disebut Hunsrik Brasil.
^Silabis inuktut adalah sistem penulisan berbasis suku kata yang digunakan untuk menulis bahasa Inuktitut (Nunavut & Kanada timur) dan Inuinnaqtun (lebih ke arah barat, kadang ditulis dalam alfabet Latin).
^Bahasa Khasi (Ka Ktien Khasi) adalah bahasa Austroasiatik dengan lebih dari satu juta penutur di India timur laut, terutama suku Khasi di negara bagian Meghalaya. Bahasa ini memiliki status resmi asosiasi di beberapa distrik di negara bagian ini. Kerabat terdekat bahasa Khasi adalah bahasa-bahasa lain dalam kelompok bahasa Khas di Dataran Tinggi Shillong; termasuk Pnar, Lyngngam, dan War.
^Bahasa Kiga (disebut juga Rukiga, Ruchiga, atau Chiga) adalah bahasa Great Lakes Bantu milik suku Kiga (Bakiga). Kiga serupa dan sebagian dapat dimengerti dengan bahasa Nkore. Ini pertama kali ditulis pada paruh kedua abad ke-19.
^Kokborok (atau Tripuri) adalah bahasa Tibeto-Burma yang berasal dari negara bagian Tripura di India dan wilayah tetangga Bangladesh. Namanya berasal dari kata kók yang berarti "lisan" atau "bahasa" dan borok yang berarti "orang" atau "manusia". Bahasa ini merupakan salah satu bahasa kuno di India Timur Laut.
^Bahasa ini menggunakan Dialek Dholuo. Dialek ini atau bisa disebut dengan Nilotik Kavirondo, adalah dialek dari kelompok bahasa Luo dari bahasa Nilotik, yang dituturkan oleh sekitar 4,2 juta orang Luo di Kenya dan Tanzania, yang mendiami bagian pantai timur Nam Lolwe (Danau Victoria) dan wilayah di selatan.
^Kreol Mauritius atau Morisien (sebelumnya dieja Morisyen; nama asli: kreol morisien [kʁeol moʁisjɛ̃, - moʁiʃɛ̃]) adalah bahasa kreol berbasis Prancis yang dituturkan di Mauritius. Kata-kata dalam bahasa Inggris disertakan dalam versi bahasa standar.
^Bahasa Ndau (disebut juga chiNdau, Chindau, Ndzawu, Njao, Chidanda) adalah bahasa Bantu yang digunakan oleh 2.400.000 orang, & juga adalah bahasa Shona dan dapat dipahami bersama dengan bahasa Shona lainnya seperti Manyika, Zezuru, dan Karanga. Konstitusi Zimbabwe tahun 2013 menetapkan status bahasa Ndau sebagai bahasa resmi.
^N'Ko (ߒߞߏ) adalah bentuk koiné terpadu yang distandarisasi dari beberapa bahasa Manding yang ditulis dalam alfabet N'Ko. Bahasa ini digunakan di Guinea, Guinea-Bissau, Mali, Pantai Gading, Burkina Faso, dan beberapa negara Afrika Barat lainnya, terutama, tetapi tidak terbatas pada, bentuk tertulis, sedangkan dalam tuturan, berbagai ragam Manding digunakan.
^Bahasa Nuer (Thok Naath, "bahasa rakyat") adalah bahasa Nilotik dari kelompok Nilotik Barat. Bahasa ini dituturkan oleh orang Nuer di Sudan Selatan dan di Ethiopia barat (wilayah Gambela).
^Bahasa Tiv adalah bahasa Tivoid yang dituturkan di beberapa negara bagian di Nigeria Tengah Utara, dengan beberapa penutur di Kamerun. Bahasa ini memiliki lebih dari 5,2 juta penutur pada tahun 2024. Populasi penutur Tiv terbesar terdapat di negara bagian Benue di Nigeria.
^Chitumbuka (juga dikenal sebagai Senga & Tumbuka) adalah sebuah bahasa Bantu yang digunakan terutama di Malawi, Zambia, Tanzania, dan Zimbabwe. Pada tahun 2024, terdapat sekitar 7,1 juta penutur asli bahasa Chitumbuka dari ketiga negara tidak termasuk penutur dari Zimbabwe yang datanya tidak ditambahkan.
^Bahasa Zapotek /ˈzæpətɛk/ adalah kelompok sekitar 50 bahasa asli Mesoamerika yang berkerabat dekat dan merupakan cabang utama dari keluarga bahasa Oto-Manguea dan dituturkan oleh suku Zapotek dari dataran tinggi tengah-barat daya Meksiko.