Java Speech API


Java Speech API (JSAPI) adalah antarmuka pemrograman aplikasi untuk dukungan lintas platform dari pengenal perintah dan kontrol, sistem dikte, dan penyintesis ucapan. Meskipun JSAPI mendefinisikan antarmuka hanya ada beberapa implementasi yatng dibuat oleh pihak ketiga, misalnya FreeTTS.

Teknologi inti

Dua teknologi ucapan inti didukung melalui Java Speech API: sintesis ucapan dan pengenalan suara.

Sintesis ucapan

Sintesis ucapan menyediakan proses kebalikan dari menghasilkan ucapan sintetis dari teks yang dihasilkan oleh aplikasi, applet, atau pengguna. Hal ini sering disebut sebagai teknologi text-to-speech.

Langkah-langkah utama dalam memproduksi ucapan dari teks adalah sebagai berikut:

  • Analisis struktur: Memproses teks masukan untuk menentukan di mana paragraf, kalimat, dan struktur lainnya dimulai dan diakhiri. Untuk sebagian besar bahasa, data tanda baca dan pemformatan digunakan dalam tahap ini.
  • Pra-pemrosesan teks: Menganalisis teks input untuk konstruksi khusus bahasa. Dalam bahasa Inggris, perlakuan khusus diperlukan untuk singkatan, akronim, tanggal, waktu, angka, jumlah mata uang, alamat email, dan banyak bentuk lainnya. Bahasa lain memerlukan pemrosesan khusus untuk bentuk ini, dan sebagian besar bahasa memiliki persyaratan khusus lainnya.

Hasil dari dua langkah pertama ini adalah bentuk lisan dari teks tertulis. Berikut adalah contoh perbedaan antara teks tertulis dan lisan:

Rumah sakit St. Matthew ada di Main St.
-> “Rumah sakit Saint Matthew ada di Main Street”

Tambahkan $20 ke akun 55374.
-> “Tambahkan dua puluh dolar ke akun lima lima, tiga tujuh empat.”

Langkah selanjutnya mengubah teks lisan menjadi ucapan:

  • Konversi teks ke fonem: Mengonversi setiap kata menjadi fonem. Fonem adalah satuan dasar bunyi dalam suatu bahasa.
  • Analisis prosodi: Memproses struktur kalimat, kata, dan fonem untuk menentukan prosodi yang sesuai untuk kalimat tersebut.
  • Produksi bentuk gelombang: Menggunakan fonem dan informasi prosodi untuk menghasilkan bentuk gelombang audio untuk setiap kalimat.

Penyintesis ucapan dapat membuat kesalahan dalam salah satu langkah pemrosesan yang dijelaskan di atas. Telinga manusia disetel dengan baik untuk mendeteksi kesalahan ini, tetapi ketelitian oleh pengembang dapat meminimalkan kesalahan dan meningkatkan kualitas keluaran suara. Sementara Java Speech API 1 mengandalkan Java Speech API Markup Language (JSML), rilis yang lebih baru menggunakan SSML untuk menyediakan banyak cara bagi Anda untuk meningkatkan kualitas output dari penyintesis ucapan.

Pengenalan suara

Pengenalan suara memberi komputer kemampuan untuk mendengarkan bahasa lisan dan menentukan apa yang telah dikatakan. Dengan kata lain, ia memproses input audio yang berisi ucapan dengan mengubahnya menjadi teks.

Langkah-langkah utama dari pengenalan ucapan biasa adalah sebagai berikut:

  • Desain tata bahasa: Mendefinisikan kata-kata yang mungkin diucapkan oleh pengguna dan pola di mana mereka dapat diucapkan.
  • Pemrosesan sinyal: Menganalisis karakteristik spektrum (yaitu, frekuensi) dari audio yang masuk.
  • Pengenalan fonem: Membandingkan pola spektrum dengan pola fonem bahasa yang dikenali.
  • Pengenalan kata: Membandingkan urutan kemungkinan fonem dengan kata dan pola kata yang ditentukan oleh tata bahasa aktif.
  • Pembuatan hasil: Menyediakan aplikasi dengan informasi tentang kata-kata yang telah dideteksi oleh pengenal dalam audio yang masuk.

Tata bahasa adalah objek di Java Speech API yang menunjukkan kata-kata apa yang diduga diucapkan oleh pengguna dan dalam pola apa kata-kata itu mungkin muncul. Tata bahasa penting bagi pengenal suara karena membatasi proses pengenalan. Pembatas ini membuat pengenalan lebih cepat dan lebih akurat karena pengenal tidak harus memeriksa kalimat aneh.

Java Speech API 1 mendukung dua tipe tata bahasa dasar: tata bahasa aturan dan tata bahasa dikte. Jenis-jenis ini berbeda dalam berbagai cara, termasuk bagaimana aplikasi mengatur tata bahasa; jenis kalimat yang mereka izinkan; bagaimana hasil disediakan; jumlah sumber daya komputasi yang dibutuhkan; dan bagaimana mereka digunakan dalam desain aplikasi. Tata bahasa aturan ditentukan dalam JSAPI 1 oleh JSGF, Java Speech Grammar Format. JSAPI 2 yang lebih baru mendukung format SRGS yang lebih baru. JSAPI 2 tidak menawarkan dukungan untuk dikte.

Kelas dan antarmuka Java Speech API

Kelas dan antarmuka berbeda yang membentuk Java Speech API dikelompokkan ke dalam tiga paket berikut:

  • javax.speech : Berisi kelas dan antarmuka untuk mesin ucapan generik.
  • javax.speech.synthesis : Berisi kelas dan antarmuka untuk sintesis ucapan.
  • javax.speech.recognition : Berisi kelas dan antarmuka untuk pengenalan ucapan.

Kelas EngineManager seperti kelas pabrik yang digunakan oleh semua aplikasi Java Speech API. Kelas tersebut menyediakan metode statis untuk memungkinkan akses ke sintesis ucapan dan mesin pengenalan suara. Antarmuka Engine merangkum operasi umum yang harus disediakan oleh mesin ucapan yang sesuai dengan Java Speech API untuk aplikasi ucapan.

Aplikasi ucapan utamanya dapat menggunakan metode untuk melakukan tindakan seperti mengambil properti dan status mesin ucapan dan mengalokasikan serta membatalkan alokasi sumber daya untuk mesin ucapan. Selain itu, antarmuka Engine memaparkan mekanisme untuk menjeda dan melanjutkan aliran audio yang dihasilkan atau diproses oleh mesin ucapan. AudioManager dapat memanipulasi aliran. Antarmuka Engine disubklasifikasikan oleh antarmuka Synthesizer dan Recognizer, yang menentukan fungsi sintesis ucapan dan pengenalan suara tambahan. Antarmuka Synthesizer merangkum operasi mesin sintesis ucapan yang sesuai dengan Java Speech API untuk aplikasi ucapan.

Java Speech API didasarkan pada penanganan event. Event yang dihasilkan oleh mesin ucapan dapat diidentifikasi dan ditangani sesuai kebutuhan. Event ucapan dapat ditangani melalui antarmuka EngineListener, khususnya melalui RecognizerListener dan SynthesizerListener.

Spesifikasi terkait

Java Speech API ditulis sebelum Java Community Process (JCP) dan menargetkan Java Platform, Standard Edition (Java SE). Selanjutnya, Java Speech API 2 (JSAPI2) dibuat sebagai JSR 113 di bawah JCP. API ini menargetkan Java Platform, Micro Edition (Java ME), tetapi juga sesuai dengan Java SE.

Referensi

Read other articles:

Renang pada Olimpiade Musim Panas 1896LokasiPantai ZeaAthenaTanggal11–19 Agustus 1896Jumlah disiplin4Peserta13 dari 4 negara1900 → Renang pada Olimpiade Musim Panas 1896 adalah pelaksanaan cabang olahraga renang pada penyelenggaraan Olimpiade Musim Panas 1896. Kompetisi pada cabang olahraga ini berlangsung di Pantai Zea, Athena. Edisi ini menandingkan 4 nomor. 13 atlet dari 4 negara bertanding dalam edisi ini. Peserta 13 atlet dari 4 negara bertanding dalam edisi i...

 

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Februari 2023. Hotstar adalah platform hiburan digital India yang diluncurkan pada bulan Februari 2015 oleh Disney Star. Layanan ini dimiliki oleh The Walt Disney Company.[1] Layanan ini menyediakan video sesuai permintaan secara daring.[2][3]...

 

 

Equisetales Equisetum telmateia Klasifikasi ilmiah Kerajaan: Plantae Divisi: Pteridophyta Kelas: Equisetopsida Ordo: EquisetalesDC. ex Bercht. & J. Presl Suku / Familia Archaeocalamitaceae † Calamitaceae † Equisetaceae Phyllothecaceae † Equisetales adalah bangsa/ordo tumbuhan paku yang mencakup paku ekor kuda, sebagai satu-satunya anggota yang masih lestari hingga sekarang, dan beberapa kerabat yang punah dan hanya dikenal dari fosil, yaitu Calamitaceae, Archaeocalam...

British colony in Southeast Asia (1826–1946) Straits Settlements1826–1946 Flag(1904–1925) Coat of arms Anthem: God Save the King(1826–1837; 1901–1942; 1945–1946)God Save the Queen (1837–1901) Malaya in 1922:   Unfederated Malay States: Johor, Kedah, Kelantan, Perlis, Terengganu   Federated Malay States: Negeri Sembilan, Selangor, Pahang, Perak   Straits Settlements: Malacca, Penang, Singapore, DindingStatusDivision within Bengal Presidency (182...

 

 

Piute beralih ke halaman ini. Untuk kegunaan lain, lihat Piute (disambiguasi). Wanita dan anak Paiute di Yosemite Valley 1891. Paiute (kadang-kadang dibaca Piute) merujuk pada dua kelompok Amerika Asli - Paiute Utara di California, Nevada dan Oregon, dan Paiute Selatan di Arizona, tenggara California dan Nevada, dan Utah. Paiute Utara dan Selatan menuturkan bahasa yang sama yang berasal dari cabang Numic dari keluarga Uto-Aztec dalam bahasa Amerika Asli. Asal kata Paiute belum jelas. Beberapa...

 

 

Adam Smith, pemikir utama ekonomi klasik. Ekonomi klasik secara umum dianggap sebagai aliran modern pertama dalam sejarah pemikiran ekonomi. Pemikir dan pengembang utama aliran ini antara lain adalah Adam Smith, Jean-Baptiste Say, David Ricardo, Thomas Malthus dan John Stuart Mill. The Wealth of Nations karya Adam Smith pada tahun 1776 dianggap sebagai penanda dimulainya era ekonomi klasik. Aliran ini mengemuka hingga pertengahan abad ke-19, dan kemudian digantikan oleh ekonomi neoklasik, yan...

This article contains content that is written like an advertisement. Please help improve it by removing promotional content and inappropriate external links, and by adding encyclopedic content written from a neutral point of view. (August 2016) (Learn how and when to remove this template message) This article is written like a personal reflection, personal essay, or argumentative essay that states a Wikipedia editor's personal feelings or presents an original argument about a topic. Please he...

 

 

Italian television character DVD Cover for Topo Gigio and Friends Topo Gigio (Italian pronunciation: [ˈtɔːpo ˈdʒiːdʒo]) is a fictional anthropomorphic mouse, originally the lead character of a children's puppet show on Italian television in the early 1960s. The character, created in 1958 by artist Maria Perego, her husband Federico Caldura and fellow artist Guido Stagnaro,[1][2] debuted on RAI in 1959 and has been customarily voiced by actor Giuseppe Peppino Maz...

 

 

Telecommunications in Djibouti falls under the authority of the Ministry of Communication & Culture. Communications Telephones Main lines in use: 23,000 (2015) Mobile/cellular: 312,000 (2015) For additional, see Telephone numbers in Djibouti. Telephone system The Djibouti Telecom headquarters in Djibouti City. General assessment: Telephone facilities in the city of Djibouti are defined by CIA World Factbook as adequate as are the microwave radio relay connections to outlying areas of the ...

2021 Android smartphone produced by Samsung Not to be confused with Samsung Galaxy M32. Samsung Galaxy A32Samsung Galaxy A32 5GSamsung Galaxy A32 (4G LTE)BrandSamsung GalaxyManufacturerSamsung ElectronicsSloganAwesome screen, awesome camera, long-lasting battery lifeSeriesGalaxy A seriesModelInternational models:4G: SM-A325F, SM-A325F/DS, SM-A325M 5G: SM-A326B, SM-A326B/DS, SM-A326BR, SM-A326BR/DS, SM-A326UJapanese model:SCG08 (au, 5G)First released4G: 25 February 2021; 3 years a...

 

 

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. La mise en forme de cet article est à améliorer (juillet 2021). La mise en forme du texte ne suit pas les recommandations de Wikipédia : il faut le « wikifier ». La séparation des pouvoirs législatif, exécutif, judiciaire est un principe fondamental des démocraties représentatives. Au contraire, les régimes despotiques et dictatoriaux pratiquent une concentration des pouvoirs. Ces pouvoi...

 

 

Stephen Townesend was Dean of Exeter between 1583 and 1588.[1] Notes ^ Ursula Radford (1955). An Introduction to the Deans of Exeter. Report & Transactions of the Devonshire Association 87: 1–24. Religious titles Preceded byGeorge Carew Dean of Exeter 1583–1588 Succeeded byMatthew Sutcliffe vteDeans of ExeterHigh Medieval Serlo Roger de Wynkleigh William de Stanwey Roger de Toriz John Noble John Pycot Andrew de Kilkenny Late Medieval Henry de Somerset Thomas de ...

Stasiun Kōnomiya国府宮駅Stasiun Kōnomiya pada Januari 2008LokasiMatsushita 1-1-1, Inazawa-shi, Aichi-ken 492-8208 [1]JepangKoordinat35°15′14″N 136°48′10″E / 35.2538419°N 136.8029165°E / 35.2538419; 136.8029165Koordinat: 35°15′14″N 136°48′10″E / 35.2538419°N 136.8029165°E / 35.2538419; 136.8029165Operator MeitetsuJalur■ Jalur Meitetsu NagoyaLetak80.9 kilometer dari ToyohashiJumlah peron2 peron pulauInformas...

 

 

Channing Tatum Channing Tatum en la Comic-Con de San Diego de 2017Información personalNombre de nacimiento Channing Matthew TatumNacimiento 26 de abril de 1980 (44 años)Cullman, Alabama, Estados UnidosNacionalidad EstadounidenseLengua materna Inglés FamiliaCónyuge Jenna Dewan (matr. 2009; div. 2018)Pareja Jessie J (2018-2020)Zoë Kravitz (desde 2021) Hijos 1EducaciónEducado en Escuela Secundaria GaitherUniversidad Estatal de GlenvilleEscuela secundari...

 

 

Artikel ini bukan mengenai Isabelle Fuhrman. Emma FuhrmanLahirEmma Cate Fuhrmann15 September 2001 (umur 22)Dallas, TexasPekerjaanAktrisTahun aktif2003–sekarangSitus webwww.emmafuhrmann.com Emma Cate Fuhrmann (lahir 15 September 2001) adalah seorang aktris Amerika yang telah memulai akting sejak ia berusia 5 tahun. Dia pertama kali memulai perannya dalam The Magic of Belle Isle (2012) sebagai Finnegan O'Neil. Ini adalah peran utama pertamanya dalam film bersama bermain Morgan Free...

2018 local election in England 2018 Merton London Borough Council election ← 2014 3 May 2018 2022 → All 60 council seats on Merton London Borough Council   First party Second party   Party Labour Conservative Last election 36 seats, 49.6% 20 seats, 31.6% Seats won 34 17 Seat change 2 3 Popular vote 83,890 56,223 Percentage 46.9% 31.5% Swing 2.7% 0.1%   Third party Fourth party   Party Liberal Democrats Merton Park Residents Last...

 

 

Миссис Даутфайрангл. Mrs. Doubtfire Жанры комедиядрамамелодрама Режиссёр Крис Коламбус Продюсеры Марк РэдклиффРобин УильямсМарша Гарсес Уильямс На основе Мадам Даутфайр[вд] Авторысценария Лесли ДиксонРэнди Мейем Сингер В главныхролях Робин УильямсСалли ФилдПирс Брос...

 

 

Michaël Llodra Michaël Llodra (lahir 18 Mei 1980) adalah petenis profesional putra dari Prancis. Bersama Fabrice Santoro, ia dua kali memenangi nomor ganda putra Australia Terbuka. Sepanjang kariernya, ia memenangkan 3 gelar ganda dan 14 gelar tunggal, dan peringkat tertingginya di Asosiasi Pemain Tenis Profesional mencapai urutan ke-34, yang dicapai pada bulan Juli 2008. Wikimedia Commons memiliki media mengenai Michaël Llodra. Pengawasan otoritas Umum Integrated Authority File (Jerman) I...

Australian musician, songwriter and producer Rob YoungerBirth nameRobert Kent YoungerBornSydney, New South Wales, AustraliaGenres Punk rock indie rock Occupation(s) Musician producer Instrument(s)VocalsYears active1974–presentLabelsCitadelMusical artist Rob Younger (born Robert Kent Younger) is an Australian rock musician, vocalist, songwriter and producer. He is a founding mainstay of the punk rock group Radio Birdman, and he is a pioneer of the local independent music scene. Radio Birdman...

 

 

Bilateral relationsCanadian–Israeli relations Canada Israel Diplomatic missionEmbassy of Canada, Tel AvivEmbassy of Israel, Ottawa Canada and Israel share bilateral diplomatic, commercial, and cultural ties. Canada recognised Israel on 11 May 1949, three days before the first anniversary of the Israeli Declaration of Independence, and currently maintains an embassy in Tel Aviv;[1] Israel maintains an embassy in Ottawa and regional[clarification needed] consulates in Montreal...