Web semantikWeb semantik (bahasa Inggris: Web Semantic, Jejaring Semantik, Web Bermakna, sering kali juga disebut sebagai Web 3.0) merujuk kepada ekstensi Waring Wera Wanua (World Wide Web) melalui standar[1] yang ditetapkan oleh Konsorsium World Wide Web (World Wide Web Consortium; W3C). Tujuan dari ekstensi ini adalah membuat data yang berada pada jaringan internet dapat dibaca dan diinterpretasi oleh mesin. Istilah Web Semantik dimulai oleh Tim Berners-Lee,[2] perintis sistem World Wide Web. ![]() Web semantik memungkinkan representasi pengetahuan secara eksplisit dan pemrosesan lebih lanjut untuk menghasilkan pengetahuan baru dari informasi yang tersimpan secara implisit. Teknologi ini memberikan akses dan pencarian informasi yang lebih akurat dan menyeluruh dibandingkan dengan sistem temu kembali informasi yang ada saat ini. Data yang sebelumnya beragam dan tidak terstruktur dapat dipetakan dan digabungkan menggunakan representasi pengetahuan bersama serta skema yang dapat diperluas secara dinamis. Untuk memungkinkan pengkodean semantik pada data, teknologi seperti Resource Description Framework (RDF)[3] dan Web Ontology Language (OWL)[4] digunakan. Teknologi-teknologi ini digunakan untuk merepresentasikan metadata secara formal. Sebagai contoh, ontologi dapat mendeskripsikan konsep, hubungan antar entitas, dan kategori benda. Semantik yang tertanam ini menawarkan keuntungan yang signifikan seperti penalaran terhadap data dan beroperasi dengan sumber data yang heterogen.[5] Standar-standar ini mengenalkan format data yang umum dan protokol pertukaran di Web, yang pada dasarnya berupa RDF. Menurut W3C, “Web Semantik menyediakan kerangka kerja umum yang memungkinkan data untuk dibagikan dan digunakan kembali di seluruh aplikasi, perusahaan, dan batas-batas komunitas.”[6] Oleh karena itu, Web Semantik dianggap sebagai integrator di berbagai aplikasi dan sistem konten dan informasi yang berbeda. SejarahIstilah web semantik pertama kali digunakan oleh Tim Berners-Lee untuk menggambarkan jaringan data (atau web data)[7] yang dapat diproses maknanya oleh mesin.[8] Meskipun beberapa kritikus mempertanyakan kemapanan web semantik, para peneliti web semantik berargumen bahwa kenyataan bahwa web semantik dapat diterapkan dalam bidang ilmu perpustakaan dan informasi, industri, biologi, dan penelitian ilmu humaniora telah membuktikan validitas konsep dasar web semantik.[9] Tim Berners-Lee pertama kali mengemukakan visinya tentang Web Semantik pada tahun 1999 sebagai berikut:[9]
Artikel Scientific American tahun 2001 oleh Berners-Lee, Hendler, dan Lassila menggambarkan evolusi yang diharapkan dari Web yang ada menjadi Web Semantik.[10] Pada tahun 2006, Berners-Lee dan rekan-rekannya menyatakan bahwa: “Ide sederhana ini…masih belum terwujud sepenuhnya”.[11] Pada tahun 2013, lebih dari empat juta domain Web (dari total sekitar 250 juta) mengandung markah Web Semantik.[12] ContohDalam contoh berikut, teks <div vocab="https://schema.org/" typeof="Person">
<span property="name">Mohammad Hatta</span> lahir di
<span property="birthPlace" typeof="Place" href="https://www.wikidata.org/entity/Q7248">
<span property="name">Bukittinggi</span>.
</span>
</div>
Sintaks HTML tersebut dapat direpresentasikan ulang dalam bentuk RDF berupa tiga serangkai semantik (dalam blok kode berikut ditulis dalam bentuk sintaks Turtle).[13] Tiap tiga rangkai hubungan berisi dua buah node yang terhubung dengan suatu sisi (edge): node pertama disebut dengan subjek merupakan titik asal suatu sisi, sisi yang menjadi penghubung disebut dengan predikat yang mendefinisikan hubungan antara dua node, dan node kedua yang merupakan titik tuju suatu sisi disebut dengan objek, berisi nama node tujuan atau nilai literal (teks atau nomor, dsb.)[13] Dalam contoh HTML sebelumnya, menggunakan bentuk tiga serangkai semantik subjek - predikat - objek, dapat disusun hubungan sebagai berikut:
Menggunakan Turtle, suatu node yang belum diketahui atau belum memiliki pengenal global (pada contoh ini diberikan nama ) dapat direpresentasikan dengan sintaks _:a <https://www.w3.org/1999/02/22-rdf-syntax-ns#type> <https://schema.org/Person> .
_:a <https://schema.org/name> "Mohammad Hatta" .
_:a <https://schema.org/birthPlace> <https://www.wikidata.org/entity/Q7248> .
<https://www.wikidata.org/entity/Q7248> <https://schema.org/itemtype> <https://schema.org/Place> .
<https://www.wikidata.org/entity/Q7248> <https://schema.org/name> "Bukittinggi" .
Dari representasi Turtle di atas, dapat dibentuk graf pengetahuan sebagai berikut. ![]() Penggunaan URI dalam dokumen web membuat suatu teks dapat ditelusuri menggunakan protokoll HTTP dan menghasilkan dokumen lain yang menjelaskan data mengenai URI tersebut. Dalam kaidah data tertaut terbuka, proses ini disebut dengan dereferensi (dereference).[13] Dalam contoh ![]() Pada sisi yang dibentuk menggunakan URI pada grafik sebelumnya, dapat dilakukan dereferensi dari sintaks: _:a <https://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> .
Node <https://schema.org/Person> <http://www.w3.org/2002/07/owl#equivalentClass> <http://xmlns.com/foaf/0.1/Person> .
Menggunakan OWL, dapat diimplikasikan bahwa node _:a <https://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
Latar belakangPada awal 1960-an, konsep model jaringan semantik mulai dikaji oleh para peneliti, di antaranya oleh ilmuwan kognitif Allan M. Collins, ahli bahasa Ross Quillian, dan psikolog Elizabeth F. Loftus. Penelitian mereka mengkaji model pengetahuan yang terstruktur secara semantik.[16] Penerapan model ini pada internet modern memperluas fungsi jaringan laman web yang dapat dibaca manusia dan saling terhubung dengan jaringan pranala dengan memasukkan metadata yang dapat dibaca oleh komputer.[17] Metadata ini berisi informasi mengenai laman-laman tersebut dan keterkaitan satu laman dengan laman yang lain. Dengan adanya perluasan (ekstensi) ini, perayap web otomatis dapat mengakses lebih banyak informasi dari laman di internet dan merangkai informasi tersebut untuk para pengguna. Istilah "Web Semantik" dicetuskan oleh Tim Berners-Lee, penemu Waring Wera Wanua dan direktur Konsorsium Waring Wera Wanua (World Wide Web Consortium; W3C), suatu lembaga yang mengawasi pengembangan dan pengusulan standar-standar Web Semantik. Ia mendefinisikan Web Semantik sebagai "jaringan data yang dapat diproses secara langsung dan tidak langsung oleh mesin".[18] Ragam teknologi yang kini dinaungi oleh W3C telah ada dan digunakan sejak sebelum distandardisasi oleh W3C. Teknologi-teknologi ini digunakan dalam berbagai konteks, terutama yang berkaitan dengan informasi yang mencakup domain terbatas dan terdefinisi, dan pada domain yang memiliki kebutuhan untuk berbagi data, seperti penelitian ilmiah atau pertukaran data antar bisnis.[19] Keterbatasan HTMLBerkas pada komputer pada umumnya dapat dibagi menjadi dokumen yang dapat dibaca manusia atau data yang dapat dibaca mesin. Contoh berkas dokumen yang dapat dibaca manusia adalah pesan email, laporan, dan brosur. Contoh berkas data yang dapat dibaca mesin adalah kalender, buku alamat, daftar putar, dan spreadsheet, yang disajikan kepada pengguna setelah melalui pemrosesan pada program aplikasi yang memungkinkan berkas-berkas tersebut dilihat, dicari, dan digabungkan. Saat ini, dokumen-dokumen yang tersimpan dalam Waring Wera Wanua sebagian besar didasarkan pada bahasa Hypertext Markup Language (HTML), sebuah konvensi markah yang digunakan untuk menyusun kode pada teks yang memiliki objek multimedia seperti gambar dan formulir interaktif tertanam di antara teks tersebut. Pada dokumen-dokumen ini terdapat tag metadata yang menjadi metode untuk mengkategorikan konten halaman web, yang dilakukan oleh komputer. Pada contoh di bawah ini, nama kolom "keywords", "description", dan "author" diberi nilai seperti "makanan", "barang murah untuk dijual", dan "Ahmad". <meta name="keywords" content="makanan, minuman, peralatan" />
<meta name="description" content="Peralatan untuk dijual" />
<meta name="author" content="Ahmad" />
Dengan kategorisasi melalui sistem tag ini, sistem komputer lain dapat mengakses dan berbagi data ini, dan dengan mudah mengidentifikasi nilai yang relevan dan dibutuhkan oleh pengguna. Menggunakan HTML dan alat penampilnya (seperti peramban web, maupun agen pengguna lain), seorang pengguna dapat membuat dan menampilkan laman suatu toko yang mencantumkan barang-barang yang dijual di toko tersebut. Kode HTML halaman katalog ini dapat membuat pernyataan sederhana di tingkatan kode dokumen seperti "judul dokumen ini adalah 'Toko Kelontong Haji Ahmad." Meskipun demikian, bahasa HTML tidak memiliki fungsi spesifik untuk menyatakan dengan jelas bahwa, misalnya, nomor barang X586172 adalah Teh Botol Sosro dengan harga eceran Rp3500, atau bahwa barang tersebut merupakan produk konsumen. Sebaliknya, HTML hanya dapat menyatakan bahwa rentang teks "X586172" seharusnya ditempatkan di dekat "Teh Botol Sosro" dan "Rp3500", dst. Tidak ada cara bagi mesin yang memproses kode HTML tersebut untuk mengatakan (menalar[20]) bahwa "dokumen ini adalah katalog" atau bahkan untuk menetapkan bahwa "Teh Botol Sosro" adalah semacam nama barang dan bukan nama orang atau bahwa "Rp3500" adalah harga dan bukan jam keberangkatan. Tidak ada pula cara untuk menyatakan bahwa potongan-potongan informasi ini hanya bermakna bila terhubung bersama dalam mendeskripsikan suatu item tersendiri, dan berbeda dari item lain yang mungkin tercantum pada halaman tersebut. HTML semantik mengacu pada praktik HTML yang memberikan markah berdasarkan maksud dari konten pada markah tersebut, alih-alih menentukan detail tata letak secara langsung. Misalnya, penggunaan Teknologi Microformat memberikan ekstensi pada sintaksis HTML untuk membuat markah semantik yang dapat dibaca mesin yang memberikan kategorisasi objek-objek termasuk orang, organisasi, acara, dan produk.[21] Selain Microformat, teknologi-teknologi serupa telah dikembangkan, termasuk dalam kategori ini adalah RDFa, Microdata dan Schema.org.[22] Solusi Web SemantikWeb Semantik merupakan pengembangan lanjutan dari solusi HTML semantik dan Microformat. Web Semantik melibatkan aktivitas penerbitan data dalam bahasa yang dirancang khusus untuk data seperti Resource Description Framework (RDF), Web Ontology Language (OWL), dan Extensible Markup Language (XML).[13] HTML mendeskripsikan dokumen dan tautan di antara dokumen-dokumen tersebut. Sebaliknya, RDF, OWL, dan XML dapat mendeskripsikan hal-hal yang bersifat arbitrer yang dikandung dalam dokumen tersebut seperti orang, pertemuan, atau komponen pesawat. Teknologi-teknologi tersebut dikombinasikan untuk menyediakan deskripsi untuk melengkapi atau menggantikan konten dalam dokumen Web. Dengan demikian, konten dapat dimanifestasikan sebagai data deskriptif yang tersimpan dalam basis data yang dapat diakses melalui Web,[23] atau sebagai markah dalam dokumen (khususnya, menggunakan Extensible HTML (XHTML) yang diselingi dengan XML, atau, lebih sering, ditulis murni dalam XML, dengan tata letak atau kode pemampil disimpan secara terpisah). Deskripsi yang dapat dibaca mesin memungkinkan pengelola konten untuk menambahkan makna pada konten, i.e. untuk mendeskripsikan struktur pengetahuan yang kita miliki tentang konten tersebut. Dengan cara ini, mesin dapat memproses pengetahuan itu sendiri, alih-alih teks, menggunakan proses yang mirip dengan penalaran deduktif dan inferensi manusia, sehingga memperoleh hasil yang lebih bermakna dan membantu komputer untuk melakukan pengumpulan informasi dan penelitian otomatis. Contoh tag yang akan digunakan di halaman web non-semantik: <item>blog</item>
Pengkodean informasi serupa di halaman web semantik mungkin terlihat seperti ini: <item rdf:about="https://example.org/semantic-web/">Semantic Web</item>
Tim Berners-Lee menyebut jaringan Data Tertaut yang dihasilkan sebagai Grafik Global Raksasa (Giant Global Graph),[24] berbeda dengan Waring Wera Wanua yang berbasis kode HTML. Berners-Lee berpendapat bahwa jika pada masa lalu aktivitas yang dilakukan melalui Web adalah berbagi dokumen, aktivitas tersebut pada masa depan adalah berbagi data. Jawabannya atas pertanyaan "bagaimana hal tersebut dapat dilakukan" adalah dengan memberikan tiga poin instruksi. Pertama, URL harus mengarah ke data. Kedua, siapa pun yang mengakses URL tersebut harus mendapatkan data kembali. Ketiga, hubungan antara data harus mengarah ke URL tambahan yang berisi data.[25] Tag dan pengenalTag, termasuk kategori hierarkis dan tag yang ditambahkan dan dipelihara secara kolaboratif (misalnya dengan folksonomi dapat dianggap sebagai bagian dari, potensi penggunaan atau langkah menuju visi Web semantik.[26] Penanda unik, termasuk kategori hierarkis dan yang ditambahkan secara kolaboratif, alat analisis dan metadata, termasuk tag, dapat digunakan untuk membuat bentuk-bentuk semantik dalam dokumen web.[27] Penanda dan bentuk ini telah digunakan dalam bidang kajian akademik untuk kategorisasi topik penelitian dan bidang ilmiah, seperti yang dilakukan oleh proyek OpenAlex. Selain itu, melalui proyek Wikidata dan Scholia (dalam pengembangan) menyediakan API, halaman web, umpan dan grafik untuk berbagai kueri semantik untuk data peneliti dan bidang akademik. Web 3.0Tim Berners-Lee mendeskripsikan Web Semantik sebagai komponen Web 3.0.[28]
"Web Semantik" seringkali digunakan sebagai sinonim untuk "Web 3.0", meskipun terdapat variasi pada definisi setiap istilah.[29] Lanjutan dari Web 3.0Generasi Web berikutnya sering disebut Web 4.0, tetapi definisinya tidak jelas. Menurut beberapa sumber, ini adalah Web yang melibatkan kecerdasan buatan, internet untuk segala, komputasi pervasif, komputasi sarwega (ubiquitous), dan web untuk segala di antara konsep-konsep lainnya.[30][31][32] Menurut Uni Eropa, Web 4.0 adalah "generasi keempat yang diharapkan dari World Wide Web. Dengan menggunakan kecerdasan buatan dan ambient yang canggih, internet of things, transaksi blockchain tepercaya, dunia virtual dan kemampuan XR, objek dan lingkungan digital dan nyata terintegrasi sepenuhnya dan berkomunikasi satu sama lain, memungkinkan pengalaman yang benar-benar intuitif dan imersif, memadukan dunia fisik dan digital dengan mulus."[33] TantanganBeberapa tantangan bagi Web Semantik meliputi luas cakupan, ketidakjelasanya, ketidakpastian hasil, inkonsistensi hasil, dan penyesatan. Desain dari Sistem penalaran otomatis harus dapat mengatasi semua masalah ini agar dapat memenuhi tujuan Web Semantik.
Daftar tantangan ini bersifat ilustratif, alih-alih komprehensif, dan berfokus pada tantangan terhadap lapisan "logika penggabung" dan "pembuktian" Web Semantik. Laporan akhir World Wide Web Consortium (W3C) Incubator Group for Uncertainty Reasoning for the World Wide Web [34] (URW3-XG) mengelompokkan masalah-masalah ini ke dalam satu judul tunggal, yaitu "ketidakpastian".[35] Banyak teknik yang disebutkan di sini memerlukan perluasan ke Bahasa Ontologi Web (OWL), misalnya untuk menganotasi probabilitas bersyarat. Bidang ini merupakan area penelitian yang sedang aktif. [36] Standar-standar Web SemantikW3C mengawasi dan mengarahkan standardisasi teknologi Web Semantik dalam konteks Web 3.0.[37] KomponenIstilah "Web Semantik" sering digunakan secara lebih spesifik untuk merujuk pada format dan teknologi yang membangun jejaring (web) makna (semantik) di antara informasi dalam Waring Wera Wanua. Pengumpulan, penataan, dan pemulihan data tertaut pada Web didukung oleh teknologi yang menyediakan deskripsi formal tentang konsep, istilah, dan hubungan dalam domain pengetahuan tertentu. Teknologi-teknologi ini disebut sebagai standar-standar W3C dan meliputi:
Struktur Berlapis Web Semantik menggambarkan arsitektur Web Semantik. Fungsi dan hubungan antar komponen dapat diringkas sebagai berikut: [38]
Keadaan standardisasi saat iniStandar yang telah ditetapkan:
Belum sepenuhnya dirilis:
Daftar Pustaka
Referensi
Pranala luar
|