Búsqueda semántica

La búsqueda semántica es un proceso utilizado para mejorar la búsqueda por Internet mediante el uso de datos de las redes semánticas para desambiguar las consultas y el texto de la web con la finalidad de encontrar los resultados más relevantes en relación con la demanda del usuario.

Introducción

Debido a la rápida evolución de la web (desde la primera generación o web 1.0 pasando por la web 2.0 y llegando a la web 3.0 o web semántica) y el gran incremento de contenidos presentes en Internet como red global, cada vez se hace más necesario tener métodos eficientes de recuperación de información.

La recuperación de información consiste en encontrar el material (normalmente documentos) de entre grandes colecciones de datos para satisfacer la necesidad de un usuario. El principal objetivo del sistema de recuperación de información debe ser obtener los documentos más relevantes posibles en relación con una consulta particular.

Hoy en día es imprescindible el uso de motores de búsqueda para realizar las consultas en Internet y es posible que un mismo motor de búsqueda proporcione respuestas diferentes para diferentes versiones de una misma pregunta. Estos resultados pueden depender de las palabras clave utilizadas y no siempre son correctos.

Estas son las principales motivaciones para el desarrollo de métodos de búsqueda semántica, aprovechar las propiedades de la semántica (como el estudio del significado de las palabras) para orientar la búsqueda y así intentar obtener resultados óptimos.

La dificultad de este tipo de búsqueda recae en que para los seres humanos es fácil establecer equivalencias semánticas entre diferentes expresiones pero este proceso no es evidente para los sistemas automatizados. Un sistema de búsqueda semántica ideal tendría que emular un hipotético sistema de búsqueda humano con una memoria suficientemente grande para recordar y relacionar todas las preguntas y respuestas anteriormente consultadas. Es cierto que diferentes personas pueden dar diferentes respuestas a una misma pregunta pero por mucho que re-formulemos la consulta la respuesta será similar ya que semánticamente serán consultas equivalentes.

Finalmente el objetivo definitivo para un sistema artificial de búsqueda semántica será obtener los mismos resultados y en el mismo orden de relevancia respecto a diferentes consultas semánticamente equivalentes.

Hildebrand et al.[1]​ proporciona una visión general enumerando sistemas de búsqueda semántica e identifica otros usos de la semántica en los procesos de búsqueda.

Desambiguación

Típicamente el caso que suele presentarse es el de un usuario con una necesidad de información más o menos concreta que propone una consulta a un motor de búsqueda, esta consulta contiene palabras clave que el usuario considera necesarias o correctas para obtener la información deseada. Entonces el motor de búsqueda convierte en metadatos (crea una representación) las palabras clave utilizadas en la consulta y realiza la búsqueda en su base de datos. Esta contiene la relación de metadatos con todos los documentos que conoce y devuelve una lista de resultados en función de la relevancia establecida por el orden de clasificación. Este sistema tiene dos limitaciones principales: a veces el usuario no es capaz de definir correctamente su objetivo mediante palabras clave además de que los motores de búsqueda no entienden el lenguaje natural.

El lenguaje natural es muy complejo debido, en gran parte, al gran número de sinónimos y palabras polisémicas que contiene. En este punto entra en juego la importancia de la aplicación de sistemas de búsqueda semántica en los motores de búsqueda. En general el proceso de búsqueda semántica es:

A. Interpretar la pregunta del usuario extrayendo los conceptos más relevantes de la frase. B. Utilizar este grupo de conceptos para crear una consulta y utilizarla contra la ontología del sistema. C. Presentar los resultados al usuario.

Con tal de entender que es lo que el usuario está buscando (punto A del proceso), se debe desambiguar el significado de las palabras clave utilizadas en la pregunta. Se considera que un término es ambiguo cuando este puede tener un considerado número de significados posibles, por ejemplo la palabra hoja como "la hoja de un árbol", "una hoja de papel" o "una hoja de afeitar". Gracias a los procesos de desambiguación se elige el significado más probable de entre todos los posibles.

Estos procesos tienen en cuenta el significado del resto de palabras presentes en la frase y el resto del texto de las webs. La determinación de cada significado influye en la desambiguación de los demás hasta llegar a una situación de máxima verosimilitud y coherencia para la frase inicial consultada. Toda la información fundamental para el proceso de desambiguación, es decir, todo el conocimiento utilizado por el sistema, se ve representada en forma de una red semántica organizada alrededor de un núcleo conceptual.


Red semántica

El principal objetivo de la investigación de redes semánticas es el desarrollo de una serie de lenguajes y la tecnología necesaria para expresar información semántica que pueda ser entendida y procesada por las computadoras para poder aplicarlo al entorno del trabajo en red.

Una estructura de este tipo pretende representar el conocimiento lingüístico mostrando las interrelaciones entre conceptos. Cada concepto léxico coincide con el nodo de una red semántica y está conectado con otros por relaciones semánticas específicas en una estructura jerárquica y hereditaria. De esta forma, cada concepto enriquece con sus características y su significado a los nodos cercanos.

Cada nodo de la red agrupa un conjunto de sinónimos que representan el mismo concepto léxico y pueden contener:

  • Lemas simples ('asiento', 'vacaciones', 'trabajo', 'rápido', 'más', etc.).
  • Compuestos ('guardaespaldas', 'pararrayos', 'aguardiente', etc.).
  • Colocaciones ('plan de choque', 'paquete bomba', 'llevar a cabo', 'bajo consumo', etc.).

Los enlaces que identifican las relaciones semánticas entre los conjuntos de sinónimos son las directrices a seguir para la organización de la red semántica de conceptos.

Ontología

Antes se ha mencionado el concepto de ontología que aparece en la parte del proceso de la búsqueda semántica en que ya se ha desambiguado el mensaje inicial del usuario y se pretende realizar la consulta definitiva.

Ontología es un término originalmente utilizado en filosofía y ahora relacionado con la informática como un conjunto de términos jerárquicamente estructurado para describir un dominio que puede ser utilizado como núcleo de una base de conocimientos. Con tal de que las ontologias puedan ser interpretadas por los ordenadores, los conceptos, propiedades y sus relaciones, restricciones y normas se describen en un lenguaje formal. Por lo tanto la ontología de un dominio de conocimiento proporciona un vocabulario con el que se representa el conocimiento de ese dominio de conocimiento y el conjunto de relaciones que mantienen los términos utilizados en el vocabulario.

La definición de ontologías es un proceso básico para el desarrollo de búsquedas semánticas ya que con ellas se obtienen muchos beneficios. Definen la terminología de un dominio de búsqueda de forma detallada con lo que los conceptos semánticos quedan establecidos de forma no ambigua además de obtener una relación directa entre conceptos semánticos similares.


Referencias


Artículos:

  • Tomasz, Imielinski y Alessio, Signorini: «If you ask nicely, I will answer: Semantic Search and Today's Search Engines». IEEE International Conference on Semantic Computing (2009).
  • Junaidah, Mohamed Kassim y Mahathir, Rahmany: «Introduction to Semantic Search Engine». International Conference on Electrical Engineering and Informatics (del 5 al 7 de agosto de 2009; Selangor. Malasya).
  • DU, Zhi-Qiang; HU, Jing; YI, Hong-Xia y HU, Jin-Zhu: «The Research of the Semantic Search Engine based on the Ontology».
  • WEI-DONG, Fang; LING, Zhang; YAN-XUAN, Wang y SHOU-BIN, Dong: «Toward a Semantic Search Engine Based on Ontologies». Proceedings of the Fourth International Conference on Machine Learningand Cybernetics (del 18 al 21 de agosto de 2005; Guangzhou, China).

Read other articles:

Keluarga mesin seri APembuatToyotaProduksi1978–2006Konfigurasimesin 4 silinder segarisCampuran blok silinderBesi TuangCampuran kepala silinderAluminiumValvetrainSOHC, DOHCSistem bahan bakarKarburator, Fuel injectedTipe bahan bakarBensin Mesin A adalah sebuah keluarga mesin 4 silinder segaris berbahan bakar bensin buatan Toyota. Pengembangan mesin ini dimulai pasda tahun 1970an , ketika Toyota ingin membangun sebuah mesin baru untuk Toyota Tercel, penerus Mesin K Toyota.[1] Tujuannya...

 

 

Alireza Jahanbakhsh Alireza Jahanbakhsh pada 2019Informasi pribadiNama lengkap Alireza Jahanbakhsh[1]Tanggal lahir 11 Agustus 1993 (umur 30)[2]Tempat lahir Gilan, IranTinggi 185 cm (6 ft 1 in)Posisi bermain gelandangNomor 16Karier junior2005–2007 Payam Alborz Qazvin[2]2007–2008 Persian Qazvin[2]2008–2010 Damash Gilan[2]Karier senior*Tahun Tim Tampil (Gol)2010–2011 Damash Tehran 12 (0)2011–2013 Damash Gilan 44 (10)2013–20...

 

 

Land surface effects on climate are wide-ranging and vary by region. Deforestation and exploitation of natural landscapes play a significant role. Some of these environmental changes are similar to those caused by the effects of global warming.[1][2][3] Deforestation effects See also: Deforestation by region Major land surface changes affecting climate include deforestation (especially in tropical areas),[4][5][6][7][8] and dest...

Huria Kristen Batak ProtestanSingkatanHKBPPenggolonganProtestanOrientasiLutheranTeologiKonfesi HKBP[1]BentukpemerintahanEpiskopalEphorusPdt. Dr. Robinson ButarbutarSekretaris JenderalPdt. Dr. Victor TinambunanKepala DepartemenKoinonia: Pdt. Dr. Deonal SinagaMarturia: Pdt. Daniel Taruli Asi Harahap, M.ThDiakonia: Pdt. Debora Purada Sinaga, M.ThPerhimpunanPersekutuan Gereja-Gereja di Indonesia (PGI)Dewan Gereja-Gereja Asia (CCA)Federasi Lutheran Sedunia (LWF)Dewan Gereja-Gereja Sedunia ...

 

 

American basketball player (born 1990) DeMarcus CousinsCousins with the Golden State Warriors in 2019No. 15 – Taiwan Beer LeopardsPositionCenterLeagueT1 LeaguePersonal informationBorn (1990-08-13) August 13, 1990 (age 33)Mobile, Alabama, U.S.Listed height6 ft 10 in (2.08 m)Listed weight270 lb (122 kg)Career informationHigh schoolJohn L. LeFlore (Mobile, Alabama)CollegeKentucky (2009–2010)NBA draft2010: 1st round, 5th overall pickSelected by the Sacram...

 

 

Chemical compound FencamineClinical dataRoutes ofadministrationOralATC codenoneLegal statusLegal status In general: ℞ (Prescription only) Identifiers IUPAC name 1,3,7-trimethyl-8-({2-[methyl(1-phenylpropan-2-yl)amino]ethyl}amino)-3,7-dihydro-1H-purine-2,6-dione CAS Number28947-50-4PubChem CID115374ChemSpider103208UNII3AO7AC8C6KCompTox Dashboard (EPA)DTXSID10276158 Chemical and physical dataFormulaC20H28N6O2Molar mass384.484 g·mol−13D model (JSmol)Interactive image SMILES O...

See also: 2014 Delaware elections 2014 United States House of Representatives election in Delaware, At-large district ← 2012 November 4, 2014 2016 →   Nominee John Carney Rose Izzo Party Democratic Republican Popular vote 137,251 85,146 Percentage 59.3% 36.8% County resultsCarney:      50–60%      60–70% Izzo:      40–50% U.S. Representative before election John Carney Democratic E...

 

 

Vasil Levski Vasil Levski (bahasa Bulgaria: Васил Левски, Pengucapan Bulgaria: [vɐˈsiɫ ˈlɛfski]), lahir sebagai Vasil Ivanov Kunchev (Васил Иванов Кунчев; 18 Juli 1837 – 18 Februari 1873) adalah pahlawan nasional Bulgaria. Dijuluki sebagai Rasul Kebebasan, Levski membentuk dan menyusun strategi untuk gerakan revolusioner yang ingin membebaskan Bulgaria dari kekuasaan Turki Utsmani. Levski mendirikan Organisasi Revolusioner Internal, da...

 

 

Monumen Bartholomäus Ziegenbalg di Tranquebar, Tamil Nadu, India Selatan Bartholomäus Ziegenbalg (7 Oktober 1682 – 23 Februari 1719) adalah seorang pendeta Lutheran, dan misionaris Protestan pertama yang pergi ke India. Masa kecil Ziegenbalg dilahirkan di desa Pulsnitz di Sachsen pada 10 Juli 1682 dalam keluarga Kristen yang miskin namun saleh. Pada usia dini ia memperlihatkan kecakapannya dalam musik. Ia belajar di Universitas Halle di bawah pengajaran A. H. Francke. Halle ...

Collective name used by Cartoon Network for original animated series The Cartoon Cartoons logo, used for the Latin America version of Cartoon Cartoon Fridays. Cartoon Cartoons is a collective name used by Cartoon Network for their original animated television series originally aired from April 28, 1996, to November 8, 2009, and produced in majority by Hanna-Barbera and/or Cartoon Network Studios. The collective name includes the Cartoon Network original series What a Cartoon!, Dexter's Labora...

 

 

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (يوليو 2019) فوسي أو الجبل العذري (بالآيسلندية: Fúsi)‏  الصنف فيلم دراما  تاريخ الصدور 201512 نوفمبر 2015 (ألمانيا)22 أكتوبر 2015 (المجر)[1]  مدة العرض 95 دقيقة  البلد آي�...

 

 

Gliotoxin Names IUPAC name (3R,6S,10aR)-6-Hydroxy-3-(hydroxymethyl)-2-methyl-2,3,6,10-tetrahydro-5aH-3,10a-epidithiopyrazino[1,2-a]indole-1,4-dione Identifiers CAS Number 67-99-2 Y 3D model (JSmol) Interactive image ChEMBL ChEMBL331627 YChEMBL145588 N ChemSpider 5988 Y ECHA InfoCard 100.163.992 PubChem CID 6223 UNII 5L648PH06K Y CompTox Dashboard (EPA) DTXSID60877179 InChI InChI=1S/C13H14N2O4S2/c1-14-10(18)12-5-7-3-2-4-8(17)9(7)15(12)11(19)13(14,6-16)21-20-12/h2-4,8-...

Labuhanbatu beralih ke halaman ini. Untuk kegunaan lain, lihat Labuhanbatu (disambiguasi). Kabupaten LabuhanbatuKabupatenTranskripsi bahasa daerah • Abjad Jawiلابهان بتوKantor Bupati Labuhanbatu LambangMotto: Ika bina en paboloKita bangun dan perbaikiPetaKabupaten LabuhanbatuPetaTampilkan peta SumatraKabupaten LabuhanbatuKabupaten Labuhanbatu (Indonesia)Tampilkan peta IndonesiaKoordinat: 2°16′00″N 100°06′00″E / 2.26667°N 100.1°E࿯...

 

 

Kekhalifahan Kordobaخليفة قرطبة929–1031Iberia sekitar 1000. Wilayah Kekhalifahan Kordoba diwarnai hijau.Ibu kotaKordobaBahasa yang umum digunakanArab Andalusia, Muzarab dan IbraniPemerintahanMonarkiSejarah • Abdurrahman III memproklamasikan dirinya sebagai khalifah.[1] 929• Perpecahan Kekhalifahan menjadi negara-negara kecil Taifa 1031 Luas1000[2]600.000 km2 (230.000 sq mi)Populasi• 1000 10,000,000 Didahului oleh Digant...

 

 

Финал Гран-при по фигурному катанию 2009-2010 Тип соревнования Международный турнир под эгидой ИСУ Дата 3 декабря— 6 декабря Сезон 2009—2010 Место проведения Токио Соревнования Предыдущее Финал Гран-при 2008-2009 Последующее Финал Гран-при 2010-2011 Финал Гран-при по фигурному катанию 2...

Mobile phone model The topic of this article may not meet Wikipedia's notability guidelines for products and services. Please help to demonstrate the notability of the topic by citing reliable secondary sources that are independent of the topic and provide significant coverage of it beyond a mere trivial mention. If notability cannot be shown, the article is likely to be merged, redirected, or deleted.Find sources: Samsung SGH-X820 – news · newspapers · books ...

 

 

弗拉芒布拉班特省Vlaams-Brabant(荷蘭語)Brabant flamand(法語)Flämisch-Brabant(德語) 比利时省份 旗幟徽章坐标:50°55′N 04°35′E / 50.917°N 4.583°E / 50.917; 4.583国家 比利时大区 弗拉芒大区社群 弗拉芒社群省会(及最大城市)鲁汶政府 • 省长Jan Spooren面积[1] • 总计2,106 平方公里(813 平方英里)人口(2021年1月1日[2]�...

 

 

Questa voce o sezione sull'argomento Piemonte non è ancora formattata secondo gli standard. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Questa voce sull'argomento centri abitati della città metropolitana di Torino è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Valpergacomune Valperga – VedutaVeduta LocalizzazioneStato Italia Regione Piemonte Città metropolitana&#...

President of Mexico from 2000 to 2006 This article may need to be rewritten to comply with Wikipedia's quality standards, as The lead consists of important information not included in the body, such as his presidential economic and foreign policy and expulsion from PAN. The presidency section mostly consists of public image and legacy summaries without policy elaboration and features a bulleted list which could be written as plain text. The lead also fails to summarize his pre-presidential li...

 

 

Huruf Kiril Je Penggunaan Fonetis:[j]Alfabet KirilHuruf SlaviaАА́А̀А̂А̄ӒБВГҐДЂЃЕЕ́ÈЕ̂ЁЄЖЗЗ́ЅИИ́ЍИ̂ЙІЇЈКЛЉМНЊОŌПРСС́ТЋЌУУ́ У̀У̂ӮЎФХЦЧЏШЩЪЫЬЭЮЯHuruf non-SlaviaӐА̊А̃Ӓ̄ӔӘӘ́Ә̃ӚВ̌ҒГ̑Г̣Г̌ҔӺҒ̌ӶД̌Д̣Д̆ӖЕ̄Е̃Ё̄Є̈ӁҖӜҘӞЗ̌З̱З̣ԐԐ̈ӠӢИ̃ҊӤҚӃҠҞҜК̣ԚӅԮԒӍӉҢԨӇҤО́О̀О̆О̂О̃ӦӦ̄ӨӨ̄Ө́Ө̆ӪҨԤР̌ҎҪС̣С̱Т̌Т̣ҬУ̃Ӱ Ӱ́Ӱ̄ӲҮҮ́ҰХ̣...