ניתוח סנטימנט

דוגמה לניתוח סנטימנט של ציוצים בטוויטר

ניתוח סנטימנט (באנגלית: Sentiment analysis) לעיתים נקרא גם כריית דעות או בינה מלאכותית רגשית, הוא השימוש בעיבוד שפה טבעית, כריית טקסט, בלשנות חישובית וביומטריה כדי לזהות, לחלץ, לכמת ולחקור מצבים רגשיים ומידע סובייקטיבי בשיטתיות. ניתוח סנטימנט מיושם באופן נרחב על ביקורות ותגובות לסקרים, רשתות מקוונת וחברתית, ועוד. התחום משתמש במודלי שפה עמוקה כדי לנתח גם תחומי נתונים מורכבים יותר, כגון טקסטים חדשותיים שנכתבים לרוב בשפה בה הדובר נמנע מהבעת דעה או רגש בצורה מפורשת.[1]

ניתוח סנטימנט הוכח כטכניקה בעלת ערך רב עבור מערכות המלצה (מערכות מספקות המלצות למשתמשים על פריטים שעשויים לעניין אותם).

דוגמאות

הדוגמאות הבאות ממחישות את מטרת ניתוח הסנטימנט ואת האתגרים הכרוכים בביצועו.

מקרים פשוטים

  • החרמון הוא ההר היפה ביותר בישראל.
  • סירות דיג משנות ה-80 בצבע פסטל הן מכוערות.
  • אני לא אוהב אופנועים גדולים ומיושנים.

מקרים מאתגרים יותר

  • אני לא יכול שלא לאהוב את המוצר הזה (שלילה כפולה)
  • שומר נפשו ירחק (ביטויים)
  • כשארצה לשמוע את דעתך אני אפנה אלייך (סרקזם)
  • אני אוהב את הנייד שלי אבל לא הייתי ממליץ עליו לקולגות שלי (סנטימנט חיובי מותנה)

סוגי משימות

זיהוי קוטביות

אחת המשימות המרכזיות בניתוח סנטימנט היא סיווג הקוטביות של טקסט נתון. כלומר, זיהוי האם הטקסט הוא חיובי, שלילי או נייטרלי. סיווג סנטימנט מתקדם יותר יזהה מצבים רגשיים נוספים, כמו הנאה, כעס, גועל, עצב, פחד והפתעה.[2]

זיהוי סובייקטיביות/אובייקטיביות

משימה נפוצה נוספת היא סיווג טקסט נתון, בדרך כלל משפט, לאחד מהשניים: אובייקטיבי או סובייקטיבי.[3] משימה זו עלולה להיות מאתגרת, מאחר שהסובייקטיביות של מילים וביטויים היא לעיתים תלוית הקשר, ומסמך אובייקטיבי עשוי להכיל משפטים סובייקטיביים (למשל, מאמר חדשותי המצטט דעות של אנשים). בו פאנג, חוקרת מרכזית בענף ניתוח הסנטימנט, הראתה כי הסרת משפטים אובייקטיביים ממסמך בטרם סיווג הקוטביות שלו עזרה לשפר את הביצועים.

המונח 'אובייקטיבי' מתייחס לאירוע הנושא מידע עובדתי.[4] למשל, המשפט 'כדי להיבחר לנשיא ארצות הברית, מועמד חייב להיות בן שלושים וחמש לפחות'. המונח 'סובייקטיבי' מתאר אירוע באמצעות דעות אישיות ושיפוטיות, למשל המשפט 'אנחנו האמריקאים צריכים לבחור נשיא שהוא בוגר ומסוגל לקבל החלטות נבונות'.

זיהוי תכונה/היבט

משימה זו מתייחסת לזיהוי דעות או רגשות המובעים ביחס לתכונות או היבטים מסוימים של ישות כלשהי, למשל מסך של טלפון סלולרי, שירות של מסעדה או איכות צילום של מצלמה.[5] מאפיינים שונים של אותה ישות יכולים ליצור תגובות רגשיות שונות, למשל למלון יכול להיות מיקום נוח, אבל אוכל בינוני.[6] בעיה זו כוללת מספר בעיות משנה, למשל, זיהוי ישויות רלוונטיות, חילוץ התכונות/ההיבטים של אותן ישויות, וקביעה אם דעה המובעת על כל תכונה/היבט היא חיובית, שלילית או נייטרלית.[7]

דירוג אינטנסיביות

זיהוי עוצמת הרגשות המובעים בטקסט נתון. עוצמה זו היא לעיתים בעלת חשיבות מכרעת בהבנת התחושה המדויקת הנובעת מהטקסט (למשל, 'טוב' לעומת 'מדהים').

שיטות ותכונות

הגישות הקיימות לניתוח סנטימנט מתחלקות לשלוש קטגוריות עיקריות: טכניקות מבוססות ידע, שיטות סטטיסטיות וגישות היברידיות.[8] טכניקות מבוססות ידע מסווגות טקסט לפי קטגוריות השפעה בהתבסס על נוכחותן של מילות השפעה חד משמעיות כמו שמח, עצוב, מפחד או משועמם.[9] שיטות סטטיסטיות כוללות אלמנטים מתחום למידת המכונה, כמו LSA (ניתוח סמנטי סמוי - צורה של עיבוד שפה טבעית המבוססת על הרעיון שמילים המשמשות בהקשרים דומים נוטים להיות בעלי משמעויות דומות), מכונת וקטורים תומכים, "Bag-of-words", למידה עמוקה ועוד. השיטות לוקחות בחשבון, מעבר למילים עצמן, את ההקשר בו הן נאמרות או נכתבות, את סביבתן, ואת משמעותן. גישות היברידיות משתמשות הן בשיטות למידת מכונה והן באלמנטים מענף ייצוג ידע כגון אונטולוגיות ורשתות סמנטיות, על מנת לזהות סמנטיקה המתבטאת בצורה עדינה. זאת, למשל, באמצעות ניתוח מושגים שאינם מעבירים מידע רלוונטי במפורש, אך מקושרים באופן מרומז למושגים אחרים שעושים זאת.[10]

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא ניתוח סנטימנט בוויקישיתוף

הערות שוליים

  1. ^ Hamborg, Felix; Donnay, Karsten (2021). "NewsMTSC: A Dataset for (Multi-)Target-dependent Sentiment Classification in Political News Articles". "Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume"
  2. ^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Thi-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen. "Emotion Recognition for Vietnamese Social Media Text". In Proceedings of the 2019 International Conference of the Pacific Association for Computational Linguistics (PACLING 2019), Hanoi, Vietnam (2019).
  3. ^ Pang, Bo; Lee, Lillian (2008). "4.1.2 Subjectivity Detection and Opinion Identification". Opinion Mining and Sentiment Analysis. Now Publishers Inc.
  4. ^ Wiebe, Janyce; Riloff, Ellen (2005). Gelbukh, Alexander (ed.). "Creating Subjective and Objective Sentence Classifiers from Unannotated Texts". Computational Linguistics and Intelligent Text Processing. Lecture Notes in Computer Science (באנגלית). Berlin, Heidelberg: Springer. 3406: 486–497. doi:10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6.
  5. ^ Hu, Minqing; Liu, Bing (2004). "Mining and Summarizing Customer Reviews". Proceedings of KDD 2004.
  6. ^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (2013-06-22). "Good location, terrible food: detecting feature sentiment in user-generated reviews". Social Network Analysis and Mining. 3 (4): 1149–1163. CiteSeerX 10.1.1.396.9313. doi:10.1007/s13278-013-0119-7. ISSN 1869-5450.
  7. ^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Opinion Observer: Analyzing and Comparing Opinions on the Web". Proceedings of WWW 2005.
  8. ^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "New avenues in opinion mining and sentiment analysis". IEEE Intelligent Systems. 28 (2): 15–21. CiteSeerX 10.1.1.688.1384. doi:10.1109/MIS.2013.30.
  9. ^ Ortony, Andrew; Clore, G; Collins, A (1988). The Cognitive Structure of Emotions (PDF). Cambridge Univ. Press. אורכב מ-המקור (PDF) ב-2015-11-23.
  10. ^ Cambria, E; Hussain, A (2015). Sentic Computing: A Common-Sense-Based Framework for Concept-Level Sentiment Analysis. Springer. ISBN 9783319236544.

Read other articles:

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Oktober 2022. Kamus etimologi adalah kamus berupa daftar berbagai etimologi. Kamus raksasa seperti Oxford English Dictionary dan Webster's juga menyediakan informasi tentang etimologi tanpa berfokus pada bidang tersebut. Artikel bertopik bahasa ini adalah sebuah rin...

 

Czekanowskiales (juga dikenal sebagai Leptostrobales) adalah ordo tumbuhan runjung yang punah. Anggota ordo ini bertahan hidup dari zaman Trias Akhir hingga Kapur Akhir di sub-kala Maastrichtium sebelum akhirnya punah bersama dinosaurus dan ammonit pada peristiwa kepunahan Kapur–Paleogen. Czekanowskiales Periode Trias Akhir - Maastrichtium PreЄ Є O S D C P T J K Pg N Fosil daun Phoenicopsis angustifoliaTaksonomiKerajaanPlantaeDivisiEmbryophyta siphonogamaDivisiGymnospermaeDivisiGinkgophyt...

 

Bagian dari seriIslam Rukun Iman Keesaan Allah Malaikat Kitab-kitab Allah Nabi dan Rasul Allah Hari Kiamat Qada dan Qadar Rukun Islam Syahadat Salat Zakat Puasa Haji Sumber hukum Islam al-Qur'an Sunnah (Hadis, Sirah) Tafsir Akidah Fikih Syariat Sejarah Garis waktu Muhammad Ahlulbait Sahabat Nabi Khulafaur Rasyidin Khalifah Imamah Ilmu pengetahuan Islam abad pertengahan Penyebaran Islam Penerus Muhammad Budaya dan masyarakat Akademik Akhlak Anak-anak Dakwah Demografi Ekonomi Feminisme Filsafat...

يفتقر محتوى هذه المقالة إلى الاستشهاد بمصادر. فضلاً، ساهم في تطوير هذه المقالة من خلال إضافة مصادر موثوق بها. أي معلومات غير موثقة يمكن التشكيك بها وإزالتها. (يوليو 2019) الحدثكأس الكؤوس الأوروبية 1979–80 نادي فالنسيا نادي أرسنال 0 0 التاريخ14 مايو 1980  الملعبملعب الملك بودوان...

 

Oldest form of Shaivism Part of a series onShaivism DeitiesParamashiva(Supreme being) Shiva Sadasiva Bhairava Rudra Virabhadra Shakti Parvati Sati Durga Kali Ganesha Kartikeya Forms of Shiva Others Scriptures and texts Vedas Agama-Tantras Shivasutras Tirumurai Vachanas Svetasvatara Philosophy Three Components Pati Pashu Pasam Three bondages Anava Karma Maya other aspects 36 Tattvas Yoga Satkaryavada Abhasavada Svatantrya Aham Practices Vibhuti Rudraksha Panchakshara Bilva Maha Shivaratri Yama...

 

State Forest in Washington County, Wisconsin Loew Lake Unit, Kettle Moraine State ForestIUCN category V (protected landscape/seascape)The Ice Age Trail passes through the Loew Lake unitShow map of WisconsinShow map of the United StatesLocationWashington, Wisconsin, United StatesCoordinates43°13′7″N 88°18′52″W / 43.21861°N 88.31444°W / 43.21861; -88.31444Area1,090 acres (4.4 km2)Established1987Governing bodyWisconsin Department of Natural Resources...

Pour les articles homonymes, voir France (homonymie), section Navires. France Autres noms PicardieFrance IV Type Paquebot transatlantique Histoire Chantier naval Chantiers de Penhoët, Saint-Nazaire, France Quille posée Février 1909 Lancement 10 septembre 1910 Mise en service 20 avril 1912 Statut Démoli en 1935 Équipage Équipage 500 Caractéristiques techniques Longueur 217 m Maître-bau 23,88m Port en lourd 6 384 tpl Tonnage 24 666 tonnes Propulsion 4 turbines à action directe tr...

 

Nur MisuariNur Misuari pada 2009. Ketua Komite Pusat Front Pembebasan Nasional Moro[1]Presiden Republik Bangsamoro (Tidak diakui)Masa jabatan12 Agustus 2013 – 28 September 2013PresidenFidel Ramos (1992-1998) Joseph Estrada (1998-2001) Gloria Macapagal-Arroyo (2001-2010)PendahuluLininding PangandamanPenggantiAlvarez IsnajiGubernur Wilayah Otonomi Muslim Mindanao ke-3Masa jabatan1996–2001 Informasi pribadiLahir03 Maret 1939 (umur 85)Tapul, Sulu, Persemakmuran FilipinaS...

 

American writer (1935–2011) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Carl Oglesby – news · newspapers · books · scholar · JSTOR (December 2015) (Learn how and when to remove this message) Carl Preston Oglesby Carl Preston Oglesby (July 30, 1935 – September 13, 2011) was an American writer, academ...

Viện Nghiên cứu lập pháp Quốc hội Việt Nam Quốc kỳ Việt Nam Quốc huy Việt Nam Cơ cấu tổ chức Phương thức liên hệ ' Trang web quochoi.vn/viennghiencuulapphap Cơ quan tương đương {{{a}}} Viện Nghiên cứu lập pháp là cơ quan thuộc Ủy ban Thường vụ Quốc hội, có chức năng nghiên cứu khoa học lập pháp, những vấn đề lý luận, thực tiễn về tổ chức và hoạt động của Quốc hội Việt Nam; tổ ch...

 

SMA Negeri 4 SemarangInformasiDidirikan16 Januari 1978JenisSekolah NegeriNomor Statistik Sekolah30006Nomor Pokok Sekolah Nasional30.1.03.63.04.004Kepala SekolahWiwin Sri Winarni, S.S.AlamatLokasiJl. Karangrejo Raya 12A Banyumanik, Semarang, Jawa Tengah,  IndonesiaTel./Faks.+62 24 7471 540Situs [email protected] SMA Negeri 4 Semarang, merupakan salah satu Sekolah Menengah Atas Negeri yang ada di Semarang, yang beralamat di Jl. Karangrejo Raya 12A ...

 

Luigi Bettazzivescovo della Chiesa cattolicaMons. Luigi Bettazzi, nella cattedrale di Bologna, per l'ingresso in diocesi dell'arcivescovo Matteo Maria Zuppi, il 12 dicembre 2015. In charitate Dei ✠ In patientia Christi  Incarichi ricoperti Vescovo titolare di Tagaste (1963-1966) Vescovo ausiliare di Bologna (1963-1966) Vescovo di Ivrea (1966-1999) Presidente di Pax Christi Italia (1968-1985)  Nato26 novembre 1923 a Treviso Ordinato presbitero4 agosto 1946 dal cardinale Giovanni Ba...

Medical conditionComplications of pregnancy810 women die every day from preventable causes related to pregnancy and childbirth. 94% occur in low and lower middle-income countries.SpecialtyObstetricsComplicationsNumerous biological and environmental complicationsRisk factorsNumerous biological and environmental conditions Complications of pregnancy are health problems that are related to, or arise during pregnancy. Complications that occur primarily during childbirth are termed obstetric labor...

 

Part of a series onChicanos and Mexican Americans Terms Identity Chola/o La Raza Pachuca Pachuco Pinta/o Xicanx Concepts Anti-Mexican sentiment History Early-American Period Josefa Segovia Las Gorras Blancas Mexican–American War Mutualista San Elizario Salt War Sonoratown Treaty of Guadalupe Hidalgo Pre-Chicano Movement 1917 Bath riots Bisbee Deportation Bloody Christmas Bracero program California agricultural strikes Cantaloupe strike of 1928 Citrus Strike of 1936 La Matanza Mexican Repatr...

 

Sue BarkerNazionalità Regno Unito Altezza165 cm Tennis Termine carriera1984 Carriera Singolare1 Vittorie/sconfitte 365 - 208 Titoli vinti 15 Miglior ranking 4º (20 marzo 1977) Risultati nei tornei del Grande Slam  Australian Open SF (1975, 1977 (dicembre))  Roland Garros V (1976)  Wimbledon SF (1977)  US Open 3T (1976) Altri tornei  Tour Finals F (1977) Doppio1 Vittorie/sconfitte 33 - 38 Titoli vinti 0 Miglior ranking 70º (12 ottobre 1987) Risultati nei tornei...

1997 novel by Lance Parkin This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: The Dying Days – news · newspapers · books · scholar · JSTOR (August 2024) (Lear...

 

Relative motion of two surfaces in contact or separated by a thin film of fluid Part of a series onClassical mechanics F = d p d t {\displaystyle {\textbf {F}}={\frac {d\mathbf {p} }{dt}}} Second law of motion History Timeline Textbooks Branches Applied Celestial Continuum Dynamics Kinematics Kinetics Statics Statistical mechanics Fundamentals Acceleration Angular momentum Couple D'Alembert's principle Energy kinetic potential Force Frame of reference Inertial frame of reference Impulse Inert...

 

The State Chancellor of Prussia was the highest minister of the Kingdom of Prussia and existed from 1807 to 1850. The State Chancellor was the forerunner to the Prime Minister of Prussia. History Portrait of Prince Karl August von Hardenberg, after Thomas Lawrence. The State Chancellor was primarily a subordinate executive body and overseer of the State Administration. He usually also chaired the Prussian State Council, especially when the King himself did not do so. The Chancellor's official...

هذه المقالة تحتاج للمزيد من الوصلات للمقالات الأخرى للمساعدة في ترابط مقالات الموسوعة. فضلًا ساعد في تحسين هذه المقالة بإضافة وصلات إلى المقالات المتعلقة بها الموجودة في النص الحالي. (ديسمبر 2023) هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة...

 

Time zone (UTC+01:00) Time in Europe: Light Blue Western European Time / Greenwich Mean Time (UTC) Blue Western European Time / Greenwich Mean Time (UTC) Western European Summer Time / British Summer Time / Irish Standard Time (UTC+1) Red Central European Time (UTC+1) Central European Summer Time (UTC+2) Yellow Eastern European Time / Kaliningrad Time (UTC+2) Ochre Eastern European Time (UTC+2) Eastern European Summer Time (UTC+3) Green Moscow Time / Turkey Time (UTC+3) Turquoise Armenia Time...