Analisi del sentiment

Analisi del sentimento

L'analisi del sentiment o sentiment analysis (nota anche come opinion mining) è un campo dell'elaborazione del linguaggio naturale che si occupa di costruire sistemi per l'identificazione ed estrazione di opinioni dal testo. Si basa sui principali metodi di linguistica computazionale e di analisi testuale. L'analisi del sentiment è utilizzata in molteplici settori: dalla politica ai mercati azionari, dal marketing alla comunicazione, dall'ambito sportivo a quello delle scienze mediche e naturali, dall'analisi dei social media alla valutazione delle preferenze del consumatore.

Metodi e caratteristiche

Gli approcci esistenti all'analisi del sentiment possono essere raggruppati in 4 categorie principali[1]:

  • spotting di parole chiave;
  • affinità lessicale;
  • metodi statistici;
  • tecniche di livello concettuale.

La prima classifica il testo da categorie influenti basata sulla presenza di parole influenti non ambigue come contento, triste, impaurito, annoiato[2]. L'affinità lessicale non rileva solamente le parole influenzanti, ma anche assegna arbitrariamente alle parole una probabile affinità a emozioni particolari[3]. I metodi statistici fanno leva invece su elementi tratti dal machine learning come analisi semantica latente, macchine a vettori di supporto, bag of words e orientazione semantica[4]. Per estrapolare l'opinione in un contesto e ottenerne delle caratteristiche, sono usate le relazioni grammaticali delle parole. Le relazioni sono ottenute da un'analisi sintattica profonda del testo[5]. A differenza delle tecniche puramente sintattiche, gli approcci a livello concettuale fanno leva sugli elementi della rappresentazione della conoscenza come le ontologie e le reti semantiche, e quindi, sono capaci di rilevare semantiche che sono espresse in maniera sottile[6].

Sentiment analysis e Web 2.0

Risorse di analisi del sentiment

Vocabolari sentiment e parole:

Analizzatori di sentiment:

  • AlchemyAPI[15] (commercial);
  • BitextAPI[16] (commercial);
  • Semantria[17] (commercial);
  • Sentiment140[18] (commercial, for Twitter);
  • Stanford NLP[19] (academic);
  • Twinword[20] (commercial, free / unlimited);
  • Werfamous[21] (free);
  • WordStat[22] (commercial);
  • Buzzlogix[23] (free and commercial versions).

Documenti con annotazioni manuali di sentiment che possono essere usati per valutare gli algoritmi):

  • Twitter dataset in 4 languages[24] (12,500 tweet).

Note

  1. ^ Erik Cambria, Björn Schuller, Yunqing Xia e Catherine Havasi, New Avenues in Opinion Mining and Sentiment Analysis, in IEEE Intelligent Systems, vol. 28, n. 2, 2013, pp. 15–21, DOI:10.1109/MIS.2013.30.
  2. ^ Andrew Ortony, G Clore e A Collins, The Cognitive Structure of Emotions (PDF), Cambridge Univ. Press, 1988 (archiviato dall'url originale il 23 novembre 2015).
  3. ^ Ryan Stevenson, Joseph Mikels e Thomas James, Characterization of the Affective Norms for English Words by Discrete Emotional Categories (PDF), in Behavior Research Methods, vol. 39, n. 4, 2007, pp. 1020–1024. URL consultato il 7 febbraio 2016 (archiviato dall'url originale il 4 marzo 2016).
  4. ^ Peter Turney, Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews, in Proceedings of the Association for Computational Linguistics, 2002, pp. 417–424, arXiv:cs.LG/0212032.
  5. ^ Lipika Dey e S. K. Mirajul Haque, Opinion Mining from Noisy Text Data, in Proceedings of the second workshop on Analytics for noisy unstructured text data, p.83-90, 2008.
  6. ^ Erik Cambria e Amir Hussain, Sentic Computing: Techniques, Tools, and Applications (PDF), Springer, 2012.
  7. ^ generating the Affective Norms for English Words (ANEW) dataset, su tomlee.wtf.
  8. ^ Ryan A. Stevenson, Joseph A. Mikels e Thomas W. James, Characterization of the Affective Norms for English Words by discrete emotional categories, in Behavior Research Methods, vol. 39, n. 4, 1º novembre 2007, pp. 1020–1024, DOI:10.3758/BF03192999, ISSN 1554-351X (WC · ACNP).
  9. ^ a b SenticNet, su sentic.net.
  10. ^ Erik Cambria, Daniel Olsher e Dheeraj Rajagopal, SenticNet 3: A common and common-sense knowledge base for cognition-driven sentiment analysis (PDF), in Proceedings of AAAI, 2014, pp. 1515–1521.
  11. ^ Stefano Baccianella, Andrea Esuli e Fabrizio Sebastiani, Sentiwordnet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining (PDF), in Proceedings of LREC, 2010, pp. 2200–2204. URL consultato il 5 aprile 2014.
  12. ^ SentiWordNet, su cnr.it. URL consultato il 7 febbraio 2016 (archiviato dall'url originale il 26 novembre 2017).
  13. ^ Carlo Strapparava e Alessandro Valitutti, WordNet-Affect: An affective extension of WordNet (PDF), in Proceedings of LREC, 2004, pp. 1083–1086 (archiviato dall'url originale il 3 marzo 2016).
  14. ^ Manuela Speranza, FBK, WordNet Domains, su fbk.eu.
  15. ^ Copia archiviata, su alchemyapi.com. URL consultato il 7 febbraio 2016 (archiviato dall'url originale il 21 settembre 2009).
  16. ^ https://www.bitext.com/
  17. ^ Semantria Web Demo - semantria.com, su semantria.com.
  18. ^ API - Sentiment140 - A Twitter Sentiment Analysis Tool, su sentiment140.com. URL consultato il 7 febbraio 2016 (archiviato dall'url originale il 3 marzo 2016).
  19. ^ Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank, su Deeply Moving: Deep Learning for Sentiment Analysis.
  20. ^ Twinword Sentiment Analysis API Web Demo, su twinword.com.
  21. ^ A Twitter and web sentiment analysis tool, su werfamous.com. URL consultato il 31 gennaio 2021 (archiviato dall'url originale il 14 agosto 2018).
  22. ^ Content analysis software for sentiment analysis, su provalisresearch.com.
  23. ^ (EN) Text Analysis & Sentiment Analysis API | Buzzlogix, su Buzzlogix | Text Analysis API, Buzzlogix.com. URL consultato il 23 novembre 2015 (archiviato dall'url originale il 25 novembre 2015).
  24. ^ DAI-Labor > Competence Centers > CC IRML > Datasets > Annotated Sentiment Dataset, su dai-labor.de. URL consultato il 7 febbraio 2016 (archiviato dall'url originale il 29 febbraio 2016).

Altri progetti

Collegamenti esterni