感情認識(かんじょうにんしき、英語: Emotion recognition)は、人間の感情を識別するプロセス。他人の感情を認識する際の正確さは、人によって大きく異なる。感情認識を持つ人々を支援するためのテクノロジーの使用は、比較的初期の研究分野である。一般に、このテクノロジーは、コンテキスト内で複数のモダリティ(人間とコンピュータの相互作用)英語版を使用する場合に最適に機能する。これまで、ほとんどの作業は、ビデオからの顔の表情の認識英語版、音声からの話し言葉、テキストからの書き言葉、およびウェアラブルによって測定される生理学の認識を自動化することで行われてきた。










知識ベースの手法(レキシコンベースの手法と呼ばれることもある)は、特定の感情タイプを検出するために、ドメイン知識と言語の意味論および統語論を利用する。このアプローチでは、感情分類プロセス中に WordNet 、SenticNet[9]ConceptNet 、EmotiNet[10]などの知識ベースのリソースを使用するのが一般的である[11]。このアプローチの利点の1つは、そのような知識ベースのリソースの大規模な可用性によってもたらされるアクセシビリティと経済性[8]。一方、この手法の制限は、概念のニュアンスや複雑な言語規則を処理できない[8]









  1. HUMAINE:複数のモダリティで感情的な単語とコンテキストラベルを備えた自然なクリップを提供する[20]
  2. Belfastデータベース:テレビ番組やインタビューの録音からの幅広い感情をクリップに提供する[21]
  3. SEMAINE:人と仮想エージェントの間の視聴覚録音を提供し、怒り、幸せ、恐怖、嫌悪感、悲しみ、軽蔑、娯楽などの感情の注釈が含まれている[22]
  4. IEMOCAP:俳優間の二者択一のセッションの記録を提供し、幸福、怒り、悲しみ、欲求不満、中立状態などの感情[23]
  5. eNTERFACE:7つの国籍の被験者の視聴覚記録を提供し、幸福、怒り、悲しみ、驚き、嫌悪感、恐怖などの感情[24]
  6. DEAP:脳波記録EEG )、心電図ECG )の記録、顔のビデオ録画、およびフィルムクリップを見ている人々の感情価覚醒英語版、優位性に関する感情の注釈を提供する[25]
  7. DREAMER:脳波記録EEG )と心電図ECG )の記録に加え、フィルムクリップを見ている人々の感情価覚醒英語版、および優位性に関する感情の注釈を提供する[26]
  8. MELD:各発話が感情と感情でラベル付けされているマルチパーティの会話データセット。MELD [27]はビデオ形式で会話を提供するため、マルチモーダル感情認識および感情分析に適している。 MELDは、マルチモーダル感情分析英語版と感情認識、対話システム英語版会話における感情認識英語版に役立つ[28]
  9. MuSe:人と物体の間の自然な相互作用の視聴覚記録を提供する[29]。感情価、覚醒、信頼性の観点から、離散的かつ継続的な感情注釈と、マルチモーダル感情分析および感情認識に役立つ音声トピックがある。
  10. UIT-VSMEC:標準的なベトナムのソーシャルメディア感情コーパス(UIT-VSMEC)であり、6つの感情ラベルを持つ約6,927の人間の注釈付き文があり、自然言語処理(NLP)の低リソース言語であるベトナムの感情認識研究に貢献している[30]
  11. BED:脳波記録( EEG )の記録、および画像を見ている人々の感情価覚醒英語版に関する感情の注釈を提供する。また、EEGベースのバイオメトリクス[31]はいろいろなタスク(SSVEP、目を閉じて休む、目を開いて休む、認知タスク)にさらされる人々の脳波記録(EEG)も含む。





nVisoは、リアルタイムAPIを介してWebおよびモバイルアプリケーションにリアルタイムの感情認識を提供する[35]ヴィサージュ・テクノロジー AB英語版は、マーケティングや科学研究などの目的で、ヴィサージュ SDK英語版の一部として感情推定を提供する[36]














