アフェクティブ・コンピューティング:特許・論文・グラントで見る感情認識AI技術の最前線
著者:アスタミューゼ株式会社 三田 歩 博士(理学)
目次
アフェクティブ・コンピューティングとは?
人間の感情を認識・処理するAI技術への期待が、いま急速に高まっています。メンタルヘルスの社会問題化、顧客体験向上への企業需要、自動運転における安全要件の高度化——複数の社会課題が重なるなか、感情を「計算可能」にする技術として注目されているのが、アフェクティブ・コンピューティング(Affective Computing)です。
アフェクティブ・コンピューティングとは、コンピュータが人間の感情を認識・解釈・処理し、さらには感情におうじた応答を生成する技術・研究領域の総称です。1997年にMITメディアラボのロザリンド・ピカード教授が著書『Affective Computing』(注1)のなかで提唱した概念であり、以来、人工知能・認知科学・心理学・神経科学が交差する学際的な領域として発展を続けてきました。
注1:Picard, R. W. (1997). Affective Computing. MIT Press. https://mitpress.mit.edu/9780262661157/affective-computing/
感情の認識に使用されるおもな入力手段としては、顔の表情、視線、音声、生体信号(脳波、心拍、皮膚電気活動など)、行動データがあげられます。これらを単独あるいは組みあわせてもちいる「マルチモーダル感情認識」が、現在の研究開発の主流となっています。応用先はヘルスケア(メンタルヘルスモニタリング、診断支援)、モビリティ(ドライバーの状態推定)、教育(学習者の集中・理解度推定)、顧客体験(感情適応型チャットボット)など、産業横断的なひろがりを見せています。
アフェクティブ・コンピューティングとしばしば混同される概念として感性工学(Kansei Engineering)があります。感性工学は、人間の感性や感情的な反応を製品設計・ものづくりに活かす日本発の工学的アプローチであり、1970年代に広島大学の長町三生教授らによって体系化されました(注2)。
注2:長町三生(1989).『感性工学』.海文堂出版.
感性工学が「感情を製品設計に反映させる」という設計思想を軸とするのに対し、アフェクティブ・コンピューティングは「感情をリアルタイムに認識・処理するシステム」の構築を主眼とする点で区別されます。両者は感情を技術と結びつけるという方向性を共有しつつも、アプローチと応用領域において異なる系譜を持ちます。本レポートでは、両者を区別したうえで、アフェクティブ・コンピューティングを分析対象として論じます。
近年の技術的加速を牽引しているのは、深層学習(Deep Learning)の発展とセンサ技術の小型化・低価格化です。従来は研究室内でしか実現できなかった高精度な感情推定が、スマートフォンやウェアラブルデバイス、車載カメラといった実環境のデバイス上で動作しつつあります。アスタミューゼの独自データベースをもちいた分析では、アフェクティブ・コンピューティングに関連する特許出願件数は2015年から2024年の10年間で約22倍に増加しており、その伸びはAI分野のなかでもきわだった水準です。 この「研究から実装へ」の移行が、産業界における特許出願・研究投資・スタートアップ創出の急増として如実にあらわれています。次章以降では、その実態をデータにもとづいて詳細に分析します。
アフェクティブ・コンピューティングに関連する特許の動向
アスタミューゼの保有する特許データベースから、「感情認識」「アフェクティブ・コンピューティング」「感情推定」「マルチモーダル感情」などの技術要素を要約にふくむ2015年以降の特許母集団6,604件を抽出し、ふくまれるキーワードの年次推移から近年進展のある技術要素を特定する「未来推定」分析を実施しました。キーワードの変遷を把握することで、ブームが去った技術やこれから脚光をあびると予測される技術を定量的に評価し、それぞれの要素技術に対する技術ステータス(黎明・萌芽・成長・実装)を予測する分析です。

成長率(Growth)は、2015年以降の文献中における出現回数と、2020年以降の文献中における出現回数の比で定義されます。値が1に近いキーワードほど直近の出現頻度が高く、近年注目されているキーワードとみなせます。
成長率の高いキーワードのなかから注目すべきものを紹介します。
- 被験者横断(cross-subject):成長率0.977。異なる個人間でも安定して機能する汎用的な感情認識モデルの開発をしめすキーワードです。従来のモデルは特定の人物のデータで学習・評価されることが多く、他者への転用精度が低いという課題がありました。このキーワードの急増は、個人差を超えた頑健なシステム実現への研究開発が本格化していることをしめしています。
- クロスモーダル(cross-modal):成長率0.989。あるモダリティ(感情を入力するための、音声や表情、脳波といった信号の種類)で学習した知識を別のモダリティに転用・対応づける技術で、マルチモーダルのより高度な発展形です。2019年の1件から2024年には42件へと急増しています。
- マルチモーダル(multi-modal):成長率0.922。音声や表情、生体信号など複数の入力を同時に組みあわせて感情を推定するアプローチで、単一モダリティと比較して認識精度が大幅に向上することから、アフェクティブ・コンピューティングの基本設計として広く採用されています。2016年の2件から2024年には245件へと増加しています。
- 脳波(electroencephalogram):成長率0.929。2016年の1件から2024年には150件へと急増しており、非侵襲的に内面状態を直接計測できる手段として、ヘルスケアや教育分野での応用を念頭に置いた研究開発が活発化しています。
これらのキーワードの変遷からは、アフェクティブ・コンピューティングの特許開発が、単一のモダリティによる単純な感情分類から、複数モダリティを融合した高精度・高汎用性のシステム開発へと急速にシフトしていることが読みとれます。
続いて、特許出願数の国別の動向です。図2は、2015年以降におけるアフェクティブ・コンピューティング関連特許の国別出願件数の年次推移です。特許データは出願から公開までタイムラグがあるため、直近である2024〜2025年の集計値は参考値としてあつかう必要があります。

国別では中国での出願件数がもっとも多く、全体の78.6%(5,192件)を占めています。2015年の47件から2024年には1,049件へと約22倍に増加しており、長期的な増加傾向が続いています。中国では、第14次五か年計画(2021〜2025年)においてAI技術を国家重点分野に位置づけており、感情認識を含むAI応用技術への積極的な産学両輪での投資がこの急増を支えていると考えられます。
次いで米国(5.8%、386件)、国際出願(WIPO)(5.1%、336件)、韓国(3.9%、256件)、日本(3.3%、216件)が続いています。中国が圧倒的な「量」をリードするなか、米国は後述するスタートアップ企業群や研究助成の規模において「質」での優位性をたもっています。
出願人別では、平安保険(Ping An Technology Shenzhen Co., Ltd.)が211件でトップを独走しており、金融・保険業界が感情分析技術の実用化にもっとも積極的な産業のひとつであることをしめしています。これに南京郵電大学(105件)、華南理工大学(82件)、重慶郵電大学(74件)と中国の通信・情報系大学が続きます。非中国圏ではMicrosoft Technology Licensing(54件)が8位に入っています。
日本からは、ソニーグループ(感情認識に基づくサービス提供制御)、NEC(顔表情認識による空調制御)、ヤマハ発動機(生体情報を用いた感情推定デバイス)、デンソー(車内での感情推定と走行データ連携)など、完成品メーカーによる実装指向の特許出願が目立ちます。中国の大学・IT企業主導の基盤技術開発とは対照的に、日本では既存の製品やサービスへの感情認識AI統合を志向した応用開発が先行していることがうかがえます。
以下は、注目の特許事例です。
- CN119763175A「Multi-modal emotion recognition method and psychological intervention system」
- 出願人:南京情報工程大学(Nanjing University of Information Science & Technology)
- 国:中国
- 公開年:2025年
- 概要:顔の特徴点・音声・映像を組み合わせたマルチモーダル感情認識システムと、その結果を活用した心理介入システムを一体化した特許。静的な瞬間の認識にとどまらず感情の動的変化をリアルタイムに追跡できる点が特徴で、メンタルヘルス支援への応用を想定している。マルチモーダルやクロスモーダルのキーワード急増を体現する代表的な事例。
- CN119924834A「Personnel emotion recognition method and device based on EEG-fNIRS multi-mode signals」
- 出願人:Nanjing Jinfa Health Industry Co., Ltd. / KINGFAR International Inc.
- 国:中国
- 公開年:2025年
- 概要:脳波(electroencephalogram)と機能的近赤外線分光法(fNIRS)という2種類の生体信号を組みあわせてマルチモーダルで感情を推定する手法に関する特許。脳波の空間分解能の低さとfNIRSの応答遅延というそれぞれの弱点を相互補完することで認識精度を向上させる。医療やヘルスケア分野への応用を想定した企業発の実用指向の特許。
- WO2025154660A1「Method, Apparatus and System for Adaptively Regulating Surrounding Temperature of Area Using Facial Expression Recognition」
- 出願人:日本電気株式会社(NEC Corporation)
- 国:日本
- 公開年:2025年
- 概要:顔表情認識により人物の感情状態(感情価・覚醒度)を推定し、エリアの目標感情状態に合わせて周囲温度を自動調整する空調制御システムに関する特許。オフィスや商業施設、公共交通機関などへの応用が期待される。
- WO2025164009A1「Data Communication System, Center Device, Vehicle Device, Data Processing Method, and Data Processing Program」
- 出願人:株式会社デンソー(DENSO CORPORATION)
- 国:日本
- 公開年:2025年
- 概要:車両内でユーザーの感情を継続的に推定し、設定されたトリガー条件が満たされた際に感情データと走行操作ログ・車両状態データをセンターデバイスへ送信するシステムに関する特許。感情状態と運転行動の相関分析を可能にし、安全運転支援や自動運転との統合への展開が期待される。
アフェクティブ・コンピューティングに関連する論文の動向
企業や研究機関の発表する論文は、研究開発段階にあり、特許と比較すると社会実装までに時間を要する中長期の様相が反映されます。アスタミューゼの保有する論文データベースから、アフェクティブ・コンピューティングに関連するキーワードを概要にふくむ2015年以降の論文母集団28,806件を抽出し、未来推定分析をおこないました。

特許分析と同様に、成長率の高いキーワードから近年の研究動向を読み解きます。論文で特筆すべきは、感情認識の評価にもちいられる公開ベンチマークデータセットの名称が上位を占めている点です。
- セッション横断(cross-session):成長率0.969。異なる計測セッション間でも有効な感情認識を実現するための研究が急増しています。被験者横断(cross-subject)が「異なる人物間」での汎用性を追求するのに対し、セッション横断(cross-session)は「同一人物の異なる計測日・状況」でも安定して機能するモデルの開発をめざす点で区別されます。2022年の12件から急増しており、汎用化のもうひとつの側面として注目されます。
- SEED-IV:成長率0.965。脳波(electroencephalogram)をもちいた感情認識の標準ベンチマークデータセット。2018年以降に急増し、2023年には47件と、脳波×感情認識研究の主要評価基盤として定着しています。
- RAVDESS:成長率0.941。音声・映像を組み合わせた感情表現データセット。2021年以降に急増(73件)しており、音声感情認識やマルチモーダル研究のデファクトスタンダードとして広く利用されています。
- BERT:成長率0.977。大規模言語モデル(LLM)の代表格であるBERTを感情認識・感情分析に応用する研究が2019年以降に急増しており、大規模言語モデルとの融合という最新潮流を反映しています。
これらのキーワード群は、アフェクティブ・コンピューティング研究が「マルチモーダル化」「感情認識の汎用化・頑健性の向上」「大規模言語モデルとの融合」という三つの方向性で急速に深化していることを示しています。
続いて、論文出版件数の年次推移です。図4は、2015年以降のアフェクティブ・コンピューティング関連論文の出版件数の年次推移です。

論文件数は2015年の1,609件から2023年には4,279件へと約2.7倍に増加しており、長期的な増加傾向が続いています。
以下は、注目の論文事例です。
- Cross-Lingual Bimodal Emotion Recognition with LLM-Based Label Smoothing
- 雑誌名:Big Data and Cognitive Computing
- DOI:10.3390/bdcc9110285
- 出版年:2025年
- 機関名:HSE University / St. Petersburg Federal Research Center(ロシア)
- 概要:音声とテキストの2モダリティによる感情認識に、大規模言語モデル(Qwen3-4B・ChatGPT-5)を活用したラベルスムージングとデータ拡張を組みあわせた手法に関する論文。英語・ロシア語間のクロスリンガル転移を実現し、言語をまたいだ汎用感情認識モデルの構築に成功している。BERTをはじめとする大規模言語モデルとアフェクティブ・コンピューティングの融合という最新潮流を体現する研究。
- Multimodal Emotion-Aware Conversational Agent for Mental Health Support Using Deep Learning and Generative AI
- 雑誌名:International Journal of Advanced Research in Science, Communication and Technology
- DOI:10.48175/ijarsct-29926
- 出版年:2025年
- 機関名:Pune Institute of Computer Technology(インド)
- 概要:テキスト・顔表情・生理信号の3モダリティを統合したマルチモーダル感情認識エージェントをメンタルヘルス支援に応用した論文。Transformerベースの言語モデルとビジョントランスフォーマー(Vision Transformer)を組みあわせ、感情に応じた共感的応答を生成するシステムを構築。大規模言語モデルとアフェクティブ・コンピューティングの融合がメンタルヘルス領域での実用化へむかう潮流をしめす。
- Attention-Based Transfer Enhancement Network for Cross-Corpus EEG Emotion Recognition
- 雑誌名:Sensors
- DOI:10.3390/s25185718
- 出版年:2025年
- 機関名:マカオ理工大学 / 梧州大学(中国)
- 概要:SEED・SEED-IV・SEED-Vの6タスクにおいてクロスコーパス(異なるデータセット間)での脳波感情認識の精度向上を実現した論文。ノイズ耐性を高めるNERM(Noise-Enhanced Representation Modeling)と多スケール周波数特徴を抽出するWTRM(Wavelet Transform Representation Modeling)の2つの自己教師あり学習を組みあわせた事前学習フレームワーク(CATE)を提案。従来手法を最大15.65ポイント上回る精度を達成しており、被験者横断(cross-subject)およびセッション横断(cross-session)の汎用化課題に正面から取りくむ最新事例。
アフェクティブ・コンピューティングに関連するグラントの動向
グラント(競争的研究資金)には、まだ論文発表や特許出願にいたっていない、新たなアプローチや研究に対する投資の動向が反映されます。特許や論文と比較して、社会実装までにより長い時間を要する技術に関わる長期的な研究動向をしめすデータといえます。
アスタミューゼの保有するグラントデータベースから、アフェクティブ・コンピューティングに関連するキーワードを概要にふくむ2015年以降のグラント情報621件を抽出し、未来推定分析をおこないました。

特許・論文分析と同様に、成長率の高いキーワードから研究投資の動向を読み解きます。グラントの成長率上位には、MPathic-IBCHという単一の研究プロジェクト由来のワードが多くランクインしています。MPathic-IBCHは、医療現場における人種的な無意識の偏見(Implicit Bias)を是正することを目的としたAIベースの医師教育システムです。音声の韻律や声調、音量といったパラ言語的(paraverbal)な感情表現と、視線やジェスチャー、身体の傾きといった非言語的(nonverbal)な感情表現をリアルタイムに認識し、医師に対して詳細かつ個別化されたフィードバックを提供します。顔面表情の分析にはEMFACS(感情特化顔面動作符号化システム)および商用ツールのFaceReaderを活用しており、これらのキーワードの急増はMPathic-IBCHの継続的な研究投資を反映しています。このようなシステムはヘルスケア・医療教育分野におけるアフェクティブ・コンピューティングの新たな応用領域として注目されます。
続いて、グラントの件数および配賦額です。アフェクティブ・コンピューティングに関連するグラントの国別の件数推移が図6、配賦額の推移が図7です。なお、中国はグラントデータの開示状況が年次により大きく異なり、実態を反映しない可能性が高いことから除外しています。また、公開直後のグラント情報はデータベースに格納されていない場合があり、直近の集計値については過小評価されている可能性があります。


グラントの国別動向をみると、件数では日本が190件と最多ですが、配賦額では米国が全体の約54%(約9,303万ドル、153件)で断トツのトップです。次いでEU(約2,979万ドル、24件)、日本(約1,298万ドル、190件)、スイス(約741万ドル、25件)が続きます。
1件あたりの平均配賦額は日本が約6.8万ドルにとどまるのに対し、米国は約60.8万ドル、EUは約124.1万ドルと大きな開きがあります。これは研究規模の構造的な違いをしめしており、米国やEUが大型のコンソーシアム型研究プロジェクトを牽引しているのに対し、日本は比較的小規模・個人研究者単位での資金配分が主流であることを反映していると考えられます。
以下に、注目の研究プロジェクト事例を紹介します。
- AI Institute: Institute for Student-AI Teaming
- 機関/企業:The Regents of the University of Colorado
- グラント名/国:National Science Foundation(NSF)/米国
- 採択年:2020年
- 期間:2020~2026年
- 研究配賦額:約1,979万ドル
- 概要:AIと学習者が協働するチーミング型学習環境の構築を目指す大型研究プロジェクト。学習者の感情・認知状態をリアルタイムに把握し、AIが適応的なフィードバックを提供するシステムの開発を中心課題としている。教育分野におけるアフェクティブ・コンピューティングの最大規模の研究投資のひとつ。
- NCS-FO: Brain-Informed Goal-Oriented and Bidirectional Deep Emotion Inference
- 機関/企業:University of Florida
- グラント名/国:National Science Foundation(NSF)/米国
- 採択年:2023年
- 期間:2023~2027年
- 研究配賦額:約98万ドル
- 概要:脳波など神経生理学的信号と行動データを統合し、目標指向型の双方向感情推論モデルを構築するプロジェクト。脳情報を活用することで、単なる感情の「検出」から「推論」へと技術を高度化することを目指す。グラントキーワードの上位に挙がった脳波(electroencephalogram)への研究投資を体現する事例。
- XAI-PAC: Towards Explainable and Private Affective Computing
- 機関/企業:Computer Systems Institute, University of Italian Switzerland
- グラント名/国:スイス国立科学財団(SNSF)/スイス
- 採択年:2024年
- 期間:2024~2027年
- 研究配賦額:約92万ドル
- 概要:感情認識AIの判断根拠を人間が理解・検証できるようにする説明可能AI(XAI)技術と、GDPRなどの規制に対応するプライバシー保護技術の両立を目指すプロジェクト。感情認識AIの実用化における「ブラックボックス問題」と個人情報保護という二大課題に正面から取り組む研究として注目される。
アフェクティブ・コンピューティングに関連するスタートアップ企業の事例
スタートアップ企業の資金調達動向は、技術の事業化可能性と市場の期待を反映します。アスタミューゼの保有するスタートアップデータベースから、アフェクティブ・コンピューティングに関連する企業情報を抽出し、資金調達額上位の企業を中心に分析しました。
資金調達額上位の企業をみると、AIコンパニオンロボットや感情認識AI、顧客体験領域の企業が集中しており、感情を認識・応答する機械への市場期待が高まっていることがうかがえます。地域別では米国企業が多くを占めるものの、中国のコンパニオンロボット企業も急速に台頭しています。
以下は、注目のスタートアップ企業事例です。
- 青心意创(Qingxin Yichuang)
- URL:https://cyanborg.com/
- 所在国/創業年:中国/2024年
- 事業概要:自然言語処理や感情認識、物理的インタラクションを統合したAIコンパニオンロボットの開発に特化。創業1年以内での大型調達は、中国における感情認識AIロボット市場の急成長を象徴する事例である。
- Wayvee Analytics
- URL:https://wayvee.com/
- 所在国/創業年:米国/2023年
- 事業概要:カメラを使わないレーダーセンサとAIアルゴリズムを活用し、実店舗内の顧客満足度・購買意向をリアルタイムで計測するリテールテック企業。呼吸や心拍、微細動作などの生理信号から感情を推定し、プライバシーへの配慮と高精度計測を両立している。価格設定や棚割り最適化、A/Bテストなど小売業の意思決定支援に活用されている。
- Emotiva
- URL:https://www.emotiva.it
- 所在国/創業年:イタリア/2017年
- 事業概要:顔の微細な動き(Action Units)をコンピュータビジョンと機械学習で解析し、人間の感情や注意状態を測定するディープテックAI企業。主力製品EmPowerは、動画コンテンツを視聴している人の感情反応・注意度をリアルタイムで分析するSaaSプラットフォームで、広告やコンテンツ効果測定(ニューロマーケティング)領域への応用を展開。GDPR対応と倫理委員会の設置によりプライバシー保護を重視している点も特徴である。
アフェクティブ・コンピューティング関連技術の動向分析まとめ
本レポートでは、アスタミューゼが保有する特許・論文・グラント・スタートアップのデータベースにもとづき、アフェクティブ・コンピューティング技術の年次推移による動向分析および具体的な事例抽出をおこないました。
特許の分析からは、マルチモーダル感情認識や被験者横断汎用化、脳波応用に関するキーワードが顕著に増加していることが確認されました。出願の78.6%を中国が占め、産学両輪で急速な権利化が進む一方、日本は製品組み込み型の応用開発で独自性を発揮しています。
論文の分析からは、脳波や音声、映像をもちいたベンチマークデータセットの活用が進む一方、大規模言語モデルとの融合や異なる計測セッション間での汎用化という新たな研究潮流が急速に台頭していることが読みとれます。2015年から2023年にかけて出版件数が約2.7倍に増加しており、研究活動の活発化が続いています。
グラントの分析からは、米国NSFやEU欧州委員会が大型投資を主導しており、教育やヘルスケア、医療教育分野への応用を目的とした研究プロジェクトが件数・金額ともに上位を占めることが確認されました。
スタートアップの分析からは、AIコンパニオンロボットやリテールテック、広告効果測定の3領域で、感情認識AIの事業化が着実に進んでいることが確認されました。
特許の成長率上位に出現したキーワードとして、被験者横断 (cross-subject)、クロスモーダル(cross-modal)、マルチモーダル(multi-modal)、脳波(electroencephalogram)が挙げられます。これらは「個人差を超えた汎用性」「複数モダリティの統合」「生体信号の直接利用」という三つの軸として整理でき、論文においても同様の方向性が確認されます。一方でグラントのキーワード成長率上位の多くは単一プロジェクト由来のワードであり、それ以外のキーワードの成長率は特許・論文と比較して総じて低く、研究投資は既存の確立された概念を引き続き深掘りする傾向が強いことも示唆されます。
以上の分析結果をまとめると、現状の研究開発では、マルチモーダル融合・感情認識の汎用化および頑健性の向上・大規模言語モデルとの融合が主要な研究課題となっています。また、実用化にむけては、感情認識AIの説明可能性の確保やGDPRなどのプライバシー規制への対応、個人差を超えた汎用モデルの構築といった課題への取りくみも重要です。
将来的には、ヘルスケアやメンタルヘルス、モビリティ、顧客体験(CX)など多様な分野において、従来の手法では対応がむずかしかったリアルタイムかつ非侵襲的な感情計測・応用が進むことが期待されます。とくに、ウェアラブル脳波デバイスの低価格化と大規模言語モデルとの融合技術の成熟、そしてプライバシー配慮型センシング技術の普及との相乗効果によって、今後さまざまな産業においてアフェクティブ・コンピューティングが活用されることが予想されます。
著者:アスタミューゼ株式会社 三田 歩 博士(理学)
さらなる分析は……
アスタミューゼでは「感情認識AI」に関する技術に限らず、様々な先端技術/先進領域における分析を日々おこない、さまざまな企業や投資家にご提供しております。
本レポートでは分析結果の一部を公表しました。分析にもちいるデータソースとしては、最新の政府動向から先端的な研究動向を掴むための各国の研究開発グラントデータをはじめ、最新のビジネスモデルを把握するためのスタートアップ/ベンチャーデータ、そういった最新トレンドを裏付けるための特許/論文データなどがあります。
それら分析結果にもとづき、さまざまな時間軸とプレイヤーの視点から俯瞰的・複合的に組合せて深掘った分析をすることで、R&D戦略、M&A戦略、事業戦略を構築するために必要な、精度の高い中長期の将来予測や、それが自社にもたらす機会と脅威をバックキャストで把握する事が可能です。
また、各領域/テーマ単位で、技術単位や課題/価値単位の分析だけではなく、企業レベルでのプレイヤー分析、さらに具体的かつ現場で活用しやすいアウトプットとしてイノベータとしてのキーパーソン/Key Opinion Leader(KOL)をグローバルで分析・探索することも可能です。ご興味、関心を持っていただいたかたは、お問い合わせ下さい。