原文:
www.kdnuggets.com/2016/05/voice-tone-analysis-emotion-detection.html
作者:卡洛斯·阿尔盖塔,灵魂黑客实验室。
创建情感感知技术在近年来变得非常流行。有一广泛的公司试图从你写的内容、你的语音语调或你面部的表情中检测你的情感。所有这些公司都通过基于云的编程接口(API)在线提供他们的技术。
1. 谷歌网络安全认证 - 快速进入网络安全职业的快车道。
2. 谷歌数据分析专业认证 - 提升你的数据分析能力
3. 谷歌 IT 支持专业认证 - 支持你的组织在 IT 方面
作为我的离线情感感知硬件(Project Jammin)的一部分,我已经构建了早期的面部表情和语音内容识别原型,用于情感检测。在这篇简短的文章中,我描述了缺失的部分——一个语音语调分析器。
为了构建一个语调分析器,需要研究语音波形的特性(声音的二维表示)。波形也被称为声音的时间域表示,因为它们是表示强度随时间变化的表现形式。有关波形的更多详细信息,请参阅这个有趣的页面。
英语语言中四个不同字母的波形。
使用专门设计用于分析语音的软件,目的是提取波形的某些特征,这些特征可以用作训练机器学习分类器的特征。给定一组带有情感标签的语音录音,我们可以使用提取的特征构建每个录音的向量表示。
从语音中提取情感所使用的特征因研究而异,有时甚至取决于分析的语言。一般来说,许多研究和应用工作使用了音高、梅尔频率倒谱系数(MFCC)和语音的共振峰的组合。
*上方为表达惊讶的语音波形。
蓝色下方为音高,黄色为强度,红色为共振峰。*
一旦提取了特征并构建了语音的向量表示,就会训练一个分类器来检测情感。在以前的工作中使用了几种类型的分类器。其中最受欢迎的是支持向量机(SVM)、逻辑回归(Logit)、隐马尔可夫模型(HMM)和神经网络(NN)。
作为一个早期原型,我实现了一个简化版的情感检测分类器。与其检测快乐、悲伤、愤怒等多种情感,我的情感分析器进行二元分类,以检测用户的激发水平。高激发水平与快乐、惊讶和愤怒等情感相关,而低激发水平与悲伤和无聊等情感相关。以下视频展示了我的情感分析器在树莓派上的运行。请欣赏!
简历:卡洛斯·阿尔盖塔 是一位居住在台湾的洪都拉斯企业家。他拥有信息系统与应用领域的博士学位,并且是 Veryfast Inc. 和 Soul Hackers Labs 的联合创始人。
相关:
-
深度学习中的深层感受
-
2016 年及之后深度学习的预期
-
关于情感分析的 11 件事