一种基于背景声音识别的社会情境感知方法
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61373119, 61222209, 61103063);国家重点基础研究发展计划(973)(2012CB316400);新世纪优秀人才支持计划(NCET-12-0466);高等学校博士学科点专项科研基金(20126102110043);陕西省自然科学基础研究计划(2012JQ8028);西北工业大学基础研究基金(JC20110267)


Approach of Social Context Awareness Based on Background Sound Recognition
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    随着社会需求的不断扩大及技术的不断发展,人与人之间的社会交互也越来越多.理解社会交互特征并能感知用户所处的社会情境语义(如在开会、在上课),对于促进和辅助用户社会活动具有重要意义.从背景声音的角度对社会交互进行理解,目的是通过对背景声音差异性特征的提取,识别用户所处的社会情境.提出了一种基于背景声音识别的社会情境感知方法,该方法采用Mel frequency cepstral coefficients (MFCCs,即Mel 频率倒谱系数)分析声音信号,将路径搜索限制和搜索过滤的改进Dynamic Time Warping(DTW)算法作为识别器.通过对11 种社会情境背景声音的采集和识别,表明该算法能够有效地识别用户所处的社会情境,且其运算效率与识别率比传统DTW 算法有所提高.

    Abstract:

    With the spread of social needs and development of techniques, social interaction is more and more frequent among people. To promote and assist human social interaction, it's important to understand the social context the user situates. The paper mainly studies the understanding of social contexts based on background sounds, the goal of which is to recognize the social context in which users reside through analyzing the differences of background sounds. It uses the Mel frequency cepstral coefficients to analyze sound features and classify the sounds based on an improved Dynamic Time Warping (DTW) algorithm. Experimental results show that the proposed algorithm is more effective than traditional methods.

    参考文献
    相似文献
    引证文献
引用本文

杨曜,郭斌,於志文.一种基于背景声音识别的社会情境感知方法.软件学报,2013,24(S2):24-31

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-06-15
  • 最后修改日期:2013-07-22
  • 录用日期:
  • 在线发布日期: 2014-01-02
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号