主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
卢坚,陈毅松,孙正兴,张福炎.基于隐马尔可夫模型的音频自动分类.软件学报,2002,13(8):1593-1597
基于隐马尔可夫模型的音频自动分类
Automatic Audio Classification by Using Hidden Markov Model
投稿时间:2001-02-13  修订日期:2001-05-22
DOI:
中文关键词:  基于内容的音频分类  隐马尔可夫模型  向量量化  MFCC(mel-frequency cepstral coefficient)
英文关键词:content-based audio classification  hidden Markov model (HMM)  vector quantisation  mel-frequency cepstral coefficients (MFCC)
基金项目:国家自然科学基金资助项目(69903006,60073030)
作者单位
卢坚 南京大学,计算机科学与技术系,江苏,南京,210093
南京大学,计算机软件新技术国家重点实验室,江苏,南京,210093 
陈毅松 南京大学,计算机科学与技术系,江苏,南京,210093
南京大学,计算机软件新技术国家重点实验室,江苏,南京,210093 
孙正兴 南京大学,计算机科学与技术系,江苏,南京,210093
南京大学,计算机软件新技术国家重点实验室,江苏,南京,210093 
张福炎 南京大学,计算机科学与技术系,江苏,南京,210093
南京大学,计算机软件新技术国家重点实验室,江苏,南京,210093 
摘要点击次数: 3383
全文下载次数: 4035
中文摘要:
      音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以及语音文档检索等领域都有重大的应用价值.由于隐马尔可夫模型能够很好地刻画音频信号的时间统计特性,因此,提出一种基于隐马尔可夫模型的音频分类算法,用于语音、音乐以及它们的混合声音的分类.实验结果表明,隐马尔可夫模型的音频分类性能较好,最优分类精度达到90.28%.
英文摘要:
      As one of the key methods to extract content semantics and structure from audio, automatic audio classification, especially for a speech and a music, is valuable for content-based audio retrieval, video summary and retrieval, and spoken document retrieval, etc. Because hidden Markov model (HMM) can well model audio signal抯 time statistical properties, a left-right discrete HMM is proposed to classify a speech, a music and their mixed audio. The experimental results show that HMM is excellent for audio classification accuracy is up to 90.28%.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利