主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
郑 方,牟晓隆,徐明星,武 健,宋战江.汉语语音听写机技术的研究与实现.软件学报,1999,10(4):436-444
汉语语音听写机技术的研究与实现
Research and Implementation of the Techniques for Chinese Dictation Machines
投稿时间:1998-02-24  修订日期:1998-05-12
DOI:
中文关键词:  连续语音识别,汉语语音听写机,搜索策略,基于统计知识的帧同步搜索算法,差分状态驻留,特征变化量,词搜索树,双层搜索网络,汉语语音听写机引擎,语音命令.
英文关键词:CSR (Continuous speech recognition), CDM (Chinese dictation machine), search strategy, SKB-FSS (statistical knowledge based frame synchronous search) algorithm, differential state dwell, feature difference sum, WST (word search tree), TLSN (two-level sear
基金项目:本文研究得到国家863高科技项目基金资助.
作者单位
郑 方 清华大学计算机科学与技术系语音实验室,北京,100084 
牟晓隆 清华大学计算机科学与技术系语音实验室,北京,100084 
徐明星 清华大学计算机科学与技术系语音实验室,北京,100084 
武 健 清华大学计算机科学与技术系语音实验室,北京,100084 
宋战江 清华大学计算机科学与技术系语音实验室,北京,100084 
摘要点击次数: 3132
全文下载次数: 3279
中文摘要:
      文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎,并在PC机上构建了两个系统:非特定人汉语语音听写机
英文摘要:
      In this paper, the search strategies in the acoustic layer of the CSR (continuous speech recognition) and the CDM (Chinese dictation machine) are addressed in two aspects, the acoustic recognition unit and the syntax-constrained word search tree. The SKB-FSS (statistical knowledge based frame synchronous search) algorithm and the syntax-constrained WST (word search tree) structure are proposed, they form the TLSN (two-level search network) in the acoustic layer. The statistical knowledge used by the algorithm includes differential state dwell distribution, the feature difference sum and so on, which result in an improvement of 36.6% in CSR. The principles of a modified back-off estimation algorithm and the search algorithms for the N-gram based language models are also introduced. Finally, by integrating the authors' techniques, a Chinese dictation machine engine (CDME) is implemented. A speaker-independent CDM text editor named ST97 and a voice command system named CMD97 are established for personal computers (PCs) based on the CDME.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利