Responsive image
博碩士論文 etd-0906107-041006 詳細資訊
Title page for etd-0906107-041006
論文名稱
Title
十萬個中文人名語音辨識系統之設計研究
A design of speech recognition system for one hundred thousand Chinese names
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
48
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2007-07-26
繳交日期
Date of Submission
2007-09-06
關鍵字
Keywords
隱藏式馬可夫模型、端點偵測、梅爾倒頻譜係數
MFCC, Endpoint detection, Hidden Markov Model
統計
Statistics
本論文已被瀏覽 5666 次,被下載 0
The thesis/dissertation has been browsed 5666 times, has been downloaded 0 times.
中文摘要
本論文的主要目的,在針對十萬筆中文人名之語音辨識系統,進行設計與實作。系統運用梅爾倒頻譜係數、隱藏式馬可夫模型與語音文字比對策略,作人名候選之機制,並配合中文之聲調辨識,以提升最終結果之可靠度。

實驗證實在語者相依的情況下,透過四聲的正確分類與平衡的單音訓練兩策略,吾人約可獲得85%之正確辨識率。這個結果,比未使用上述兩策略之系統,約可增加8%之正確辨識率。整體語音辨識系統,在Intel Celeron 2.4 GHz之處理器與Red Hat Linux 9.0的運算環境下,中文人名之語音辨識,約可在2.0秒內完成。
Abstract
The objective of this thesis is to design and implement a speech recognition system for one hundred thousand Chinese names. Mel frequency cepstrum coefficient, hidden Markov model and lexicon search strategy are utilized to choose the name candidates. Furthermore, a mandarin intonation technique is also incorporated into this system to increase the final speech recognition accuracy.

The experimental results indicate that for the speaker dependent case, an 85% correct rate can be achieved by use of the proposed intonation classification scheme and the balanced monosyllable training database. The above correct rate has an increase of 8% over the previous method without using these two techniques. Under Redhat Linux 9.0 environment, a mandarin name can be recognized within 2 seconds by the use of a computer with Intel Celeron 2.4 GHz CPU.
目次 Table of Contents
摘要I-II
致謝III
目錄IV-V
圖目錄VI
表目錄VII
第1章 緒論1
1-1 研究動機與目的1
1-2 研究方法2
1-3 章節概要2
第2章 語音訊號處理之基本技術3
2-1 語音辨識系統架構3
2-2 端點偵測(Endpoint Detection)4
2-2-1 能量(Energy)4
2-2-2 越零率(Zero Crossing Rate)5
2-3 視窗函數(Window Function)7
2-4 特徵萃取(Feature Extraction)8
2-4-1 線性預估倒頻譜係數10
2-4-2 梅爾倒頻譜係數(MFCC)11
2-5 隱藏式馬可夫模型(HMM)13
2-5-1 隱藏式馬可夫模型理論13
2-5-2 訓練系統(Training)15
2-5-3 測試系統(Testing)16
2-6 自相關函數(ACF,Autocorrelation Function)18
第3章 系統設計與實驗結果21
3-1 資料庫建立與規劃21
3-2 資料庫錄製方式23
3-3 系統說明24
3-4 系統架構28
3-5 系統相關參數設定34
3-6 驗證測試結果35
第4章 結論與討論37
4-1 結論37
4-2 討論38
參考文獻39
參考文獻 References
[1] 鄭吉峰,“台灣地區中文地址語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月。

[2] 孫益君,“以PDA為平台之語音辨識應用系統開發”,中原大學資訊工程研究所碩士論文,民國92年7月。

[3] 楊永泰,“隱藏式馬可夫模型應用於中文語音辨識之研究”,中原大學資訊工程研究所碩士論文,民國88年7月。

[4] 王小川,“語音訊號處理”,全華科技圖書公司,民國93年。

[5] 維基百科,http://zh.wikipedia.org/

[6] 台灣概覽,http://twinfo.ncl.edu.tw/

[7] 全國商工行政服務網,http://210.69.121.50/~doc/ce/cesc1110.html

[8] 公開資訊觀測站,http://newmops.tse.com.tw/

[9] 歌詞帝國,http://www.kikikoko.idv.tw/

[10] 批踢踢實業坊,bbs://ptt.cc

[11] David S. Petruncio,Jr. and Mark A. Hasegawa-Johnson,“Evaluation of Various Features for Music Genre Classification with Hidden Markov Models”, ECE, March 2002.

[12] 陳豫德,“中文人名語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月。

[13] Lawrence Rabiner and Biing-Hwang Juang, "Fundamentals of Speech Recognition", N.J.: Prentice Hall, 1993.

[14] Ben Gold and Nelson Morgan, "Speech and Audio Signal Processing: Processing and Perception of Speech and Music", John Wiley & Sons, Inc. 2000.


[15] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders” , John Wiley & Sons, Inc., 2003.

[16] Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models”, Proc. ICSI, April 1998.

[17] 黃銘崇,“不特定語者語詞辨識系統之特徵設計”,國立中山大學電機工程研究所碩士論文,民國90年6月。

[18] 鄭博文,“雜訊環境下語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月。

[19] 賴昭華,“不特定語者中量語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國91年7月。

[20] 潘睿慈,“特定語者中文語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月。

[21] 廖蓋隆,羅竹風,范源主編,“中國人名大詞典”,上海辭書出版社出版 : 新華書店發行,1990年。

[22] 國父全集編輯委員會編輯,“國父全集 補編”, 臺北市 : 近代中國出版 : 中央文物總經銷,民國78年。

[23] 胡健國,“近代華人生卒簡歷表”,國史館印行,民國93年。

[24] 王永志 主編,“2006台灣名人錄”, 中央通訊社,2005年12月初版。

[25] 大專院校一覽表,http://reg.aca.ntu.edu.tw/college/search/

[26] 林維琦,“古今中外人名語音辨識系統之設計研究” ,國立中山大學電機工程研究所碩士論文,民國95年7月。
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 18.218.157.107
論文開放下載的時間是 校外不公開

Your IP address is 18.218.157.107
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code