論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available
論文名稱 Title |
十萬個中文人名語音辨識系統之設計研究 A design of speech recognition system for one hundred thousand Chinese names |
||
系所名稱 Department |
|||
畢業學年期 Year, semester |
語文別 Language |
||
學位類別 Degree |
頁數 Number of pages |
48 |
|
研究生 Author |
|||
指導教授 Advisor |
|||
召集委員 Convenor |
|||
口試委員 Advisory Committee |
|||
口試日期 Date of Exam |
2007-07-26 |
繳交日期 Date of Submission |
2007-09-06 |
關鍵字 Keywords |
隱藏式馬可夫模型、端點偵測、梅爾倒頻譜係數 MFCC, Endpoint detection, Hidden Markov Model |
||
統計 Statistics |
本論文已被瀏覽 5666 次,被下載 0 次 The thesis/dissertation has been browsed 5666 times, has been downloaded 0 times. |
中文摘要 |
本論文的主要目的,在針對十萬筆中文人名之語音辨識系統,進行設計與實作。系統運用梅爾倒頻譜係數、隱藏式馬可夫模型與語音文字比對策略,作人名候選之機制,並配合中文之聲調辨識,以提升最終結果之可靠度。 實驗證實在語者相依的情況下,透過四聲的正確分類與平衡的單音訓練兩策略,吾人約可獲得85%之正確辨識率。這個結果,比未使用上述兩策略之系統,約可增加8%之正確辨識率。整體語音辨識系統,在Intel Celeron 2.4 GHz之處理器與Red Hat Linux 9.0的運算環境下,中文人名之語音辨識,約可在2.0秒內完成。 |
Abstract |
The objective of this thesis is to design and implement a speech recognition system for one hundred thousand Chinese names. Mel frequency cepstrum coefficient, hidden Markov model and lexicon search strategy are utilized to choose the name candidates. Furthermore, a mandarin intonation technique is also incorporated into this system to increase the final speech recognition accuracy. The experimental results indicate that for the speaker dependent case, an 85% correct rate can be achieved by use of the proposed intonation classification scheme and the balanced monosyllable training database. The above correct rate has an increase of 8% over the previous method without using these two techniques. Under Redhat Linux 9.0 environment, a mandarin name can be recognized within 2 seconds by the use of a computer with Intel Celeron 2.4 GHz CPU. |
目次 Table of Contents |
摘要I-II 致謝III 目錄IV-V 圖目錄VI 表目錄VII 第1章 緒論1 1-1 研究動機與目的1 1-2 研究方法2 1-3 章節概要2 第2章 語音訊號處理之基本技術3 2-1 語音辨識系統架構3 2-2 端點偵測(Endpoint Detection)4 2-2-1 能量(Energy)4 2-2-2 越零率(Zero Crossing Rate)5 2-3 視窗函數(Window Function)7 2-4 特徵萃取(Feature Extraction)8 2-4-1 線性預估倒頻譜係數10 2-4-2 梅爾倒頻譜係數(MFCC)11 2-5 隱藏式馬可夫模型(HMM)13 2-5-1 隱藏式馬可夫模型理論13 2-5-2 訓練系統(Training)15 2-5-3 測試系統(Testing)16 2-6 自相關函數(ACF,Autocorrelation Function)18 第3章 系統設計與實驗結果21 3-1 資料庫建立與規劃21 3-2 資料庫錄製方式23 3-3 系統說明24 3-4 系統架構28 3-5 系統相關參數設定34 3-6 驗證測試結果35 第4章 結論與討論37 4-1 結論37 4-2 討論38 參考文獻39 |
參考文獻 References |
[1] 鄭吉峰,“台灣地區中文地址語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月。 [2] 孫益君,“以PDA為平台之語音辨識應用系統開發”,中原大學資訊工程研究所碩士論文,民國92年7月。 [3] 楊永泰,“隱藏式馬可夫模型應用於中文語音辨識之研究”,中原大學資訊工程研究所碩士論文,民國88年7月。 [4] 王小川,“語音訊號處理”,全華科技圖書公司,民國93年。 [5] 維基百科,http://zh.wikipedia.org/ [6] 台灣概覽,http://twinfo.ncl.edu.tw/ [7] 全國商工行政服務網,http://210.69.121.50/~doc/ce/cesc1110.html [8] 公開資訊觀測站,http://newmops.tse.com.tw/ [9] 歌詞帝國,http://www.kikikoko.idv.tw/ [10] 批踢踢實業坊,bbs://ptt.cc [11] David S. Petruncio,Jr. and Mark A. Hasegawa-Johnson,“Evaluation of Various Features for Music Genre Classification with Hidden Markov Models”, ECE, March 2002. [12] 陳豫德,“中文人名語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月。 [13] Lawrence Rabiner and Biing-Hwang Juang, "Fundamentals of Speech Recognition", N.J.: Prentice Hall, 1993. [14] Ben Gold and Nelson Morgan, "Speech and Audio Signal Processing: Processing and Perception of Speech and Music", John Wiley & Sons, Inc. 2000. [15] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders” , John Wiley & Sons, Inc., 2003. [16] Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models”, Proc. ICSI, April 1998. [17] 黃銘崇,“不特定語者語詞辨識系統之特徵設計”,國立中山大學電機工程研究所碩士論文,民國90年6月。 [18] 鄭博文,“雜訊環境下語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月。 [19] 賴昭華,“不特定語者中量語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國91年7月。 [20] 潘睿慈,“特定語者中文語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月。 [21] 廖蓋隆,羅竹風,范源主編,“中國人名大詞典”,上海辭書出版社出版 : 新華書店發行,1990年。 [22] 國父全集編輯委員會編輯,“國父全集 補編”, 臺北市 : 近代中國出版 : 中央文物總經銷,民國78年。 [23] 胡健國,“近代華人生卒簡歷表”,國史館印行,民國93年。 [24] 王永志 主編,“2006台灣名人錄”, 中央通訊社,2005年12月初版。 [25] 大專院校一覽表,http://reg.aca.ntu.edu.tw/college/search/ [26] 林維琦,“古今中外人名語音辨識系統之設計研究” ,國立中山大學電機工程研究所碩士論文,民國95年7月。 |
電子全文 Fulltext |
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。 論文使用權限 Thesis access permission:校內校外均不公開 not available 開放時間 Available: 校內 Campus:永不公開 not available 校外 Off-campus:永不公開 not available 您的 IP(校外) 位址是 18.218.157.107 論文開放下載的時間是 校外不公開 Your IP address is 18.218.157.107 This thesis will be available to you on Indicate off-campus access is not available. |
紙本論文 Printed copies |
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。 開放時間 available 已公開 available |
QR Code |