Responsive image
博碩士論文 etd-0826108-145039 詳細資訊
Title page for etd-0826108-145039
論文名稱
Title
中文語音辨識系統降低訓練量之策略研究-以地址系統與二、三、四字詞系統為例
A Design of Training Size Reduction Strategy for Mandarin Speech Recognition System - A Case Study on Address Inputting System and Phrase Recognition System
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
71
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2008-07-25
繳交日期
Date of Submission
2008-08-26
關鍵字
Keywords
線性預估倒頻譜係數、語文文字比對機制、混合訓量
Mixture training, LPC Cepstrum, Speech-text alignment strategy
統計
Statistics
本論文已被瀏覽 5655 次,被下載 0
The thesis/dissertation has been browsed 5655 times, has been downloaded 0 times.
中文摘要
本論文主要研究地址系統與二、三、四字詞系統之訓練語料量的降低策略,針對二字詞作訓練語料,利用平衡篩選、混合訓練,讓整體訓練語料大大地降低。單音節辨識採用隱藏式馬可夫模型,將每音框長度重疊一半,特徵參數以梅爾倒頻譜係數和線性預估倒頻譜係數為主,加上文字比對策略與聲調辨識,讓辨識率提升。針對特定語者之評量,系統中每個單詞辨識皆可在一秒內完成。
Abstract
The objective of this thesis is to reduce the training size for the Mandarin address inputting system and the Mandarin phrase recognition system. A set of two-word Mandarin phrases is developed by the balanced sieving and mixture training techniques. This greatly reduces the training data size for the systems. Hidden Markov model using both MFCC and LPCC features is proposed in this thesis. Speech-text alignment, frame overlapping and tone recognition are incorporated to increase the correct recognition rates. For the speaker-dependent case, any phrase in these two speech systems can be recognized within one second.
目次 Table of Contents
摘要 I
致謝 II
目錄 III
圖目錄 VI
表目錄 VIII
第一章 緒論 1
1-1 研究動機 1
1-2 研究方法、目的與基本架構 1
1-3 章節概要 4
第二章 辨識系統架構與語音訊號處理介紹 5
2-1 辨識系統架構 5
2-2 音節切割 6
2-2-1 能量 6
2-2-2 越零率 6
2-2-3 線性預估係數誤差能量 7
2-3 特徵萃取 9
2-3-1 高頻預強 10
2-3-2 加視窗 10
2-3-3 離散傅利葉轉換 11
2-3-4 梅爾頻率濾波器 11
2-3-5 離散餘弦轉換 13
2-3-6 差量倒頻譜係數 13
2-3-7 線性預估編碼與自相關分析 14
2-3-8 線性預估倒頻譜參數 15
2-4 聲調辨識 16
2-4-1 聲調特性 16
2-4-2 聲調求法 18
第三章 語音模型的訓練與辨識流程 25
3-1 隱藏式馬可夫模型 25
3-2 隱藏式馬可夫模型之訓練 26
3-2-1 參數初始化 26
3-2-2 參數重估 29
3-3 隱藏式馬可夫模型之辨識程序 31
3-3-1 Viterbi 演算法 31
3-4 文字比對辨識流程 32
第四章 地址辨識系統之介紹 34
4-1 資料庫介紹和來源 34
4-2 系統輸入介紹 35
4-3 系統流程 37
第五章 系統參數與實驗結果 39
5-1 系統參數 39
5-2 實驗結果 39
5-2-1 訓練量與辨識率之關係 40
5-2-2 個別訓練與混合訓練 41
5-2-3 訓練詞之篩選 43
5-2-4 特徵值萃取 48
5-3 與上屆實驗成果之比較 55
第六章 結論與展望 56
6-1 結論 56
6-2 展望 56
參考文獻 57
附錄一 59
參考文獻 References
[1] 吳俊榮, “中文二、三、四字詞語詞辨識系統之設計研究” , 國立中山大學電機工程研究所碩士論文, 民國96 年7 月.
[2] 國語日報出版中心主編, “新編國語日報辭典”, 國語日報社, 民國89 年.
[3] 陳躍升, “中文履歷表之語音建構系統設計” , 國立中山大學電機工程研究所碩士論文, 民國95 年7 月.
[4] 鄭鶴得, “中文二字語詞辨識系統之設計研究” , 國立中山大學電機工程研究所碩士論文, 民國96 年7 月.
[5] 王勝明, “台灣、香港與大陸地區中文語音辨識系統之設計研究” , 國立中山大學電機工程研究所碩士論文, 民國96 年7 月.
[6] 重慶郵政http://www.cqpost.com.cn:8080/postcode/index.jsp
[7] 北京郵政局http://www.bjpost.gov.cn/postcode/ybcx_index.asp
[8] 中國行政區劃網 http://www.xzqh.org/quhua/
[9] J. R. Deller, J. G. Proakis, and J. H. L. Hansen, Discrete Time Processing of Speech Signals, New York: Macmillan Pub. Co., 1993.
[10] 古鴻炎、張小芬、吳俊欣,“仿趙氏音高尺度之基週軌跡正規化方法及其應用”, 第十六屆自然語言與語音處理研討會(台北) ,第325-334 頁,2004.
[11] 王小川, ”語音訊號處理”, 全華, 民國93 年.
[12] 葉俊亨, “中文語音情緒辨識” , 大同大學資訊工程研究所碩士論文, 民國93年6 月.
[13] J.F. Kaiser, Discrete-Time Speech Signal Processing, pp.11-99, Prentic Hall PTR, 2002.
[14] D. A. Krubsack, "An autocorrelation pitch detector and voicing decision with confidence measures developed for noise-corrupted speech", IEEE Trans. Signal Processing, vol.39, pp. 319-329, Feb. 1991
[15] 國立臺灣師範大學國音教材編輯委員會編纂, “國音學” ,正中書局,民國96 年
[16] J. Makhoul, “Linear prediction: a tutorial review,” Proc. IEEE, Vol. 63, no.4, pp.561–580, April 1975.
[17] Tze Fen Li, “Speech recognition of mandarin monosyllables,” Patter Recognition,Vol.36 pp. 2713-2721, April 2003.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.144.48.135
論文開放下載的時間是 校外不公開

Your IP address is 3.144.48.135
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code