Responsive image
博碩士論文 etd-0831106-153520 詳細資訊
Title page for etd-0831106-153520
論文名稱
Title
中文地名語音辨識系統之設計研究
A Design of Speech Recognition System for the Mandarin Toponyms
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
45
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2006-07-25
繳交日期
Date of Submission
2006-08-31
關鍵字
Keywords
聲調偵測機制、隱藏式馬可夫模型、中文單音節辨識
Hidden Markov Model, Speech recognition of mandarin monosyllables, Pitch detection mechanism
統計
Statistics
本論文已被瀏覽 5688 次,被下載 0
The thesis/dissertation has been browsed 5688 times, has been downloaded 0 times.
中文摘要
本論文的中文地名語音辨識系統建構在Red Hat Linux 9.0作業系統下,系統採用目前廣泛運用的語音辨識相關技術,包含了梅爾倒頻譜參數、線性預估編碼與隱藏式馬可夫模型。系統以單音節做為辨識基礎,針對容易混淆的情形,採用聲調辨識機制來修正最後結果。在語者特定的環境下,本系統的辨識率約為90%,辨識時間在1.5秒以內。
Abstract
In this thesis, a Mandarin toponym speech recognition system is developed using MFCC, LPC and HMM under Red Hat Linux 9.0. The system is based on monosyllable HMM's to select the initial toponym candidates, and its final classification result can be obtained by further pitch identification mechanisms. For speaker-dependent case, a 90% correct rate can be achieved approximately and the recognition process can be accomplished within 1.5 seconds on the average.
目次 Table of Contents
致謝 Ⅰ
摘要 Ⅲ
目錄 Ⅳ
圖表目錄 Ⅵ
第一章 緒論 1
1-1 研究動機與目的 1
1-2 研究方法簡介 2
1-3 章節概要 3
第二章 語音處理相關技術之研究 4
2-1 語音處理相關領域 4
2-2 語音辨識相關技術 6
2-2-1 端點偵測(Endpoint Detection) 6
2-2-2 能量(Energy) 6
2-2-3 越零率(Zero Crossing Rate) 6
2-2-4 最大相似比(Maximum Likelihood Rate) 8
2-3 視窗函數(Window Function) 9
2-4 特徵萃取(Feature Extraction) 10
2-4-1 線性預估編碼(Linear Predictive Coding) 10
2-4-2 倒頻譜係數(Cepstrum Coefficient) 13
2-4-3 梅爾倒頻譜係數(Mel-Frequency Cepstrum oefficients) 15
2-5 隱藏式馬可夫模型(Hidden Markov Model) 17
第三章 辨識系統設計 19
3-1 資料庫建立 19
3-2 注音符號處理 23
3-2-1 方法一 23
3-2-2 方法二 24
3-3 系統輸入介紹 25
3-4 系統架構 26
第四章 實驗結果 31
4-1 系統相關參數設定 31
4-2 實驗結果 31
4-3 錯誤分析與改善 33
4-3-1 錯誤分析 33
4-3-2 改善策略 34
第五章 結論與未來展望 36
參考文獻 37
參考文獻 References
[1] http://www.krysstal.com/spoken.html
[2] Ben Gold and Nelson Morgan, “Speech and Audio Signal Processing: Processing and Perception of Speech and Music”, John Wiley & Sons. Inc. 2000.
[3] 中國行政區劃網 http://www.xzqh.org/quhua/
[4] 中華民國內政部民政司 http://www.moi.gov.tw/dca/regime02.asp
[5] Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of Speech Recognition”, N.J.: Prentice Hail, 1993.
[6] Tze Fen Li, “Speech recognition of mandarin monosyllables,” Patter Recognition, vol.36 pp2713-2721, April 2003.
[7] L. R.Rabiner, “A tutorial on hidden Markov models and selected applications in speech recognition”, Proc, IEEE, vol.77, pp.257-286, Feb, 1989.
[8] Kazunaga Yoshida, Takao Watanabe and Shinji Koga,“Large vocabulary word recognition based on demi-syllable hidden markov model using samll amount of training data”, C&C Information Technology Research Laboratories, NEC Corporation, 4-1-1 Miyazaki, Miyamac-ku, Kawasaki213, JAPAN.
[9] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders”, John Wiley & Sons, Inc. 2003.
[10] 王小川, “語音訊號處理”, 全華, 民國93年.
[11] 潘睿慈, “特定語者中文語詞辨識系統之設計研究”, 國立中山大學電機電機工程研究所碩士論文, 民國94年7月.

[12] 鄭吉峰, “台灣地區中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國94年7月.
[13] 張慶勇,“中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國93年7月.
[14] 鄭博文, “雜訊環境下語音辨識系統之設計研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[15] 陳豫德, “中文人名語音辨識系統之設計研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[16] 賴昭華, “不特定語者中量語詞辨識系統之設計研究,” 國立中山大電機工程研究所碩士論文, 民國91年7月.
[17] 黃銘崇, “不特定語者語詞辨識系統之特徵設計,” 國立中山大學電機工程研究所碩士論文, 民國90年6月.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.136.22.50
論文開放下載的時間是 校外不公開

Your IP address is 3.136.22.50
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code