Responsive image
博碩士論文 etd-0831105-013335 詳細資訊
Title page for etd-0831105-013335
論文名稱
Title
台灣地區中文地址語音辨識系統之設計研究
A Design of Mandarin Speech Recognition System for Addresses in Taiwan
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
40
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2005-07-26
繳交日期
Date of Submission
2005-08-31
關鍵字
Keywords
隱藏式馬可夫模型、端點偵測、梅爾倒頻譜係數
Hidden Markov model(HMM), Mel-frequency cepstrum(MFCC), End-point detection, Mel-frequency cepstrum
統計
Statistics
本論文已被瀏覽 5620 次,被下載 0
The thesis/dissertation has been browsed 5620 times, has been downloaded 0 times.
中文摘要
本論文使用端點偵測、梅爾倒頻譜係數、隱藏式馬可夫模型等相關技術為基礎,來設計製作中文地址的語音辨識系統。本論文包含語詞辨識與單音辨識兩方面。在語詞辨識方面,先進行篩選候選人,再進行辨識,以減少辨識時間;在單音辨識方面,經過辨識後,針對易混淆的情形,再進一步確認以增加辨識率。在特定語者的實驗室環境下,本系統辨識率約為85%,所需辨識時間在2秒之內。
Abstract
A Mandarin speech recognition system for addresses in Taiwan, based on end-point detection, MFCC and HMM, is proposed and implemented in this thesis. It includes both phrase and monosyllable recognition tasks. For the phrase recognition part, we select the initial candidates before the final recognition stage to tremendously reduce the computational time. On the other side, for the monosyllable recognition part, we further refine the recognition details to improve the correct rate under easily confused circumstances. The final system can achieve 85% correct identification rate, and the address recognition can be completed within 2 seconds in the laboratory environment for speaker-dependent case.
目次 Table of Contents
摘要 1
致謝 2
目錄 3
圖目錄 5
表目錄 6
第 1 章 緒論 7
1-1 研究動機與目的 7
1-2 研究方法 8
1-3 章節概要 8
第 2 章 語音處理之相關研究探討 9
2-1 語音辨識流程 9
2-2 端點偵測 10
2-2-1 能量 10
2-2-2 越零率 10
2-2-3 最大相似比 11
2-3 視窗函數 12
2-4 特徵萃取 13
2-4-1 線性預估倒頻譜係數 14
2-4-2 梅爾倒頻譜係數 14
2-5 隱藏式馬可夫模型 16
第 3 章 系統設計 18
3-1 系統簡介 18
3-2 資料庫建立 19
3-3 系統架構流程 22
3-4 系統之端點偵測 25
3-5 系統之篩選機制 26
3-6 系統之確認機制 27
3-7 系統之提示機制 29
3-8 系統示範 30
第 4 章 實驗結果 31
4-1 實驗結果 31
4-2 與上屆系統之差異性 34
第 5 章 結論與建議 36
5-1 結論 36
5-2 建議 37
參考文獻 38
參考文獻 References
[1] Lawrence Rabiner, “The Power of Speech”, Science, vol. 301, Issue 5639, pp1494-1495, 12 September 2003.
[2] Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of Speech Recognition”, N.J.: Prentice Hail, 1993.
[3] A.lan V. Oppenheim, Ronald W. Schafer, with John R. Buck, “Discrete-Time Signal Processing”, N.J.: Prentice Hall, 1999.
[4] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders”, John Wiley & Sons, Inc. 2003.
[5] Ben Gold and Nelson Morgan, “Speech and Audio Signal Processing : Processing and Perception of Speech and Music”, John Wiley & Sons, Inc. 2000.
[6] John R. Deller, J. G.. Proakis, and John H. L. Hansen, “Discrete-Time Processing of Speech Signals”, New York: Macmillan Pub. Co., 1993.
[7] Lawrence R. Rabiner and Ronald W. Schafer, “Digital processing of speech signals”, N.J.: Prentice-Hall, 1978.
[8] V. R. Algazi, K. L. Brown, M. J. Ready, D. H. Irvine, C. L. Cadwell and Sang Chung, “Transform Representation of the Spectra of Acoustic Speech Segment with Applications-I: General Approach and Application to Speech Recognition,” IEEE Trans. Speech and Audio Processing, vol.1, No.2, April 1993.
[9] Tze Fen Li, ”Speech recognition of mandarin monosyllables,” Pattern Recognition, vol.36, pp2713-2721, April 2003.
[10] L. R.Rabiner, “A tutorial on hidden Markov models and selected applications in speech recognition”, Proc. IEEE, vol.77, pp.257-286, Feb. 1989.
[11] 王小川, ”語音訊號處理”, 全華, 民國93年.
[12] 張慶勇,“中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國93年7月.
[13] 許博閔, “混合式中文人名語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國93年7月.
[14] 侯政寬, “中文關鍵語詞搜尋系統之設計與研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[15] 陳豫德, “中文人名語音辨識系統之設計研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[16] 鄭博文, “雜訊環境下語音辨識系統之設計研究,” 國立中山大學電機工程研究所碩士論文, 民國92年7月.
[17] 賴昭華, “不特定語者中量語詞辨識系統之設計研究,” 國立中山大電機工程研究所碩士論文, 民國91年7月.
[18] 黃銘崇, “不特定語者語詞辨識系統之特徵設計,” 國立中山大學電機工程研究所碩士論文, 民國90年6月.
[19] 中華郵政全球資訊網, http://www.post.gov.tw/post/index.jsp
[20] 內政部民政司, http://www.moi.gov.tw/dca/
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.15.219.217
論文開放下載的時間是 校外不公開

Your IP address is 3.15.219.217
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code