論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available
論文名稱 Title |
台灣、香港與大陸地區中文地址語音辨識系統之設計研究 A Design of Mandarin Speech Recognition System for Addresses in Taiwan,Hong Kong and China |
||
系所名稱 Department |
|||
畢業學年期 Year, semester |
語文別 Language |
||
學位類別 Degree |
頁數 Number of pages |
51 |
|
研究生 Author |
|||
指導教授 Advisor |
|||
召集委員 Convenor |
|||
口試委員 Advisory Committee |
|||
口試日期 Date of Exam |
2007-07-26 |
繳交日期 Date of Submission |
2007-09-06 |
關鍵字 Keywords |
隱藏式馬可夫模型、梅爾倒頻譜係數 MFCC, Hidden Markov Model |
||
統計 Statistics |
本論文已被瀏覽 5711 次,被下載 0 次 The thesis/dissertation has been browsed 5711 times, has been downloaded 0 times. |
中文摘要 |
本論文的主要目的在針對中文地名語音辨識系統進行設計與實作。完成之系統能正確辨識出台灣地區之戶籍及通訊地址,大陸地區北京、上海、天津、重慶四個直轄市之通訊地址,與香港地區之路名及學校飯店等公眾場所之名稱。論文中運用梅爾倒頻譜係數、隱藏式馬可夫模型與語音文字比對策略,來作初步之評量候選機制;並配合中文之聲調辨識,以提昇最終之系統正確率。在語者特定的環境下,使用Celeron 2.4 GHz之CUP與Red Hat 9.0 之作業系統,正確率可逹到90%,而辨識約可在3秒內完成。 |
Abstract |
The objective of this thesis is to design and implement a speech inputting system for addresses in Taiwan,Mainland china and HongKong,The completed system has the capability to identify full census and posting addresses in Taiwan and full posting addresses in Peking、Shanghai、Tien-Jin and Chungchin of China。For HongKong,a partial address system,including region/street name or school,hotal and other public location names,is implemented。 In this thesis,Mel frequency cepstrum coefficient,Hidden Mavkov model and lexicon search strategy are applied to choose the initial address candidates;Mandarin intonation classification technique is then used to increase the final correct rate,under speaker dependent case,a 90%correct rate can be reached by using a Intel Celeron 2.4GHz CPU and RedHat Linux 9.0 operating system。The total address-inputting task can be completed within 3 seconds。 |
目次 Table of Contents |
目 錄 致謝Ⅰ 摘要Ⅲ 目錄Ⅳ 圖表目錄Ⅵ 第一章 緒論1 1-1 研究動機與目的1 1-2 研究方法簡介2 1-3 論文架構2 第二章 語音處理的基本技術3 2-1 語音辨識系統的基本構3 2-1-1 語音辨識之技術分類3 2-1-2 語音辨識流程4 2-2 語音訊號的前處理介紹5 2-2-1 端點偵測(Endpoint Detection)5 2-2-2 能量(Energy)6 2-2-3 越零率(Zero Crossing Rate)7 2-2-4 線性預估誤差能量(LPCEE)9 2-3 特徵萃取(Feature Extraction)13 2-3-1 音框化13 2-3-2 標準化(Normalize)14 2-3-3 漢明窗(Hamming window)15 2-3-4 傅立葉轉換16 2-3-5 倒頻譜係數(Cepstrum Coefficient)17 2-4 隱藏式馬可夫模型(Hidden Markov Model, HMM)20 第三章 辨識系統設計25 3-1 資料庫建立25 3-1-1 中國省地縣鄉建立25 3-1-2 大陸四個直轄市路名建立28 3-1-3 香港資料庫的建立29 3-1-4 台灣地址資料庫的建立30 3-2 系統輸入介紹32 3-3 系統架構37 3-4 系統相關設定41 3-5 實驗結果42 第四章 結論與未來展望43 參考文獻44 |
參考文獻 References |
[1] 北京郵政在線 http://www.bjpost.gov.cn/ [2] 重慶郵政 http://www.cqpost.com.cn:8080/postcode/index.jsp [3] 中國行政區劃網 http://www.xzqh.org/quhua/ [4] 王小川, “語音訊號處理”, 全華, 民國93年. [5] 魏宏章, “中文語音辨識系統之設計研究”國立中山大學電機工程研究所碩士論文,民國95年7月. [6] 陳躍升, “中文履歷表之語音建構之系統設計”國立中山大學電機工程研究所碩士論文,民國95年7月. [7] 林維琦, “古今中外人名語音辨識系統之設計研究”國立中山大學電機工程研究所碩士論文,民國95年7月. [8] 張文杰, “模型調式之語者辨識系統”國立中央大學電機工程研究所碩士論文. [9] 2006香港街道圖 萬里機構出版. [10] Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of Speech Recognition”, N.J.: Prentice Hail, 1993. [11] Tze Fen Li, “Speech recognition of mandarin monosyllables,” Patter Recognition, vol.36 pp2713-2721, April 2003. [12] L. R.Rabiner, “A tutorial on hidden Markov models and selected applications in speech recognition”, Proc, IEEE, vol.77, pp.257-286, Feb, 1989. [13] Kazunaga Yoshida, Takao Watanabe and Shinji Koga,“Large vocabulary word recognition based on demi-syllable hidden markov model using samll amount of training data”, C&C Information Technology Research Laboratories, NEC Corporation, 4-1-1 Miyazaki, Miyamac-ku, Kawasaki213, JAPAN. [14] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders”, John Wiley & Sons, Inc. 2003 [15] Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models” , Proc. ICSI, April 1998 |
電子全文 Fulltext |
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。 論文使用權限 Thesis access permission:校內校外均不公開 not available 開放時間 Available: 校內 Campus:永不公開 not available 校外 Off-campus:永不公開 not available 您的 IP(校外) 位址是 18.224.63.87 論文開放下載的時間是 校外不公開 Your IP address is 18.224.63.87 This thesis will be available to you on Indicate off-campus access is not available. |
紙本論文 Printed copies |
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。 開放時間 available 已公開 available |
QR Code |