Responsive image
博碩士論文 etd-0906107-035010 詳細資訊
Title page for etd-0906107-035010
論文名稱
Title
中文二、三、四字語詞辨識系統之設計研究
A Design of Speech Recognition System for Two-word、Three-word and Four-word Mandarin Phrases
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
37
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2007-07-26
繳交日期
Date of Submission
2007-09-06
關鍵字
Keywords
聲調辨識、梅爾倒頻譜係數、隱藏式馬可夫模型
tone recognition, MFCC, hidden Markov model
統計
Statistics
本論文已被瀏覽 5638 次,被下載 0
The thesis/dissertation has been browsed 5638 times, has been downloaded 0 times.
中文摘要
本論文針對中文二、三、四字語詞之辨識系統,進行探討與實作。我們運用隱藏式馬可夫模型、文字比對與聲調辨識等策略,來作語詞之評量候選與決策推斷機制。實驗証實,對七萬筆之中文二字語詞、二萬四仟筆之中文三字語詞與二萬二仟筆之中文四字語詞,吾人可以使用約三成之語料作訓練來達到接近整體訓練之效果。本系統在二、三、四字語詞之模擬測試情況下,可分別獲得 80%, 92% 與 97%之正確辨識率。系統所需之辨識時間,在 Intel Celeron 2.4 GHz CPU之個人電腦與Red Hat Linux 9.0 之運算環境下,平均約可在1秒內完成。
Abstract
In this thesis, a two-word, three-word and four-word Mandarin phrases speech recognition system is studied and implemented. This system utilizes hidden Markov model, lexicon search strategy and tone recognition to select the initial phrase candidates and make the final decision. Experimental results indicate that using about one third of the total phrase population, 80%, 92% and 97% correct rates can be achieved for the 70,000 two-word, 24,000 three-word and 22,000 four-word phrases recognition problems respectively. Any spoken phrase can be found within 1 second, using a PC with Intel Celeron 2.4 GHz CPU and Red Hat Linux 9.0 operating system.
目次 Table of Contents
摘要I
致謝II
目錄III
圖目錄V
表目錄VI
第1章 緒論1
1-1 研究動機與目的1
1-2 研究方法2
1-3 章節概要3
第2章 系統架構與語音訊號處理相關技術4
2-1 切割單音4
2-1-1 能量(Energy)4
2-1-2 過零率(Zero Crossing Rate) 4
2-1-3線性預估編碼(Linear Prediction Coding, LPC)5
2-2 特徵萃取(Feature Extraction)8
2-2-1 漢明視窗(Hamming Window )8
2-2-2 梅爾三角濾波器(Mel -Filters Bank)8
2-2-3 餘弦轉換(DCT)9
2-3 四聲聲調辨識9
2-3-1 中文語音特性10
2-3-2 四聲特性10
2-3-3 自相關函數(ACF,Autocorrelation Function)11
2-4 隱藏式馬可夫模型(HMM)15
2-5 維特比演算法(Viterbi Algorithm)16
2-6 系統架構18
第3章 實驗結果21
3-1 聲調實驗結果21
3-2 模擬實驗結果22
3-3 錯誤分析與改善24
3-4 改善策略24
第4章 結論與建議26
4-1 結論26
4-2 建議與未來展望26
第五章 參考資料28
參考文獻 References
[1] http://www.sinica.edu.tw/as/weekly/84/525/04.txt

[2] http://irw.ncit.edu.tw/peterju/speech.html#software

[3] 薛伯謙, “嵌入式系統上的語音辨識”, 國立清華大學資訊工程研究所碩士論文, 民國93年7月.

[4] 許博閔, “混合式中文人名語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國93年7月

[5] 王小川, “語音訊號處理”, 全華, 民國93年

[6] 潘睿慈, “特定語者中文語詞辨識系統之設計研究”, 國立中山大學電機電機工程研究所碩士論文, 民國94年7月

[7] 黃志文、余明興、黃世陽、吳明哲, “中文連音二字詞之語音合成”

[8] 郭智超, “以音節為基礎之中文語音文件檢索系統的研究”, 國立清華大學資訊工程研究所碩士論文, 民國92年6月.

[9] L. R. Rabiner, “A tutorial on hidden Markov modles and selected application in speech recognition”, Proc. IEEE, vol.77, pp. 257-286, Feb. 1989

[10] Ben Gold and Nelson Morgan, “Speech and Audio Signal Processing: Processing and Perception of Speech and Music”, John Wiley & Sons. Inc. 2000

[11] Tze Fen Li, “Speech recognition of mandarin monosyllables,” Patter Recognition, vol.36 pp2713-2721, April 2003.

[12] 蘇吉信, “A Design of Speech Recognition System for Three-word and Four-word Mandarin Phrases” July 2006.

[13] 魏宏璋, “中文地名語音辨識系統之設計研究”,民國95年7月

[14] 賴昭華, “不特定語者中量語詞辨識系統之設計研究” , 國立中山大電機工程研究所碩士論文, 民國91年7月

[15] Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of Speech Recognition”, pp. 97-112, N.J.: Prentice Hail, 1993.

[16] V. R. Algazi, K. L. Brown, M. J. Ready, D. H. Irvine, C. L. Cadwell and Sang Chung, “Transform Representation of the Spectra of Acoustic Speech Segment with Applications-I: General Approach and Application to Speech Recognition,” IEEE Trans. Speech and Audio Processing, vol.1, No.2, April 1993.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 100.26.35.111
論文開放下載的時間是 校外不公開

Your IP address is 100.26.35.111
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code