Responsive image
博碩士論文 etd-0824109-172533 詳細資訊
Title page for etd-0824109-172533
論文名稱
Title
英文語音辨識系統之設計研究
A Design of English Speech Recognition System
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
60
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2009-07-29
繳交日期
Date of Submission
2009-08-24
關鍵字
Keywords
梅爾倒頻譜係數、線性預估倒頻譜係數、隱藏式馬可夫模型、語音辨識
Linear predicted cepstrum coefficients, Hidden Markov model, Mel frequency cepstrum coefficients, Speech recognition
統計
Statistics
本論文已被瀏覽 5642 次,被下載 0
The thesis/dissertation has been browsed 5642 times, has been downloaded 0 times.
中文摘要
本論文探討英文語音辨識系統之設計與實作策略,系統可以以英文字母拼字讀入的方式或直接唸英文單字的方式來作英文單字之口語輸入辨識與查詢。實作採用梅爾倒頻譜係數與線性預估倒頻譜係數來作特徵參數之萃取,運用隱藏式馬可夫模型來作聲音之辨識。在Pentium 1.6 GHz之個人電腦與Ubuntu 8.04作業系統下,針對11萬筆英文單字作拼字讀入辨識,吾人約可達到95%之正確辨識率;而針對1500個英文單字作直接唸英文單字作辨識,吾人亦可達到93%之正確辨識率,兩種輸入方式之平均所需辨識時間均約在1.5秒以內。
Abstract
This thesis investigates the design and implementation strategies for a English speech recognition system. Two speech inputting methods, the spelling inputting and the reading inputting, are implemented for English word recognition and query. Mel-frequency cepstrum coefficients, linear predicted cepstrum coefficients, and hidden Markov model are used as the two feature models and the recognition model respectively. Under the Pentium 1.6 GHz personal computer and Ubuntu 8.04 operating system environment, a 95% correct recognition rate can be obtained for a 110 thousand English word database by the spelling inputting method; and a 93% correct recognition rate can be achieved for a 1,500 English word database by the reading inputting method. The average computation time for each word using either inputting method is about 1.5 seconds.
目次 Table of Contents
致謝I
摘要II
目錄III-V
圖目錄VI
表目錄VII
第一章 緒論1
1-1 研究動機1
1-2 研究目的及方法1
1-3 設計架構流程2
第二章 英文的起源及發音的介紹3
2-1 英文的介紹3
2-1-1 英文的歷史3
2-2 如何學英文發音5
2-2-1 美音和英音5
2-2-2 英文KK音標的符號介紹5
2-3 英文母音的介紹7
2-4 英文子音的介紹7
2-5 英文語音的分類8
2-6 KK音標符號的顯示問題9
2-7 字彙KK音標的收集與處理11
第三章 語音訊號處理介紹14
3-1 單位語詞及音節的切割14
3-1-1 音框能量與越零率14
3-1-2 線性預估誤差能量16
3-2 梅爾頻率倒頻譜係數16
3-2-1 預強調17
3-2-2 音框化17
3-2-3 漢明窗18
3-2-4 梅爾三角濾波器19
3-2-5 離散傅立葉轉換20
3-2-6 離散餘弦轉換20
3-3 線性預估係數21
3-3-1 線性預估倒頻譜參數22
第四章 語音訓練的模型24
4-1 隱藏式馬可夫模型24
4-2 維特比演算法26
第五章 英文語音辨識系統29
5-1 英文拼音辨識系統的介紹29
5-1-1 資料的收集與建立29
5-1-2 系統的設計方法30
5-1-3 字母比對流程34
5-1-4 系統架構圖35
5-1-5 訓練方式與辨識率之關係36
5-1-6 實驗結論41
5-1-7 隨機測試42
5-2 英文辨識系統的介紹43
5-2-1 資料的收集與建立43
5-2-2 系統的設計方法44
5-2-3 系統架構圖46
5-2-4 實驗結果47
5-2-5 實驗結論49
5-2-6 隨機測試50
第六章 未來展望51
參考文獻52
參考文獻 References
[1] 賴昭榮, “中文語音辨識系統降低訓練量之策略研究-以地址系統與二、三、四字詞系統為例”, 國立中山大學電機工程研究所碩士論文, 民國97年7月。
[2] 陳儒平, “中文語音辨識系統增進辨識率之策略研究-以人名系統與二、三、四字詞系統為例”, 國立中山大學電機工程研究所碩士論文, 民國97年7月。
[3] 吳俊榮, “中文二、三、四字語詞辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國96年7月。
[4] 吳銘鈞, “以音節為基礎之語者識別”, 國立清華大學資訊工程研究所碩士論文, 民國92年6月。
[5] 羅瑞麟, “以語者辨識與評分輔助口說英文學習”, 國立清華大學資訊工程研究所碩士論文, 民國93年6月。
[6] 美國人口調查局 http://www.census.gov/
[7] 楊煒仁, “K.K.音標教學”, 文鶴, 民國86年。
[8] 楊懿麗, “英語語音學”, 渤海堂, 民國83年。
[9] 黃正興, “英語發音(English Pronunciation)”, 三民, 民國87年
[10] 王小川, “語音訊號處理” , 全華, 民國96年。
[11] Xuedong Huang&Alex Acero&Hsiao-Wuen Hon, “SPOKEN LANGUAGE PROCESSING” , PEARSON , Jun 2005
[12] Konstantinos G. Derpanis, “Isolated English Letter Speech Recognition” , York University, Department of Computer Science and Engineering , April 5, 2004
[13] Carnegie Mellon University http://www.cmu.edu/index.shtml
[14] 台灣教育部 http://www.edu.tw/
[15] Phonetics:The Sounds of American English http://www.uiowa.edu/~acadtech/phonetics/english/frameset.html
[16] Phoneme Chart: English Vowel and Consonant Sounds http://www.btinternet.com/~ted.power/phon00.htm
[17] 維基百科 http://zh.wikipedia.org/w/index.php?title=%E8%8B%B1%E8%AF%AD&variant=zh-hant
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.140.186.241
論文開放下載的時間是 校外不公開

Your IP address is 3.140.186.241
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code