Responsive image
博碩士論文 etd-0824110-152849 詳細資訊
Title page for etd-0824110-152849
論文名稱
Title
法文語音辨識系統之設計研究
A Design of French Speech Recognition System
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
53
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2010-07-28
繳交日期
Date of Submission
2010-08-24
關鍵字
Keywords
隱藏式馬可夫模型、梅爾倒頻譜係數、線性預估倒頻譜係數
Linear predictive cepstrum coefficients, Mel-frequency cepstrum coefficients, Hidden Markov model
統計
Statistics
本論文已被瀏覽 5634 次,被下載 0
The thesis/dissertation has been browsed 5634 times, has been downloaded 0 times.
中文摘要
本論文探討法文語音辨識系統之設計研究與實作策略,系統以法文常用425個單音節作為主要的訓練與辨識方式,將每個單音節以一聲與四聲兩種不同聲調的方式連續唸一次,每個單音節共錄製12次,來作訓練資料。實作採用梅爾倒頻譜係數與線性預估倒頻譜係數來作特徵參數之萃取,運用隱藏式馬可夫模型來作單音的辨識。在CPU時脈為2.2GHz的AMD Athlon xp 2800+ 之個人電腦與Ubuntu 9.04作業系統下,針對3850個法文語詞,吾人約可以達到86%之正確辨識率,平均所需辨識時間約需1.5秒。
Abstract
This thesis investigates the design and implementation strategies for a French speech recognition system. It utilizes the speech features of the 425 common French mono-syllables as the major training and recognition methodology. A training database is established by reading each mono-syllable 12 times in 6 rounds. Every mono-syllable is consecutively read twice with different tones. The first pronounced pattern has high pitch of tone 1,while the second one has falling pitch of tone 4. Mel-frequency cepstrum coefficients, linear predictive cepstrum coefficients, and hidden Markov model are used as the two feature models and the recognition model respectively. Under the AMD Athlon xp 2800+ with clock rate 2.2GHz personal computer and Ubuntu 9.04 operating system environment, a correct phrase recognition rate of 86% can be reached for a 3850 French phrase database. The average computation time for each phrase is about 1.5 seconds.
目次 Table of Contents
摘要 II
致謝 III
圖目錄 VI
表目錄 VII
第一章緒論 1
1-1研究動機 1
1-2研究方法 2
1-3論文章節概要 3
第二章法語發音介紹 4
2-1母子音的發音規則 6
2-2法語的變音符號 9
2-3讀音規則 10
第三章語音辨識系統的流程與數學架構 13
3-1前處理流程 13
3-1-1音節切割 14
3-1-2能量 14
3-1-3越零率 16
3-1-4線性預估係數誤差能量 17
3-2特徵萃取流程 19
3-2-1預強濾波器 19
3-2-2加視窗 20
3-2-3離散傅利葉 20
3-2-4梅爾頻率濾波器 21
3-2-5離散餘弦轉換 22
3-2-6線性預估倒頻譜係數 23
3-3隱藏式馬可夫模型介紹 26
3-3-1參數初始化 28
3-3-2參數重估 29
3-3-3正向逆向程序 29
3-3-4狀態轉移機率矩陣參數重估 32
3-3-5狀態觀察機率矩陣參數重估 33
3-4VITERBI演算法介紹 33
第四章法文辨識系統介紹及實作成果 35
4-1硬體環境與軟體規範 35
4-2音節分類及語料選取 36
4-3音節的訓練策略 38
4-3-1音節訓練方式(一) 38
4-3-2音節訓練方式(二) 39
4-3-3音節訓練方法(三) 40
4-4語文辨識系統實作成果與辨識效能 42
4-4-1法文常用語詞辨識系統 42
4-4-2語文地名辨識系統 43
第五章結論與未來展望 45
5-1結論 45
5-2未來展望 45
參考文獻 46
參考文獻 References
[1] 吳俊榮,“中文二、三、四字詞語詞辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國96年7月。
[2] 賴昭榮,“中文語音辨識系統降低訓練量之策略研究─以地址系統與二三、四字詞系統為例”, 國立中山大學電機工程研究所碩士論文, 民國97年7月
[3] 維基百科, http://zh.wikipedia.org/
[4] 翁德明, 中世紀法文音韻的源頭與流變 , 華藝數位經銷,民國99年。
[5] 白麗虹, 法語發音基礎學習, 萬人,民國85年
[6] 舒毅寧, 停.看.聽. 法語發音入門, 中央圖書,民國89年
[7] 王小川, 語音訊號處理, 全華,民國93年。
[8] 王漢蘭,“隱藏式馬可夫模型應用於語音訊號辨識之研究” , 中原大學資訊工程研究所碩士論文, 民國87年。
[9] 楊永泰,“隱藏式馬可夫模型應用於中文語音辨識之研究”, 中原大學資訊工程研究所碩士論文, 民國88年7月。
[10] 賴昭華,“不特定語者中量語詞辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國91年7月。
[11] X.Huang, A.Acero, and H.W.Hon,Spoken Language Processing, Prentice Hall, Taiwan, 2001.
[12] 法國旅遊局, http://tw.franceguide.com/
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.231.222.84
論文開放下載的時間是 校外不公開

Your IP address is 3.231.222.84
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code