Responsive image
博碩士論文 etd-0824109-165741 詳細資訊
Title page for etd-0824109-165741
論文名稱
Title
中文語音辨識系統增進辨識率之策略研究-以地址系統與二、三、四字詞系統為例
A Design of Recognition Rate Improving Strategy for Mandarin Speech Recognition System - A Case Study on Address Inputting System and Phrase Recognition System
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
57
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2009-07-29
繳交日期
Date of Submission
2009-08-24
關鍵字
Keywords
自動聲調辨識、隱藏式馬可夫模型、梅爾頻率倒頻譜係數、次音節模型、線性預估倒頻譜係數、語音辨識
speech recognition, hidden Markov model, sub-syllable model, automatic tone recognition, LPCC, MFCC
統計
Statistics
本論文已被瀏覽 5655 次,被下載 0
The thesis/dissertation has been browsed 5655 times, has been downloaded 0 times.
中文摘要
本論文主要針對中文語音辨識系統增進辨識率之策略,進行聲調自動偵測與子音自動校正的研究,並將其運用在中文地址系統與二、三、四字詞系統中。在聲調自動偵測方面,吾人經由統計分析中文四聲的聲學特徵分佈,約可自動在6分鐘內估計出四組參數來作為四聲辨識之模型,提升其聲調之正確辨識率,並免除手動調校所需約到8小時之冗長程序,加快聲調模型之訓練速度;在子音自動校正方面,吾人利用次音節模型來輔助子音以提升其子音辨識率,進而提升語詞辨識率。經實驗証實在不增加訓練量的前題下,經由自動偵測聲調及子音校正的策略,針對地址系統約18萬筆地名資料,吾人可獲得90%以上之正確辨識率。針對共11萬6千筆二、三、四字詞之中文語音辨識系統,吾人能將正確辨識率分別由約77%, 94%, 97.5%,提昇到約85%, 96%, 98%。
Abstract
This thesis investigates the recognition rate improvement strategies for a Mandarin speech recognition system. Both automatic tone recognition and consonant correction schemes are studied and applied to the Mandarin address inputting system and the Mandarin 2, 3, 4-word phrase recognition systems. For automatic tone recognition scheme, the acoustic properties of the four tones in the Mandarin training database are estimated statistically by 4 sets of parameters within 6 minutes. These automatically generated parameters can greatly increase the tone recognition accuracy, and at the same time reduce the amount of time spent in the manual tone parameter adjustment, that is about 8 hours in general. For consonant correction scheme, the sub-syllable models are developed to enhance the consonant recognition accuracy, and hence further improve the overall correct rate for the whole Mandarin phrases. Experimental results indicate that over 90% correct rate can be achieved for the Mandarin address inputting system with 180 thousand place names by applying the above two schemes. Furthermore, the recognition rates for the Mandarin 2, 3, 4-word phrase recognition systems with 116 thousand phrases in total can be improved from 77%, 94% and 97.5%, to 85%, 96% and 98% respectively.
目次 Table of Contents
摘要 Ⅰ
致謝 Ⅱ
目錄 Ⅲ
圖目錄 Ⅵ
表目錄 Ⅶ
第1章 緒論 1
1-1 研究動機 1
1-2 研究方法、目的與基本架構 1
1-3 章節概要 5
第2章 語音辨識相關技術與系統架構之研究 6
2-1 音節切割 6
2-1-1 能量 6
2-1-2 過零率 7
2-1-3 線性預估係數誤差能量 7
2-2 特徵萃取 8
2-2-1 高頻預強調 8
2-2-2 加視窗與取音框 8
2-2-3 離散傅利葉轉換 9
2-2-4 梅爾頻率濾波器 9
2-2-5 離散餘弦轉換 10
2-2-6 差量倒頻譜係數 11
2-2-7 線性預估編碼 11
2-2-8 線性預估倒頻譜係數 12
第3章 語音模型的訓練與辨識流程 14
3-1 隱藏式馬可夫模型 14
3-2 隱藏式馬可夫的訓練 15
3-2-1 參數模型初始化 15
3-2-2 參數重估 17
3-3 隱藏式馬可夫的辨識程序 21
第4章 中文語音聲調自動辨識之研究 23
4-1 中文語音聲調簡介 23
4-2 中文變調規則 23
4-2-1 上聲的聲調 24
4-2-2 多音節上聲的變調 24
4-3 音高軌跡 25
4-4 音高模型建立 27
4-5 模擬測試 28
4-6 實驗結果 29
第五章 中文子音辨識之研究 34
5-1 中文子音簡介 34
5-2 中文子音端點偵測 36
5-2-1 能量 36
5-2-2 越零率 37
5-2-3 音框相關性係數 37
5-2-4 切割臨界值偵測 38
5-3 次音節的訓練與模擬 40
5-3-1 次音節訓練 41
5-3-2 子音模擬方法及模擬結果 41
第六章 地址辨識系統之介紹 44
6-1 資料庫來源介紹 44
6-2 系統輸入輸出介紹 44
6-3 系統模擬測試 45
第七章 結論、建議與未來展望 47
7-1 結論 47
7-2 建議與未來展望 48
參考文獻 49
參考文獻 References
[1] 賴昭榮,“中文語音辨識系統降低訓練量之策略研究-以地址系統與二、三、四字詞系統為例”, 國立中山大學碩士論文,民國96年.
[2] 鄭鶴得,“中文二字語詞辨識系統之設計研究”, 國立中山大學碩士論文,民國95年.
[3] 陳躍升,“中文履歷表之語音建構系統設計”, 國立中山大學碩士論文,民國94年.
[4] 王小川,語音訊號處理,全華,民國96年.
[5] Xuedong Huang, Alex Acero, and Hsiao-Wuen Hon,Spoken Language Processing, Prentice Hall, Inc., 2001.
[6] John R. Deller Jr., John G. Proakis, John H. L. Hansen, Discrete-Time Processing of Speech Signals, Prentice Hall, 1993.
[7] 國音臺灣師範大學國音教材編輯委員會編纂,國音學,正中書局,民國89年.
[8] Barnett Vic,Lewis Toby, " Outliers in Statistical Data", John Wiley & Sons,1994.
[9] 蔡炎興,“關鍵詞萃取及語者辨識系統之研製”, 國立中央大學碩士論文, 民國91年.
[10] 蔡永琪,“基於次音節單元之關鍵詞辨識”, 國立中央大學碩士論文,民國84年.
[11] 王勝明,“台灣、香港與大陸地區中文語音辨識之設計研究”, 國立中山大學碩士論文,民國95年.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.146.221.52
論文開放下載的時間是 校外不公開

Your IP address is 3.146.221.52
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code