Responsive image
博碩士論文 etd-0824110-152453 詳細資訊
Title page for etd-0824110-152453
論文名稱
Title
日文語音辨識系統增進辨識率之策略研究
A Design of Recognition Rate Improving Strategy for Japanese Speech Recognition System
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
60
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2010-07-28
繳交日期
Date of Submission
2010-08-24
關鍵字
Keywords
語音辨識、梅爾頻率倒頻譜係數、線性預估倒頻譜係數、次音節模型、語詞訓練、隱藏式馬可夫模型
Phrase training, Sub-syllable model, Mel-frequency cepstral coefficients, Speech recognition, Linear predictive cepstrum coefficients, Hidden Markov model
統計
Statistics
本論文已被瀏覽 5617 次,被下載 0
The thesis/dissertation has been browsed 5617 times, has been downloaded 0 times.
中文摘要
本論文主要針對日文語音辨識系統增進辨識率之策略,進行語詞訓練與子音校正二方面之研究。在語詞訓練方面,吾人利用各個音類的平衡篩選得到995個二音節日語語詞當作訓練語料,並進行左右字音的混合訓練,產生188類日文常用單音之特徵模型,以達到增進辨識率之效果;在子音自動校正方面,吾人利用次音節模型來輔助子音以提升其子音辨識率,進而提升語詞辨識率。經實驗証實,運用吾人發展出的語詞訓練庫及子音校正策略,針對共三萬四千筆日文語詞,吾人可將平均正確辨識率由86.91%提升至92.38%。
Abstract
This thesis investigates the recognition rate improvement strategies for a Japanese speech recognition system. Both training data development and consonant correction scheme are studied. For training data development, a database of 995 two-syllable Japanese words is established by phonetic balanced sieving. Furthermore, feature models for the 188 common Japanese mono-syllables are derived through mixed position training scheme to increase recognition rate. For consonant correction, a sub-syllable model is developed to enhance the consonant recognition accuracy, and hence further improve the overall correct rate for the whole Japanese phrases. Experimental results indicate that the average correct rate for Japanese phrase recognition system with 34 thousand phrases can be improved from 86.91% to 92.38%.
目次 Table of Contents
摘 要 II
致 謝 III
目 錄 IV
圖目錄 VI
表目錄 VII

第一章 緒論 1
1-1 研究動機 1
1-2 研究方法 1
1-3 論文章節概要 4

第二章 日語語音學基礎 5
2-1 日語五十音及羅馬拼音系統 5
2-2 發音規則 6
2-3 特殊發音 8
2-4 音節判斷與單音定義 11

第三章 語音辨識系統的架構 14
3-1 前處理流程 14
3-1-1 音節切割 14
3-1-2 高頻預強 16
3-1-3 取框與加窗 16
3-2 特徵萃取流程 17
3-2-1 梅爾頻率倒頻譜係數 18
3-2-2 線性預估倒頻譜參數 21
3-3 隱藏式馬可夫模型 23
3-3-1 隱藏式馬可夫模型之訓練 24
3-3-2 隱藏式馬可夫模型之辨識程序 30
3-4 交叉比對 32

第四章 提升辨識率之策略 33
4-1 硬體環境、軟體規範與實驗語料 33
4-2 訓練策略 35
4-2-1 重音訓練模型 35
4-2-2 語詞訓練模型 36
4-2-3 降低語詞訓練量 38
4-2-4 訓練策略綜合比較 39
4-3 子音修正策略 40
4-3-1 日語子音簡介 40
4-3-2 次音節切割與訓練 41
4-3-3 子音修正效能 43
4-4 實驗總結 45

第五章 日語辨識系統實作成果與辨識效能 47
5-1 日文常用語詞辨識系統 47
5-2 日語檢定字彙辨識系統 48
5-3 日本地名辨識系統 49
5-4 日本人名辨識系統 50
5-5 與中文辨識系統比較 51

第六章 結論與未來展望 52
6-1 結論 52
6-2 未來展望 52

參考文獻 53
參考文獻 References
[1] George Weber,“TOP LANGUAGES-The World's 10 most influential Languages”, http://www.andaman.org/BOOK/reprints/weber/rep-weber.htm。
[2] 維基百科, http://zh.wikipedia.org/。
[3] 陳孟揚, “日文語音辨識系統之設計研究”, 國立中山大學電機工程研究所 碩士論文, 民國98年7月。
[4] 賴昭榮, “中文語音辨識系統降低訓練量之策略研究─以地址系統與二、三、四字詞系統為例”, 國立中山大學電機工程研究所 碩士論文, 民國97年7月。
[5] 謝文廣, “中文語音辨識系統增進辨識率之策略研究─以地址系統與二、三、四字詞系統為例” 國立中山大學電機工程研究所碩士論文, 民國98年7月。
[6] 渡邊弘史, “日中兩語語音對照分析-包括日語長音之理論與語彙分類”, 吳鳳學報, 民國94年。
[7] 戶田昌幸、黃國彥 合著,日語語音學入門 , 鴻儒堂出版社, 民國80年。
[8] 王小川, 語音訊號處理, 全華出版社,民國93年。
[9] Sadaoki Furui, “Speech recognition for Japanese spoken language”, 1994 IEEE。
[10] Shin-ichiro、Hashimukai、Chikahiro Araki、Mikio Mori、Shuji Taniguchi、Shozo Kato, “A New Method to Reduce the Ambiguity of Japanese Phoneme Candidates Recognized by Recurrent Neural Networks”,2008 IEEE。
[11] 渡邊弘史, “日語重音之理論與語音分類”, 吳鳳學報, 民國92年。
[12] 林彩惠日語學苑,http://www.thcs.com.tw/courseInfoListAction.xml。
[13] 蔡永琪,“基於次音節單元之關鍵詞辨識”, 國立中央大學電機工程研究所 碩士論文, 民國84年。
[14] 財團法人語言訓練測驗中心, http://www.lttc.ntu.edu.tw/。
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 18.191.234.62
論文開放下載的時間是 校外不公開

Your IP address is 18.191.234.62
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code