Responsive image
博碩士論文 etd-0907106-224505 詳細資訊
Title page for etd-0907106-224505
論文名稱
Title
古今中外人名語音辨識系統之設計研究
A Design of Speech Recognition System for Chinese Names of Historical Figures Around the World
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
38
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2006-07-26
繳交日期
Date of Submission
2006-09-07
關鍵字
Keywords
隱藏式馬可夫模型、端點偵測、梅爾倒頻譜係數
Mel-frequency cepstrum coefficients(MFCC), Hidden Markov model(HMM), Endpoint detection
統計
Statistics
本論文已被瀏覽 5664 次,被下載 0
The thesis/dissertation has been browsed 5664 times, has been downloaded 0 times.
中文摘要
本論文探討古今中外人名之辨識問題。文中蒐集並錄製了二次的四萬六千多筆人名,來作語音辨識之基礎。我們運用梅爾倒頻譜係數、人名單音節之隱藏式馬可夫模型與語音文字比對策略,來作初步人名之評量候選機制,並配合中文之聲調辨識,以提昇最終結果之可靠度。實驗證明:在語者相依的條件下,我們以第ㄧ次錄製之四萬六千筆人名語料作訓練,第二次錄製之語料當作測試,系統可獲得9成之正確辨識率。而每ㄧ人名之辨識,在Intel Celeron 2.4 GHz之處理器與Red Hat Linux 9.0的運算環境下,均可在1.5秒內完成。
Abstract
A design of speech recognition system for Chinese names of historical figures around the world is proposed in this thesis. A speech database of approximately forty-six thousand Chinese names is collected and recorded twice for system evaluation. This system applies Mel-frequency cepstrum coefficients, monosyllable HMM’s and speech-text alignment scheme to accomplish initial candidate selection. A Mandarin pitch identification mechanism is then followed to increase the correct rate and obtain the final answer. The experimental results indicate that a 90% correct identification rate can be achieved, under the condition that the first session recording material is used for training and the second one for testing. For the speaker dependent case, the correct name can be recognized within 1.5 seconds, using a PC with an Intel Celeron 2.4 GHz CPU and RedHat Linux 9.0 Operation System.
目次 Table of Contents
致謝 I
摘要 II
目錄 III
圖目錄 V
表目錄 VI

第1章 緒論 1
1-1 研究動機與目的 1
1-2 研究方法 1
1-3 章節概要 1

第2章 語音信號處理之基本技術 2
2-1 語音辨識系統架構 2
2-2 端點偵測(Endpoint Detection) 3
2-2-1 能量(Energy) 3
2-2-2 越零率(Zero Crossing Rate) 3
2-3 視窗函數(Window Function) 5
2-4 特徵萃取(Feature Extraction) 7
2-4-1 線性預估倒頻譜係數 8
2-4-2 梅爾倒頻譜係數(MFCC) 9
2-5 隱藏式馬可夫模型(HMM) 12
2-5-1 隱藏式馬可夫模型理論 12
2-5-2 訓練系統(Training) 14
2-5-3 測試系統(Testing) 14
2-6 自相關函數(ACF,Autocorrelation Function) 15

第3章 系統設計與實驗結果 18
3-1 資料庫建立與規劃 18
3-2 資料庫錄製方式 20
3-3 系統簡介 21
3-4 系統架構 22
3-5 系統相關參數設定 26
3-6 實驗結果 27

第4章 結論與建議 28
4-1 結論 28
4-2 建議 29

參考文獻 30
參考文獻 References
[1] 鄭吉峰,“台灣地區中文地址語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月

[2] 孫益君,“以PDA為平台之語音辨識應用系統開發”,中原大學資訊工程研究所碩士論文,民國92年7月

[3] 楊永泰,“隱藏式馬可夫模型應用於中文語音辨識之研究”,中原大學資訊工程研究所碩士論文,民國88年7月

[4] 王小川,“語音訊號處理”,全華,民國93年

[5] 維基百科,http://zh.wikipedia.org/

[6] 台灣概覽,http://twinfo.ncl.edu.tw/

[7] 全國商工行政服務網,http://210.69.121.50/~doc/ce/cesc1110.html

[8] 公開資訊觀測站,http://newmops.tse.com.tw/

[9] 歌詞帝國,http://www.kikikoko.idv.tw/

[10] 批踢踢實業坊,bbs://ptt.cc

[11] David S. Petruncio,Jr. and Mark A. Hasegawa-Johnson,“Evaluation of Various Features for Music Genre Classification with Hidden Markov Models”, March 2002

[12] 陳豫德,“中文人名語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月

[13] Lawrence Rabiner and Biing-Hwang Juang, "Fundamentals of Speech Recognition", N.J.: Prentice Hail, 1993.

[14] Ben Gold and Nelson Morgan, "Speech and Audio Signal Processing : Processing and Perception of Speech and Music", John Wiley & Sons, Inc. 2000.

[15] Wai C. Chu, “Speech Coding Algorithms : Foundation and Evolution of Standardized Coders” , John Wiley & Sons, Inc. 2003

[16] Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models” , Proc. ICSI, April 1998

[17] 黃銘崇,“不特定語者語詞辨識系統之特徵設計”,國立中山大學電機工程研究所碩士論文,民國90年6月

[18] 鄭博文,“雜訊環境下語音辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國92年7月

[19] 賴昭華,“不特定語者中量語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國91年7月

[20] 潘睿慈,“特定語者中文語詞辨識系統之設計研究”,國立中山大學電機工程研究所碩士論文,民國94年7月
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 18.222.120.133
論文開放下載的時間是 校外不公開

Your IP address is 18.222.120.133
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code