Responsive image
博碩士論文 etd-0906107-032140 詳細資訊
Title page for etd-0906107-032140
論文名稱
Title
中文履歷表語音輸入系統之設計研究
A Design of Speech Inputting System for Chinese Resumes
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
41
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2007-07-26
繳交日期
Date of Submission
2007-09-06
關鍵字
Keywords
梅爾倒頻譜係數、隱藏式馬可夫模型
Hidden Markov model, Mel-frequency cepstrum coefficients
統計
Statistics
本論文已被瀏覽 5614 次,被下載 0
The thesis/dissertation has been browsed 5614 times, has been downloaded 0 times.
中文摘要
本論文使用隱藏式馬可夫模型、最大相似比與文字比對等策略,來完成中文簡歷表的口語輸入。簡歷表中包含姓名之介紹、性別、出生年月日、籍貫與學歷等5項輸入。系統建立在 Intel Pentium 1.6 GHz 之 PC 與 Red Hat Linux 9.0 之作業系統上。在特定語者環境下,吾人可以語音輸入之方式,平均在45秒內,完成個人基本簡歷資料之輸入。
Abstract
In this thesis, hidden Markov model, maximum likelihood ratio and lexicon search strategy are used to establish a Chinese resume inputting system. The resume contains five items: name introduction, gender, birth date, birth place and education. This system is developed using a PC with an Intel Pentium 1.6 GHz CPU and Red Hat Linux 9.0 operating system. For the speaker-dependent case, a resume can be completed within 45 seconds on the average.
目次 Table of Contents
摘要I
致謝II
目錄III
圖目錄VI
表目錄VII
第1章 緒論1
1-1 研究動機與目的1
1-2 研究方法1
1-3 論文架構2
第二章 語音處理之技術研究3
2-1 語詞辨識的基本架構3
2-2 語音辨識之前置處理5
2-2-1 端點偵測5
2-2-1-1 能量5
2-2-1-2 越零率6
2-2-1-3 線性預估係數誤差能量7
2-2-2 預強8
2-2-3 取窗型函數9
2-3 線性預測倒頻譜參數10
2-4 求倒頻譜參數11
2-5 梅爾倒頻譜係數12
2-6 隱藏式馬可夫模型14
2-7 最大相似比測試15
2-8 文字比對作為語詞切割機制17
第3章 履歷表之語音建構系統設計19
3-1 履歷表總項目介紹19
3-2 履歷表之語音建構系統輸出方式20
3-3 履歷表之語音建構系統操作介紹21
3-4 資料庫建立23
3-4-1 資料庫介紹和來源23
3-4-2 系統訓練資料庫建立25
3-5 履歷項目之辨識流程25
3-5-1 姓名介紹系統辨識流程26
3-5-2 基本資料辨識流程27
3-6 單音辨識系統流程28
3-7 文字比對模型之建立29
3-8 各項系統實驗參數30
第四章 結論與未來展望31
參考文獻32
參考文獻 References
[1] A.lan V. Oppenheim, Ronald W. Schafer, with John R. Buck, “Discrete-Time Signal Processing”, N.J.: Prentice Hall, 1999.

[2] Ben Gold and Nelson Morgan, “Speech and Audio Signal Processing : Processing and Perception of Speech and Music”, John Wiley & Sons, Inc. 2000.

[3] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders”, John Wiley & Sons, Inc. 2003.

[4] Tze Fen Li, “Speech recognition of mandarin monosyllables,” Pattern Recognition, vol.36, pp2713-2721, April 2003.

[5] U.C.Berkeley, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models”ICSI. April 1998.

[6] Robert J. Sternberg, “Cognitive Psychology” 2th Ed. Holt, Rinehart, & Winston, 1999.

[7] 王小川, ”語音訊號處理”, 全華, 民國93年.

[8] 張慶勇,“中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國93年7月.

[9] 鄭吉峰,“台灣地區中文地址語音辨識系統之設計研究”, 國立中山大學電機工程研究所碩士論文, 民國94年7月.

[10] 賴昭華, “不特定語者中量語詞辨識系統之設計研究,” 國立中山大電機工程研究所碩士論文, 民國91年7月.

[11] Yue-sheng Chen “A System Design of Chinese Resume by Speech Construction”國立中山大學電機工程學系研究所碩士論文,民國94年7月.

[12] Hong-Jhang Wei ”A Design of Speech Recognition System for the Mandarin Toponyms” 國立中山大學電機工程學系研究所碩士論文,民國94年7.

[13] 顧宏義 馬自毅 注釋“新譯 百家姓”三民書局2005年.

[14] 劉明堂主編 “2007 台灣名人錄”中央通訊社 2007年.

[15] 王永志主編 “2006 台灣名人錄”中央通訊社 2006年.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外均不公開 not available
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.140.185.170
論文開放下載的時間是 校外不公開

Your IP address is 3.140.185.170
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code