Responsive image
博碩士論文 etd-0822111-020504 詳細資訊
Title page for etd-0822111-020504
論文名稱
Title
義大利文語音辨識系統之設計研究
A Design of Italian Speech Recognition System
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
55
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2011-07-18
繳交日期
Date of Submission
2011-08-22
關鍵字
Keywords
義大利文語音辨識系統、梅爾倒頻譜係數、線性預估倒頻譜係數、隱藏式馬可夫模型、音位結構學
Phonotactics, Hidden Markov model, Linear predicted cepstral coefficients, Italian speech recognition system, Mel-frequency cepstral coefficients
統計
Statistics
本論文已被瀏覽 5632 次,被下載 472
The thesis/dissertation has been browsed 5632 times, has been downloaded 472 times.
中文摘要
歐洲聯盟(簡稱歐盟)成立於1993年11月1日,它是根據1992年2月7日所簽訂的《馬斯垂克條約》所創建。歐盟成員國主要分佈於歐洲各地區,共包含27個國家,屬於經濟與政治之共同體。其運作之方式採取跨國家與政府之架構,經由歐盟委員會、理事會、議會和歐洲中央銀行之組織,逐步將歐洲各國由區域性共同開發之經濟轉型為單一性政經整合之市場。義大利除了為歐洲聯盟六個創始國之一外,也是八大工業國家組織(簡稱G8)之一員,而G8是當時全球工業先進國家的表徵。義大利扮演著在政治與經濟上不可忽視的角色。本研究之目的在於建立一套義大利文語音辨識系統,使吾人更有效地學習義大利語,進而促進不同文化之了解與擴展旅遊生活之視野。
本論文主要探討義大利文語音辨識系統之設計與實作策略。論文中吾人運用義大利語之發音規則,以370個常用單音節之語音特徵來作系統訓練與辨識之基礎。語音訓練資料庫之錄製採取陰平一聲與去聲四聲兩種音調連續錄製之策略,以彰顯義大利語中重音與非重音之區別。其中一聲為音高維持高值之音調,四聲為音高由高至低值之音調。吾人由第一個常用單音節錄製相同單音之一、四聲各一次,依序錄至第370個單音節,構成一輪。每輪每個單音可獲二次之訓練語料。本論文中使用5輪10次之訓練機制,並採用梅爾倒頻譜係數與線性預估到頻譜係數來作音節特徵參數之萃取,以隱藏式馬可夫模型來作單音之辨識,再由音位結構學之比對,獲得最終之辨識結果。在CPU時脈為2.2 GHz的AMD Athlon XP 2800+ 之個人電腦與Ubuntu 9.04作業系統下,針對4,000筆之義大利文常用語詞資料庫與3,304筆之義大利文能力測驗檢定資料庫,本系統之正確辨識率可分別達到88.35% 與89.32%,兩資料庫之平均辨識時間皆少於1.5秒。而系統之總訓練時間約為二小時。
Abstract
The European Union (EU) established on November 1, 1993, according to the Maastricht Treaty signed on February 7, 1992. This economic and political community consists of 27 member states, primarily located in Europe. She operates through a supranational and intergovernmental system, including the European Commission, the Council, the Parliament and the Central Bank, to transfer herself from the joint economic development regions to the single market of economic and political integration. Italy is one of the six founding countries of the EU, also one of the G8 members, the eight industrially advanced nations in the world, and playing a force to be reckoned with. It is our objective to build a language system that can help us to learn Italian more effectively, to promote our competency of intercultural understanding, and to widen our vision of travel and living.
This thesis investigates the design and implementation strategies for an Italian speech recognition system. It utilizes the speech features of the 370 common Italian mono-syllables as the major training and recognition methodology. A training database of 10 utterances per mono-syllable is established by applying Italian pronunciation rules. These 10 utterances are collected through reading 5 rounds of the same mono-syllables twice with different tones. The first pronounced pattern has high pitch of tone 1, while the second one has falling pitch of tone 4. Mel-frequency cepstral coefficients, linear predicted cepstral coefficients, and hidden Markov model are used as the two syllable feature models and the recognition model respectively. Under the AMD 2.2 GHz Athlon XP 2800+ personal computer and Ubuntu 9.04 operating system environment, correct phrase recognition rates of 88.35% and 89.32% can be reached using phonotactical rules for a 4,000 vocabulary Italian phrase database and a 3,304 word database for Italian Language Proficiency Test. The average computation time for each system is less than 1.5 seconds, and the training time for the systems is about two hours.
目次 Table of Contents
論文審定書 i
摘要 ii
Abstract iii
目錄 iv
圖次 vi
表次 vii
第一章 緒論 1
1-1 研究動機 1
1-2 研究方法 2
1-3 論文章節概要 3
第二章 義大利文語音學基礎 4
2-1 字母表 5
2-2 子音與母音的發音規則 7
2-2-1 母音的發音規則 7
2-2-2 子音的發音規則 7
2-3 發音的音節區分 10
2-4 重音符號與發音規則 11
第三章 語音辨識系統的流程 13
3-1 前處理流程 14
3-1-1 音節切割 14
3-1-2 語音訊號之前置處理 17
3-2 特徵萃取流程 18
3-2-1 線性預估倒頻譜係數 19
3-2-2 梅爾頻率倒頻譜係數 21
3-3 隱藏式馬可夫模型 25
3-3-1 模型參數初始化 26
3-3-2 參數重估 27
第四章 義大利文語音辨識系統實作成果與辨識效能 34
4-1 硬體環境與軟體規範 34
4-2 單音模型之建立與模擬資料庫 35
4-3 單音模型之訓練策略 36
4-3-1 辨識率與單音訓練次數之關係 37
4-3-2 單音訓練每次錄製不同個數之單音 38
4-3-3 每輪每次錄製兩個不同音調之單音 40
4-4 辨識系統實作成果與辨識效能 42
4-4-1 義大利文常用語詞辨識系統 42
4-4-2 義大利文能力測驗檢定系統 43
第五章 結論與未來展望 45
參考文獻 46
參考文獻 References
[1] 林立樹,義大利史-西方文化的智庫,三民書局,2008[民97]。
[2] 墨刻編輯室,義大利,墨刻出版股份有限公司,2008[民97]。
[3] 維基百科,http://zh.wikipedia.org/
[4] Nannini, Alda 藤谷道夫原作:鄭明德譯,義大利語入門,旺文社股份有限公司,1997[民86]。
[5] 康華倫,初級義大利文文法,茂昌圖書有限公司,2004[民93]。
[6] 王小川,語音訊號處理,台北:全華圖書,2004[民93]。
[7] Thomas F. Quatieri, Discrete-Time Speech Signal Processing Principles and Practice, Prentice Hall, Taiwan, 2005
[8] X. Huang, A. Acero, and H.W. Hon, Spoken Language Processing, Prentice Hall, Taiwan, 2001
[9] 義大利辦事處,http://www.italy.org.tw/Chinese/index.html/
[10] 輔仁大學義大利語文學系,http://www.italy.fju.edu.tw/index.php
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:自定論文開放時間 user define
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available


紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code