Responsive image
博碩士論文 etd-0527113-145410 詳細資訊
Title page for etd-0527113-145410
論文名稱
Title
多線性主成分分析下使用邏輯斯迴歸及KNN演算法之區別分析比較-左心室心臟超音波資料之實證研究
Comparison on Discriminant Analysis Using Logistic Regression and KNN Algorithm Based on Multilinear Principal Component Analysis for Study of Cardiology Ultrasound in Left Ventricle
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
53
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2013-06-17
繳交日期
Date of Submission
2013-06-27
關鍵字
Keywords
KNN 演算法、灰階值、多線性主成分分析、邏輯斯迴歸模型
gray-scale value, k-nearest neighbors, logistic regression model, multilinear principal component analysis
統計
Statistics
本論文已被瀏覽 5783 次,被下載 0
The thesis/dissertation has been browsed 5783 times, has been downloaded 0 times.
中文摘要
過去許多文獻指出,罹患心臟疾病患者的心臟收縮與舒張機能,相對於正常人來得較差。因此我們試圖利用二維心臟超音波影像的灰階值做為資料數據,利用心臟收縮與舒張所造成的差異來分析心臟功能是否正常,期望以統計的方法對此數據進行分析,找出影響心臟功能最重要的地方,以及試圖利用資料提供的訊息將其功能正常者與異常者進行分類。

根據楊小瑩 (2012) 和陳柏嵂 (2012) 在分析左心室心臟超音波影像資料時,在使用主成分分析的方法時,因為高維度矩陣容易產生較大的變異,因此本研究引用 Hung, H. et al.(2012) 多線性主成分分析 (Multilinear Principal Component Analysis) 的方法,可將高維度空間映射到低維空間中去,降維度的過程就是捨棄不重要的特徵向量縮減維度,相較於一般的主成分分析,多線性主成分分析保留了資料的結構性且有較佳的解釋比例,再以邏輯斯迴歸模型及 KNN 演算法 (K-Nearest Neighbors Algorithm) 來探討受試者分類結果之正確性。
Abstract
Many studies in the literature pointed out that systolic and diastolic function of the heart is poor for patients with certain heart diseases relative to normal people. Here a two-dimensional echocardiographic image with gray-scale values is used as the two-dimensional response data to examine the heart functional risk. We make use of the differences between the systolic and diastolic in left ventricle of the heart images to analyze heart function and see if it is normal or abnormal. The objective of this study is to identify the important areas in left ventricle, as well as trying to use the information provided by the data to classify the people into two categories as with normal heart function or not.

According to Yang (2012) and Chen (2012), in the analysis of cardiology ultrasound imaging data in left ventricle, while using principal component analysis (PCA in short) method, it will yield larger variations in the high-dimensional covariance matrix estimate with small sample size. Therefore, this study uses multilinear principal component analysis (MPCA in short) developed by Hung, H. et al. (2012) to extract important locations with larger variations which can better explained the variabilities. Later the original data is transformed into fewer variables for further investigations. Compared with the conventional PCA, the MPCA seems to be able to retain the data structure better and a better explained proportion of total variance. After extracting important variables for classification, logistic regression model and $k$-nearest neighbors algorithm as used to investigate the accuracy of the classification results.
目次 Table of Contents
誌謝 i

摘要 ii


Abstract iii


1 前言 1

2 資料描述 1
2.1 資料蒐集方式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.2 資料處理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2.1 旋轉 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2.2 資料截取 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.3 灰階值校正 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 心臟病介紹 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3.1 川崎氏症 (KD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.2 心室中騙缺損 (VSD) . . . . . . . . . . . . . . . . . . . . . . . . . . 7


3 研究方法 8
3.1 多線性主成分分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.1.1 統計模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.2 因素轉軸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3 邏輯斯迴歸模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.1 邏輯斯迴歸模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.2 ROC曲線 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.4 KNN 演算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.5 評斷與驗證 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

4 研究結呆 13
4.1 使用多線性主成分分析起音波影像資料 . . . . . . . . . . . . . . . . . . . . . 13

4.2 BT06 Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4.2.1 BT06 Logistic Regression . . . . . . . . . . . . . . . . . . . . . . . 14

4.2.2 BT06 KNN Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . 18

4.3 IE33 Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.3.1 IE33 Logistic Regression . . . . . . . . . . . . . . . . . . . . . . . . 22
4.3.2 IE33 KNN Algorithm(分兩類) . . . . . . . . . . . . . . . . . . . . . 25
4.3.3 IE33 KNN Algorithm(分四類) . . . . . . . . . . . . . . . . . . . . . 27


5 討論與結語 32

參考文獻 33

A 附錄 34

A.1 多線性主成分分析統計性質 . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
A.2 KNN 演算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
A.3 Wilks’ Lambda 統計量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
A.3.1 Wilks’ Lambda 準則檢定新增變數 . . . . . . . . . . . . . . . . . . . 37
A.4 因素轉軸 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
A.5 表附錄 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
參考文獻 References
[1] Fix, E. and Hodges, J. L. (1951). Discriminatory Analysis, Nonparametric Discrimination: Consistency Properties, Report No. 4, Project No. 21-49-004, Brooks Air Force Base, USAF School of Aviation Medicine.
[2] Han, E. H., Karypis, G. and Kumar, V. (2001). Text categorization using weight adjusted k-Nearest Neighbor classification. Pacific-Asia Conference on Knowledge Discovery and Data Mining, pp. 53-65.
[3] Hanley, J. A. and McNeil, B. J. (1982). The meaning and use of the area under a receiver operating characteristic (ROC) Curve. Radiology, 143, pp. 29-36.
[4] Hosmer, D. W. and Lemeshow, S. (2000). Applied Logistic Regression, 2nd ed. John Wiley, Inc.
[5] Hung, H., Wu, P., Tu, I. and Huang, S. (2012). On Multilinear Principal Component Analysis of Order-Two Tensors. Biometrika, 99, pp. 569-583.
[6] Kaiser, H. F. (1958). The varimax criterion for analytic rotation in factor analysis. Psychometrika, 23, pp. 187-200.
[7] Loftsgaarden, D. O., and Quesenberry, C. P. (1965). A Nonparametric Estimate of a Multivariate Density Function, Annals of Mathematical Statistics, 36, pp. 1049-1051.
[8] Ye, J. (2005). Generalized low rank approximations of matrices. Machine Learning, 61, pp. 167-191.
[9] Rencher, A. C. (2002). Methods of Multivariate Analysis, 2nd ed. John Wiley, New York.
[10] 林恆旭,王宗道(2010)。如何診斷正常收縮功能之心臟衰竭:超音波及核磁共振所扮演的角色,中華民國心臟協會–會訊6月號。
[11] 陳柏嵂(2012)。影響點對分類精確度之效應研究-左心室心臟超音波之應用,國立中山大學應用數學系碩士論文。
[12] 高莉玟(2011)。左心室心臟超音波研究-距離指標邏輯斯與正規化之區別分析比較,國立中山大學應用數學系碩士論文。
[13] 陳潔敏(2011)。左心室心臟超音波研究-區別分析,國立中山大學應用數學系碩士論文。
[14] 楊小瑩(2012)。主成分分析與稀疏主成分分析分析分類效果之比較應用於左心室心臟超音波之研究,國立中山大學應用數學系碩士論文。
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:自定論文開放時間 user define
開放時間 Available:
校內 Campus:永不公開 not available
校外 Off-campus:永不公開 not available

您的 IP(校外) 位址是 3.21.76.0
論文開放下載的時間是 校外不公開

Your IP address is 3.21.76.0
This thesis will be available to you on Indicate off-campus access is not available.

紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 永不公開 not available

QR Code