Responsive image
博碩士論文 etd-0602116-204811 詳細資訊
Title page for etd-0602116-204811
論文名稱
Title
大數據下的糖尿病醫療管理—以D診所為例
The Big Data of Diabetes Healthcare Management - A Case of D Clinic
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
70
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2016-06-29
繳交日期
Date of Submission
2016-07-02
關鍵字
Keywords
大數據、機器學習、預測模型、邏輯式回歸、XGBoost、糖尿病、糖尿病管理
Logistic Regression, XGBoost, Predicting Model, Diabetes, Diabetes Management, Machine Learning, Big Data
統計
Statistics
本論文已被瀏覽 5778 次,被下載 3103
The thesis/dissertation has been browsed 5778 times, has been downloaded 3103 times.
中文摘要
無論全球或是台灣地區,糖尿病病患的人數呈現有增無減的現象,不僅對個人的健康造成傷害,更對整體社會造成嚴重的成本。因此本研究欲藉由高雄地區三間地方診所整年度病患的就診資料,用以建立糖尿病預測模型進而取得病患罹患糖尿病的機率。最後設定不同的臨界點與搭配醫療成本的懲罰矩陣,能透過選擇性地介入治療,以達到極小化診所醫療成本的目的。

 研究顯示機器學習的新技術XGBoost用於資料欄位龐大之資料,能使預測模型能得到更佳的辨識率。此外,模型所預測的結果確實能夠協助醫療診所進行選擇性介入病患治療,進而有效使醫療成本的花費降低。

關鍵詞:大數據、機器學習、預測模型、邏輯式回歸、XGBoost糖尿病、糖尿病管理
Abstract
Whether in the globe or in Taiwan, the number of diabetes patients is being on the rise. Diabetes not only does harm to individuals but causes lots of heavy costs to the entire Taiwan society. Given this, the research tries to use patients’ annual diagnosis records from three Kaohsiung local clinics to build a diabetes predicting model. By doing so, the predicting model can produce probabilities of getting diabetes of every patient. Eventually, through different cut-off points and a penalty matrix made of cost of health care, the research tries to selectively provide health treatments to certain patients, and then get the minimum cost of health care.

  The results demonstrate that the new machine learning technique XGBoost can function well especially when the data frame is extremely large, and get better AUC. Besides, the probabilities the predicting model makes, in fact, can really help the clinics selectively offer treatments to patients, and attain the goal of effectively reducing the cost of health care.

Keywords: Big Data, Machine Learning, Logistic Regression, XGBoost, Predicting Model, Diabetes, Diabetes Management
目次 Table of Contents
摘要...................................................................I
ABSTRACT........................................................II
目錄..................................................................III
圖次...................................................................V
表次..................................................................VI
第一章 緒論...................................................1
第一節 研究背景與動機......................................1
第二節 研究目的................................................4
第三節 研究流程................................................5
第二章 文獻探討.............................................6
第一節 大數據...................................................6
一、 大數據的興起.............................................6
二、 大數據的定義.............................................6
三、 大數據4Vs特性..........................................8
四、 大數據應用之文獻探討................................9
第二節 大數據與管理.........................................12
一、 傳統管理...................................................12
二、 大數據對企業的影響...................................15
三、 大數據與醫療管理......................................18
第三節 糖尿病與糖尿病預測相關文獻...................21
一、 糖尿病的定義.............................................21
二、 糖尿病的主要類型.......................................21
三、 糖尿病臨床診斷..........................................22
四、 糖尿病的高風險群.......................................22
五、 糖尿病的併發症..........................................23
六、 ICD9診斷碼................................................24
七、 糖尿病相關管理文獻....................................24
第三章 研究方法..............................................28
第一節 研究流程.................................................28
第二節 研究方法.................................................30
一、 分析技術說明..............................................31
二、 分析使用名詞介紹.......................................32
第四章 分析與討論...........................................35
第一節 分析資料說明...........................................35
一、 資料來源.....................................................35
二、 資料前置處理..............................................35
三、 最終資料呈現...............................................35
第二節 預測模型優劣之評估方式............................41
第四節 模型分析結果............................................42
一、 邏輯式回歸之分析結果..................................42
二、 XGBoost之分析結果.....................................43
三、 選擇最佳臨界點以極小化醫療成本..................51
第五章 結論與建議............................................56
第一節 研究結論..................................................56
第二節 研究貢獻................................................,,57
第三節 研究限制................................................,,57
第四節 研究延伸..................................................58
參考文獻...............................................................59
參考文獻 References
參考文獻
一、中文部分
江守寰. (2016). 以大數據探勘技術分析 [視覺化管理] 在監視錄影系統之運用-臺中市政府警察局為例. 犯罪學期刊, 18(2), 1-29.
呂宗學, & 蘇慧貞. (2013). 海量資料分析在醫療照護領域的應用. 臺灣醫學, 17(6), 652-661.
李博智. (2002). 資料探勘在慢性病預測模式之建構. 元智大學資訊管理學系學位論文, 1-50.
李秀琴. (2002). 應用人工智慧技術於人類慢性疾病管理. 彰化: 彰化師範大學資訊管理學系.
李語嫣. (2010). 運用資料探勘技術由健康檢查與生活習慣資料建立疾病預測模型-以糖尿病為例. 成功大學醫學資訊研究所學位論文, 1-85.
李永裕. (2014). 應用於分析信用評估巨量資料的決策樹分類法. 臺灣大學資訊管理學研究所學位論文, 1-84.
李欣怡. (2015). 一次搞懂大樹據(上) 數位時代
林采薇. (2015). 薪資管理之大數據分析模式與實證研究. 清華大學工業工程與工程管理學系學位論文, 1-52.
林東陽. (2016). 大數據與台灣電商物流. 中原大學企業管理研究所學位論文, 1-51.
吳瑞堯, & 周駿賢. (2011). 運用資料探勘技術於六大死因慢性疾病之研究. 資訊管理學報, 18(1), 187-211.
許書銘, & 李卓勳. (2015). 大數據處理與使用行為分析之應用-電視節目推薦系統.電工通訊季刊, 62-73.
陳國青. (2014). 大數據的管理喻意. iManagement貳月號
陳威宏. (2015). 用運大數據處理APT攻擊之研究. 中國文化大學資訊安全產業碩士專班
陳孟萱. (2015). 應用機器學習方法於作物種植條件之研究. 成功大學會計學系學位論文, 1-51.
陳譽晏. (2015). 運用 R Shiny 建立文字探勘平台之語意分析及輿情分析. Journal of Data Analysis, 10(6), 51-78.
陳傑豪. (2015). 執行長必須改變的九件事. 哈佛商業評論
張利華. (2014). 大數據帶來企業管理的颠覆性革命
張俊郎, & 張鈺芳. (2006). 運用資料探勘於糖尿病高危險族群早期療育之研究. 中華民國品質學會第42屆年會暨第12屆全國品質管理研討會
黃盈智. (2013). 巨量資料分析運用於顧客關係管理之研究. 國立政治大學企業管理研究所學位論文
黃琦芮. (2015). 大數據價值創新之個案研究—以阿里巴巴集團為例. 國立台灣科技大學財務金融研究所學位論文
黃巧頻. (2015). 應用資料探勘技術於顧客價值與消費行為之研究─ 以某直銷公司為例. 朝陽科技大學企業管理系學位論文, 1-102.
趙麗慧. (2014). 大數據運用與企業競爭力之探索性研究. 臺灣大學國際企業管理組學位論文, 1-103.
廖介銘. (2003). 決策樹應用於糖尿病之探勘. 華梵大學資訊管理學系碩士班, 碩士論文.
廖子逸. (2015). 影響行動通訊客戶流失因素之討論-以台灣電信業者為例. 國立交通大學經營管理研究所碩士班學位論文
薛人豪. (2015). 基於大數據的高速公路即時路況壅塞預測. 中央大學資訊工程學系學位論文, 1-119.
鍾智林. (2015). 公共自行車系統營運特性大數據分析. 第二十三屆海峽兩岸都市交通學術研討會論文集
謝明瑞. (2015). 大數據分析—以科P現象為例. 財團法人國家政策基金會
中山大學企業管理學系. (2014). 管理學—整合關膽與創新思維
哈佛教你精通大數據. (2014). 遠見天下文化出版股份有限公司《哈佛商業評論》全球繁體中文版
湯瑪斯‧戴文波特. (2014). 大數據@工作力:如何運用巨量資料,打造個人與企業競爭優勢
全民健康保險雙月刊第92期. (2011)
全球糖尿病報告. (2016). 世界衛生組織
ICD-9-CM疾病碼一覽表. (2001). 衛生福利部健康保險署

二、英文部分
Beyer, M. A., & Laney, D. (2012). The importance of ‘big data’: a
definition.Stamford, CT: Gartner, 2014-2018.
Batty, M. (2013). Big data, smart cities and city planning. Dialogues in Human
Geography, 3(3), 274-279.
Douglas, L. (2001). 3d data management: Controlling data volume, velocity and
variety. Gartner. Retrieved, 6.
Hoerger, T. J., Harris, R., Hicks, K. A., Donahue, K., Sorensen, S., & Engelgau, M.
(2004). The cost-effectiveness of screening for type 2 diabetes.Annals of Internal
Medicine, 140, 689-699.
Kleinbaum, D. G., & Klein, M. (2010). Logistic regression: a self-learning text.
Springer Science & Business Media.
Kayyali, B., Knott, D., & Van Kuiken, S. (2013). The big-data revolution in US
health care: Accelerating value and innovation. Mc Kinsey & Company, 1-13.
Laney, D. (2012). The importance of'Big Data': A definition. Gartner. Retrieved,21.
Lohr, S. (2012). The age of big data. New York Times, 11.
Manovich, L. (2011). Trending: The promises and the challenges of big social
data. Debates in the digital humanities, 2, 460-475.
Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Byers, A.
H. (2011). Big data: The next frontier for innovation, competition, and
productivity.
Mayer-Schönberger, V., & Cukier, K. (2013). Big data: A revolution that will
transform how we live, work, and think. Houghton Mifflin Harcourt.
Rokach, L., & Maimon, O. (2008). Introduction to Decision Trees. Data Mining with
Decision Trees: theory and application, 5.
Tuomilehto, J., Lindström, J., Eriksson, J. G., Valle, T. T.,
Hämäläinen, H., Ilanne-Parikka, P., ... & Salminen, V. (2001). Prevention of type 2
diabetes mellitus by changes in lifestyle among subjects with impaired glucose
tolerance. New England Journal of Medicine, 344(18), 1343-1350.


三、網路部分
大數據. 維基百科 https://goo.gl/burVnq
大數據納入新政府發展方針,成智慧醫療、創新應用基礎. 科技新報
http://goo.gl/rs7FPb
大數據+醫療讓智慧醫療惠及于民. 中國經濟時報 http://goo.gl/x1Ou5z
全民糖尿病觀測站 http://www.diabetes.org.tw/
衛生福利部中央健保險署 http://www.nhi.gov.tw/
糖尿病健康資訊網 http://www.jjmt.com.tw/diabetes/index.php
全球逾六成企業應用大數據做決策. 經濟日報 http://goo.gl/nMfMbw
巨量資料的時代,用「大、快、雜、疑」四字箴言帶你認識大數據
http://www.inside.com.tw/2015/02/06/big-data-1-origin-and-4vs
關於糖尿病,10個你一定要知道的事實.
http://www.storm.mg/article/100014
Gardient Boosting. 維基百科 https://goo.gl/QkfqdX
Big Data Is Changing the Way We Get Well
 http://mashable.com/2014/09/17/big-data-health-care/#Jxx.c0GTVsqQ
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外完全公開 unrestricted
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available


紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code