論文使用權限 Thesis access permission:校內校外完全公開 unrestricted
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available
論文名稱 Title |
利用資料探勘技術發掘議題網絡
Discovering Issue Networks Using Data Mining Techniques |
||
系所名稱 Department |
|||
畢業學年期 Year, semester |
語文別 Language |
||
學位類別 Degree |
頁數 Number of pages |
94 |
|
研究生 Author |
|||
指導教授 Advisor |
|||
召集委員 Convenor |
|||
口試委員 Advisory Committee |
|||
口試日期 Date of Exam |
2002-07-26 |
繳交日期 Date of Submission |
2002-08-01 |
關鍵字 Keywords |
議題網絡、資訊擷取、資料探勘、鏈結分析、群集分析 link analysis, data mining, information retrieval, clustering analysis, issue networks |
||
統計 Statistics |
本論文已被瀏覽 5645 次,被下載 3722 次 The thesis/dissertation has been browsed 5645 times, has been downloaded 3722 times. |
中文摘要 |
近年來資料探勘技術在購物行為分析、客戶關係管理、犯罪調查等方面的應用頗為盛行;然而在與我們日常相關的政治、社會領域的運用,仍然侷限於取樣資料的分析,用以彌補統計工具的不足而已。在本研究中,我們針對政治或公共政策議題,採用議題網絡為描述架構,資料探勘為核心技術;藉由雛型系統的執行,配合個案資料的擷取,發展出以議題為中心的資訊建構和知識發掘方法。 我們的研究重點包含議題網絡資訊建構、參與者群集發掘及網絡關鍵元件發掘三大部分。議題網絡的資訊建構,先以資訊擷取技術將個案議題有關的電子報報導,轉換為結構化的網絡元件;再以圖形和表格方式,由不同角度呈現網絡資訊。在參與者群集發掘部分,我們採用以議題為關聯基礎的參與者群集分析方法。這和傳統依據參與者的行政隸屬或黨派背景,所作的群集判斷有所不同。能夠更就事論事的提供觀察者,有關參與者群集關係和群集變化的資訊。第三個部分是以鏈結分析,依據網絡參與者和子議題間的交互關係及重要性,來判斷參與者和子議題的關鍵程度。 最後我們以專家評估的方式,藉由熟悉個案議題的議員、記者和議會員工,對上述第一個部分進行概念回憶度和概念精確度的效能評估,對第二、第三部分進行確實性、有用性和創新度的效能評估,並與各組評估者的相似度作了比較分析。 |
Abstract |
By means of data mining techniques development these days, the knowledge discovered by virtue of data mining has ranging from business application to fraud detection. However, too often, we see only the profit-making justification for investing in data mining while losing sight of the fact that they can help resolve issues of global or national importance. In this research, we propose the architecture for issue oriented information construction and knowledge discovery that related to political or public policy issues. In this architecture, we adopt issue networks as the description model and data mining as the core technique. This study is also performed and verified with prototype system constructing and case data analyzing. There are three main topics in our research. The issue networks information construction starts with text files information retrieving of specified issue from news reports. Keywords retrieved from news reports are converted into structuralized network nodes and presented in the form of issue networks. The second topic is the clustering of network actors. We adopt an issue-association clustering method to provide views of clustering of issue participators based on relations of issues. In third topic, we use specified link analysis method to compute the importance of actors and sub-issues. Our study concludes with performance evaluation via domain experts. We conduct recall, precision evaluation for first topic above and certainty, novelty, utility evaluation for others. |
目次 Table of Contents |
內容目錄 第一章 緒論 1 1.1 研究背景與動機 1 1.2 研究目的 2 1.3 研究流程 3 1.4 論文架構 4 第二章 文獻探討 5 2.1 公共政策的政治影響模式 5 2.1.1團體理論 5 2.1.2鐵三角模式 6 2.1.3議題網絡 7 2.2 資料探勘 8 2.3 關鍵字擷取 9 2.4 關聯分析 11 2.5 群集分析 12 2.6 鏈結分析 13 第三章 研究方法與研究架構 15 3.1 研究方法 15 3.2 研究單元與研究範圍 15 3.2.1 研究單元與關鍵屬性 15 3.2.2 研究範圍 17 3.3 研究架構 17 第四章 議題網絡資訊建構與展現 19 4.1個案選擇與網絡元件定義 19 4.2議題網絡資訊建構 19 4.2.1 議題網絡資訊建構流程 19 4.2.2 語意建構 22 4.3議題網絡資訊展現 24 第五章 參與者群集發掘 27 5.1資料探勘技術選擇 27 5.1.1 資料特性 27 5.1.2 資料探勘技術選擇 28 5.2以子議題關聯為基礎的參與者群集分析 29 5.2.1 子議題關聯分析 29 5.2.1.1 資料項選擇 29 5.2.1.2 參數選擇 30 5.2.1.3 結果初估 30 5.2.2 參與者群集分析 31 第六章 網絡關鍵元件發掘 36 6.1 資料探勘技術選擇 36 6.1.1 問題分析 36 6.1.2 資料探勘技術選擇 37 6.2 關鍵參與者及關鍵子議題發掘 40 6.2.1演算法比較 41 6.2.2關鍵參與者擷取 42 6.3關鍵子議題發掘與網絡的演進分析 43 第七章 議題網絡資訊效能評估 45 7.1評估方法設計 45 7.1.1評估依據 45 7.1.2網絡建構效能的評估項目與方法 46 7.1.3網絡發掘效能的評估項目與方法 48 7.2網絡建構評估結果與分析 50 7.3參與者群集發掘評估結果與分析 52 7.4關鍵元件發掘評估結果與分析 54 7.4.1關鍵參與者選取評估與分析 54 7.4.2關鍵子議題選取評估與分析 56 第八章 結論與建議 59 8.1研究結果討論 59 8.2研究貢獻 60 8.3未來研究方向 61 參考文獻 63 中文部分 63 英文部分 63 附錄A、議題網絡資料探勘系統介面舉例 67 附錄B、評估者代號及背景 72 附錄C、效能評估表 73 圖目錄 圖1.1 本研究流程 4 圖3.1 研究架構 18 圖4.1議題網絡資訊建構流程 21 圖4.2關鍵字資料庫 22 圖4.3語意元件資料庫 22 圖4.4樣板式網絡元件選取平台 23 圖4.5議題網絡展現表-以子議題為觀察角度 25 圖4.6議題網絡展現表-以參與者為觀察角度 26 圖5.1以關聯規則為基礎的群集分析流程 28 圖5.2以子議題及態度所組合的資料項 29 圖5.3 第一階段,分割數為六時系統的產出範例 30 圖5.4參與者對各分割的匹配分數(第一階段,六分割) 31 圖5.5 參與者對子議題及態度的組合查詢 32 圖5.6 吳敦義所涉及的子議題及態度 33 圖5.7各階段參與者分群結果及三個重要參與者的群集變化 34 圖6.1參與者被報導總次數排名 38 圖6.2 hubs值與執行次數比較 39 圖6.3參與者hub值排名 40 圖7.1議題事實、報導、和系統輸出之關係圖 46 圖7.2效能評估時的資訊路徑 46 圖7.3網絡發掘能力的效能評估項目 49 表目錄 表4.1網絡元件及屬性定義表 20 表6.1 不同加權演算法的相似度比較 42 表6.2港市合一議題各階段關鍵參與者彙整表 42 表6.3港市合一議題各階段關鍵子議題彙整表 43 表6.4港市合一議題演進輪廓 44 表7.1 網絡建構評估結果 51 表7.2 議會員工間概念擷取項目相似度(﹪) 52 表7.3 群集發掘評估結果 53 表7.4 議會員工間群集分析相似度(﹪) 53 表7.5 關鍵參與者選取評估結果 54 表7.6 議會員工間關鍵參與者選取相似度(﹪) 55 表7.7記者間關鍵參與者選取相似度(﹪) 55 表7.8議員間關鍵參與者選取相似度(﹪) 56 表7.9關鍵子議題發掘評估結果 56 表7.10議員間關鍵子議題選取相似度(﹪) 57 表7.11記者間關鍵子議題選取相似度(﹪) 57 表7.12 議會員工間關鍵子議題選取相似度(﹪) 58 |
參考文獻 References |
參考文獻 中文部分 王鐵生譯,Wilson, G. K. 著, 1998,利益團體,五南圖書出版公司。 李麟添,1980,立法角色之研究-桃園縣議會第八屆縣議員角色傾向之分析,臺灣商務印書館。 倪達仁譯,Austin, R. 著,1995政治學 雙葉出版社。 姚祥瑞,2000,台灣地區水庫興建政策與環保團體互動之研究-以美濃水庫為個案分析,文化大學政治學研究所博士論文。 黃榮護,1991,公共管理,商鼎文化出版社。 陳俊彰,2001,從網頁中發掘教師知識分佈圖,中山大學資訊管理研究所碩士論文。 張勳騰,1999,資料探採在通信資料庫上目標行銷的應用,中山大學資訊管理研究所碩士論文。 薛智名,2001,虛擬實踐社群之知識圖發掘,中山大學資訊管理研究所碩士論文。 劉昶演,1997,民意代表的角色傾向-以第三屆立法委員為例,中山大學政治學研究所碩士論文。 魏鏞,朱志宏,詹中原,黃德福,1992,公共政策,國立空中大學印行。 英文部分 Abramowicz, W., and Zurada, J. “Knowledge Discovery for Business Information System,” Kluwer Academic Publishers, 2001 Adriaans, P., and Zantinge, D. “DATA MINING,” ADDISON-WESLEY, 1999. Bently, A.F. “The Process of Government,” Chicago: University of Chicago Press, 1908 Berkowitz, S.D.“An interoduction to structural analysis: The network approach to social research,” Toronto: Butterworth, 1982 Berry, M.J.A., and Linoff, L. “Data Mining Techniques: For Marketing, Sales, and Customer Support,” John Wiley & Sons, Inc, 1997 Bhandari, I. “Can Data Mining Help in Resolving Political Issue,” The On-Line Executive Journal for Data-Intensive Decision Support, September 1, 1998: Vol. 2, No. 351998 Bots, P.W.G., VanTwist, M.J.W., and VanDuin, R. “Designing a Power Tool for Policy Analysts: Dynamic Actor Network Analysis,” Proceedings of the 32nd Hawaii International Conference on System Sciences ,1999Chen, H. and Lynch, K.J. “Automatic Construction of Networks of Concepts Characterizing Document Databases,” IEEE TRANSACTIONS ON SYSTEM, MAN, AND CYBERNETICS, VOL. 22, NO. 5, SEP/OCT 1992 Chien, L.F. “PAT-Tree-Based Keyword Extraction for Chinese Information Retrieval,” Proceedings of the 1997 ACM SIGIR, Philadelphia, PA, USA, pp.50-58. Choe, C.S. “Public Policy Making and Interest Groups Politics in the U.S: An Analysis of IRCA,” International Area Review, 2001, Vol. 4(1) Eick, S.G. “Visual Discovery and Analysis,” IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, VOL. 6, NO. 1, JANUARY-MARCH 2000. Frawley, W., Piatetsky, S. G.., and Matheus, C. “Knowledge Discovery in Databases: An Overview,” AI Magazine, Fall 1992, pp 213-228. Han, E.H., Karypis, G., Kumar, V. and Mobasher, B. “Clustering Based On Association Rule Hypergraphs,” In Proc. of Workshop on Research Issues on Data Mining and Knowledge Discovery, 1997. Han, J. and Kamber, M. “Data Mining : Concepts and Techniques,” Morgan Kaufmann Publishers, 2001 Heaney, M. T. “Issue Networks, Information, and Interest-Group Alliances,” University of Chicago, April 30,2001 Heclo, H. “Issue Networks and the Executive Establishment,” American Enterprise Institute, 1978 Henzinger, M.R. “Hyperlink Analysis for the Web,” IEEE INTERNET COMPUTING , 1089-7801, 2001 Heywood, A. “Politics,” Palgrave, Formerly Macmillan Press, 1997 Horowitz, E., Sahni, S. and Anderson, F.S.,“Fundamentals of Data Structures in C,” New York, 1993 Kleinberg, J.M. “Authoritative Sources in a Hyperlinked Environment,” ACM, Vol. 46, No. 5, September 1999, pp. 604 –632 , 1999 Lempel, R. and Soffer, A. “PicASHOW: Pictorial Authority Search by Hyperlinks on the Web,” ACM 1-58113-348-0/01/0005 , 2001 Mills, C.W. “The Power Elite,” Oxford University Press,Inc., 1956 Salisbury, R.H., Heinz, J. P., Nelson, R. L. and Lauman, E. O. “Triangles, Networks, and Hollow Cores: The Complex Geometry of Washington Interest Representation,” In M. P. Petracca(Ed., 1992. Salton, G. and Buckley, C., “Term-Weighting Approaches in Automatic Text Retrieval,” Information Processing & Management. 24, No. 5, 1998. Simoudis, E. “Reality Check for Data Mining,” IEEE EXPER Vol.11.No.5, OCTOBER 1996, pp26-33 Smith, H. “The Power Game: How Washington Works,” Ballantine Books. 1988 Witten, I.H. and Frank, E. “Data Mining – Practical Machine Learning Tools and Techniques with JAVA Implementations,” Morgan Kaufmann Publishers, 2000 Wllsworth, J.W. and Stahnke, A. A. “Politics and Political Systems,” McGraw-Hill, 1976 |
電子全文 Fulltext |
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。 論文使用權限 Thesis access permission:校內校外完全公開 unrestricted 開放時間 Available: 校內 Campus: 已公開 available 校外 Off-campus: 已公開 available |
紙本論文 Printed copies |
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。 開放時間 available 已公開 available |
QR Code |