Responsive image
博碩士論文 etd-0801102-182218 詳細資訊
Title page for etd-0801102-182218
論文名稱
Title
利用資料探勘技術發掘議題網絡
Discovering Issue Networks Using Data Mining Techniques
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
94
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2002-07-26
繳交日期
Date of Submission
2002-08-01
關鍵字
Keywords
議題網絡、資訊擷取、資料探勘、鏈結分析、群集分析
link analysis, data mining, information retrieval, clustering analysis, issue networks
統計
Statistics
本論文已被瀏覽 5645 次,被下載 3722
The thesis/dissertation has been browsed 5645 times, has been downloaded 3722 times.
中文摘要
近年來資料探勘技術在購物行為分析、客戶關係管理、犯罪調查等方面的應用頗為盛行;然而在與我們日常相關的政治、社會領域的運用,仍然侷限於取樣資料的分析,用以彌補統計工具的不足而已。在本研究中,我們針對政治或公共政策議題,採用議題網絡為描述架構,資料探勘為核心技術;藉由雛型系統的執行,配合個案資料的擷取,發展出以議題為中心的資訊建構和知識發掘方法。
我們的研究重點包含議題網絡資訊建構、參與者群集發掘及網絡關鍵元件發掘三大部分。議題網絡的資訊建構,先以資訊擷取技術將個案議題有關的電子報報導,轉換為結構化的網絡元件;再以圖形和表格方式,由不同角度呈現網絡資訊。在參與者群集發掘部分,我們採用以議題為關聯基礎的參與者群集分析方法。這和傳統依據參與者的行政隸屬或黨派背景,所作的群集判斷有所不同。能夠更就事論事的提供觀察者,有關參與者群集關係和群集變化的資訊。第三個部分是以鏈結分析,依據網絡參與者和子議題間的交互關係及重要性,來判斷參與者和子議題的關鍵程度。
最後我們以專家評估的方式,藉由熟悉個案議題的議員、記者和議會員工,對上述第一個部分進行概念回憶度和概念精確度的效能評估,對第二、第三部分進行確實性、有用性和創新度的效能評估,並與各組評估者的相似度作了比較分析。

Abstract
By means of data mining techniques development these days, the knowledge discovered by virtue of data mining has ranging from business application to fraud detection. However, too often, we see only the profit-making justification for investing in data mining while losing sight of the fact that they can help resolve issues of global or national importance. In this research, we propose the architecture for issue oriented information construction and knowledge discovery that related to political or public policy issues. In this architecture, we adopt issue networks as the description model and data mining as the core technique. This study is also performed and verified with prototype system constructing and case data analyzing.
There are three main topics in our research. The issue networks information construction starts with text files information retrieving of specified issue from news reports. Keywords retrieved from news reports are converted into structuralized network nodes and presented in the form of issue networks. The second topic is the clustering of network actors. We adopt an issue-association clustering method to provide views of clustering of issue participators based on relations of issues. In third topic, we use specified link analysis method to compute the importance of actors and sub-issues.
Our study concludes with performance evaluation via domain experts. We conduct recall, precision evaluation for first topic above and certainty, novelty, utility evaluation for others.

目次 Table of Contents
內容目錄
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 2
1.3 研究流程 3
1.4 論文架構 4
第二章 文獻探討 5
2.1 公共政策的政治影響模式 5
2.1.1團體理論 5
2.1.2鐵三角模式 6
2.1.3議題網絡 7
2.2 資料探勘 8
2.3 關鍵字擷取 9
2.4 關聯分析 11
2.5 群集分析 12
2.6 鏈結分析 13
第三章 研究方法與研究架構 15
3.1 研究方法 15
3.2 研究單元與研究範圍 15
3.2.1 研究單元與關鍵屬性 15
3.2.2 研究範圍 17
3.3 研究架構 17
第四章 議題網絡資訊建構與展現 19
4.1個案選擇與網絡元件定義 19
4.2議題網絡資訊建構 19
4.2.1 議題網絡資訊建構流程 19
4.2.2 語意建構 22
4.3議題網絡資訊展現 24
第五章 參與者群集發掘 27
5.1資料探勘技術選擇 27
5.1.1 資料特性 27
5.1.2 資料探勘技術選擇 28
5.2以子議題關聯為基礎的參與者群集分析 29
5.2.1 子議題關聯分析 29
5.2.1.1 資料項選擇 29
5.2.1.2 參數選擇 30
5.2.1.3 結果初估 30
5.2.2 參與者群集分析 31
第六章 網絡關鍵元件發掘 36
6.1 資料探勘技術選擇 36
6.1.1 問題分析 36
6.1.2 資料探勘技術選擇 37
6.2 關鍵參與者及關鍵子議題發掘 40
6.2.1演算法比較 41
6.2.2關鍵參與者擷取 42
6.3關鍵子議題發掘與網絡的演進分析 43
第七章 議題網絡資訊效能評估 45
7.1評估方法設計 45
7.1.1評估依據 45
7.1.2網絡建構效能的評估項目與方法 46
7.1.3網絡發掘效能的評估項目與方法 48
7.2網絡建構評估結果與分析 50
7.3參與者群集發掘評估結果與分析 52
7.4關鍵元件發掘評估結果與分析 54
7.4.1關鍵參與者選取評估與分析 54
7.4.2關鍵子議題選取評估與分析 56
第八章 結論與建議 59
8.1研究結果討論 59
8.2研究貢獻 60
8.3未來研究方向 61
參考文獻 63
中文部分 63
英文部分 63
附錄A、議題網絡資料探勘系統介面舉例 67
附錄B、評估者代號及背景 72
附錄C、效能評估表 73



圖目錄
圖1.1 本研究流程 4
圖3.1 研究架構 18
圖4.1議題網絡資訊建構流程 21
圖4.2關鍵字資料庫 22
圖4.3語意元件資料庫 22
圖4.4樣板式網絡元件選取平台 23
圖4.5議題網絡展現表-以子議題為觀察角度 25
圖4.6議題網絡展現表-以參與者為觀察角度 26
圖5.1以關聯規則為基礎的群集分析流程 28
圖5.2以子議題及態度所組合的資料項 29
圖5.3 第一階段,分割數為六時系統的產出範例 30
圖5.4參與者對各分割的匹配分數(第一階段,六分割) 31
圖5.5 參與者對子議題及態度的組合查詢 32
圖5.6 吳敦義所涉及的子議題及態度 33
圖5.7各階段參與者分群結果及三個重要參與者的群集變化 34
圖6.1參與者被報導總次數排名 38
圖6.2 hubs值與執行次數比較 39
圖6.3參與者hub值排名 40
圖7.1議題事實、報導、和系統輸出之關係圖 46
圖7.2效能評估時的資訊路徑 46
圖7.3網絡發掘能力的效能評估項目 49

表目錄
表4.1網絡元件及屬性定義表 20
表6.1 不同加權演算法的相似度比較 42
表6.2港市合一議題各階段關鍵參與者彙整表 42
表6.3港市合一議題各階段關鍵子議題彙整表 43
表6.4港市合一議題演進輪廓 44
表7.1 網絡建構評估結果 51
表7.2 議會員工間概念擷取項目相似度(﹪) 52
表7.3 群集發掘評估結果 53
表7.4 議會員工間群集分析相似度(﹪) 53
表7.5 關鍵參與者選取評估結果 54
表7.6 議會員工間關鍵參與者選取相似度(﹪) 55
表7.7記者間關鍵參與者選取相似度(﹪) 55
表7.8議員間關鍵參與者選取相似度(﹪) 56
表7.9關鍵子議題發掘評估結果 56
表7.10議員間關鍵子議題選取相似度(﹪) 57
表7.11記者間關鍵子議題選取相似度(﹪) 57
表7.12 議會員工間關鍵子議題選取相似度(﹪) 58
參考文獻 References
參考文獻
中文部分
王鐵生譯,Wilson, G. K. 著, 1998,利益團體,五南圖書出版公司。
李麟添,1980,立法角色之研究-桃園縣議會第八屆縣議員角色傾向之分析,臺灣商務印書館。
倪達仁譯,Austin, R. 著,1995政治學 雙葉出版社。
姚祥瑞,2000,台灣地區水庫興建政策與環保團體互動之研究-以美濃水庫為個案分析,文化大學政治學研究所博士論文。
黃榮護,1991,公共管理,商鼎文化出版社。
陳俊彰,2001,從網頁中發掘教師知識分佈圖,中山大學資訊管理研究所碩士論文。
張勳騰,1999,資料探採在通信資料庫上目標行銷的應用,中山大學資訊管理研究所碩士論文。
薛智名,2001,虛擬實踐社群之知識圖發掘,中山大學資訊管理研究所碩士論文。
劉昶演,1997,民意代表的角色傾向-以第三屆立法委員為例,中山大學政治學研究所碩士論文。
魏鏞,朱志宏,詹中原,黃德福,1992,公共政策,國立空中大學印行。

英文部分
Abramowicz, W., and Zurada, J. “Knowledge Discovery for Business Information System,” Kluwer Academic Publishers, 2001
Adriaans, P., and Zantinge, D. “DATA MINING,” ADDISON-WESLEY, 1999.
Bently, A.F. “The Process of Government,” Chicago: University of Chicago Press, 1908
Berkowitz, S.D.“An interoduction to structural analysis: The network approach to social research,” Toronto: Butterworth, 1982
Berry, M.J.A., and Linoff, L. “Data Mining Techniques: For Marketing, Sales, and Customer Support,” John Wiley & Sons, Inc, 1997
Bhandari, I. “Can Data Mining Help in Resolving Political Issue,” The On-Line Executive Journal for Data-Intensive Decision Support, September 1, 1998: Vol. 2, No. 351998
Bots, P.W.G., VanTwist, M.J.W., and VanDuin, R. “Designing a Power Tool for Policy Analysts: Dynamic Actor Network Analysis,” Proceedings of the 32nd Hawaii International Conference on System Sciences ,1999Chen, H. and Lynch, K.J. “Automatic Construction of Networks of Concepts Characterizing Document Databases,” IEEE TRANSACTIONS ON SYSTEM, MAN, AND CYBERNETICS, VOL. 22, NO. 5, SEP/OCT 1992
Chien, L.F. “PAT-Tree-Based Keyword Extraction for Chinese Information Retrieval,” Proceedings of the 1997 ACM SIGIR, Philadelphia, PA, USA, pp.50-58.
Choe, C.S. “Public Policy Making and Interest Groups Politics in the U.S: An Analysis of IRCA,” International Area Review, 2001, Vol. 4(1)
Eick, S.G. “Visual Discovery and Analysis,” IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, VOL. 6, NO. 1, JANUARY-MARCH 2000.
Frawley, W., Piatetsky, S. G.., and Matheus, C. “Knowledge Discovery in Databases: An Overview,” AI Magazine, Fall 1992, pp 213-228.
Han, E.H., Karypis, G., Kumar, V. and Mobasher, B. “Clustering Based On Association Rule Hypergraphs,” In Proc. of Workshop on Research Issues on Data Mining and Knowledge Discovery, 1997.
Han, J. and Kamber, M. “Data Mining : Concepts and Techniques,” Morgan Kaufmann Publishers, 2001
Heaney, M. T. “Issue Networks, Information, and Interest-Group Alliances,” University of Chicago, April 30,2001
Heclo, H. “Issue Networks and the Executive Establishment,” American Enterprise Institute, 1978
Henzinger, M.R. “Hyperlink Analysis for the Web,” IEEE INTERNET COMPUTING , 1089-7801, 2001
Heywood, A. “Politics,” Palgrave, Formerly Macmillan Press, 1997
Horowitz, E., Sahni, S. and Anderson, F.S.,“Fundamentals of Data Structures in C,” New York, 1993
Kleinberg, J.M. “Authoritative Sources in a Hyperlinked Environment,” ACM, Vol. 46, No. 5, September 1999, pp. 604 –632 , 1999
Lempel, R. and Soffer, A. “PicASHOW: Pictorial Authority Search by Hyperlinks on the Web,” ACM 1-58113-348-0/01/0005 , 2001
Mills, C.W. “The Power Elite,” Oxford University Press,Inc., 1956
Salisbury, R.H., Heinz, J. P., Nelson, R. L. and Lauman, E. O. “Triangles, Networks, and Hollow Cores: The Complex Geometry of Washington Interest Representation,” In M. P. Petracca(Ed., 1992.
Salton, G. and Buckley, C., “Term-Weighting Approaches in Automatic Text Retrieval,” Information Processing & Management. 24, No. 5, 1998.
Simoudis, E. “Reality Check for Data Mining,” IEEE EXPER Vol.11.No.5, OCTOBER 1996, pp26-33
Smith, H. “The Power Game: How Washington Works,” Ballantine Books. 1988
Witten, I.H. and Frank, E. “Data Mining – Practical Machine Learning Tools and Techniques with JAVA Implementations,” Morgan Kaufmann Publishers, 2000
Wllsworth, J.W. and Stahnke, A. A. “Politics and Political Systems,” McGraw-Hill, 1976
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:校內校外完全公開 unrestricted
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available


紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code