輔仁大學
學術資源網

記錄編號3316
狀態NC088FJU00392001
助教查核
索書號
學校名稱輔仁大學
系所名稱資訊工程學系
舊系所名稱
學號487516084
研究生(中)文炫傑
研究生(英)
論文名稱(中)利用因素分析法建構中間資料階層
論文名稱(英)Constructing Intermediate Concepts by Factor Analysis
其他題名
指導教授(中)黃貞瑛 教授
指導教授(英)
校內全文開放日期
校外全文開放日期
全文不開放理由
電子全文送交國圖.
國圖全文開放日期.
檔案說明
電子全文
學位類別碩士
畢業學年度88
出版年
語文別中文
關鍵字(中)因素分析 分類 轉軸 離散化 著色
關鍵字(英)factor analysis classification rotation discretization coloring
摘要(中)現今電腦的快速發展,已使得資料處理方面的步驟更加的快速,而其主要的運用之一,是有助於我們在眾多繁雜的資料中,能於最短時間內獲得重要且有用的資訊,資料探勘(data mining)的目的便是設法找出隱含於資料庫中的有用資訊。而分類(classification)則是資料探勘的主題之一,其目的是在給定的資料群中加以分析分類,以提供給往後作為分類預測一個重要的依據。但在作資料的分類之時,往往會受限於我們需要一個龐大的的資料庫,才能使得出的資料及訊息具有意義且具有說服力。然欲從資料中獲得有用的資訊時,有時又囿於資料庫過於龐大,實際操作起來必有其困難性。面對此情形,如何將龐大的資料庫以合理的方式將其縮小,或是過濾一些無用的“垃圾”。於是我們考慮經由「分解」的方法以簡化問題。有鑑於此,本研究希望利用因素分析法,過濾一些資料並且尋找出資料之間的相依性,以便於處理龐大資料庫時,能夠節省時間及空間,並且得出一個可令人滿意的答案。在統計學的領域中,因素分析法適用於將屬性變數適當的歸於不同因素之中,因此原屬性變數與分類結果間,又可產生介於期間之資料階層-因素。因此產生有意義的中間結果,衍生出資料階層由較低之屬性變數,繼而因素而最高層之資料階層為分類結果。因此原資料庫之資料分類若以函數y=F(X)描述之,其中X=(x1,…,xn)為屬性變數;則利用因素分析法,可將其分解為: y=G(F1(Z1),F2(Z2),……..Fk(Zk)) 其中F,....Fk為因素分析法所得之因素,而Z1∪Z2∪.....Zk=X,且任一i,j,1≦i,j≦K,Zi∩Zj中=ψ。 以上描述之方法,即為本文之主題,利用因素分析之技巧於函數分解法(Function Decomposition)中,其目的不僅於建構中間資料階層概念,並由其對應之分解函數,找出此原函數更為精簡之描述法,以期有效率的預測分類結果。 我們將我們的方法實作出來,並和利用ID3演算法為主軸,而實作出的程式SEE5[9],比較所得出的結果,並加以探討變異數間的相互關連性大小。經由本研究的結果發現到應用因素分析法,在瞭解資料庫上卻有其效益。
摘要(英)To describe patterns or rules, one of the simplest approaches is a function expression. When dealing with a complex problem in data mining, the approach of function decomposition can be used to simplify the complex problem. In this thesis a function decomposition based on factor analysis in statistic is introduced. For a given set of training examples, this approach is used to construct what we called factors, they are intermediate concepts between the target variable and attribute variables. Besides this approach is as other classification learning schemes, it takes a set of classified examples from which it is expected to learn a way of classifying other examples. The approach is implemented and tested in this work. Since experiments are given and are compared with SEE5.
論文目次摘要………………………………………………………………………I 目錄………………………………………………………..……………IV 目錄(圖)……….…………………………………………..……………..V 目錄(表)………….………………………………………..……………VI 1. 緒論………….………………………………………..………………1 2. 相關資料………….………………….………………..……………...4 3. 因素分析……….………….………………………………………...14 4. 演算法……………………………………………………………….24 5. 實驗結果…………………………………………………………….33 6. 結論………………………………………………………………….50 參考文獻………………………………………………………………..52 附錄……………………………………………………………………..54
參考文獻[1]. Kaiser,H. F. The varimax criterion for analytic rotation in factor analysis, Psychometrika-VOL. 23,no. 3, September,1958。 [2]. Luba,T.: 1995,Decomposition of multi-valued functions,25th Intl. Symposium on Mutiple-Valued Logic,Bloomigton, Indiana,pp. 256-261。 [3]. Richard A. Johnson,Dean W. Wichern, Applied Multivariate Statistic Analysis, fourth edition。 [4]. Usama M. Fayyad,Keki b. Irani. : 1992,A technical note of Artificial Intelligence Laboratory,Electrical Engineering And Computer Science Department,the University of Michigan,Ann Arbor,MI 48109-2110。 [5]. Usama M. Fayyad,Keki b. Irani. : 1993,Multi-interval discretization of continuous-valued attributes for classification learning, Proceedings of 13th Int. Conference on Artificial Intelligence。 [6]. Zupan, B. Demsar, J.,Bohanec,M. and Bratko, I.: 1997, Machine learning by function decomposition,proc. 14th international conference on Machine Learning。 [7]. Zupan, B. Demsar,J.,Bohanec,M. and Bratko,I.: 1997 Constructing intermediate concepts by decomposition of real functions,Proc. European Conference on Machine Learning,ECML-97,Prague。 [8]. 黃俊英,多變量分析,第七版。 [9]. http://www.rulequest.com
論文頁數62
附註
全文點閱次數
資料建置時間
轉檔日期
全文檔存取記錄
異動記錄M admin Y2008.M7.D3 23:17 61.59.161.35