記錄編號 | 5769 |
狀態 | NC093FJU00392038 |
助教查核 | |
索書號 | |
學校名稱 | 輔仁大學 |
系所名稱 | 資訊工程學系 |
舊系所名稱 | |
學號 | 492515095 |
研究生(中) | 古建華 |
研究生(英) | ku chien-hua |
論文名稱(中) | 資料探勘在天氣預測之研究與應用 |
論文名稱(英) | Data Mining in Weather Prediction |
其他題名 | |
指導教授(中) | 顏秀珍
徐嘉連 |
指導教授(英) |
|
校內全文開放日期 | 不公開 |
校外全文開放日期 | 不公開 |
全文不開放理由 | |
電子全文送交國圖. | 同意 |
國圖全文開放日期. | 2016.07.31 |
檔案說明 | 電子全文 |
電子全文 | 01 |
學位類別 | 碩士 |
畢業學年度 | 94 |
出版年 | |
語文別 | 中文 |
關鍵字(中) | 天氣預測、資料探勘、類神經網路、關聯法則 |
關鍵字(英) | Weather Prediction, Data Mining, Neural Network,Association Rule |
摘要(中) | 摘 要
隨著電腦日新月異的發展,以及資料庫觀念的逐漸成熟,資料儲存的媒介有由紙張轉變為電子資料型態的趨勢,資料電子化不但易於收藏更增加了管理的便利性,除此之外電腦快速運算的特性,可於短時間內處理大量的資料,使得各種資料處理分析的方法應運而生,譬如目前天氣預測已經從早期在紙上作業為主的方式,進步到運用電腦來進行各項天氣預測與分析,氣象研究人員可將經由各項觀測儀器蒐集之大量氣象數據儲存於資料庫中,然後使用適當的演算法在電腦上執行模擬與分析,進而迅速地推估與預測天氣變化的情況;但是目前在天氣預測,都是以分析資料為主個人經驗為輔,若預報人員經驗不足將導致天氣預測的偏差,因此如何適時補充一些較為易懂的規則協助預報人員,已是目前許多學者努力的研究目標。
氣象資料除了可以提供氣象研究人員進行天氣預測的模擬與分析外,同時還可運用一些資料探勘的技術對這些儲存在資料庫中的氣象資?再作進一步的分析;本研究便期望能運用這些資料探勘的技術,從眾多的氣象資料中找到對天氣預測上有用的資訊,提供天氣預測可用之預測規則。
首先,本研究蒐集85年到92年的氣象資料,經過整理後選其中85年到91年的氣象資料作為類神經網路、C5與C&RT等資料探勘演算法的訓練資料,再以92年的氣象資料來進行驗證與比對,同時以類神經網路演算法與我們的演算法找出重要欄位,並探討隨機選出以「雨」天氣現象配合「晴」天氣現象之比例為1:1、1:2及1:3的訓練資料量對其準確度的影響;最後本研究發現以原始資料去訓練與預測的正確率偏低,當以等比例、1:2及1:3與重要欄位去訓練與預測出的正確率相當,約為九成左右的正確,且實驗的結果顯示,三個演算法所產生的結果十分類似,即在下雨的預測規則方面,當能見度轉差天空總雲量變多的時候,就有機會下雨;另外在晴天的預測規則方面,則是當能見度為佳天空總雲量為少的時候,當時的天氣可推測為晴天。
|
摘要(英) | Abstract
With the development of the computer technology and the trend of data digitalizing, the concept of the database management makes it possible for the storage media to change from the early paper sheet to the recent electronic storage devices, which increases the conveniences in managing and storing data. Besides, the computer technology makes it possible to handle enormous amount of data in short time with its fast computing capability. It is such capability that makes more and more people put effort on the study to improve data processing and analyzing. Weather forecasting would be one of the best examples for such change. Years ago, people made prediction with long sheet which had recorded weather data on it, and the process has been improved in terms of making different types of devices and computer systems doing all the measures and data storage. The weather men can easily and quickly make prediction on the weather for next hour through simulating and analyzing the data stored. However, here comes the problem. How if the weather men are not so experienced in making analysis, would they still predict the weather condition accurately? Thus, how to create some simple rules to assist the weather men doing their analysis has become a new field where draw more and more people’s attention.
More than predicting the weather condition next hour, for those who work on weather forecasting, the data on weather can be further applied to the techniques on datamining to dig out information that may be helpful for forecasting. The main goal of this paper is try to research on the weather date with various dataminig techniques and to find whether there are certain rules which are helpful to weather predicting.
We applied the algorithms of neural network, C5, and C&RT on the weather data collected between the year of 1996 and 2002 to see if there were any rules for the raining day and sunny day respectively. The result turned out that there existed certain characteristic for it to be a raining day or a sunny day. When the visibility decreased and the overall amount of cloud increased, it got pretty good chance to rain. On the other hand, it could possibly be a sunny day when the visibility increased and the overall amount of cloud decreased. When we further applied such rules to predict the weather condition of the year 2003, and it was up to 90% matched.
|
論文目次 | 資料探勘在天氣預測之研究與應用
第壹章 緒論………………………………………………………………… 1
第一節 研究動機與目的…………………………………………………… 2
第二節 研究範圍與限制…………………………………………………… 4
第三節 預期研究貢獻……………………………………………………… 5
第四節 譣文架構…………………………………………………………… 6
第貳章 相關研究…………………………………………………………… 8
第一節 氣象知識…………………………………………………………… 8
第二節 文獻探討…………………………………………………………… 17
第三節 現行天氣預報採用方式…………………………………………… 18
第四節 預測方法相關研究………………………………………………… 23
第五節 資料萃取方式……………………………………………………… 25
第參章 研究方法…………………………………………………………… 29
第一節 研究設備及工具介紹……………………………………………… 29
第二節 研究流程、研究設計……………………………………………… 31
第三節 研究步驟建置說明………………………………………………… 32
第四節 實例說明…………………………………………………………… 35
第肆章 實驗結果…………………………………………………………… 36
第伍章 結論與未來研究方向…………………………………………… 45
第一節 結論………………………………………………………………… 45
第二節 未來研究方向……………………………………………………… 46
參考文獻………………………………………………………………………… 47
|
參考文獻 | 中文文獻部份
1. 中央氣象局網站
2. 台灣大學大氣科學網站
3. 「台灣地區氣溫變遷之研究」中國文化大學地學研究所
4. 吳元彰、劉正熙、楊鍵樵,「從時序性數值資料中探勘相似特徵之研究」,國立台灣科技大學電子工程研究所
5. 李修宇,「以資料萃取技術探索天氣、污染、氣喘病發作的關連性─以類神經網路BPN模型為例」,南華大學資訊管理學系
6. 許晃雄、盧孟明,「我國氣候研究與預報的未來發展」台灣大學大氣科學、中央氣象局科技中心
7. 鄭明典,「數值天氣預報近期的發展趨勢」,中央氣象局氣象科技研究中心
8. 陳啟元,「資料探勘技術於健保資料之應用-以醫院門診服務點數預測為例」,中正大學資訊管理所
9. 李駿翔,「應用資料探勘分類技術於專利分析之研究」中原大學資訊管理學系
10. 江巧雯,「長時間序列叢集化之研究」,元智大學資訊管理系
11. 陳仕昇,「以可重複序列挖掘網路瀏覽規則之研究」,中央大學資訊管理研究所
12. 張衡閣,「一個資料庫多維度序列法則探勘方法」,朝陽科技大學資訊管理系
13. 江忠益,「一種發掘週期性關聯規則之演算法」,中山大學電機工程學系
14. 馬南超,「一種三向時間序列資料處理模型」,中原大學資訊工程學系
15. 楊漢賢、李國麟、關錦倫,「強烈熱帶風暴錦雯(9919)西進路徑的預測- 數值天氣預報的應用」,香港天文台
16. 周乃昉、鄭子璉、林柏承,「應用類神經網路於颱降雨量的推估」。
17. 李天浩、王時鼎、張志琳,「淡水河流域颱風面積定量降雨氣候預報模式研究」,第九屆水利工程研討會論文集,中壢,民國 87 年。
18. 孫建平、張斐章,「倒傳遞神經網路演算法於時雨量預測之研究」,八十四年農業工程研討會論文集,台北,第 209-233 頁,民國 84 年
19. 陳昶憲、楊朝仲,「時序類神經集水區洪水預測模式」,台灣水利, 第 46 期第 1 卷,民國 87 年 3 月。
20. 鄭子璉,「分佈型類神經網路降雨逕流模式之研究」,碩士論文,國立成功大學水利及海洋工程研究所,民國 85 年 6月。
21. 蔡鐵山,「濁水溪流域颱風降雨預報模式之研究」。
22. 李御璽、顏秀珍、林基玄、曾乙甯、馬莉芋「資料探勘在銀行信貸風險評分模型上之研究」。
23. 空軍地面氣象觀測手冊
24. 資料探勘軟體規格http://www.spss.com/clementine/index.htm
英文文獻部份
25. R. Agrawal, R. Srikant: “Fast Algorithm for Mining Association Rules”, International Conference on Very Large Data Bases, pp 487-499, Sept. 1994
26. R. Agrawal, R. Srikant: “Mining Sequential Patterns”, International Conference on Data Engineering (ICDE), pp 3-14, March 1995. Expanded version available as IBM Research Report RJ9910, October 1994.
27. G. Das, K.-I. Lin, H. Mannila, G. Renganathan, and P. Smyth, ”Rule Discovery from Time Series,” Proc. Int’l Conf. Knowledge Discovery and Datamining, pp. 16-22, 1998.
28. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann ,San Francisco, (2001).
29. .H. Pinto, J. Han, J. Pei, K. Wang, Q. Chen, and U. Dayal. "Multi-Dimensional Sequential Pattern Mining", Proceedings of the 10th ACM International Conference on Information and Knowledge Management (CIKM'01), Atlanta, USA, pp. 81-88 , (2001).
30. A. Savasere, E. Omiecinski, and S. Navathe, “An Efficient Algorithm for Mining Association Rules,” Proceedings of the 21st Conference of Very Large Databases (VLDB), pp. 432-444 (1995).
31. M. J. Zaki, “SPADE: An Efficient Algorithm for Mining Frequent Sequences,” Proceeding of Machine Learning Journal, special issue on Unsupervised Learning, Vol. 42 Nos. 1/2, pp. 31-60 (2001). 70
32. Wei, C., Piramuthu, S. and Shaw, M. J., “Knowledge Discovery and Data Mining,” To appear in Handbook of Knowledge Management, C. Holesapple (Ed.), 2002.
33. Rafiei, D., “On Similarity-Based Queries for Time Series Data,” Proceedings of 15th International Conference on Data Engineering, 1999.
34. G. Piatetsky-Shapiro. Discovery, analysis, and presentation of strong rules. In G. Piatetsky-Shapiro and W. J. Frawley, editors, Knowledge Discovery in Databases, 229-238. AAAI/MIT Press, 1991
35. J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, Publishers,pps5-9,2001.
|
論文頁數 | 50 |
附註 | |
全文點閱次數 | |
資料建置時間 | |
轉檔日期 | |
全文檔存取記錄 | |
異動記錄 | M admin Y2008.M7.D3 23:17 61.59.161.35 |