輔仁大學
學術資源網

記錄編號3406
狀態NC088FJU00506001
助教查核
索書號
學校名稱輔仁大學
系所名稱應用統計研究所
舊系所名稱
學號487726017
研究生(中)葉瑞鈴
研究生(英)YEH RUEY-LING
論文名稱(中)統計調查中遺漏值處理之研究-以臺灣地區消費者動向調查為例
論文名稱(英)Imputation Method for Missing Data in Government Survey--Consumers’ Behavior Survey in Taiwan Area
其他題名
指導教授(中)謝邦昌 博士
指導教授(英)
校內全文開放日期
校外全文開放日期
全文不開放理由
電子全文送交國圖.
國圖全文開放日期.
檔案說明
電子全文
學位類別碩士
畢業學年度88
出版年
語文別中文
關鍵字(中)遺漏值 多重插補 熱卡法 SOLAS
關鍵字(英)missing data multiple imputation hot-deck SOLAS
摘要(中)摘 要 在求真求善的統計學理的探討上,如何使統計調查結果更接近母體的態樣,一直是努力研究的方向,故處理遺漏值以減少調查的非抽樣誤差,仍有一些意義與科學研究之價值。準此,本文針對統計調查中遺漏值發生原因及處理之方法加以彙整研究,並以行政院主計處所辦理之「臺灣地區消費者動向調查」為例,以SOLAS模擬執行熱卡法及多重插補並評估其效果。 在模擬過程中,首先找出問卷中基本問項與插補問項相關較大者後,以隨機遺漏之方式產生不同遺漏比率之資料集,分別執行SOLAS之熱卡法、多重插補法並評估模擬結果。 本文所探討遺漏值發生的原因,除可作為調查過程中事前預防措施的參考,亦可作為選擇處理遺漏值方法的重要評估因素。在實例研究中,多重插補模擬結果之平均數與原始得點數的差異小,顯示效果良好,並可快速產生完整的資料集,供研究者做深入的分析;此外,遺漏值的比率與各種插補法的效果有關,可供本調查選擇插補法之參考,此亦為本研究的重要發現。 關鍵字:遺漏值、多重插補、熱卡法、SOLAS。
摘要(英)ABSTRACT That survey results do reflect the reality of population is statistical aim, so it still takes efforts to reduce the non-sampling error for getting the correct information and making the right decision. The purpose of this paper is to discuss the ways of dealing with missing data, and do some simulation by imputing pseudo-missing values from "Consumers'' Behavior Survey in Taiwan Area". We begin to find the fundamental items with higher correlation to the imputed variable. Then we generate many incomplete data sets by various missing rates randomly. At last, we execute hot-deck and multiple imputation procedures by SOLAS, and evaluate the results. In the case study, the analysis results of the data sets imputed by multiple imputation are very close to those of the original complete data. We can say that multiple imputation behaves well in providing complete data sets to researchers for further study. Besides, we also find that the rate of missing data plays an important role in discussing the effectiveness of imputing methods. It could be a good index to select imputing methods for the survey. Keywords:missing data;multiple imputation;hot-deck;SOLAS
論文目次目 錄 第一章 緒 論…………………………………………………… 1 第一節 研究動機……………………………………………… 1 第二節 研究目的……………………………………………… 2 第三節 研究架構……………………………………………… 2 第二章 處理遺漏值的方法…………………………………… 3 第一節 文獻回顧……………………………………………… 3 第二節 遺漏值發生的原因…………………………………… 5 一、無回答類型………………………………………… 5 二、無回答原因分析……………………………………… 6 第三節 處理遺漏值的方法…………………………………… 9 第四節 其他事前及事後之補救措施…………………………12 一、無回答問題…………………………………………… 12 二、敏感性問題…………………………………………… 13 第三章 SOLAS之插補方法…………………………………………15 第一節 插補簡介……………………………………………… 15 第二節 遺漏值機制…………………………………………… 16 第三節 遺漏值的類型………………………………………… 17 第四節 各種插補法之利弊…………………………………… 17 一、平均數插補…………………………………………… 17 二、熱卡插補……………………………………………… 18 三、LVCF插補 …………………………………………18 四、多重插補……………………………………………… 18 第五節 多重插補法……………………………………………19 第六節 插補應注意事項……………………………………… 21 第四章 實例研究………………………………………………… 22 第一節 台灣地區消費者動向調查簡介……………………… 22 第二節 模擬研究方法………………………………………… 22 一、模擬過程…………………………………………………… 23 二、實際模擬經過及結果…………………………………23 第五章 結論與建議…………………………………………… 42 第一節 結果與討論…………………………………………… 42 第二節 建議…………………………………………………… 43 參考文獻………………………………………………………… 46 附錄一、模擬結果表…………………………………………… 49 附錄二、臺灣地區消費者動向調查相關資料………………… 89 附錄三、臺灣地區消費者動向調查基本問項三與一、二、四至六 之關聯分析…………………………………………… 97
參考文獻參 考 文 獻 ?翁彰佑及程爾觀(1991),「隨機遺失資料插補法估計效用之比較」,中國統計學報第二十九卷第二期。 ?劉長萱及蔡政豐(1996),「問卷調查的不完整取樣設計」,調查研究第三期。 ?陳信木、林佳瑩(1997),「調查資料之遺漏值的處置-以熱卡插補法為例」,調查研究第三期。 ?金勇迸(1996),「非抽樣誤差分析」,中國統計出版社。 ?黃登源(1998),「應用迴歸分析」,華泰文化事業公司。 ?鄭光甫及韋端(1995),「抽樣方法-理論與實務」,三民書局。 ?趙民德、謝邦昌(1998),「探索真相」,曉園出版社公司。 ?李丕準(1996),「不完整資料之處理─以二段式插補法為例」,主計月報第八十一卷第六期。 ?李丕準(1997),「處理問卷逸失資料之研究」,主計月報第八十三卷第二、三期。 ?劉義周(1984),「調查研究中不知道選項問題的分析」,政大學報五十二期。 ?張善楠(1999),「教學研究中學童和父母雙重資料之項目無作答分析」,調查研究第六期。 ?Dempster, A.P.,N.M.Laird, and Donald B. Rubin (1977), “Maximum Likelihood from Incomplete Data Via the EM Algorithm. ” Journal of the Royal Statistical Society, Series B 39:1-38. ?Ford, Narry L.(1976), “Missing Data Procedures: A Comparative Study ” American statistical Association: Proceedings of the Social Statistics Section 1976, Part 1,324. ? Fuchs, Camil (1982), “Maximum Likelihood Estimation and Model Selection in Contingency Tables with Missing Data. ” Journal of the American Statistical Association 77(378):270-78. ? Gelfand, Alan E. and Bradley P. Carlin(1993), “Maximum-Likelihood Estimation for Constrained or Missing-Data Models. ” The Canadian Journal of Statistics 21(3):303-11. ? Kalton, G. and Kasprzyk, D.(1982), “Imputing for missing survey responses. ” Proc.Sect. Survey Res. Meth., Amer. Statist. Assoc.,22-23. ? Kalton, Graham (1983), “Compensating for Missing Survey Data ” Research Report Series, Ann Arbor, MI:Institute for Social Research, University of Michigan. ?Kalton, Graham and Leslie Kish(1984), “Some Efficient Random Imputation Methods.” Communications in Statistics, Theory and Methods 13:1319-39. ?Kim, Jae On and James Curry(1977), “The Treatment of Missing Data in Multivariate Analysis.” Sociological Methods and Research 6(2):215-40. ?Leslie Kish(1965), “Survey Sampling” John Wiley and Sons, LNC532. ? Lessler, Judith T. and William D. Kalsbeek(1992), Nonsampling Error in Surveys. New York:John Wiley & Sons, Inc. ?Little, R.J.A. and D. B. Rubin(1987), Statistical Analysis With Missing Data, New York:John Wiley & Sons. ?Madow, Willoan G. (1983), “Incomplete Data in Sample Surve.” Vol. I, Report and Case Studies. New York: Academic3. ? Rubin,D.B. & Schenker, N. (1986), “Multiple Imputation for Interval Estimation From Simple Random Samples with Ignorable Nonresponse.” Journal of the American Statistical Association, 81 ,p.366-374. ? Rubin,D.B. (1987), Multiple Imputation for Nonresponse in Surveys, New York:John Wiley & Sons. ?Sande, Innis G.(1979), “A Personal View of Hot Deck Imputation Procedures.” Survey Methodology 5:238-58. ?Sande, Innis G.(1982), “ Imputation in Surveys: Coping with Reality.” The American Statistician 36:145-52. ?Statistical Solutions Ltd.(1997), SOLAS for Missing Data Analysis 1.0.
論文頁數100
附註
全文點閱次數
資料建置時間
轉檔日期
全文檔存取記錄
異動記錄M admin Y2008.M7.D3 23:17 61.59.161.35