DOI QR코드

DOI QR Code

A Trial of Data Editing Using Fellegi-Holt Techniques and Its Analysis

Fellegi-Holt 기법을 이용한 에디팅의 시도 및 분석

  • Published : 2009.08.31

Abstract

In actual statistical surveys, the inconsistencies within the record are often occurred due to incorrect response. The users may be confused and statistical agencies may have a problem of reliability on statistical data in this case. It is needed to detect and correct the unconvinced record without any special reasons. However, it is not simple to determine which item should be corrected in every failed record. In this paper we briefly introduce Fellegi-Holt method, apply to a business survey, and then discuss the problems for this trial editing.

실제 통계조사에서는 응답 자료라 할지라도 부정확한 응답 등으로 항목 간 연관성 오류가 나타나곤 한다. 이러한 경우 사용자는 상당한 혼란에 빠질 수 있으며 이는 통계자료의 신뢰에 대한 문제이기도 하다. 따라서 특별한 사유가 없이 납득하기 어려운 레코드는 탐색되고 수정되어야 할 필요성이 있다. 이때 어떤 변수를 수정해야 할지를 레코드마다 일일이 결정하는 것은 그리 간단하지 않다. 본 연구에서는 Fellegi-Holt 방법을 이용하여 사업체 조사 자료의 에디팅을 시도하고 그 결과와 문제점을 분석한다.

Keywords

References

  1. 김규성 (2008). 에디팅 품질관리 매뉴얼, <한국통계학회>
  2. 박진우, 박현주, 김진억 (2005). 주택가격동향조사를 위한 데이터편집 사례연구, <조사연구>, 6, 83-98
  3. 변종석 (2007). Introduction to Data Editing, Data Editing in Survey, 2007 통계의 날 기념 워크숍, <한국조사연구학회>
  4. 이의규, 심규호 (2007). 사업체 대상 조사의 자동내검기법, <국가통계발전을 위한 통계기법의 개선>, 통계개발원, 81-100
  5. 통계청 (2004). <2003년 기준 산업총조사 입력.내검 프로그램 운영요령서>, 통계청 내부자료
  6. Chen, B., Thibaudeau, Y. and Winkler, W. E. (2002). A comparison study of ACS if-then-else, NIM, and DISCRETE edit and imputation systems using ACS data, Proceedings of the Section on Survey Research Methods, American Statistical Association
  7. De Wall, T. (2003). Processing of Erroneous and Unsafe Data, Ph. D. Thesis, Erasmus University Rotterdam
  8. De Waal, T. and Coutinho, W. (2005). Automatic editing for business surveys: An assessment of selected algorithms, International Statistical Review, 73, 73-102 https://doi.org/10.1111/j.1751-5823.2005.tb00252
  9. Fellegi, I. P. and Holt, D. (1976). A systematic approach to automatic edit and imputation, Journal of American Statistical Association, 71, 17-35 https://doi.org/10.2307/2285726
  10. Granquist, L. (1997). The new view on editing, International Statistical Review, 65, 381-387 https://doi.org/10.1111/j.1751-5823.1997.tb00315.x
  11. Greenberg, B. (1986). The Use of Implied Edits and Set Covering in Automated Data Editing, Bureau of the Census, Statistical Research Division Report Series SRD Research Report Number: Census/ SRD/RR-86/02
  12. Kozak, R. (2005). The Banff system for automated editing and imputation, Proceedings of the Survey Methods Section, SSC Annual Meeting
  13. Nordholt, E. S. and De Waal, T. (1999). Automatic Editing in the Dutch Labour Cost Survey Using CherryPi, UN Statistical Commission and Economic Commission for Europe, Working Paper 7
  14. Whitridge, P. and Kovar, J. (1990). Applications of the Generalized Edit and Imputation System at Statistics Canada, Statistics Canada
  15. Winkler, W. E. and Draper, L. R. (1997). The SPEER edit system, statistical data editing, UN Economic Commission for Europe, II, 51-55