대학별고사를 위한 문항분석, 표준점수, 검사동등화

  • 성태제 ((120-750) 서울시 서대문구 대현동 11-1 이화여대 사범대학 교육학과)
  • 발행 : 1994.12.01


본 논문은 1994학년도 부터 부활된 대학별고사 실시에 따른 문항분석, 표준 점수제 그리고 검사동등화의 문제점을 지적하기 위하여 교육측정이론의 기본 개념을 소개하는데 있다. 대학별고사의 타당성과 신뢰성을 보장받기 위하여는 양질의 문항제작이 우선하여야하며, 이를 위하여 문항분석은 종전에 사용하던 고전검사이론 보다는 문항반응이론을 이용하는 것이 바람직하다. 문항반응이론에 의한 문항분석은 피험자 집단의 특성에 의하여 문항특성이 달리 분석되지 않는 특징을 지니고 있기 때문이다. 문항이 논술형일 경우 채점자간 신뢰도와 채점자 내 신뢰도를 간과하여서는 안될 것이다. 다양한 선택과목을 채택하는 대학별 고사에서 입학 사정을 위하여 원점수를 사용하거나, 표준점수 혹은 검사동등화 방법을 이용하고 있으나 이는 교육측정이론에 위배된다. 다른 과목에 대한 인가의 능력을 상대비교 할 수 없으며, 표준점수와 검사동등화는 동일 능력에 대한 상대비교를 위한 방법이다. 특히 검사동등화는 동일 특성, 공정성, 모교집단 불변성, 대칭성을 전제한다. 표준점수제에 의하여 수험생들의 다른 능력을 상대 비교하는 방법은 다른 능력이 점수로 표현되기 때문에 가능하나 그 점수가 무엇을 의미하는 가를 분석할 때는 교육평가의 기본 철학에도 위배된다.



  1. 교육측정, 평가, 연구, 통계 용어사전 교육평가연구회
  2. 교육평가연구 v.5 no.2 문항모수 변이에 따른 선형, 동백분위, IRT, 검사동등화 방법의 강인성 비교연구 남현우
  3. 문항반응이론 입문 성태제
  4. 교육학연구 v.31 no.2 입시위주의 교육과 과열과외 성태제
  5. 교육평가연구 v.6 no.1 차별기능(편파성)문항 추출을 위한 Raju 방법과 Mantel-Haenszel 방법의 비교연구 성태제
  6. 교육평가연구 v.6 no.2 Mantel-Haenszel 방법과 Raju 방법에 의한 제 4차, 제 5차 대학수학능력시험 실험평가의 성별에 따른 차별기능문항 추출 추정아;성태제
  7. MHDIF:Mantel-Haenszel 방법을 이용한 차별기능문항 추출 컴퓨터 프로그램 추정아;성태제
  8. 교육평가연구 v.6 no.2 대학수학능력시험 제 6차, 제 7차 실험평가의 문항특성과 피험자능력 동등화 황소림
  9. Standards for educational and phychological testing AERA/APA/NCME
  10. Educational Measurement(2nd ed.) Angoff, W. H.;R. L. Thorndike(ed.)
  11. User's manual for the MicroCAT testing system(version 3) Assessment Systems Corporation
  12. Item Response Theory;Parameter estimation techniques Baker, F. B.
  13. The Basic of Item Response Theory Baker, F. B.
  14. Journal of Educational Measurement v.28 A comparison of two procedures for computing IRT equalting coefficients Baker, F. B.;Ali Al-Karni
  15. EQUATE;Computer program for equating two metrics in item response theory [Computer Program] Baker, F. B.;Ali Al-Karni
  16. Fundamental of Item Response Theory Hambleton, R. K.;Swaminathan, H.;Rogers, H. J.
  17. Test Equating Holland, P. W.;Rubin, D. B.(eds.)
  18. Test validity Differential item performance and the Mantel-Haenszel procedure Holland, P. W.;Thayer, D. T.;H. Wainer;H. I. Braun(eds.)
  19. Educational and Psychological Measurement and Evaluation(7th ed.) Hopkins, K. D.;Stanley, J. C.;Hopkins, B. R.
  20. IRTDIF;A computer program for the IRT differential item functions[Computer Program] Kim, S.;Cohen, A. S.
  21. Processings of the Royal Society of Edinburgh v.18 On problems connected with item selection and test construction Lawley, D. N.
  22. Applied Psychological Measurement v.5 Item bias in a test of reading comprehension Linn, R. L.;Levine, M. V.;Hasting, C. N.;Wardrop, J. L.
  23. Applications of item response theory to practical testing problems Lord, F. M.
  24. Journal of Educational Measurement v.17 Vertical equating using the Rasch model Loyd, B. H.;Hoover, H. D.
  25. Handbook of research on curriculum Cruuiculum evaluation and assessment Madus, F. G.;Kellanghan, T.;P. W. Jackson(ed.)
  26. BILOG;Maximum likehood item analysis and test scoring with logistic models Mislevy, R. J.;Bock, R. D.
  27. PC-BILOG;Item analysis and test scoring with binary logistic model[Computer Program] Mislevy, R. J.;Bock, R. D.
  28. Psychometrika v.53 The area between two item characteristics curves Raju, N. S.
  29. Applied Psychological Measurement v.14 Determining the significance of estimated signed and unsigned areas between two item response functions Raju, N. S.
  30. Applied Psychological Measurement v.7 Developing a common metric in item response theory Stoking, M. L.;Lord, F. M.
  31. The Measurement of Educational Products, Seventeenth Yearbook of the National Society for the Study of Education The nature, purposes and general methods of measurements of educational products Thorndike, E. L.;G. M. Whipple(ed.)
  32. BICAL;CAlibrating items with the Rasch model(Statistical Laboratory Research Memorandum NO.23B) Wright, B. D.;Mead, R. J.;Bell, S. R.
  33. LOGIST user's guide Wingersky, M. S.;Barton, M. A.;Lord, F. M.