• 제목/요약/키워드: 채점자 교육

검색결과 67건 처리시간 0.024초

서답형 문항 온라인 채점 시스템의 개발과 적용 (Development and Application of an Online Scoring System for Constructed Response Items)

  • 조지민;김경훈
    • 컴퓨터교육학회논문지
    • /
    • 제17권2호
    • /
    • pp.39-51
    • /
    • 2014
  • 서답형 문항이 포함된 대규모 평가에서 학생들의 답안이 어떻게 채점자들에게 분배되고 어떠한 체계적인 채점 과정을 거쳐야 하는 지에 대한 채점의 효율성은 전반적인 평가의 성공에 중요한 사안이다. 서답형 문항 채점에서 채점자 신뢰도를 확보하기 위해 채점자의 채점 결과가 얼마나 일관성이 있으며, 또한 채점자 간의 채점 결과 또한 서로 일관성을 유지해야하는 것이 중요하다. 이 연구의 목적은 지필 평가로 시행된 서답형 문항 채점을 위한 온라인 채점 시스템을 설계하고 개발한 후, 이를 시행한 결과를 기반으로 온라인 채점 시스템에 대한 신뢰도를 확인하고자 하였다. 이러한 서답형 문항 온라인 채점은 채점자들의 채점 과정에 대한 정보로, 기존의 전통적인 채점 방식과의 비교와 함께 채점자 내 및 채점자 간의 신뢰도를 제공하고 있다. 그 결과로 온라인 채점 시스템이 신뢰롭고 타당한 서답형 문항 채점 결과를 얻는데 효과적이었다는 것을 알 수 있었다.

  • PDF

서답형 문항의 인터넷 기반 채점시스템 설계 연구 (A Study on design of The Internet-based scoring system for constructed responses)

  • 조지민;김경훈
    • 컴퓨터교육학회논문지
    • /
    • 제10권2호
    • /
    • pp.89-100
    • /
    • 2007
  • 대규모 집단을 대상으로 시행하는 서답형 문항을 수기 채점 방식으로 채점하는 경우 채점 과정에서 발생하는 채점 오차를 줄이기 위해서는 많은 노력과 시간을 필요로 한다. 이러한 문제점을 해결하기 위해 세계 각국에서는 서답형 문항 채점 시스템을 개발하여 운용하고 있지만, 국내에서는 채점 시스템의 기초적인 연구도 미흡한 실정이다. 본 연구의 목적은 '서답형 문항의 인터넷 기반 채점 시스템' 설계의 기반을 마련하는데 있다. 시스템 설계의 기반 마련을 위한 시스템의 개요와 기본 설계도, 채점자 배정 방법, 채점자 신뢰도 추정에 의한 채점자 오류 검색 알고리즘을 제안하였다. 본 시스템은 실시간으로 채점 신뢰도를 추정하여 채점 오차를 보정할 수 있는 장점이 있다.

  • PDF

생물 개념 이해의 평가 도구로서 개념도의 타당도, 신뢰도 그리고 현실 적용 가능성에 대한 연구 (A Study on Validity, Reliability and Practicality of a Concept Map as an Assessment Tool of Biology Concept Understandings)

  • 조정일;김정
    • 한국과학교육학회지
    • /
    • 제22권2호
    • /
    • pp.398-409
    • /
    • 2002
  • 본 연구는 개념도 채점 방법의 타당도, 신뢰도 그리고 평가 도구로서 개념도의 현실 적용가능성을 알아보는데 목적이 있다. Burry-Stock의 채점 방법, Novak과 Gowin의 채점 방법, McClure와 Bell의 채점 방법을 모두 사용했고, 각 채점 방법에 대해 2명의 채점자를 배정하였다. 채점자는 지방 국립 사범대 과학교육학부 4학년 학생들이었다. Burry-Stock의 채점 방법을 제외하고는 과제의 제시 유형에 상관없이 두 채점자간의 정수 차이가 크지 않았고, 점수 차이가 통계학적으로도 유의하지 않았다. Novak과 Gowin과 McClure와 Bell의 채점 기준을 따를 때 개념도는 타당도가 높은 평가 도구인 것으로 나타났다. Burry-Stock의 채점 방법은 개념을 주고 개념도를 만들도록 한 과제를 위해 개발된 것인 만큼 그 유형의 과제를 가지고 개념도를 만들도록 했을 때는 타당도가 있었다. 각각 3가지 채점 방법에 따른 Pearson의 단순 적률상관 계수를 이용하여 채점자간 신뢰도롤 분석한 결과 신뢰도는 $.449{\sim}.975$의 범위였다. Novak과 Gowin의 채점 방법을 사용할 때는 .94 이상의 높은 일치도를 보여주었다. McClure와 Bell의 채점 방법 또한 환경 오염에서 .816의 비교적 높은 상관 관계를 보여 주었다. 채점자들이 개념도률 채점하는데 걸린 시간은 최소 1.13분에서 최대 3.70분까지 소요되었다. 본 연구 결과 개념도가 생물 개념 평가 도구로서 타당도 신뢰도 그리고 현실적용 가능성이 충분히 있다고 사료된다. 작성하는데 필요한 시간은 평균 29분이었다(n=40. S.D=5.10). 채점자들이 40개의 개념도를 채점하는데 필요한 시간을 기록하였다. Table 5는 각 평가 방법에 따른 개념도 채점에 평균 소요 시간을 나타낸 것이다. 전체적으로 1.13분에서 3.70분까지 소요되었다. 채점자에 따라 채점 시간에서 차이를 보였다.

초등 과학과 포트폴리오의 채점기준 개발과 신뢰도 검증 (Developing Scoring Rubric and the Reliability of Elementary Science Portfolio Assessment)

  • 김찬종;최미애
    • 한국과학교육학회지
    • /
    • 제22권1호
    • /
    • pp.176-189
    • /
    • 2002
  • 본 연구의 목적은 초등학교 과학과 포트폴리오를 채점할 수 있는 다양한 채점기준을 개발하고, 개발된 각 채점기준의 신뢰도를 검증해 보고자 하는 것이다. 채점기준을 개발하기 위한 포트폴리오는 4학년 2학기 '단원 2. 지층과 화석', '단원 4. 열과 물체의 변화' 를 중심으로 청주교대 과학교육 연구실에서 2000년 여름에 개발한 체제를 같은 해 가을, 경기도 중도시의 한 초등학교 4학년 한 학급에 적용하여 얻은 것이다. 총괄-일반, 총괄-특수, 분석-일반, 분석-특수의 4가지 채점기준을 개발하고, 각 채점기준에 근거하여 학생들이 작성한 포트폴리오 증거물을 채점하여 각 채점 기준별 채점자간 신뢰도와, 채점자내 신뢰도를 구하였다. 1차 채점에서는 총 12명의 채점자들이 각 채점기준별로 3명씩 그룹을 나누어 그룹당 12권의 포트폴리오 증거물을 채점하였다. 단, 분석-특수 채점기준의 경우 6권의 포트폴리오 증거물만을 채점하였다. 채점자내 신뢰도를 알아보기 위해 실시한 채점시기별 신뢰도에서는 l차 채점에 참가한 채점자 중 각 채점기준별로 2명씩 총 8명이 2차 채점에 참가하여 l차 채점과 동일한 방식으로 채점을 실시하였다. 채점결과를 SPSS 통계 프로그램에 입력하여 상관계수를 구한 결과, 총괄-일반 채점기준은 채점자간 신뢰도가 높고 채점자내 신뢰도가 있는 것으로 나타났고 총괄-특수 채점기준은 채점자간 신뢰도와 채점자내 신뢰도가 있는 것으로 나타났다. 분석-일반 채점기준은 채정자간 신뢰도가 높고 채점자내 신뢰도는 있는 것으로 나타났으며, 분석-특수 채점기준은 채점자간 신뢰도와 채점자내 신뢰도가 모두 높은 것으로 나타났다. 일반적인 채점기준들(총괄-일반, 분석-일반)의 경우, 하나의 채점 기준으로 모든 포트폴리오 목표를 채점할 수 있으므로 매우 경제적이고 실용적이나, 채점자들은 채점시 모호함을 느낀다고 하였다. 반면에, 특수적인 채점기준들(총괄-특수, 분석-특수)의 경우, 채점은 더 명확하게 할 수 있으나, 목표별로 채점기준을 개발해야 하므로 많은 시간과 노력이 필요하게 된다. 채점기준의 실용도 측면에서는 분석-특수 채점기준이 다른 기준보다 2배 이상의 시간이 결려 실용도는 낮은 것으로 나타났다.

중학생 과학탐구활동 수행평가 시 총체적 채점에서 나타나는 채점자간 불일치 유형 분석 (An Analysis on Rater Error in Holistic Scoring for Performance Assessments of Middle School Students' Science Investigation Activities)

  • 김형준;유준희
    • 한국과학교육학회지
    • /
    • 제32권1호
    • /
    • pp.160-181
    • /
    • 2012
  • 본 연구의 목적은 과학탐구활동 수행평가 시 총체적 채점의 신뢰도를 높이기 위하여 채점자간 불일치의 정도와 유형을 이해하는 것이다. 이를 위하여 중학생 60명을 대상으로 과학탐구 수행평가를 실시하였고, 4명의 훈련된 채점자 채점을 실시하였다. 분산 분석결과 교사 관련 분산성분에 의해 전체 분산의 25%를 설명할 수 있으며, 4명의 채점자중 2명은 관대한 채점자, 2명은 엄격한 채점자의 경향을 지닌 것으로 나타났다. 전체 240 채점 사례 중 4명의 채점자가 모두 일치한 사례는 51사례이다. 채점자간 불일치가 나타나는 189사례에 대하여 채점자 협의를 통하여 확인한 결과, 채점자간 중요하게 생각하는 부분의 차이 때문에 발생하는 불일치 유형1이 38%, 채점자의 관대함과 엄격함에 의해 발생하는 불일치 유형2가 25%, 채점자가 중요하게 생각하지 않은 부분에서 간과하기 때문에 발생하는 등 실수에 의한 불일치 유형3이 31%로 나타났다. 불일치 유형1은 채점자마다 중요하게 생각하는 과제 요소와 평가 요소가 다른 경우로 나누어서 나타났으며, 맥락상의 의미를 강조하는 채점자는 관대한 경향을, 특정 요소를 강조하여 분석적으로 해석하는 채점자는 엄격한 경향을 나타냈다. 불일치 유형 2는 많은 경우 채점 척도의 경계에 학생의 응답에 대하여 나타났으며, 채점자들은 이러한 학생 응답에 대하여 옳은 서술의 개수를 세는 등 분석적인 채점을 수행하는 것을 확인할 수 있었다. 또한 불일치 유형3은 채점자의 실수로 발생하는 불일치로 주로 학생의 응답 중 평가 기준에 부합하는 부분인데 채점자가 중요하게 생각하지 않기 때문에 간과하여 발생하는 것으로 파악할 수 있었다. 이상과 같은 채점자간 불일치를 제어하기 위해서는 채점자가 중요하게 생각하는 과제 요소와 평가 요소에 대하여 사전 및 진행 중 협의를 할 필요가 있다고 판단된다. 또한 총체적 채점을 하는 경우도 각 수준에 해당하는 평가 기준과 함께 경계에 놓인 학생 응답을 변별하는 기준을 제시하는 것이 필요하다. 채점자들은 자신의 채점경향이 엄격한지 관대한지를 파악하고 경계에 놓인 학생의 응답에 대한 판단을 주의 깊게 하여야 불일치를 줄일 수 있다. 실수에 의한 오차를 줄이기 위해서는 여러 명의 채점자가 교차 채점하는 것이 필요하다. 동일한 채점 기준에 대한 채점자의 해석이 다르게 나타나는 경향과 원인에 대한 추후 연구가 필요하다.

한국어능력시험(TOPIK) 쓰기 평가의 채점 특성 연구 (A Study on the Features of Writing Rater in TOPIK Writing Assessment)

  • 안수현;김정숙
    • 한국어교육
    • /
    • 제28권1호
    • /
    • pp.173-196
    • /
    • 2017
  • Writing is a subjective and performative activity. Writing ability has multi-facets and compoundness. To understand the examinees's writing ability accurately and provide effective writing scores, raters first ought to have the competency regarding assessment. Therefore, this study is significant as a fundamental research about rater's characteristics on the TOPIK writing assessment. 150 scripts of the 47th TOPIK examinees were selected randomly, and were further rated independently by 20 raters. The many-facet Rasch model was used to generate individualized feedback reports on each rater's relative severity and consistency with respect to particular categories of the rating scale. This study was analyzed using the FACETS ver 3.71.4 program. Overfit and misfit raters showed many difficulties for noticing the difference between assessment factors and interpreting the criteria. Writing raters appear to have much confusion when interpreting the assessment criteria, and especially, overfit and misfit teachers interpret the criteria arbitrarily. The main reason of overfit and misfit is the confusion about assessment factors and criteria in finding basis for scoring. Therefore, there needs to be more training and research is needed for raters based on this type of writing assessment characteristics. This study is recognized significantly in that it collectively examined writing assessment characteristics of writing raters, and visually confirmed the assessment error aspects of writing assessment.

한국인과 중국인 예비 한국어 교사 대상 채점자 교육 사례 (A Case Study on Rater Training for Pre-service Korean Language Teacher of Native Speakers and Chinese Speakers)

  • 이두용
    • 한국어교육
    • /
    • 제29권1호
    • /
    • pp.85-108
    • /
    • 2018
  • This study pointed out the reality that many novice Korean language teachers who lack rater training are scoring the learners' writing skill. The study performed and analyzed a case where pre-service teachers were educated in order to explore the possibility of promoting rater training in a Korean language teacher training course. The pre-service teachers majoring in Korean language education at the graduate school scored TOPIK compositions and were provided feedback by the FACETS program, which were further discussed at the rater meeting. In three scoring processes, the raters scored with conscious of own rating patterns and showed positive change or over correction due to excessive consciousness. Consequentially, ongoing training can improve rating ability, and considering the fact that professional rater training is hard to progress, the method composed of FACETS analysis and rater training revealed positive effects. On the other hand, the rater training including native Korean and non-native(Chinese) speakers together showed no significant difference by mother tongue but by individual difference. This can be interpreted as a positive implication to the rating reliability of non-native speakers possessing advanced Korean language abilities. However, this must be supplemented through extended research.

구문의미트리 비교기를 이용한 주관식 문항 채점 시스템에 대한 연구 (Research on Subjective-type Grading System Using Syntactic-Semantic Tree Comparator)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제21권6호
    • /
    • pp.83-92
    • /
    • 2018
  • 주관식 문항은 깊이 있는 사고능력 평가와 고등정신능력 평가에 적합하나 채점하기가 쉽지 않다. 동일한 채점기준을 갖더라도 채점자에 따라 다른 채점결과를 가져올 수 있으므로 객관적인 자동 채점 시스템이 필요하다. 그렇지만 채점 시스템은 표현 언어인 한국어 분석과 비교의 문제가 걸려있다. 본 연구는 한국어의 구문 분석을 구현하고 결과인 구문분석 트리를 비교하는 비교기를 이용하여 주관식 문항을 채점하는 채점 시스템을 설계, 개발하였다. 이 시스템은 단어 중심의 채점 시스템과 구문의미트리 중심의 채점 시스템을 복합한 시스템으로 구문의미트리 비교기를 활용하였다. 본 시스템의 실험 결과 제안한 구문의미트리 중심의 채점 시스템과 복합 채점 시스템이 더 나은 결과를 가져옴을 알 수 있었다. 본 연구는 한국어 구문의미분석과 주관식 채점 영역에 활용할 수 있고 또한 문서 분류에도 활용할 수 있을 것이다.

HWPML을 이용한 워드프로세서 실기 채점 시스템 (A Grading System of Word Processor Practical Skill Using HWPML)

  • 하진석;진민
    • 정보교육학회논문지
    • /
    • 제7권1호
    • /
    • pp.37-47
    • /
    • 2003
  • 본 논문에서는 한글과컴퓨터사에서 지원하는 HWPML(Hangul Word Processor Markup Language) 파일 포맷 형식을 이용하여 워드프로세서 실기 채점 시스템을 설계하고 구현하였다. HWPML은 한글 파일 형식을 마크업된 태그 구조로 나타낸 것으로 이를 이용하면 다른 응용 프로그램에서도 한글 파일을 편집할 수 있게 된다. 문제 출제는 관리자 또는 사용자 인증 과정을 거친 사용자면 누구나 출제 가능하도록 하였다. 정답 파일등록은 관리자만 등록할 수 있게 설계하여 채점 결과의 정확성을 유지하도록 하였다. 시스템을 이용하여 채점된 결과는 데이터베이스에 저장되고 문제별 합격 횟수와 불합격 횟수를 구하고 산술적인 합격률을 보여준다. 사용자의 채점 결과는 실시간으로 확인 가능하고 해당 문제의 사용자별 응시 횟수, 점수, 채점 결과를 검색할 수 있도록 데이터베이스에 저장하였다. 채점 결과를 바탕으로 관리자 조언을 추가하여 학습자들의 부족한 부분을 보충 학습할 수 있도록 하였다.

  • PDF

진료수행 시험에서 채점자 및 시험 일자에 따른 결과 차이 (Difference in Results according to Scorer and Test Date in Clinical Practice Test)

  • 권소희;김영전
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.345-352
    • /
    • 2018
  • 본 연구는 진료수행 시험 상황을 재연하여 실제 의사가 채점한 결과와 표준화 환자가 채점한 결과의 차이가 있는지, 첫째 날 응시한 학생과 정보가 노출된 둘째 날 응시한 학생의 점수 차이를 비교하고자 하였다. 의과대학 4학년 101명이 4가지 세트(본태성고혈압, 수면장애, 기분저하, 무월경)로 구성된 진료수행 시험에 응시하였다. 학생들은 첫째 날과 둘째 날 중 표준화환자 채점 세트와 의사 채점 세트로 구성된 평가 일정하나에 무작위로 배정되었다. 각 진료수행의 평가지침은 병력청취, 신체진찰, 환자교육, 환자의사관계, 진찰태도로 영역을 구분하여 구성하였다. 각 상황별, 영역별 성취점수를 표준점수로 변환하여 집단 간 차이를 비교하였다. 모든 영역에서 여학생의 성취점수가 남학생의 성취보다 유의하게 높았다(P=.001). 표준화 환자가 채점한 집단과 의사가 채점한 집단의 평균의 유의한 차이는 없었다(p=.425). 연속되는 시험일자 중 둘째 날 응시한 군이 병력청취와 신체진찰영역에서 유의한 차이를 보였다. 본 연구에서는 채점자의 신분에 따른 평가 결과에 차이가 없음을 다시 한 번 밝히면서 표준화 환자를 활용한 평가의 가능성을 확인하였다.