• 제목/요약/키워드: machine grading

검색결과 64건 처리시간 0.023초

준지도학습 방법을 이용한 한국어 서답형 문항 반자동 채점 (Semi-Automatic Scoring for Short Korean Free-Text Responses Using Semi-Supervised Learning)

  • 천민아;서형원;김재훈;노은희;성경희;임은영
    • 인지과학
    • /
    • 제26권2호
    • /
    • pp.147-165
    • /
    • 2015
  • 서답형 문항은 학생들의 종합적인 사고력을 평가할 수 있다는 장점이 있으나, 채점 비용이 많이 들고 채점자의 주관이 개입될 수 있다는 단점이 있다. 이런 단점을 개선하기 위해 영어권에서는 자동채점 시스템을 개발하여 사용하고 있으나, 한국어의 경우에는 아직 여전히 연구 단계에 있다. 본 논문에서는 준지도학습 방법을 이용한 한국어 서답형 문항의 채점 시스템을 제안한다. 제안된 시스템은 모범답안을 초기 모델로 학생답안의 일부를 채점하고 그 결과를 이용해서 점진적으로 학생답안의 채점을 늘려가는 준지도학습 방법을 이용한다. 제안된 시스템을 평가하기 위해서 2013학년도 학업성취도 평가의 국어 및 사회 과목의 서답형 문항을 사용했다. 채점 시간과 일관성에 관해서 매우 좋은 결과를 얻었다. 그 결과 채점 시간을 크게 단출할 수 있었으며 다양한 채점 방법을 적용하여 객관성을 확보한다면 현장에서 바로 적용할 수 있을 것으로 기대된다.

인터넷에서의 유해 이미지 컨텐츠 등급 분류 기법 (Classification Method of Harmful Image Content Rates in Internet)

  • 남택용;정치윤;한치문
    • 한국정보과학회논문지:정보통신
    • /
    • 제32권3호
    • /
    • pp.318-326
    • /
    • 2005
  • 본 논문은 인터넷 둥을 통해 유입되는 유해 이미지를 그 특징을 이용하여 무해, 선정, 유해(누드), 심한 유해(성인물)과 같은 이미지 컨텐츠의 등급으로 선별하기 위한 이미지 특징 추출 방법과 이미지분류 기술을 제시한 것이다. 이를 위해 본 논문에서는 입력 이미지에서 유해 정보임을 인식하기 위한 피부 영역 검출 기법을 제시한다. 또한, 노이즈를 줄이고 효과적으로 유해성 정도를 추출하기 위해 관심 영역을 설정하고 그 관심 영역 안에서만 특징을 정의하는 관심 영역 검출 알고리즘을 제안한다. 그리고 이미지를 4 종류의 등급으로 선별하기 위해 유해 이미지 분류 모델을 생성하는 다중 SVM 학습 기법과 생성된 분류 모델을 이용하여 입력 데이타의 유해 등급을 분류하는 다중 SVM 분류 기법을 제시한다. 특히 피부색 영역 이미지의 형태 정보와 피부색 비율 이미지의 색깔정보를 합하여 만든 피부색 가능성 분포 이미지를 제시하고, 이 피부색 가능성 분포 이미지를 축소하여 학습 과정에서 특징 분류를 위해 이용하는 이미지 특성 벡터를 제안한다. 마지막으로 본 논문에서 제안한 유해 이미지 등급 선별 기법을 적용한 실험 결과와 이미지의 유해 둥급 분류에 대한 판별 성능을 평가한다.

Detecting Peripheral Nerves in the Elbow using Three-Dimensional Diffusion-Weighted PSIF Sequences: a Feasibility Pilot Study

  • Na, Domin;Ryu, Jaeil;Hong, Suk-Joo;Hong, Sun Hwa;Yoon, Min A;Ahn, Kyung-Sik;Kang, Chang Ho;Kim, Baek Hyun
    • Investigative Magnetic Resonance Imaging
    • /
    • 제20권2호
    • /
    • pp.81-87
    • /
    • 2016
  • Purpose: To analyze the feasibility of three-dimensional (3D) diffusion-weighted (DW) PSIF (reversed FISP [fast imaging with steady-state free precession]) sequence in order to evaluate peripheral nerves in the elbow. Materials and Methods: Ten normal, asymptomatic volunteers were enrolled (6 men, 4 women, mean age 27.9 years). The following sequences of magnetic resonance images (MRI) of the elbow were obtained using a 3.0-T machine: 3D DW PSIF, 3D T2 SPACE (sampling perfection with application optimized contrasts using different flip angle evolution) with SPAIR (spectral adiabatic inversion recovery) and 2D T2 TSE (turbo spin echo) with modified Dixon (m-Dixon) sequence. Two observers used a 5-point grading system to analyze the image quality of the ulnar, median, and radial nerves. The signal-to-noise ratio (SNR) and contrast-to-noise ratio (CNR) of each nerve were measured. We compared 3D DW PSIF images with other sequences using the Wilcoxon-signed rank test and Friedman test. Inter-observer agreement was measured using intraclass correlation coefficient (ICC) analysis. Results: The mean 5-point scores of radial, median, and ulnar nerves in 3D DW PSIF (3.9/4.2/4.5, respectively) were higher than those in 3D T2 SPACE SPAIR (1.9/2.8/2.8) and 2D T2 TSE m-Dixon (1.7/2.8/2.9) sequences (P < 0.05). The mean SNR in 3D DW PSIF was lower than 3D T2 SPACE SPAIR, but there was no difference between 3D DW PSIF and 2D T2 TSE m-Dixon in all of the three nerves. The mean CNR in 3D DW PSIF was lower than 3D T2 SPACE SPAIR and 2D T2 TSE m-Dixon in the median and ulnar nerves, but no difference among the three sequences in the radial nerve. Conclusion: The three-dimensional DW PSIF sequence may be feasible to evaluate the peripheral nerves around the elbow in MR imaging. However, further optimization of the image quality (SNR, CNR) is required.

한국어 학습 모델별 한국어 쓰기 답안지 점수 구간 예측 성능 비교 (Comparison of Korean Classification Models' Korean Essay Score Range Prediction Performance)

  • 조희련;임현열;이유미;차준우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.133-140
    • /
    • 2022
  • 우리는 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 문제에서 세 개의 딥러닝 기반 한국어 언어모델의 예측 성능을 조사한다. 이를 위해 총 304편의 답안지로 구성된 실험 데이터 세트를 구축하였는데, 답안지의 주제는 직업 선택의 기준('직업'), 행복한 삶의 조건('행복'), 돈과 행복('경제'), 성공의 정의('성공')로 다양하다. 이들 답안지는 네 개의 점수 구간으로 구분되어 평어 레이블(A, B, C, D)이 매겨졌고, 총 11건의 점수 구간 예측 실험이 시행되었다. 구체적으로는 5개의 '직업' 답안지 점수 구간(평어) 예측 실험, 5개의 '행복' 답안지 점수 구간 예측 실험, 1개의 혼합 답안지 점수 구간 예측 실험이 시행되었다. 이들 실험에서 세 개의 딥러닝 기반 한국어 언어모델(KoBERT, KcBERT, KR-BERT)이 다양한 훈련 데이터로 미세조정되었다. 또 두 개의 전통적인 확률적 기계학습 분류기(나이브 베이즈와 로지스틱 회귀)도 그 성능이 분석되었다. 실험 결과 딥러닝 기반 한국어 언어모델이 전통적인 기계학습 분류기보다 우수한 성능을 보였으며, 특히 KR-BERT는 전반적인 평균 예측 정확도가 55.83%로 가장 우수한 성능을 보였다. 그 다음은 KcBERT(55.77%)였고 KoBERT(54.91%)가 뒤를 이었다. 나이브 베이즈와 로지스틱 회귀 분류기의 성능은 각각 52.52%와 50.28%였다. 학습된 분류기 모두 훈련 데이터의 부족과 데이터 분포의 불균형 때문에 예측 성능이 별로 높지 않았고, 분류기의 어휘가 글쓰기 답안지의 오류를 제대로 포착하지 못하는 한계가 있었다. 이 두 가지 한계를 극복하면 분류기의 성능이 향상될 것으로 보인다.