• Title/Summary/Keyword: 평가 일치도

검색결과 2,349건 처리시간 0.039초

에세이 자동 평가 모델 성능 향상을 위한 데이터 증강과 전처리 (Data Augmentation and Preprocessing to Improve Automated Essay Scoring Model)

  • 고강희;김도국
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.327-332
    • /
    • 2023
  • 데이터의 품질과 다양성은 모델 성능에 지대한 영향을 끼친다. 본 연구에서는 Topic을 활용한 데이터 전처리와 BERT 기반 MLM, T5, Random Masking을 이용한 증강으로 데이터의 품질과 다양성을 높이고자 했으며, 이를 KoBERT 기반 에세이 자동 평가 모델에 적용했다. 데이터 전처리만 진행했을 때, Quadratic Weighted Kappa Score(QWK)를 기준으로 모델이 에세이의 모든 평가 항목에 대해 베이스라인보다 더욱 높은 일치도를 보였으며 평가항목별 일치도의 평균을 기준으로 0.5368029에서 0.5483064(+0.0115035)로 상승했다. 여기에 제안하는 증강 방식을 추가 할 경우 MLM, T5, Random Masking 모두 성능 향상 효과를 보였다. 특히, MLM 데이터 증강 방식을 추가로 적용하였을 때 최종적으로 0.5483064에서 0.55151645(+0.00321005)으로 상승해 가장 높은 일치도를 보였으며, 에세이 총점으로 QWK를 기준으로 성능을 평가하면 베이스라인 대비 0.4110809에서 0.4380132(+0.0269323)로의 성능 개선이 있었다.

  • PDF

전자기록의 진본 평가 시스템 모형 연구 (The Model of Appraisal Method on Authentic Records)

  • 김익한
    • 기록학연구
    • /
    • 제14호
    • /
    • pp.91-117
    • /
    • 2006
  • 전자기록은 평가 시 가치 평가와 진본 여부 평가를 함께 수행해야 한다. 그간 기록의 가치 평가에 대해서는 여러 논의가 진행되어 왔지만 진본 평가에 대해서는 그러하지 못했다. 이 글에서는 진본 평가가 기록관리 각 과정의 어느 국면에서 필요하고 그 구체적인 방법은 무엇인가를 밝히고 있다. 대체로 입수단계에서는, 생산기관에서의 재생산 직후의 일치 검증, 수신된 전자기록의 품질 및 일치 검증, 입수기록패키지와 보존기록패키지의 일치 검증이 필요하다. 저장단계에서는 매체수록된 보존기록패키지의 일치 검증, 저장된 전자기록의 손상여부 검사와 복구가, 각종 처리의 단계에서는 관리기준값 변경 처리 후의 적절성 평가, 기록철 분류구조 변경 후의 평가, 마이그레이션 이후의 일치평가 및 기타 주기적 무결성 평가, 배부기록의 일치 평가 등이 요구된다. 이러한 진본 평가를 위해서는 일치검증평가, 내용적 동일성 확인 평가, 메타데이터 요소의 적절성 평가, 불법적 변경여부의 확인 평가, 물리적 상태평가 등의 방법이 적용되어야 한다.

탐색경로 일치도 분석을 이용한 웹사이트 사용성 평가 (Web Usability Testing by Using Scanpath Similarity Analysis)

  • 김영준;김영진
    • 한국산학기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.793-803
    • /
    • 2013
  • 본 연구는 새로운 웹사용성 평가 방법의 하나로 탐색경로 일치도 분석의 유용성을 알아보기 위해 수행되었다. 사용한 웹사이트는 5개 공공기관이었으며, 15명의 피험자가 참여하였다. 우선, 참가자들에게 각 웹사이트를 3초간 보여주고 자유롭게 탐색하게 하면서 안구운동을 추적하였고 호감도를 측정하였다. 그 후 안구운동 추적 상태에서 참가자들에게 17개의 임무과제를 수행하도록 하였으며. 마지막 인터뷰에서는 웹사이트에 대한 만족도, 인지도, 과제 난이도 등에 응답하게 하였다. 여러 측정치들 간의 관련성을 분석하였으며, 분석 결과 본 연구에서 관심을 가졌던 탐색경로 일치도가 호감도 및 만족도와 의미 있는 관련성을 보였다. 즉 웹사이트에 대한 호감도가 높을수록 탐색경로 일치도가 높은 결과를 얻었다. 이 결과는 웹사이트에 대한 주관적 만족도 평가 방식을 대신해, 안구운동의 탐색경로 일치도와 같은 측정치가 객관적인 사용성 평가 지수가 될 수 있음을 보여주는 것이다. 안구운동 고정 및 응시시간 등과 함께 사용함으로써 웹사이트에서 보이는 관찰자의 행동을 보다 더 적절하게 추론할 수 있는 가능성을 논의하였다.

ATP bioluminescence Assay를 이용한 대학 급식시설의 위생상태 평가에 관한 연구 (Evaluation of Hygienic Status of University Foodservice Operation using ATP bioluminescence Assay)

  • 박영숙
    • 한국식품조리과학회지
    • /
    • 제16권2호
    • /
    • pp.195-201
    • /
    • 2000
  • 대학 급식 시설의 미생물적 위생상태를 평가하기 위해서 도마, 칼, 식판 그리고 행주에 대하여 ATP bioluminescence와 표준평판 균수를 측정 비교하여 분석, 평가한 결과는 다음과 같다. 1) 도마, 칼, 식판 그리고 행주에 대한 표준평판 균수의 허용기준으로 1 $\textrm{cm}^2$당 40을 기준으로 하고 ATP bioluminescence는 800 RLU을 허용기준으로 하여 만족 할만한 수준과 시정할 수준으로 구분하여 위생상태를 평가하였을 때 ATP bioluminescence 측정값과 표준평판 균수 측정값은 84.7%의 일치도를 보였다. 2) 사용 전 도마, 칼, 식판, 및 행주의 ATP bioluminescence 측정값과 표준평판 균수 측정값의 일치도는 91.7%, 사용 중 두 값의 일치도는 75%. 그리고 세척ㆍ소독 후의 두값의 일치도는 87.5%로 사용 전의 일치도가 가장 높았고 사용 중의 일치도가 가장 낮았다. 3) ATP bioluminescence 측정과 표준 평판 균수 측정으로 얻어진 결과에서 사용 전 도마, 칼, 식판, 및 행주의 87.5%가 허용기준 이하이고, 사용 중 도마, 칼, 식판, 및 행주의 29.2%만이 허용기준 이하이며, 세척ㆍ소독 후 도마, 칼, 식판, 및 행주의 42.7%가 허용기준 이하로 사용전의 위생상태가 가장 양호하며 사용 중인 경우 위생상태가 가장 불량하여 즉각적인 조치가 필요하다. 4) 사용 전 도마, 칼, 식판, 행주 4종류의 표준평판 균수가 허용기준 이하 검출된 대학 급식 시설은 3곳이며, 사용 중 4종류의 표준평판 균수가 허용기준 이하 검출된 곳은 없었고 세척ㆍ소독 후 4종류의 표준평판 균수가 허용기준 이하 검출된 곳도 없었다. 5) 도마, 칼, 식판, 및 행주의 용도별 분리사용은 거의 이루어지고 있지 않고 있다. 특히 칼과 도마는 교차오염의 가능성이 크므로 용도에 따라 구분하여 분리 사용이 필요하며 소독방법 및 횟수에서 행주의 소독이 가장 잘 이루어지고 있으며 도마의 소독이 가장 미흡하게 나타나고 있다. 사용 중 도마, 칼, 행주에 대한 즉각적인 조치와 분리 사용이 필요하며 칼, 도마, 행주에 대한 적절한 소독 방법이 강구되어야 한다고 사려된다. 결론적으로 ATP bioluminescence 측정값은 표준평판균수 측정값과 높은 일치도를 보여 급식 분야의 미생물 품질관리 평가에 ATP bioluminescence 측정의 이용 가능성이 높게 나타나고 있으며 실제로 HACCP system에 적용하기 위하여 보다 지속적인 연구가 필요하다고 사려된다.

  • PDF

교사 평정용 영아발달 평가도구 (The Development of Infants and Toddlers: A Rating Scale for Teachers)

  • 이영자;이종숙;신은수;곽향림;이정욱
    • 아동학회지
    • /
    • 제22권2호
    • /
    • pp.255-275
    • /
    • 2001
  • 본 연구의 목적은 영아프로그램을 수행하면서 실시할 수 있는 1, 2세 학급 영아를 위한 교사 평정용 발달평가도구를 개발하는 것이다. 이 평가도구는 영아프로그램의 일과를 중심으로 대소근육운동, 자조기술, 사회의사소통, 사회정서, 인지영역의 발달을 평가할 수 있도록 총 201문항으로 구성하였다. 전국적으로 어린이집에서 표집된 1245명의 1, 2세 학급 영아를 대상으로 평가문항의 양호도, 신뢰도 타당도를 검증하였다. 내용 타당도는 전문가 집단의 검토결과 타당하게 나타났으며, 신뢰도는 내적 일치도, 평정시간 일치도, 검사-재검사간 일치도가 높게 나타났다. Bayley와의 공인 타당도도 양호하였다. 구인 타당도 분석결과 영아의 발달은 영역별로 뚜렷이 구분되기보다는 통합적 특성이 있는 것으로 나타났다. 이 평가도구의 표준화를 위하여 전국 규준이 원점수와 표준점수로 제시되었다.

  • PDF

광고 창의성 평가에 대한 광고주, 광고 제작자, 소비자 간의 상호인식 연구: 상호지향성 모델의 확장 적용 (Mutual Perceptions among Clients, Agencies, and Consumers on the Evaluation of Ad Creativity: Extending Application of the Co-Orientation Model)

  • 김봉철;최명일;이진우
    • 광고학연구
    • /
    • 제25권1호
    • /
    • pp.179-201
    • /
    • 2014
  • 본 연구는 확장된 상호지향성 모델을 적용하여 광고 창의성 평가에 대한 광고주, 광고 제작자, 소비자 간의 상호인식을 살펴보고자 했다. 이를 위해 창의성이 있다고 평가된 광고물을 대상으로 광고 창의성 평가척도로 타당성이 확보된 독창성, 적합성, 명료성, 상관성에 대해 광고주, 광고 제작자, 소비자 간의 객관적 일치도와 주관적 일치도, 정확도 등을 살펴보았다. 분석결과를 살펴보면, 객관적 일치도의 경우 광고주와 제작자 사이에서 비교적 높게 나타나고, 제작자와 소비자 사이에서는 비교적 낮게 나타났다. 주관적 일치도는 광고주 차원에서는 비교적 높게 나타나고 있으나 제작자 차원에서는 비교적 낮게 나타났다. 정확도의 경우는 제작자 인식과 광고주가 생각하는 제작자 인식, 소비자 인식과 제작자가 생각하는 소비자 인식에서는 높게 나타났으나 광고주 인식과 제작자가 생각하는 광고주 인식에서는 낮게 나타났다. 이 연구결과를 바탕으로 광고주나 광고 제작자는 광고 창의성에 대한 소비자의 생각을 많이 고려할 필요가 있다.

2, 3세 유아의 사회 정서 문제 조기발견: ASQ:SE 선별 평가서의 표준화 연구 (Early Identification of 2- and 3-Year-Old Children for Social and Emotional Problems: A Preliminary Study of the Ages and Stages Questionnaires: Social-Emotional (ASQ:SE))

  • 허계형
    • 아동학회지
    • /
    • 제21권4호
    • /
    • pp.123-141
    • /
    • 2000
  • 본 연구 논문은 영 유아를 대상으로 한 사회 정서 문제의 선별 평가서인 Ages and Stages Questionnaire: Social-Emotional (ASQ:SE)의 표준화(신뢰도 및 타당도)연구이다. 특히, ASQ:SE 질문지 가운데에서도 24개월과 36개월용을 이용하여 ASQ:SE 의 내적 일치도 (internal consistency reliability), 재검사 신뢰도 (test-retest reliability), 절선 점수 (cutoff points), 공인 타당도 (concurrent validity)에 대해 연구하였다. 전체 447명의 부모가 참여한 가운데, 237명은 24개월용 질문지를 작성했고, 210명은 36개월용 질문지를 작성했다. 내적 일치도는 24개월 질문지에서 71, 36개월 질문지에서는 .73이었다. 재검사 신뢰도는 24 개월 질문지에서 100%, 36개월 질문지에서 97%이었다. 마지막으로 공인 타당도는 24개월과 36개월 설문지에서 95%이었다. 끝으로, 추후 다양한 대상으로 연구될 것이 추천되며 또한 이 연구에서 제외되어졌던 연령의 ASQ:SE 질문지의 내적 일치도, 신뢰도 및 타당도가 연구되어져야 할 것이다.

  • PDF

특정 범주에 대한 평가자간 카파 일치도의 퍼뮤테이션 p값 (Permutation p-values for specific-category kappa measure of agreement)

  • 엄용환
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.899-910
    • /
    • 2016
  • 근사검정은 종종 표본이 작은 순서척도의 범주를 갖는 분할표를 분석할 때 그 p값이 과대추정 되거나 과소추정 되기 때문에 적절하지 못한 것으로 여겨진다. 본 논문에서는 순서화된 범주를 갖는 $k{\times}k$ 분할표에서 특정 범주에 대한 가중 일치도에 대해 정확한 p값과 재표본 기법에 의해 p값을 구하는 퍼뮤테이션 방법을 제시한다. 이를 위해 두 명의 평가자가 특정의 범주에서 얼마나 일치된 평가를 하는 지를 측정하기 위해 $Kv{\dot{a}}lseth$가 제안한 특정 범주에 대한 가중 일치도 (weighted specific-category kappa)를 사용한다. 사례 데이터로서 $3{\times}3$ 분할표 형태의 실제 데이터와 가상데이터 그리고 $4{\times}4$ 분할표 형태의 가상데이터를 이용하며, 정확한 퍼뮤테이션 p값과 재표본 퍼뮤테이션 p값 그리고 근사검정의 p값을 계산하여 비교한다.

베타-이항 분포에서 Gibbs sampler를 이용한 평가 일치도의 사후 분포 추정 (Posterior density estimation of Kappa via Gibbs sampler in the beta-binomial model)

  • 엄종석;최일수;안윤기
    • 응용통계연구
    • /
    • 제7권2호
    • /
    • pp.9-19
    • /
    • 1994
  • 평가자간 평가 일치도(measure of agreement)를 나타내는 모수 $\kappa$와 양성 반응 비율 $\mu$를 지닌 베타-이항 분포 모형은 심리학 분야에서 많이 다루어지는 모형이다. 이 모형에서 $\kappa$에 대한 추정은 $\mu$가 0에 가까운 값을 가질 때 우도함수를 이용한 전통적 추론 방법의 적용이 어렵다. 본 논문에서는 이러한 문제를 Gibbs sampler를 이용한 Bayesian 분석 방법을 적용시켜 주변 사후 밀도 함수를 추정하였으며 이를 이용하여 Bayesian 추정값도 구하였다.

  • PDF

중지 중절골과 경추를 이용한 골령 평가의 체질량 지수에 따른 일치도 (Measuring Agreement of Modified MP3 and CVMS according to BMI Percentile)

  • 이석순;이대우;양연미;김재곤
    • 대한소아치과학회지
    • /
    • 제46권1호
    • /
    • pp.48-56
    • /
    • 2019
  • 이 연구의 목적은 골격 성숙도를 평가하기 위해 3번째 손가락의 중간 지골을 이용하는 방법과 경추를 이용하는 방법 사이의 체질량 지수 백분위 수에 따른 일치도를 조사하는 것이다. 후향의 차트 분석을 통하여 체질량 지수 자료, 수완부 방사선 사진, 측방 두부 방사선 사진이 같은 날에 채득된 경우를 조사 대상으로 하였다. 조사 대상은 체질량 지수 백분위 수에 따라 4개 군으로 나뉘었다. 2가지 방법 사이의 체질량 지수 백분위 수 군에 따른 일치도는 가중치 카파 통계량을 계산하여 측정되었다. 전체 군에 대해 2가지 방법 간에 좋은 일치도를 보였지만 성별 및 체질량 지수 백분위 수 군에 따라서 일치도가 달랐다. 남자는 과체중 군에서 가장 큰 일치도를 보였으나 여자의 경우 저체중에서 비만으로 감에 따라 일치도가 더 증가하는 경향을 보였다. 어린이와 청소년의 성장을 평가할 때 성별과 체중 상태가 골령을 분석하는 2가지 방법의 일치도에 영향을 줄 수 있기 때문에 소아치과 의사는 이를 고려해야 한다.