• 제목/요약/키워드: 분류오류

검색결과 648건 처리시간 0.03초

ERP로 확인된 한국어 문장 이해과정에서의 통사 및 의미 처리특성 연구 (Syntactic and Semantic Integration Processes during Korean Sentence Comprehension: using ERPs as an neurophysiological index)

  • 김충명;이경민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.259-263
    • /
    • 2004
  • 본 연구는 머리어-후행언어(head-final language)로 분류되는 한국어의 통사 및 의미 처리 과정의 언어간(cross linguistic) 일반성과 언어내(intra-language) 특이성을 ERP(event- related potentials) 실험결과를 통해 알아보고자 하였다. 한국어 문장처리 과정에서의 통사 및 의미 처리특성은, 우선 이들을 지표하는 각각의 오류문을 통해 P600과 N400 이라는 언어일반의 처리과정을 보이면서도 각 성분의 영역분포는 오류가 출현된 위치에 따라 분기하고 있음을 관찰할 수 있었다. 곧, 문미위치의 술어오류에서 중심-두정 부위의 활성화 우세로 각 오류간 영역분화를 보이는 패턴을 새롭게 확인하였다. 이로써 오류의 유형별 재분류과정으로 드러난 오류출현 위치가 오류의 유형 내에 영향을 끼치는 한 변수가 될 수 있으며. 이는 이들 보어 및 술어를 구성하는 고유의 범주 특성으로 해석할 수 있는 근거가 될 수 있음도 아울러 확인하였다.

  • PDF

한글 문서에서 형태적 중의 오류의 교정 (A method for morphological correction of ambiguous error)

  • 김민주;정준호;이현주;최재혁;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF

선박의 종류별 선원의 행동오류 추정과 예측에 관한 기초 연구

  • 임정빈;이춘기;정재용;박득진;강유미;박초희
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2018년도 추계학술대회
    • /
    • pp.19-21
    • /
    • 2018
  • 선원의 행동오류는 해양사고를 야기하는 하나의 직접적인 원인이기 때문에 이를 이해하는 것은 해양사고 예방에 근본이 된다. 선원의 행동오류를 이해하기 위해서는 행동오류를 추정하고 예측할 수 있어야 한다. 본 연구에서는 은닉 마르코브 모델(Hidden Markov Model, HMM)을 이용하여 선원들의 행동오류를 추정하고 예측하였다. 아울러 5가지 선박의 종류 각각에 나타나는 선원들의 행동오류를 서로 비교 분석하였다. 모델에 사용한 데이터는 해양안전심판원의 해양사고 보고서에 기록된 내용을 SRKBB(Skill-, Rule- and Knowledge-Based Behavior) 모델을 기반으로 분류하고 관측 수열을 생성하며 라벨링 작업을 통해서 구축하였다. 구축한 데이터를 적용하여 HMM을 보정하고 파라미터를 획득하여 선원들의 행동오류에 관한 모델을 구축하였다. 실험 결과, 선박 종류별로 선원들의 행동오류의 패턴은 서로 다르고, 이를 통해서 선박종류별 해기사들의 행동오류의 추정과 예측이 가능함을 일차적으로 확인할 수 있었다. 추후 본 연구를 지속 전개하여 해양사고 예방을 위한 인적오류의 저감에 기여할 수 있는 방안을 모색할 에정이다.

  • PDF

한국어 기계 번역에서의 품질 검증을 위한 치명적인 오류 범위 탐지 모델 (Critical Error Span Detection Model of Korean Machine Translation)

  • 정다현;이승윤;어수경;박찬준;이재욱;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.80-85
    • /
    • 2023
  • 기계 번역에서 품질 검증은 정답 문장 없이 기계 번역 시스템에서 생성된 번역의 품질을 자동으로 추정하는 것을 목표로 한다. 일반적으로 이 작업은 상용화된 기계 번역 시스템에서 후처리 모듈 역할을 하여 사용자에게 잠재적인 번역 오류를 경고한다. 품질 검증의 하위 작업인 치명적인 오류 탐지는 번역의 오류 중에서도 정치, 경제, 사회적으로 문제를 일으킬 수 있을 만큼 심각한 오류를 찾는 것을 목표로 한다. 본 논문은 치명적인 오류의 유무를 분류하는 것을 넘어 문장에서 치명적인 오류가 존재하는 부분을 제시하기 위한 새로운 데이터셋과 모델을 제안한다. 이 데이터셋은 거대 언어 모델을 활용하는 구축 방식을 채택하여 오류의 구체적인 범위를 표시한다. 또한, 우리는 우리의 데이터를 효과적으로 활용할 수 있는 다중 작업 학습 모델을 제시하여 오류 범위 탐지에서 뛰어난 성능을 입증한다. 추가적으로 언어 모델을 활용하여 번역 오류를 삽입하는 데이터 증강 방법을 통해 보다 향상된 성능을 제시한다. 우리의 연구는 기계 번역의 품질을 향상시키고 치명적인 오류를 줄이는 실질적인 해결책을 제공할 것이다.

  • PDF

연산 영역 가변 알고리즘을 적용한 MPEG-4 부호화 기반의 적응적 오류 은닉 기법 (Adaptive Error Concealment Technique using a Variable Operating Region Algorithm based on MPEG-4 Coding)

  • 김병주;권기구;이석환;권성근;김봉석;이건일
    • 한국멀티미디어학회논문지
    • /
    • 제6권1호
    • /
    • pp.78-88
    • /
    • 2003
  • 본 논문에서는 연산 영역 가변 알고리즘을 적용한 MPEG-4 부호화 기반의 적응적 오류 은닉 (error concealment) 기법을 제안하였다. 이 알고리즘에서는 손실 블록을 그의 주변 정보를 이용하여 이들을 평탄블록 (flat block) 및 에지 블록 (edge block)으로 분류한다. 즉, 손실된 블록의 주변 블록들에 대해서 블록 경계 영역의 인접 화소들의 차를 이용하여 평탄 블록을 분류하고, 평탄 블록으로 분류되지 않은 블록들에 대해서는 인접 화소의 차가 정해진 임계값을 넘어서는 개수에 따라 가변적인 연산 영역 (variable operating region, VOR)을 설정한 후, Sobel 연산자를 적용하여 우세 에지 방향 성분을 추정한다. 이렇게 분류된 각 블록에 대하여 적응적 오류 은닉을 수행한다. 평탄 블록에 대해서는 시각적 성능 향상을 위해 평균값을 기반으로 한 가중치에 따른 양선형 보간(mean based weighted bilinear interpolation, MWBLI) 방법을 적용하고, 에지 블록에 대해서는 8가지 방향에 대하여 경계 픽셀을 이용한 방향성 보간 (boundary directional interpolation, BDI) 방법을 적용하여 오류 은닉을 수행한다. 모의 실험 결과를 통하여 제안한 방법이 객관적 화질 및 주관적 화질 측면에서 기존의 방법보다 그 성능이 우수함을 확인하였다.

  • PDF

은닉 마코프 모델 확률 보정을 이용한 음성 인식 성능 향상 (Performance Improvement in Speech Recognition by Weighting HMM Likelihood)

  • 권태희;고한석
    • 한국음향학회지
    • /
    • 제22권2호
    • /
    • pp.145-152
    • /
    • 2003
  • 본 논문에서는 인식 단위로서의 개개의 은닉 마코프 모델 (HMM: Hidden Markvo Model)에 대응하는 가중치를 도입하여 HMM출력 스코어는 HMM출력 확률과 HMM 가중치의 곱으로 표현된다고 가정하고 기존의 최소 분류 오류 훈련 방법과 유사하게 HMM 가중치를 반복적으로 훈련하는 방법을 제안하였다. 제안된 방법은 오인식 척도에 대해 차분 (delta) 계수를 정의하고 이를 이용하여 HMM 가중치를 반복하여 훈련하는 방법이다. 이러한 방법은 HMM 가중치의 합을 HMM 개수의 총합으로 제한함으로써 기존의 파라미터 추정 방법과 비터비 (Viterbi) 알고리즘에 큰 변화 없이 음성 인식에 효과적으로 적용될 수 있다. 제안된 방법은 기존의 분할 (segmental) 최소 분류 오류훈련 방법과 비교하여 추정하는 파라미터의 개수가 감소되었으며 훈련 모델의 최적 상태열을 이용한 경도 계산 과정이 포함되지 않음으로써 계산량을 효과적으로 단축할 수 있다. HMM가중치를 이용한 HMM기반의 음성 인식기의 성능 평가를 위해서 단독 숫자음 인식 실험을 실시하였다. 실험적 결과들은 HMM 확률 보정을 이용한 음성 인식 시스템이 베이스라인 시스템보다 음성 인식 성능이 더 우수함을 보여준다. 제안된 방법은 기존의 최소 분류 오류 훈련 방법에 비하여 구현하기 간편한 반면에 더욱 우수한 음성 인식 성능 향상을 보여준다.

클래스 임베딩과 주의 집중 순환 신경망을 이용한 자주 묻는 질문의 자동 분류 (Automatic Classification of Frequently Asked Questions Using Class Embedding and Attentive Recurrent Neural Network)

  • 장영진;김학수;김세빈;강동호;장현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.367-370
    • /
    • 2018
  • 웹 또는 모바일 사용자는 고객 센터에 구축된 자주 묻는 질문을 이용하여 원하는 서비스를 제공받는다. 그러나 자주 묻는 질문은 사용자가 직접 핵심어를 입력하여 검색된 결과 중 필요한 정보를 찾아야 하는 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 사용자 질의를 입력 받아 질의에 해당하는 클래스를 분류해주는 문장 분류 모델을 제안한다. 제안모델은 웹이나 모바일 환경의 오타나 맞춤법 오류에 대한 강건함을 위해 자소 단위 합성곱 신경망을 사용한다. 그리고 기계 번역 이외에도 자연어 처리 부분에서 큰 성능 향상을 보여주는 주의 집중 방법과 클래스 임베딩을 이용한 문장 분류 시스템을 사용한다. 457개의 클래스 분류와 769개의 클래스 분류에 대한 실험 결과 Micro F1 점수 기준 81.32%, 61.11%의 성능을 보였다.

  • PDF

한글 인쇄체 문자의 형식 분류 및 비선형적 자소 분리에 관한 연구 (A Study on Korean Printed Character Type Classification And Nonlinear Grapheme Segmentation)

  • 박용민;김도현;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.784-787
    • /
    • 2006
  • 본 논문에서는 한글 인쇄체 문자의 자소를 비선형적으로 분리하는 방법을 제안한다. 자소 분리 대상 문자는 자소의 조합 방식에 따라 6개의 형식으로 분류한다. 인쇄체 한글의 6형식 분류를 위해 그레이 레벨의 문자 이미지로부터 망 특성과 수직 수평 투영 기법을 이용해 특징을 추출하고, 오류 역전파 기법을 이용하여 분류를 시도한다. 분류된 문자 형식을 기반으로 분리 후보 영역을 지정하고, 이 영역을 기반으로 다단식 그래프 탐색 알고리즘을 이용하여 최적의 비선형적 자소 분리 경로를 찾아낸다. 실험 결과, 제안한 방법은 한글의 6형식 분류에 적합하였으며, 자소가 서로 붙어 선형적으로 분리가 어려운 문자의 자소 분리에 좋은 성능을 나타내었다.

  • PDF

부분 AUC와 최적분류점들 (Partial AUC and optimal thresholds)

  • 홍종선;조현수
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.187-198
    • /
    • 2019
  • ROC와 CAP 곡선을 이용하여 다양한 정확도 측도를 바탕으로 최적분류점을 추정하는 많은 연구가 있다. 본 연구에서는 ROC와 CAP 곡선의 특정한 부분 면적을 나타내는 대안적인 통계량을 제안한다. 새롭게 정의된 부분 면적을 나타내는 통계량의 미분방정식을 이용하여 ROC와 CAP 함수와의 관계를 살펴보고, 다음으로는 ROC와 CAP 곡선에 대한 다양한 정확도 측도들의 조건에서의 최적분류점과의 관계를 유도한다. 혼합분포를 구성하는 두 종류의 분포함수를 다양한 정규분포로 가정하여 최적분류점을 설정하고, 다양한 정확도 측도들의 조건에서의 최적분류점에 대응하는 제1종과 제2종 오류의 크기를 탐색하고 토론한다.

백양꽃(Lycoris koreana Nakai)에 대한 분류학적 재검토 (New Taxonomic Treatment of Lycoris koreana Nakai)

  • 이종원;정경숙;강신호
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2019년도 추계학술대회
    • /
    • pp.21-21
    • /
    • 2019
  • 백양꽃(Lycoris koreana)이 속해 있는 상사화속(Lycoris)은 종간 잡종이 쉽게 일어나 많은 자연교잡종을 가지고 있어 식물의 종분화와 진화를 연구하는데 흥미로운 분류군이다. 그러나 이런 사유로 명백한 분류학적 차이가 있음에도 불구하고 대상종의 분류학적 위치의 설정에 문제가 발생되어 계급의 설정에 혼란을 가져오기도 한다. 특히 한국산 상사화속의 종 분류는 그동안 많은 형태학적, 분계학적, 화분학적, 세포학적, 분자생물학적 연구가 이루어져 있음에도 아직도 도감과 많은 문헌에서 오류와 오동정의 문제점을 가지고 있다. 특히 백양꽃에 대하여서는 Nakai에 의해 신종으로 설정된 이래 일본에 분포하는 동 속 식물과의 관계 분석의 오류로 계급의 설정에 현재까지 다양한 문제가 발생되고 있다. 백양꽃은 전라남도 백양산에 분포하고, 포가 자주색이고, 꽃의 크기가 작으며, 화사와 화주가 적색 또는 암적색인 특징으로 Nakai에 의해 신종으로 설정되었다. 이후 Nakai와 Lee는 L. koreana 가 한국에만 분포하는 것으로 보고 한국 특산종으로 취급하였다. 그러나 백양꽃의 실체에 대하여 많은 논의가 있었으나 Lee and Oh는 L. radiata로 동정하였고, Yang은 L. koreana는 한국에 분포하지 않고 L. sanguinea만이 분포하는 것으로 보고하였다. Koyama는 L. sanginea에 대하여 L. sanguinea와 L. kuishiana를 비교하여 수술이 화관 밖으로 돌출되어 있는 점 외에는 L. koreana와 차이가 없음을 들어 각각 L. sanguinea var. sanguinea, L. sanguinea var. kuishiana 그리고 L. sanguinea var. koreana로 재설정 하였고 이는 한국과 일본학자들에 의해서도 거의 받아들여지고 있으나 본 연구를 통하여 L. koreana의 종(species)으로의 계급 부여와 한국특산식물 설정의 타당한 결과를 도출하였다.

  • PDF