• 제목/요약/키워드: 언어적 오류

검색결과 380건 처리시간 0.023초

피봇 가중치 접근을 통한 한국어 패러프레이즈 추출 (Pivot Weighting Approach to Extract Korean Paraphrases)

  • 박에스더;이형규;김민정;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.31-36
    • /
    • 2010
  • 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇 언어로 하여 단어 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류 전파 문제가 큰 단점이 된다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우, 단어 정렬 오류가 더 많고 이로 인해 잘못된 피봇 프레이즈가 선정되는 문제가 더욱 심각하다. 이런 문제를 보완하기 위해, 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서, 올바른 피봇 프레이즈에 더 높은 가중치를 부여 하는 방법을 제안한다. 실험 결과, 기존의 패러프레이즈 추출 방법에 제안하는 피봇 가중치 부여 방법을 추가적으로 적용했을 때, 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다.

  • PDF

Dynamic palatogram을 이용한 기능적 구음장애의 언어치료에 대하여 - 측음화된/ㅅ/의 개선을 중심으로 -

  • 박혜숙;최홍식;김광문;신미성이
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1993년도 제1회 학술대회 연제순서 및 초록집
    • /
    • pp.12-12
    • /
    • 1993
  • 발음검사 결과 /i/에 선행되는 /ㅅ/은 정상발음을 보였으나 그 이외의 모음에 선행되는 /ㅅ/은 모두 측음화 /ㅅ/로 규척적인 오류발음을 하고 있는 증례에 대한 발음교정에서 청각자극에 의한 feedback 및 촉ㆍ시지각을 중심으로하는 전래적 발음지도 방법으로는 개선의 효과를 볼 수 없었으므로 전기적 인공구개(D.P)를 이용한 혀운동의 시각적 feedback을 중심으로한 발음지도를 시도한 즉 측음화 /ㅅ/음의 소실이 인정되고 정상구음 /ㅅ/의 출현을 보였다. (중략)

  • PDF

정상 노인과 알츠하이머성 치매 환자의 자발화 산출에서의 언어적 특징 (Linguistic Features of Spontaneous Speech Production in Normal Aging, Alzheimer's Disease)

  • 김정완
    • 한국노년학
    • /
    • 제32권3호
    • /
    • pp.747-758
    • /
    • 2012
  • 본 연구는 임상 현장에서 정상 노인과 변별되는 알츠하이머성 치매 환자의 자발화 과제에서의 수행력을 알아보기 위해 실시되었다. 연구방법은 65세 이상의 정상노인 13명과 알츠하이머성 치매 환자 26명(치매 의심(questionable) 9명, 경도(mild) 치매 9명, 중도(moderate) 치매 8명)을 대상으로 대화하기 및 연속그림 설명하기 과제를 실시하였고, 전체 발화 템포, 주저시간(초단위), 조음 음운 오류, 그리고 문법적 오류를 포함한 네 가지 구어적 요소에 대해 분석, 비교하였다. 연구결과, 네 가지 요소 모두에서 집단 간 차이를 보였다. 특히, 전체 발화 템포는 정상노인과 세 치매 환자군 각각에서 유의한 차이를 보였는데, 주저시간은 중도 치매에서만, 그리고 조음 음운 오류는 경도, 중도 치매군에서만 증가되었다. 문법적 오류는 정상노인과 비교하여 치매의심군과 중도 치매군에서 유의하게 증가되었다. 상기 연구 결과를 통해, 다음과 같은 결론을 제시할 수 있다. 첫째, 정상노인과 세 치매 환자군을 가장 변별력있게 구분할 수 있는 구어적 요소는 전체 발화 템포이다. 둘째, 조음 음운능력은 치매의심군에서는 감소하지 않지만, 경도 및 중도치매군에서는 그 수행력이 떨어진다. 셋째, 문법적 오류는 중도 치매환자군에서부터 확연히 증가한다. 향후, 자발화 과제를 통해 의료기관 외의 장소에서도 치매 선별의 용이성을 더할 수 있으며, 담화 차원의 언어능력에 대한 관찰이 가능하므로 다양한 원인질환을 가진 치매 환자들의 정보를 얻을 수 있을 것으로 기대된다.

한국어 문법 검사기의 기능 확장을 위한 서술어와 논항의 통사.의미적 관계 분석 (Analysis of Predicate/Arguments Syntactico-Semantic Relation for the Extension of a Korean Grammar Checker)

  • 남현숙;손훈석;최성필;박용욱;소길자;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.403-408
    • /
    • 1997
  • 언어의 내적 특성을 반영하는 의미 문체의 검사 및 교정은 언어의 형태적인 면과 관련있는 단순한 철자 검사 및 교정에 비해 더 난해하고 복잡한 양상을 띤다. 본 논문이 제안하는 의미 정보를 이용한 명사 분류 방법은 의미와 문체 오류의 포착과 수정 기능을 향상시키기 위한 방법의 하나이다. 이 논문은 문맥상 용법이 어긋나는 서술어를 교정하기 위해 명사 의미 분류방법을 서술어/논항의 통사 의미적 관계 분석에 이용하여 의미 규칙을 세우는 과정을 서술한다. 여기서 논항인 명사의 의미 정보를 체계적으로 분류하기 위해 시소러스 기법과 의미망을 응용한다. 서술어와 논항 사이의 통사 의미적 관계에 따라 의미 문체 오류를 검사하고 교정함으로써 규칙들을 일반화하여 구축하게 하고 이미 존재하고 있는 규칙을 단순화함으로써 한국어 문법 검사기의 기능을 보완한다.

  • PDF

탈북학생들을 위한 수학 보충학습에서 담론 속에 나타난 오류유형과 담론의 특성 (The Characteristics of Mathematical Errors & Discourse in a Supplementary Class for the Migrant Students from North Korea)

  • 고상숙
    • 한국학교수학회논문집
    • /
    • 제15권1호
    • /
    • pp.53-80
    • /
    • 2012
  • 본 연구는 연립방정식과 연립부등식에서 탈북학생들이 나타내는 오류의 유형과 수학적 담론의 특성을 파악하여 학습의 향상을 꾀하고자 시도되었다. 이 때 담론중심의 학습은 학생들을 수학적 언어의 공동체로 이끌어내는 수단이 되어 자신감을 극복할 수 있게 돕는다. 이를 위해 다양한 배경을 지닌 5명의 탈북학생을 대상으로 2011년 1학기 서울에 위치한 모OO 대안학교에서 보충수업일환으로 8차시 연구가 수행되었다. 학습과정은 녹음되어 전사되었고, 학생의 학습지, 연구자의 관찰지가 수집되었다. 연구결과로는 탈북학생들은 기술적 오류, 기록오류, 잘못 이해된 기호, 잘못 해석된 언어, 한자어 해석오류를 보였고, 담론은 제 0수준으로부터 서서히 상위수준으로 향상은 보였으나 최상의 수준인 제 2수준~3수준은 단편적으로만 나타났다. 그러나 담론의 요소인 설명하기와 정당화하기가 활성화되면서 상호작용의 ERE 패턴에서 Ev(평가)와 Eb(정교화)가 증가하는 긍정적인 양상을 보였다.

  • PDF

통계적 결정 그래프 학습 방법을 이용한 한국어 품사 부착 오류 수정 (Korean Part-of-Speech Tagging Error Correction Method Based on Statistical Decision Graph Learning)

  • 류원호;이상주;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.123-129
    • /
    • 2001
  • 지금까지 한국어 품사 부착을 위해 다양한 모델이 제안되었고 95% 이상의 높은 정확도를 보여주고 있다. 그러나 4-5%의 오류는 실제 응용 분야에서 많은 문제를 야기시킬 수 있다. 이러한 오류를 최소화하기 위해서는 오류를 분석하고 이를 수정할 수 있는 규칙들을 학습하여 재사용하는 방범이 효과적이다. 오류 수정 규칙을 학습하기 위한 기존의 방법들은 수동학습 방법과 자동 학습 방법으로 나눌 수 있다 수동 학습 방법은 많은 비용이 요구되는 단점이 있다. 자동 학습 방법의 경우 모두 변형규칙 기반 접근 방법을 사용하였는데 어휘 정보를 고려할 경우 탐색 공간과 규칙 적용 시간이 매우 크다는 단점이 있다. 따라서 본 논문에서는 초기 모델에 대한 오류 수정 규칙을 효율적으로 학습하기 위한 새로운 방법으로 결정 트리 학습 방법을 확장한 통계적 결정 그래프 학습 방법을 제안한다. 제안된 방법으로 두 가지 실험을 수행하였다. 초기 모델의 정확도가 높고 말뭉치의 크기가 작은 첫 번째 실험의 경우 초기 모델의 정확도 95.48%를 97.37%까지 향상시킬 수 있었다. 초기 모델의 정확도가 낮고 말뭉치 크기가 큰 두 번째 실험의 경우 초기 모델의 정확도 87.22%를 95.59%로 향상시켰다. 또한 실험을 통해 결정 트리 학습 방법에 비해 통계적 결정 그래프 학습 방법이 더욱 효과적임을 알 수 있었다.

  • PDF

웹에 기반한 국어 작문 학습시스템 구현 (Web-Based Intelligent Learning System for Korean Language)

  • 남현숙;권현주;김수남;유승훈;신민규;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.413-417
    • /
    • 1999
  • 최근 인터넷을 통한 언어 교육 연구에 관심이 고조되면서 다양한 언어 학습 홈페이지가 등장하였다. 이 논문은 국어 작문 학습을 목표로 본 연구실에서 개발한 '바른 우리글 쓰기' 학습시스템에 대해 다룬다. 본 학습 시스템은 초보자에서 전문가에 이르는 학습자를 대상으로 우리말로 글을 쓸 때 필요한 우리말 지식을 체계적으로 학습하도록 하거나 학습자가 직접 쓴 문장에서 스스로 오류를 찾아 분석하고 그에 따른 설명 및 글쓰기 규칙을 더 상세하게 알 수 있도록 설계하였다. 학습시스템의 내부 구조를 효율적으로 구성하기 위해 우리말 글과 관련 있는 자료를 수집하여 각각 지식베이스화하고, 학습 내용을 서로 체계적으로 연결하기 위해 우리나라 사람이 자주 틀리는 오류를 중심으로 해당 글쓰기 규칙과 참고 자료와 용례를 하이퍼텍스트화하였다. 이 시스템은 특히 학습 모형에 따라 학습 자료를 재구성할 수 있도록 지식베이스와 모형을 독립하였다. 이와 같이 학습 자료를 풍부하게 준비하고 학습 내용을 구성하는 일 만큼이나 중요한 과제는 학습자의 수준에 맞춰 학습 줄거리를 구성하는 작업이다. 이 시스템에서도 학습자의 특성을 살릴 수 있도록 연역적 학습 모형과 귀납적 학습 모형을 시도하였지만 더 세분화된 학습 줄거리 구성에 대한 연구가 있어야 한다. 따라서 학습자의 학습 동기를 유발할 수 있는 학습 내용과 적절한 기술이 조화를 이룬 홈페이지를 만드는 일이 향후 우리가 지향할 연구 과제이다.

  • PDF

한국어 음성인식 후처리기를 위한 학습 데이터 자동 생성 방안 (Automatic Generation of Training Data for Korean Speech Recognition Post-Processor)

  • 구선민;박찬준;문현석;서재형;어수경;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.465-469
    • /
    • 2022
  • 자동 음성 인식 (Automatic Speech Recognition) 기술이 발달함에 따라 자동 음성 인식 시스템의 성능을 높이기 위한 방법 중 하나로 자동 후처리기 연구(automatic post-processor)가 진행되어 왔다. 후처리기를 훈련시키기 위해서는 오류 유형이 포함되어 있는 병렬 말뭉치가 필요하다. 이를 만드는 간단한 방법 중 하나는 정답 문장에 오류를 삽입하여 오류 문장을 생성하여 pseudo 병렬 말뭉치를 만드는 것이다. 하지만 이는 실제적인 오류가 아닐 가능성이 존재한다. 이를 완화시키기 위하여 Back TranScription (BTS)을 이용하여 후처리기 모델 훈련을 위한 병렬 말뭉치를 생성하는 방법론이 존재한다. 그러나 해당 방법론으로 생성 할 경우 노이즈가 적을 수 있다는 관점이 존재하다. 이에 본 연구에서는 BTS 방법론과 인위적으로 노이즈 강도를 추가한 방법론 간의 성능을 비교한다. 이를 통해 BTS의 정량적 성능이 가장 높은 것을 확인했을 뿐만 아니라 정성적 분석을 통해 BTS 방법론을 활용하였을 때 실제 음성 인식 상황에서 발생할 수 있는 실제적인 오류를 더 많이 포함하여 병렬 말뭉치를 생성할 수 있음을 보여준다.

  • PDF

대수 문장제의 오류 유형과 문제 해결의 관련성 분석 (The Analysis of Relationship between Error Types of Word Problems and Problem Solving Process in Algebra)

  • 김진호;김경미;권혁진
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제23권3호
    • /
    • pp.599-624
    • /
    • 2009
  • 본 연구에서는 중학교 2학년 106명의 학생들을 대상으로 대수 문장제 해결에서 나타난 오류의 유형을 조사하고, 학생들의 오류 유형과 Polya의 문제 해결 단계의 관련성에 대하여 알아보았다. 연구 결과 대수 문장제 해결에서 학생들의 오류는 "잘못 해석된 언어"(39.7%), "왜곡된 정리나 정의"(38.2%), "기술적 오류"(11.8%), "검증되지 않은 답"(7.4%), "오용된 자료"(2.9%), "논리적으로 타당하지 않은 추론"(0%)의 6가지 오류로 분류하였다. 대수 문장제 해결에서 나타나는 학생들의 오류가 대수 문장제 해결과 어떤 관련성을 가지고 있는지 조사한 결과 학생들의 특정 오류 유형과 문제 해결 단계 사이에 긴밀한 관련성이 발견되었다. 오용된 자료의 오류를 범하는 학생들은 대부분 계획 실행 단계를 성공적으로 수행하지 못하였고, 잘못 해석된 언어, 왜곡된 정리나 정의의 오류를 범하는 학생들은 문제의 이해, 계획의 작성, 반성 단계를 성공적으로 수행하지 못하였다. 검증되지 않은 답의 오류를 범한 학생들은 계획의 작성과 반성의 단계를 성공적으로 수행하지 못하였으며, 기술적 오류를 범한 학생들은 특히 반성 단계를 성공적으로 수행하지 못하였다.

  • PDF

언어 지식과 통계 정보의 보완적 특성을 이용한 품사 태깅 (Part-of-Speech Tagging Using Complemental Characteristics of Linguistic Knowledge and Stochastic Information)

  • 임희석;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-108
    • /
    • 1997
  • 기존의 품사 태깅 방법에서 독립적으로 사용해온 언어 지식과 통계 정보는 품사 태깅의 정확도와 처리 범위의 향상을 위해서 상호 보완적인 특성을 갖는다. 이에 본 논문은 언어 지식과 통계 정보의 보완적 특성을 이용한 규칙 우선 직렬 품사 태깅 방법을 제안한다. 제안된 방법은 언어 지식에 의한 품사 태깅 결과를 선호함으로써 규칙 기반 품사 태깅의 정확도를 유지하며, 언어 지식에 의해서 모호성이 해소되지 않은 어절에 통계 정보에 의한 품사 태깅 결과를 할당함으로써 통계 기반 품사 태깅의 처리 범위를 유지한다. 또한, 수정 언어 지식에 의해 태깅 결과의 오류를 보정함으로써 품사 태깅의 정확도를 향상시킨다. 약 2만 어절 크기의 외부 평가 코퍼스에 대해 수행된 실험 결과, 규칙 우선 직렬 품사 태깅 시스템은 통계 정보만을 이용한 품사 태깅의 정확도보다 32.70% 향상된 95.43%의 정확도를 보였다.

  • PDF