• 제목/요약/키워드: Syntactic Features

검색결과 93건 처리시간 0.017초

한국어와 영어 두 언어를 동시에 습득하는 한국어린이의 한국어 후치부정어 습득에 대한 연구 (The Development of Postverbal Negation in Korean in a Korean-English Bilingual Child)

  • 김명숙
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.383-419
    • /
    • 2009
  • 본 연구의 목적은 첫째, 태어나면서부터 영어와 한국어를 동시에 습득하는 한 한국어린이(R)의 한국어 후치부정어 발달과정을 살펴보는 것이고, 둘째, 후치부정어의 발달과정과 실제 사용상의 발달적인 측면에서 한국어만 습득하는 어린이들과 비교하여 비슷한 발달 모습과 다른 모습을 분석하는 것이다. 세 번째는 R의 한국어 부정어 습득 과정뿐만 아니라 관찰되는 특별한 형태의 원인을 규명하고자 하는 것이다. 본 연구의 대상은 한국어와 영어를 동시에 습득하는 어린이이며, 연구방법은 종단연구를 사용하였으며, 한국어의 후치부정어 발달을 5세에서 7세 사이의 2년에 걸쳐 연구하였다. 전체적으로 R 의 후치부정어의 습득은 습득환경의 영향으로 속도에 차이가 있으며 한국어만 습득하는 어린이와 비슷한 발달모습을 보이지만 다른 발달모습도 나타내는 것으로 나타났다. 이 연구 결과는 R이 호주에 살고 있는 동안에는 모국어와 제2언어 학습메커니즘 두 기능 모두를 사용한다는 것을 보여 주고, 그 반면에 한국에 살고 있는 동안에는 모국어 학습메커니즘 만을 사용한다는 것을 보여 주고 있다. 이러한 결과는 모국어와 제2언어 학습메커니즘이 기본적으로는 서로 다르지 않다는 것을 보여 주고 있다. 왜냐하면 한 어린이가 서로 다른 두 언어 환경에 따라 발달 과정이 퇴보하였다 진보하였다 하는 특성을 보여 주기 때문이다.

  • PDF

감정 온톨로지의 구축을 위한 구성요소 분석 (Component Analysis for Constructing an Emotion Ontology)

  • 윤애선;권혁철
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.157-175
    • /
    • 2010
  • 의사소통에서 대화자 간 감정의 이해는 메시지의 내용만큼이나 중요하다. 비언어적 요소에 의해 감정에 관한 더 많은 정보가 전달되고 있기는 하지만, 텍스트에도 화자의 감정을 나타내는 언어적 표지가 다양하고 풍부하게 녹아들어 있다. 본 연구의 목적은 인간언어공학에 활용할 수 있는 감정 온톨로지를 구축할 수 있도록 그 구성요소를 분석하는 데 있다. 텍스트 기반 감정 처리 분야의 선행 연구가 감정을 분류하고, 각 감정의 서술적 어휘 목록을 작성하고, 이를 텍스트에서 검색함으로써, 추출된 감정의 정확도가 높지 않았다. 이에 비해, 본 연구에서 제안하는 감정 온톨로지는 다음과 같은 장점이 있다. 첫째, 감정 표현의 범주를 기술 대상과 방식에 따라 6개 범주로 분류하고, 이들 간 상호 대응관계를 설정함으로써, 멀티모달 환경에 적용할 수 있다. 둘째, 세분화된 감정을 분류할 수 있되, 감정 간 차별성을 가질 수 있도록 24개의 감정 명세를 선별하고, 더 섬세하게 감정을 분류할 수 있는 속성으로 강도와 극성을 설정하였다. 셋째, 텍스트에 나타난 감정 표현을 명시적으로 구분할 수 있도록, 경험자 기술 대상과 방식 언어적 자질에 관한 속성을 도입하였다. 넷째, 본 연구의 감정분류는 Plutchik의 분류와 호환성을 갖고 있으며, 언어적 요소의 기술에서 국제표준의 태그세트를 수용함으로써, 다국어 처리에 활용을 극대화할 수 있도록 고려했다.

  • PDF

도메인 적응 기술을 이용한 한국어 의미역 인식 (Korean Semantic Role Labeling Using Domain Adaptation Technique)

  • 임수종;배용진;김현기;나동렬
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.475-482
    • /
    • 2015
  • 높은 성능의 의미역 인식 시스템의 개발을 위해서는 대상 도메인에 대한 대량의 수동 태깅 학습 데이터가 필요하다. 그러나 충분한 크기의 의미역 인식용 학습 데이터는 오직 소수의 도메인에서만 존재한다. 소스 도메인의 시스템을 상대적으로 매우 작은 학습 데이터를 가진 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 15% 정도 성능 하락이 발생한다. 이러한 도메인 변경에서의 성능 하락 현상을 최소화하기 위해 본 논문에서는 2 가지 기법을 제시한다. 첫째, 도메인 적응 방법론의 하나인 Prior 모델에 기반하여 개발된 한국어 의미역 인식 시스템을 위한 도메인 적응 알고리즘을 제안한다. 둘째, 크기가 작은 타겟 도메인 데이터를 이용할 때 데이터 희귀 문제의 감소를 위해 소스 도메인 데이터 이용시 보다 단순화된 형태소 태그와 구문 태그 자질을 사용할 것을 제안한다. 뉴스 도메인에서 개발된 시스템의 위키피디아 도메인에의 적용과 관련하여 다른 연구의 도메인 적응 기술과 우리가 제안한 방법을 비교 실험하였다. 우리의 두 가지 방법을 같이 사용할 때 더 높은 성능을 달성하는 것을 관찰하였다. 우리 시스템은 F1-score 64.3% 성능으로서 기존의 다른 도메인 적응 기술들과 비교하여 2.4~3.1% 더 높은 성능을 가지는 것으로 관찰되었다.