• Title/Summary/Keyword: 어휘정보

Search Result 1,062, Processing Time 0.025 seconds

A Korean Grammar Chacker Founded on Expanded Lexical Disambiguation Rule and Partial Parsing (확장한 어휘적 중의성 제거 규칙에 따른 부분 문장 분석에 기반한 한국어 문법 검사기)

  • Park, Su-Ho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.516-522
    • /
    • 2001
  • 본 논문에서는 한국어 형태소 분석기가 처리할 수 없는 어휘적 중의성 해결을 위한 방법으로 부분 문장 분석 기법을 연구한다. 부분 문장 분석 기법의 신뢰도를 높이기 위해서 말뭉치를 이용한 데이터를 통해 학습한 경험적 규칙을 이용한다. 학습한 경험적 규칙을 오류 유형에 따라 확장하고 전문화하여 축적된 연구결과를 지식 베이스로 삼아 한국어 맞춤법 및 문법 검사기에서 사용하는 부분 문장 분석기의 성능을 향상시킨다. 본 논문에서 사용한 확장하고 전문화한 지식 베이스는 말뭉치에서 얻은 경험적 규칙을 기반으로 한다. 이 경험적 규칙은 언어적 지식을 기반으로 한다.

  • PDF

Lexical Access in Processing Korean Noun Eojeols (한국어 명사 어절 처리에서의 어휘 근접 과정)

  • Min, Sung-Ki;Yi, Kwang-Oh
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.57-62
    • /
    • 2005
  • 한국어 명사 어절의 시간 경과에 따른 처리 양상을 확인해 보기 위하여 점화어절판단과제(primed eojeol decision task)를 이용한 실험을 실시하였다. 점화어 제시 방식은 차폐점화, SOA 100ms, SOA 300ms 조건으로 하였으며, 점화어-표적어의 관계는 어절일치, 어간일치, 통제조건으로 조작하였다. 그 결과 어절일치조건과 어간일치조건에서 촉진효과가 있었으며, SOA가 증가함에 따라 어절일치조건과 어간일치조건에서의 촉진효과도 함께 증가하는 양상을 확인하였다. 점화어의 제시 방식과 점화어-표적어의 관계간의 상호작용도 유의미하였다. 이러한 결과를 바탕으로 심성어휘집에서의 어절 표상의 실재성과 어절 속성과 어간 속성이 어절 처리 과정에 관여하는 방식에 관하여 논의하였다.

  • PDF

A Study of different Combination of contemporary Korean Idiomatic Phrase (현대 국어 관용구의 결합 관계 고찰)

  • Lee, Hee-Ja
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.333-352
    • /
    • 1994
  • 이 글은 그 동안 '숙어' 또는 '관용어'라는 이름 하에 별 다른 구별 없이 일괄적으로 다루어져 왔던 현대 국어 관용구를 그의 형태적 통사적 의미론적 결합 관계의 특성에 따라 재분류하여 그들의 특성과 하위 분류 등을 밝혀 보았다. 즉, 관용구를 그 내적구조의 특성, 구성요소들 사이의 의미상의 관련성의 긴밀도, 어휘와의 정도에 따라, 어휘화된 정도가 가장 높고 긴밀도에 있어서도 가장 높고 내적구성에 있어서도 여러 가지 특성을 보이는 것을 '숙어'라 하고, 그 이외의 것을 '연어'라 했다. '연어'가 생겨난 요인에 따라 '형태적 연어'와 '통사적 연어', '의미적 연어'로 나누었다. 이러한 분류는 국어 관용구의 특성을 밝혀 줄 수 있을 뿐만 아니라, 이에 더 나아가 각 관용구의 특성에 따른 올바른 기술을 통해 국어의 특수한 어휘 결합에 대한 보다 나은 이해를 꾀할 수 있다고 본다.

  • PDF

Lexical Analysis of Dictionary Definitions for Constructing Semantic Networks (명사류 의미망 구축을 위한 사전 뜻풀이의 어휘구조분석)

  • Han, Young-Gyun
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.326-332
    • /
    • 1994
  • 본 연구에서는 중사전 규모의 현대국어사전에서 약 5,000 개의 표제항목의 뜻풀이 8,000여 항에 사용된 어휘를 분석한 결과를 제시하였다. 분석 결과 명사류의 의미구조에서 최상위계층에 속하는 것들이 사전의 뜻풀이에 자주 사용됨을 확인할 수 있었고, 아울러 뜻풀이에 사용되는 단어들이 어느 정도 통제된 상태임을 알 수 있었다. 그러나 표제항목과 뜻풀이에 사용된 단어들 사이의 관계만을 바탕으로 해서는 의미망을 구축하기 어려웠는데, 그것은 국어사전에서의 뜻풀이가 지니고 있는 구조적 문제에서 기인하는 것이다. 즉 일부 한자어의 경우에는 명사로 정의되지 않으며, 그 결과 표제명사와 뜻풀이에 사용된 명사 사이의 관계를 바탕으로 한 의미망의 구축에 포함되지 않는 것이다. 또한 순환적 뜻풀이의 경우 역시 의미망 구축에 장애요소로 작용함을 밝혔다.

  • PDF

Comparative Analysis of Statistical Language Modeling for Korean using K-SLM Toolkits (K-SLM Toolkit을 이용한 한국어의 통계적 언어 모델링 비교)

  • Lee, Jin-Seok;Park, Jay-Duke;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.426-432
    • /
    • 1999
  • 통계적 언어 모델은 자연어 처리의 다양한 분야에서 시스템의 정확도를 높이고 수행 시간을 줄여줄 수 있는 중요한 지식원이므로 언어 모델의 성능은 자연어 처리 시스템, 특히 음성 인식 시스템의 성능에 직접적인 영향을 준다. 본 논문에서는 한국어를 위한 통계적 언어 모델을 구축하기 위한 다양한 언어 모델 실험을 제시하고 각 언어 모델들 간의 성능 비교를 통하여 통계적 언어 모델의 표준을 제시한다. 또한 형태소 및 어절 단위의 고 빈도 어휘만을 범용 언어 모델에 적용할 때의 적용률을 통하여 언어 모델 구축시 어휘 사전 크기 결정을 위한 기초적 자료를 제시한다. 본 연구는 음성 인식용 통계적 언어 모델의 성능을 판단하는 데 앞으로 큰 도움을 줄 수 있을 것이다.

  • PDF

A Study of the Automatic Extraction of Hypernyms and Hyponyms from the Corpus (코퍼스를 이용한 상하위어 추출 연구)

  • Pang, Chan-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.46-53
    • /
    • 2007
  • 본 연구는 코퍼스 내 어휘들의 상하위 관계를 중심으로 패턴들을 추출하는 방법을 제안한다. 한국어 어순의 자유로움으로 인한 제약으로 주로 사전 뜻풀이말을 중심으로 하였던 패턴 추출 방식에서 벗어나 본 연구는 코퍼스를 이용하여 다양한 패턴들을 제시하고자 하였다. 연구 방법으로는 세종전자 사전을 이용하여 상하위어 쌍들의 목록을 선정한 후 코어넷으로 상하위어 목록을 추가한다. 그리고 이 두 상하위어 목록의 어휘 쌍들을 포함하는 문장들을 코퍼스에서 추출한 후 체계적으로 패턴화 할 수 있는 문장들을 추출하여 21가지 패턴으로 일반화하였다. 21가지 패턴들을 정규식으로 표현한 뒤 각각 동일한 패턴들을 가진 문장들을 코퍼스에서 다시 추출한 결과 57%의 정확률이 측정되었다.

  • PDF

Construction of Korean WordNet (한국어 워드넷의 구축)

  • Lim, Sung-Shin;Lee, Eun-Ryoung;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

Programming with Korean Vocabulary by Using P Language (P 언어를 이용한 한글 프로그래밍)

  • Choi, Sea-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.90-95
    • /
    • 2013
  • 본 논문에서는 모국어를 이용한 프로그래밍을 위한 지원 방법으로서, 모국어로 된 데이터의 표현, 변수의 모국어 표현, 문법 키워드의 모국어 표현, 모국어 병행표현 등에 대하여 알아본다. 그리고 임의의 다국어를 지원하도록 설계된 P 언어를 이용하여 한글 프로그래밍을 하는 방법을 알아본다. 구체적으로 한글 프로그래밍 환경을 구축하는 방법, 한글 프로그램을 위한 어휘의 선정에 대하여 알아보고, 이를 이용한 간단한 알고리즘의 구현과 art 모듈을 이용하여 그래픽 프로그래밍의 예를 들어보겠다. 그리고 한글 프로그래밍을 위해 P 언어를 사용한 경우의 장점과 단점에 대하여 알아보겠다. 끝으로 한글 프로그래밍의 발전을 위해서는 표준 한글어휘 선정을 위해 학계와 산업계의 통일된 노력이 필요하다는 점과 한글 프로그래밍이 가져다 줄 수 있는 영향과 한글 프로그래밍의 바른 사용 방법으로서 영문과 한글의 병용사용을 제안한다.

  • PDF

Automatic WordNet mapping using word sense disambiguation (의미 애매성 해소를 이용한 WordNet 자동 매핑)

  • Lee, Chang-Ki;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.262-268
    • /
    • 2000
  • 본 논문에서는 어휘 의미 애매성 해소와 영어 대역어 사전 그리고 외국언어에 존재하는 개념체계를 이용하여 한국어 개념체계를 자동으로 구축하는 방법을 기술한다. 본 논문에서 사용하는 방법은 기존의 개념체계 구축 방법들에 비해 적은 노력과 시간을 필요로 한다. 또한 상기한 자동 구축 방법에서 사용하는 어휘 의미 애매성 해소를 위한 6가지 feature도 함께 설명한다.

  • PDF

Abductive Reasoning based Question Answering System for Yes/No Quiz (가추적 추론에 기반한 가부형(O/X 퀴즈) 질의응답 시스템)

  • Heo, Jeong;Lee, Hyung-Jik;Bae, Yong-Jin;Kim, Hyun-Ki;Ock, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.46-49
    • /
    • 2015
  • 본 논문에서는 가추적 추론에 기만한 질의응답 기술을 활용하여 O/X 퀴즈 질문에 대한 질의응답을 수행하는 기술에 대해서 소개한다. O/X 퀴즈를 기존의 질의응답 기술에 적용하기 위해서는 O/X 퀴즈 문장을 단답형 질문으로 재생성해야 한다. 질문재생성에서는 단답형 질문으로 변환하기 위해 특정 어휘(또는 개체나 구)를 <지시대명사>나 <지시관형사+명사>로 대체한다. 이때 대체된 어휘는 정답후보로 인식된다. 단답형질문과 정답후보의 쌍으로 구성된 정답가설은 근거검색과 유사도에 기반한 신뢰도 값 계산을 통해, O/X를 결정하게 된다. 실험을 통해, 신뢰도 임계값이 0.45일 때 정확률이 69.17%를 보였다.

  • PDF