• Title/Summary/Keyword: 어휘정보

Search Result 1,062, Processing Time 0.029 seconds

Text Categorization Using Both Lexical Information and Syntactic Information (어휘정보와 통사정보를 모두 이용한 문서분류)

  • 박성배;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.37-39
    • /
    • 2001
  • 현재 이용가능한 대부분의 자동문서분류 시스템의 가장 큰 문제는 문서에 포함된 단어 사이의 통사 정보는 무시한 채, 각 단어의 분포만 고려한다는 점이다. 하지만, 통사 정보도 문서 분류를 위해 매우 중요한 정보 중의 하나이다. 본 논문에서는 문서에 나타난 어휘 정보와 함께 통사 정보를 함께 고려하는 자동문서분류 방법을 제시한다. Reuters-21578 말뭉치에 대한 문서분류 실험결과 제시된 방법은 어휘정보만 사용하는 방법과 통사정보만 사용하는 방법 모두보다 높은 성능을 보인다 이 말뭉치에 대해서, 어휘정보만으로 학습된 Support Vector Machine으로 약 77%의 매우 높은 정확도를 얻을 수 있음에도 약 0.63%의 추가적인 성능 향상이 있었다.

  • PDF

Accurate Unlexicalized Korean Parsing (고성능 비어휘정보 한국어 구문분석)

  • Oh, Jin-Young;Cha, Jeong-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.295-298
    • /
    • 2010
  • 본 논문에서는 어휘정보를 사용하는 한국어 구문분석 성능과 거의 비슷한 성능을 내는 비어휘정보 한국어 의존 구문분석에 대해서 설명한다. 본 논문에서는 어휘정보를 대신해서 품사정보와 어절 구문태그 정보를 사용하고 CRFs를 사용하여 레이블링 방법으로 구문분석 한다. 자질을 변경하여 어절 처음에 나타나는 용어 정보와 뒤 어절의 용언 정보를 추가하였다. 본 논문에서 제시하는 실험 결과(어절:85.73%, 문장:43.86%)는 현재 최고의 성능을 내는 어휘정보 사용 한국어 구문분석과 비슷하다. 본 논문에서 제안한 비어휘정보 구문분석 방법은 어휘정보 구문분석에 비해 모델 사이즈가 작고 처리방법이 간단하여 쉽게 다른 도메인에 적용이 가능할 것으로 기대한다.

  • PDF

Implementation of Sentence Construction using Lexical Information (어휘 정보를 이용한 문장완성의 구현)

  • 황인정;이은실;민홍기
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2003.06a
    • /
    • pp.10-13
    • /
    • 2003
  • 본 연구는 어휘 정보를 이용하여 구어체 문장구성을 하였다. 구어체 문장구성의 목적은 언어생활이 불편한 사람들을 위한 통신보조기기에 사용하기 위해서이다. 통신보조기기는 사용자가 원하는 문장을 만들어 음성으로 출력해주는 시스템이다. 그러므로 문장을 구성하기 위해서 어휘 정보를 통신보조기기의 개념에 맞도록 변형하여 도입하였다. 어휘는 도메인별로 발췌하고 분류하였으며, 각 어휘에 대해 시소러스와 하위범주화사전을 만들었다. 어휘정보에 관한 상세한 정보는 문장구성과 재사용 그리고 문맥상 어색한 문장검출을 위해 중요한 자료가 된다.

  • PDF

A Sentence Sentiment Classification reflecting Formal and Informal Vocabulary Information (형식적 및 비형식적 어휘 정보를 반영한 문장 감정 분류)

  • Cho, Sang-Hyun;Kang, Hang-Bong
    • The KIPS Transactions:PartB
    • /
    • v.18B no.5
    • /
    • pp.325-332
    • /
    • 2011
  • Social Network Services(SNS) such as Twitter, Facebook and Myspace have gained popularity worldwide. Especially, sentiment analysis of SNS users' sentence is very important since it is very useful in the opinion mining. In this paper, we propose a new sentiment classification method of sentences which contains formal and informal vocabulary such as emoticons, and newly coined words. Previous methods used only formal vocabulary to classify sentiments of sentences. However, these methods are not quite effective because internet users use sentences that contain informal vocabulary. In addition, we construct suggest to construct domain sentiment vocabulary because the same word may represent different sentiments in different domains. Feature vectors are extracted from the sentiment vocabulary information and classified by Support Vector Machine(SVM). Our proposed method shows good performance in classification accuracy.

Automatic Construction of Generalized Lexical Information for Syntactic Ambiguity Resolution (구문 분석에서의 중의성 해소를 위한 일반화된 어휘정보의 자동 구축 및 적용)

  • Chung, Hoo-Jung;Hwang, Young-Sook;Kwak, Yong-Jae;Park, So-Young;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.269-275
    • /
    • 1998
  • 구문 분석에서의 중의성을 해결하는 데 어휘정보가 유용하다는 것은 잘 알려져 있다. 그러나 기존의 어휘정보 구축 방법들은 많은 수작업을 요구하거나, 자동으로 구축하는 경우에는 어휘 자체를 그대로 사용함에 따라 심각한 자료 회귀성 문제가 발생했다. 본 논문에서는 구문 분석에서의 중의성 해소를 위해 원시 코퍼스와 시소러스를 이용하여 개념 수준(conceptual-level)의 일반화된 술어-인자 어휘정보를 자동으로 구축하고, 이를 파서에 적용하는 방법을 제안하고자 한다. 제안한 방법으로 구축한 일반화된 어휘정보를 파서를 이용하여 명사구의 지배소 결정 실험에 적용하여 본 결과, 정확도가 85.9%에서 91.5%로 향상되었다. 또, 미지격 결정 실험에 대해서는 86.32 %의 격 결정 성공률을 보여주었다.

  • PDF

Effect of Word Sense Ambiguation on Internet-Based Information Retrieval (어휘의미중의성이 인터넷기반 정보검색에 미치는 영향)

  • 황상규;오경묵;변영태;천윤심
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.151-155
    • /
    • 1999
  • 기존의 문헌정보검색에 있어 어휘의미중의성은 검색 효율 저하의 주요 원인 중 하나로 생각되어져 왔다. 어휘 의미중의성에 의한 검색 효율 저하란 검색어로 입력한 어휘가 문서에서 서로 다른 의미로 사용됨에 따라 의도하지 않은 다른 문서가 검색될 수 있음을 의미한다. 본 논문에서는 새로운 정보 검색 환경인 인터넷기반 정보검색에 인어 어휘의미중의성이 검색 정확율에 미치는 영향을 살펴보고, 기존에 문헌정보검색에 있어 어휘 의미중의성에 관한 연구가 인터넷기반 정보검색에 있어서도 제대로 적용되는지를 확인해 보았다. 또한 실험을 통해 검색어 수와 어휘의미중의성 간의 상관관계를 조사하였으며, 일반 이용자가 인터넷기반 정보검색 수행시 어휘의미중의성에 의한 검색 효율 저하를 최대한 방지할 수는 방법에 대해 모색해 보았다.

  • PDF

Learning English Vocabulary Using Synonyms And Antonyms System Design (동의어와 반의어를 활용한 영어 어휘 학습 시스템 설계)

  • Jun-Hyeok Ok;Hong-Jun Jang;Byoungwook Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.21-22
    • /
    • 2023
  • 영어 공인 시험에서 영어 어휘는 가장 중요한 요소 중 하나이다. 그러나 기존 영어 어휘 학습 시스템은 단순히 어휘 교재의 콘텐츠를 디지털화한 것에 그치고 있다. 영어 어휘 학습에서 동의어에 대한 학습은 언어 능력을 향상시키고 다양한 상황에서 효과적으로 의사소통할 수 있는 능력 향상에 도움이 된다. 본 연구에서는 학습자들이 영어 어휘 학습을 효과적으로 할 수 있도록 동의어 및 반의어를 활용할 수 있는 학습 시스템을 제안한다. 본 시스템은 동의어와 반의어에 대한 정보가 필요한 영어 어휘를 입력으로 받아 생성형 AI에서 동의어 및 반의어에 대한 정보를 생성한 후에 반환하는 기능을 수행한다. 본 시스템은 학습자들이 어휘 평가에서 오답으로 답한 어휘에 대해 동의어 및 반의어에 대한 추가적인 어휘와 예문을 제공하여 영어 어휘 학습의 효율성을 높일 수 있을 것이다.

Automatic Construction of Lexical Classification Net for Two Languages (양국어 어휘분류망의 자동 구축)

  • Hwang, Geum-Ha;Choi, Gi-Seon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.389-396
    • /
    • 1999
  • 본 연구에서는 이미 만들어진 양국어 단일 언어 어휘 분류체계를 이용하여 양국어 어휘 분류등급 간의 개념유사도에 의한 양국어 분류체계간의 연관 관계를 구축하고자 한다. 중국어 유의어사전과 한국어 분류어휘표를 이용하여 양국어 어휘 분류체계에서의 분류등급 간의 개념유사성 및 양국어간의 어휘 유사성에 의하여 어휘분류망을 자동 구축한다. 자동 구축된 어휘분류망을 통하여 한국어 분류어휘표의 어휘 구성 및 분류체계에 대한 분석 평가를 진행할 것이며 나아가 한국어 분류어휘표에 대한 어휘 및 분류체계에 대한 보완을 시도하고자 한다. 본 연구는 한국어 자체 어휘 분류체계의 구축 방법론의 연구에도 어느 정도 도움될 것으로 기대한다.

  • PDF

Un aspect do la recherche lexico-syntaxique doe constructions $\grave{a}$ verbs support on $cor{\acute{e}}en$ (한국어 기능동사 연구의 한 국면)

  • Hong, Chai-Song
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.527-532
    • /
    • 1993
  • 한국어 어휘부 구성에 기능동사(경동사) 구문에 관한 언어정보의 수록은 필수적이다. 범용적 대규모 한국어 어휘자료 database 구축을 위한 기능동사 구문과 언어학적 분석 기술과 관련하여 제기되는 여러 문제들 중에서 기능동사의 어휘적 한정의 문제는, 어휘부 중심의 논의를 펼칠 때, 각별한 중요성을 갖는다. 본 발표에서는 우선 확장된 기능동사 개념에 의거하여 기능동사 정보를 어휘부에 반드시 수록해야 할 논거를 제시하고, 기능동사의 어휘적 한정의 문제를 집중적으로 거론하고자 한다. 요점은 기능동사 구문이 서술명사와 기능동사의 결합에 의해 성립된다고 볼 때 이 두 범주의 어휘적 실현은 예측불가능한 제한적 결합관계에 의해 특징지어지므로, 일정한 서술명사와 결합 가능한 기능동사의 어휘적 형태를 어휘부에서 낱낱이 한정하고 기재하여야 하리라는 것이다. 이를 위한 필수적인 연구작업은 크게 상호보완적인 두 부분으로 이루어진다. 한편 한국어 서술명사의 총체를 목록화하고, 그 개별어휘 하나하나에 대해 가능한 기능동사 구문과, 구체적인 기능동사 어휘를 한정하는 것이 필요하다. 또 한편으로는 한국어 동사의 총체를 목록화하여, 그 개별어휘 하나하나의 가능한 통사적 실현을 체계화하는 과정에서 기능동사 용법을 빠짐없이 가려내는 작업이 요구된다고 보겠다.

  • PDF

An Enhanced Method for Unsupervised Word Sense Disambiguation using Korean WordNet (한국어 어휘의미망을 이용한 비감독 어의 중의성 해소 방법의 성능 향상)

  • Kwon, Soonho;Kim, Minho;Kwon, Hyuk-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.693-696
    • /
    • 2010
  • 자연언어처리에서 어의 중의성 해소(word sense disambiguation)는 어휘의 의미를 정확하게 파악하는 기술로 기계번역, 정보검색과 같은 여러 응용 분야에서 중요한 역할을 한다. 본 논문에서는 한국어 어휘의미망(Korlex)을 이용한 비감독 어의 중의성 해소 방법을 제안한다. 의미미부착 말뭉치에서 추출한 통계 정보와 한국어 어휘의미망의 관계어 정보를 이용함으로써 자료 부족문제를 완화하였다. 또한, 중의성 어휘와 공기어휘 간의 거리 가중치, 의미별 사용 정보 가중치를 사용하여 언어적인 특징을 고려하여 본 논문의 기반이 되는 PNUWSD 시스템보다 성능을 향상하였다. 본 논문에서 제안하는 어의 중의성 해소 방법의 평가를 위해 SENSEVAL-2 한국어 데이터를 이용하였다. 중의성 어휘의 의미별 관계어와 지역 문맥 내 공기어휘 간의 카이제곱을 이용하였을 때 68.1%의 정확도를 보였고, 중의성 어휘와 공기어휘 간의 거리 가중치와 의미별 사용 정보 가중치를 사용하였을 때 76.9% 정확도를 보여 기존의 방법보다 정확도를 향상하였다.