• Title/Summary/Keyword: 어휘정보

Search Result 1,062, Processing Time 0.03 seconds

A Domain Adaptive Sentiment Dictionary Construction Method for Domain Sentiment Analysis (도메인 별 감성분석을 위한 도메인 맞춤형 감성사전 구축 기법)

  • Kim, Dahae;Cho, Taemin;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.15-18
    • /
    • 2015
  • SNS의 확산으로 대중들은 제품, 서비스, 사회적 이슈 등 다양한 도메인에 대하여 자신의 기분이나 의견을 적극적으로 표현하고 있다. 이에 따라 SNS를 분석하여 제품의 수요, TV 시청률, 주가 등의 다양한 현상을 예측하는 데 있어 감성분석을 활용하는 연구가 활발히 진행되고 있다. 감성분석은 각 어휘에 대한 품사, 극성, 감성지수를 규정하고 있는 감성사전을 기반으로 이루어진다. 하지만 동일한 단어라도 도메인에 따라 중요도가 달라지기 때문에 도메인의 특성을 고려한 감성사전을 사용해야 할 필요성이 있다. 따라서 본 연구에서는 다양한 도메인에 대하여 각각의 특성에 맞게 더욱 정확한 감성분석을 할 수 있도록 도메인 맞춤형 감성사전을 구축하는 기법을 제안한다. 도메인 별로 긍 / 부정 평가에 있어 중요한 척도가 되는 단어들을 도메인 감성어휘로 선별하여 목록을 구축하고, 각 감성어휘의 중요도에 따라 도메인 감성지수를 새롭게 정의하였다. 실험 결과, 평가 도메인에 적합한 감성사전이 다른 도메인의 감성사전 및 범용 감성사전보다 우수한 성능을 보였다. 이를 통해 도메인 맞춤형 감성사전 구축기법의 효용성을 확인하였다.

  • PDF

Design and Implementation of a Augmentative and Alternative Communication System Using Sentence Generation (문장생성에 의한 통신보조시스템의 설계 및 구현)

  • Woo Yo-Seop;Min Hong-Ki;Hwang Ein-Jeong
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.9
    • /
    • pp.1248-1257
    • /
    • 2005
  • This paper designs and implements a sentence generation for an augmentive and alternative communication system(AAC). The AAC system is assistive communication device to help the mute language disorder communicate more freely and the system have an objected to reduce time and keystrokes for sentence generating. The paper of sentence generation make up for merits and demerits in the existing sentence generation method and in order to sentence generation. One aspect of Korean language that confines nouns defending on the verbs or postpositional words is used for sentence generation. The distinctive feature of this paper is to connect verbs to nouns using domain knowledge. We utilize the lexical information that exploits characteristics of Korean language for sentence generation. A comparison with other approaches is also presented. This sentence generation is based on lexical information by extracting characteristics of sentences.

  • PDF

Performance Improvement of Variable Vocabulary Speech Recognizer (가변어휘 음성인식기의 성능개선)

  • Kim Seunghi;Kim Hoi-Rin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.21-24
    • /
    • 1999
  • 본 논문에서는 가변어휘 음성인식기의 성능개선 작업에 관한 내용을 기술하고 있다. 묵음을 포함한 총 40개의 문맥독립 음소모델을 사용한다. LDA 기법을 이용하여 동일차수의 특징벡터내에 보다 유용한 정보를 포함시키고, likelihood 계산시 가우시안 분포와 mixture weight에 대한 가중치를 달리 함으로써 성능향상을 볼 수 있었다. ETRI POW 3848 DB만을 사용하여 실험한 경우, $21.7\%$의 오류율 감소를 확인할 수 있었다. 잡음환경 및 어휘독립환경을 고려하여 POW 3848 DB와 PC 168 DB 및 PBW445 DB를 사용한 실험도 행하였으며, PBW 445 DB를 사용한 어휘독립 인식실험의 경우 $56.8\%$의 오류율 감소를 얻을 수 있었다.

  • PDF

The Semantic Structure and Argument Realization of Korean Passive Verbs (한국어 피동동사의 의미구조와 논항실현)

  • 김윤신;이정민;강범모;남승호
    • Korean Journal of Cognitive Science
    • /
    • v.11 no.1
    • /
    • pp.25-32
    • /
    • 2000
  • Korean passive verbs are derived from their corresponding active verbs by suffixation or by adding endings and auxiliaries to their stems. Therefore. we assume p passive verbs share some lexical informations with their active counterparts. This paper extending the Generative Lexicon theory of Pustejovsky (995). aims to characterize the argument realization patterns of Korean passive verbs focusing on the case alternation a and to propose their lexical semantic structures which account for the syntactic behavior.

  • PDF

A Review of Structure and Application of Unified Medical Language System(UMLS) (통합의학언어 시스템(UMLS)의 구성 및 적용에 대한 고찰)

  • Kim, Hye-Sun
    • Journal of Information Management
    • /
    • v.32 no.2
    • /
    • pp.26-39
    • /
    • 2001
  • Various controlled vocabularies such as thesaurus and classification used for effective information retrieval contain different terms in expressing the same concept or meaning. National Library of Medicine has developed the Unified Medical Language System(UMLS) to solve the problems of information retrieval and integration resulted from the difference of concepts between different sources. The UMLS development was initiated in 1982 as a long-term project, and the 2001 edition of the UMLS consists of three parts : Metathesaurus, Semantic Network, and SPECIALIST Lexicon. This paper reviews background and structure of the UMLS including applications in PubMed, NLM Gateway.

  • PDF

Unsupervised Korean Word Sense Disambiguation using CoreNet (코어넷을 활용한 비지도 한국어 어의 중의성 해소)

  • Han, Kijong;Nam, Sangha;Kim, Jiseong;Hahm, YoungGyun;Choi, Key-Sun
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.153-158
    • /
    • 2017
  • 본 논문은 한국어 어휘 의미망인 코어넷(CoreNet)을 활용한 비지도학습 방식의 한국어 어의 중의성 해소(Word Sense Dsiambiguation)에 대한 연구이다. 어의 중의성 해소의 실질적인 응용을 위해서는 합리적인 수준으로 의미 후보를 나눌 필요성이 있다. 이를 위해 동형이의어와 코어넷의 개념체계를 활용하여 의미 후보를 나누어서 진행하였으며 이렇게 나눈 것이 실제 활용에서 의미가 있음을 실험을 통해 보였다. 접근 방식으로는 문맥 속에서 서로 영향을 미치는 어휘의 의미들을 동시에 고려하여 중의성 해소를 할 수 있도록 마코프랜덤필드와 의존구조 분석을 바탕으로 한 지식 기반 모델을 사용하였다. 이 과정에서도 코어넷의 개념체계를 활용하였다. 이 방식을 통해 임의의 모든 어휘에 대해 중의성 해소를 하도록 직접 구축한 데이터 셋에 대하여 80.9%의 정확도를 보였다.

  • PDF

Text Chunking by Rule and Lexical Information (규칙과 어휘정보를 이용한 한국어 문장의 구묶음(Chunking))

  • 김미영;강신재;이종혁
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.103-109
    • /
    • 2000
  • 본 논문은 효율적인 한국어 구문분석을 위해 먼저 구묶음 분석(Chunking) 과정을 적용할 것을 제안한다. 한국어는 어순이 자유롭지만 명사구와 동사구에서는 규칙적인 어순을 발견할 수 있으므로, 규칙을 이용한 구묶음(Chunking) 과정의 적용이 가능하다. 하지만, 규칙만으로는 명사구와 동사구의 묶음에 한계가 있으므로 실험 말뭉치에서 어휘 정보를 찾아내어 구묶음 과정(Chunking)에 적용한다. 기존의 구문분석 방법은 구구조문법과 의존문법에 기반한 것이 대부분인데, 이러한 구문분석은 다양한 결과들이 분석되는 동안 많은 시간이 소요되며 이 중 잘못된 분석 결과를 가려서 삭제하기(pruning)도 어렵다. 따라서 본 논문에서 제시한 구묶음(Chunking) 과정을 적용함으로써, 잘못된 구문분석 결과를 미연에 방지하고 의존문법을 적용한 구문분석에 있어서 의존관계의 설정 범위(scope)도 제한할 수 있다.

  • PDF

A Study on the Development of Abridged KDC for Elementary School Libraries (초등학교도서관을 위한 KDC 간략판 개발에 관한 연구)

  • Kim, Jeong-Hyen
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2005.08a
    • /
    • pp.87-96
    • /
    • 2005
  • 초등학생관련 자료의 유별 현황 및 어휘분석을 바탕으로 초등학교도서관을 위한 KDC 간략판을 개발하고자 시도되었다. 즉, 분류표의 수정 전개 범위는 최대한 KDC 4판의 기본 틀인 유, 강, 목을 그대로 유지하면서 자료의 유별 분포도를 분석하여 분류항목을 세분하였으며, 초등학생의 특성을 반영하기 위한 구체적인 방법으로 KDC 분류명사를 추출하여 초등학생을 대상으로 설문조사한 결과 및 초등학생관련 자료의 실증적인 어휘분석을 종합하여 분류항목의 수정전개에 반영하였다. 이 연구에서는 초등학교도서관을 대상으로 하였지만 중등학교도서관에 대해서도 이와 같은 실증적인 유별 현황 및 어휘분석 방법을 적용하여 주기적으로 분류표의 개정 작업에 반영한다면 KDC가 학교도서관을 위해 보다 실공적인 분류표가 될 것이다.

  • PDF

Android Based Korean Education Application for Foreigners (외국인을 위한 안드로이드 기반 한국어 교육 애플리케이션)

  • Choi, Sun-A;Lee, Hwa-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1480-1483
    • /
    • 2011
  • 스마트 기기 사용자가 급증하면서 애플리케이션의 수도 급격히 많아지고 있다. 다양한 종류의 교육용 애플리케이션이 많이 개발되어 졌지만 외국인을 위한 한국어 교육 애플리케이션의 수는 매우 적다. 이에 본 논문은 외국인 사용자가 한국어를 학습할 수 있는 애플리케이션을 설계 구현하였다. 한국어 어휘능력이 부족한 외국인을 주 대상으로 단어와 예문 및 시각적인 요소인 이미지와 청각적인 요소인 듣기를 결합하여 학습 효과를 극대화시킴으로써 효과적인 어휘능력의 향상을 목표로 구현하였다.