• 제목/요약/키워드: 어휘정보

검색결과 1,062건 처리시간 0.029초

도메인 별 감성분석을 위한 도메인 맞춤형 감성사전 구축 기법 (A Domain Adaptive Sentiment Dictionary Construction Method for Domain Sentiment Analysis)

  • 김다해;조태민;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.15-18
    • /
    • 2015
  • SNS의 확산으로 대중들은 제품, 서비스, 사회적 이슈 등 다양한 도메인에 대하여 자신의 기분이나 의견을 적극적으로 표현하고 있다. 이에 따라 SNS를 분석하여 제품의 수요, TV 시청률, 주가 등의 다양한 현상을 예측하는 데 있어 감성분석을 활용하는 연구가 활발히 진행되고 있다. 감성분석은 각 어휘에 대한 품사, 극성, 감성지수를 규정하고 있는 감성사전을 기반으로 이루어진다. 하지만 동일한 단어라도 도메인에 따라 중요도가 달라지기 때문에 도메인의 특성을 고려한 감성사전을 사용해야 할 필요성이 있다. 따라서 본 연구에서는 다양한 도메인에 대하여 각각의 특성에 맞게 더욱 정확한 감성분석을 할 수 있도록 도메인 맞춤형 감성사전을 구축하는 기법을 제안한다. 도메인 별로 긍 / 부정 평가에 있어 중요한 척도가 되는 단어들을 도메인 감성어휘로 선별하여 목록을 구축하고, 각 감성어휘의 중요도에 따라 도메인 감성지수를 새롭게 정의하였다. 실험 결과, 평가 도메인에 적합한 감성사전이 다른 도메인의 감성사전 및 범용 감성사전보다 우수한 성능을 보였다. 이를 통해 도메인 맞춤형 감성사전 구축기법의 효용성을 확인하였다.

  • PDF

문장생성에 의한 통신보조시스템의 설계 및 구현 (Design and Implementation of a Augmentative and Alternative Communication System Using Sentence Generation)

  • 우요섭;민홍기;황인정
    • 한국멀티미디어학회논문지
    • /
    • 제8권9호
    • /
    • pp.1248-1257
    • /
    • 2005
  • 본 논문은 통신보조시스템을 위한 문장생성의 구현과 설계에 관한 것이다. 통신보조시스템은 언어장애인을 위한 보조 시스템으로서 시간과 키의 수를 줄여 문장을 생성하는데 그 목적이 있다. 본 논문에서는 기존의 문장생성의 장단점을 보완하여 문장생성을 하였다. 문장생성을 위하여 동사와 조사에 따라 명사가 한정되는 한글 구조를 이용하였다. 본 논문의 특징은 도메인 개념을 이용하여 명사와 동사를 연결하였다. 문장생성을 위해 한글의 특성으로 구축한 어휘정보를 이용하였다. 또한 현재 문장생성에 관한 여러 방법을 비교하였다. 문장생성은 문장특징 추출에 의한 어휘정보에 바탕을 둔다.

  • PDF

가변어휘 음성인식기의 성능개선 (Performance Improvement of Variable Vocabulary Speech Recognizer)

  • 김승희;김회린
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.21-24
    • /
    • 1999
  • 본 논문에서는 가변어휘 음성인식기의 성능개선 작업에 관한 내용을 기술하고 있다. 묵음을 포함한 총 40개의 문맥독립 음소모델을 사용한다. LDA 기법을 이용하여 동일차수의 특징벡터내에 보다 유용한 정보를 포함시키고, likelihood 계산시 가우시안 분포와 mixture weight에 대한 가중치를 달리 함으로써 성능향상을 볼 수 있었다. ETRI POW 3848 DB만을 사용하여 실험한 경우, $21.7\%$의 오류율 감소를 확인할 수 있었다. 잡음환경 및 어휘독립환경을 고려하여 POW 3848 DB와 PC 168 DB 및 PBW445 DB를 사용한 실험도 행하였으며, PBW 445 DB를 사용한 어휘독립 인식실험의 경우 $56.8\%$의 오류율 감소를 얻을 수 있었다.

  • PDF

한국어 피동동사의 의미구조와 논항실현 (The Semantic Structure and Argument Realization of Korean Passive Verbs)

  • 김윤신;이정민;강범모;남승호
    • 인지과학
    • /
    • 제11권1호
    • /
    • pp.25-32
    • /
    • 2000
  • 한국어에서 피동동사는 대응하는 능동동사로부터 접미사를 첨가하여 파생되거나 대응하는 능동동사의 어간에 어미와 조동사로 이루어진 형태를 붙여 형성된다. 따라서 피동동사는 그 능동동사와 공유하는 어휘정보를 갖는다고 가정할 수 있다. 이 논문은 피동동사의 논항 실현 양상을 격교체현상을 중심으로 살펴보고 Pustejovsky(1995)의 생성어휘부 이론에 근거하여 그 의미구조를 설정하는 것을 그 목적으로 한다.

  • PDF

통합의학언어 시스템(UMLS)의 구성 및 적용에 대한 고찰 (A Review of Structure and Application of Unified Medical Language System(UMLS))

  • 김혜선
    • 정보관리연구
    • /
    • 제32권2호
    • /
    • pp.26-39
    • /
    • 2001
  • 효과적인 정보검색 도구로 활용되는 시소러스, 분류표 등의 통제어휘집들은 동일한 개념이나 의미를 표현하는데 서로 다른 어휘를 사용하고 있다. 이러한 동일 개념에 대한 용어 표현차이로 인한 정보의 검색 및 통합문제를 해결하기 위하여 미국국립의학도서관은 통합의학언어시스템(Unified Medical Language System : 이하 UMLS)을 개발하였다. UMLS 개발은 1986년부터 시작된 장기 프로젝트로서 2001년판 UMLS는 메타시소러스, 의미망, 전문가 사전의 세가지 요소로 구성되어 있다. 본고는 UMLS의 개발배경과 구성요소 및 PubMed, NLM Gateway에서의 적용사례에 대해 고찰하였다.

  • PDF

코어넷을 활용한 비지도 한국어 어의 중의성 해소 (Unsupervised Korean Word Sense Disambiguation using CoreNet)

  • 한기종;남상하;김지성;함영균;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.153-158
    • /
    • 2017
  • 본 논문은 한국어 어휘 의미망인 코어넷(CoreNet)을 활용한 비지도학습 방식의 한국어 어의 중의성 해소(Word Sense Dsiambiguation)에 대한 연구이다. 어의 중의성 해소의 실질적인 응용을 위해서는 합리적인 수준으로 의미 후보를 나눌 필요성이 있다. 이를 위해 동형이의어와 코어넷의 개념체계를 활용하여 의미 후보를 나누어서 진행하였으며 이렇게 나눈 것이 실제 활용에서 의미가 있음을 실험을 통해 보였다. 접근 방식으로는 문맥 속에서 서로 영향을 미치는 어휘의 의미들을 동시에 고려하여 중의성 해소를 할 수 있도록 마코프랜덤필드와 의존구조 분석을 바탕으로 한 지식 기반 모델을 사용하였다. 이 과정에서도 코어넷의 개념체계를 활용하였다. 이 방식을 통해 임의의 모든 어휘에 대해 중의성 해소를 하도록 직접 구축한 데이터 셋에 대하여 80.9%의 정확도를 보였다.

  • PDF

규칙과 어휘정보를 이용한 한국어 문장의 구묶음(Chunking) (Text Chunking by Rule and Lexical Information)

  • 김미영;강신재;이종혁
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.103-109
    • /
    • 2000
  • 본 논문은 효율적인 한국어 구문분석을 위해 먼저 구묶음 분석(Chunking) 과정을 적용할 것을 제안한다. 한국어는 어순이 자유롭지만 명사구와 동사구에서는 규칙적인 어순을 발견할 수 있으므로, 규칙을 이용한 구묶음(Chunking) 과정의 적용이 가능하다. 하지만, 규칙만으로는 명사구와 동사구의 묶음에 한계가 있으므로 실험 말뭉치에서 어휘 정보를 찾아내어 구묶음 과정(Chunking)에 적용한다. 기존의 구문분석 방법은 구구조문법과 의존문법에 기반한 것이 대부분인데, 이러한 구문분석은 다양한 결과들이 분석되는 동안 많은 시간이 소요되며 이 중 잘못된 분석 결과를 가려서 삭제하기(pruning)도 어렵다. 따라서 본 논문에서 제시한 구묶음(Chunking) 과정을 적용함으로써, 잘못된 구문분석 결과를 미연에 방지하고 의존문법을 적용한 구문분석에 있어서 의존관계의 설정 범위(scope)도 제한할 수 있다.

  • PDF

초등학교도서관을 위한 KDC 간략판 개발에 관한 연구 (A Study on the Development of Abridged KDC for Elementary School Libraries)

  • 김정현
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.87-96
    • /
    • 2005
  • 초등학생관련 자료의 유별 현황 및 어휘분석을 바탕으로 초등학교도서관을 위한 KDC 간략판을 개발하고자 시도되었다. 즉, 분류표의 수정 전개 범위는 최대한 KDC 4판의 기본 틀인 유, 강, 목을 그대로 유지하면서 자료의 유별 분포도를 분석하여 분류항목을 세분하였으며, 초등학생의 특성을 반영하기 위한 구체적인 방법으로 KDC 분류명사를 추출하여 초등학생을 대상으로 설문조사한 결과 및 초등학생관련 자료의 실증적인 어휘분석을 종합하여 분류항목의 수정전개에 반영하였다. 이 연구에서는 초등학교도서관을 대상으로 하였지만 중등학교도서관에 대해서도 이와 같은 실증적인 유별 현황 및 어휘분석 방법을 적용하여 주기적으로 분류표의 개정 작업에 반영한다면 KDC가 학교도서관을 위해 보다 실공적인 분류표가 될 것이다.

  • PDF

외국인을 위한 안드로이드 기반 한국어 교육 애플리케이션 (Android Based Korean Education Application for Foreigners)

  • 최선아;이화민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1480-1483
    • /
    • 2011
  • 스마트 기기 사용자가 급증하면서 애플리케이션의 수도 급격히 많아지고 있다. 다양한 종류의 교육용 애플리케이션이 많이 개발되어 졌지만 외국인을 위한 한국어 교육 애플리케이션의 수는 매우 적다. 이에 본 논문은 외국인 사용자가 한국어를 학습할 수 있는 애플리케이션을 설계 구현하였다. 한국어 어휘능력이 부족한 외국인을 주 대상으로 단어와 예문 및 시각적인 요소인 이미지와 청각적인 요소인 듣기를 결합하여 학습 효과를 극대화시킴으로써 효과적인 어휘능력의 향상을 목표로 구현하였다.