• 제목/요약/키워드: word-net

검색결과 258건 처리시간 0.023초

코어넷을 활용한 비지도 한국어 어의 중의성 해소 (Unsupervised Korean Word Sense Disambiguation using CoreNet)

  • 한기종;남상하;김지성;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.153-158
    • /
    • 2017
  • 본 논문은 한국어 어휘 의미망인 코어넷(CoreNet)을 활용한 비지도학습 방식의 한국어 어의 중의성 해소(Word Sense Dsiambiguation)에 대한 연구이다. 어의 중의성 해소의 실질적인 응용을 위해서는 합리적인 수준으로 의미 후보를 나눌 필요성이 있다. 이를 위해 동형이의어와 코어넷의 개념체계를 활용하여 의미 후보를 나누어서 진행하였으며 이렇게 나눈 것이 실제 활용에서 의미가 있음을 실험을 통해 보였다. 접근 방식으로는 문맥 속에서 서로 영향을 미치는 어휘의 의미들을 동시에 고려하여 중의성 해소를 할 수 있도록 마코프랜덤필드와 의존구조 분석을 바탕으로 한 지식 기반 모델을 사용하였다. 이 과정에서도 코어넷의 개념체계를 활용하였다. 이 방식을 통해 임의의 모든 어휘에 대해 중의성 해소를 하도록 직접 구축한 데이터 셋에 대하여 80.9%의 정확도를 보였다.

  • PDF

워드넷 기반 한국어 명사 어휘의미망의 정제 (Refinement of KorLex based on WordNet)

  • 황순희;윤애선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.267-272
    • /
    • 2005
  • 최근 들어 온톨로지(ontology), 시소러스(thesaurus) 등과 함께 주목받고 있는 Princeton 대학의 워드넷(WordNet, 이하 PWN) 은 자연어 처리(NLP)와 관련하여 대안을 제시할 수 있는 어휘의미망(lexico-semantic network)이다. 또한 PWN을 기반으로 상이한 개별어 어휘의미망 구축이 여러 차례 시도되었고, 현재도 진행 중이다. 본 연구는 간접 구축 방식에 의한 어휘의미망 구축 시 요구되는 정제(refinement) 방식들을 검토하고, 이를 한국어 명사 어휘의미망(KL)에 적용하여 정확도 검증 방법의 한 대안으로 제시하였다. 또한 보다 정교한 정제 방법의 모색과 고찰은 향후 과제로 삼고자 한다.

  • PDF

어휘사전 워드넷을 활용한 의미기반 웹 정보필터링 (Semantic-Based Web Information Filtering Using WordNet)

  • 변영태;황상규;오경묵
    • 한국정보처리학회논문지
    • /
    • 제6권11S호
    • /
    • pp.3399-3409
    • /
    • 1999
  • Information filtering for internet search, in which new information retrieval environment is given, is different from traditional methods such as bibliography information filtering, news-group and E-mail filtering. Therefore, we cannot expect high performance from the traditional information filtering models when they are applied to the new environment. To solve this problem, we inspect the characteristics of the new filtering environment, and propose a semantic-based filtering model which includes a new filtering method using WordNet. For extracting keywords from documents, this model uses the SDCC(Semantic Distance for Common Category) algorithm instead of the TF/IDF method usually used by traditional methods. The world sense ambiguation problem, which is one of causes dropping efficiency of internet search, is solved by this method. The semantic-based filtering model can filter web pages selectively with considering a user level and we show in this paper that it is more convenient for users to search information in internet by the proposed method than by traditional filtering methods.

  • PDF

WordNet과 텍스트 코퍼스에 기반한 의미 관계를 활용한 웹 텍스트 조사 기법 (A Web Text Mining Technique using Semantic Relations based on WordNet and Text Corpus)

  • 이호석;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.181-184
    • /
    • 2007
  • 본 논문은 문장 분석에 의하여 의미 관계를 생성하고 의미 네트워크에 의하여 유사한 의미 관계를 고려하는 의미 중심의 웹 텍스트 검색 기법에 대하여 논의한다. 기존의 웹 텍스트 검색은 단어만을 혹은 의미 관계만을 고려한 검색이었다고 할 수 있다. 그러나 문장 분석에 의한 의미 관계의 생성과 의미 네트워크에 의한 유사한 의미 관계의 고려는 기존의 단어 중심 혹은 의미 관계 중심의 검색 한계를 넘어서 유사한 의미 관계를 고려한 좀 더 포괄적이고 계층적인 검색을 가능하게 할 것으로 생각된다.

  • PDF

코어넷을 활용한 비지도 한국어 어의 중의성 해소 (Unsupervised Korean Word Sense Disambiguation using CoreNet)

  • 한기종;남상하;김지성;함영균;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.153-158
    • /
    • 2017
  • 본 논문은 한국어 어휘 의미망인 코어넷(CoreNet)을 활용한 비지도학습 방식의 한국어 어의 중의성 해소(Word Sense Dsiambiguation)에 대한 연구이다. 어의 중의성 해소의 실질적인 응용을 위해서는 합리적인 수준으로 의미 후보를 나눌 필요성이 있다. 이를 위해 동형이의어와 코어넷의 개념체계를 활용하여 의미 후보를 나누어서 진행하였으며 이렇게 나눈 것이 실제 활용에서 의미가 있음을 실험을 통해 보였다. 접근 방식으로는 문맥 속에서 서로 영향을 미치는 어휘의 의미들을 동시에 고려하여 중의성 해소를 할 수 있도록 마코프랜덤필드와 의존구조 분석을 바탕으로 한 지식 기반 모델을 사용하였다. 이 과정에서도 코어넷의 개념체계를 활용하였다. 이 방식을 통해 임의의 모든 어휘에 대해 중의성 해소를 하도록 직접 구축한 데이터 셋에 대하여 80.9%의 정확도를 보였다.

  • PDF

비주얼 검색을 위한 위키피디아 기반의 질의어 추출 (Keyword Selection for Visual Search based on Wikipedia)

  • 김종우;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제21권8호
    • /
    • pp.960-968
    • /
    • 2018
  • The mobile visual search service uses a query image to acquire linkage information through pre-constructed DB search. From the standpoint of this purpose, it would be more useful if you could perform a search on a web-based keyword search system instead of a pre-built DB search. In this paper, we propose a representative query extraction algorithm to be used as a keyword on a web-based search system. To do this, we use image classification labels generated by the CNN (Convolutional Neural Network) algorithm based on Deep Learning, which has a remarkable performance in image recognition. In the query extraction algorithm, dictionary meaningful words are extracted using Wikipedia, and hierarchical categories are constructed using WordNet. The performance of the proposed algorithm is evaluated by measuring the system response time.

개념적 거리와 밀도를 고려한 온톨로지 기반의 코스웨어 분류 (Courseware Classification using Conceptual Distance and Density based on Ontology)

  • 조미영;최창;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.314-318
    • /
    • 2006
  • 인터넷의 비약적인 발전으로 많은 강의 자료가 존재하게 되었으며, 어느 누구나 손쉽게 강의 자료를 구할 수 있게 되었다. 하지만 사용자는 단순히 많은 정보만을 원하는 것이 아니라 정확한 정보를 얻기를 원한다. 이에 본 논문에서는 기존의 단어 빈도수 기반의 분류 방식이 아닌 개념적 분류 방식으로 온톨로지를 이용하여 코스웨어를 분류해보고자 한다. 온톨로지로는 어휘적 온톨로지의 일종인 WordNet의 과목에 대한 계층적 구조를 활용하였다. 실험 데이터로는 강의 자료 중 파워포인트로 작성된 코스웨어를 이용하였으며, 코스웨어의 메타데이터들과 과목들간의 개념적 거리 및 밀도를 측정하여 코스웨어를 분류하였다. 또한 WordNet상의 어휘 확장을 통하여 분류과목 확장이 가능함을 보였다.

  • PDF

구문분석기의 어휘확장 (Lexical Expansion of Sentence Parsers)

  • 김민찬;김곤;배재학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.755-758
    • /
    • 2005
  • 본 논문에서는 구문분석기의 어휘확장을 통해 구문분석의 성공률을 높이고자 하였다. 구문분석은 문장내 구성성분들이 가지는 통사적인 관련성을 파악하는 작업이다. 구문분석 실패의 가장 빈번한 원인 중의 하나는 미등록 어휘의 출현이다. 결여된 어휘문제를 해결하는 것은 구문분석의 성공률을 높이고, 원문이해 시스템을 보다 더 견고하게 하는데 관건으로 작용한다. 이를 위하여, 본 논문에서는 구분분석기 LGPI+ 의 어휘 사전에 존재하지 않는 단어들을 또 다른 어휘자원인 WordNet을 이용하여 해결하고자 하였다. 구체적으로는, (1) 미등록 어휘를 WordNet에서 찾고, (2) 그 유의어 정보를 파악하여, (3) LGPI+ 어휘사전에 추가한다. 실험을 통하여 구문분석의 실패를 해결하고, 정확도와 성공률을 높일 수 있음을 확인하였다.

  • PDF

감정요소를 이용한 SNS 메시지 분류기 구현에 대한 연구 (A Study on the Implementation of SNS Message Classification by Emotion Factors)

  • 김재영;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.217-222
    • /
    • 2011
  • 최근 SNS가 급격하게 성장하고 있고 많은 사용자들이 이 SNS를 하나의 다른 커뮤니케이션 매체로 사용하고 있다. SNS를 이용하는 개인 사용자들은 자신의 소식과 감정의 변화를 표현하는 수단으로 SNS를 이용하고 있다. 이에 본 연구에서는 감정을 나타내는 감정 요소를 이용하여 메시지를 분류하는 프로그램을 구현하였다. 감정 성분 추출은 OMLS(Ocean-Monmouth Legal Services)에 있는 감정 어휘를 이용하여 로젯(Roget)의 시소러스와 워드넷(WordNet)을 이용하여 이루어졌다.

개념기반 이미지 검색 시스템을 위한 도메인 온톨로지 구축 (Building the Domain Ontology for Content Based Image Retrieval System)

  • 공현장;김원필;오군석;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.81-84
    • /
    • 2002
  • 멀티미디어 분야가 급성장하면서 좀더 효율적으로 멀티미디어 자료의 저장, 처리, 검색을 위한 연구가 진행되고 있다. 특히, 내용기반 시각정보 검색에 있어 지능형 시스템(Intelligent System)을 접목하여 의미적 접근을 시도하는 I-CBIR(Intelligent-Content Based Image Retrieval)에 관한 연구가 진행되고 있다. 또한, 내용기반 이미지검색 시스템에 온톨로지(Ontology)의 이론을 적용하여 이미지에 의미를 부여하여 개념적 검색이 가능하도록 노력하고 있다. 이러한 연구에서 적용된 대형의 온톨로지는 이미지 검색 시스템에 적합하지 않게 너무 방대한 정보를 가지고 있으며, 또한 시대적 변화에 대응하지 못하여 I-CBIR 시스템에서 그 효율성을 제대로 발휘하지 못하고 있다. 따라서 본 논문에서는 많은 대형 온톨로지 중에서 WordNet을 선택하여, WordNet의 구축 방법에 기반한 자동차(Car)에 대한 도메인 온톨로지(Domain Ontology)를 구축해보고, 구축된 도메인 온톨로지를 적용함으로써 더 향상된 I-CBIR 시스템이 되도록 하였다.

  • PDF