• 제목/요약/키워드: 워드 넷

검색결과 99건 처리시간 0.026초

워드넷 기반의 단어 중의성 해소 프레임워크 (A Framework for WordNet-based Word Sense Disambiguation)

  • 임초람;조세형
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.325-331
    • /
    • 2013
  • 본 연구에서는 단어의 의미 중의성을 해소하기 위한 방법을 제안하고 그 결과를 제시한다. 본 연구에서는 워드넷을 두가지 차원에서 활용하였는데, 하나는 사전으로서의 활용이며 다른 하나는 단어간의 개념 계층 구조를 가진 일종의 온톨로지로서 활용하였다. 이 중의성 해소 방식의 장점은 첫째 매우 단순하다는데 있다. 둘째로는 코퍼스를 활용하는 지식 기반/통계 기반 방식이 아니기 때문에 의미 태그 부착된 코퍼스의 부족으로 인한 문제가 발생하지 않는다는 것이다. 현재는 워드넷 온톨로지 중에서 개념 계층 구조, 즉 상위어-하위어 (hypernym-hyponym)의 관계만을 사용하였으나 향후 어렵지 않게 다른 관계들, 즉 유사어(synonym), 반의어(antonym), 부분어(meronym) 등의 관계를 활용하여 확장함으로써 성능의 향상을 기대할 수 있다.

워드넷과 구글에 기반한 온톨로지 개체의 일반화 (Generalization of Ontology Instances Based on WordNet and Google)

  • 강신재;강인수
    • 한국지능시스템학회논문지
    • /
    • 제19권3호
    • /
    • pp.363-370
    • /
    • 2009
  • 본 논문은 온톨로지의 지식을 확장하기 위하여 웹 페이지 등 텍스트에서 추출된 온톨로지 개체(ontology instances)를 일반화하는 방법을 제시한다. 이를 위해서는 단어 의미 중의성 해소 과정이 필수적인데, 구글, 워드넷과 같은 오픈 API와 어휘 리소스를 이용하여 비교사학습 방법으로 해결하는 방법을 제안한다. 실험 결과 기존 연구에 비해 15.8%의 성능 향상을 얻을 수 있었다.

워드넷 기반의 임의 추출 분할 방식을 이용한 동적 문제 출제 시스템 설계 (A Design of Dynamic Question Generation System using a Voluntary Extraction and Division Methodbased on WordNet)

  • 추승우;오정석;김유섭;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.283-285
    • /
    • 2004
  • 문제 은행 방식을 사용하는 웹 기반 학습 시스템의 문제점으로 지적되었던 문제 유출에 따른 평가의 공정성 문제를 해결하고자 임의 추출 분할 방식을 이용한 동적 문제 출제 시스템이 제안되었다. 하지만 이 시스템 또한 문제 은행 방식을 사용하여 위의 문제를 해결하려고 하였다. 본 논문에서는 이러한 문제점을 해결하기 위하여 단어간의 관계를 계층적으로 표현한 어휘 데이터베이스인 한국어 워드넷을 활용한 방법을 적용하였다 먼저 임의 추출 분할 방식으로 출제된 문제의 예제 문항을 형태소 분석기를 이용하여 명사들을 추출한다. 이 명사들을 이용하여 한국어 워드넷에서 해당 면사의 상위 개념 또는 동일 개념의 Synset을 추출한다. 이렇게 추출된 Synset으로 다른 예시 문항이지만 의미적으로 유사한 다양한 예제 문항을 생성하려는 시스템을 제안한다. 제안된 시스템의 사용으로 평가의 공정성 문제를 해결하고자 한다.

  • PDF

상위어 시퀀스의 클러스터링을 이용한 단어의 의미 애매성 해소 (Word Sense Disambiguation using Hypernym Sequence Clustering)

  • 정창후;최윤수;최성필;윤화묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.935-936
    • /
    • 2009
  • 본 논문에서는 과학기술문서에 존재하는 기술용어와 이들 간의 연관관계를 설명하는 디스크립터를 찾아서 [subject predicate object] 형태의 트리플을 생성하는 애플리케이션을 개발할 때 발생하는 단어 의미 애매성 해소 문제를 다룬다. 기술용어가 가지고 있는 연관관계를 결정하기 위해서 워드넷의 신셋 정보를 사용하는데 이 방법은 동사를 워드넷에 매핑할 때와 상위어 관계로 전이할 때 여러 개의 의미에 매핑되는 문제점이 발생한다. 이것을 해결하기 위해서 상위어 시퀀스 클러스터링을 이용한 단어의 의미 애매성 해결 방안을 제시한다. 이 방법을 사용함으로써 워드넷 매핑과 상위어 전이 시에 발생하는 다중 매핑 문제를 동시에 해결할 수 있다.

한국어 워드넷에서의 개념 유사도를 활용한 선택형 문항 생성 시스템 (A Question Example Generation System for Multiple Choice Tests by utilizing Concept Similarity in Korean WordNet)

  • 김용범;김유섭
    • 정보처리학회논문지A
    • /
    • 제15A권2호
    • /
    • pp.125-134
    • /
    • 2008
  • 본 논문에서는 난이도를 고려하여 선택형 문항을 자동으로 생성하는 방법을 고안하였으며, 학습자 수준에 적합하도록 동적인 형태로 다양한 문항 제시를 할 수 있는 시스템을 구현하였다. 선택형 문제를 통한 평가에서는 적절한 규모의 문제 은행이 필요하다. 이와 같은 요구를 만족시키기 위해서는 보다 쉽고 빠른 방식으로 다양하고 많은 문제 및 문항을 생성할 수 있는 시스템이 필요한데, 본 논문에서는 문제 및 문항의 생성을 위하여 워드넷이라는 언어 자원을 이용한 자동 생성 방법을 고안하였다. 자동 생성을 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드마다 워드넷의 계층적 특성에 따라 유사한 의미를 가진 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 기존의 한국어 워드넷의 스키마를 개념간 의미 유사도 행렬을 구할 수 있는 형태의 스키마로 변경한다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도가 없다고 볼 수 있는 수준 9까지 다양하게 제시될 수 있으며, 생성될 문항에 어느 정도의 유사도를 가진 어휘를 포함시키느냐에 따라서 출제자의 의도에 따른 난이도의 조정이 가능하다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 포함되어 있는 트리 구조의 크기까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 더 다양한 내용과 난이도를 가진 문제 또는 문항을 더 쉽게 출제할 수 있는 시스템을 개발할 수 있었다.

워드넷을 이용한 스키마 엘리먼트 매칭 시스템 (Schema Element Matching System using WordNet)

  • 이민호;이원구;최윤수;윤화묵;최동훈;조민희;정한민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.122-124
    • /
    • 2012
  • 정보의 상호운용성 확보를 위해서 여러 형태로 정의되어 있는 스키마들을 매칭하는 것은 반드시 필요한 작업이다. 워드넷은 영어의 의미 어휘목록으로 유의어 집단과 어휘 목록사이의 다양한 의미관계를 기록하여 자동화된 본문 분석과 인공지능 응용에 활용할 수 있다. 본 논문에서는 워드넷을 이용하여 스키마 엘리먼트 이름의 의미 집합을 추출하고 대응하는 엘리먼트 의미 집합과의 유사도를 측정함으로써 스키마 엘리먼트를 매칭하는 시스템을 제안한다. 본 시스템은 다중매칭된 복잡한 관계를 간단한 방법으로 단일매칭화함으로써 사용자가 직관적이고 용이하게 사용할 수 있다. 이를 통하여 데이터 통합, 변환, 분산 검색 등 정보의 상호운용이 필요한 다양한 분야에서 활용될 수 있을 것으로 기대한다.

워드넷의 의미 관계 집합을 이용한 온톨로지 매핑 (Ontology Mapping using Semantic Relationship Set of the WordNet)

  • 곽정애;용환승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.466-475
    • /
    • 2009
  • 다양한 온톨로지 개발로 온톨로지간에 정보공유와 재사용이 필요하게 되면서 온톨로지 매핑에 관련된 연구가 활발이 이루어지고 있다. 온톨로지 매핑 기법으로는 어휘 유사성, 구조 유사성, 인스턴스 유사성, 추론 유사성 검사 기법으로 나누어진다. 이 중 어휘 유사성 검사 기법은 대부분의 온톨로지 매핑 연구에서 사용하는 기법으로써 주로 워드넷에 정의되어 있는 동의어 집합만을 사용한다. 이에 본 연구에서는 워드넷에 정의되어 있는 동의어 집합 외에 상위어, 하위어, 전체어, 부분어 집합의 모든 단어들을 포함한 수퍼워드셋을 정의하고, 이것을 이용한 온톨로지 매핑 기법을 제안한다. 실험 결과에 의하면, 제안된 기법은 기존 온톨로지 매핑 기법보다 평균 12%까지 온톨로지 매칭율을 높인 것을 보여준다.

문서 클러스터를 위한 워드넷기반의 대표 레이블 선정 방법 (Representative Labels Selection Technique for Document Cluster using WordNet)

  • 김태훈;손미애
    • 인터넷정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.61-73
    • /
    • 2017
  • 본 연구에서는 문서 클러스터링 결과 도출된 개별 클러스터가 함축하고 있는 의미를 파악하는 데 필요한 어휘들의 정보량을 활용한 문서 클러스터 레이블링(Documents Cluster Labeling) 방법을 제안하였다. 이를 위해, 클러스터에 포함된 어휘들이 해당 클러스터에서 얼마나 중요한 비중을 차지하고 있는지 파악하기 위하여 각 어휘의 출현 빈도와 정보량을 이용한 어휘의 가중치를 계산한 후, 워드넷을 이용하여 클러스터에 포함된 어휘들의 최근접 공통 상위어를 후보 레이블로 식별하였다. 이상의 과정을 거쳐 식별된 후보 레이블의 정보량과 클러스터내에서의 중요도 가중치를 활용해, 해당 클러스터의 의미와 특징을 포괄적으로 표현할 수 있는 대표 레이블을 결정하였다. 본 연구의 우수성을 입증하기 위해 다음과 같은 실험을 수행하였다. 실험은 본 연구에서 제안한 방법에 따라 선정된 레이블과 후보 레이블을 워드넷에 프로젝션한 후, 워드넷상에서 이들 레이블의 위치(깊이)를 확인하였다. 또한 선정된 후보 레이블을 상위어로 갖고 있는 클러스터 내 어휘의 수를 도출하여, 휴리스틱 방법에 따라 선정된 레이블을 전문가가 찾은 대표 레이블과의 비교를 수행하였다. 평가지표로 후보 레이블의 적합성($Suitability_{cl}$)과 대표 레이블의 적절성($Appropriacy_{rl}$)을 활용하였다. 실험 결과, 본 연구에서 제안한 방법을 적용해 문서 클러스터 레이블링을 수행할 경우, 후보 레이블의 적합성의 경우 기존의 방법보다 약간 감소하지만 계산량이 기존 방법의 약 20% 정도로 감소하였으며, 대표 레이블의 적절성의 경우 기존의 방법보다 우수한 결과를 도출하는 것을 확인하였다.

워드넷 기반 한국어 명사 어휘의미망의 정제 (Refinement of KorLex based on WordNet)

  • 황순희;윤애선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.267-272
    • /
    • 2005
  • 최근 들어 온톨로지(ontology), 시소러스(thesaurus) 등과 함께 주목받고 있는 Princeton 대학의 워드넷(WordNet, 이하 PWN) 은 자연어 처리(NLP)와 관련하여 대안을 제시할 수 있는 어휘의미망(lexico-semantic network)이다. 또한 PWN을 기반으로 상이한 개별어 어휘의미망 구축이 여러 차례 시도되었고, 현재도 진행 중이다. 본 연구는 간접 구축 방식에 의한 어휘의미망 구축 시 요구되는 정제(refinement) 방식들을 검토하고, 이를 한국어 명사 어휘의미망(KL)에 적용하여 정확도 검증 방법의 한 대안으로 제시하였다. 또한 보다 정교한 정제 방법의 모색과 고찰은 향후 과제로 삼고자 한다.

  • PDF

협동적 순위 평가와 워드넷을 이용한 검색엔진의 성능 향상 (Performance Inprovement of a Search Engine Using Collaborative Evaluation and The WordNet)

  • 김형일;김준태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2001
  • 웹에서 사용자가 원하는 정보를 정확히 추출하기란 쉬운 문제가 아닐 것이다. 이러한 정보추출의 중요성의 문제는 방대해지는 정보의 양과 직결된다. 현재 웹의 정보는 사용자들이 원하는 모든 정도를 담고 있다고 이야기할 수 있을 만큼 많은 정보들이 내재되어 있다. 그러나 이러한 정보의 홍수 속에서 사용자들은 자신이 원하는 정보를 정확히 추출하기란 쉽지 않은 일이며, 정확히 추출이 되었어도 전통적 방식을 따르는 검색엔진은 내용기반 방식을 기초로 웹페이지의 순위를 결정함으로, 사용자에게 중요한 페이지를 상위에 위치시키기란 쉬운 일이 아니다. 본 논문에서는 이러한 전통적 방식의 검색엔진의 문제점을 해결하기 위하여 협동적 순위 평가 방법과 워드넷을 기반으로 검색엔진의 성능 향상 방법을 제안한다.

  • PDF