• 제목/요약/키워드: 워드 넷

검색결과 99건 처리시간 0.026초

감정요소를 이용한 SNS 메시지 분류기 구현에 대한 연구 (A Study on the Implementation of SNS Message Classification by Emotion Factors)

  • 김재영;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.217-222
    • /
    • 2011
  • 최근 SNS가 급격하게 성장하고 있고 많은 사용자들이 이 SNS를 하나의 다른 커뮤니케이션 매체로 사용하고 있다. SNS를 이용하는 개인 사용자들은 자신의 소식과 감정의 변화를 표현하는 수단으로 SNS를 이용하고 있다. 이에 본 연구에서는 감정을 나타내는 감정 요소를 이용하여 메시지를 분류하는 프로그램을 구현하였다. 감정 성분 추출은 OMLS(Ocean-Monmouth Legal Services)에 있는 감정 어휘를 이용하여 로젯(Roget)의 시소러스와 워드넷(WordNet)을 이용하여 이루어졌다.

위키피디아에 기반한 단어 사이의 의미적 연결 관계 탐색 (Discovering Semantic Relationships between Words by using Wikipedia)

  • 김주황;홍민성;이오준;정재은
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
    • /
    • pp.17-18
    • /
    • 2015
  • 본 논문에서는 위키피디아를 이용하여 단어 사이의 유사도와 내포된 연결 단어들에 대한 탐색 기법을 제안 한다. 위키피디아에서 제공하는 API를 이용하여 두 단어 사이를 탐색함으로써, 기존 단어 사이의 유사도를 계산하는 방식보다 더 간단하고 폭 넓은 의미 집단을 포괄할 수 있다. 이는 그래프적 특성에 기반하며 그래프를 구성하는 방식으로써 동적 방식과 정적 방식으로 구성된다.

  • PDF

한영 교차언어 정보검색에서 질의 변환 및 질의 확장 방법 (Query Translation and Query Expansion Method in Korean-to-English Cross-Language Information Retreival)

  • 김백일;서희철;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.235-242
    • /
    • 2002
  • 본 논문은 한영 교차언어 정보검색을 위한 질의 변환 방법과 질의 확장에 대해서 기술하고 있다. 한영 교차언어 정보 검색은 한국어 질의와 관련된 영어 문서를 검색하는 것을 말하며, 한국어 질의를 영어 질의로 변환하는 방법을 사용했다. 이를 위해 한국어 단어들에 대한 영어 대역어들의 공기 정보를 이용하며, 공기 정보로는 상호 정보를 사용했다. 또한 한국어와 영어의 연어 사전을 사용하여 성능을 향상시켰다. 추가적인 검색 성능 향상을 위한 방법으로, 기존 연구에서 많이 사용된 적합성 피드백에 의한 지역적 질의 확장 대신, 영어 워드넷을 확장하여 구축한 한영 이중언어 시소러스를 사용하여 질의 확장을 하는 전역적 질의 확장을 시도하였다. 실험결과, 정확률의 향상보다는 재현율의 향상 정도가 더 컸으며, 긴 질의보다 짧은 질의를 확장한 경우가 성능이 높았다.

  • PDF

단어간의 연관성을 고려한 어휘 체인 기반 자동 요약 (Automatic Summarization based on Lexical Chains considering Word Assocication)

  • 송영인;한경수;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.300-305
    • /
    • 2002
  • 자동 문서 요약 분야에서 대상 문서를 컴퓨터가 이해할 수 있는 형태로 어떻게 파악하고 구조화할 것인가는 중요한 이슈가 되어 왔다. 문서에 출현한 단어들은 Bag of Words 가정처럼 서로 독립적으로 존재하는 것이 아니라 문서가 쓰여진 의도에 따라 서로 간의 의미적, 혹은 지시적으로 연관되어 있다. 이러한 단어간의 연관성은 결속성(cohesion)이라고 표현하며, 이를 이용한 자동 방법으로 Barzilay의 어휘 체인(lexical chain)을 사용한 자동 방법이 대표적이다. 본 연구에서는 단어간의 연관성과 영문 시소러스인 워드넷(wordnet)에서 단어의 위치 정보를 사용하여 어휘 체인의 성능을 개선하였고, 대상 문서의 개념을 어휘 체인에 기반해 표현하여 자동의 성능을 개선하는 방안을 제시한다.

  • PDF

통계정보와 WordNet을 이용한 복합명사 분석 (Nominal Compound Analysis Using Statistical Information and WordNet)

  • 류민홍;나동열;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-40
    • /
    • 2000
  • 복합명사의 한 구조는 구성 명사간의 수식관계의 집합이라고 본다. 한 복합명사에 대하여 가능한 여러 구조 중에서 올바른 구조를 알아 내는 것이 본 논문의 목표이다. 이를 위하여 우리는 최근에 유행하는 통계 기반 분석 기법을 이용한다. 먼저 우리의 복합 명사 분석 문제에 알맞은 통계 모델을 개발하였다. 이 모델을 이용하면 분석하려는 복합명사의 가능한 분석 구조마다 확률 값을 얻게 된다. 그 다음 가능한 구조들 중에서 가장 확률값이 큰 구조를 복합명사의 구조로 선택한다. 통계 기반 기법에서 항상 문제가 되는 것이 데이터 부족문제이다. 우리는 이를 해결하기 위해 개념적 계층구조의 하나인 워드넷(WordNet)을 이용한다.

  • PDF

이질의 도메인 온톨로지내의 개념간 병합 방법 연구 (A Study on the Methodology for Merging the Heterogeneous Domain Ontologies)

  • 공현장;황명권;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.677-680
    • /
    • 2004
  • 시맨틱 웹의 개발에 대한 연구가 많이 진행됨에 따라 많은 도메인 온톨로지들이 구축되고 있다. 많은 개발자들이 연구 겉과를 바탕으로 온톨로지를 제작하고 있으나, 개발자들의 개인 관점의 차이, 명확한 온톨로지 구축 방법론의 부재, 온톨로지 구축 도구의 다양성 등의 문제에 따라 동일한 주제의 온톨로지 일지라도 내용에서 많은 차이점이 발생하고 있다. 이러한 온톨로지 언어적 수준, 온톨로지적 수준의 차이 때문에 각각 온톨로지의 상호운용성이 떨어진다. 또한 현재 온톨로지 구축 도구들의 기능들은 온톨로지 생성, 편집, 추론 등이 주를 이루고 있고, 동일한 주제에 대한 이질의 도메인 온톨로지를 병합하는 기능은 부족한 실정이다. 이에 본 논문에서는 각각의 개발자에 의해 개발된 동일한 도메인의 온톨로지들을 병합하여 더욱 완전한 온톨로지 구축을 위한 병합 방법을 연구하였다. 병합 방법은 대형의 온톨로지인 워드넷(WordNet)을 기반으로 하여, 이러한 이질의 도메인 온톨로지들을 공통된 주제를 중심으로 세부적인 단계를 거쳐 병합을 꾀하였다.

  • PDF

홈서버 환경에서 메타데이터 기반의 검색 설계 (A design of metadata based search method in Homeserver)

  • 김재원;김진형;최오훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.199-201
    • /
    • 2005
  • 유비쿼터스 환경의 시발점인 홈 네트워크 기술은 홈서버를 중심의 댁내 모든 가전기기들을 하나의 네트워크로 연결함으로써 사용자가 언제 어디에서 단말 기기를 이용하여 댁내의 상황을 모니터링하고 모든 기기들을 제어할 수 있게 해주는 기술이다. 홈 네트워크의 핵심인 홈서버는 다양한 가전기기로부터 다량의 멀티미디어 콘텐츠를 저장하며, 다른 홈서버 또는 모바일 단말을 이용하여 검색과 공유가 가능하다. 그러나, 홈서버와 각 모바일 단말이 가지는 콘텐츠에 대한 메타데이터는 일관성을 가지지 않기 때문에 콘텐츠 검색이 용이하지 않고, 사용자가 직접 메타데이터 간의 유사성을 파악해야하는 문제점이 있다. 또한 메타 데이터간의 이질성으로 인해 이종 기기들 간의 콘텐츠의 검색, 공유 또한 힘들다. 따라서 홈서버들 간의 일관적인 데이터 입력과 공유를 위하여 멀티미디어 콘텐츠에 일반적으로 적용되는 Mepg-7 기반의 메타데이터 레지스트리 설계를 제시한다. 또한 이질적인 메타데이터를 지니는 홈서버-모바일 단말 간의 콘텐츠 공유를 위하여 워드넷 기반의 온톨로지 설계를 본 논문에서 제시한다.

  • PDF

워드넷 온톨로지를 이용한 토픽맵 매핑 (Mapping Topic Maps using WordNet ontology)

  • Yoo, Woo-Jong;Kim, Jin-Woo;Kwon, Ju-Hum
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.175-177
    • /
    • 2004
  • In this paper, we provide a mechanism to map topics between similar Topic Map ontologies, which enlarge the capacities of current Topic Maps. That is, there is no explicit way to map topics across multiple Topic Maps in current technology. Therefore, our approach provide semi-automatic or automatic mapping of topics between Topic Maps. In order to map the topics, we provide precise definitions of mapping properties and mapping rules.

  • PDF

위키피디아를 이용한 지식베이스 개념 확장 방법 (Knowledge Base Population Method using Wikipedia)

  • 황영권;최동진;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.1-4
    • /
    • 2010
  • 다양한 분야에 소속된 사람들이 사용하고 있는 개념들을 기존의 워드넷과 같은 지식베이스가 모두 포함하지 못한다는 한계점이 지적되었다. 본 연구에서는 이를 해결하기 위해 위키피디아 문서집합의 분석을 통하여 해결하고자 한다. 위키피디아는 현재 320만개 이상의 유/무형의 개체에 대한 상세한 설명을 포함하고 있으며, 현재도 해당 분야의 전문가들에 의해 지속적으로 제목(주제) 생성 및 내용 작성이 수행되고 있다. 이에, 위키피디아 문서는 지식베이스의 개념 확장을 위해 아주 유용한 자원이 될 수 있으며, 본 논문에서는 이러한 위키피디아 문서 제목의 개념화를 통해 기존의 지식베이스와 연결하는 의미적인 방법을 기술한다. 이를 이용한 간단한 실험을 통하여 본 연구가 우월한 가능성이 있음을 파악하였다.

  • PDF

군집 주제의 유의어와 유사도를 이용한 문서군집 향상 방법 (Enhancing Document Clustering Method using Synonym of Cluster Topic and Similarity)

  • 박선;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1538-1541
    • /
    • 2011
  • 본 논문은 군집 주제의 유의어와 유사도를 이용하여 문서군집의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 비음수행렬분해의 의미특징을 이용하여 군집 주제(topic)의 용어들을 선택함으로서 문서 군집 집합의 내부구조를 잘 표현할 수 있으며, 군집 주제의 용어들에 워드넷의 유의어를 사용하여서 확장함으로써 문서를 용어집합(bag-of-words)으로 표현하는 문제를 해결할 수 있다. 또한 확장된 군집 주제의 용어와 문서집합에 코사인 유사도를 이용하여서 군집의 주제에 적합한 문서를 잘 군집하여서 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.