• Title/Summary/Keyword: word-net

Search Result 258, Processing Time 0.027 seconds

Topic Classification for Suicidology

  • Read, Jonathon;Velldal, Erik;Ovrelid, Lilja
    • Journal of Computing Science and Engineering
    • /
    • v.6 no.2
    • /
    • pp.143-150
    • /
    • 2012
  • Computational techniques for topic classification can support qualitative research by automatically applying labels in preparation for qualitative analyses. This paper presents an evaluation of supervised learning techniques applied to one such use case, namely, that of labeling emotions, instructions and information in suicide notes. We train a collection of one-versus-all binary support vector machine classifiers, using cost-sensitive learning to deal with class imbalance. The features investigated range from a simple bag-of-words and n-grams over stems, to information drawn from syntactic dependency analysis and WordNet synonym sets. The experimental results are complemented by an analysis of systematic errors in both the output of our system and the gold-standard annotations.

Analysis of Advertising Effect of Farm Homepages Registered in Search Engine (농가 홈페이지의 검색엔진 등록효과 분석)

  • Kwon, Yong-Dae;Kim, Eung-Cheo
    • Korean Journal of Agricultural Science
    • /
    • v.30 no.2
    • /
    • pp.191-198
    • /
    • 2003
  • This paper aims at being informed on how farms should invest resources to advertise their homepages on the internet. The number of visitors to homepage was used for analyzing the effect of advertising homepages of farmers conducting e-business. The results of analysis are as follows; (1) The daily number of visitors that has viewed homepages was 55 on average, (2) 48% of visitors came to farm homepages via search engine, which was the highest rate among accessible routes to homepage. Therefore, it was suggested that farmers should register their homepages on major search engines such as yahoo.co.kr, naver.com and daum.net in order to promote the effect of advertising homepage. We recommend that farmers should enlist the name of agricultural products on the first page of search engine view because people tend to use key word(92%) rather than homepage name(8%) when they would like to search wanted products on the internet.

  • PDF

Ontology-based models of legal knowledge

  • Sagri, Maria-Teresa;Tiscornia, Daniela
    • 한국디지털정책학회:학술대회논문집
    • /
    • 2004.11a
    • /
    • pp.111-127
    • /
    • 2004
  • In this paper we describe an application of the lexical resource JurWordNet and of the Core Legal Ontology as a descriptive vocabulary for modeling legal domains. It can be viewed as the semantic component of a global standardisation framework for digital governments. A content description model provides a repository of structured knowledge aimed at supporting the semantic interoperability between sectors of Public Administration and the communication processes towards citizen. Specific conceptual models built from this base will act as a cognitive interface able to cope with specific digital government issues and to improve the interaction between citizen and Public Bodies. As a Case study, the representation of the click-on licences for re-using Public Sector Information is presented.

  • PDF

Implementation and Model to Automatically Generate an Ontology for Korean (한국어에 적합한 자동 온톨로지 생성을 위한 모델 제안 및 구현)

  • Jung, Young-Giu;Park, Mi-Sung;Choi, Jae-Hyuk;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.173-176
    • /
    • 2003
  • 본 논문은 언어학적 데이터로부터 자동으로 온톨로지를 생성하기 위한 모델을 제안하고 이를 구현한다. 모델 제안을 위해 온톨로지의 기본 구성 요소인 개념과 관계를 정의하고 이러한 개념과 관계 객체를 자동으로 추출하는 알고리즘을 제안한다. WordNet을 이용하여 개념을 자동으로 추출하고, 추출된 개념들간의 관계는 한국어의 구문적 특성을 이용하여 관계의 기본 형태를 정의하고 이를 기반으로 관계를 추출한다. 본 논문은 특허문서에서 전기통신기술문서를 대상으로 구현했으며, 제안된 알고리즘을 다른 영역으로 확장하여 이를 검증할 것이다.

  • PDF

Concept based Image Retrieval Using Similarity Measurement Between Concepts (개념간 유사성 측정을 이용한 개념 기반 이미지 검색)

  • 조미영;최춘호;신주현;김판구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.253-255
    • /
    • 2003
  • 기존의 개념 기반 이미지 검색에서는 이미지의 의미적 내용 인식을 위해 일반적으로 어휘적 정보나 텍스트 정보를 이용했다. 이러한 텍스트 정보 기반 이미지 검색은 전통적인 검색 방법인 키워드 검색 기술을 그대로 사용하여 쉽게 구현할 수 있으나 텍스트의 개념적 매칭이 아닌 스트링 매칭이므로 주석처리된 단어와 정확한 매칭이 없다면 찾을 수가 없었다. 이에 본 논문에서는 ontology의 일종인 WordNet을 이용하여 깊이 정보량 링크 타입, 밀도 등을 고려한 개념간 유사성 측정으로 패턴 매칭의 문제를 해결하고자 했다. 또한 키워드로 주석처리 되어 있는 Microsofts Design Gallery Live의 이미지를 이용하여 개념간 유사성 측정법을 실질적으로 개념 기반 이미지 검색에 적용해 보았다.

  • PDF

Performance Inprovement of a Search Engine Using Collaborative Evaluation and The WordNet (협동적 순위 평가와 워드넷을 이용한 검색엔진의 성능 향상)

  • 김형일;김준태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.103-105
    • /
    • 2001
  • 웹에서 사용자가 원하는 정보를 정확히 추출하기란 쉬운 문제가 아닐 것이다. 이러한 정보추출의 중요성의 문제는 방대해지는 정보의 양과 직결된다. 현재 웹의 정보는 사용자들이 원하는 모든 정도를 담고 있다고 이야기할 수 있을 만큼 많은 정보들이 내재되어 있다. 그러나 이러한 정보의 홍수 속에서 사용자들은 자신이 원하는 정보를 정확히 추출하기란 쉽지 않은 일이며, 정확히 추출이 되었어도 전통적 방식을 따르는 검색엔진은 내용기반 방식을 기초로 웹페이지의 순위를 결정함으로, 사용자에게 중요한 페이지를 상위에 위치시키기란 쉬운 일이 아니다. 본 논문에서는 이러한 전통적 방식의 검색엔진의 문제점을 해결하기 위하여 협동적 순위 평가 방법과 워드넷을 기반으로 검색엔진의 성능 향상 방법을 제안한다.

  • PDF

A Study on Semantic Annotation System for Multimedia File (멀티미디어 파일에 대한 시맨틱 어노테이션에 관한 연구)

  • Hwang, In-Moon;Yoo, Nam-Hyun;Song, Gil-Jong;Kim, Won-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06d
    • /
    • pp.301-305
    • /
    • 2007
  • 기존의 멀티미디어 자료들을 직접 분석하여 메타데이터를 부여하던 기존 연구들은 멀티미디어 파일에 부여된 키워드에 해당하는 온톨로지가 존재하지 않는 경우 해당 멀티미디어 파일에 대한 직접 검색을 실시하지 않거나, 잘못된 의미가 부여된 키워드에 의하여 검색 결과의 정확성과 재현율이 떨어지는 문제점을 가지고 있었다. 본 논문에서 제안한 SASM은 키워드에 부여된 다의성과 동의성의 개념을 이용하여 WordNet을 이용하여 확장한 후, 확장된 키워드들을 이용하여 온톨로지가 구축되어 있지 않더라도 해당 이미지에 대한 직접 분석을 실시할 수 있으며, 키워드에 대한 동의성과 다의성을 이용한 확장된 키워드들을 이용함으로써 검색 결과의 재현율과 정확성의 성능을 향상시켰다.

  • PDF

A Semantic Case Scheme and a Feature Set for Processing Prepositional Phrases in English-to-Korean Machine Translation (영한 기계변역에서의 전치사구 처리를 위한 격의미 체계와 의미속성 집합)

  • Kang, Won-Seog;Seo, Jung-Yun;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.177-180
    • /
    • 1994
  • 영한 기계변역에서의 전치사구 처리는 자연어 처리의 중요한 연구과제 중 하나이다. 특히 전치사구의 격의미는 그에 대한 한국어 표현에 중요한 실마리가 된다. 본 논문은 영어의 전치사구에 대한 한국어 표현을 선택하기 위한 격의미 체계를 정의하고 그 격의미 체계를 실험한다. 이 격의미 체계는 전치사구에 대한 한국어의 격의미를 분별함으로 보다 좋은 한국어 격조사를 선택하게 해준다. 본 논문에서는 각 격의미의 구분을 위한 의미속성 집합도 정의한다. 이 의미속성 집합은 WordNet의 시소러스에서 제공한 상하위 관계와 변환표를 근거로 자동적으로 추출된다. 의미속성 집합의 자동획득은 격의미 체계의 표현과 기계변역의 성능 평가에 일반성을 부여한다. 격의미 체계와 의미속성 집합의 자동 획득은 영한 기계변역은 물론 한국어 생성과 자연어 처리에 중요한 기여를 할 것으로 보인다.

  • PDF

Adaptive Thesaurus using a Neural Network (신경망을 이용한 적응형 시소러스)

  • Choe, Jong-Pil;Choe, Myeong-Bok;Kim, Min-Gu
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.12
    • /
    • pp.1211-1218
    • /
    • 2000
  • 정보검색 분야에서 시소러스 용어와 용어 사이의 관계를 나타내어, 질의어와 검색될 정보 사이에 존재하는 용어적 차이를 줄이는데 사용될 수 있다. 시소러스를 사용하는 방법 중 진보된 것은 용어 사이의 관계에 가중치를 주어, 소위 스프레딩 엑티베이션 방법을 이용하여 주어진 용어에서 다른 용어들 사이의 유사성을 측정하여 이를 검색에 이용한다. 그러나, 이러한 방법은 가중치를 어떻게 할당하느냐에 따라 그 결과가 달라지는 문제점이 발생한다. 본 논문에서는 시소러스의 가중치를 사용자의 검색된 정보에 대한 적합성 반응에 근거하여 조절할 수 있는 신경망 기반 시소러스를 제안한다. 제안된 시소러스의 타당성을 위하여 프로토타입의 시소러스를 WordNet으로부터 추출하여 실험하였으며, 그 결과로 recall-precision 값이 향상됨을 보였다.

  • PDF

A Logical Framework for Image Object Representation (이미지 개체 표현을 위한 논리적 프레임워크)

  • Choi, Jun-Ho;Kim, Sung-Suk;Choi, Chang;Kim, Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.197-200
    • /
    • 2005
  • 의미 기반 영상 검색은 Color, Texture, Region 정보, Spatial Color Distribution 등의 저차원 특징 정보와 이미지 데이터에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드나 시소러스와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 따라서 본 논문에서는 WordNet 어휘 사전을 확장한 개념적 어휘 체계를 갖는 대형 Ontology를 기반으로 하여 이미지 데이터 내의 객체 인식과 추출된 객체간의 관계를 정의하여 이를 논리적으로 표현할 수 있는 방법을 제시하고자 한다.

  • PDF