• Title/Summary/Keyword: 의미 유사도

Search Result 1,897, Processing Time 0.025 seconds

Query expansion by Similar words Using LSI (잠재적 의미 색인을 이용한 유사 질의어 확장)

  • Lim, Tae Hun;An, Dong Un;Chung, Seong Jong
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.165-169
    • /
    • 2009
  • 오늘날 인터넷 검색은 하루가 다르게 발전되고 있다. 주로 키워드 매칭에 의존을 둔 지금의 검색 서비스들은 사용자 중심의 아이템들을 개발해 정보검색의 경과시간 및 결과의 분류면에서 우수함을 보여주고 있다. 질의어의 의미에 유사한 검색은 아직은 발전하는 단계로, 내용에 기반을 둔 검색 환경에 초점이 맞춰지고 있다. 이와 관련하여 행렬의 특이치 분해(SVD)를 이용한 잠재적 의미 색인 기법(LSI)을 본 연구에서 다루고자 한다. 구축한 시스템의 성능 평가는 재현도 계산으로 비교되었는데 작은 크기의 특이값(singular value)들 생략에 의한 SVD의 성능과 그것을 재이용, 질의어에 대한 의미 구조상 근접한 용어들을 찾아 질의어를 확장한 후 적합한 문서들의 검색을 사용한 특이값 개수, 유사단어 확장 개수를 달리하여 실험하였다. 실험 결과, 특이값 2개를 사용한 잠재적 의미 색인이 특이값 3개를 사용한 잠재적 의미 색인보다 보다 나은 성능을 보였다. 그리고 조건을 달리한 모든 잠재적 의미 색인의 경우 단어 매칭에 의한 적합문서 검색보다 별 뚜렷한 나은 결과는 보이지 않았다. 하지만 의미적으로 관계가 깊은 유사어들을 찾아냈고, 의미적으로 가장 관계 깊은 문서를 대부분의 경우에서 순위 1위로 찾아내는 부분적 우수함을 보였다.

  • PDF

A Semantic Distance Measurement Model using Weights on the LOD Graph in an LOD-based Recommender System (LOD-기반 추천 시스템에서 LOD 그래프에 가중치를 사용한 의미 거리 측정 모델)

  • Huh, Wonwhoi
    • Journal of the Korea Convergence Society
    • /
    • v.12 no.7
    • /
    • pp.53-60
    • /
    • 2021
  • LOD-based recommender systems usually leverage the data available within LOD datasets, such as DBpedia, in order to recommend items(movies, books, music) to the end users. These systems use a semantic similarity algorithm that calculates the degree of matching between pairs of Linked Data resources. In this paper, we proposed a new approach to measuring semantic distance in an LOD-based recommender system by assigning weights converted from user ratings to links in the LOD graph. The semantic distance measurement model proposed in this paper is based on a processing step in which a graph is personalized to a user through weight calculation and a method of applying these weights to LDSD. The Experimental results showed that the proposed method showed higher accuracy compared to other similar methods, and it contributed to the improvement of similarity by expanding the range of semantic distance measurement of the recommender system. As future work, we aim to analyze the impact on the model using different methods of LOD-based similarity measurement.

ARGUMENT STRUCTURE ALTERNATIONS IN ENGLISH AND KOREAN

  • 김미숙
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2001.06a
    • /
    • pp.59-73
    • /
    • 2001
  • 이 논문은 영어와 한국어에서 논 항구조의 교체를 허용하는 처소격 동사들의 통사구조와 의미를 비교 분석해 보려고 한다. 지금까지 연구가 논항구조의 교체를 허용하는 이런 동사들이 통사적 유사성에만 국한되어 연구가 되었을 뿐 여러 다른 통사적 형식에서 보여지는 차이점이나 논항 교체 동사들의 의미적 차이점과 같은 중요한 현상들에 대한 많은 연구가 되어지지 않았다. 따라서 첫 번째로 이 논문에서는 Pinker (1989)에 제시한 논항 교체 동사들의 의미적 분석을 구체적으로 소개하고, 이런 교체 동사들의 의미적 유사성과 차이점으로 구분한 Pinker의 의미분류들을 자세히 알아본다. 또한 Pinker가 교체동사들의 의미적 분류를 위해 사용한 통사적 기준인 논항 생략 (PP-omission test)을 소개한다. 두 번째로 영어의 논항 교체 동사들에 해당하는 한국어 동사들의 통사적 형태를 알아봄으로써 영어와 한국어에서의 통사적 유사성과 차이점을 알아본다. 세 번째로 영어와 한국어에서 나타나는 통사적 차이점의 설명을 위해 Pinker가제시한 의미 분류들을 수정한 새로운 분류를 제시한다 마지막으로 Jackendoff (1996)에서 제시된 의미적 설명이 영어의 논항 교체 동사에 해당하는 한국어 동사들의 통사적 형태들의 다양성을 설명할 수 있음을 보여준다

  • PDF

Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means (비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약)

  • Park, Sun;Lee, Ju-Hong
    • Journal of KIISE:Software and Applications
    • /
    • v.35 no.4
    • /
    • pp.255-264
    • /
    • 2008
  • This paper proposes a novel method using K-means and Non-negative matrix factorization (NMF) for topic -based multi-document summarization. NMF decomposes weighted term by sentence matrix into two sparse non-negative matrices: semantic feature matrix and semantic variable matrix. Obtained semantic features are comprehensible intuitively. Weighted similarity between topic and semantic features can prevent meaningless sentences that are similar to a topic from being selected. K-means clustering removes noises from sentences so that biased semantics of documents are not reflected to summaries. Besides, coherence of document summaries can be enhanced by arranging selected sentences in the order of their ranks. The experimental results show that the proposed method achieves better performance than other methods.

Video Data Modeling for Supporting Structural and Semantic Retrieval (구조 및 의미 검색을 지원하는 비디오 데이타의 모델링)

  • 복경수;유재수;조기형
    • Journal of KIISE:Databases
    • /
    • v.30 no.3
    • /
    • pp.237-251
    • /
    • 2003
  • In this paper, we propose a video retrieval system to search logical structure and semantic contents of video data efficiently. The proposed system employs a layered modelling method that orBanifes video data in raw data layer, content layer and key frame layer. The layered modelling of the proposed system represents logical structures and semantic contents of video data in content layer. Also, the proposed system supports various types of searches such as text search, visual feature based similarity search, spatio-temporal relationship based similarity search and semantic contents search.

Ontology-based Semantic Information Extraction Using An Advanced Content-based Image Retrieval (향상된 콘텐츠 기반 이미지 검색을 이용한 온톨로지 기반 의미적 정보 추출)

  • Shin, Dong-Wook;Jeon, Ho-Chul;Jeong, Chan-Back;Kim, Tae-Hwan;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.348-353
    • /
    • 2008
  • 이미지의 사용이 증가함에 따라 이미지 중 사용자가 원하는 이미지를 효율적으로 검색하기 위한 방법들이 연구되어 왔다. 본 논문에서는 질의 이미지를 분석하여 이미지 특징(feature)을 추출한 후 이미지 특징에 대한 유사도 평가를 통한 이미지 검색 및 온톨로지를 기반으로 검색된 이미지들과 유사하다고 판단된 이미지와 그러한 이미지들의 의미적 정보를 추출하는 방법을 제안한다. 제안된 시스템은 질의 이미지에서 색상, 질감, 모양 등의 특징을 추출하여 유사도 평가를 통해 검색된 이미지를 제공하고, 내용기반 이미지 검색 방식을 통해 이미지를 검색하고, 온톨로지를 이용해 이미지의 의미적 정보를 추출하여 사용자에게 이미지와 관련된 의미적 정보를 제공한다.

  • PDF

An Automatic Evaluation Metric for Korean Paraphrase via Semantic Frame (시맨틱 프레임을 이용한 한국어 패러프레이즈 자동 평가 방법)

  • Park, Hancheol;Gweon, Gahgene;Choi, Ho-jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.761-764
    • /
    • 2014
  • 본 연구는 지능형 QA시스템과 관련한 연구에서, 자동 패러프레이즈 생성 시스템을 평가하는 새로운 방법을 제시한다. 기존의 패러프레이즈 생성 시스템의 자동 평가 방법은 참조할 수 있는 패러프레이즈 정보의 양이 크게 제한되어 있었으며, 원 문장의 콘텍스트(context)와 이에 의존하는 통사적 구조(syntactic structure) 및 의미적 구조의 유사성을 고려하지 않고, 단순 구/단어 수준의 의미 유사성을 기반으로 생성된 패러프레이즈를 평가하였다. 이러한 문제를 해결하기 위해 본 연구는 시맨틱 프레임(semantic frame)을 이용한 패러프레이즈 문장 평가 방법을 제시한다. 본 연구에서 제시하는 방법론은 문장의 콘텍스트를 표현하는 프레임과 이러한 프레임이 발생시키는 통사적, 의미적 구조의 유사성을 바탕으로 원 문장과 패러프레이즈 문장의 '의미 유사성', '어휘 형태 비 유사성'을 평가하는 방식이다.

Improving The Performance of Triple Generation Based on Distant Supervision By Using Semantic Similarity (의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상)

  • Yoon, Hee-Geun;Choi, Su Jeong;Park, Seong-Bae;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.23-28
    • /
    • 2015
  • 본 논문에서는 한국어 트리플 생성 시스템의 정확도를 향상시키기 위한 distant supervision 기반의 신뢰도 측정 방법을 제안한다. 기존의 많은 패턴 기반의 트리플 생성 시스템에는 distant supervision의 기본 가정으로 인해 다수의 오류 패턴이 발생할 여지가 크다. 기존의 연구에서는 오류 패턴을 제거하기 위하여 발생 빈도, 공기 횟수 등의 통계에 기반하여 간접적으로 신뢰도를 측정하였다. 본 논문에서는 한국어 패턴과 영어 프로퍼티 사이의 의미 유사도를 측정함으로써 통계에 기반한 방법보다 더 정확한 신뢰도 측정 방법을 제안한다. 비지도 학습 방법인 워드임베딩을 활용하여 어휘의 의미를 학습하고, 이들 사이의 유사도를 측정한다. 한국어 패턴과 영어 프로퍼티의 어휘 불일치 문제를 해결하기 위하여 정준상관분석을 활용하였다. 실험 결과에 따르면 본 논문에서 제안한 패턴 신뢰도 측정 방법은 통계 기반의 방법에 비해 정확률이 9%나 더 높은 트리플 집합을 생성함을 보여주어, 의미 유사도를 반영한 신뢰도 측정이 기존의 통계 기반 신뢰도 측정보다 고품질 트리플 생성에 더 적합함을 확인하였다.

  • PDF

Semantic Image Retrieval Using Color Distribution and Similarity Measurement in WordNet (컬러 분포와 WordNet상의 유사도 측정을 이용한 의미적 이미지 검색)

  • Choi, Jun-Ho;Cho, Mi-Young;Kim, Pan-Koo
    • The KIPS Transactions:PartB
    • /
    • v.11B no.4
    • /
    • pp.509-516
    • /
    • 2004
  • Semantic interpretation of image is incomplete without some mechanism for understanding semantic content that is not directly visible. For this reason, human assisted content-annotation through natural language is an attachment of textual description to image. However, keyword-based retrieval is in the level of syntactic pattern matching. In other words, dissimilarity computation among terms is usually done by using string matching not concept matching. In this paper, we propose a method for computerized semantic similarity calculation In WordNet space. We consider the edge, depth, link type and density as well as existence of common ancestors. Also, we have introduced method that applied similarity measurement on semantic image retrieval. To combine wi#h the low level features, we use the spatial color distribution model. When tested on a image set of Microsoft's 'Design Gallery Line', proposed method outperforms other approach.

The Time-course of Interaction between Perceptual and Conceptual Representation System (시간경과와 처리유형에 따른 지각적 표상체계와 의미적 표상체계의 상호작용)

  • 김성일;이정모
    • Korean Journal of Cognitive Science
    • /
    • v.11 no.3_4
    • /
    • pp.45-55
    • /
    • 2000
  • This study was conducted to examine whether conceptual representational system was implicitly accessed while processing semantically similar but perceptually dissimilar pictures either conceptually or perceptually, The results indicated that the priming effects for the semantically similar picture pairs were found in conceptually driven processing but the effect was not found in data-driven processing. In addition. the semantic priming effect was found with 24 hour delay between the stimuli, The comparison of the recognition ratio and priming effects indicated that the priming effect was largely affected by semantically similar pictures. but recognition was relatively u unaffected, The results suggest that both Perceptual Representational System (PRS) and Conceptual Representational System (CRS) be involved during conceptually driven processing, but both PRS and CRS function independently during explicit recognition.

  • PDF