• Title/Summary/Keyword: 의미적 유사성 검색

Search Result 96, Processing Time 0.031 seconds

A Structured Tag Clustering Method using Semantic Similarities for Photo Categorization (사진 콘텐츠의 분류를 위한 의미적 유사도 기반 구조적 태그 클러스터링 기법)

  • Won, Ji-Hyeon;Park, Hee-Min;Lee, Jong-Woo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.427-429
    • /
    • 2012
  • 개인이 사용할 수 있는 스마트 기기가 다양해지면서 여러 기기로 생산된 사진 콘텐츠가 어떤 기준이나 규칙 없이 분산되어 있어 콘텐츠를 관리하고 원하는 콘텐츠를 검색하는 것이 어려워졌다. 따라서 본 논문에서는 개인 사진 콘텐츠를 효과적으로 분류하기 위하여 의미적 유사도를 기반으로 한 태그 클러스터링 기법을 제안한다. 태그들 사이의 유사도를 계산하여 서로 관련이 있다고 판단되는 태그들을 클러스터링 하는데, 태그가 같은 클러스터에 포함되어 있으면 그 태그를 가진 사진들도 유사성을 가진다고 볼 수 있으므로 개인 사진들을 의미에 따라 분류하는데 이용할 수 있다.

Bootstrap Mining for Searching Similar Content of XML Data (XML 데이터의 유사내용 검색을 위한 Bootstrap Mining)

  • Lee Han-Su;Park Jong-Hyun;Kang Ji-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.517-519
    • /
    • 2005
  • 인터넷 상의 정보교환을 위한 국제표준인 XML은 여러 분야의 응용에 사용되며 응용의 특성에 따라 다양한 형태의 구조로 정의되어 사용된다. 이러한 XML은 응용에 따라 의미적으로 유사한 정보라 하더라도 서로 다른 구조정보를 가질 수 있으며 때로는 스키마(DTD)가 없는 XML문서 형태로 존재하기도 한다. 그 결과 특정 영역(동일 스키마 따르는)의 응용들 사이의 통합은 용이해 졌으나 서로 다른 영역 또는 영역에서 소외된 응용과의 통합은 여전히 문제로 남아있다. 본 연구에서는 대부분의 XML문서는 구조정보에 의미를 내포하고 있다는 특성을 고려하여 문서의 구조정보만을 이용하여 서로 다른 영역의 정보들 사이의 유사성을 판단하고 이를 이용하여 의미적으로 유사한 정보를 찾는다. 또한 XML 문서의 특성을 고려하여 보다 정확한 유사정보를 찾기 위하여 처리의 단위를 정의하고 이를 기반으로 프로토타입 시스템을 구현하였다.

  • PDF

Effective Keyword Search on Semantic RDF Data (시맨틱 RDF 데이터에 대한 효과적인 키워드 검색)

  • Park, Chang-Sup
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.11
    • /
    • pp.209-220
    • /
    • 2017
  • As a semantic data is widely used in various applications such as Knowledge Bases and Semantic Web, needs for effective search over a large amount of RDF data have been increasing. Previous keyword search methods based on distinct root semantics only retrieve a set of answer trees having different root nodes. Thus, they often find answer trees with similar meanings or low query relevance together while those with the same root node cannot be retrieved together even if they have different meanings and high query relevance. We propose a new method to find diverse and relevant answers to the query by permitting duplication of root nodes among them. We present an efficient query processing algorithm using path indexes to find top-k answers given a maximum amount of root duplication a set of answer trees can have. We show by experiments using a real dataset that the proposed approach can produce effective answer trees which are less redundant in their content nodes and more relevant to the query than the previous method.

Similarity Measure between Ontologies using OWL Properties (OWL 속성을 이용한 온톨로지 간 의미 유사도 측정 방법)

  • Ahn Woo-Sik;Park Jung-Eun;Oh Kyung-Whan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.169-171
    • /
    • 2006
  • 인터넷이 보다 대중화되고 광범위해지면서 의미적 관계에 따라 정보를 저장하는 온톨로지 시스템이 미래의 지능적인 컴퓨터를 위한 적절한 수단으로 각광받고 있다. 하지만 온톨로지와 같은 메타 데이터를 사용한 방법은 그 사용 목적 또는 작성자의 개인적인 관점에 따라 다양한 이질적인(heterogeneous) 형태를 띠게 된다. 이러한 이질적인 정보들은 데이터가 다른 시스템에서 처리되는 것을 어렵게 한다. 정보의 상호운용성을 보장하기 위해서는 서로 다른 온톨로지 시스템간의 개체에 대한 유사도를 평가할 수 있어야 한다. 따라서 두 개의 다른 OWL 언어로 정의된 온톨로지 사이에서 두 개의 엔티티의 유사도를 측정하기 위한 새로운 유사도 척도(similarity measure)를 제안하였다. 이는 온톨로지 상의 이질적인 정보를 통합하는데 사용되며, 온톨로지 비교(comparison), 정렬(alignment), 매칭(matching) 그리고 병합(merging)의 기반이 되는 중요한 기법이다. 새로운 유사도 척도는 특정한 매핑 정보를 사용하지 않고 온톨로지 언어의 속성을 기반으로 하므로 OWL을 사용한 온톨로지 간의 유사도 검색에 곧바로 적용될 수 있는 장점을 지닌다.

  • PDF

Design of Multimedia Retrieval System based on XML (XML기반 멀티미디어 검색시스템의 설계)

  • Yoon, Mi-Hee;Cho, Dong-Uk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.59-62
    • /
    • 2003
  • 컴퓨팅 기술의 발달 밍 보편화로 인해 사용자들의 멀티미디어에 대한 요구가 증가하였고, 이러한 요구를 만족시키기 위해서는 단순한 텍스트 형식의 데이터가 아닌 멀티미디어 데이터, 특히 비디오 데이터에 대한 저장, 관리, 검색하는 기능이 필수적이다. 본 논문에서는 비디오데이터에 대한 효율적인 의미검색을 위해 주석기반 검색뿐만 아니라 특징기반 검색을 지원한다. 특히 사용자가 원하는 객체나 장면의 유사성 검색이 가능하며, 장면의 검색 결과로 제시된 장면을 선택한 후 선택된 장면을 기반으로 사용자가 원하는 좀 더 정확한 장면의 검색을 위한 SQBE(scene-query-by-example) 질의가 가능한 XML 기반 멀티미디어 검색시스템을 제안한다.

  • PDF

An Intelligent Travel Agent System using Region Ontology (지역 온톨로지를 이용한 지능형 여행정보 제공 시스템)

  • Ko, Eun-Jung;Kim, Yeo-Jung;Jin, Yun;Kang, Ji-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.610-612
    • /
    • 2004
  • 사례기반 추론 기법 등을 이용한 여행정보 제공 시스템은, 도메인 용어를 이용하여 사례 표현과 유사도 검색을 하기 때문에, 사례 기술의 제약을 받고, 사례 검색에서도 사용자가 요구하는 결과를 의미에 맞게 검색을 하지 못하며, 다른 시스템간의 상호운용성(interoperability)을 제공하지 못한다는 단점이 있다. 이러한 단점을 극복하기 위해, 여행정보 제공 시스템에 지역 온톨로지 정보를 이용하게 되면, 용어의 타입, 계층, 관계 등을 기술 할 수 있게 되어 사례기반 추론의 한계점을 극복하여 보다 의미적으로 정확한 사례표현과, 검색 결과를 생성할 수 있으며, 더 나아가 차세대 지능형 웹으로 급부상하는 시맨틱 웹에서도 활용이 가능하게 된다. 본 논문에서는, 지역 온톨로지 정보를 이용한 여행 정보 제공시스템의 장점에 대해 고찰하였으며, 그 증명용 프로그램을 설계 및 개발하였다. 본 논문에서 개발한 시스템은 사용자의 요구를 의미적으로 매핑 할 수 있으며, 용어 사이의 관계를 기술하여 여러 시스템 사이의 상호운용성(interoperability)을 제공하며, 분산 환경에서 데이터의 공유를 가능하게 한다.

  • PDF

DART: Data Augmentation using Retrieval Technique (DART: 검색 모델 기술을 사용한 데이터 증강 방법론 연구)

  • Seungjun Lee;Jaehyung Seo;Jungseob Lee;Myunghoon Kang;Hyeonseok Moon;Chanjun Park;Dahyun Jung;Jaewook Lee;Kinam Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.313-319
    • /
    • 2022
  • 최근 BERT와 같은 트랜스포머 (Transformer) 기반의 모델이 natural language understanding (NLU)와 같은 여러 자연어 처리 태스크에서 좋은 성능을 보인다. 이러한 모델은 여전히 대용량의 학습을 요구한다. 일반적으로, 데이터 증강 기법은 low-resource 환경을 개선하는 데 도움을 준다. 최근 생성 모델을 활용해 합성 데이터를 생성해 데이터를 증강하는 시도가 이루어졌다. 이러한 방법은 원본 문장과 의미론적 유사성을 훼손하지 않으면서 어휘와 구조적 다양성을 높이는 것을 목표로 한다. 본 논문은 task-oriented 한 어휘와 구조를 고려한 데이터 증강 방법을 제안한다. 이를 위해 검색 모델과 사전 학습된 생성 모델을 활용한다. 검색 모델을 사용해 학습 데이터셋의 입력 문장과 유사한 문장 쌍을 검색 (retrieval) 한다. 검색된 유사한 문장 쌍을 사용하여 생성 모델을 학습해 합성 데이터를 생성한다. 본 논문의 방법론은 low-resource 환경에서 베이스라인 성능을 최대 4% 이상 향상할 수 있었으며, 기존의 데이터 증강 방법론보다 높은 성능 향상을 보인다.

  • PDF

A Comparative Study on the Effectiveness of Hangul Natural Language Retrieval Using KT Test Set (KT Test Set을 이용한 우리말 자연언어검색의 효율성에 관한 비교연구)

  • 이현아;김성혁
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1995.08a
    • /
    • pp.37-40
    • /
    • 1995
  • 본 연구는 자연언어시스템에서 색인어와 탐색어의 특정성에 기인하는 재현율 감소를 극복하기 위한 방법론으로써 탐색어의 확장을 통한 검색효율을 평가하였다. 이를 위하여 우리말 데이터베이스를 대상으로 주제전문가가 자연언어로 작성한 원 질의문 (Q1), 원 질의문에 사용된 탐색어와 데이터베이스내의 색인어간의 유사도를 이용하여 탐색어를 확장한 질의문 (Q2(0.2), Q2(0.3)), 주제전문가인 이용자가 Q1의 의미적인 관계를 고려해서 자연언어로 탐색어를 확장한 질의문 (Q3)을 검색효율면에서 비교하였다. 실험결과, 평균재현율은 Q2(0.2), Q2(0.3), Q3, Q1의 검색의 순이었다. 평균정확율은 Q3, Q2(0.3), Q1, Q2(0.2)검색의 순으로 나타났다.

  • PDF

A Study on the building Dataset of Similar Case Matching in Legal Domain using Deep Learning Algorithm (딥러닝 알고리즘을 이용한 유사 판례 매칭 데이터셋 구축 방안 연구)

  • Kang, Ye-Jee;Kang, Hye-Rin;Park, Seo-Yoon;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.72-76
    • /
    • 2021
  • 판례는 일반인 또는 법률 전문가가 사건에 참조하기 위해 가장 먼저 참고할 수 있는 재판의 선례이다. 하지만 이러한 판례의 유용성에도 불구하고 현 대법원 판례 검색 시스템은 판례 검색에 용이하지 않다. 왜냐하면 법률 전문 지식이 없는 일반인은 검색 의도에 부합하는 검색 결과를 정확히 도출하는 데 어려움이 있으며, 법률 전문가는 검색에 많은 시간과 비용이 들게 되기 때문이다. 이미 해외에서는 유사 케이스 매칭 데이터셋을 구축하여 일반인과 전문가로 하여금 유사 판례 검색을 용이하게 할 뿐만 아니라 여러 자연어 처리 태스크에도 활용하고 있다. 하지만 국내에는 법률 AI와 관련하여 오직 법률과 관련한 세부 태스크 수행에 초점을 맞춘 연구가 많으며, 리소스로서의 유사 케이스 매칭 데이터셋은 구축되어 있지 않다. 이에 본 논문에서는 리소스로서의 판례 데이터셋을 위해 딥러닝 알고리즘 중 문서의 의미를 반영할 수 있는 Doc2Vec 임베딩 모델과 SBERT 임베딩 모델을 적용하여 판례 문서 간 유사도를 측정·비교하였다. 그 결과 SBERT 모델을 통해 도출된 유사 판례가 문서 간 내용적 유사성이 높게 나타났으며, 이를 통해 SBERT 모델을 이용하여 유사 판례 매칭 기초 데이터셋을 구축하였다.

  • PDF

A Hot Coil Quality Design Su, pp.rt System using Case Based Reasoning (사례기반추론을 이용한 열연제품 품질설계지원시스템)

  • 고영관;박상혁;서민수;임여종
    • Journal of Intelligence and Information Systems
    • /
    • v.3 no.1
    • /
    • pp.101-109
    • /
    • 1997
  • 철강제품의 품질설계란 제품의 주문요구조건을 만족시키기 위해 제품의 성분 및 생산공정을 결정하는 과정을 의미한다. 본 연구에서는 품질설계업무를 지원하기 위한 시스템을 개발하였다. 설계업무의 특성을 고려하여 과거사례를 설계에 이용하기 위해, 사례기반추론(Case-based Reasoning)접근방법을 이용하였다. 본 연구에서는 또한 유사사례의 효율적 검색을 위해 품질설계 문제에 적합한 유사성척도를 제안하고 있으며, 문제에 적합한 유사성척도를 제안하고 있으며, 문제에 적합한 지식관리 방법 및 설계조정 방법을 개발하였다.

  • PDF