• 제목/요약/키워드: Semantic search

검색결과 435건 처리시간 0.031초

온톨로지기반 추론을 이용한 시맨틱 검색 시스템 (Semantic Search System using Ontology-based Inference)

  • 하상범;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.202-214
    • /
    • 2005
  • 시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.

Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링 (XML-based Modeling for Semantic Retrieval of Syslog Data)

  • 이석준;신동천;박세권
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.147-156
    • /
    • 2006
  • 이벤트 로깅은 시스템 및 네트워크 관리에 있어 그 역할이 증대되고 있으며, syslog는 해당 분야에 있어 사실상의 표준으로 사용되고 있다. 그러나 대부분의 로그 분석은 반구조적 특징을 보이는 로그 형식으로 인하여 빈번히 출현하는 패턴에만 집중하고 있다. XML은 syslog 데이터를 구조화하는 데 있어 유용한 방식을 제공하고 정보 탐색을 용이하게 해 준다. 하지만 이전의 XML 형식들 및 어플리케이션들은 로그 데이터를 위한 순위 기반 검색이나 유사도 측정 등과 같은 의미론적 접근에 적합하지 않다. 본 논문에서는 XML 기반의 순위 키워드 검색 기법을 기초로, 새로운 로그 데이터 모델링을 통해 syslog 데이터를 위한 XML 트리 구조를 제안한다. 그리고 기존의 XML 구조보다 의미론적 검색에 적합함을 보인다.

시맨틱 웹 포털에서의 검색과 시각화 방법 연구 (Search and Visualization Method on the Semantic Web Portal)

  • 이명진;이기준;박상언;홍준석;김우주
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2008년도 연합학회학술대회
    • /
    • pp.389-403
    • /
    • 2008
  • 웹에서의 정보가 지속적으로 늘어남에 따라 현재의 웹은 더욱 더 많은 한계를 드러내고 있다. 정보검색의 측면에서 본다면 웹 페이지는 사람이 이해하기 위한 표현 정보만을 담고 있기 때문에 사용자는 단순히 키워드의 포함 여부에 따라 많은 문서를 검색 결과로 제공받게 되며, 이들 사이에 필요한 정보를 발췌하는데 많은 시간을 소비하게 된다. 이러한 문제를 해결하기 위한 노력의 일환으로 W3C에 의해 시맨틱 웹이 제안되었다. 시맨틱 웹은 자원과 자원간의 관계 정보로 이루어진 온톨로지를 기반으로 하고 있으며, 따라서 사용자는 온톨리지 기반의 검색을 통해 의미 있는 정보를 제공받을 수 있다. 온톨로지는 의미적인 정보를 담고 있기 때문에 사용자에게 적절한 정보를 제공해 줄 수 있는 새로운 검색 방법과 이를 사용자에게 보여줄 수 있는 시각화 방법을 요구하게 된다. 본 연구에서는 온톨로지를 기반으로 한 의미적 정보의 연관관계를 찾아나가는 검색 방법과 이를 사용자에게 제공해 주기 위한 시각화 방법을 제안하고자 한다. 논문에서 제안하고자 하는 바는 온톨로지로부터 사용자의 질의와 관련된 자원과 다른 자원 사이의 관계를 검색해서 제공하고자 하는 것이다. 이를 통해 사용자는 단순히 질의어가 포함된 결과가 아닌 질의어와 다른 자원간의 관계를 파악할 수 있으며, 자원 간의 관계를 기반으로 탐색해 나갈 수 있다.

  • PDF

SSD에서의 시맨틱 파일 검색을 위한 확장된 속성 제공의 로그기반 파일시스템 (Attribute-Rich Log-Structured Filesystem for Semantic File Search on SSD)

  • 기안호;강수용
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권2호
    • /
    • pp.241-252
    • /
    • 2011
  • 운영체제의 다른 부분이나 저장장치, 매체의 변화에 비해 파일시스템은 지난 수십 년 간 그 발전 속도가 더딘 편이다. 그러나 데이터의 증가에 따라 파일의 개수는 기하급수적으로 증가하고 있으며, 이렇게 늘어난 파일들에 대해 검색을 효율적으로 수행하기 위한 새로운 파일시스템 구조에 대한 연구가 최근 파일에 대한 시맨틱 검색을 하고자 하는 요구와 맞물려 주목 받고 있다. 하지만 이러한 연구는 저장 장치와 바로 맞닿는 계층이 아닌 더 상위 계층에서만 이루어지고 있어 기존의 하드디스크와는 다른 특성을 지니는 플래시 메모리 기반의 저장장치인 SSD에 최적화를 시키기 위한 노력으로 이어지진 않았다. 논문에서는 다중 로깅 지점이라는 SSD의 특성을 활용한 로그기반 파일시스템이 SSD에서 얻는 성능상의 이점을 활용하여 새로운 요구사항인 시맨틱 파일 검색까지 추가 비용 없이 지원하는 파일시스템을 제안한다.

시맨틱 웹 기술을 이용한 온톨로지기반 호텔 검색 시스템 (An Ontology-based Hotel Search System Using Semantic Web Technologies)

  • 유동희;서용무
    • 한국전자거래학회지
    • /
    • 제13권4호
    • /
    • pp.71-92
    • /
    • 2008
  • 현재, 호텔 검색 엔진들은 여행객들의 호텔 검색을 돕고 있다. 하지만 검색 엔진을 통한 호텔에 대한 검색 결과는 여행객들을 만족시키지 못하고 있다. 그 이유는 검색 엔진이 다양하고 모호한 용어들로 표현되는 여행객의 기호를 정확하게 이해하고 처리할 수 없기 때문이다. 본 논문에서는 현재 사용 가능한 시맨틱 웹 기술인 RDF, OWL, SWRL을 이용하여 온톨 로지를 구축하고, 구축된 온톨로지를 기반으로 검색 엔진이 어떻게 여행객들의 기호에 적합한 호텔을 찾는가를 보여주었다. 이를 위해, 기존의 호텔 관련 온톨로지들을 분석하였고 Q&A 커뮤니티들에 올라온 호텔 검색과 관련된 용어들을 조사하였다. 조사된 결과를 바탕으로, 세 개의 하위 온톨로지인 객관적 개념 온톨로지, 보편적 인지 개념 온톨로지, 평가 개념 온톨로지로 구성된 호텔 도메인 온톨로지를 구축하였다. 구축된 온톨로지를 호텔 검색에 이용하는 것을 보여주기 위해 시맨틱 호텔 검색 시스템을 구현하였다.

  • PDF

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

시맨틱을 이용한 연구 논문 검색 시스템 (Semantic based Research-Paper Searching System)

  • 김영민;이상준
    • 인터넷정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.15-22
    • /
    • 2003
  • 웹의 발달로 정보의 수요가 증가하고 이를 위한 통합, 대용량 정보 저장 시스템들이 증가추세에 있다. 이런 정보 저장 시스템의 크기가 커져감에 따라 기존의 키워드 기반 논문 검색 방법은 검색결과의 양도 클 뿐만 아니라 검색자의 의도를 반영한 검색을 수행하기가 어렵다. 본 연구에서는 공학 논문들을 대상으로 논문 제목의 구성 형태를 분석하고, 제목 내의 키워드들의 역할 정보들을 RDF 시맨틱으로 구성하여 논문검색에 이용하는 방법을 제안한다. XML형태와 시맨틱을 이용하여 논문 검색에 이용한 결과 키워들 만을 이용하는 기존 방법보다는 훨씬 검색자의 의도를 잘 반영하면서도 필요한 결과만을 얻을 수 있었다.

  • PDF

확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기 (A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules)

  • 이수광;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.448-448
    • /
    • 2001
  • The definitions in Korean dictionary not only describe meanings of title, but also include various semantic information such as hypernymy/hyponymy, meronymy/holonymy, polysemy, homonymy, synonymy, antonymy, and semantic features. This paper purposes to implement a parser as the basic tool to acquire automatically the semantic information from the definitions in Korean dictionary. For this purpose, first we constructed the part-of-speech tagged corpus and the tree tagged corpus from the definitions in Korean dictionary. And then we automatically extracted from the corpora the frequency of words which are ambiguous in part-of-speech tag and the grammar rules and their probability based on the statistical method. The parser is a kind of the probabilistic chart parser that uses the extracted data. The frequency of words which are ambiguous in part-of-speech tag and the grammar rules and their probability resolve the noun phrase's structural ambiguity during parsing. The parser uses a grammar factoring, Best-First search, and Viterbi search In order to reduce the number of nodes during parsing and to increase the performance. We experiment with grammar rule's probability, left-to-right parsing, and left-first search. By the experiments, when the parser uses grammar rule's probability and left-first search simultaneously, the result of parsing is most accurate and the recall is 51.74% and the precision is 87.47% on raw corpus.

의미기반 비디오 검색을 위한 인덱싱 에이전트의 설계 (Design of Indexing Agent for Semantic-based Video Retrieval)

  • 이종희;오해석
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.687-694
    • /
    • 2003
  • 최근 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이터에 대한 다양한 검색은 더욱 중요한 의미를 가지게 되었다. 비디오 데이터를 효율적으로 처리하기 위해서는 비디오 데이터가 가지고 있는 내용에 대한 정보를 데이터베이스에 저장하고 사용자들의 다양한 질의를 처리할 수 있는 의미기반 검색 기법이 요구된다. 기존의 내용기반 비디오 검색 시스템들은 주석기반 검색 또는 특징기반 검색과 같은 단일 방식으로만 검색을 하므로 검색 효율이 낮을 뿐 아니라 완전한 자동 처리가 되지 않아 시스템 관리자나 주석자의 많은 노력을 요구한다. 본 논문에서는 주석기반 검색과 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 제안하는 특징기반 검색기법을 통해 가장 유사한 키 프레임을 검색한다. 따라서 의미기반 검색을 통해 비디오 데이터의 검색의 효율을 높일 수 있도록 시스템을 설계한다.

온톨로지 기반 의미검색 웹 서비스와 PDM과의 통합 (Ontology-based Semantic Searching Web Service and Integration with PDM)

  • 함경준;서효원;양영순;최영
    • 한국전산구조공학회논문집
    • /
    • 제21권6호
    • /
    • pp.579-587
    • /
    • 2008
  • 협업 환경에서 각 에이전트는 같은 의미의 정보를 서로 다른 용어로 사용하기 때문에 정보공유의 어려움이 있다. 즉 협력 제품개발 환경에서 동일한 제품정보를 각 에이전트가 서로 다른 용어로 표현함으로써 제품정보 공유를 어렵게 만든다. 이러한 어려움을 해결하기 위해서는 의미기반 정보를 활용한 제품정보 공유 방법이 필요하다. 본 연구에서는 의미기반 제품정보 공유를 위해 온톨로지 기반의 의미검색 시스템 및 기존의 PDM시스템과 연계하는 방법을 제안한다. 온톨로지는 OWL기반으로 구축하고, 구축된 온톨로지로부터 Pellet 추론 엔진을 이용하여 의미검색을 가능하게 하며, 이것을 웹서비스를 기반으로 구현하여 다른 시스템에서 활용이 가능토록 한다. 또한 기존의 PDM과 연계하여 PDM을 기반으로 의미검색을 수행할 수 있는 방법을 제안한다.