• 제목/요약/키워드: 시맨틱 문서 검색

검색결과 64건 처리시간 0.032초

시멘틱 웹 데이터를 위한 키워드 인덱싱 기법 (Indexing Scheme for keyword-based Query Processing on Semantic Web)

  • 신혜연;김연희;정균락;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.51-55
    • /
    • 2006
  • 시맨틱 웹은 현재 웹의 확장된 개념으로 사람뿐만 아니라 컴퓨터 스스로가 데이터를 이해하고 처리할 수 있도록 정보에 의미를 부여하는 것이다. 시맨틱 웹 데이터를 기술하는 RDF를 통해 메타데이터를 표현하고 의미론적 추론이 가능하게 되었다. 따라서 기존에 일반 사용자가 쉽게 사용할 수 있는 키워드 검색 방법을 시맨틱 웹 데이터인 RDF/RDF 스키마에 적용함으로써 차세대 웹으로 인식되고 있는 시맨틱 웹을 일반 사용자도 쉽게 활용할 수 있도록 한다. 본 논문에서는 RDF 문서의 효율적인 검색을 위해 RDF 인스턴스와 RDF 스키마 정보를 저장하고, 키워드, 속성, 클래스 타입의 복합 조건 검색을 만족시키는 키워드 인덱스와 스키마 테이블 구조를 제안한다. 본 논문에서 제안한 구조는 다양한 조건들을 만족하는 리소스 정보의 빠르고 정확한 검색이 가능하도록 한다.

  • PDF

매치메이킹 알고리즘을 이용한 개선된 웹서비스 검색 시스템 (Advanced Web Services Retrieval System using Matchmaking Algorithm)

  • 최옥경;한상용;이정우
    • 지능정보연구
    • /
    • 제13권3호
    • /
    • pp.1-15
    • /
    • 2007
  • 향후 우리가 지향하는 차세대 웹은 보다 정확하고 신뢰성 있는 정보를 제공할 수 있는 의미론 중심의 시맨틱 웹과 XML이라는 표준 인터페이스를 통해 컴퓨터간의 자동화된 정보 교환 방식으로 향상된 고품질의 서비스를 제공하는 웹서비스의 기술이 결합된 시맨틱 웹서비스일 것이다. 이러한 시맨틱 웹서비스에서는 개념적으로 자동화된 웹서비스의 발견, 실행 및 조합이 가능하다. 그러나 기존에 개발된 시맨틱 웹서비스 검색 시스템들에서는 매치메이킹과 브로커링을 통해서 자동화된 웹서비스를 지원하는 에이전트들을 개발하고 있는 데 QoS(Quality of Services)에 관한 고려가 안 되어 있어서 실제 상황에서 적용에 어려움이 있다. 이에 본 연구에서는 이러한 기존 웹서비스 검색 모델을 보완하기 위해 QoS에 근거한 매치메이킹 알고리즘을 제안하고 이를 활용하여 일반 웹 문서 검색과 시맨틱 문서 검색이 모두 가능한 개선된 웹서비스 검색 시스템을 개발하였다. 여기서 제안된 시스템에서는 매치메이킹 알고리즘을 통해 서비스 요청자와 서비스 제공자 사이의 효율적인 매칭이 가능하고 사용자의 요구 사항 중 서비스 품질 정보를 고려하여 보다 정화한 매치메이킹을 가능케 한다. 구현된 시스템의 성능 평가를 수행하였고 그 결과도 여기에 보고하였다.

  • PDF

시맨틱 웹 문서에 대한 키워드 검색 및 랭킹 기법 (Keyword Search and Ranking Methods on Semantic Web Documents)

  • 김연희;오성균
    • 한국위성정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.86-93
    • /
    • 2012
  • 본 논문에서는 시맨틱 웹에서 온톨로지와 메타데이터를 기술하는 OWL 문서를 대상으로 하는 키워드 검색 기법과 랭킹 기법을 제안한다. 제안한 키워드 검색 기법은 OWL 문서에 대한 키워드 검색 결과의 단위를 정보 리소스로 정의하고 질의 키워드의 범위를 클래스와 프로퍼티의 이름은 물론 리터럴 데이터까지 확장하였다. 그리고 클래스나 프로퍼티의 계층 관계, 동등 관계 등 OWL 문서에 정의되어 있는 기본적인 추론 요소들을 고려하여 직접 기술되어 있지 않지만 새롭게 유도되는 정보도 키워드 검색에 반영하였다. 또한 키워드를 통해 간접적으로 의미적 관계를 맺고 있는 정보 리소스에 대한 검색이 가능하기 때문에 질의 키워드와 관련이 있는 많은 수의 정보 리소스들을 검색할 수 있다. 제안한 랭킹 기법은 OWL 문서의 특성을 고려하여 다양한 요소를 순위 결정에 참여시킴으로써 사용자의 검색 만족도를 높일 수 있다. 본 논문에서 제안한 키워드 검색 기법과 랭킹 기법은 방송 프로그램과 같은 디지털 콘텐츠의 검색 등 다양한 분야에서 활용될 수 있다.

자동화된 통합 프레임워크를 위한 시맨틱 웹 기반의 정보 검색 시스템 (Semantic Web based Information Retrieval System for the automatic integration framework)

  • 최옥경;한상용
    • 정보처리학회논문지C
    • /
    • 제13C권1호
    • /
    • pp.129-136
    • /
    • 2006
  • 정보 검색 시스템은 사용자가 찾고자 하는 지식 정보를 보다 정확하고 빠르게 전달하는 데 그 목적이 있다. 그러나 현재의 검색 시스템은 단순 구문 분석 방식으로 사용자가 원하는 정확한 정보를 제공하지 못한다. 따라서 본 논문에서는 온톨로지 서버를 이용한 SW-IRS(Semantic Web based Information Retrieval System)를 제안한다. 제안한 시스템은 에이전트 기반의 자동 분류 기술과 시맨틱 점 기반의 정보 검색 기법들을 이용하여 반구조(semi-structured) 문서뿐만 아니라 비구조(unstructured) 문서의 처리를 극대화시키고자 한다. 또한 상호 운용성 및 데이터 통합을 위해 RDF(Resource Description Framework) 방식의 문서 저장 서버를 지원하며 웹 페이지들간에 검색 순위를 두어 보다 신속하고 정확한 정보 검색이 가능하도록 하고자 한다. 마지막으로 새로운 순위 측정 알고리즘을 제안하고 이를 이용한 성능 평가를 실시하여 그 효율성과 정확성을 검증해 보이고자 한다.

비모수적 상관계수를 이용한 시맨틱 온톨로지 음성 정보 추출 (Semantic Ontology Speech Information Extraction using Non-parametric Correlation Coefficient)

  • 이병욱
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.147-151
    • /
    • 2013
  • 질의 키워드의 출현 빈도수가 높은 문서를 검색하면 키워드의 의미가 다양하여 정확한 정보를 인지하지 못하며, 기존 검색 시스템의 온톨로지 구성만으로는 검색된 문서들이 사용자의 요구에 부합되지 않는 문제점을 가진다. 본 연구에서는 시맨틱 웹 기술을 기반으로 인사관리에서 인선에 필요한 다양한 개념들과 지식으로 구성된 인선 온톨로지와 인선 규칙들을 구축하고 이들을 지원하는 인선 절차와 인선 결과의 적합성을 확인할 수 있는 시스템을 제안한다. 또한, 이를 기반으로 비모수적 상관 계수를 이용하여 음성 정보를 추출하는 방법을 사용하여 평균 SNR이 0.752dB 감소됨을 보임으로써 제안한 방법의 우수성을 확인하였다.

Word2vec을 활용한 문서의 의미 확장 검색방법 (Semantic Extention Search for Documents Using the Word2vec)

  • 김우주;김동희;장희원
    • 한국콘텐츠학회논문지
    • /
    • 제16권10호
    • /
    • pp.687-692
    • /
    • 2016
  • 기존의 문서 검색 방법론은 TF-IDF와 같은 벡터공간모델을 활용한 키워드 기반 방법론을 사용한다. 키워드 기반의 문서검색방법론으로는 문제가 몇몇 문제점이 나타날 수 있다. 먼저 몇 개의 키워드로 전체의 의미를 나타내기 힘들 수 있다. 또 기존의 키워드 기반의 방법론을 사용하면 의미상으로 비슷하지만 모양이 다른 동의어를 사용한 문서의 경우 두 문서 간에 일치하는 단어들의 특성치만 고려하여 관련이 있는 문서를 제대로 검색하지 못하거나 그 유사도를 낮게 평가할 수 있다. 본 연구는 문서를 기반으로 한 검색방법을 제안한다. Centrality를 사용해 쿼리 문서의 특성 벡터를 구하고 Word2vec알고리즘을 사용하여 단어의 모양이 아닌 단어의 의미를 고려할 수 있는 특성 벡터를 만들어 검색 성능의 향상과 더불어 유사한 단어를 사용한 문서를 찾을 수 있다.

개념 망을 통한 전자 카탈로그의 시맨틱 검색 및 추천 (Semantic Search and Recommendation of e-Catalog Documents through Concept Network)

  • 이재원;박성찬;이상근;박재휘;김한준;이상구
    • 한국전자거래학회지
    • /
    • 제15권3호
    • /
    • pp.131-145
    • /
    • 2010
  • 현재까지, 사용자의 요구에 맞는 카탈로그 문서를 제공하기 위해 널리 사용되고 있는 패러다임은 키워드 검색 혹은 협업적 필터링 기반 추천이다. 일반적으로 사용자의 질의어는 짧기 때문에, 사용자의 요구(질의어, 선호도)에 적합한 카탈로그 문서를 제공하는 것은 쉽지 않다. 이를 극복하기 위해 다양한 기법들이 제안되었으나, 이전 연구들은 색인어 매칭을 기반으로 하고 있다. 기존 베이지안 신념 망을 이용한 방법은 사용자의 요구 및 카탈로그 문서들을 연관성이 높은 개념들로 표현하였다. 하지만 개념들이 카탈로그 문서에서 추출된 색인어로 구성되어 있기 때문에 개념간의 관계 정보를 잘 표현하지 못하였다. 이에 본 연구는 베이지안 신념 망을 확장하여, 사용자의 요구 및 카탈로그 문서들을 웹 디렉토리에서 추출한 개념(혹은 카테고리) 망으로 표현한다. 개념 망을 이용함으로써, 사용자의 요구와 카탈로그 문서간의 개념 매칭도를 계산하는 것이 가능하다. 즉, 사용자의 질의어와 카탈로그 문서의 색인어가 일치하지 않을지라도, 개념적으로 관련성이 높은 문서를 검색하는 것이 가능하다. 또한 사용자간의 개념적 유사도를 계산함으로써, 시맨틱 기반의 협업적 필터링 추천이 가능하다.

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

온톨로지 기술과 스피어만 상관계수를 적용한 시맨틱 정보 검색 향상 (Improvement of the Semantic Information Retrieval using Ontology and Spearman Correlation Coefficients)

  • 이병욱
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.351-357
    • /
    • 2013
  • 질의 키워드의 정보 검색은 키워드의 의미가 다양하여 검색된 문서들이 사용자의 요구에 부합되지 않는 문제점을 가지며, 사용자의 상황과 특성이 사용자 마다 달라 정보가 매우 적고 연관성을 찾기 어렵다. 또한, 일반 상관 계수의 사용은 정보에 대한 연관성을 나타내지 못하는 문제가 있다. 본 연구에서는 시맨틱 웹 기술을 기반으로 인선에 필요한 다양한 개념들과 지식으로 구성된 인선 온톨로지와 인선 규칙들을 구축하고 규칙들을 지원하는 인선 절차와 인선 결과의 적합성을 확인할 수 있는 지식검색 시스템을 제안한다. 제안된 시스템에서는 스피어만 상관계수를 이용하여 사용자의 상황과 특성에 적합한 정보를 제공하여 제한적인 정보 추천의 단점을 해결하였다. 키워드 기반 검색과 시맨틱 기반 검색 실험 결과 시맨틱 기반 검색이 키워드 검색에 비하여 정확도는 90.3%, 재현율은 71.8%의 성능을 보였다.

차세대 웹에서 XML과 RDF 문서를 처리하는 XML&RDF 검색 에이전트 (XML&RDF Retrieve Agent Processing XML and RDF Document in The Next Generation Web)

  • 한기덕;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2006
  • 차세대 웹을 표현하는 단어로 XML(extensible markup language)과 시맨틱 웹(Semantic Web)을 꼽을 수 있다. XML은 1996년 W3C (World Wide Consortium)에서 제안한 데이터 표현 능력이 높은 언어이며, 시맨틱 웹은 사람이 읽고 해석하기에 편한 현재의 웹 대신에 컴퓨터가 이해할 수 있는 형태의 새로운 언어로 표현해 기계들끼리 서로 의사소통을 할 수 있는 지능형 웹을 말하는 것으로써 현재 XML을 기반으로 하는 RDF(Resource Description Framework)나 온톨로지 기술을 통해 시맨틱 웹 구축방안에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 차세대 웹에서의 정보 공유를 위한 검색 에이전트의 역할 및 에이전트간의 구조에 관한 설명, XML&RDF 검색 에이전트의 설계 모델 및 현재까지 구현된 시스템의 개요를 보여준다.

  • PDF