• 제목/요약/키워드: 개념기반 정보검색

검색결과 368건 처리시간 0.025초

시맨틱 검색 시스템의 개념적 모형화와 그 구현에 대한 연구 (A Study on the Conceptual Modeling and Implementation of a Semantic Search System)

  • 한동일;권혁인;정학진
    • 지능정보연구
    • /
    • 제14권1호
    • /
    • pp.67-84
    • /
    • 2008
  • 본 논문은 시맨틱 검색 시스템에 관한 포괄적인 개념적 모델 제안과 실질적인 구현 사례를 제시한다. 제안된 시맨틱 검색 시스템은 개념적으로 3계층의 아키텍처 지식획득 계층, 지식표현 계층, 지식이용 계층으로 구성하여 설계 및 구현되었다. 지식획득(Knowledge acquisition) 계층은 다양한 소스(Source)의 콘텐츠(텍스트, 이미지, 멀티미디어등)로부터 시맨틱 메타데이터를 생성 및 저장하는 영역이다. 지식표현(Knowledge Representation) 계층은 온톨로지의 스키마와 인스턴스를 구축하고, 이러한 온톨로지 기반 질의 확장 등을 통해 시맨틱 검색을 처리하는 영역이다. 마지막으로 지식이용(Knowledge Utilization) 계층은 검색 이용자가 시맨틱 웹 언어 또는 온톨로지에 대한 지식이 없더라도 직관적으로 검색 질의(Query)를 입력하고 검색 결과를 확인할 수 있도록 구성하였다. 향후 제시된 시맨틱 검색 시스템은 기존 연구 수준의 시맨틱 검색 시스템을 상용화 수준으로 향상시킬 수 있는 계기가 될 것으로 기대된다.

  • PDF

과도한 지식을 요구하지 않는 공통기반축에 의한 용어 번역과 한영 교차정보검색에의 응용 (Knowledge-poor Term Translation using Common Base Axis with application to Korean-English Cross-Language Information Retrieval)

  • 최용석;최기선
    • 인지과학
    • /
    • 제14권1호
    • /
    • pp.29-40
    • /
    • 2003
  • 교차언어 정보검색은 다국어 정보검색의 일부분으로 질의어에서 사용하는 언어와 검색대상인 문서의 언어가 서로 다른 경우의 정보검색을 의미한다. 교차언어 정보검색의 성능 향상을 위해서는 양질의 언어자원이 대량으로 필요한 경우가 많기 때문에 이를 해결하기 쉽지 않다. 본 논문에서는 사전에 기반한 대역어 후보 선정 시, 가중치를 부여해 질의어를 변환하는 방식을 제안한다. 가중치 계산에 이용되는 의미거리는 영어 명사와 한국어 명사를 같은 벡터 공간에 표현하고, 두 벡터간의 관계를 이용해 거리를 계산한다. 서로 다른 두 언어의 명사를 한 공간에 표현하기 위해 "공통 기반축"의 개념을 제시하고, 구축 방법을 제안한다. 고급 자원인 온톨로지를 확보하지 않고, 제안하는 방법으로 우수한 정보검색 결과를 얻을 수 있다는 것을 실험을 통해 보여준다.을 통해 보여준다.

  • PDF

GDIT기반의 순수 구조 질의 처리를 위한 색인 구조에 대한 분석 (Analysis of Index Structures for Sturcture-based Retrieval on GDIT)

  • 정채영;김영자;김현주;배종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.193-195
    • /
    • 2000
  • 구조적 문서는 문서로의 다양한 접근 경로를 제공하므로, 구조적 문서들에 대한 정보 검색 시스템들은 문서의 구조를 사용한 구조 검색 질의를 지원하여 검색의 신뢰도를 높일 수 있다. 그러므로, 구조적 문서가 가지는 엘리먼트간의 구조적 포함관계나 순서등 문서 구조에 바탕을 둔 다양한 유형의 사용자 질의를 지원할 수 있는 색인 구조가 필요하다. 본 논문에서는 엘리먼트와 엘리먼트 사이의 구조적 상관관계나 엘리먼트의 발생순서에 관련된 질의등 여러 유형의 순수 구조 질의를 처리할 수 있는 세가지 색인 구조를 제시하고 그 성능을 평가한다. 제안된 색인 알고리즘은 GDIT 개념[5]에 바탕을 두고, GDIT기반의 색인 기법을 사용한다.

  • PDF

WBSE를 이용한 웹 기반 학습시스템에 관한 연구 (A Study on the WBI System Using WBSE)

  • 전주현;홍찬기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.652-654
    • /
    • 2001
  • 웹 기반 교육(WBI)이 많은 장점을 가지고 있으나 한편으로는 웹 기반 수업 혹은 웹 기반 교육의 초기에는 교수자의 개인적인 수준에서 교육 시스템이 개발 운영되어 체계적으로 개발 관리되지 못하였고 교수-학습자의 요구사항을 충분히 반영하지 못하였다. 그리고 분산되어 있는 자료의 적절한 활용과 검색이 용이하지 못하여 중복 개발되고 신뢰성이 떨어지는 문제점등을 내포한다. 이 논문에서는 WBSE(Web Based Software Engineering)개념을 웹 기반 교육시스템에 도입하여 요구사항을 반영하고 기존에 개발되어 사용되고 있는 소프트웨어를 컴포넌트화 하는 작업을 시도하여 이를 재사용 통합함으로써 새로운 교육 소프트웨어 개발에 사용되는 일련의 과정에 대하여 연구 기술하였다.

  • PDF

디지털 콘텐츠의 효율적 검색과 관리를 위한 UCI 식별체계의 온톨로지 적용 (Applying Ontologies to UCI for the Efficient Search and Management of Digital Contents)

  • 하은옥;김윤호
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.215-228
    • /
    • 2009
  • 디지털 콘텐츠 식별체계인 UCI(Universal Content Identifier)는 디지털 콘텐츠의 투명한 유통과정과 효율적 검색과 관리를 위해서 만든 URN(Uniform Resource Name)에 기반을 둔 식별체계이다. UCI 식별자를 부여받은 디지털콘텐츠는 사용자가 원하는 콘텐츠를 정확하게 전달하기 위해서는 다양한 메타데이터 정보를 필요로 한다. 그러나 UCI에서 제공하는 식별 메타데이터만으로는 콘텐츠에 대한 다양한 정보를 표현하기에는 부족하며, 정보의 보다 정확한 표현과 효율적 검색 및 관리를 위해서는 UCI에서 제공하는 메타데이터와 함께 메타데이터 내에 표현된 개념과 그 의미 관계를 정형화하고 명시적인 방법으로 정의하는 온톨로지를 필요로 한다. 본 논문에서는 UCI 식별체계의 메타데이터간 개념관계를 온톨로지로 확장하고 도메인 온톨로지를 설계함으로써 구축된 UCI 메타데이터 정보를 효율적으로 이용하여 의미 기반의 검색과 관리를 가능하게 하였으며, 다양한 질의어를 통하여 메타데이터만을 이용하는 UCI식별체계에 비하여 효율적인 검색과 관리가 가능함을 보였다.

  • PDF

의미관계 정보를 이용한 약품 온톨로지의 구축과 활용 (Medicine Ontology Building based on Semantic Relation and Its Application)

  • 임수연;박성배;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.428-437
    • /
    • 2005
  • 온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의, 그리고 그들간의 관계로 이루어진다. 본 논문에서는 온톨로지를 구축하고 갱신할 때의 시간과 비용을 줄이기 위하여 텍스트의 분석결과를 이용한 도메인 온톨로지의 반자동 구축방안을 제안한다. 이를 위하여 관련 문서들 내에 출현한 전문용어들의 처리방안을 제시하고, 추출한 개념들과 그들간의 관계를 온톨로지의 구축에 활용한다. 실험 도메인은 약품분야로 정하였으며, 구축한 온톨로지는 문서의 검색에 활용하였다. 온톨로지 내의 계층관계들이 문서검색에 효용이 있음을 보이기 위하여 일반적인 키워드기반 문서검색과 온톨로지 내의 관련 정보들을 연관피드백에 이용한 온톨로지기반 문서검색을 비교한 결과, 후자의 경우 정확률이 $4.97\%$, 재현율이 $0.78\%$ 향상됨을 알 수 있었다.

한의 온톨로지 기반 시맨틱 검색 시스템 (Semantic Search System based on Korean Medicine Ontology)

  • 김상균;박동훈;김안나;오용택;김지영;예상준;김철;장현철
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.533-543
    • /
    • 2012
  • 본 연구에서는 한의 온톨로지를 이용한 시맨틱 검색 시스템을 제안한다. 시맨틱 검색은 사용자의 검색어가 어떤 개념에 속하는지 인식하고 온톨로지에서 검색어와 연관된 정보들을 보여주는 기능을 제공하는 장점이 있다. 본 연구에서 구현한 시맨틱 검색 시스템 또한 이와 같은 시맨틱 검색 기능을 구현하였다. 뿐만아니라 한의 온톨로지의 시맨틱을 분석해서 한의학적으로 의미 있는 검색 시나리오를 정의하고 이 시나리오를 수행하는 프로세스 및 사용자 인터페이스를 구현하였다. 이를 통해 단순히 온톨로지에서 연결된 정보를 검색해주는 것 뿐만 아니라 보다 의미 있는 검색 결과를 제공함으로써 한의 정보를 검색하는 사용자들이 유용한 검색 결과를 얻을 수 있도록 하였다.

Grid 서비스를 위한 UDDI 기반의 Repository 시스템에 대한 연구 및 설계 (A Study and Design of a Repository System Based on UDDI fur Grid Services)

  • 송인혁;이정훈;임효상;황규영;박형우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.76-78
    • /
    • 2003
  • 컴퓨터 기술의 발전과 인터넷의 보급에 따라 분산된 컴퓨팅 자원과 정보를 효과적으로 활용하려는 다양한 연구가 진행되고 있다. 이러한 노력의 일환으로 최근 W3C 에서는 분산환경의 표준 프로그래밍 모델로 웹서비스라는 개념을 제시하였다. UDDI 는 이러한 환경에서 웹서비스에 대한 메타데이타를 저장하고 이를 검색할 수 있도록 기능을 제공하는 Repository 시스템이다. 웹서비스를 이용하고자 하는 응용프로그램은 UDDI 가 저장한 정보를 검색하여 원하는 웹서비스를 발견하고 이를 활용할 수 있다. 이와 같이 UDDI 는 웹서비스 기반의 분산 응용에서 필요한 디렉토리 서비스기능을 제공하여 분산된 웹서비스의 통합을 지원하는 기반 시스템으로 널리 활용될 것으로 기대된다. 본 논문에서는 W3C 에서 제정한 UDDI 3.0 Specification 을 분석하여 Repository 시스템에서 관리해야할 데이터 구조를 설계하고, 제공하는 API 들을 기능별로 분류한다. 그리고 이러한 분석을 토대로 Repository 시스템의 아키텍쳐를 설계한다.

  • PDF

시맨틱 웹에 기초한 모바일 관광정보 서비스 (A Semantic Web Service for Tourism Information over the Mobile Web)

  • 이양원
    • 대한지리학회지
    • /
    • 제42권5호
    • /
    • pp.788-807
    • /
    • 2007
  • 웹 기술의 변화발전 동향을 파악하는 것은 지리정보의 웹 공유에 있어서 우선적으로 고려되어야 할 사항 중의 하나이다. 시맨틱 웹은 컴퓨터가 정보를 보여주는 것에 그치지 않고 정보를 이해하도록 하는 방법론 및 기술로서, 기존의 웹과 온톨로지의 결합을 통해 이루어진다. 개념화의 명시적인 사양이라고 정의되는 온톨로지와 이에 기반한 시맨틱 웹은 지리정보의 효과적인 공유와 검색을 위해 활용될 수 있다. 이 논문에서는 모바일 웹 상에서 사용자의 행동맥락에 부합되는 관광정보를 제공하기 위한 시맨틱 웹 서비스에 대해 논의한다. 이를 위해 관광지, 관광자원, 관광객의 활동 등이 체계적으로 개념화 및 조직화된 PARA(Place-Attraction-Resource-Activity) 온톨로지 모형을 구축하고, 관광객의 이동을 고려하기 위하여 관광지와 연결된 전철 네트웍을 이 모형에 결합시킨다. XML(Extensible Markup Language) 웹 서비스는 클라이언트의 요청과 이에 따른 서버의 응답을 중개하는 역할을 하는데, PARA 온톨로지 모형과 연동되는XML 웹 서비스를 통해 개념기반의 관광정보 발견이 가능하도록 한다. 이 연구에서 제안하는 시스템은 도쿄 관광정보의 검색 시뮬레이션을 통해 그 가용성이 테스트되었다.

정보검색시스템에서 조인 시퀀스 분리성 기반 논리곱 불리언 질의 최적화 (Conjunctive Boolean Query Optimization based on Join Sequence Separability in Information Retrieval Systems)

  • 박병권;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권4호
    • /
    • pp.395-408
    • /
    • 2004
  • 논리곱 불리언 질의는 질의에 포함된 키워드들이 모두 나타나는 텍스트 문서들을 검색하는질의로서, 정보검색 시스템에서 가장 널리 사용되는 질의이다. 논리곱 불리언 질의는 검색의 정확도를 높이기 위하여 많은 수의 키워드로 구성된 긴 질의를 사용한다. 이 경우. 키워드 처리 순서가 성능에 크게 영향을 미친다. 기존 정보검색시스템에서는 휴리스틱에 의존하여 키워드 처리 순서를 결정하므로 최적을 보장하지 못한다. 동적 프로그래밍과 같은 기존의 데이타베이스 질의 최적화 알고리즘은 복잡도가 지수적으로 증가하므로(Ο(n2$^{n-1}$)), 키워드 수가 많은 논리곱 불리언 질의에는 적합하지 않다. 본 논문에서는 조인시퀀스 분리성이라는 새로운 개념에 기반한 논리곱 불리언 질의 최적화 알고리즘을 제안한다. 조인 시퀀스 분리성이란 조인에 참여하는 릴레이션들이 어떤 조건을 만족할 경우, 최적 조인 시퀀스가 두 개의 서브 시퀀스로 분리된다는 성질이다. 이 성질을 활용하면 Ο(nlogn)만에 최적 조인 시퀀스를 구할 수 있다. 본 논문에서는 이러한 조인 시퀀스 분리성의 개념을 정형적으로 정의하고 이에 기반한 질의 최적화 알고리즘의 최적성을 이론적으로 증명한다. 그리고, 제안한 질의 최적화 알고리즘의 성능 평가를 위해, 비용 모델을 사용하여 다양한 시뮬레이션을 수행한다. 그 결과, 제안한 알고리즘의 성능이 기존의 휴리스틱 기반 질의 최적화 알고리즘들에 비해 100배 이상 우수함을 보인다. 또한, 동적 프로그래밍 알고리즘에 비해 질의 최적화 시간 면에서 기하 급수적으로 우수함을 보인다(키워드 개수가 10 개일 경우 600배 이상 우수함).