• Title/Summary/Keyword: 개념 기반 정보검색

Search Result 369, Processing Time 0.043 seconds

Retrieval Model Based on Word Translation Probabilities and the Degree of Association of Query Concept (어휘 번역확률과 질의개념연관도를 반영한 검색 모델)

  • Kim, Jun-Gil;Lee, Kyung-Soon
    • The KIPS Transactions:PartB
    • /
    • v.19B no.3
    • /
    • pp.183-188
    • /
    • 2012
  • One of the major challenge for retrieval performance is the word mismatch between user's queries and documents in information retrieval. To solve the word mismatch problem, we propose a retrieval model based on the degree of association of query concept and word translation probabilities in translation-based model. The word translation probabilities are calculated based on the set of a sentence and its succeeding sentence pair. To validate the proposed method, we experimented on TREC AP test collection. The experimental results show that the proposed model achieved significant improvement over the language model and outperformed translation-based language model.

An Effective Method using Sketch Interface for Image Retrieval (스케치 인터페이스를 이용한 효과적인 영상 검색)

  • Jeong, Se-Yoon;Kim, Kyu-Heon;Lee, Jae-Yeon;Bae, Young-Lae J.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.875-878
    • /
    • 2000
  • 내용 기반 영상 검색은 일반적으로 질의 영상을 사용해서 검색한다. 대부분의 사용자는 검색 당시에 자신이 생각하는 질의와 일치하는 영상을 실제로 갖고 있지 않다. 사용자는 검색기가 제공하는 샘플이나 자신이 갖고 있는 영상 중에서 검색하고자 하는 개념과 비슷한 영상을 질의 영상으로 사용한다. 그러나, 이 질의 영상은 사용자가 생각하는 개념을 충분히 반영하지 못하는 경우가 대부분이다. 따라서 사용자는 자신이 원하는 결과를 얻기 위해서 검색을 여러 번 하게 된다. 이는 최초 검색에서 적절한 질의 영상을 사용하지 못하고 있기 때문이다. 검색 시스템의 검색엔진도 중요하지만, 적절한 질의의 사용 여부에 의해 검색 결과가 크게 좌우된다. 적절한 질의 사용의 중요성은 기존의 텍스트 기반 검색에서 이미 알려진 사실이다. 영상 검색에서도 효과 적인 검색을 위해서는 사용자가 생각하는 질의 영상을 구체화하여 질의로 사용하는 기술이 필요하다. 이러한 관점에서, 사용자가 검색하고자 하는 추상적인 개념을 구체화하여 질의 영상으로 사용한다면 검색 성능을 높일 수 있다. 본 논문에서는 사용자가 생각하고 있는 추상적인 질의를 구체화하기 위해 스케치 인터페이스를 개발하였다. 스케치 인터페이스를 통해서 사용자가 생각한 질의를 구체화하여 이를 검색에 활용함으로서 전체 검색 회수를 줄임으로서 보다 빠른 시간에 효과적으로 검색을 수행할 수 있었다.

  • PDF

Development of Web-based Workbench for the Construction of Thesaurus (시소러스 구축을 위한 웹 기반 워크벤치 개발)

  • Lee, Seung-Jun;Jung, Han-Min;Sung, Won-Kyung;Choi, Kwang;Lee, Sang-Hun;Choi, Suk-Doo
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.999-1004
    • /
    • 2006
  • 본 연구에서는 다양한 개념 패싯과 관계 패싯들을 수용한 범용 과학기술 시소러스 구축용 웹 기반 워크벤치 개발에 대해 기술한다. 기존 국내 시소러스 구축용 워크벤치들이 제공하는 기본적인 용어 관계구축 기능을 확장하여 개념 패싯, 범주 관계 패싯, 의미역 관계 패싯, 속성 관계 패싯 및 속성 키워드 처리 기능을 원활히 제공할 수 있는 사용자 중심적 워크벤치를 개발함으로써 시소러스 상의 개념들에 대한 효율적인 구축이 가능하도록 한다. 또한 시멘틱 웹 상의 온톨로지 영역에 보다 근접한 고도화되니 시소러스 구축을 위해 용어들을 개념화시키고, 개념간의 다양한 관계를 설정하는 프로세스 중심적 설계로 분야 적합성이 높은 정보 처리 기반을 갖춘다. 궁극적으로 여러 마이크로 시소러스들을 통합하여 운용할 수 있는 복합 모델을 구축하는 것을 목표로 하고 있다. 이러한 목적에 부합하는 시스템 구현을 위해 CBD(Component Based Development) 개발 방법론으로 MSF/CD를 이용하였으며, 분산 환경에서 이기종간의 데이터 교환을 용이하게 하기 위하여 웹 서비스 (XML Web Services)를 이용하였다. 또한 시멘틱 웹 기반 연구자 간 협업 지원 서비스 구현을 위한 확장 검색용으로서도 활용할 수 있도록 하였다. 시소러스 반출은 CSV, XML 및 RDF를 모두 지원할 수 있도록 함으로써 다양한 사용자 요구 사항에 부합할 수 있도록 하였다. 시소러스 브라우징을 시각화 기반의 3단계 구조를 가진 플래시로 구현하여 사용자가 쉽게 시소러스를 탐색하고 분석할 수 있는 기반을 제공하였다. 또한 다양한 검색 요구를 만족시키고자 기본 검색, 고급 검색, 메타 검색을 선택할 수 있도록 하며, 개념 편집 및 시소러스 브라우징과 연동시켜 효율적인 시소러스 구축이 가능하도록 하였다. 본 연구의 워크벤치를 이용하여 구축된 시소러스는 기존 시소러스들에 비해 사용자가 보다 폭넓은 의미 기반 검색을 수행할 수 있도록 함으로써 다각적인 정보를 쉽게 획득할 수 있는 기반을 마련하고 있다는 데 의의가 있으며, 다국어 시소러스 및 다중 시소러스를 수용할 수 있는 방향으로 발전시킬 계획이다.

  • PDF

A Design of Book Search program based on the Semantic Web (시맨틱 웹 기반의 도서검색 프로그램 설계)

  • Choi, Jun-nyeong;Lee, Ji-hun;Jung, In-jung;Yu, Don-hui
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.05a
    • /
    • pp.130-131
    • /
    • 2014
  • 시맨틱 웹은 1998년 웹의 창시자인 Tim Berners Lee가 제안을 한 웹 기술로써 인간의 언어를 이해하고 인간과 쉽게 의사소통이 가능한 네트워크를 말한다. 즉 컴퓨터 스스로 웹에 연결된 정보의 의미를 인식하고 사용자가 필요로 하는 정보를 검색하며 검색된 정보에서 지식을 유추할 수 있는 기능을 제공하는 지능형 웹 환경이다. 이런 시맨틱 웹 개념을 적용한 사례로는 네이버 시맨틱 웹 영화검색 이있다. 본 논문에서는 네이버 시맨틱 웹 영화검색 시스템을 벤치마킹한 도서검색 서비스 설계를 제안하고자 한다. 본 도서검색 서비스는 온톨로지 개념을 적용하여 도서와 관련된 검색 카테고리를 설정하며, 간단한 시나리오는 다음과 같다. 한 권의 책을 검색하면 해당 책과 연관된 첫 번째 카테고리로 출판사, 제작한 년도, 저자, 장르, 관련 검색 도서 등의 데이터들이 상단에 제시된다. 제시된 카테고리에서 임의의 항목을 선택하면 그 하단 공백에 선택된 항목과 연관된 카테고리에 해당하는 항목들이 제시된다. 예를 들어, 출판사를 선택한다면 해당 출판사에서 출간된 도서들이 하단 공백에 열거가 되고 상단 두 번째 카테고리에 원작국가, 저자 관련 책, 수상정보, 공동 집필자, 책을 원작으로 확장된 컨텐츠 등 또 다른 카테고리가 우측으로 생성이 되며 선택을 할 수 있게 된다. 본 논문에서 제안하는 시맨틱 웹 기반 도서검색 서비스는 사용자가 검색하고자 하는 정보를 보다 효율적이고 사용자 중심에서 제공할 수 있다고 사료된다.

  • PDF

Concept Map based P2P contents sharing system (개념지도 기반 P2P 콘텐츠 공유 시스템)

  • 나고운;차재혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.223-225
    • /
    • 2004
  • 현재의 P2P 시스템은 특정한 분야에서는 성공을 거두고 있지만 지식과 정보 공유의 목적으로서는 활용되지 못하고 있다. 사용자가 웹에서 수집한 자료와 새로 생성한 지식 및 정보 콘텐츠들은 기존의 P2P시스템으로는 공유하기 힘든 몇 가지 이유가 있다. 그 이유 중 하나는 대부분의 P2P시스템은 사용자가 콘텐츠 각각에 대한 메타데이터를 작성하도록 하거나 키워드가 나타나도록 파일명을 수정하도록 요구하기 때문이다. 본 논문에서 제안하는 CONCEPT P2P는 P2P 환경에서 콘텐츠를 공유하는데 개념지도를 사용한다. 개념지도는 시간 소모적인 메타데이터 작성 작업에 대한 대안이 될 수 있기 때문이다 CONCEPT P2P는 로컬 파일 시스템에 수집하고 있는 관심 콘텐츠의 공유를 목적으로 한다. 사용자의 개념지도를 추출하여 개념지도로부터 콘텐츠 묶음을 검색하므로 무리한 수작업이 없이도 다양한 분야의 콘텐츠를 효과적으로 공유할 수 있도록 설계하였다. 또한 다른 사용자와 개념 네트워크를 형성하여 관심 개념에 의해서 클러스터링 되고 있는 복수개의 콘텐츠를 지속적으로 수집하고 배포하는 접근을 취하였다. 개념 지도를 기술하고 검색하는 부분에서는 RDF 기반의 시맨틱 웹 언어와 RDF 질의 언어인 QEL을 사용하였다.

  • PDF

A Study for Search Method WBI Components Based-on XML Component Specification (XML 명세를 통한 교육컴포넌트 검색에 관한 연구)

  • Jeon, Ju-Hyun;Hong, Chan-Ki
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1081-1084
    • /
    • 2002
  • 웹 기반 교육 컴포넌트를 효과적으로 재사용하기 위해서는 충분히 많은 수의 교육컴포넌트 존재, 등록과 검색시스템의 지원, 효과적인 교육컴포넌트의 서술 등의 문제가 해결되어야 한다. 이 논문에서는 웹 기반 교육시스템에 컴포넌트 개념을 도입하여 재사용성을 높이는 연구의 연장으로 등록된 교육 컴포넌트를 검색하여 새로운 교육 소프트웨어 개발에 사용할 때 생산성과 신뢰성 증대를 위하여 효과적인 교육 컴포넌트 검색을 제공하기 위한 XML기반의 교육컴포넌트 검색 방법을 제시하고 검색 시스템을 설계 구현하였다.

  • PDF

A Study for Search Method WBI Components Based-on Component Specification (명세를 통한 교육컴포넌트 검색에 관한 연구)

  • 전주현;홍찬기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.854-856
    • /
    • 2003
  • 웹 기반 교육시스템에 컴포넌트 개념을 도입하여 재사용하는 연구는 소프트웨어 재사용 측면에서 생산성 증대에 기여하지만 이러한 효과가 현실화되기 위해서는 기술적인 제반 요소들, 예를 들면 충분히 많은수의 사용 가능한 컴포넌트의 존재, 검색 및 등록 시스템의 지원, 효과적인 컴포넌트 서술 등의 문제가 해결되어야 하며 이 논문에서는 웹 기반 교육시스템에 컴포넌트 개념을 도입하여 재사용성을 높이는 연구의 연장으로 컴포넌트를 인터넷상에 개방하면서 그 컴포넌트에 대한 검색을 하거나 컴포넌트를 이해하고자 하는 사용자들에게 도움이 되는 정보들이 상세하게 기술되어야 함을 전제로 개발자의 WBI에서 요구 사항에 부합되는 컴포넌트를 검색하기 위한 컴포넌트 명세 모델과 아키텍쳐에 기반한 컴포넌트 검색 모델을 XML형태로 명세하고 클래스 다이어그램으로 표기하는 연구를 하였다.

  • PDF

지능형 전자상거래를 위한 온톨로지의 효율적인 생성

  • Kim, Tae-Seok;Yang, Jin-Hyeok;Lee, Ji-Hong;Son, Jong-Su;Jeong, In-Jeong
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.11a
    • /
    • pp.273-279
    • /
    • 2005
  • 월드와이드웹 (WWW) 기반의 전자상거래는 주로 데이터베이스를 기반으로 서비스를 제공하고 있다. 그러나 월드와이드웹 기반의 전자상거래는 단순 키워드 검색에만 의존하고 있다. 이러한 검색은 데이터베이스 자체로는 의미적인 정보를 효과적으로 처리하기에는 많은 문제점이 있다. 1999년 말에 의미적인 정보를 효과적으로 처리하기 할 수 있는 시맨틱 웹 이 제안되었다. 시맨틱 웹은 의미적인 정보를 담고 있는 지식베이스(Knowledge Bases)인 온톨로지를 기반으로 하고 있다. 그러나 온툴로지의 생성은 많은 부분을 휴리스틱에 의존하고 있기 때문에 많은 시간과 비용이 소비된다. 따라서 우리는 이와 같은 문제를 해결하기 위하여 데이터베이스에서 온톨로지를 생성하는 방법을 제안한다. 데이터베이스는 도메인을 잘 나타내고 있는 정보의 저장소이므로 데이터베이스로부터의 온톨로지 생성은 분석, 설계 등의 사전 작업이 필요하지 않아 시간과 비용의 소비를 줄 일 수 있는 장점이 있다. 우리는 데이터베이스에서 스키마를 추출, 뼈대그래프$^{1}$ 를 생성하고 개념그래프로 확장하여 도메인을 잘 나타낼 수 있는 온톨로지를 생성하는 알고리즘을 제안하고 제안된 알고리즘을 통하여 온톨로지를 생성을 함으로서 제안된 생성 방법을 검증한다. 제안한 방법으로 생성된 온톨로지는 단순 키워드 검색에서 의미적인 검색을 할 수 있는 시맨틱 웹 서비스의 기반이 되므로 의미적 검색이 가능한 전자상거래 서비스를 구축하는데 시간과 비용의 소비를 줄임으로 차세대 전자상거래의 초석이 된다.

  • PDF

A Study for Search Method WBI Components (웹 기반교육 컴포넌트 검색에 관한 연구)

  • Jeon, Ju-Hyun;Hong, Chan-Ki
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.1155-1158
    • /
    • 2001
  • 웹 기반 교육시스템에 컴포넌트 개념을 도입하여 재사용하는 연구는 소프트웨어 재사용 측면에서 생산성 증대에 기여하는 것이 사실이지만 이러한 효과가 현실화되기 위해서는 기술적인 제반 요소들, 예를 들면 충분히 많은 수의 사용 가능한 컴포넌트의 존재, 검색 및 등록 시스템의 지원, 효과적인 컴포넌트 서술 등의 문제가 해결되어야 한다. 이 논문에서는 웹 기반 교육시스템에 컴포넌트 개념을 도입하여 재사용성을 높이는 연구의 연장으로 등록된 교육 컴포넌트를 검색하여 새로운 교육 소프트웨어 개발에 사용할 때 생산성과 신뢰성 증대를 위하여 효과적인 교육 컴포넌트 검색을 제공하기 위한 XML기반의 교육컴포넌트 검색 방법을 제시하고 연구하였다.

  • PDF

Concept and Attribute based Answer Retrieval (개념 속성 기반 정보 검색)

  • Yun Bo-Hyun;Seo Chang-ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.3 s.35
    • /
    • pp.1-10
    • /
    • 2005
  • This paper presents the information retrieval system which can retrieve the most appropriate answer sentence for user queries by using the concept and the attribute for the knowledge retrieval. The system analyzes the user query into the Boolean queries with the concept and the attribute and then retrieve the relevant documents in the indexing set of answer documents. Users can retrieve the relevant answer sentences from the relevant documents. For this, the answer documents indexed by the concept and the attribute are segmented by each sentence respectively. Thus, the segmented sentences are analyzed into the concept and the attribute of which the relevance degree with indexing units of documents is evaluated. Then, the system indexes the location of answer sentences. In the experiment, we evaluate the performance of our answer retrieval system against 100 user queries and show the experimental results.

  • PDF