• 제목/요약/키워드: Information Retrieval Engine

검색결과 136건 처리시간 0.023초

지능형 기상 서비스를 위한 기상 온톨로지의 설계 (A Design of Weather Ontology for Intelligent Weather Service)

  • 정의현
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.185-193
    • /
    • 2008
  • IT기반의 기상학과 기상 서비스의 급속한 발전에도 불구하고, 아직까지 사람들이 직접 기상 정보를 받아와 판단하는 전통적인 방식으로 기상 정보가 이용되고 있다. 특히 지능화된 기상 정보 처리가 유비쿼터스 컴퓨팅과 개개인의 생활에 매우 유용할 것으로 기대됨에도 불구하고, 기계 주도의 자동화된 기상정보 처리에 대한 연구는 오랫동안 주목을 받지 못했다. 본 논문에서는 지능형 기상 정보처리를 가능하게 하는 GRIB기반의 온톨로지의 설계에 대해서 논한다. GRIB은 세계적으로 널리 사용되는 범용 목적의 기상 데이터 포맷으로 세계 기상기구에 의해 승인된 형식이다. 설계된 온톨로지와 Jess 엔진으로 구성된 추론 시스템으로 지능형 기상 애플리케이션을 구현하고 실험하여, 기계 주도의 기상 정보 처리에 대한 효과를 검증하였다.

  • PDF

가상문서를 개념을 활용한자기 주도적 학습지원 시스템의 설계 및 구현 (Design and Implementation of Supporting System of a Self-Directed Learning using Virtual Document Concept)

  • 노진순;이용배;맹성현
    • 정보교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.234-245
    • /
    • 2002
  • World-Wide Web으로 인하여 인터넷상의 다양하고 고품질의 자료들을 교육용으로 손쉽게 활용할 수 있는 시대가 도래하였다. 그러나 이와 같은 자료들은 교육적 효과를 극대화시키기 위해서 좀 더 정제되고, 교육과정에 맞는 흐름을 가질 필요가 있다. 따라서 이러한 흐름 제공을 위해서는 웹 상에서 분산되어 독립적으로 존재하는 디지털 문서들을 교육 목적에 맞게 새로운 순서, 즉 문맥화 된 순서를 가진 자료로 재구성할 수 있어야 하고, 이와 같이 재구성된 자료들은 문서간의 부드러운 내용 전개를 위해서는 부가적인 설명이나 기존 문서에 빠져 있는 내용들을 보완할 수 있어야 한다. 본 논문에서는 인터넷상의 수많은 리소스들을 재가공하여 교육과정에 맞는 흐름을 부여하기 위하여 가상문서 개념을 도입하였다. 이와 같이 저작된 가상문서를 이용하여 검색엔진의 형태로 학습자에게 제공함으로써 학습자의 수준과 목적에 맞는 문서를 검색하여 학습할 수 있는 자기 주도적 학습을 유도하려고 한다.

  • PDF

콘텐트 기반의 이미지검색을 위한 분류기 접근방법 (Image Classification Approach for Improving CBIR System Performance)

  • 한우진;손경아
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.816-822
    • /
    • 2016
  • 콘텐트 기반 이미지 검색은 기존의 태그 또는 레이블이 있는 텍스트 기반의 검색이 아닌 이미지의 특징을 이용하여 검색하는 방법이다. 실생활 이미지 데이터는 태그나 레이블이 달려있는 경우가 많지 않기 때문에 텍스트 기반의 검색 방법을 사용하기 힘든 경우가 있다. 또한, 기존에 주로 사용되는 이미지 특징 벡터의 유사도를 사용하여 검색하는 방법은 추출 벡터의 유사도 기준으로 사용자가 의도한 결과가 나올지 확신할 수 없다. 예를 들어 사용자가 입력한 질의 이미지와 검색된 이미지들의 종류가 일치하는지의 문제가 있다. 본 논문에서는 사용자가 질의 이미지의 클래스를 예상하고 결과도 동일한 클래스를 원한다는 가정에 착안하여 이미지 검색 엔진의 성능을 개선하였다. 기존의 유사도 기반의 검색에 머신 러닝 기법을 사용한 이미지 분류기를 적용하여 질의와 동일한 클래스의 결과를 찾는 방법을 제안하였으며, 그 성능을 20개 카테고리에 속하는 11,530개의 이미지로 구성되어 있는 PASCAL VOC 공개 데이터를 이용하여 검증하였다.

음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가 (Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System)

  • 김태수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

블로그 검색 성능 향상을 위한 주제-랭크 기법 (The Topic-Rank Technique for Enhancing the Performance of Blog Retrieval)

  • 신현일;윤은일;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.19-29
    • /
    • 2011
  • 1인 미디어인 블로그에 대한 관심이 증가함에 따라, 블로그 검색과 관련된 다양한 랭킹 알고리즘들이 제안되었다. 이러한 알고리즘들은 블로그가 웹 페이지와 다르게 갖는 구조적 특징에 맞게 변형되었으며, 각 블로그간의 연결이나, 댓글, 트랙백들을 통해 이루어진 상호소통 속에서 나타난 결과들을 바탕으로 블로그의 평판이나 인기도를 수치화하여 검색 시스템에 반영한다. 하지만 실제 블로그 검색에서는 블로그 자체의 랭크뿐만 아니라 검색어와 블로그 글과의 적합성과시간등의요소를복합적으로사용하게된다. 그런데기존에알려진요소만으로는검색결과의품질이낮을수 있다. 본 논문에서는 블로그의 주제와 관련도가 가장 높은 블로그를 찾아 낼 수 있는 주제-랭크 기법을 제안한다. 이 기법은 블로그와 블로그 글의 색인어뿐만 아니라, 블로그 글을 대표하는 주제와의 관계까지 랭킹을 매기는 방법이다. 제안된 기법을 통해 블로그 검색에서 검색어와 블로그의 연관성에 따라 랭킹을 효과적으로 부여할 수 있다. 본 논문 제안하는 주제-랭크 기법을 적용한 블로그 검색 시스템의 정확률과 적용률을 국내의 다른 블로그 검색 시스템들과 비교해 본 결과, 주제-랭크 기법을 사용한 블로그 검색 시스템의 성능이 타 시스템에 비해 더 우수함을 알 수 있었다.

오디세우스/IR: 정보 검색 기능과 밀결합된 고성능 객체 관계형 DBMS (Odysseus/m: a High-Performance ORDBMS Tightly-Coupled with IR Features)

  • 황규영;이민재;이재길;김민수;한욱신
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권3호
    • /
    • pp.209-215
    • /
    • 2005
  • 상용 ORDBMS 개발사들은 자신의 DBMS에 사용자 정의 타입과 사용자 정의 함수를 추가하는 확장 방법을 제공하고 있다. 이러한 확장은 상위 레벨 인터페이스를 사용하여 이루어진다. 이러한 기법을 소결합(loose-coupling)이라 부른다. 소결합의 장점은 구현하기 쉽다는 것이나, 높은 성능이 요구되는 대용량 데이타베이스에서 새로운 데이타 타입과 연산을 추가하기에는 적합하지 않다. 본 논문에서는, 이러한 요구 조건.을 충족하기 위해 밀결합(tight-coupling)이라는 개념을 사용하는 것을 제안한다. 밀결합에서 새로운 데이타 타입과 연산은 DBMS의 엔진 내부에 통합된다. 따라서, 새로운 데이타 타입과 연산이 높은 성능으로 일관성 있게 제공된다. 이 밀결합 아키텍처는 정보 검색 기능과 공간 데이타베이스 기능을 한국과학기술원/첨단정보기술연구센터에서 개발 중인 객체 관계형 DBMS 오디세우스/IR에 통합하기 위해 사용되고 있다. 본 논문에서는, 오디세우스/1R을 소개하고 오디세우스/IR과 밀결합된 정보 검색 기능(미국 특허 등록)을 설명한다. 다음으로, 오디세우스/1R을 사용한 단일 시스템(non-parallel) 설정에서 2,000만건의 웹 페이지를 관리할 수 있는 웹 검색 엔진을 보인다.

그리드 기반 정보검색 서비스를 위한 동적 가상 조직 관리 시스템 (Dynamic Virtual Organization Management System for Grid Based Information Retrieval Service)

  • 김양우;이승하;김혁호
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.1009-1016
    • /
    • 2006
  • 그리드 컴퓨팅 기반의 모든 응용 작업은 두 개의 요구사항을 필히 만족해야 하는데 그 중 하나는 가상조직의 동적 변화를 수용할 수 있어야 한다는 것이고, 또 다른 하나는 서로 다른 가상조직 사이에 서로 다른 보안 단계와 정책을 적용할 수 있어야 한다는 것이다. 본 논문에서는 우선 위의 요구사항들에 대한 두 개의 가상 시나리오를 통하여 그 중요성을 부각시키는 동시에 그리드 기반의 정보검색 시스템 시제품 개발을 통하여 그 요구사항들이 만족될 수 있음을 보여주었다. 가상조직의 동적 변화특성은 단지 그 조직에 속한 사용자들의 증가와 감소뿐만이 아니라, 전체 시스템을 구성하고 있는 서브시스템들 간에 컴퓨팅 파워에 대한 동적인 변화 요구에도 적용된다. 이는 어느 한 서브시스템으로부터의 컴퓨팅 파워 증가 요청을 시스템 내의 유휴 자원인 다른 서브시스템이 만족시켜 줄 수 있기 때문에 전체적인 시스템 상의 유연성이 유지된다는 장점을 갖는다. 본 논문에서는 글로버스 3.0에서 제공되는 보안기능과 가상조직을 이용하여 그리드 기반 정보검색 시스템을 구현하였고, 동적 가상조직을 위한 본 시스템의 확장성과 보안성이 어떻게 향상될 수 있는지를 보여 주었다. 이와 더불어 본 논문에서는 서로 다른 가상조직들을 관리하기 위한 가상조직 관리서비스를 구현하여 글로버스에 추가 서비스로 등록하였다.

검색과 분류가 동시에 가능한 JULSE 시스템의 설계 및 구현 (Design and Implementation of Field Classification and Information Retrieval Engine;JULSE)

  • 장정효;손주성;김도연;이상곤;이원휘;안동언
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.673-676
    • /
    • 2005
  • 기존의 정보검색 엔진은 문서의 분야에 상관없이 본문 전체의 내용을 보여주므로 사용자가 적합한 내용인지를 파악하기 위해서는 본문 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 본 논문에서 제안하는 방법은 질의어가 지시하는 분야를 분야연상어를 이용하여 자동으로 파악하고, 사용자가 원하는 분야에서의 검색이 이루어지도록 하는 검색과 분류가 동시에 가능한 엔진을 설계하여 검색결과의 성능을 향상하고자 한다. 이와 함께 적당한 분야연상어가 다수 출현한 단락을 사용자에게 제공하여 본문 전체를 보지 않아도 질의어에 적당한 문서인지를 빠르게 파악하도록 설계하여 구현하였다.

  • PDF

온톨로지기반 추론을 이용한 시맨틱 검색 시스템 (Semantic Search System using Ontology-based Inference)

  • 하상범;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.202-214
    • /
    • 2005
  • 시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.

자연어의 논리식으로의 변환을 이용한 고급검색 및 이를 활용한 히스토리 검색 (An Advanced Search that Converts Natural Language into the Logic Advanced Search and with Developed History Search Method)

  • 이대홍;유한석;박상원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.195-204
    • /
    • 2020
  • 현재 웹에서 존재하는 웹페이지는 16억개 이상이며 이중에서 원하는 검색결과를 얻기란 쉽지 않은 일이다. 대부분의 검색엔진에서는 정밀한 검색결과를 제공하기 위하여 논리식의 형태로 검색할 수 있게 하고 있다. 하지만 일반적인 경우 사람들은 원하는 정보를 논리식 형태로 검색하는데 익숙하지 않다. 때문에 복잡한 논리식 형태로 검색하기 보다는 자연어로 검색한다. 따라서 본 논문에서는 사용자가 입력하는 자연어 질의를 검색엔진의 고급검색을 사용할 수 있는 논리식으로 변환하여 검색결과의 품질을 향상시켜주는 검색방법을 제안한다. 또한 사용자들은 검색형태의 특징 중 하나인 단순성에 의해 길게 검색하기 보다는 여러 번의 짧은 검색을 이용하는 경우가 훨씬 많다. 이에 따라 사용자들에게 편리성을 제공하기 위하여 앞에서 제안한 검색방법을 활용한 히스토리 검색방법을 제안한다. 본 논문의 검색방법들을 사용한 결과 자연어 상태의 검색결과보다 논리식으로 변환한 검색결과의 정확도가 개선되었고 누락되는 키워드 없이 사용자가 검색하고자하는 모든 키워드를 반영할 수 있다. 이러한 검색방법이 검색엔진의 발전에 기여할 것으로 기대한다.