• 제목/요약/키워드: Information Retrieval Engine

검색결과 136건 처리시간 0.023초

ONTOLOGY DESIGN FOR THE EFFICIENT CUSTOMER INFORMATION RETRIEVAL

  • Gu, Mi-Sug;Hwang, Jeong-Hee;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.345-348
    • /
    • 2005
  • Because the current web search engine estimates the similarity of documents, using the frequency of words, many documents irrespective of the user query are provided. To solve these kinds of problems, the semantic web is appearing as a future web. It is possible to provide the service based on the semantic web through ontology which specifies the knowledge in a special domain and defines the concepts of knowledge and the relationships between concepts. In this paper to search the information of potential customers for home-delivery marketing, we model the specific domain for generating the ontology. And we research how to retrieve the information, using the ontology. Therefore, in this paper, we generate the ontology to define the domain about potential customers and develop the search robot which collects the information of customers.

  • PDF

디자인 전문 포탈 사이트의 디렉토리 구축체계에 관한 연구 (A Study on the Directory Classification Schemes of the Design Portal Site)

  • 임경란
    • 디자인학연구
    • /
    • 제15권2호
    • /
    • pp.223-232
    • /
    • 2002
  • 인터넷이 정보획득의 중요한 수단으로써 보편화되면서 인터넷상의 정보를 효율적으로 조직화하고 관리할 수 있는 시스템의 중요성이 점차 커지고 있다. 이에 따라 이용자의 정보검색효율성에 직접적인 영향을 기치는 디렉토리 분류체계에 대한 연구가 각 분야별로 활발히 진행되고 있다. 본 연구에서는 디자인 분야 디렉토리 분류체계에 의한 검색의 효율성을 높이기 위하여 문헌 분류체계에 대한 이론과 현재 서비스되어 지고 있는 디자인 포탈사이트들의 디렉토리 분류체계를 비교 분석하여 효율적인 분류체계 방안을 제안 하고자 한다.

  • PDF

도메인 질의응답 시스템 (Domain Question Answering System)

  • 윤승현;임은희;김덕호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.144-147
    • /
    • 2015
  • Question Answering (QA) 서비스는 사용자의 자연어 질의에 대응하는 정확한 답변을 제공하는 시스템이다. 본 연구는 특정 도메인에 관련한 사용자들의 질문에 대해 QA 서비스가 자동으로 대응하는 방법에 관한 연구이다. 이를 수행하기 위하여 사용자의 자연어 질문을 이해하고, 정형 데이터 및 비정형 데이터로부터 사용자 질문에 적합한 답변을 도출하여 제공하는 방법을 제시한다. 실험 결과 top 1 accuracy 68%, top 5 accuracy 77% 결과를 얻었다. 또한 본 논문은 QA 시스템 내부 모듈이 전체 accuracy에 미치는 영향에 대해서도 기술하였다.

병렬 정보검색 시스템의 순차적인 검색엔진 알고리즘의 병렬화를 위한 연구 (A Study for Parallelizing Sequential Algorithms of Search Engine in Parallel Information Retrieval System)

  • 김석영;박미영;박혁로;정인상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.693-696
    • /
    • 2007
  • 대규모 데이터를 효율적으로 검색하기 위한 병렬 정보검색 시스템에서는 하드웨어 확장으로 인한 병렬화로 시스템 전체의 작업 처리량을 증가시켰다. 그러나 병렬 시스템 상에서 수행되는 검색엔진의 알고리즘들은 여전히 순차적으로 수행되기 때문에, 사용자의 개별적인 질의처리 시간은 단축되지 않는다. 본 연구는 검색엔진의 병렬화를 위하여 사용자 질의처리 과정과 역색인 파일처리 과정의 순차 알고리즘들을 조사하여 병렬화의 필요성과 가능성을 평가한다. 이러한 평가는 병렬 정보검색 시스템에서 수행되는 순차 알고리즘들의 효과적이고 체계적인 병렬화를 도모하고, 보다 효율적인 병렬 정보검색 시스템의 구축을 가능하게 한다.

유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구 (A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research)

  • 박동진;최기석;이명선;이상태
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.54-62
    • /
    • 2009
  • 국가적으로 그리고 각 연구기관에서는 투자의 효율성을 기하기 위하여 연구사업 선정과정에서 데이터베이스로부터 중복과제 혹은 유사과제를 검색하는 과정을 거친다. 최근 부얼리언 기반의 키워드 매칭 검색알고리즘의 발전 및 이를 채택한 검색엔진의 개발로 인하여 검색의 정확도가 많이 향상되었지만, 사용자가 입력하는 제한된 수의 키워드들에 의한 검색은 유사과제 파악과 우선순위의 결정에 어려움이 있다. 본 연구에서는 제안된 과제의 문서를 분석하여 다수의 색인어들을 추출하고, 이들에게 가중치를 부여한 후, 기존의 문서들과 비교하여 유사과제를 찾아내는 문서단위의 검색 알고리즘을 제안한다. 구체적으로 벡터공간검색(Vector-Space Retrieval)모델의 한 종류인 TFIDF(Term Frequency Inverse document Frequency)를 기본 구조로 채택한다. 또한 개발되는 알고리즘에는 연구과제 제안문서의 구조에 적합한 속성별 가중치(feature weighting)를 반영하고 검색속도의 향상을 위하여 K-최근접 문서(KNN: K-Nearest Neighbors) 기법도 반영한 알고리즘을 제시한다. 실험을 위하여 실제 연구제안 문서와 구조가 동일한 기존의 보고서를 사용하였는데, KISTI에서 운영하는 과학기술정보포털서비스인 NDSL에서 이미 분류해 놓은 4분야의 1,000 개 연구 보고서 문서를 발췌하여 실험을 하였다.

범주 기반 평가를 이용한 검색시스템의 성능 향상 (Improving Performance of Search Engine Using Category based Evaluation)

  • 김형일;윤현님
    • 한국콘텐츠학회논문지
    • /
    • 제13권1호
    • /
    • pp.19-29
    • /
    • 2013
  • 정보에 대한 공간 복잡도가 높은 현재의 인터넷 환경에서는 사용자가 원하는 정보를 정확히 제공하는 것이 검색엔진의 목표이다. 그러나 대다수 검색엔진이 활용하는 내용 기반 기법은 현재의 인터넷 환경에서는 효과적인 도구로 사용될 수 없다. 내용 기반 기법은 어휘의 형태적 특성을 이용하여 웹페이지 가중치를 결정하기 때문에 웹페이지에 대한 변별력이 우수하지 못하다는 단점이 있다. 이러한 문제점을 해결하여 사용자에게 효과적인 정보를 제공하기 위해, 본 논문에서는 범주 기반 평가 기법을 제안한다. 범주 기반 평가 기법은 질의어를 의미관계로 확장하여 웹페이지와 유사성을 측정한다. 웹페이지 가중치 적용에 있어서, 범주 기반 평가 기법은 웹페이지 검색에 대한 사용자 반응과 질의어 범주를 가중치에 활용함으로써 웹페이지에 대한 변별력을 증가시킨다. 본 논문에서 제안한 기법은 사용자가 원하는 정보를 검색엔진을 통해 효과적으로 제공할 수 있는 장점이 있으며, 다양한 실험을 통해 범주 기반 평가 기법의 활용성을 확인하였다.

온톨로지 기반의 문화·관광지 검색 어플리케이션 구현 (Ontology-based Culture·Tourist Attraction Search Application)

  • 황태원;서정희;박흥복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.772-774
    • /
    • 2017
  • 현재 지역 문화 관광에 대한 개괄적인 단순 검색들은 많이 있으나, 온톨로지 기술을 적용한 체계적인 정보검색은 미약한 수준이다. 기존의 검색방법인 키워드 중심의 검색은 사용자가 원하는 의도와는 다른 검색 결과를 도출한다. 반면에 온톨로지를 이용한 시맨틱 검색은 추출한 웹 데이터들을 온톨로지로 구축하여 단어와 단어 간의 관계를 만들어 검색어와 관련된 정보를 보여준다. 따라서 관광객들이 해당 지역의 문화 관광지에 대해 검색 할 때, 검색결과에 의미 연관성을 포함하는 내용을 제공한다면 온톨로지를 통해 해당 지역의 문화 관광지, 이동수단, 연계된 장소 혹은 관련 행사에 대한 정보 등을 보다 쉽게 파악할 수 있을 것이다. 본 논문에서는 사용자에게 정확하고 신뢰성 있는 정보를 제공하기 위해 기존의 내부 데이터베이스에만 의존하던 검색 시스템을 확장하여 공공기관의 데이터베이스를 활용한 문화 관광지에 특화된 온톨로지 기반의 검색 시스템을 모바일 애플리케이션을 이용하여 제안하고자 한다. 이러한 효율적인 온톨로지의 구성으로 사용자에게 적합한 정보를 빠르고 정확하게 제공할 수 있다.

  • PDF

의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계 (LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services)

  • 김준겸;서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • 현재 다양한 검색엔진들이 사용되고 있다. 검색엔진은 메타태그 정보를 기본으로 크롤링, 색인생성, 검색 결과 출력의 3단계를 거치며, 사용자가 원하는 자료의 검색을 도와준다. 그러나 키워드를 기반으로 검색해서 얻은 방대한 문서가 관련이 없거나 적은 문서일 경우도 많다. 이러한 문제점 때문에 검색 결과에서 내용을 파악하여 정확도를 분류를 해야 하는 번거로운 일이 발생하게 된다. 다양한 검색엔진을 통해 추출된 결과의 경우 검색엔진의 인덱스는 주기적으로 업데이트 되지만 가중치에 대한 기준과 업데이트 주기는 검색엔진마다 다르고 검색 순위 산정 기준이 서로 다르기 때문에 동일한 키워드를 검색어로 입력하고도 서로 다른 검색 순위를 보여주는 단점을 가지고 있다 따라서 본 논문에서는 기존 검색엔진 대신 사용자가 입력한 키워드와 문서의 연관성을 추출하여 사용자가 찾고자 하는 키워드를 입력했을 때 키워드와 문서의 연관성을 향상 시킬 수 있는 LSTM모델을 설계하고자 한다.

  • PDF

DIALOG와 인터넷 데이터베이스의 검색 효율성에 관한 비교 연구 (Internet Database Retrieval Efficiency vs. DIALOG Retrieval Efficiency)

  • 김현희;최창석;안태경;신명조
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.103-127
    • /
    • 2000
  • 본 연구에서는 정보시스템과 정보의 유형이 DIALOG와 인터넷 데이터베이스의 검색 효율에 어떤 영향을 미치는 지를 알아 보기 위해서 두 가지 작업을 수행하였다. 첫째는 이 두 시스템의 검색 성능에 대한 기초 자료를 얻기 위해서 두 시스템의 특성을 비교/분석하고 설문지를 통해 에너지 및 경제 분야 정보 이용자들의 정보 이용 행태를 조사하였다. 두 번째는 에너지와 경제 분야의 20개의 정보 질문들을 이용하여 탐색 실험을 하여 두 시스템의 검색 효율성을 측정/비교하였는데 검색 효율성을 좀 더 효과적으로 비교하기 위해서 9가지 가설들을 설정하였다. 연구 결과를 종합해 보면 정보 유형이 DIALOG와 인터넷 데이터베이스 시스템의 적합성에 영향을 미칠 것이라는 가설들은 별 무리없이 검증되었으나 DIALOG를 활용한 검색 결과의 적합도가 인터넷을 활용한 경우의 적합도 보다 높을 것이라는 가설은 경제 분야만 통계적으로 검증되고 에너지 분야는 검증되지 못했다. 본 연구 결과에서 상대적으로 인터넷의 검색 효율이 높게 나온 이유로는 먼저 인터넷 검색에서 전문 정보가 비교적 많이 수록된 전문 검색엔진을 사용하게 한 점을 들 수 있고, 둘째는 인터넷 데이터베이스의 질적인 성장을 들 수 있으며, 끝으로 경제 및 에너지 분야의 주제 특성상 인터넷 데이터베이스를 통해 관련 자료를 많이 얻을 수 있지 않았을까 하는 가정을 해 볼 수 있다.

  • PDF

시맨틱 웹을 이용한 온톨로지 기반의 정보검색 시스템 설계 및 구현 (Design and Implementation of Information Retrieval System Based on Ontology Using Semantic Web)

  • 서우진;유경택
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.209-217
    • /
    • 2019
  • 본 논문에서는 시맨틱 검색 수행을 위해 검색 도메인에 알맞은 온톨로지를 이용, 구축하고 정보에 관한 검색, 변환, 통합, 공유가 가능한 검색 엔진을 구현하여 검색 시스템의 기반을 마련하는 것을 목적으로 하였다. 기존 방식에서 벗어나 온톨로지를 활용하여 계층 관계를 추론하고, 그 계층을 근거로 개체를 추론한 다음 속성을 추출하여 사용자가 원하는 자료와 관련있는 분야를 검색하는 것이다. 이러한 방식으로 정보를 검색할 수 있도록 정보검색 시스템을 '자격증'과 관련된 키워드를 입력하여 구현하였다. 구현된 시스템은 온톨로지에서 각 속성들의 의미와 관계를 정리하여 일반인 정보검색을 사용자가 빠르고 쉽게, 정확한 검색을 할 수 있도록 하였다. 또한, 구현 결과를 2개의 다른 검색엔진과 비교하였다. 비교한 검색엔진은 대표적인 검색엔진인 '네이버'와 '다음'이다. 시맨틱 웹을 이용한 검색을 수행하기 위해 검색 도메인에 맞는 온톨로지를 이용하여 구축한 본 연구의 검색 엔진은 상당히 우수한 결과를 보여주는 것으로 평가되었다. 그러나 검색 엔진의 정확성과 신뢰성을 높이고 좀 더 포괄적인 범주의 검색어 포함하기 위해서는 더욱 정형화된 온톨로지가 필요하다고 사료된다.