• 제목/요약/키워드: Information Retrieval Engine

검색결과 136건 처리시간 0.021초

Q&A 커뮤니티 기반 전문영역 검색을 위한 프레임워크 (A Framework for Q&A Community based Vertical Search)

  • 정옥란;오제환;이은석
    • 한국전자거래학회지
    • /
    • 제16권2호
    • /
    • pp.143-158
    • /
    • 2011
  • 본 연구는 Q&A(question and answer:질문-답변) 커뮤니티 사이트에서 집단지성의 특성을 추출하고, 이를 이용한 전문지식이나 정보 검색을 위한 전문영역 검색(vertical search) 을 위한 프레임워크를 제안한다, 많은 Q&A 사이트로부터 얻은 정보는 하나의 집단지성의 형태로 볼 수 있으며, 전문영역 검색은 특정 전문 분야 검색에 초점을 맞춘 검색 방법이다. 제안된 프레임워크는 사용자가 검색하고자 하는 질의어와 연관되어 있는 질문(question)과 답변(answer) 정보를 이용하여 관련어를 확장한 후, 이를 기반으로 전문지식을 요구하는 특정 도메인분야에 적용하게 된다. 이를 통해 일반 검색 엔진을 통해 검색된 검색 결과보다 유용한 정보와 전문적인 상세정보까지 제공해 줄 수 있다.

웹 통합문서의 효율적 생성과 검색을 위한 자동링크지원 시스템의 설계 및 구축 (Design and Implementation of Automatic Linking Support System for Efficient Generating and Retrieving Integrated Documents Based on Web)

  • 이원중;정은재;주수종;이승용
    • 정보처리학회논문지A
    • /
    • 제10A권2호
    • /
    • pp.93-100
    • /
    • 2003
  • 분산 컴퓨팅과 웹 서비스 기술의 발달과 함께, 급증하는 인터넷 사용자는 웹 기반의 맞춤형 정보를 편리하게 작성하고 제공받을 수 있는 서비스들을 요구하고 있다. 이를 위해, 본 논문에서는 맞춤형 정보로서 웹 기반의 통합문서를 생성하고, 사용자 요구에 따라 다양한 검색을 지원할 수 있는 자동링크지원 시스템(ALSS : Automatic Linking Support System)을 구축하고자 한다. 본 시스템의 구성은 클라이언트/서버 환경을 기반으로, 서버는 어휘분석, 질의처리 및 통합문서생성 기능들을 제공하는 자동링크엔진과 사전, 이미지 컨텐츠 및 URLs로 이루어진 데이터베이스를 지원하도록 구축하였다. 클라이언트 측은 서버 측의 자동링크엔진과 데이터베이스를 접근하여 웹 기반의 통합문서를 생성하는 웹 에디터와 검색 서비스를 지원하는 웹 도우미로 구축하였다. 웹 에디터나 웹 도우미 프로그램은 클라이언트 측에 별도의 설치 없이 서버로부터 다운로딩하여 실행할 수 있으며, 서버의 실행기능들의 일부를 글라이언트 측에 분산시키므로써 서버의 부하를 감소시켰다. 본 시스템의 구현으로서, 사용자 인터페이스는 JDK 1.3 기반의 SWING을 이용하고, 클라이언트와 서버간의 연동을 위한 자바 RMI 기법을 적용하였으며, SQL Server 7.0을 사용하여 데이터베이스를 구축하였다. 마지막으로 웹 에디터와 웹 도우미에 의해 자동링크엔진과 데이터베이스를 접근하는 과정과 그들의 실행결과를 보였다.

영역 할당 기법을 이용한 효율적인 경로 테이블 기법 (An Effective Path Table Method Exploiting the Region Numbering Technique)

  • 민준기
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.157-164
    • /
    • 2006
  • XML은 인터넷 상에서 데이터 표현 및 교환의 표준으로 떠오르고 있어서 XML 데이터의 양이 급속히 증가하고 있다. 따라서, XML 데이터에 대한 효율적인 저장 및 검색이 필요하다 관계형 데이터베이스를 이용하는 XRel과 같은 XML 저장 관리 기법에서는 단순히 모든 레이블 경로들을 저장함으로써, 다양한 형태의 경로 표현식을 효율적으로 처리하지 못한다. 본 논문에서는 관계형 데이터베이스를 이용하여 XRel에서 제안된 경로 테이블 기법 보다 효율적인 데이터 저장 및 검색 기법을 제시한다. 본 논문에서 제안하는 기법은 XML 경로 인덱스를 관계형 데이터베이스에 저장하고 레이블 경로를 경로 식별자로 대치함으로써 다양한 형태의 XML 질의들을 기존의 방식에 비하여 보다 효율적으로 처리할 수 있도록 하였다. 또한 제안된 방식은 관계형 데이터베이스 엔진의 수정을 요구하지 않으며, 기존의 방식에 비하여 보다 적은 디스크 공간을 소비한다. 우리의 실험 결과는 제안된 기법이 기존의 기법에 비하여 좋은 질의 성능을 나타냄을 보인다.

강인한 오디오 핑거프린팅 시스템을 위한 에너지와 통계적 필터링 (Energy and Statistical Filtering for a Robust Audio Fingerprinting System)

  • 정병준;김대진
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-9
    • /
    • 2012
  • 디지털 음악과 스마트 폰이 대중화되면서 잡음에 강인한 실시간 음악 핑거프린트 시스템이 다양하게 개발되고 있다. 특히 핑거프린트 알고리즘 중 Multiple Hashing(MLH)은 잡음에 강인하고 정교한 구조로 되어 있다. 본 논문에서는 음악 데이터베이스로부터 질의 및 응답의 정확도를 개선하기 위해 에너지 집중필터를 사용하고 연속성과 중복성을 제거하는 통계적 필터를 제안한다. 에너지 집중 필터는 하위 비트에 에너지가 집중되는 Discrite Cosine Transform(DCT)의 특징을 이용하고, 통계적 필터는 검색된 핑거프린트 정보들 사이의 상관관계 특성을 이용한다. 실험 결과로 잡음 환경에서 에너지와 통계적 필터링으로 구성된 제안 알고리즘은 우수성을 보인다. 이는 제안된 필터 엔진으로 Philips Robust Hash(PRH)보다 잡음에 강인하고 Multiple Hashing(MLH)보다 간결한 핑거프린트 시스템을 구성할 수 있다.

온톨로지를 이용한 이미지 내 객체사이의 의미 정보 추론 (Semantic Information Inference among Objects in Image Using Ontology)

  • 김지원;김철원
    • 한국전자통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.579-586
    • /
    • 2020
  • 웹 페이지에는 방대한 양의 멀티미디어 자료가 있으며 정확한 검색을 위하여 낮은 수준의 시각 정보에서 의미 정보를 추출하는 방법에 대한 연구가 이루어지고 있다. 그러나 이러한 기술들은 대부분 한 장의 이미지에 하나의 정보를 추출하므로 이미지 내에 여러 객체가 조합되어 있는 경우 의미 정보를 추출하기 어렵다. 본 논문에서는 이미지내의 여러 객체와 배경 등을 추출하기 위하여 우선 각각의 저수준 특징을 추출하고, 이를 SVM을 이용하여 미리 정의해 놓은 배경과 객체로 나눈다. 이렇게 나눈 객체와 배경은 온톨로지로 구축하고, 위치와 연관 관계의 의미 정보를 추론엔진을 이용하여 추론한다. 이는 이미지 내의 여러 객체들 사이에 의미 정보 추론이 가능하고, 좀 더 복잡하고 다양한 고수준의 의미 정보를 추론하는 방법을 제안한다.

오디세우스/Parallel-OOSQL: 오디세우스 정보검색용 밀결합 DBMS를 사용한 병렬 정보 검색 엔진 (Odysseus/Parallel-OOSQL: A Parallel Search Engine using the Odysseus DBMS Tightly-Coupled with IR Capability)

  • 류재준;황규영;이재길;권혁윤;김이른;허준석;이기훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권4호
    • /
    • pp.412-429
    • /
    • 2008
  • 최근 들어 인터넷의 성장으로 인하여 문서의 양이 기하급수적으로 증가함에 따라, 대용량의 문서를 마르게 검색 할 수 있는 병렬 정보 검색 엔진에 대한 중요성이 더욱 대두되고 있다. 병렬 정보 검색 엔진을 구현하기 위하여서는 역 색인을 분할하고, 분할된 역 색인을 통하여 병렬적으로 검색하는 것이 필요하다. 역 색인을 분할하는 기존 방법으로는 1) 문서 식별자 분할 방법과 2) 식별자 분할 방법이 있다. 그러나 각 분할 방법은 다음과 같은 단점들을 가지고 있다. 문서 식별자 분할 방법은 문서의 추가가 용이하고 처리량(throughput)이 높은 반면에 top-k 질의 처리 성능이 좋지 않다. 그리고 식별자 분할 방법은 top-k 질의 처리 성능이 좋은 반면에 문서의 추가가 어렵고 처리량이 낮다. 본 논문에서는 이러한 단점들을 해결하기 위하여 혼합 분할 방법을 제안하고 이를 정보 검색 기능과 밀결합된 DBMS인 오디세우스에 실현한 병렬 정보 검색 엔진을 설계하고 구현한다. 먼저, 제안된 병렬 정보 검색 엔진인 오디세우스/parallel-OOSQL의 아키텍쳐를 설명한다. 그리고 체계적인 실험을 통하여 제안된 시스템의 유용성을 보인다. 실험 결과, 문서 식별자 분할 방법은 질의 처리 시간이 역 색인 분할의 블록의 개수에 근사적으로 역 비례함을 보였으며, 키워드 식별자 분할 방법은 top-k 질의 처리에 좋은 성능을 보였다. 본 논문에서 제안된 병렬 정보 검색 엔진은 세 가지 분할 방법을 모두 제공하기 때문에 응용 환경에 따라 분할 방법을 커스터마이즈함으로써 항상 좋은 성능을 낼 수 있다. 오디세우스/parallel-OOSQL 병렬 정보 검색 엔진은 각 슬레이브 노드 당 1억 건의 웹 문서를, 시스템 전체로는 수십억 건의 웹 문서를 인덱스하여 저장하고 질의를 처리할 수 있다.

패턴을 이용한 3D 가상 건축 기술 (3D Virtual Building Technic using Pattern)

  • 한정수;김귀정
    • 한국콘텐츠학회논문지
    • /
    • 제10권8호
    • /
    • pp.66-72
    • /
    • 2010
  • 본 연구는 건축자재들을 컴포넌트로 구성하고 컴포넌트들을 패턴으로 조립하여 패턴 단위로 건축설계가 효율적으로 이루어질 수 있도록 하는 3D 가상건축 기술을 개발한다. 또한 이 기술을 이용하여 건축의 공정에 설계, 분석, 변경정보, 조립 등의 건축설계를 시뮬레이션을 통하여 건축의 손쉬운 변경과 비용을 효과적으로 절감하기 위한 기술을 지원하는 조립 건축설계 시스템 개발을 목적으로 한다. 특히 설계자와 사용자도 패턴을 이용하여 쉽게 건축물을 변경시킬 수 있으며 변경에 따라 필요한 자재들의 패턴 정보와 변경된 건축물의 설계도가 자동 생성된다. 또한 개인의 숙련도나 지식 가시화를 통해 발생할 수 있는 지식검색 역시 구현 목표로 한다.

폭소노미 기반 개인화 웹 검색 시스템 (Folksonomy-based Personalized Web Search System)

  • 김동욱;강수용;김한준;이병정
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권1호
    • /
    • pp.105-115
    • /
    • 2010
  • 검색엔진들은 사용자로부터 질의어를 전송받아 질의어와 관련이 가장 높은 웹 문서들을 보여주게 된다. 하지만 검색엔진이 사용자의 질의어만 가지고 사용자의 의도를 파악하여 정확한 웹 문서를 제공하기는 어렵다. 따라서 검식 엔진 시스템은 다양한 개인화 방법을 사용하여 각 사용자가 원하는 검색 결과를 보여주기 위해 노력한다. 본 논문에서는 개인화 검색을 위해 '폭소노미'를 기반으로 사용자에게 적합한 질의어를 추천해 주는 방법을 제안한다. 또한 이러한 개인화된 검색 결과를 제공하는 시스템이 가질 수 있는 프라이버시 침해 위험성을 제거하면서도 검색 서비스 제공자 입장에서는 사용자 정보를 활용한 다양한 서비스(개인화 광고등) 제공이 가능하도록 하는 개인화 검색 서비스 구조를 제안한다.

연관 피드백과 퍼지 함의 연산자를 이용한 스니핏 추출 방법 (Snippet Extraction Method using Fuzzy Implication Operator and Relevance Feedback)

  • 박선;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.424-431
    • /
    • 2012
  • 정보 검색 시 검색엔진은 사용자에게 웹페이지 순위와 웹페이지의 요약정보를 제공한다. 이중 웹 페이지를 대표 할 수 있는 요약된 정보를 스니핏(snippet)이라한다. 스니핏은 사용자의 웹페이지 방문에 큰 영향을 준다. 정확한 방문 페이지의 정보를 모르고 단지 스니핏 만을 이용할 때에 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 검색엔진에서 지원하는 스니핏에 사용자의 의도를 정확하게 반영하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 연관 피드백과 퍼지 함의 연산자를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 연관 피드백을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 웹 페이지 사이에 퍼지 함의 연산자를 이용하여 질의와 확장된 질의의 포함관계가 반영된 스니핏을 추출함으로써 사용자의 의도를 스니핏에 더 잘 반영할 수 있다. 실험결과에서 제안방법이 다른 방법보다 스니핏 추출에 더 좋은 성능을 보인다.

이미지정보 탐색을 위한 웹 검색엔진의 비교 평가 (Comparison and Evaluation of Web-based Image Search Engines)

  • 김효정
    • 정보관리연구
    • /
    • 제31권4호
    • /
    • pp.50-70
    • /
    • 2000
  • 인터넷으로 접근할 수 정보의 형태가 텍스트는 물론 이미지나 사운드까지 포함되면서 다양한 웹 이미지 검색엔진들이 개발되고 있다. 그러나 이 검색엔진들은 검색 특성과 효율성 면에서 상당한 차이를 보이고 있다. 이에 본 연구에서는 현재 개발된 이미지정보를 탐색하는 검색엔진들의 유형을 살펴보고 이들의 특성과 성능을 비교 평가하여 이용자로 하여금 정보요구에 적합한 이미지 검색엔진을 선택할 수 있도록 하는데 그 목적이 있다. 본 연구의 비교대상 검색엔진으로는 현재 가장 널리 쓰이고 있는 AV Photo Finder, Lycos MultiMedia, Amazing Picture Machina Image Surfer, WebSeek, Ditto를 선정하였다. 먼저 문헌연구를 통해 이미지 검색엔진의 평가기준을 마련하였다. 그리고 마련된 기준에 따라 각 검색엔진들의 데이터베이스 및 색인 방법, 검색 기능, 출력 형태, 이용자 인터페이스를 조사하였고 검색성능을 평가하기 위해 상대적 재현율과 정확률을 측정하였다. 그 결과 AV Photo Finder의 정확률이 가장 높았고 Ditto와 WebSeek의 정확률은 비교적 높은 편이었다. 그리고 Lycos MultiMedia와 Image Surfer의 정확률 값이 그 뒤를 이었으며 Amazing Picture Machine의 정확율이 가장 낮았다.

  • PDF