• 제목/요약/키워드: 검색 엔진

검색결과 825건 처리시간 0.024초

활동성, 신뢰성 기반의 Influence 지수 산정 알고리즘 설계 (A Design of the Influence Value Computation Algorithm Based on Activity and Trust)

  • 최창현;박건우;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.383-386
    • /
    • 2009
  • 집단지성을 이용한 지식검색 서비스는 개방적 구조와, 축적된 자료를 공유할 수 있다는 커뮤니티적인 특성으로 큰 인기를 얻고 있다. 하지만 방대한 지식공유속에서 사용자가 진정으로 원하는 답변 획득은 점점 더 어려워지고 있다. 최근 알고리즘적으로 가장 정교하다고 평가 받는 구글을 통해 상위에 랭크된 검색결과들 중에는 집단지성을 통해 구축된 위키피디아, Yahoo Q/A 과 같은 Social 검색엔진의 검색결과들이 상당수 존재한다. 본 논문은 대부분의 질문은 인간으로부터 문제해결의 실마리를 얻을 수 있다는 점과 온라인상의 사용자에 대한 연구를 통해 지식검색 서비스 사용자중 Influence를 찾는것에 목적이 있다. 이에 국내 Social 검색 엔진의 대표인 네이버 지식iN을 중심으로 지식검색내의 사용자 활동성과 신뢰성을 분석하고, 이를 기반으로한 Influence 지수 산정 알고리즘을 제안한다. 제안된 알고리즘을 통한 Influence 지수는 지식검색 서비스에서 문제 해결의 실마리를 가진 사용자를 찾는 중요한 지표가 될 것이다.

정확도 높은 검색 엔진을 위한 문서 수집 방법 (A Document Collection Method for More Accurate Search Engine)

  • 하은용;권희용;황호영
    • 정보처리학회논문지A
    • /
    • 제10A권5호
    • /
    • pp.469-478
    • /
    • 2003
  • 인터넷상의 정보 검색 엔진들은 웹 로봇을 이용해서 인터넷에 연결되어 있는 수 많은 웹 서버들을 주기적 또는 비주기적으로 방무나여 자체적인 인텍싱 방법에 따라 자료를 추출하고 분류해서 검색 엔진의 기초가 되는 데이터 베이스를 구축하고 변겨아는 작업을 계속하고 있다. 이런 일련의 작업은 인터넷 상에 분산되어 있는 막대한 정보를 쉽고 정확하게 찾을 수 있는 게이트 사이트로서의 역할을 담당하기 위한 전략적인 목적으로 진행되고 있다. 수천만 이상의 웹 사이트들을 상대로 하는 정보 수집은 검색 엔진 사이트 중심으로 기존 데이터의 수정과 삭제 등과 같은 데이터 베이스 유지 관리와 신규 사이트들에 대한 자료 수집 작업이 이루어지고 있다. 이러한 작업은 웹 서버에 대한 사전 지식 없이 정보 추출을 위해 웹 로봇을 실행하므로 인터넷 상에 수많은 요구가 전송되고 이는 인터넷 트래픽을 증가 시키는 원인이 되고 있다. 따라서 웹 서버가 사전에 자신이 공개할 문서에 대한 변경 정보를 웹 로봇에게 통보하고 웹 로봇은 이 정보를 이용해서 웹 서버의 해당 문서에 대한 정보 수집 작업을 한다면 불필요한 인터넷 트래픽을 감소시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 해당 문서에 대한 정보수집 작업을 한다면 불필요한 인터넷 트래픽을 감소 시킬 수 있을 뿐만 아니라 검색 엔진의 정보의 신뢰도도 높아지고 웹 서버의 시스템 부하와 검색 엔진의 시스템 부하를 줄일 수 있는 효과를 가질 수 있을 것이다. 본 논문에서는 웹 서버상의 웹 문서 파일의 변동 사항을 자동으로 검사하고 변동 사항들을 종합 정리해서 변경 문서에 대한 정보를 통보 받기 원하는 등록된 각 웹 로봇에게 전송하는 검사 통보 시스템을 설계 구현하였다. 웹 로봇을 운영하는 검색 엔진에서는 통보된 요약 정보를 이용해서 웹 서버로부터 해당 문서를 전송 받아 필요로 하는 인덱스 정보를 추출해서 데이터베이스를 구축하는 효율적인 웹 로봇을 설계 구현하였다.

고속의 패킷 포워딩 엔진을 위한 병렬 IP 주소 검색 기법 (A Parallel IP Address Lookup Scheme for High-Speed Packet Forwarding Engine)

  • 박재형;장익현;김진수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1297-1300
    • /
    • 2002
  • 포워딩 엔진은 외부 인터페이스를 통해서 들어오는 패킷에 대해서 IP 주소를 기반으로 목적지로 향하는 다음 홉을 결정한다. 이러한 고속의 패킷 처리를 위한 포워딩 엔진을 설계함에 있어서 IP 주소 탐색은 중요한 요인이다. 본 논문에서는 검색경로 압축 트라이에 기반한 IP 주소 탐색 알고리즘을 병렬화 하는 기법을 제시한다. 제시된 병렬화를 통해서 IP 주소 탐색의 메모리 접근 횟수글 줄일 수 있으며, 고성능의 패킷 포워딩 엔진에 적용할 수 있다.

  • PDF

의학 분야 웹 자료의 분류에 대한 개선 방안 연구 (A Study on the Organizing Web Materials in the Field of Medicine)

  • 정경희
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.89-106
    • /
    • 2004
  • 웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 $\boxDr$의학용어집$\boxUl$의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

인터넷 학술정보자원의 디렉토리 서비스 설계에 있어서 DDC 분류체계의 활용에 관한 연구 (A study on the use of DDC scheme in directory search engine for research information resources on internet)

  • 최재황
    • 정보관리학회지
    • /
    • 제15권2호
    • /
    • pp.47-68
    • /
    • 1998
  • 인터넷이 제공하는 학술정보자원은 풍부하지만 그 중에서 이용자들이 자신에게 필요한, 좋은 정보를 찾기는 쉽지 않다. 체계적으로 정리되어 있지 않기 때문이다. 본 연구에서는 도서관에서 오랫동안 이용해온 분류체계인 DDC(Dewey Decimal Classification)을 이용하여 학술분야 인터넷정보자원을 검색할 주제별 디렉토리 검색엔진을 설계하였다. 이 검색엔진을 설계함에 있어서 대개념에서 소개념으로 특정주제를 세분해가는 DDC의 '체계적 배열'에 따라 분류코드를 설계하였고, DDC의 '상관색인'을 이용하여 자동 문서분류사전을 작성하였다.

  • PDF

시맨틱 자원을 이용한 KOSEN 통합검색 서비스 (Unified Search Service using Semantic Resource in KOSEN)

  • 한희준;윤정선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.533-535
    • /
    • 2010
  • 검색기능은 사용자가 원하는 정보를 효과적으로 탐색하고 이용가능하게 하는 중요한 서비스 요소이다. 본 논문에서는 과학기술분야 전문분석자료, 수집자료, 동향정보를 제공하는 KOSEN(한민족과학기술자네트워크)의 통합검색 서비스 구축에 대해 논한다. 어휘지능망, 연구주제망 등 시맨틱 자원을 활용하여 사용자의 검색 편의성 및 효율성을 최대화 하였으며, 빠른 검색속도와 다양한 검색 부가기능을 제공함으로써 정보의 획득 및 이용의 만족도를 증가시키고자 FAST 검색엔진을 적용한 특징이 있다.

  • PDF

사용자 프로파일을 이용한 전자 상거래 검색 시스템 설계 (Design of Electronic Commerce Search System Using User-Profile)

  • 김두현;홍도석;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.601-603
    • /
    • 2001
  • 본 논문에서는 사용자의 요구사항을 만족하는 최적의 상품을 검색하는 전자 상거래 검색 시스템을 설계하고자 한다. 우리는 전자 상거래의 물품 구입에 대한 사용자 설문 조사를 통하여 소비자에게 영향을 미치는 요소들을 추출한다. 이러한 요소들 중에서 검색 엔진이 비교할 수 있는 요소들을 소비자 프로파일(Profile) 요소로 결정하고, 인터넷의 많은 상품 중에서 퍼지(Fuzzy) 이론을 적용하여 사용자의 프로파일에 적당한 상품 검색 알고리즘을 제안해 소비자가 상품 검색을 쉽게 할 수 있는 검색 시스템을 설계한다.

  • PDF

범주 기반 평가를 이용한 검색시스템의 성능 향상 (Improving Performance of Search Engine Using Category based Evaluation)

  • 김형일;윤현님
    • 한국콘텐츠학회논문지
    • /
    • 제13권1호
    • /
    • pp.19-29
    • /
    • 2013
  • 정보에 대한 공간 복잡도가 높은 현재의 인터넷 환경에서는 사용자가 원하는 정보를 정확히 제공하는 것이 검색엔진의 목표이다. 그러나 대다수 검색엔진이 활용하는 내용 기반 기법은 현재의 인터넷 환경에서는 효과적인 도구로 사용될 수 없다. 내용 기반 기법은 어휘의 형태적 특성을 이용하여 웹페이지 가중치를 결정하기 때문에 웹페이지에 대한 변별력이 우수하지 못하다는 단점이 있다. 이러한 문제점을 해결하여 사용자에게 효과적인 정보를 제공하기 위해, 본 논문에서는 범주 기반 평가 기법을 제안한다. 범주 기반 평가 기법은 질의어를 의미관계로 확장하여 웹페이지와 유사성을 측정한다. 웹페이지 가중치 적용에 있어서, 범주 기반 평가 기법은 웹페이지 검색에 대한 사용자 반응과 질의어 범주를 가중치에 활용함으로써 웹페이지에 대한 변별력을 증가시킨다. 본 논문에서 제안한 기법은 사용자가 원하는 정보를 검색엔진을 통해 효과적으로 제공할 수 있는 장점이 있으며, 다양한 실험을 통해 범주 기반 평가 기법의 활용성을 확인하였다.

정보 수집 에이전트를 사용한 어린이 교육 정보 검색 시스템의 설계 및 구현 (Design and Implementation of an Education Information Search System for Children Using Information Gathering Agents)

  • 전진욱;배인한
    • 인터넷정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.97-108
    • /
    • 2002
  • 특정 정보를 필요로 하는 사용자는 관련 문서를 찾기 전에 다수의 검색 엔진들을 질의할 필요가 자주 있을 것이다. 검색엔진들의 항해 문제를 해결하기 위하여 에이전트가 사용되고 있다. 일반적으로, 에이전트는 적절할 때 또는 다른 프로그램의 요청에 따라 자동적으로 특정한 태스크를 수행할 수 있는 프로그램이다. 이 논문에서, 우리는 Edulnfo4k라 부르는 정보 수집에이전트를 사용한 어린이 교육 정보 검색 시스템을 설계하고 구현한다. 정보 수집 에이전트는 다수의 어린이 포털 웹사이트들: 야후코리아 꾸러기, 네이버 쥬니어 그리고 한미르 개구쟁이를 주기적으로 방문하고, 어린이 교육 또는 학습 정보를 수집하고, 수집된 정보를 데이터베이스에 저장한다. 따라서 일반 사용자들은 일관된 사용자 인터페이스를 통하여 데이터베이스로부터 어린이 교육 정보를 편리하게 검색할 수 있다. 그 결과, 우리는 Edulnfo4k가 다수의 검색엔진에서 질의 언어 통합검색을 제공함을 알 수 있었다.

  • PDF

유연성 있는 이벤트 파싱 엔진의 설계 및 구현 (Design and Implementation of Flexible Event Parsing Engine)

  • 윤태웅;민덕기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.189-192
    • /
    • 2003
  • 분산 시스템의 관리를 위해서 시스템 내의 각 컴포넌트에서 발생되는 많은 이벤트 중에 의미 있는 이벤트를 효과적으로 찾아내는 이벤트 파싱 엔진이 필요하다. 본 논문에서는 유연성 있는 이벤트 파싱 엔진을 제안한다. 특히 이벤트 파싱 엔진의 내부 구현을 위해서 기존의 룰 기반 접근방법을 변형한 새로운 접근방법을 제시한다. 본 엔진에서는 룰의 조건과 액션을 스크립트 객체화한 스크립트 객체 기반 접근방법과 룰에 해당하는 이벤트들을 찾아낼 때 보다 효과적이 검색을 지원하는 이벤트 토큰 기반 방식을 사용한다.

  • PDF