• 제목/요약/키워드: 웹 검색

검색결과 2,248건 처리시간 0.027초

다중 에이전트 기반 웹 웨어하우징 (Web Warehousing based on Multi-Agent)

  • 김현희;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2000
  • 본 연구에서는 기존의 데이터 웨어하우징 기술과 웹 기반 기술을 통합한 웹 웨어하우징 기법에 다중 에이전트 패러다임을 적용하여 다중 에이전트 기반 웹 웨어하우징 시스템을 설계, 구현하였다. 시스템은 정보 검색 에이전트, 정보 통합 에이전트, 웹하우스 구축 에이전트로 구성된다. 정보 검색 에이전트는 여러 종류의 웹 자원을 수집한다. 정보 통합 에이전트는 정보 검색 에이전트에 의해 수집된 이형질적인 데이터를 일정한 형식으로 변환한다. 웹하우스 에이전트는 생성된 데이터를 사용하여 웹하우스를 구축하고 관리한다. 웹 데이터를 통합하기 위해 새로운 데이터 모델을 제안하였다. 의미를 갖는 지능적 객체를 생성하기 위해 여러 종류의 추론 에이전트들이 추론작업을 수행하고, 이들은 블랙보드 시스템을 통하여 작업을 통합한다. 본 시스템은 의미 정보 데이터를 사용하므로 웹 정보의 의미적 검색과 정보추출이 가능하다.

  • PDF

개인화 에이전트를 이용한 시멘틱 웹서비스 검색 (The Personalized Agent using the Semantic WebService Discovery)

  • 하상범;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.124-126
    • /
    • 2003
  • 현재 소프트웨어들은 웹서비스라는 새로운 분야로 확대되어 발전되고 있다. 또한 기존의 웹이 가지는 단점을 보완하기 위해 등장한 시멘틱 웹을 차세대 웹이라 말하고 이러한 시멘틱 웹을 사용하기 위한 않은 연구가 진행되고 있다. 본 논문에서는 에이전트가 정보의 의미를 이해하고 자동화한 기법들을 사용 할 수 있게 하는 시멘틱 웹에 대한 연구를 웹서비스(Webservice)분야로 확대시키고, DAML-S라는 독립된 연구분야로서 서비스내용에 대한 기술과 프로세스 컨트롤의 정의. 서비스를 접근하는 방법들을 에이전트가 수행하므로써 기존의 Syntactic기반 웹 서비스 검색구조가 가지는 문제점을 개선하고 에이전트가 추론형 검색엔진을 통하여 보다 정확하고 적합한 웹 서비스 검색을 가능하게 한다. 또한 개인화 기법들을 활용하여 효율성이 한 단계 높은 개인화 기능을 에이전트에게 부여하게 된다.

  • PDF

RIA 기술을 활용한 개인화된 웹 검색 (Personalized Web Search using RIA Technology)

  • 박차라;임태수;이우기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (A)
    • /
    • pp.9-10
    • /
    • 2007
  • 쉽고 유연한 조작과 다양하고 역동적인 화면구성에 초점을 맞춘 인터넷서비스 맞춤기술인 RIA(Rich Internet Aplication)기술들은 웹2.0기술중 사용자 편의성을 강조한 차세대 UI기술로 기대되고 있다. 본 논문은 평면적이고 순차적인 방법의 고급검색을 동적UI로 구현하고 사용자가 개인화 검색정보를 저장해서 검색에 활용할 수 있도록 구현하였다. 또한 사용자중심의 키워드 선호도를 통해 기존 웹 검색보다 개인화된 검색 결과물을 발견할 수 있는 검색구조를 설계하였다. 본 연구는 RIA 기술을 활용한 개인화 검색 관리자의 적용을 통해 검색된 페이지양의 감소를 입증하여 사용자에게 더욱 정제된 데이터를 제공하며 결론적으로 사용자들이 더욱 유연하고 편리한 방법으로 개인화된 웹 검색을 이용할 수 있음을 보였다.

  • PDF

포인트 / 웹 검색을 위한 맞춤형 옵션들

  • 그레그R.노테스
    • 디지털콘텐츠
    • /
    • 4호통권95호
    • /
    • pp.34-37
    • /
    • 2001
  • 웹검색의 어둡고 먼 과거로 거슬러 올라가면 HotBot가 스크립티드 파워 검색 기능에 대한 특성의 검색엔진으로서 최고 권위를 휘두르고 있었다. 그 초기 형태들 중 하나의 경우 검색자가 HotBot 검색 형태에 대한 옵션 중 어떤것이 디스플레이되어야 하는지를 선택할 수 있었다. 쿠키 파일에 검색자 컴퓨터상의 이런 환경설정이 저장된다는 것은 검색자가 HotBot를 재방문할 때마다 그가 선호하는 검색 옵션이 나타난다는 것을 의미한다.

  • PDF

계층적 캐슁 기법을 이용한 대용량 웹 검색 엔진의 구현 (Implementation of a large-volume Web search engine using the multi-level data caching)

  • 임성채
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.87-91
    • /
    • 2007
  • 논문에서는 6,000만개 웹 페이지의 색인 데이터에 대해 일 600만 질의를 처리하는 대용량 웹 검색 시스템을 위해 구현된 계층적 캐슁 기법을 소개한다. 논문에서 설명된 시스템 구조 및 알고리즘은 실제 상용 웹 검색 엔진에서 구현되고 운영 결과를 통해 그 유용성이 입증된 것들로서, 구현된 시스템과 유사성을 가지는 대용량 데이터 처리 시스템에 적용 가능할 것이다. 본 논문에서는 기존에 많이 소개되지 않았던 웹 검색 엔진의 운영 절차 및 웹 질의 처리 시스템에 대한 기술적 내용이 기술되었으며, 기술된 내용을 통해 웹 검색 엔진에 대해 보다 정확한 이해가 가능해 질 것이다.

  • PDF

웹 환경에서의 홈페이지 검색 시스템 (Homepage Retrieval System in Web Environment)

  • 장중식;박의규;나동렬;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.70-75
    • /
    • 2001
  • 최근 웹 환경은 홈페이지 단위로 구축되는 사례가 보편화 되어 있으며, 사용자가 단순한 웹 문서가 아닌 홈페이지를 요구하는 경우도 빈번하다. 그러나 기존의 웹 환경 검색 시스템의 결과는 이러한 질의에 대한 결과로는 적절하지 않기 때문에, 본 논문에서는 홈페이지 검색을 위한 새로운 방법을 제시한다. 웹 문서 검색을 위하여 먼저 기존 검색 방법을 이용하여 결과를 얻은 후 웹 문서에 포함된 링크가 주는 정보를 추가하여 결과를 확장하는 두 가지 방법을 제시한다. 확장된 결과에서 홈페이지의 엔트리 포인트에 해당하는 웹 문서를 출력 리스트의 상위에 위한 순위 재조정 알고리즘을 소개한다.

  • PDF

강화학습을 이용한 웹 정보 검색 (Web Information Search Using Reinforcement Learning)

  • 정태진;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.94-96
    • /
    • 2001
  • 현재 인터넷상에서 제공되고 있는 대부분의 서치엔진들은 정보소스에 접근해서 이를 가져오는 웹 로봇(webbot)이라고 불리우는 에이전트를 이용한다. 그런데 이런 웹 로봇들이 웹 문서를 검색하는 방법은 극히 단순하다. 물론 많은 정보를 가지고 오는 것에 초점이 맞추어져 있어서 정확도를 중시하지 않는 것에도 한 원인이 있다. 범용 검색엔진과는 달리 검색하는 영역을 축소하여 특정 주제에 관련된 정보만을 더 정확히 찾아주는 검색엔진의 필요성이 증가하고 있다. 이에 본 논문에서는 강화 학습 방법을 이용하여 웹 상에 존재하는 정보 중에서 특정 주제의 웹 페이지를 보다 더 정확히 찾는 방법을 제시한다. 강화 학습은 웹 상의 하이퍼링크를 따라가는 문제에 있어서 미래에 이로움을 주는 행동의 효용성을 측정하는데 있어서 이점을 보인다. 강화 학습을 이용하여 제시된 방법을 통한 실험에서는 일반적인 방법보다 더 적은 링크를 따라가고도 더 정확한 결과를 보였다.

  • PDF

반복적 웹 검색을 제거한 다중 웹정보 뷰어 (Multiple Web-Information Viewer removing repetitive web searching)

  • 이정수;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.964-966
    • /
    • 2014
  • 인터넷 이용자 급증으로 정보들은 무한히 생산되고 사방에 산재되어 가고 있다. 이로 인해 정보들을 탐색하는 시간은 계속 증가하고 있다. 특히 공지사항이나 날씨처럼 반복적으로 갱신되는 정보들을 얻기 위해 사람들은 동일한 정보를 주기적으로 검색하고 있으며 이에 따른 불필요한 트래픽 유발 및 검색시간이 낭비되고 있는 실정이다. 본 논문은 동일한 정보를 주기적으로 검색함으로써 야기되는 문제점을 서술하고 이를 해결하기 위해 다수의 웹상에서 각종 정보들만을 추출하여 하나의 웹페이지 내에 배치하는 웹 컴포넌트를 설계 및 구현한다. 이 시스템을 사용한다면 사용자는 단순히 하나의 웹페이지를 클릭함으로써 다수의 웹상에 저장된 정보들을 웹서핑 없이 얻을 수 있기 때문에 정보검색 시간을 크게 단축시킬 수 있다. 이 시스템을 구현하기 위해 크로스 도메인상의 웹문서에서 정보를 추출하고 조작하는 것을 금지하는 웹 표준 정책인 동일출처정책을 우회할 수 있는 방법을 서술하였으며 이 정책을 회피함으로써 파생되는 문제점과 해결방안을 서술하였다. 마지막으로 현존하는 관련 시스템들과 비교하여 우수성을 보인다.

메타데이터 기반 시맨틱 검색 (Semantic Search based on Metadata)

  • 최정화;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.694-696
    • /
    • 2005
  • 본 논문은 `시맨틱 검색`을 위해서 시맨틱 웹 기술을 사용하여 사용자가 원하는 콘텐츠 제공을 위한 시맨틱 검색 방법을 제안한다. 본 연구는 현재 웹의 단점인 사람 위주의 웹 구성, 단순 텍스트 매칭 기반의 검색, 사람의 필터링이 필요한 대량의 결과, 특정 지식 검색이 불가능한 구조의 웹을 시맨틱 검색이 가능하도록 하기 위해서 다음과 같은 단계로 연구한다. 첫째, 도메인에 따른 정확한 정보의 제공을 위해서 OWL 온톨로지를 이용하여 컨텍스트 모델링한다. 둘째, 도메인 관련 웹 문서를 수집하고 도메인 온톨로지를 기반으로 키워드의 의미를 분석하고 주석 처리(annotation)한다. 셋째, 사용자의 자연어 질의에 의미있는 컨텍스트를 추가하여 질의를 확장한다. 넷째, 확장된 질의를 규칙기반 추론엔진을 이용하여 결과를 추론한다. 마지막으로, 사용자 프로파일 분석을 이용하여 선호하는 문서를 우선으로 추천하는 방법을 연구한다. 따라서 본 연구는 질의어에 해당하는 결과문서가 존재하지 않더라도 사용자가 선호하는 문서의 추론이 가능하고, 특정 도메인의 전문가 지식을 추가한 메타 데이터 추론을 통해서 검색 패러다임을 변화시킨다.

  • PDF

바이오 인포메틱스를 이용한 웹 페이지 분석 기법에 관한 연구 (A Study on Web Pages Analysts Technique based on Bioinformatics)

  • 윤효근;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.97-99
    • /
    • 2001
  • 대부분의 정보검색 과정들은 웹 페이지의 분석에 따라 검색 로봇을 이용한 검색기법, 카테고리를 이용한 색인 DB를 검색기법, 메타 태그를 이용한 검색기법을 사용하고 있다. 그러나 이러한 기법을 통하여 원하는 정보를 얻을 경우 정확도가 떨어지는 정보가 검색되어 사용자는 다시 한번 검색된 목록들을 확인해야 하는 경우가 발생한다. 본 논문은 다양한 형태의 웹 페이지에 대하여 바이오 인포메틱스 기술을 적용하여 분석, 사용자에게 필요로 하는 정보를 보다 정확하게 제공하는 기법을 제안한다.

  • PDF