• 제목/요약/키워드: Web Search Engines

검색결과 209건 처리시간 0.031초

Towards Intelligent Web Interaction

  • Takama, Yasufumi
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.134-137
    • /
    • 2003
  • Both browsing and retrieval with search engines are major operations that establish the interaction between users and the Web. Although both operations are usually combined to locate information from the Web, recent growth of the Web has overtaken the potential of this conventional interaction. This paper proposes the concept of Retrieve, Browse, and Analyze (RBA)-based interactions, as the improvement of the conventional Retrieve and Browse (RB)-based interaction. The prototype interface based on RBA-based interaction is also presented.

  • PDF

질의어 패턴 자동분석을 통한 커뮤니티 기반 개인화 검색 (Personalized Search based on Community through Automatic Analysis of Query Patterns)

  • 박건우;이상훈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.321-326
    • /
    • 2009
  • 기존의 웹 검색 엔진들은 사용자의 검색 의도를 충분히 반영하지 못하기 때문에 사용자가 원하는 정확한 정보를 찾기가 어렵다. 따라서 최근에는 개인의 검색 패턴을 분석하여 검색에 반영함으로써 검색 결과에 대한 만족도를 높이기 위한 많은 연구들이 진행되고 있다. 이러한 개인화 검색을 통해 사용자는 방대한 웹상의 정보들 중 자신의 검색 의도에 보다 적합하고 정확한 정보를 획득할 수 있다. 본 논문에서는 웹 사용자들의 질의어 사용 빈도수(Frequency)에 대한 랭킹 정보를 통해 최근 주요 관심사(Interest)를 파악하고, 주요 관심사 별로 형성된 커뮤니티(Community)를 기반으로 수행되는 개인화 검색 방안을 제안한다. 실험결과 질의어 빈도수, 관심사 및 커뮤니티를 검색에 반영할 경우 개인의 검색 의도에 보다 적합한 검색 결과가 제공되는 것을 확인할 수 있다.

시맨틱 웹 기술을 이용한 온톨로지기반 호텔 검색 시스템 (An Ontology-based Hotel Search System Using Semantic Web Technologies)

  • 유동희;서용무
    • 한국전자거래학회지
    • /
    • 제13권4호
    • /
    • pp.71-92
    • /
    • 2008
  • 현재, 호텔 검색 엔진들은 여행객들의 호텔 검색을 돕고 있다. 하지만 검색 엔진을 통한 호텔에 대한 검색 결과는 여행객들을 만족시키지 못하고 있다. 그 이유는 검색 엔진이 다양하고 모호한 용어들로 표현되는 여행객의 기호를 정확하게 이해하고 처리할 수 없기 때문이다. 본 논문에서는 현재 사용 가능한 시맨틱 웹 기술인 RDF, OWL, SWRL을 이용하여 온톨 로지를 구축하고, 구축된 온톨로지를 기반으로 검색 엔진이 어떻게 여행객들의 기호에 적합한 호텔을 찾는가를 보여주었다. 이를 위해, 기존의 호텔 관련 온톨로지들을 분석하였고 Q&A 커뮤니티들에 올라온 호텔 검색과 관련된 용어들을 조사하였다. 조사된 결과를 바탕으로, 세 개의 하위 온톨로지인 객관적 개념 온톨로지, 보편적 인지 개념 온톨로지, 평가 개념 온톨로지로 구성된 호텔 도메인 온톨로지를 구축하였다. 구축된 온톨로지를 호텔 검색에 이용하는 것을 보여주기 위해 시맨틱 호텔 검색 시스템을 구현하였다.

  • PDF

서버 부하를 고려한 동적 로봇에이전트 시스템의 설계 및 구현 (Design and Implementation of a Dynamic Robot Agent System Considering the Server's Workload)

  • 박규석;이충석;김성
    • 한국정보처리학회논문지
    • /
    • 제7권11S호
    • /
    • pp.3732-3838
    • /
    • 2000
  • 급속한 인터넷 사이트와 이용자들의 증가로 인해 이용자들의 요구에 부응하는 정보를 위한 검색 엔지들의 개발이 가속화되고 있다. 이로 인해 많은 검색엔진들의 문서 수집 활동으로 인한 대상 호스트들에 대한 부하가 초래되었고, 방대한 양의 새로운 정보가 추가되어 가는 상황에서 모든 정보의 주기적인 갱신이 필요하게 되었다. 이러한 시대적인 상황과 검색시스템의 기본요건이 빠른 속도와 정확한 정보 수집을 이루기 위하여 방대한 호스트내의 문서를 수집할 수 있는 기술의 필요성이 높아졌으며, 이용자들의 다양한 요구와 WWW(World Wide Web)간의 상호 유기적인 작용을 위한 검색 엔진의 역할이 더욱 커지고 있다. 본 연구에서는 기존에 제시되었던 로봇 에이전트 시스템에 대한 비교 분석 후 이들을 보완하여 대상 서버에 대한 부하량 측정치와 로봇이 수집 활동 시에 체험한 부하량을 함께 고려하여 문서수집이 빠른 시간 내에 이루어지며 대상 서버에 과도한 부하를 주지 않는 로봇 에이전트와 원격 관리 시스템을 설계 및 구현한다.

  • PDF

온톨로지 기반의 사용자 의도를 고려한 맞춤형 검색 서비스 (Ontology-based User Customized Search Service Considering User Intention)

  • 김수경;김건우
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.129-143
    • /
    • 2012
  • 웹 기술의 급속한 발전은 기업들이 관리해야 하는 정보량의 폭발적인 증가를 초래하였다. 이와 더불어 보다 정확한 정보를 찾기 위한 검색 엔진 솔루션 시장의 규모도 더불어 크게 증가하였다. 하지만 대부분의 검색엔진들은 사용자의 검색 의도를 고려하지 않고 사용자가 입력한 특정 키워드를 포함하는 문서들을 반환하는 방법을 채택하고 있어, 실제 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 본 연구에서는 이러한 문제를 해결 하기 위한 중요 기술인 적합성을 만족시키기 위해 재현율과 정확율을 높일 수 있는 방법을 제안하였다. 우선 검색어의 재현율을 높일 수 있도록 유사어 관계 확장을 위한 온톨로지 스키마 모델을 제안하고 이를 기반으로 한 추론을 통해 검색어의 확장을 제시하였다. 확장된 검색어들을 이용하여 문서 검색을 하기 위한 다단계 유사도 검색 순위화 알고리즘을 제안하였다. 설계된 온톨로지 스키마와 온톨로지 저장소의 데이터를 기반으로 추론과 유사도 검색 순위화 엔진이 포함된 웹사이트 형식의 사용자 의도 적응형 검색 솔루션을 구현하였다. 구현된 검색 솔루션을 통해 다양한 검색어를 입력하여 제안 방법의 타당성을 입증하였고 사용자 의도를 고려한 맞춤형 검색 솔루션의 필요성을 설명하였다.

교육학 분야 주제전문가와 탐색전문가의 인터넷 검색엔진을 사용한 정보 탐색 행태 비교연구 (A Comparative Study about Information Searching Behaviors of Educational Researchers Using Web Search Engines -Subject Specialists vs information specialists)

  • 이명희
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.5-22
    • /
    • 1998
  • 본 연구는 인터넷을 사용하는 교육학 분야 연구자들을 주제전문가인 최종이용자와 탐색전문가 그룹으로 나누어 이들의 검색엔진을 사용한 정보탐색 행태가 어떻게 다른지를 비교하였다. 탐색과정과 탐색결과에서 밝혀진 결과는 아래와 같다. 탐색과정에서 사용된 탐색어 수와 연산자 수는 주제전문가가 탐색전문가 보다 약간 많았으며 탐색시간도 길었다. 그러나 탐색결과 주제전문가보다 탐색전문가에 의해 검색된 문헌에서 적합문헌수가 더욱 많았으며 정확률도 더욱 높은 것으로 밝혀졌다.

  • PDF

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

검색포털 지식검색에 대한 한의학분류체계 조사 및 개선방안 연구 (A study of investigation and improvement to classification for oriental medicine in search portal web site)

  • 김철
    • 대한한의정보학회지
    • /
    • 제15권1호
    • /
    • pp.1-10
    • /
    • 2009
  • In these days everyone search the information easily with the Internet as the rapid distribution and active usage of the Internet. The search engines were developed specially to accuracy of information retrieval. User search the information more quickly and variously with them. The search portal system will be embossed with representation and basic services. The Internet user needs the result of text, image and video, knowledge search. The keyword based search is used generally for getting result of the information retrieval and another method is category based search. This paper investigates the classification of knowledge search structure for oriental medicine in market leader of search portal system by ranking web site. As a result, each classification system is unified and there is a possibility of getting up a many confusion to the user who approaches with classification systematic search method. This treatise proposed the improved oriental medicine classification system of internet information retrieval in knowledge search area. if the service provider amends about the classification system, there will be able to guarantee the compatibility of data. Also the proper access path of the knowledge which seeks is secured to user.

  • PDF

아파치 스파크 기반 검색엔진의 설계 및 구현 (Design and Implementation of a Search Engine based on Apache Spark)

  • 박기성;최재현;김종배;박제원
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.17-28
    • /
    • 2017
  • 최근 데이터의 활용가치가 높아지면서 데이터에 관한 연구가 활발히 진행되고 있다. 데이터의 수집, 저장, 활용을 위한 대표적인 프로그램으로 웹 크롤러, 데이터베이스, 분산처리 등이 있으며, 최근에는 웹 크롤러가 다양한 분야에 활용할 수 있는 유용성으로 인해 크게 각광받고 있는 실정이다. 웹 크롤러란 자동화된 방법으로 웹서버를 순회하여 웹 페이지를 분석하고 URL을 수집하는 도구라고 정의할 수 있다. 인터넷 사용량의 증가로 매일 대량으로 생성되는 웹 페이지의 처리를 위해 하둡의 맵리듀스를 기반으로 하는 분산 웹 크롤러가 많이 사용되고 있다. 그러나 맵리듀스는 사용이 어렵고 성능에 제약이 있는 단점이 있다. 이러한 맵리듀스의 한계를 보완하여 제시된 인메모리 기반 연산 플랫폼인 아파치 스파크가 그 대안이 되고 있다. 웹 크롤러의 주요용도 중 하나인 검색엔진은 웹 크롤러로 수집한 정보 중 특정 검색어에 맞는 결과를 보여준다. 검색엔진을 기존 맵리듀스 기반의 웹 크롤러 대신 스파크 기반 웹 크롤러로 구현할 경우 더욱 빠른 데이터 수집이 가능할 것이다.

웹 환경에서의 개인정보 검색기법 (A Retrieval Technique of Personal Information in a Web Environment)

  • 서영덕;장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.145-151
    • /
    • 2015
  • 최근 개인정보 보호에 대한 관심이 높아지면서 웹 환경에 노출된 개인정보를 효율적으로 검색할 수 있는 시스템의 필요성이 증대되었다. 현재 웹 환경에 노출된 개인정보는 자신이 알고 있는 단편적인 단서를 이용한 검색을 통해 노출여부를 판단하고 있다. 그러나 이 방법은 검색결과의 우선순위가 개인정보의 노출도와 관계가 없어 효율적이지 못하다. 본 논문에서는 사용자 입력을 근거로 웹 환경에 노출된 사용자의 개인정보를 효율적으로 검색하고 삭제할 수 있도록 지원하는 프로세스를 제안한다. 또한 기존 검색 방법과의 비교를 통하여 검색성능의 향상 정도를 평가한다.