• 제목/요약/키워드: web searching

검색결과 565건 처리시간 0.03초

분산수집 모델을 이용한 웹 로봇의 설계 및 구현 (Design of Web Robot Engine Using Distributed Collection Model Processing)

  • 김대유;김정태
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.115-121
    • /
    • 2010
  • 인터넷의 이용이 활발해짐에 따라 수많은 정보들이 웹을 통하여 공개되고 있으며, 이용자는 웹 검색 서비스를 이용하여 이러한 정보들에 효과적으로 접근할 수 있다. 웹 검색 서비스의 구축을 위해서는 웹 로봇을 사용한 웹 문서 수집이 선행되어야 하며, 웹 문서들의 수가 급격히 증가하면서 양질의 웹 문서들을 효과적으로 수집할 수 있는 웹 로봇에 대한 필요성이 증가되고 있으며, 그에 따른 많은 웹 수집 로봇이 탄생되고 있다. 본 논문에서는 효과적인 웹 수집 로봇의 설계와 동적인 웹페이지에서 사용하는 자바스크립트의 링크추출 방안을 제안하였다. 본 논문에서는 성능 분석을 위하여 제안된 모델을 사용하여 수집 모델을 1개로 설정해 놓고 299개의 웹 페이지를 점검 하였을 경우, 2분 12.67초가 소요되었고, 수집 모델을 10개로 생성하여 점검 하였을 경우 12.33초가 소요됨을 알 수 있었다.

자바스크립트 함수처리 기능을 포함한 분산처리 방식의 웹 수집 로봇의 설계 (Efficient Design of Web Searching Robot Engine Using Distributed Processing Method with Javascript Function)

  • 김대유;김정태
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2595-2602
    • /
    • 2009
  • 본 논문에서는 기존의 웹 수집 로봇에서 처리 하지 못하는 자바스크립트 함수 링크를 처리하기 위하여 인터넷 익스플로러의 "Active Script Engine"을 사용하여 웹 로봇을 구현하였으며, 또한 자바스크립트 함수 링크를 처리하였을 경우 웹 수집 로봇의 수집량을 측정하기 위한 웹 수집 로봇을 개발하였다. 웹 수집 로봇을 개발하기 위해서 구글봇과 네이봇 등 웹 수집 로봇의 구조를 파악하여, 수집 로봇에 활용되는 구성요소를 구현하고 분산처리 형태의 웹 수집 로봇을 설계하였다. 또한 제안된 웹 로봇에 제안된 자바스크립트 처리 모델을 추가하여 성능평가를 하였으며, 성능평가방법은 자바스크립트를 사용하는 웹 사이트의 게시판을 대상으로 하여 웹 수집량을 비교 분석하였다. 웹 사이트 게시물 1000개인 경우, 일반 웹 로봇의 경우에는 1페이지밖에 수집하지 못하였고, 제안된 웹 로봇의 경우 1000개 이상의 웹 페이지를 수집하는 결과를 얻었다.

Invisible Web 탐색도구의 성능 비교 및 분석 (The Effectiveness of the Invisible Web Search Tools)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.203-225
    • /
    • 2004
  • 본 연구는 표준 웹 탐색엔진에 색인되지 않는 Invisible Web에 대한 특성과 Invisible Web 탐색도구들을 파악하고, 이들 도구에서 Invisible Web 탐색의 성능을 비교 평가하기 위해 수행되었다. 표준 웹 탐색엔진이 Google과 Invisible Web 탐색엔진인 Incy Wincy, Invisible Web 메타탐색엔진인 Profusion과 Search. com 에서 11개의 탐색질문이 탐색되었다. Profusion과 Search. com, Incy Wincy에서의 Invisible Web(메타) 탐색 기능은 이 세 엔진에서 제공하는 웹 메타탐색기능과도 비교되었다. 탐색결과 Google이 Invisible Web 탐색에서 Invisible Web 탐색엔진보다 .15 -.35 높은 적합성순위정확률을 보였지만 통계적으로 유의한 차이는 아니었다. (${\alpha}$=.055). Invisible Web 탐색엔진에서 웹 메타탐색은 Invisible Web(메타)탐색보다 통계적으로 유의한 수준에서 더 우수한 것으로 나타났다. 성능평가에 사용된 적합성순위정확률은 검색된 문헌의 질 (적합성)과 적합문헌의 순위를 반영하는 정확률 척도로 사용될 수 있음을 보여주었다.

웹 검색 분야에서의 로그 분석 방법론의 활용도 (Applications of Transaction Log Analysis for the Web Searching Field)

  • 박소연;이준호
    • 한국문헌정보학회지
    • /
    • 제41권1호
    • /
    • pp.231-242
    • /
    • 2007
  • 웹 검색 분야에서 사용되고 있는 다양한 연구 방법들 중 로그 분석 방법은 이용자의 실제 검색 행위를 사실적으로 반영한다. 로그 분석을 통하여 대다수 이용자의 전반적인 이용 행태를 분석할 수 있으므로, 로그 분석 방법은 이용자 계층이 다양하고 이질적인 웹 검색 분야의 연구에 적합한 방법이라고 할수 있다. 이에 본 연구에서는 네이버의 트랜잭션 로그를 분석한 일련의 연구를 중심으로 로그 분석 방법론이 웽 검색 분야에 어떻게 활용되고 기여할 수 있는지를 파악하고 향후 활용 분야를 제시하고자 한다. 본 연구의 결과는 웹 검색 분야의 학문적 발전과 보다 효율적인 웹 검색 시스템 개발과 서비스 구축에 기여할 수 있을 것으로 기대된다.

웹기반 온라인목록의 이용행태 연구 (A Study on the Searching Behavior of Web-based OPAC Users)

  • 사공복희
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.81-110
    • /
    • 2003
  • 웹기반 온라인목록의 이용자 인터페이스는 이용자에게 더욱 친근하게 개선되었는가. 웹기반 온라인목록이 제공하는 탐색관련 기능은 어떠한가. 이용자들은 웹기반 온라인목록을 이용하는 데 여려움은 없는가. 이용자들은 웹기반 온라인목록에 대하여 어떤 인식을 가지고 있는가. 이런 문제에 대한 답을 통하여 웹기반 온라인목록의 검색도구로서의 문제점을 파악하고 개선방안을 제시하였다. 실험연구를 수행하였으며, 30명의 탐색자가 실험에 참여하였다. 탐색자가 웹기반 온라인목록을 실제로 탐색하는 과정중에 보이는 행태를 분석하여 데이터를 입수하였고, 탐색 후 질문지를 통하여 시스템에 대한 인식을 측정하였다.

웹과 도서관 시스템에서 이용자 정보탐색 비교연구 (A Comparison of web Searching and Library System Searching: Perceived Difficulty, Self-Efficacy, and Effort)

  • 이수영
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.29-44
    • /
    • 2007
  • 본 연구는 왜 이용자들이 정보탐색에 많은 노력을 기울이지 않는가를 알아보기 위하여 교육심리학분야에서 개발된 정신적 노력에 관한 개념을 웹 검색엔진과 도서관시스템 정보탐색행위에 적용하여 보았다. 실험실 환경에서 학부학생 총 15명을 대상으로 탐색실험을 실시하여, 탐색전 설문조사, 탐색후 설문조사, 탐색후 인터뷰, 생각 소리내어 말하기(think-aloud), 로그데이터를 통하여 데이터를 수집하였다. 연구결과, 이용자들은 웹 검색엔진을 도서관시스템에 비하여 휠씬 쉽다고 인지하며 스스로 탐색에 대한 높은 자신감을 가지고 있었다. 이러한 이용자성향은 이용자들이 웹 탐색에 도서관 탐색때보다 더 적은 노력을 기기는 것과 깊은 연관성을 가지고 있는 것으로 나타났다. 이용자들의 정신적 노력에 관한 개념은 결과적으로 이용자들의 정보탐색 행위와 경험을 설명하는데 매우 유용한 것으로 밝혀졌다.

스타일 기반 키워드 추출 및 키워드 마이닝 프로파일 기반 웹 검색 방법 (An Efficient Web Search Method Based on a Style-based Keyword Extraction and a Keyword Mining Profile)

  • 주길홍;이준휘;이원석
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1049-1062
    • /
    • 2004
  • World Wide Web의 대중화로 인해 전자 정보량이 급속하게 증가하였고, 이러한 많은 양의 다양한 정보에 대한 효율적인 검색 시스템의 필요성이 증대되었다. 정확한 검색 결과를 제공하기 위해 사용자 요구 사항의 올바른 분석과 서술이 중요하게 인식되고 있으며, 분산 환경에서의 요구 사항 추출 및 분석의 필요성이 대두되고 있다. 본 논문에서는 웹 검색 방법에 있어서 목표 검색어만을 가지고 검색을 수행하는 기존 검색 방법과 달리 검색어가 나타나는 문맥 정보를 추가하여 검색하는 방법을 제안하고 구현하였다. 또한 본 논문에서는 제안된 새로운 키워드 추출 방법으로 추출된 키워드를 기반으로 키워드 마이닝 프로파일에 기반한 웹 검색 시스템을 제안하고 구현하였다. 이는 원하는 정보를 대표하는 목표 검색어만 가지고 검색을 수행하는 기존의 검색방법과 달리 검색어가 포함된 문맥정보를 추가하여 검색하기 때문에 기존의 검색방법보다 정확하고 효율적인 정보를 제공한다. 특정 도메인으로부터 순위가 매겨진 도메인 키워드 리스트를 작성하여 이를 기준으로 기존의 출현빈도기반의 차이를 실험을 통하여 보였으며, 예제 기반 질의를 바탕으로 키워드 마이닝 프로파일을 만들어 검색을 수행하는 검색 방법으로 이의 효용성을 실험을 통해 검증하였다.

웹2.0의 참여형 아키텍쳐 환경에서 그래픽 기반 포크소노미 태그 연관 검색의 설계 및 구현 (Design and Implementation of the Graphical Relational Searching for Folksonomy Tags in the Participational Architecture of Web 2.0)

  • 김운용;박석규
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 최근 인터넷의 급격한 확장을 통해 대두되는 웹2.0 기술은 웹의 구조적 진화인 질적 변화와 사용자 증가라는 양적인 변화로 해석할 수 있으며, 이 구조는 사용자 참여형 아키텍쳐를 근간으로 하고 있다. 블로그, UCC, SNS(Social Networking Service), 매쉬 업, 롱테일 등으로 대표되는 웹2.0기술은 웹의 구조화에 중심적인 역할을 담당하고 있으며, 이곳에 포함된 사용자 참여형 자료의 분류와 검색은 포크소노미(Folksonomy)방식을 통해 널리 이용되고 있다. 포크소노미는 웹 페이지에 공개되고 있는 정보나 관련 주제를 고전적 분류학 기술로 나누는 것이 아니라 꼬리표(태그)에 따라 구분하는 새로운 분류방식으로 사용자 참여로 구성된다. 현재 이러한 분류를 통한 검색은 단순 텍스트 태그검색이나 태그클라우드 방식 등을 통해 특정 태그에 대한 검색이 이루어지고 있으나 태그들 간의 관계를 표현하고, 이들 관계를 고려한 검색은 미비한 실정이다. 이에 본 논문에서는 등록되는 태그들 간의 관계를 고려하여 태그들 간의 연관 그래프를 동적으로 형성하고 이를 기반으로 연관 검색을 제공한다. 이를 통해 태그 검색의 신뢰성을 높이고 검색의 편이성을 제공할 수 있을 것이다.

  • PDF

APPLICATION OF SPATIAL METADATA STANDARDS FOR CATALOG WEB SERVICES IN KOREA

  • Yom, Jae-Hong;Kyoung, Min-Ju;Jeong, Jang-Yoon;Lee, Dong-Cheon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.430-433
    • /
    • 2007
  • Spatial information has recently been recognized as one of the major subjects of interest in information technology. With increasing variety and quantity of spatial data on the web, searching and maintaining these data are becoming a much focussed area of research. Interoperability is the key technology in solving the complexities of spatial data in web services. The problem of maintenance and searching of spatial data in an interoperable web service environment can be solved by establishing standardized metadata of spatial information. Then using the standardized metadata, catalog web services can be deployed for autonomous searching and binding of spatial data. This study investigates the international standard for spatial data metadata(ISO/TC211 19115) and deployed catalog web service based on this metadata. Various heterogeneous spatial data of Seoul Metropolitan region were then used for experimental implementation of catalog web service.

  • PDF

검색 언어가 웹 정보검색행위에 미치는 영향에 관한 연구 - 웹 정보검색행위의 양상 차이를 중심으로 - (A Study on the Effects of Search Language on Web Searching Behavior: Focused on the Differences of Web Searching Pattern)

  • 변제연
    • 한국문헌정보학회지
    • /
    • 제52권3호
    • /
    • pp.289-334
    • /
    • 2018
  • 웹상에서 영어 이외의 언어들로 이루어진 정보가 빠르게 증가하고 있지만, 여전히 영어 정보가 가장 큰 비중을 차지함에 따라 공통어(lingua franca)로서의 지배적인 영향을 미치고 있다. 따라서 영어가 비모어인 이용자들이 보다 다양하고 풍부한 정보를 획득할 수 있도록 하기 위해서는 비영어권 화자의 모어 정보검색행위와 영어 정보검색행위에 대한 조사를 통해 주요 특징 및 차이점을 살펴볼 필요가 있다. 본 연구에서는 국내 한 사립대학의 대학생 24명을 대상으로 동시적 사고구술 기법을 적용한 정보검색 실험을 실시해 한글 정보검색행위 및 영어 정보검색행위와 인지과정을 조사하였다. 관찰데이터 및 사고구술데이터의 정성적 데이터를 기반으로, 검색 언어에 따른 웹 정보검색행위의 양상 차이에 대한 빈도분석을 실시하였다. 연구 결과, 한글 검색에서 능동적이고 적극적이며 독립적인 특성의 양상이, 영어 검색에서 수동적이고 소극적이며 의존적인 특성의 양상이 나타났다. 한글 검색에서는 이용자, 태스크, 시스템 등 다양한 출처에서 용어를 추출 조합한 검색어 구성, 여러 수준에서의 검색범위 조정, 검색엔진 검색결과페이지 내 탐색대상 아이템의 선택과 관련한 원활한 필터링, 다수 아이템의 탐색 및 비교, 웹 페이지의 전체 내용 브라우징 등이 주요 특징으로 확인되었다. 반면, 영어 검색에서는 주로 태스크 추출 용어 중심 검색어 구성, 제한된 검색범위 선호, 카테고리나 링크 등 아이템과 아이템 간 관련성에 의존한 탐색 대상 아이템 선택, 동일 아이템의 반복적 탐색, 웹 페이지의 일부 내용 브라우징, 그리고 사전 및 번역기와 같은 언어지원도구의 빈번한 사용 등이 두드러진 특징으로 파악되었다.