• 제목/요약/키워드: 웹 링크

검색결과 365건 처리시간 0.025초

자바스크립트 함수처리 기능을 포함한 분산처리 방식의 웹 수집 로봇의 설계 (Efficient Design of Web Searching Robot Engine Using Distributed Processing Method with Javascript Function)

  • 김대유;김정태
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2595-2602
    • /
    • 2009
  • 본 논문에서는 기존의 웹 수집 로봇에서 처리 하지 못하는 자바스크립트 함수 링크를 처리하기 위하여 인터넷 익스플로러의 "Active Script Engine"을 사용하여 웹 로봇을 구현하였으며, 또한 자바스크립트 함수 링크를 처리하였을 경우 웹 수집 로봇의 수집량을 측정하기 위한 웹 수집 로봇을 개발하였다. 웹 수집 로봇을 개발하기 위해서 구글봇과 네이봇 등 웹 수집 로봇의 구조를 파악하여, 수집 로봇에 활용되는 구성요소를 구현하고 분산처리 형태의 웹 수집 로봇을 설계하였다. 또한 제안된 웹 로봇에 제안된 자바스크립트 처리 모델을 추가하여 성능평가를 하였으며, 성능평가방법은 자바스크립트를 사용하는 웹 사이트의 게시판을 대상으로 하여 웹 수집량을 비교 분석하였다. 웹 사이트 게시물 1000개인 경우, 일반 웹 로봇의 경우에는 1페이지밖에 수집하지 못하였고, 제안된 웹 로봇의 경우 1000개 이상의 웹 페이지를 수집하는 결과를 얻었다.

전문가 검색 엔진에서 개념 그래프를 이용한 Web 정보 획득 (Information acquision of WEB using the conceptual graph in expert search engine)

  • 박사준;김상경;황수철;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.295-297
    • /
    • 2000
  • 전문가 검색 엔진은 전문가 시스템과 같은 목적에서 특정 전문 분야에 대한 특수한 정보를 수집 검색하기 위한 검색 엔진을 내용이다. 본 논문은 전문가 검색 엔진을 만드는 과정에서 초기 작업에 해당하는 웹 정보 수집에 대한 논문이다. 본 논문은 웹 페이지에서 하이퍼링크와 참조되는 웹 페이지에 대한 표면 지식을 이용하여, 홈페이지 그래프를 작성한다. 그리고 나서 홈페이지 그래프와 사전에 미리 준비된 개념 그래프를 이용하여, 웹 페이지 수집 중 특정 전문 분야에 해당하는 웹 페이지인지를 판별하여 사용자가 수집하고자 하는 분야에 대한 웹 페이지만을 수집한다. 본 논문은 이에 대한 개념, 설계 및 구현과 앞으로의 개선 상황을 제안한다.

  • PDF

익명 웹로그 탐사에 기반한 동적 링크 추천 (Dynamic Link Recommendation Based on Anonymous Weblog Mining)

  • 윤선희;오해석
    • 정보처리학회논문지C
    • /
    • 제10C권5호
    • /
    • pp.647-656
    • /
    • 2003
  • 웹 공간(Webspace)에서 사용자의 순회패턴을 포착하는 것을 ‘순회패턴 탐사(mining traversal patterns)’라 한다. 순회패턴 탐사에서는 사용자가 원하는 정보를 탐색하기 위해 정보 제공 서비스에 따라 이동하기 때문에 객체(예 : URL)의 내용보다는 위치 때문에 방문될 수도 있는 독특한 특징을 가진다. 따라서 순회패턴 데이터로부터 의미있는 정보를 추출하는 작업의 복잡도를 크게 증가시킨다. 그러나 이러한 정보 제공 서비스의 질을 개선하기 위한 요구가 증가하고 있기 때문에 데이터 탐사 분야에서 순회패턴 탐사 문제는 최근 중요한 문제로 대두되고 있다. 본 논문에서는 빈발 순회패턴을 탐사하여 웹 사이트 상에서 추천을 수행하는 동적 링크 추천(Dynamic Link Recommendation : DLR) 알고리즘을 제안한다. 제안한 DLR 알고리즘은 방대한 자료를 포함하고 있는 대부분의 웹 사이트에 효과적으로 적용될 수 있다. 두 개의 실제 웹 사이트에 적용한 실험 결과는 제안한 방법의 성능이 우수함을 보여준다.

웹 정보검색 시스템의 문서 순위 결정 (Document Ranking of Web Document Retrieval Systems)

  • 안동언;강인호
    • 정보관리연구
    • /
    • 제34권2호
    • /
    • pp.55-66
    • /
    • 2003
  • 인터넷의 발달로 인해 웹에서 얻을 수 있는 정보의 종류와 수는 급진적으로 증가하고 있다. 기존의 문서 위주의 구성에서 멀티미디어 서비스, 쇼핑몰 등 종류와 매체에 있어서 다양한 변화를 보이고 있다. 이에 따라 사용자가 요구하는 정보의 단위는 문서 뿐만 아니라, 사이트 그리고 서비스 단위로 확장되고 있다. 웹 환경에서 사용자의 정보 요구를 보면 크게 세가지로 볼 수 있다. 첫째는 원하는 정보를 설명하는 혹은 정보와 관련된 문서를 찾는 내용검색, 둘째는 사용자가 관심 있어 하는 개인이나 단체의 사이트 입구를 찾는 사이트 검색, 셋째는 사용자가 관심 있어 하는 서비스를 제공하는 웹 페이지를 찾는 서비스 검색을 들 수 있다. 본 논문에서는 이러한 사용자의 정보 요구 목적에 따라서 문서 순위화가 달라져야 함을 보인다. 지금까지 정보 검색에서 언급된 내용 정보, 링크 정보 그리고 URL 정보의 유용함을 사용자의 정보 요구 형태에 따라서 분류한다. 내용 검색에서는 내용 정보가 유용한 반면 링크 정보와 URL 정보를 결합할 경우 성능의 저하를 초래했다. 반면 사이트 검색에서는 내용 정보만 쓰는 것 보다는 링크 정보와 URL 정보를 결합할 경우 성능의 향상을 얻을 수 있었다.

하이퍼링크 구조를 이용한 웹 검색의 순위 알고리즘에 관한 연구 (The Study on the Ranking Algorithm of Web-based Sear ching Using Hyperlink Structure)

  • 김성희;오건택
    • 정보관리연구
    • /
    • 제37권2호
    • /
    • pp.33-50
    • /
    • 2006
  • 본 연구에서는 하이퍼 링크 구조를 이용한 웹 검색 알고리즘에 대해 살펴 본 후 페이지 품질을 측정하기 위해 웹의 하이퍼 구조를 이용하고 있는 알고리즘인 HITS와 PageRank를 분석하였다. 이어서 이들 방법을 이용한 검색 엔진인 Google과 Ask.com을 검색 알고리즘의 특성을 기준으로 분석하였다. 이런 연구는 미래의 웹 문서의 중요도를 평가하는 데 기초자료로 활용할 수 있으며, 웹 정보검색의 검색성능을 향상시키는 시스템 개발에 도움이 될 수 있을 것이라 생각한다.

웹 기반 공동작업을 위한 다중 프로토콜 인터페이스 방법의 구현 (Implementation of Multi-Protocol Interface for Web-based Collaborative Service)

  • 이은령;김지용;설동명;김두현;임기욱
    • 한국멀티미디어학회논문지
    • /
    • 제6권2호
    • /
    • pp.340-351
    • /
    • 2003
  • 본 논문에서는 웹 페이지상에서 하이퍼링크를 사용하여 정적인 정보를 검색하는 것뿐만 아니라 인적 자원과의 연결로 그 범위를 넓혀주는 Page Together 시스템의 구현에 대한 개발 경험 및 이 시스템을 기반으로 한 시범 사이트를 소개하고자 한다. 이 시스템은 인터넷 사용자들이 웹 상에서 다른 사용자들과 만나 영상 및 음성 통화를 하면서, 같은 웹 페이지를 동시에 서핑 할 수도 있고 여러 가지 공동작업도 할 수 있도록 지원한다. 시스템 구성을 살펴보면 공동 브라우징 모듈 및 멀티미디어 회의 모듈, 데이터 회의 모듈, 다중 프로토콜 인터페이스(MPI)로 구성되며 , 각 모듈은 인터넷상에서의 표준 프로토콜을 채택함으로써 개발자들에게 범용성을 제공하고 있다 MPI는 각각 독립적으로 동작하는 모듈들간에 세션에 대한 정보를 일치시키기 위해 정의하였다 MPI를 통한 메시지 전송은 세션 연결 과정 및 세션 종료 단계에서 최소화 함으로써 각 모듈간의 의존성을 낮추었다. 또한 Page Together 시스템을 이용하여 웹 게시판 서비스를 제공하는 웹 사이트를 함께 소개하고있다. 어떤 사용자가 자신의 관심분야에 대한 게시물을 게재할 때 자신에게 연결되는 링크를 함께 게재하여 둔다. 게시물을 읽은 다른 사용자가 질문이 있을 경우 그 링크를 선택함으로써 게시자와 직접 통화를 하거나 의견을 나눌 수 있다 웹 사이트를 통하여 Page Together 시스템은 원격 교육 및 원격 회의 등의 다양한 인터넷서비스에 활용할 수 있다는 것을 확인할 수 있다.

  • PDF

컨텍스트 기반의 웹 애플리케이션 설계 방법론 (Context-based Web Application Design)

  • 박진수
    • 한국전자거래학회지
    • /
    • 제12권2호
    • /
    • pp.111-132
    • /
    • 2007
  • 웹 기능의 향상과 웹 관련 기술의 발전, 레거시 시스템과의 통합 필요성 증대, 자주 변하는 웹 콘텐츠와 구조 등으로 인하여 웹 애플리케이션을 개발하고 관리하는 일이 과거보다 훨씬 더 복잡하게 되었다. 그러나 이러한 다양한 요인들을 고려하는 포괄적인 웹 애플리케이션 설계 방법론은 아직 존재하지 않고 있다. 따라서 본 연구에서는 이러한 요인들을 고려한 컨텍스트 기반의 웹 애플리케이션 설계 방법론을 제시하고자 한다. 본 연구에서 제시하는 방법론에서는 웹 정보를 전달하는 메커니즘에 따라 구분되는 9 종류의 웹 페이지 형태와 웹 페이지 간의 다양한 의미 관계를 정의하는 7 종류의 링크 형태 및 설계 과정 중에 사용되는 여러 종류의 컴포넌트 역할을 구별하는 소프트웨어 컴포넌트 형태 등 다양한 종류의 모델링 기법들을 소개하고 있다. 뿐만 아니라 이 방법론은 '콤펜디엄(compendium)' 이라 불리는 일단의 관련된 정보 클러스터들로 이루어진 독창적인 웹 애플리케이션 모델을 사용하고 있다. 하나의 콤펜디엄은 주제(theme), 컨텍스트 페이지, 링크 및 컴포넌트로 구성된다. 이러한 접근 방법은 모듈 방식의 설계에 유용할 뿐만 아니라 항상 변하는 웹 애플리케이션의 콘텐츠와 구조를 관리하는데도 도움이 된다. 본 연구에서 제시한 방법론은 의미적으로 응집력이 있고 구문적으로 느슨히 결합된 유연한 웹 디자인 산출물을 생성하는데 도움이 될 것이다.

  • PDF

심층 웹 문서 자동 수집을 위한 크롤링 알고리즘 설계 및 실험 (Crawling algorithm design and experiment for automatic deep web document collection)

  • 강윤정;이민혜;원동현
    • 한국정보통신학회논문지
    • /
    • 제27권1호
    • /
    • pp.1-7
    • /
    • 2023
  • 심층 웹 수집은 검색 양식에 질의어를 입력하고 응답 결과를 수집하는 것을 의미한다. 심층 웹이 가진 정보는 정적으로 구성되는 표면 웹보다 약 450~550배 이상의 정보를 가지고 있을 것으로 추산한다. 정적인 방식에서는 웹페이지가 새로 고쳐지기 전까지 변화된 정보를 보여주지 못한다. 동적 웹페이지 방식은 실시간으로 필요한 정보가 갱신되어 웹페이지를 새로 불러오지 않아도 실시간 정보 제공이 가능한 장점이 있지만, 일반적인 크롤러는 갱신된 정보에 접근하는 데 어려움이 있다. 따라서 이들 심층 웹에 있는 정보들을 크롤러를 이용해 자동으로 수집할 방안이 필요하다. 이에 본 논문은 스크립트를 일반적인 링크로 활용하는 방법을 제안하였으며, 이를 위해 클라이언트 스크립트를 일반 URL처럼 활용이 가능한 알고리즘을 제안하고 실험하였다. 제안된 알고리즘은, 검색 양식에 데이터를 입력하는 일반적인 방법 대신 메뉴 탐색 및 스크립트 실행으로 웹 정보를 수집하는 데 중점을 두었다.

사용자 행동 패턴과 웹 문서 구조 분석을 이용한 웹 폐이지 테스팅 방법 (A Method for Testing Web pages Using the Analysis of User Behavioral Pattern and Web Document Structures)

  • 유대승;심민석;엄정섭;이명재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.547-549
    • /
    • 2001
  • 웹 기반 시스템의 테스팅에 대한 정확성과 신뢰성을 향상시키는 것은 시스템의 질을 향상시킬 수 있고 시스템 개발 및 유지보수에 대한 비용을 현저히 줄일 수 있다. 본 논문에서는 웹 로그 분석을 통하여 테스팅 환경 설정에 필요한 정보와 사용자들에 대한 패턴 정보를 추출하였다. 그리고 웹 컨텐츠 분석을 통하여 링크 정보와 데이터베이스에 대한 접근 또는 사용자 입력을 요구하는 모듈에 대한 정보를 추출하였다. 추출한 정보를 이용하여 테스팅을 위한 시나리오 문서인 테스트 스크립트를 생성함으로써 실세계에 근접한 테스트 시뮬레이션을 구현하는 방법을 제시하였다.

  • PDF

음성 인식용 웹페이지를 위한 웹서비스 제공자의 구현 (Implementation of the Web Service Provider for the Speech Recognition Web Page)

  • 오지영;김윤중
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.257-260
    • /
    • 2003
  • 본 논문은 일반 웹페이지를 음성인식이 가능한 웹페이지로 전환하고, 이 페이지가 사용 될 수 있는 웹서비스를 구현하였다. 본 연구에서 구현한 시스템은 웹서비스 소비자와 웹서비스 제공자로 구성되어 있다. 웹서비스 소비자는 다음에 설명하는 두개의 웹서비스 제공자를 호출하는 기능과 재구성된 웹페이지외 xml 문서를 저장하는 기능, xml 문서로부터 사용자의 음성과 매핑되는 URL을 검색하는 기능을 포함하고 있다. 웹서비스 제공자는 웹페이지를 변환하는 웹서비스 제공자와 음성인식 웹서비스 제공자이다. 웹페이지 변환 웹서비스 제공자는 일반 웹페이지를 분석하여 필요한 태그를 변환하는 기능과 하이퍼링크 값인 URL을 추출하는 기능으로 구성되어 있다. 사용자의 음성을 분석하고 인식하는 음성인식기는 기존의 연구에서 구현된 음성인식 웹서비스 제공자를 이용하였다.

  • PDF