• Title/Summary/Keyword: 웹 링크

Search Result 365, Processing Time 0.029 seconds

Clustering of Web Document Exploiting with the Union of Term frequency and Co-link in Hypertext (단어빈도와 동시링크의 결합을 통한 웹 문서 클러스터링 성능 향상에 관한 연구)

  • Lee, Kyo-Woon;Lee, Won-hee;Park, Heum;Kim, Young-Gi;Kwon, Hyuk-Chul
    • Journal of Korean Library and Information Science Society
    • /
    • v.34 no.3
    • /
    • pp.211-229
    • /
    • 2003
  • In this paper, we have focused that the number of word in the web document affects definite clustering performance. Our experimental results have clearly shown the relationship between the amounts of word and its impact on clustering performance. We also have presented an algorithm that can be supplemented of the contrast portion through co-links frequency of web documents. Testing bench of this research is 1,449 web documents included on 'Natural science' category among the Naver Directory. We have clustered these objects by term-based clustering, link-based clustering, and hybrid clustering method, and compared the output results with originally allocated category of Naver directory.

  • PDF

The design and implementation of integrated linked data and Open API connection system for semantic web mashup service (시맨틱 웹 매쉬업 서비스를 위한 링크드 데이터 및 Open API 통합 연계 시스템의 설계 및 구현)

  • Jung, Jin-Uk;Im, Dong-Hyuk;Lee, Kyung-Min;Zong, Nan-Su;Kim, Hong-Gee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.71-73
    • /
    • 2012
  • 최근 웹 2.0과 시맨틱 웹의 대중화와 더불어 Open API와 링크드 데이터를 이용한 시맨틱 웹 융복합(매쉬업) 서비스가 주목을 받고 있다. 다양한 링크드 데이터와 Open API들을 조합함으로써 새로운 서비스들을 쉽고 빠르게 만드는 것이 가능하기 때문이다. 하지만 사용자가 링크드 데이터와 Open API 서비스를 사용하기 위해서는 서비스 입력 값이나 출력값 등의 해당 정보를 얻어야 하며 이를 위해 링크드 데이터와 Open API를 제공해 주는 사이트를 직접 방문해야만 하는 불편함을 가지게 된다. 본 논문에서는 시맨틱 웹 매쉬업 서비스를 위한 통합 링크드 데이터 및 Open API 관리 시스템을 설계하고 구현하였다. 제안한 시스템에서 사용자는 사전 지식 없이 통합 관리 시스템을 통해 원하는 링크드 데이터와 Open API 서비스를 검색하고 실행할 수 있다. 또한 실행된 결과는 XML 형태로 저장되어 추후 매쉬업 시 재사용이 가능하도록 한다.

하이퍼링크의다양한법적문제

  • Son, Seung-U
    • Digital Contents
    • /
    • no.11 s.150
    • /
    • pp.80-83
    • /
    • 2005
  • 인터넷공간에서자유롭고다양한정보를공유하는것은다른웹정보와의자유로운연결을전제로한다. 하 이퍼링크기술은사이버공간에있는누구나공개된다른웹사이트와의연결을가능케함으로써정보의공유 를실현하고있다. 하이퍼링크를위해웹사이트운영자들은상호협조할필요가없으며, 링크를원하는일방 에의해서공개된웹정보라면어떤것이든연결할수있다. 이번호에서는하이퍼링크가무엇인지알아보고, 다양한링크의모습에따른법적책임의차이에관해논의하며, 아울러구체적인이해를돕고자국내외링크 관련판례들을소개하고자한다.

  • PDF

An Implementation of the Ranking Algorithm for Web Documents based on Link Analysis (링크 분석에 기반한 웹 문서 중요도 평가 알고리즘의 구현)

  • Lim, Sung-Chae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.75-78
    • /
    • 2010
  • 웹 검색에는 기존의 정보검색(Information Retrieval) 시스템에서와 다르게 문서 간 하이퍼링크 정보를 바탕으로 각 웹 문서의 고유 중요도를 추정하는 방식이 자주 이용된다. 링크 분석에 기반한 알고리즘 중 PageRank 알고리즘은 구글의 웹 검색 서비스에 적용된 것으로 알려져 있다. 이런 PageRank 알고리즘에 따라 중요도를 계산하는 경우 색인된 웹 문서수가 증가함에 따라 계산에 필요한 CPU 자원의 사용도 함께 증가하며, 문서 수가 수 억 페이지에 달하면 하나의 서버에서는 계산을 수행할 수 없다는 문제가 있다. 본 논문에서는 이런 문제점을 해소하기 위해 여러 대의 서버를 PageRank 계산 용 클러스터로 사용할 수 있는 방법을 제시한다. 제시된 방법은 고속의 LAN을 이용하여 여러 대의 서버를 연결하고 반복적인 행렬 계산을 병렬로 수행할 수 있어 계산 시간을 단축시킬 수 있다. 이런 서버 클러스터 구현을 위해 멀티 쓰레딩 프로그램이 작성되었으며, PageRank 계산에 사용되는 행렬 데이터를 적은 양의 메모리만으로 표현 가능하도록 하였다.

  • PDF

Learning User Profile in Information Filtering Systemby Using Hyperlink Information (하이퍼링크 정보를 위한 정보여과 시스템에서의 사용자 프로파일 학습)

  • 박민규;김준태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.66-68
    • /
    • 1999
  • 본 논문에서는 정보여과 시스템에서 웹 페이지를 수집하고 여과하는 과정과 사용자 프로파일을 학습하는 과정에 하이퍼링크 정보를 이용하는 방법을 제안한다. 사용자가 원하는 웹 페이지를 추천하기 위해 사용자 프로파일을 하이퍼링크 정보를 이용해 만들고 사용자의 반응(feedback)에 따라 사용자 프로파일을 조정한다. 가중치 조정에 있어서 학습 효과를 높이기 위해 사용자가 반응을 보인 웹 페이지에서 출발해 링크로 연결된 모든 페이지에 대해 깊이에 따라 가중치를 조정하는 가중치 전파 알고리즘(Weight Propagation Algorithm)을 제안한다. 적은 사용자의 반응으로도 프로파일 내의 많은 페이지에 영향을 줄 수 있어 높은 학습 효과를 기대할 수 있다.

  • PDF

The Meta Search Agent using Ranking Algorithm with Link Structure Analysis (링크 구조 기반의 순위 알고리즘을 이용한 메타 검색 에이전트)

  • 김형욱;김민구;최경희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.373-375
    • /
    • 2002
  • 하이퍼 텍스트 구조의 특성을 이용한 순위 평가 알고리즘 중의 하나인 HITS 알고리즘은 웹 페이지들의 상호간에 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하여 순위에 따른 결과를 제시한다. 그러나 초기의 HITS 알고리즘은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적인 단점을 가지고 있다. 본 논문에서는 여러 웹 검색 엔진들로부터 얻어진 문서 집합에 수정된 HITS 알고리즘을 수행하는 메타 검색 에이전트를 설계하여 보다 나은 검색 성능을 구하고, 결과의 지역성을 보완한다.

  • PDF

A Method of Link Extraction on Non-standard Links in Web Crawling (웹크롤러의 비표준 링크에 관한 링크 추출 방안)

  • Jeong, Jun-Yeong;Jang, Mun-Su;Gang, Seon-Mi
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.79-82
    • /
    • 2008
  • 웹크롤러는 웹페이지 내의 URL링크를 추적하여 다른 문서를 수집한다. 국내의 상당수 웹사이트는 웹 표준에 맞지 않는 링크방식으로 웹문서를 연결하고 있다. 일반적인 웹크롤러는 링크의 비표준적인 사용을 가정하지 않기 때문에 이러한 문서는 수집할 수 없다. 비표준적인 링크가 가능한 것은 사용자의 실수에 강인한 마크업 언어인 HTML에 자바스크립트 기능이 추가되면서 자바스크립트의 변칙적인 사용이 허용되었기 때문이다. 본 논문에서는 230여개의 웹사이트를 조사하여 기존 웹크롤러에서 해결하지 못한 링크 추출 문제를 찾아내고, 이를 수집하기 위한 알고리즘을 제안한다. 또한 자바스크립트 문제 해결을 위한 무거운 자바스크립트 엔진을 대신하여 필요한 기능만으로 구성된 모듈을 사용함으로써 효율적인 문서 수집기 모델을 제안한다.

  • PDF

Web Structure Mining by Extracting Hyperlinks from Web Documents and Access Logs (웹 문서와 접근로그의 하이퍼링크 추출을 통한 웹 구조 마이닝)

  • Lee, Seong-Dae;Park, Hyu-Chan
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.11 no.11
    • /
    • pp.2059-2071
    • /
    • 2007
  • If the correct structure of Web site is known, the information provider can discover users# behavior patterns and characteristics for better services, and users can find useful information easily and exactly. There may be some difficulties, however, to extract the exact structure of Web site because documents one the Web tend to be changed frequently. This paper proposes new method for extracting such Web structure automatically. The method consists of two phases. The first phase extracts the hyperlinks among Web documents, and then constructs a directed graph to represent the structure of Web site. It has limitations, however, to discover the hyperlinks in Flash and Java Applet. The second phase is to find such hidden hyperlinks by using Web access log. It fist extracts the click streams from the access log, and then extract the hidden hyperlinks by comparing with the directed graph. Several experiments have been conducted to evaluate the proposed method.

International Scientific and Scholarly Communication Networks on World Wide Web (월드와이드웹에 나타난 국제 학술 커뮤니케이션 네트워크에 대한 탐사적 연구)

  • Park, Han-Woo
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.37 no.2
    • /
    • pp.153-168
    • /
    • 2003
  • A hyperlink on academic World Wide Web has started to be recognized as a form of collaborative communication network connecting individual researchers and research groups and expanding their collaboration relations by making possible easy and direct online contact among people or groups anywhere in the world. This paper describes the structure of academic hyperlinks embedded in universities' Web sites hosted at the 10 Asian countries and further, examines the association between the structure of the hyperlink network and collaborative communication pattern among those countries based on their frequency of co-authoring articles. This research found that the number of inter-hyperlinks among universities' Web sites was significantly correlated with the frequency of co-authored articles across the 10 countries.

A Study on WPMS for Integrity Preservation of Hyperlink in Web Site (웹 사이트에서 하이퍼링크의 무결성 유지를 위한 WPMS에 관한 연구)

  • Cho, Lee-Gi;Lee, Sung-Jae;Park, Na-Yeon;Kim, Won-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.1089-1092
    • /
    • 2003
  • TCP/IP 프로토콜을 기반으로 한 웹은 컴퓨터 기술과 통신 기술의 발달과 더불어 양적으로나 복잡도에 있어서 놀라운 속도로 성장하고 있다. 이에 따라 웹 사이트를 이용한 홍보나 기업의 이익을 목적으로 하는 웹 사이트들이 급속히 증가하면서 웹 페이지들의 추가, 삭제, 갱신 등 끊임없이 일어나고 있다. 이렇게 끊임없는 웹 페이지의 수정으로 인하여 링크가 끊어지는 등의 문제가 발생한 수 있는데, 이런 끊어진 링크의 발견은 쉽지 않고, 때에 따라서는 기업에 큰 손실을 가져올 수 있다. 본 논문에서는 웹 페이지 문서들 사이에 존재하는 관계성(Relationship)과 제약 조건(Constraint Condition)을 확장 UML을 통해 정의하여, 웹 페이지의 DLP(Dangling Link Problem)를 해결하기 위한 WPMS(Web Page Integrity Management System) 시스템을 제안하였다.

  • PDF