• Title/Summary/Keyword: 웹링크 분석

Search Result 133, Processing Time 0.037 seconds

Link Extraction and Validation for Web-page Maintenance (웹 페이지 관리를 위한 링크 추출과 검증)

  • 엄정섭;유대승;심민석;이명재
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.427-429
    • /
    • 2001
  • 웹의 발전에 따라 거대해진 웹사이트들은 서로 복잡하게 얽혀진 링크들로 인해 웹 개발과 유지보수에 큰 어려움이 따른다. 효율적인 웹 개발과 유지보수를 위해서는 웹에서 가장 중요한 정보의 단위인 링크정보들을 추출할 수 있는 방법이 요구된다. 본 논문에서는 웹 브라우저 요청에 의해 반환된 HTTP 헤더분석과 HTML 문서의 태그분석을 통해 링크들을 추출하여 “끊어진 링크”를 찾고, 추출된 “링크요소”들과 서버에 저장된 파일들을 비교하여 “사용되지 않는 파일”들을 찾아주는 “링크 분석기”시스템을 개발함으로 써 웹 개발과 유지보수에 있어서 가장 기본적이면서도 중요한 링크관리에 대한 방법을 제시한다

  • PDF

A Study of Internet using Citation Analysis (인용분석을 이용한 인터넷 정보의 연구)

  • 곽철완
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.10 no.1
    • /
    • pp.213-222
    • /
    • 1999
  • The purpose of this study is to identify important web pages in a particular area The basic premise is that citation analysis can show a similar relationship among different web pages. Web pages about‘weather’were found using a search engine Each web page was examined by hyperlink from other web pases and/or to other web pages. After this process, seven web pases are linked by many web pages. Seven web pages were analyzed by co-citation analysis. The result shows that selected web pages are linked by characteristics of information provided.

  • PDF

Design and Implementation for the Effective Web (효율적인 웹 마이닝 시스템의 설계 및 구현)

  • 김형욱;최익규;김민구
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.303-307
    • /
    • 2002
  • 효율적인 웹 마이닝을 위해서는 방대한 인터넷 공간에서 사용자가 원하는 정보를 찾아내고, 이들 중 보다 유용하다고 판단되어진 자료를 선별적으로 제시할 수 있어야 한다. 본 논문에서는 웹 컨텐츠 분석과 HTML 문서들 사이의 링크 연결의 패턴 분석을 기반으로 하는 웹 구조 분석 방법들을 검토하고, 웹 검색 시스템을 구현하여 결과를 분석하였다. 이를 위해 웹 문서의 내용을 인덱싱한 뒤 질의와의 관련성의 확률을 구하는 랭귀지 검색 모델에 링크 구조 분석을 이용한 순위 알고리즘을 사용하여 좋은 결과를 얻고자 하였다. 또한 기존의 링크 관련 알고리즘에서 알려진 문제점을 해결하기 위한 몇가지 테크닉을 사용하였다.

  • PDF

Link Analysis of Korean Web Graph (국내 웹 그래프의 링크 구조 분석)

  • Seo, Jung-Joo;Kim, Jin-Il;Kim, Eun-Sang;Kim, Daniel;Jeong, Ha-Woong;Kim, Sung-Ryul;Park, Kun-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.400-402
    • /
    • 2012
  • 웹을 구성하는 웹 페이지들과 페이지들 사이의 하이퍼링크들은 방향성을 지니는 그래프로써 표현될 수 있으며, 웹 그래프가 가지는 독자적인 링크 구조의 특성은 다양한 분야의 연구에서 활용되고 있다. 현재 검색 엔진들이 수집한 웹 페이지들은 그 규모가 수십억 개로 방대한 양을 이루고 있다. 본 논문에서는 약 3억 개의 국내 웹 페이지들을 수집하고, 링크 데이터를 추출하여 생성한 웹 그래프의 구조에 대해 분석한다. 국내 웹 페이지들의 링크의 진입 차수와 연결 요소들의 크기 분포는 멱법칙을 따르고, 웹 페이지의 진출 차수는 특정 차수 이상에서 멱법칙을 가짐을 확인한다. 또한 그래프 알고리즘을 이용하여 웹 그래프를 구성하는 요소들로 나눈 후 전체적인 구조를 도식화한 보우타이 다이어그램을 도출한다.

The Analysis and Implication of Link Integrity of Korean Public Institution Website from a Web Usability Perspective (웹 사용성 관점에서 공공기관 웹 사이트의 링크 유효성 분석 및 개선 과제)

  • Moon, Hyun Ju;Kim, Suk Il
    • 재활복지
    • /
    • v.17 no.4
    • /
    • pp.291-309
    • /
    • 2013
  • Web usability is utilized as a standard for constructing and managing website to be useful by people of all abilities and disabilities. Link integrity is one of main criteria for web usability evaluation. Links that are found to be broken or pointing to irrelevant information lead gradual degradation of link integrity over time. This study has conducted investigation for link integrity of Korean public institution website. Among 49 website that are accessible by an automatic link checker software, 91.8% of the website has more than one broken links. Also average number of broken links is 50.5 that is 0.33% of the number of links. 29 websites consist of internal broken links. And 22 website do not provide any information on the missing page. Broken links enlower website confidence by reducing web usability as well as they prohibit web search engine not to provide information on the website. Therefore, web developers and managers need to be aware of importance of link integrity and prohibit web usability degradation by performing link validation as a web management task or periodically.

Ascertaining the Structure and Content of a National Scholarly Web Space Based on Content Analysis (내용 분석을 통한 한국의 학술적 웹 공간 구조 분석)

  • Chung, Young-Mee;Yu, So-Young
    • Journal of the Korean Society for information Management
    • /
    • v.26 no.3
    • /
    • pp.7-24
    • /
    • 2009
  • Since the Web is dynamic, it is necessary to analyze scholarly Web space with both quantitative and qualitative methods for better understanding of communication characteristics. In this study, we analyzed contents of pages and links to ascertain the characteristics of Korean scholarly Web space in terms of network structure and communication behavior. The result shows that the structure of the original network with all the external links remained is not much different from that of the network with activated external links only. However, the purposes of linking vary among scholarly institutions. The centrality measures correlate more strongly with the clustering coefficient than with the constraint index implying the similar explanatory power of the two types of structural indices.

A Comparative Study on Interdisciplinarity in the Fields of Science and Technology Based on Journal Citation and Web Link Analyses (학술지 인용과 웹 링크 분석을 통한 과학기술분야의 학제성 비교 연구)

  • Jung, Ho-Yeun;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.3
    • /
    • pp.179-200
    • /
    • 2007
  • This study identifies the interdisciplinary structures of 8 scientific disciplines in science and technology using the data from journal citations and web links, and compares the interdisciplinarity among these scientific disciplines. The interdisciplinarity refers to interdisciplinary connections among scientific fields and the degree of interdisciplinarity is measured by the number of associated fields and the rate of self-citation. A re-arranged classification scheme for science and technology was adopted to identify subject categories of journals and web pages. Web link analysis revealed a few additional interdisciplinary connections that were not identified by the journal citation analysis, thus demonstrating that it is useful means of investigating the interdisciplinarity of scientific fields. Besides, in most of the cases the interdisciplinarity of the engineering fields were found greater than that of the fields in natural sciences in both analyses.

An Implementation of the Ranking Algorithm for Web Documents based on Link Analysis (링크 분석에 기반한 웹 문서 중요도 평가 알고리즘의 구현)

  • Lim, Sung-Chae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.75-78
    • /
    • 2010
  • 웹 검색에는 기존의 정보검색(Information Retrieval) 시스템에서와 다르게 문서 간 하이퍼링크 정보를 바탕으로 각 웹 문서의 고유 중요도를 추정하는 방식이 자주 이용된다. 링크 분석에 기반한 알고리즘 중 PageRank 알고리즘은 구글의 웹 검색 서비스에 적용된 것으로 알려져 있다. 이런 PageRank 알고리즘에 따라 중요도를 계산하는 경우 색인된 웹 문서수가 증가함에 따라 계산에 필요한 CPU 자원의 사용도 함께 증가하며, 문서 수가 수 억 페이지에 달하면 하나의 서버에서는 계산을 수행할 수 없다는 문제가 있다. 본 논문에서는 이런 문제점을 해소하기 위해 여러 대의 서버를 PageRank 계산 용 클러스터로 사용할 수 있는 방법을 제시한다. 제시된 방법은 고속의 LAN을 이용하여 여러 대의 서버를 연결하고 반복적인 행렬 계산을 병렬로 수행할 수 있어 계산 시간을 단축시킬 수 있다. 이런 서버 클러스터 구현을 위해 멀티 쓰레딩 프로그램이 작성되었으며, PageRank 계산에 사용되는 행렬 데이터를 적은 양의 메모리만으로 표현 가능하도록 하였다.

  • PDF

An Experimental Study on Web Link Analysis of the Korean National Archives (국가기록원 웹사이트 링크정보 분석에 관한 실험적 연구)

  • Park, Zi-Young
    • Journal of the Korean Society for information Management
    • /
    • v.25 no.2
    • /
    • pp.167-181
    • /
    • 2008
  • In this study, web link analysis of the Korean National Archives has been Performed using LexiURL to show the dynamic web flow of the National Archives and to identify which closely related institutions the archives should seek to cooperate with for developing an institutional strategic plan. Inlink and co-inlink analysis were performed and, to identify related institutions of the Korean National Archives. a comparison was made with other countries such as Australia, England and the United Stats. Through web link analysis, several features can be detected and future directions are suggested. Most inlinks and co-inlink of the Korean National Archives were from public institutions, indicating that relationships with educational or research institutions are weak. Moreover, Korean National Archives involve fewer web links related to international activities than other countries. Proceeding from these results, educational function, research function and international activities should be fortified. Korean National Archives need to provide more materials for supporting educational and research activities and more cultural interchange among related institutions. Further research with different heritage institutions such as libraries or museums is needed.

A Study on the Intellectual Structure in Web Information of Sociology Using the Co-links Analysis (동시링크를 이용한 사회학 분야 웹 정보원의 지적구조 분석:)

  • Kim Won-Jin
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2006.08a
    • /
    • pp.113-120
    • /
    • 2006
  • 본 연구에서는 사회학 분야 웹 정보원을 대상으로 동시링크분석을 실시하여 특정 학문분야의 지적구조를 분석하고, 검색엔진별 지적 구조의 차이를 분석함으로써 웹 정보원의 특성을 살펴보았다. 세 개의 검색엔진을 대상으로 지적구조의 차이를 비교한 결과, 웹 정보원 지도에서 전체적인 지적구조는 비슷하게 나타났지만, 몇 개의 웹 정보원의 경우에는 소속군집이 다르게 나타난 경우도 있었다. 그리고 Altavista와 AlltheWeb은 지도상의 웹 정보원 분포에 있어서 거의 유사한 구조를 보여주었다.

  • PDF