• 제목/요약/키워드: 하이퍼링크

검색결과 198건 처리시간 0.026초

웹 사용 데이타와 하이퍼링크 구조를 통합한 웹 네비게이션 마이닝 (Web Navigation Mining by Integrating Web Usage Data and Hyperlink Structures)

  • 구흠모;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.416-427
    • /
    • 2005
  • 웹 네비게이션 마이닝은 웹 접근 로그 데이타를 분석하여 웹을 항해하는 패턴을 발견하는 기법이다. 하지만 사용자들은 웹을 항해할 때 정상적인 계층적 경로를 따르지 않는 경우가 많기 때문에 웹 접근 로그 데이타에는 웹 항해 패턴 발견에 장애가 되는 잡음 정보가 많이 포함된다. 결과적으로 웹 접근 로그 데이타만을 이용한 기존의 웹 네비게이션 마이닝은 이런 잡음을 해결하기 위한 전처리 과정의 복잡성 등으로 인하여 웹 항해 패턴을 효율적으로 발견하는 데 좋은 성능을 보여주지 못했다. 이런 문제를 해결하기 위해 본 논문에서는 웹 접근 로그 데이타 외에 웹의 하이퍼링크 구조 정보를 함께 이용하여 웹 네비게이션 패턴을 효율적으로 발견하는 기법을 제시하였다. 웹 사이트의 계층적인 하이퍼링크 구조로부터 생성된 WebTree라 불리는 구조를 이용하여 웹 접근 로그 데이타에 포함된 비정상적인 경로에 대한 잡음을 효율적으로 제거하였다. 이 기법을 이용해 구현된 SPMiner(Sequence Pattern Miner) 시스템은 로그 데이타와 하이퍼링크 계층구조를 함께 이용함으로써 전처리의 오버헤드를 현저히 감소시켰고 결과적으로 효율적으로 네비게이션 패턴을 찾아주고 이를 추천에 이용할 수 있는 기반을 제시하였다.

도서관 웹사이트의 하이퍼링크 네트워크 분석 (A Study on the Hyperlink Network Analysis of Library Web Sites)

  • 노윤주;김성희
    • 한국비블리아학회지
    • /
    • 제28권2호
    • /
    • pp.99-117
    • /
    • 2017
  • 본 연구는 국내 도서관 유형별 웹사이트의 하이퍼링크 네트워크 구조분석을 위하여 총 32개 웹사이트의 하이퍼링크를 실증적으로 분석하였다. 크롤러를 이용하여 하이퍼링크 데이터를 수집한 후, 도서관 유형별 웹사이트를 대상으로 네트워크 내에서 나타나는 전체적인 특성과 도서관이 특히 집중하고 있는 웹사이트가 무엇인지, 중심성 값이 높은 도서관 웹사이트는 어디인지를 다양한 측면에서 분석을 시도하였다. 그 결과 첫째, 분석 대상 전체 도서관 중 연세대학교 학술정보원 웹사이트가 연결정도중심성, 매개중심성, 근접중심성, 아이겐벡터중심성 값이 가장 높게 나타났다. 둘째, 도서관 유형별로 살펴보면, 국가도서관은 국립세종도서관, 공공도서관은 서울도서관, 대학도서관은 연세대학교 학술정보원 웹사이트가 네트워크 내에서 상대적으로 영향력 있는 것으로 나타났다. 이러한 분석 결과를 토대로 앞으로 도서관 웹사이트의 효율성과 효과성을 제고시키기 위한 운영 전략 수립에 기초 자료로 활용할 수 있을 것이다.

웹 문서와 접근로그의 하이퍼링크 추출을 통한 웹 구조 마이닝 (Web Structure Mining by Extracting Hyperlinks from Web Documents and Access Logs)

  • 이성대;박휴찬
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2059-2071
    • /
    • 2007
  • 웹 사이트의 구조가 정확하게 주어진다면, 정보 제공자의 입장에서는 사용자의 행위 패턴이나 특성을 효과적으로 파악할 수 있어 보다 나은 서비스를 제공할 수 있고, 사용자의 입장에서는 더욱 쉽고 정확하게 유용한 정보를 찾을 수 있을 것이다. 하지만 웹상의 문서들은 빈발하게 수정되기 때문에 웹 사이트의 구조를 정확하게 추출하는 것은 상당한 어려움이 있다. 본 논문에서는 이러한 웹 사이트의 구조를 자동으로 추출하는 알고리즘을 제안한다. 제안하는 알고리즘은 두 단계로 구성된다. 첫 번째 단계는 웹 문서를 분석하여 그들 간의 하이퍼링크를 추출하고 이를 웹 사이트의 구조를 나타내는 방향 그래프로 표현한다. 하지만 플래시나 자바 애플릿에 포함된 하이퍼링크는 추출할 수 없는 한계가 있다. 두 번째 단계에서는 이러한 숨겨진 하이퍼링크를 추출하기 위하여 웹 사이트의 접근로그를 이용한다. 즉, 접근로그로부터 각 사용자의 클릭스트림을 추출한 후, 첫 번째 단계에서 생성한 그래프와 비교하여 숨겨진 하이퍼링크를 추출한다. 본 논문에서 제안한 알고리즘의 성능을 평가하기 위하여 다양한 실험을 수행하였고, 이러한 실험을 통하여 웹 사이트의 구조를 보다 정확하게 추출할 수 있음을 확인하였다.

MICE 생태계 분석을 위한 PCO와 이해관계자 간의 하이퍼링크 관계망 분석 (Analysis of Hyperlink Network Relationships among PCOs and Stakeholders in MICE Ecosystem )

  • 이현애;정희정;구철모;정남호
    • 경영정보학연구
    • /
    • 제20권3호
    • /
    • pp.1-16
    • /
    • 2018
  • MICE 산업은 다면적 산업으로 공공부문과 민간부문에 걸쳐 다양한 이해관계자들이 존재하며, PCO(Professional Convention Organizers)들은 이러한 이해관계자들 간의 의견을 조율하는 매개적인 역할을 한다. 따라서, PCO들은 신뢰도와 인지도를 증가시키는 한편, 이해관계자들과의 협력적 네트워크를 형성 또는 강화하기 위해 자사의 웹사이트에 이해관계자들의 하이퍼링크를 게재하고 있다. 이에 본 연구는 MICE 산업을 생태계적 관점에서 이해하고자 사회관계망 분석 기법을 적용하여 PCO와 이해 관계자들 간 하이퍼링크 관계망의 구조적 특징을 분석하고, 이 네트워크 내에서 PCO의 성과와 규모에 따라 그 역할에 차이가 있는지를 파악하고자 하였다. 연구 결과, 연결정도 중심성, 아이겐벡터 중심성, 매개 중심성, 근접 중심성이 높은 PCO를 확인하였으며, 규모가 큰 PCO가 하이퍼링크 네트워크에서 더 높은 중심성을 갖고 있음을 파악하였다.

서지적 관계유형을 적용한 하이퍼목록 연구 (A Study on Hypercatalog applying Bibliographic Relationships)

  • 문영주;김태수
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.71-74
    • /
    • 1996
  • 기존 목록의 모으는 기능을 보완하는 대안으로 하이퍼텍스트(Hypertext) 기능을 적용한 목록을 제시하였다. 관련된 문헌 상호간을 이어주는 링크는 서지적 관계 유형을 이용하였으며, 기존 MARC 포맷의 연관저록필드를 좀더 확장하여 6가지 서지적 관계를 모두 연결시킬 수 있도록 수정한 MARC 포맷을 이용하여 하이퍼목록을 구축하였다. 하이퍼목록의 인터페이스로는 상세서지화면에 나타나는 버튼을 통해 직접 관련자료의 간략리스트나 상세서지를 검색할 것을 제시하였고, 클리퍼를 이용하여 하이퍼목록을 구현하였다.

  • PDF

하이퍼미디어.멀티미디어.하이퍼텍스트: 정의(定義)와 개관(槪觀) (Hypermedia, Multimedia and Hypertext: Definitions and Overview)

  • 김지희
    • 정보관리연구
    • /
    • 제25권1호
    • /
    • pp.24-46
    • /
    • 1994
  • 본 논문은 하이퍼미디어, 멀티미디어, 하이퍼텍스트의 정의(定義)와 개관(槪觀)에 관한 것이다. 하이퍼텍스트에서는 관련 정보가 노드의 형태로 분류되며, 각 노드는 링크로 서로 연결된다. 하이퍼텍스트의 경우, 노드는 텍스트 혹은 그래픽 정보를 소장하고 있다. 멀티미디어에서는 여러 유형의 미디어(음성, 애니메이션, 텍스트, 그래픽, 비디오)가 결합된다. 하이퍼미디어는 하이퍼텍스트와 멀티미디어의 확장으로 볼 수 있다. 하이퍼미디어에서는 시스템에서 정보를 조직(組織)함에 있어서 노드와 링크를 사용하는 하이퍼텍스트의 개념(槪念)에 기초하고 있으며, 이런 경우 노드는 위의 멀티미디어 정의에서 언급된 여러 데이터 유형(類型)으로 구성된다. '노드와 링크' 개념은 하이퍼미디어 시스템에서 정보(情報)를 조직(組織)하는데 사용된다. 하이퍼미디어 시스템 계발의 새로운 접근방법은 지식기반(知識基盤) 접근(接近)이다. Joel Peing-Ling Loo는 지식기반 접근이 이러한 종류의 기술을 다루는 데 가장 효과적(效果的)이라고 제안하였다. 의미기반(意味基盤) 하이퍼미디어 모형(模型)이 정보책임, 유지와 검색을 표현하는데 있어서의 제한점(制限點)에 대한 해결책으로서 개발되었다. 정보의 지식기반(知識基盤) 표현은 전통적인 데이터 구조의 사용을 포함한다. 이러한 데이터 구조는 전문가(專門家) 시스템에서 사용되는 프레임(객체(客體)), 슬롯, 계승이론을 사용한다. 이러한 객체들이 데이터베이스에 포함되기 때문에 관계가 여러 객체 사이에서 개발되었으며, 또한 관계는 프레임이 속하는 어트리뷰트에 의하여 프레임 사이에서 존재(存在)할 수 있다.

  • PDF

대학 홈페이지 하이퍼링크 중심도와 방문자수 관계 분석 (A Correlation between the Centrality of the Hyperlinks and the Number of Visits in the Homepages of the University)

  • 권혜정;전미현;배태웅;김규태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.399-402
    • /
    • 2017
  • 대학 내 기관별 웹페이지의 방문자 패턴을 분류하고, 하이퍼링크에 따른 네트워크 분석을 통해 방문자수와의 연관성을 연구하였다. 웹페이지 언어에 따라 영문 홈페이지는 공통적으로 낮은 방문 패턴을 보였으며, 단과대학이 개별 학과에 비해 높은 방문자수를 보였다. 웹페이지 하이퍼링크의 중심도(Centrality) 분석에서는 사이중심도(Betweenness centrality)를 정도(degree)로 정규화한 값이 방문자 수의 상한 값에 대응되는 현상이 발견되었다. 홍보효과를 위해 홈페이지 내용, 구조 설계뿐만 아니라 웹 상에 적절한 노출 전략도 도움이 됨을 알 수 있었다.

시간종속적 하이퍼미디어 시스템을 위한 SGML DTD의 설계 (Design of SGML DTD for Time-dependent Hypermedia Documents)

  • 김호진;이수진;최윤철
    • 한국정보처리학회논문지
    • /
    • 제5권10호
    • /
    • pp.2479-2497
    • /
    • 1998
  • 하이퍼미디어시스템을 모델링하기 위해 제공되는 기존의 표준 모델들이나 SGML을 이용하여 설계된 하이퍼미디어 시스템들은 저마다 서로 다른 정보기술 및 저장 방법론을 제시하고 있어 이질적인 시스템간의 문서 교환이나 프리젠테이션을 어렵게 만들고 있다. 그리고 사용자 인터랙션의 처리나 시간종속적 멀티미디어 객체(time-dependent multimedia object)들의 표현에 있어서도 많은 제한점들을 가진다. 본 논문에서는 시간종속적 멀티미디어 객체들을 효율적으로 표현할 수 있고 사용자의 인터랙션에 따라 멀티미디어 객체들을 서로 다른 정보 영역으로 링크시키며 시간종속적 링크를 제공해 주는 시간종속적 하이퍼미디어 시스템(Time-dependent Hypermedia System)을 모델링하고, 그러한 하이퍼미디어 시스템을 기술하기 위한 SGML 문서타입 정의부(Document Type Definition : DTD)를 설계한다. DTD의 설계에 있어서는 멀티미디어 객체들의 동기화를 위한 스케줄링 메커니즘과 다양한 노드 형태의 기술에 중점을 두고, 사용자들에게 구조 및 개념 파악의 용이성을 제공하기 위해 모듈 개념을 적용하였다.

  • PDF

내용분석을 통한 향산된 링크기반 검색 (Improved Link-based Retrival with Content Analysis)

  • 이경희;김민수;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.151-153
    • /
    • 2004
  • 정보검색이 발달함에 따라 인터넷 환경에서의 정보 검색은 하이퍼링크 정보를 분석하여 이용하는 추세에 있다. 최근에는 주어진 주제어나 질의어에 대해 가장 적합한 검색 방법을 결정하기 위해 하이퍼텍스트 기반 링크 구조를 분석하는 알고리즘이 늘어나고 있는 실정이다. Bharat〔2〕은 HITS 알고리즘의 문제점을 지적하고 이를 개선하기 위한 방법을 제안하였다. 본 논문에서는 Bharat이 제시한 확장 질의어를 만드는 방법에 대한 문제점 제기와 이 문제에 대한 개선 안을 제시하고자 한다.

  • PDF

웹 서버 성능 향상을 위한 링크 맵 웹 시스템 구현 (Web Link Map implementation for Web Server performance improvement)

  • 문일형;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.371-374
    • /
    • 2008
  • 현재 수많은 상업포탈 사이트들은 다양한 서비스를 제공하기 위해 많은 노력을 기울이고 있다. 다양한 서비스를 제공함으로써 다양한 소비자들을 더 수용하기 위해 다양한 기능들을 개발하고 있다. 이러한 기능들을 제공하기 위해 많은 양의 하이퍼링크로 연결된다. 이런 많은 양의 하이퍼링크들은 초기 서비스 웹 페이지 소스의 대부분을 차지하게 된다. 이는 웹 서버의 부하를 주는 것은 물론이고 사용자들 역시 그렇게 많은 링크 서비스를 필요로 하지 않기 때문에 많은 양의 링크들을 정리할 필요가 생긴다. 즉 사용자들이 빈도수가 높은 서비스에 대한 링크만을 연결함으로써 웹 서버의 부하를 줄이고 웹 페이지의 소스의 양도 크게 줄일 수 있다. 일반 웹 페이지의 소스를 렌더링하여 필요한 링크만 제공하는 구현을 통해 웹 서버의 성능 향상을 연구한다.

  • PDF