• 제목/요약/키워드: 웹 링크

검색결과 365건 처리시간 0.027초

동시링크를 이용한 웹 문서 클러스터링 실험 (Clustering of Web Document Exploiting with the Co-link in Hypertext)

  • 김영기;이원희;권혁철
    • 한국도서관정보학회지
    • /
    • 제34권2호
    • /
    • pp.233-253
    • /
    • 2003
  • 인간은 지식의 조직을 통해 세계를 이해한다. 정보검색분야에서 연구되고 있는 정보의 조직화에는 분류와 클러스터링이라는 두 가지 유형이 있다. 분류는 미리 정의된 범주에 각 항목을 배정하는 행위인 반면, 클러스터링은 유사하거나 관련된 항목을 집단화함으로써 정보를 조직한다. 인터넷 정보자원의 조직은 웹 문서에 출현하는 단어들에서 키워드를 추출하여 역파일을 작성함으로써 검색에 활용하는 것이 일반적인 방법이다. 그러나 키워드의 출현 위치나 단어빈도를 통한 문서유사도 기법은 사용된 언어가 다르거나 대부분이 앵커텍스트만으로 구성되어 있는 대문페이지처럼 적용하기 어려운 경우가 많다. 이 연구는 계량정보학적 분석 기법 중에서 동시인용 기법을 웹 문서의 하이퍼링크에 적용하여, 웹 문서의 클러스터링 가능성을 실험한다.

  • PDF

인터넷 정보 추출을 이용한 웹문서 구조화 (Web Site Construction Using Internet Information Extraction)

강화학습을 이용한 웹 정보 검색 (Web Information Search Using Reinforcement Learning)

  • 정태진;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.94-96
    • /
    • 2001
  • 현재 인터넷상에서 제공되고 있는 대부분의 서치엔진들은 정보소스에 접근해서 이를 가져오는 웹 로봇(webbot)이라고 불리우는 에이전트를 이용한다. 그런데 이런 웹 로봇들이 웹 문서를 검색하는 방법은 극히 단순하다. 물론 많은 정보를 가지고 오는 것에 초점이 맞추어져 있어서 정확도를 중시하지 않는 것에도 한 원인이 있다. 범용 검색엔진과는 달리 검색하는 영역을 축소하여 특정 주제에 관련된 정보만을 더 정확히 찾아주는 검색엔진의 필요성이 증가하고 있다. 이에 본 논문에서는 강화 학습 방법을 이용하여 웹 상에 존재하는 정보 중에서 특정 주제의 웹 페이지를 보다 더 정확히 찾는 방법을 제시한다. 강화 학습은 웹 상의 하이퍼링크를 따라가는 문제에 있어서 미래에 이로움을 주는 행동의 효용성을 측정하는데 있어서 이점을 보인다. 강화 학습을 이용하여 제시된 방법을 통한 실험에서는 일반적인 방법보다 더 적은 링크를 따라가고도 더 정확한 결과를 보였다.

  • PDF

웹 정보 검색 엔진을 위한 저장구조의 설계 및 실험 (Design and Study on Structure of Storage for Web Search Engine)

  • 이동광;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.539-542
    • /
    • 2002
  • 인터넷의 발달은 월드 와이드 웹을 탄생 시켰고 그로 인한 인터넷의 폭발적 성장은 인터넷을 하나의 생활로 만들었다. 인터넷의 엄청난 자료의 양과 친숙해진 인터넷으로 인해 인터넷은 하나의 정보창구의 역할을 하게 되었고, 그에 따라 정보검색이 발전하게 되었다. 초기의 월드 와이드 웹은 많은 웹 문서가 아니었지만, 구글이 현재 20억 페이지를 색인할 만큼 엄청난 규모가 되었다. 또한 앞으로의 검색 엔진은 정보나, 웹상의 링크 정보를 통한 그 문서의 중요도를 분석하여 문서의 중요도를 판단하게 될 것이며, 지금까지의 검색엔진의 저장구조와는 다른 구조를 가지게 될 것이다. 그에 따라 웹 정보검색엔진의 저장구조는 효율적 저장과 속도 향상을 위해 중요한 구조가 되어가고 있다. 본 논문에서는 검색엔진의 저장구조에 따른 용량의 변화와 앞으로의 웹 검색엔진에서 등장할 기능인 문서의 정보나, 문서간의 링크 정보를 통한 문서의 중요도 분석 등을 수행할 수 있는 저장구조를 만들어보고 실험해 보았다.

  • PDF

퍼지 개념 네트워크를 이용한 개인화된 링크기반 검색엔진의 개발 (Development of a Personalized Link-based Search Engine using Fuzzy Concept Network)

  • 김경중;조성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권3호
    • /
    • pp.211-219
    • /
    • 2001
  • 텍스트 정보만을 이용하는 일반적인 검색엔진들의 한계를 극복하여 향상된 결과를 내기 위하여 링크 구조를 이용해 검색을 수행하는 시스템이 새롭게 등장하고 있다. 링크 구조는 사용자의 질의에 대해 중요한 문서들을 가려준다. 본 논문에서는 한 걸음 더 나아가 링크 정보를 이용하여 검색된 웹 페이지들 중 사용자의 기호에 적절한 결과를 도출하는 방법을 제안한다. 사용자 프로파일에 기반한 퍼지 개념 네트워크로 구축된 퍼지 문서 추출 시스템은 사용자의 성향을 반영하여 링크 기반 검색결과를 개인화 한다. 5명의 사용자에 대한 실험결과, 개발한 시스템이 의미 있는 웹 페이지를 검색함은 물론이고 사용자의 성향을 잘 반영함을 알 수 있었다.

  • PDF

하이퍼링크를 이용한 그래프 기반의 웹 문서 클러스터링 (Web Document Clustering based on Graph using Hyperlinks)

  • 이준;강진범;최중민
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.590-595
    • /
    • 2009
  • 인터넷 상의 웹 문서의 수가 기하급수적으로 늘어남에 따라서, 정보검색에서의 웹 문서 클러스터링은 성능과 속도가 매우 중요하게 되었다. 웹 문서 클러스터링은 의미적으로 관계가 있는 웹 문서들을 같은 클러스터로 군집함으로써 정보 검색을 보다 빠르고, 정보를 정확하게 제공할 수 있다. 그물망 그래프 형태의 클러스터링은 모든 문서간의 유사도를 측정함으로써 재현율을 높일 수 있지만, 높은 계산 비용을 갖는다. 본 논문에서는 그물망 형태의 클러스터링의 재현율과 정확율을 유지하며 계산 비용을 줄이기 위하여, 웹 문서의 구조적 특징인 하이퍼링크(Hyperlinks)를 이용한 클러스터링 방법을 제안한다.

  • PDF

온톨로지 기반 웹 항해 안내 시스템 (The Ontology-based Web Navigation Guidance System)

  • 정효숙;김희진;민경실;박성빈
    • 컴퓨터교육학회논문지
    • /
    • 제12권5호
    • /
    • pp.95-103
    • /
    • 2009
  • 본 논문에서는 온톨로지를 기반으로 사용자에게 의미적으로 관련된 링크를 자동적으로 제공하는 웹 항해 안내 시스템을 제안한다. 본 시스템은 각각의 웹 페이지를 온톨로지에 존재하는 특정 개념과 관련시키고, 온톨로지에 정의된 개념들 간의 관계를 고려하여 웹 페이지들 간의 새로운 링크를 생성한다. 본 시스템은 온톨로지를 기반으로 의미적 링크를 제공함으로써 웹 항해 안내를 향상시키는데 초점을 두고 있다. 본 노문에서 제안한 시스템을 이용하여 초등학교 5학년 학생들에게 웹 페이지를 탐색하면서 과제를 수행하는 실험을 한 결과 실험 집단에 속한 학생들의 방향 상실 정도, 웹 페이지의 재 방문율, 그리고 과제 수행에 소비된 시간이 통제 집단에 속한 학생들의 경우보다 작았고 과제 수행율은 실험 집단의 학생들이 통제 집단의 학생들보다 높았다. 본 논문에서 제안하는 시스템은 웹 기반 교육에서 중요한 항해 가능한 웹 사이트를 설계하는 데 도움이 되리라 기대된다.

  • PDF

웹 통합문서의 저작과 검색을 지원하는 자동링크지원 시스템의 구축 (The Construction of The Automatic Linking Support System(ALSII) for Authoring and Retrieving Web Integrated Documents)

  • 김운미;정창원;성재석;주수종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.591-594
    • /
    • 2000
  • 인터넷 기술의 발전으로 인하여 다양한 멀티미디어 서비스를 제공하고 있으나, 최근 들어 사용자들의 수가 증가함에 따라 정보를 제공하는 쪽에서의 단순한 서비스가 아닌 사용자 위주의 맞춤 정보 서비스를 제공하는 쪽으로 변화되고 있는 추세이다. 따라서, 본 논문에서는 차세대 웹 서비스에 초점을 맞추어, 기존의 키워드 검색방법과 수 작업에 의한 하이퍼링크 기법의 제한점을 해결한 사용자 위주의 맞춤 정보 서비스를 제공하는 자동 링크 지원 시스템(ALSII)을 제안한다. 이는 마우스 이벤트에 의한 쉬운 검색 방법과 기존 문서상의 키워드에 관련된 다양한 멀티미디어 정보를 자동으로 연결시켜 하이퍼미디어 웹 문서 작성에 편리하며, 새로운 멀티미디어 통합 정보를 구축하는데 용이하다.

  • PDF

웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법 (A Hyperlink-based Feature Weighting Technique for Web Document Classification)

  • 이아람;김한준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다

웹기반의 효과적인 링크관리자 (A Web-Based Effective Link Manager)

  • 신원준;정혜영;박양수;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.166-168
    • /
    • 2003
  • 인터넷의 확산과 더불어 사용자가 즐겨 찾는 뵐 사이트의 수도 증가되고 있다. 현재 이러한 웹 사이트들은 웹 브라우저의 즐겨찾기에 등록하여 관리되고 있다. 등록된 즐겨찾기 목록은 로컬 브라우저에 한정되어 있어서 다른 장소에서 이 즐겨찾기에 등록된 정보를 이용하려고 할 경우 번거로움이 있다. 따라서 인터넷이 연결된 어디에서나 자신의 즐겨찾기를 이용할 수 있고 다른 사용자들과 유용한 사이트 정보를 공유할 수 있는 도구를 제공하는 것이 바람직하다. 본 논문에서는 웹기반 즐겨찾기 컴포넌트인 LinkManager를 개발함으로써, 인터넷이 연결된 어디에서나 자신의 즐겨찾기를 이용하고 관리할 수 있도록 지원하였다. 추가로 LinkManager는 협업지원 시스템과 같은 웹어플리케이션에 적용될 경우 그룹의 링크를 맴버들이 공유할 수 있어서 작업의 효율을 높일 수 있다.

  • PDF