• Title/Summary/Keyword: 웹문서

Search Result 1,602, Processing Time 0.025 seconds

Dynamic User Profile Creation Method for Effective Recommendation for Documents on the Web (효과적인 웹 문서 추천을 위한 동적 사용자 프로파일 생성 기법)

  • 윤윤경;서정연
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.453-455
    • /
    • 2000
  • 기하급수적으로 증가하는 인터넷의 정보량에서 최적의 정보를 찾고자 하는 사용자의 요구가 증가함에 따라 개별적 사용자에게 필요한 정보만을 제공하는 것이 필요하다. 이러한 사용자의 요구를 충족시키기 위해 사용자의 행동을 관찰하고 학습하여 사용자 대신 문서를 수집하는 웹 문서 추천 에이전트의 필요성이 대두되었다. 본 논문에서는 웹 문서 추천에이전트에서 사용되는 프로파일을 효과적으로 생성하고 학습하기 위한 문서 표현 방법, 특징 선택법을 제안한다. 제안된 문서 표현 방법은 슬라이딩 윈도우 방법을 통해 인접한 단어쌍의 문맥 정보를 이용하고, 의존 구조를 이용하며 사용자의 관심 변화에 빨리 적응 할 수 있도록 시간에 대한 가중치를 반영한다. 제안된 방법으로 프로파일을 구성한 웹 문서 추천 에이전트는 사용자의 관심 분야를 효과적으로 반영하고 관심 변화에 빨리 적응하여 사용자에게 알맞은 문서를 추천한다.

  • PDF

A Study on the Effect of Data Fusion on the Retrieval Effectiveness of Web Documents (데이터 결합이 웹 문서 검색성능에 미치는 영향 연구)

  • Park, Ok-Hwa;Chung, Young-Mee
    • Journal of Information Management
    • /
    • v.38 no.1
    • /
    • pp.1-19
    • /
    • 2007
  • This study investigates the effect of data fusion on the retrieval effectiveness by performing an experiment combining multiple representations of Web documents. The types of document representation combined in the study include content terms, links, anchor text, and URL. The experimental results showed that the data fusion technique combining document representation methods in Web environment did not bring any significant improvement in retrieval effectiveness.

A Study of Knowledge Based Agent System for Web New-Document Retrieval (지식기반 방식을 이용한 웹 뉴스문서 검색 에이전트 시스템 연구)

  • 이성열;백혜정;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.102-104
    • /
    • 2000
  • 현재 인터넷상의 정보와 문서의 양은 상상을 초월하는 증가추이를 나타내고 있다. 이와 더불어 표현하려는 목적에 따라 체계적으로 정리되고 정형화된 문서들 또한 증가하고 있다. 이러한 문서들 중에는 각 인터넷 신문사나 웹진과 같은 문서들이 포함되는데, 이러한 문서들은 각각의 내용구성과 표현 형식에 있어서 비슷한 구성을 지니고 있다. 본 논문에서는 이러한 체계적이고 정형화된 웹 뉴스 문서검색을 위하여 '지식기반 방식을 이용한 웹 뉴스문서 검색 에이전트 시스템'을 제안한다. 사용자는 시스템에서 제공하는 지식을 기반으로 검색하고자 하는 대상을 에이전트 시스템에게 요청하게 되고 지식기반을 이용한 에이전트 시스템은 보다 정확한 정보를 사용자에게 제공하게 된다.

  • PDF

Design and Implementation of Web browser Using Voice synthesis & Recognition for Korean language (한국어 음성합성과 인식을 이용한 웹 브라우저 설계 및 구현)

  • 조경환;최훈일;조철환;장영건
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.278-280
    • /
    • 2000
  • 인터넷의 중요성이 증가함에 따라, 웹 브라우저에 음성 인터페이스를 추가하는 연구와 개발이 이루어지고 있다. 그러나, 아직까지 기존의 모든 웹 문서가 HTML로 작성되어 있어, 효과적인 음성 인터페이스를 하기에는 많은 어려움이 있으며, 음성이 느린 출력 매체이므로 사용자가 빠르게 인지할 수 있는 방안이 연구되어야 한다. 본 논문에서는 사용자의 웹 액세스를 높이기 위하여, 웹 브라우저에 연결되는 웹 문서에서, 각각의 객체를 추출한 후, 사용자가 그 객체에 바로 액세스를 하거나 한국어 음성으로 그 정보를 알 수 있는 방법을 사용하여, 음성으로 제어할 수 있는 한국어 음성 웹 브라우저를 설계하고 구현하였다. 음성합성과 인식을 사용하여 브라우저를 제어하기 때문에, 노약자나 어린이 또는 시각장애인들이 쉽게 웹 서핑을 할 수 있도록 도와줄 수 있고, 또한 현재 사용되고 있는 웹 문서에서의 객체추출을 사용하기 때문에 특별히 문서의 변환이 필요 없는 장점이 있다.

  • PDF

Web Log Mining for Adaptive Web Sites (적응형 웹 사이트를 위한 웹 로그 마이닝)

  • Ko, Kyong-Ja;Kim, In-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.325-328
    • /
    • 2001
  • 본 논문에서는 웹 사이트에 접근하는 이용자의 패턴을 분석하여 정보 제공이 보다 용이한 구조로 자동 개선시켜 나가는 적응형 웹 사이트의 구현 방안을 제시한다. 특히, 본 연구에서는 기존 웹 사이트의 구조를 가능한 파괴하지 않는 범위 내에서 웹 사이트론 변경하고자 이용자의 접근 패턴상 연관성은 높으나 접근 경로가 긴 문서들을 추출하여 색인 페이지를 추가 생성한다. 이를 위하여, 먼저 대용량의 웹 서버 로그 데이터를 대상으로 하이퍼 링크 구조에 따라 필터링된 최후 전진 문서만을 가지고 데이터 시퀀스를 구성한다. 이러한 데이터 시퀀스에 새로운 순차 접근 패턴 탐색 알고리즘인 TPA를 적용함으로써 웹 문서간 충분한 지지도를 갖는 연관성 있는 문서들의 시퀀스를 구한다. 이와같은 빈발 시퀀스들에 대한 색인 페이지를 추가로 생성시켜주는 서비스를 통하여 이용자들의 효과적인 정보 접근을 지원할 수 있는 웹 사이트로의 변경이 가능하다.

  • PDF

Automatic Classification of Web Documents Using Concept-Based Keyword Information (개념 기반 키워드 정보를 이용한 웹 문서의 자동 분류)

  • 박사준;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.151-153
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해서 분류하고자 하는 영역(category)에 대한 개념 지식을 이용한다. 먼저, 영역별 개념 지식을 기구축된 웹 문서의 집합으로부터 제목과 하이퍼링크에 기반한 앵커 텍스트를 이용하여 개념을 보유한 키워드를 추출한다. 추출된 키워드를 형태소 분석을 통해 색인어로 추출한다. 추출된 색인어에 대해 TFIDF를 확장한 영역 적용 색인 가중치 TFIDFc를 적용하여 영역별 개념 기반 색인어와 색인를 구축한다. 색인은 TFIDF를 영역별로 확장하여 구축한다. 구축된 영역별 개념 기반 색인을 이용하여 새로운 웹 문서에 대해서 어떤 영역에 해당하는 가를 결정하는 자동 분류 알고리즘을 수행한다. 자동 분류 알고리즘에 의해 수행된 문서는 영역별로 정리되며, 또한, 분류된 웹 문서의 색인어는 새로운 개념 기반 키워드로 추출되어 개념 기반 영역 지식을 구축한다.

  • PDF

Course Indexing system using XML Component in WBI (WBI상에서 XML요소를 이용한 교과 색인 시스템)

  • Chae, Seung-Chun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1179-1182
    • /
    • 2002
  • 오늘날 정보의 중요성의 증가와 신속한 정보검색의 필요성에 따라 정보관리의 현대화가 요구되고 있는데 부응해 색인생산의 전산화를 기하기 위한 시스템을 활용하지 않은 전자문서의 표준화로 기술된 XML의 요소를 정보검색을 할 수 있도록 설계를 통해 일반 웹 문서가 전자문서로 서로 교환될 수 있는 그리고 색인기능을 지원하여 정보를 검색하고 기존의 텍스트와 여러 다양한 형태의 정보를 구조적으로 표현할 수 있어 웹을 통한 학습자에게 웹 문서를 쉽게 습득할 수 있도록 구조화된 문서의 표준인 XML의 요소를 이용한 교과색인 시스템을 웹에서 이루어지는 형태의 학습자료로 보다 쉽게 만들고 문서의 교환과 내용을 색인이 원활히 이루어지도록 교과색인 시스템을 구현하여 교사와 학생간의 상호 작용하는 웹 교과색인을 연구하였다.

  • PDF

Tag Manager for Machine Translation of English Web Page (영어 웹문서 기계번역을 위한 태그 관리기)

  • An, Dong-Un;Seo, Jin-Won;Lee, Young-Woo;Chung, Sung-Jong
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.164-168
    • /
    • 1998
  • 영어 웹문서를 한국어로 기계번역을 하기 위해서는 웹문서에 있는 HTML 태그들을 처리하여야 한다. 본 논문에서는 웹문서의 태그들을 처리해 주는 태그 관리기를 제안한다. 태그 관리기는 영한기계번역의 대상이 되는 영어 웹문서에서 태그를 분리하고, 번역이 완료된 후에는 분리된 태그들을 올바른 위치에 복원시키는 기능을 갖는다. 태그 관리기는 태그들의 위치정보에 따른 태그들의 분류와 이를 분리하고 복원하는 기능을 가지고 태그의 내용에 따른 문장 분리기능도 가진다.

  • PDF

Dynamic Web Documents Recommendation System Using User-Profile (사용자 관심도를 반영한 동적 웹 문서 추천 시스템)

  • 김병진;최현우;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.136-138
    • /
    • 2001
  • 인터넷 이용의 급속한 증가로 웹사이트의 증가뿐만 아니라 웹사이트 내의 웹 문서도 급속한 증가를 보이고 있다. 따라서 이를 효과적으로 사용자들에게 보여주기 위한 동적인 추천 시스템들이 많이 제안되고 있다. 그러나 이러한 추천 시스템들은 전체 사용자들의 브라우징 패턴이나 전체 웹 문서들의 연관성만을 고려하여 서비스를 제공함으로써 개인 사용자들의 관심도를 고려하지 않은 문제점이 있다. 이에 본 논문에서는 웹사이트에 남게되는 로그파일의 분석을 이용한 사용자별 브라우징 패턴과 웹 페이지의 액세스 타임의 측정을 통해, 사용자의 관심도를 측정한다. 그리고 이를 바탕으로 웹 문서들에 대해서 퍼지개념을 적용한 자동분류 알고리즘을 이용하여 사용자의 관심도가 반영된 선별된 웹 문서를 자동분류 및 선별하여 보여줄 수 있는 방안을 제시한다.

  • PDF

An Implementation of the Ranking Algorithm for Web Documents based on Link Analysis (링크 분석에 기반한 웹 문서 중요도 평가 알고리즘의 구현)

  • Lim, Sung-Chae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.75-78
    • /
    • 2010
  • 웹 검색에는 기존의 정보검색(Information Retrieval) 시스템에서와 다르게 문서 간 하이퍼링크 정보를 바탕으로 각 웹 문서의 고유 중요도를 추정하는 방식이 자주 이용된다. 링크 분석에 기반한 알고리즘 중 PageRank 알고리즘은 구글의 웹 검색 서비스에 적용된 것으로 알려져 있다. 이런 PageRank 알고리즘에 따라 중요도를 계산하는 경우 색인된 웹 문서수가 증가함에 따라 계산에 필요한 CPU 자원의 사용도 함께 증가하며, 문서 수가 수 억 페이지에 달하면 하나의 서버에서는 계산을 수행할 수 없다는 문제가 있다. 본 논문에서는 이런 문제점을 해소하기 위해 여러 대의 서버를 PageRank 계산 용 클러스터로 사용할 수 있는 방법을 제시한다. 제시된 방법은 고속의 LAN을 이용하여 여러 대의 서버를 연결하고 반복적인 행렬 계산을 병렬로 수행할 수 있어 계산 시간을 단축시킬 수 있다. 이런 서버 클러스터 구현을 위해 멀티 쓰레딩 프로그램이 작성되었으며, PageRank 계산에 사용되는 행렬 데이터를 적은 양의 메모리만으로 표현 가능하도록 하였다.

  • PDF