• Title/Summary/Keyword: 웹문서

Search Result 1,600, Processing Time 0.03 seconds

A Hybrid Document Clustering for a Web Agent (웹 에이전트를 위한 통합방식 문서 클러스터링)

  • Yang, Chan-Beom;Lee, Seong-Yeol;Park, Yeong-Taek
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.5
    • /
    • pp.422-430
    • /
    • 2001
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심 정보를 학습하고 사용자가 필요로 하는 웹 상의 정보를 자동 제공하는 지능형 시스템이다. 웹 에이전트가 사용자의 선호도를 학습하기 위해서는 귀납적 기계학습을 수행하는데, 이때 학습의 효율을 높이기 위해서는 사용자가 관심있어하는 문서들을 유사한 문서들로 클러스터링하여 학습 시스템에 제공하여야 한다. 본 논문에서는 웹 에이전트의 학습 시스템에 입력되는 학습대상 문서들을 보다 정확하고 효율적으로 클러스터링하여 제공하기 위해서 Top-down 방식과 Bottom-up 방식을 통합 적용한 통합방식 문서 클러스터링과 초기 클러스터 생성을 위한 평가함수를 제시한다. Top-down 방식으로는 개념적 클러스터링 알고리즘인 COBWEB을 적용하고, Bottom-up 방식으로는 교차기반(Intersection-based) 클러스터링 방식인 Etzioni의 클러스터링 알고리즘을 적용하였다.

  • PDF

Analysis and Design for the System of Korean Web Document Classification (웹문서분류체계의 분석 및 새로운 설계)

  • Nam Young-Joon
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.32 no.3
    • /
    • pp.207-230
    • /
    • 1998
  • Because of a rapid increase of information available through web site, a user often falls into confusion of which web sites should be visited for his information needs. If a web site search engine can classify web sites according to their subject or topics, it can help the user to determine which web sites are worth accessing and thus to easily acquire relevant information. In this study, I propose new classifying system with a two level hierarchy and 57 items.

  • PDF

Design and Implementation of a Ditributed Multi-Agent Web Search System (분산 다중 에이전트 웹 검색 시스템 설계 및 구현)

  • 김기용;한현구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.107-109
    • /
    • 1999
  • 본 논문에서는 사용자를 대행할 수 있는 분산 다중 에이전트 기술을 이용한 웹 문서 검색 시스템을 설계 및 구현한다. 분산 환경에서의 에이전트 기술은 문서의 근접도를 평가할 때 기존의 웹 검색 엔진보다 복잡한 알고리즘 적용이 가능하며, 이로써 좀 더 정확한 문서들을 사용자에게 제공할 수 있다. 또한 분산환경으로 네트워크의 부하를 분산시킴으로써, 빠르게 자료검색 결과를 얻을 수 있는 장점이 있다. 분산된 시스템에서 에이전트들의 효율적인 통신을 위하여 프로토콜 레이어를 구현하였으며, 에이전트들의 상호 협동과 의사 소통 및 중재를 위한 하부구조(infrastructure)를 구축하여 웹 문서검색을 효과적으로 하고, 사용자 이동성을 가능하게 하였다.

  • PDF

Web Document Transcoding based on CC/PP and Annotation (CC/PP와 애노테이션에 기반한 웹 문서 트랜스코딩)

  • 김회모;이경호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.616-618
    • /
    • 2004
  • 모바일 디바이스가 널리 사용됨에 따라 이를 통한 웹 컨텐츠의 이용이 증가하고 있다. 그러나 모바일 디바이스를 통하여 기존의 웹 컨텐츠를 이용하는 데에는 한계가 있다. 본 논문에서는 CC/PP 프로파일에 따라 웹 문서를 적절히 가공하여 전송하는 트랜스코딩 방법을 제안한다. 제안된 방법은 보다 정교한 수준의 맞춤형 서비스를 지원하기 위하여 원본 문서에 애노테이션(annotation)을 기술할 수 있는 방법을 지원한다. 제안된 애노테이션은 모바일 디바이스에서 표시할 수 없는 컨텐츠를 임의의 리소스로 대체할 수 있다. 또한 제안된 방법은 디바이스의 스크린 사이즈를 고려하여 컨텐츠를 적절한 크기로 나누어 보여주며, 문서의 구조를 효과적으로 전달하기 위한 내비게이션 맵을 제공한다.

  • PDF

Active XML 기반 '전자의료기록 시스템'의 보안성 분석

  • Kim, Il-Gon;Biswas, Debmalya
    • Review of KIISC
    • /
    • v.16 no.5
    • /
    • pp.72-83
    • /
    • 2006
  • XML기반 웹서비스의 활성화와 더불어 효율적인 데이터 호출 및 통합을 위해, XML 문서 안에 웹서비스 호출 노드를 내장할 수 있는 Active XML(AXML) 문서가 개발되었다. 본 논문에서는 기존 전송계층 보안 프로토콜 및 WS-Security의 제한점을 방지하기 위한, AXML 문서의 내장형 웹서비스 호출과 XML-Encryption 및 XML-Signature 보안 표준을 통합한 데이터 암호화 및 전자서명 방식에 대해 소개한다. 또한, '전자의료 시스템' 예제를 통해 AXML 문서를 이용한 중첩된 웹서비스 호출 및 쿼리위임 방식에 대해 소개한다. 마지막으로, 기존 보안성 정형분석 방법의 확장을 통한 AXML 시스템의 보안 취약 가능성에 대해 언급하고자 한다.

The Meta Search Agent using Ranking Algorithm with Link Structure Analysis (링크 구조 기반의 순위 알고리즘을 이용한 메타 검색 에이전트)

  • 김형욱;김민구;최경희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.373-375
    • /
    • 2002
  • 하이퍼 텍스트 구조의 특성을 이용한 순위 평가 알고리즘 중의 하나인 HITS 알고리즘은 웹 페이지들의 상호간에 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하여 순위에 따른 결과를 제시한다. 그러나 초기의 HITS 알고리즘은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적인 단점을 가지고 있다. 본 논문에서는 여러 웹 검색 엔진들로부터 얻어진 문서 집합에 수정된 HITS 알고리즘을 수행하는 메타 검색 에이전트를 설계하여 보다 나은 검색 성능을 구하고, 결과의 지역성을 보완한다.

  • PDF

Efficient Term Weighting For Term-based Web Document Search (단어기반 웹 문서 검색을 위한 효과적인 단어 가중치의 계산)

  • 권순만;박병준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.169-171
    • /
    • 2004
  • 웹(WWW)은 방대한 양의 정보들과 함께 그에 따른 웹의 환경과 그에 따른 정보도 증가하게 되었다. 그에 따라 사용자가 찾고자 하는 정보가 잘 표현된 웹 문서를 효과적으로 찾는 것은 중요한 일이 되었다. 단어기반의 검색에서는 사용자가 찾고자 하는 단어가 나타난 문서들을 사용자에게 보여주게 된다. 검색 단어를 가지고 문서에 대한 가중치를 계산하게 되는데, 본 논문에서는 이러한 단어기반의 검색에서 단어에 대한 가중치를 효과적으로 계산하는 방법을 제시한다 기존의 방식은 단어가 나타난 빈도수에 한정되어진 계산을 하게 되는 반면, 수정된 방식은 태그별로 분류를 통한 차별화 된 가중치를 부여하여 계산된다. 기존의 방식과 비교한 결과 본 논문에서 제시한 수정된 방식이 더 높은 정확도를 나타냈다.

  • PDF

A Knowledge Service Using Automatic Document Sharing based on Intelligent OMDR (지능형 OMDR 기반의 자동 문서 공유 에이전트를 이용한 지식서비스)

  • Su-Kyoung Kim;Kee-Hong Ahn
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.747-750
    • /
    • 2008
  • 본 연구는 온톨로지, 자연어 처리, 메타데이터 등의 시맨틱 웹 기반 기술들을 이용하여 시맨틱 웹 응용을 위한 전체적인 기술 적용과 그의 활용에 목적을 두고 있다. 이를 위해 OWL을 기반으로 조직이나 기관의 지식 주제별 도메인 온톨로지와, 기존 워드넷(WordNet)이나 더브린 코어 메타데이터(Dublin Core Meta Data)와 조직에 정의된 데이터베이스의 스키마를 MDR로 구축하여 상호 연결하여 온톨로지가 갖는 지능적 추론과 규칙 서비스와 표준화된 메타데이터의 결합 방법을 제공한다. 이는 기존에 온톨로지와 메타데이터의 재활용과 연결(Alignment)에 있어 연구적으로 높은 가치가 있다. 그리고 조직의 사용자가 문서를 작성할 때 문서의 내용에 대해 자연어 처리 기술과 온톨로지의 기술을 이용해 적합한 용어나 메타데이터를 자동으로 제공하여 작성된 문서의 공유와 재사용성을 높이고, 작성된 문서를 XML 형식으로 구성되는 XML 기반 지능 문서 데이터베이스(XMB Based Intelligent Document Database)에 저장하여 유사한 문서를 작성하거나 사용할 필요가 있는 사용자에게 문서 등록과 검색 에이전트(Document Registry and Retrieval Agent)를 통해 이러한 제공하여 문서 지식의 사유화를 최소화 하고, 유사 문서의 재작성과 또는 특정 문서의 작성에 필요한 시간이나 경비를 줄이게 된다. 또한 웹상이나 PDA 같은 개인 휴대장치를 통해서도 서 등록과 검색 에이전트를 통해 문서를 검색하고 사용할 수 있게 한다면 언제 어디서나 해당 서비스를 활용하는 유비쿼터스와 시맨틱 웹의 실질적 응용을 거둘 수도 있으리라 사료된다.

Construction of User Profile for Personal Web Agent (개인 웹 에이전트를 위한 사용자 프로파일 구축)

  • 이상섭;소영준;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.126-128
    • /
    • 1998
  • 본 논문에서 구현하고자 하는 웹기반 사용자별 에이전트는 웹을 이용해 정보를 검색하는 사용자들에 대한 사용자 관심도를 사용자의 웹검색 행위를 감시하는 모니터 에이전트에 사용자가 직접 기술하게 하고 이를 별도의 학습서버를 두어 사용자별 프로파일을 만들어 이를 사용자가 확인 및 편집할 수 있게 하였다. 서버에서의 학습 과정은 웹 브라우저를 통하여 수집된 정보를 바탕으로 사용자가 관심을 가지는 웹 문서의 일반적인 내용에 대한 관심 정확도를 높이는 일련의 단어 정제 과정을 통하여 최적의 관심 키워드를 추출하는 작업으로 이루어지며 이는 표현 모델인 사용자 프로파일을 구축하여, 관심 문서를 검색하는데 적절한 정보를 제시하는 것을 목적으로 한다. 이 시스템에서 적용되는 학습 방식은 사용자의 웹 문서 관심도에 의존하므로 웹 문서에 나타나는 텍스트들을 대상으로 C4.5 학습 시스템을 적용한다.

  • PDF

Clustering of Web Document Exploiting with the Co-link in Hypertext (동시링크를 이용한 웹 문서 클러스터링 실험)

  • 김영기;이원희;권혁철
    • Journal of Korean Library and Information Science Society
    • /
    • v.34 no.2
    • /
    • pp.233-253
    • /
    • 2003
  • Knowledge organization is the way we humans understand the world. There are two types of information organization mechanisms studied in information retrieval: namely classification md clustering. Classification organizes entities by pigeonholing them into predefined categories, whereas clustering organizes information by grouping similar or related entities together. The system of the Internet information resources extracts a keyword from the words which appear in the web document and draws up a reverse file. Term clustering based on grouping related terms, however, did not prove overly successful and was mostly abandoned in cases of documents used different languages each other or door-way-pages composed of only an anchor text. This study examines infometric analysis and clustering possibility of web documents based on co-link topology of web pages.

  • PDF