• 제목/요약/키워드: 동적 문서

검색결과 228건 처리시간 0.024초

웹 문서 형식과 클러스터 내의 문서 유사도를 이용한 동적 추천 시스템 (Dynamic Recommendation System Using Web Document Type and Document Similarity in Cluster)

  • 김진수;김태용;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2001
  • 기존의 여러 동적 추천 시스템에서 사용자들의 브라우징 패턴을 반영하려고 노력하였다 .그러나 대부분의 동적 추천 시스템들은 웹 문서들의 형식이나 웹 문서들 간의 연관성을 고려하지 않고, 사용자들의 브라우징 패턴에만 근거하기 때문에 연관성이 없거나 의미 없는 웹 문서들에 대한 추천까지 제공하는 문제점을 지니고 있다. 본 논문에서는 웹 문서들 사이의 유사도와 로그 파일 안에 들어있는 사용자들이 패턴을 이용하여 웹 문서 자체의 형식에 따라 연관된 웹 문서뿐만 아니라 순차적인 특성을 가진 웹 문서를 추천 문서로 제공한다. 이때 추천 웹 문서의 형식이 탐색 페이지이면 사용자 브라우징 순차 패턴 DB 중에서 사용자들이 자주 항해하는 순차적인 특성을 갖는 웹 문서까지 제공하는 동적 추천 시스템을 제안한다.

  • PDF

웹 기반의 Ad Hoc 리포팅을 위한 Fat Client를 갖는 리포팅 툴 (Reporting Tool using Fat Client for Web-based Ad Hoc Reporting)

  • 최지웅;김명호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제12권4호
    • /
    • pp.264-274
    • /
    • 2006
  • 최근 들어 기업을 포함한 각 조직에서는 그들이 그 동안 축적한 데이타를 의미 있는 정보로써 활용하기 위해 데이타의 자유로운 포맷팅이 가능한 리포팅 툴을 의사 결정을 위한 데이타 분석 툴로서 확대 사용하고자 하는 요구가 증가하고 있다. 기존에는 하나의 동적 문서에 대해서 다수의 조회자가 발생하는 성격의 동적 문서들을 생성 및 배포하기 위하여 리포팅 툴을 사용해 왔다. 이러한 용도에 적합하도록 기존의 리포팅 툴은 서버 측에서 동적 문서의 생성을 담당하는 구조를 취하고 있다. 또한 서버 프로그램은 동적 문서의 미리 생성, 정기적 갱신 등을 담당하는 스케줄러와 반복된 생성을 피하기 위한 캐쉬 기능을 통하여 효율적 운영을 꾀하고 있다. 그러나 데이타 분석 용도의 동적 문서의 생성은 다수의 조회자를 고려한 동적 문서의 생성이 아니며 사용자가 다양한 값의 파라미터를 입력하는 방식으로 짧은 시간 간격으로 반복적인 동적 문서의 즉시 생성을 요구하는 특정이 있다. 이와 같이 리포팅 툴의 사용 범위 확대는 기존 리포팅 툴의 서버 측에 처리 부하를 증가시키고 있다. 본 논문에서는 제한된 리소스 환경에서도 대량의 데이타를 가공하여 동적 문서를 생성할 수 있는 리포트 뷰어를 통해 배포 목적이 아닌 데이타 분석 목적의 동적 문서의 경우 클라이언트 측에서 생성하도록 하여 서버의 부하를 분산시키고자 한다.

XML 문서의 변경을 고려한 XML 전문 검색 역인덱스 (Update conscious and depth insensitive inverted indexes for XML full-text queries)

  • 권국봉;홍동권;김권양
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.81-84
    • /
    • 2004
  • XML 문서는 관계형 테이블과는 달리 문서의 구조가 매우 복잡하고 불규칙하여 부분적인 정보를 최대한 활용하는 전문 검색이 일반적인 구조적 검색보다 더 중요한 역할을 한다. XML 문서는 계층이 있으므로 계층을 사용하는 전문 검색 연산은 계층을 제공함으로써 검색 공간을 줄여서 검색의 정확성과 효율성을 훨씬 더 높일 수 있다. 전문 검색 연산을 효과적으로 지원하기 위한 방법으로는 역인덱스를 (inverted index) 사용하는 것이 가장 일반적인 방법이다. 지금까지의 전문 검색을 위한 XML 문서의 구조 정보를 표현, 저장하는 방법들은 문서의 내용이 변경되지 않는 정적 문서(static documents)만을 고려하여 왔다. 이 방법들은 문서가 동적으로 변화할 경우 저장된 문서의 구조 정보 중에서 많은 부분을 다시 표현해야 하는 비효율적인 면이 있다. 본 논문은 XML 문서의 동적인 변화를 지원하면서 동시에 복잡한 XML 전문 검색을 지원하기 위한 방법으로 경로 스트링을 사용하는 효율적인 역 인덱스 구축 기법을 제안하고 제안하는 방법이 복잡한 문서의 검색과 문서의 동적인 변화를 효율적으로 검색할 수 있음을 보인다.

  • PDF

연관 웹 문서 분류와 사용자 브라우징 패턴을 이용한 동적 링킹 시스템 (Dynamic Linking System Using Related Web Documents Classification and Users' Browsing Patterns)

  • 박영규;김진수;김태용;이정현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.305-308
    • /
    • 2000
  • 웹사이트 설계자의 주관적 판단에 의한 정적 하이퍼텍스트 링킹은 모든 사용자들에게 동일한 링크를 제공한다는 단점을 가지고 있다. 이러한 문제점을 개선하고, 각 사용자들의 브라우징 패턴에 적합한 웹 문서들을 동적 링크로 제공해주기 위한 여러 동적 링킹 시스템들이 제안되었다. 그러나 대부분의 동적 링킹 시스템들은 사용자의 현재 브라우징 패턴과 가장 유사한 패턴 정보만을 이용해 동적 링크를 제공하기 때문에 연관성이 없는 웹 문서들에 대한 링크를 수시로 제공한다는 또 다른 문제를 지니고 있다. 본 논문에서는 데이터 마이닝의 한 응용 분야인 웹 마이닝 기법을 이용하여 웹 서버의 로그파일로부터 사용자들의 브라우징 패턴을 분석해내고, 다차원 데이터 집합에 적합한 Association Rule Hypergraph Partitioning(ARHP) 알고리즘을 이용하여 서로 연관성이 있는 웹 문서들을 분류한다. 사용자 브라우징 패턴 정보로부터 사용자에게 추천해줄 1차 링크 집합을 생성하고, 연관 웹 문서 정보를 이용하여 2차 링크 집합을 생성한다. 그리고 두 링크 집합에 공통으로 포함된 링크 집합만을 사용자에게 동적으로 추천해줌으로써 사용자가 보다 편리하고 정확하게 웹사이트를 브라우징 할 수 있도록 하는 동적 링킹 시스템을 제안한다.

  • PDF

문서의 동적 삽입 삭제를 위한 STEER 역파일 구조 (STEER Inverted File Structure for Dynamic Document Insertion/Deletion)

  • 김남일;박영찬;주종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.174-176
    • /
    • 1998
  • 역파일 구조(inverted file structure)는 검색 속도가 빠르기 때문에 정보검색 시스템의 색인정보 하부 저장구조로 널리 이용되지만 문서의 동적 삭제는 어려운 형태이다. 본 논문에서는 기존역파일 구조에 문서마다 색인어의 포스팅 레코드를 기록한 목록을 유지함으로써 문서의 동적 삭제가 용이하고, 위치정보를 포스팅 레코드에서 분리하여 위치 검색이 효율적인 역파일 구조를 설계한다. 설계된 역파일 구조는 STEER(Structured Entity Element Retrieval) 정보검색 시스템에서 구현되었다.

  • PDF

XML-RPC 기반의 분산 환경 문서 관리 시스템 모델 (DEDMS : Distributed Environment Document Management System Model based on the XML-RPC)

  • 고혁준;김정희;곽호영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.641-643
    • /
    • 2003
  • 웹 서버에서 제공하는 문서 자원들은 URL/URI 형식으로 표현되고 있지만, 동적인 서버 환경의 변화로 인해 반드시 해당 자원이 서버에 존재하고 있는 것을 보장할 수 없다. 따라서 본 논문에서는 자원에 대한 신뢰성을 보장하고, 동적인 서버 자원 관리 및 클라이언트의 요청을 처리하는 XML-RPC를 이용한 통합 문서 관리 시스템을 제안하고 모델링 한다. 제안한 시스템은 동적인 서버 자원을 관리하는 미들웨어 시스템과 클라이언트가 서버에 저장시킨 문서에 대한 갱신 정보를 미들웨어 시스템으로 통보하는 서버 시스템으로 구성된다. 모델링 결과, 분산된 서버에 있는 동적으로 변하는 문서들을 효과적으로 저장 관리할 수 있었으며, 현재 운영되고 있는 웹 서버에 적용시킬 수 있어 새로운 웹 서버 구축비용을 절감할 수 있고, XML-RPC 프로토콜을 사용하기 때문에 플랫폼 독립적이면서 데이터 관리가 효율적임을 알 수 있었다.

  • PDF

구조화 문서에서 점진적 갱신을 위한 인텍싱 기법 (An Indexing Scheme for Incremental Updating in Structured Document)

  • 김성완;김선경;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.190-192
    • /
    • 2002
  • 구조와 문서(structured document)에 대만 효율적인 처리를 위해서는 문서의 임의 엘리먼트에 빠르고 직접적인 접근을 지원하는 인덱싱 기법이 필요하다 이를 위한 기존의 연구들에서는 전통적인 정보 검색 분야에서 사용되는 역 리스트나 시그너쳐 파일을 응용한 기법들이 제안되었다. 그러나 기존의 연구들은 정적인 환경에 적합한 인덱스 구조로써, 문서에 대한 동적인 변경이 있을 경우 인덱스론 전체적으로 재구성해야 하는 부담이 있다. 본 논문에서는 역 리스트를 기반으로 문서에 대만 구조 변경과 내용 변경 등 동적인 변경에 대해 점진적 갱신을 지원하는 인덱스 구조를 설계하였다.

  • PDF

XML 문서의 다양한 구조 검색을 위한 효율적인 동적 색인 모델 (An Efficient Dynamic Indexing Model for Various Structure Retrievals of XML Documents)

  • 신승호;손충범;강형일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.48-60
    • /
    • 2004
  • 정보 표현의 기본 단위인 엘리먼트로 구성되는 XML 문서 내에서 동적으로 구조 변경이 이루어진다. 이때 XML 문서의 구조변경은 빠른 검색을 위해 기존의 색인 구조 정보의 변경 없이 효율적으로 처리되어야 한다. 이를 위해 본 논문에서는 XML 문서의 구조 변경 시 기존의 색인 구조에 효율적으로 수용될 수 있는 동적 색인 모델을 제안한다. 제안하는 동적 색인 모델은 다양한 구조 검색을 지원하기 위한 구조 정보 표현 방법과 효율적인 구조 검색을 지원하기 위한 동적 색인 구조로 구성된다. 제안하는 색인 기법이 기존의 동적 색인을 지원하는 기법보다 내용 색인, 구조 색인, 애트리뷰트 색인 측면에서 우수함을 성능 평가를 통해 보인다.

동적인 문서 여과에서 나이브 베이즈 분류기와 코사인 유사 계수의 성능 비교 (Comparative Between Naive Bayes Classifier and Cosine Similarity Coefficient in Dynamic Document Filtering)

  • 손기준;임수연;박성배;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2006
  • 온라인 정보가 증가함에 따라 많은 양의 정보 중에서 사용자가 원하는 정보를 정확하고 신속하게 찾아 주는 문서 여과의 중요성 또한 증가하고 있는 추세이다. 본 논문은 문서 여과 문제를 이진 문서 분류 문제로 보고, 나이브 베이즈 분류기를 동적인 문서 여과 목적으로 사용하였다. 이때 사용자가 자신의 관심 분야에 해당하는 주제를 제대로 여과 받기 위해서 학습 대상으로 삼아야 할 학습문서의 범위와 관련성 있는 문서를 제대로 여과 받기 위해서 체크해야 하는 관련성 표기 비율에 따른 분류기의 성능에 대하여 실험을 하였다. 코사인 유사계수를 이용한 여과 방법과의 성능도 비교 실험하였다. 실험 결과 나이브 베이즈 이진 분류기는 문서집합의 크기가 일정한 정도일 때 관련성 있는 문서가 모두 표기되지 않더라도 여과에는 큰 영향을 미치지 않음을 볼 수 있었다.

  • PDF

동적 XML 문서에서 효과적인 레이블링을 위해 형제순서 값을 갖는 프라임 넘버링 기법 (A Prime Numbering Scheme with Sibling-Order Value for Efficient Labeling in Dynamic XML Documents)

  • 이강우;이준동
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.65-72
    • /
    • 2007
  • 동적인 XML 문서에서 빈번히 발생하는 갱신에 대한 고려를 하지 않는 레이블링 기법들은 XML 문서 트리의 갱신이 일어날 때 마다 변화된 레이블 정보를 반영하기 위해서 전체 XML 트리를 재탐색하여 전체 노드의 레이블을 다시 계산하는 리레이블링(relabeling)과정이 필요하다. 이러한 리레이블링은 갱신이 빈번히 일어나는 동적인 XML 문서에서는 비용이 상당히 크다는 단점이 있다. 이런 단점을 해결하기 위해 리레이블링 과정이 필요 없는 레이블링 기법으로 프라임 넘버 레이블링 기법(prime number labeling scheme)이 제안되었다. 그러나 프라임 넘버 레이블링 기법은 문서가 갱신될 때 XML 문서 트리의 노드 간 형제순서(sibling order)를 갱신하는 문제는 고려하지 않고 있다. 이러한 형제순서의 갱신과정은 XML 문서 트리의 많은 부분을 재탐색하고 재기록 하여야 하므로 많은 비용이 필요하게 된다. 따라서 본 논문에서는 XML 문서 트리의 재탐색과 재기록이 필요 없이 형제순서를 유지할 수 있는 형제순서 값을 갖는 프라임 넘버 레이블링 기법을 제안한다.

  • PDF