• Title/Summary/Keyword: 문서 구조 분석

Search Result 497, Processing Time 0.024 seconds

Performance Evaluation on Structure-based Retrievals of XML Documents (XML 문서의 구조기반 검색성능 평가)

  • Kim, Su-Hee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.10 no.2
    • /
    • pp.396-406
    • /
    • 2009
  • In extension to our previous study, we develop metadata that specify elements' structural orders, to increase the efficiency level of XML document's retrieval process. Then, we proposed a structure-based indexing model. We expect the model to generate a more efficient retrieval process of horizontally and vertically related elements. To evaluate the model's performance level, we developed an experimental prototype and conducted an experiment on an XML corpus. On average, descendant, ancestor and sibling retrievals were approximately twelve percent faster than the ETID model. And retrievals specifying structural orders of particular element types were approximately twenty-five percent faster than the ETID model. In conclusion, metadata, such as Etype, Asso and Lsso, may make a meaningful contribution to retrieval processes that specify elements' order.

Performance Improvement of Information Retrieval System through Weight Adjustment of Hypertext and Link Structure Analysis (하이퍼 텍스트의 가중치 조절과 링크 구조 분석 기법을 통한 검색 엔진 성능 개선)

  • Lee, Sang-Ho;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.108-112
    • /
    • 2003
  • 웹 문서의 가장 큰 특징 중 하나는 링크 구조이다. 이 링크들을 이용하여 전체 웹 문서를 커다란 하나의 네트워크로 구성할 수 있으며 이러한 네트워크를 분석함으로써 보다 중요한 문서, 보다 유용한 사이트를 찾아낼 수 있다. 전통적인 검색 모델인 벡터 모델의 성능 개선을 위해 이러한 링크 분석 기법을 활용하여 검색 정확도를 향상시키기 위한 방법을 제안한다. 또한 하이퍼 텍스트는 보다 정확한 키워드를 포함할 확률이 높으므로, 이를 가중치 계산에 적용하여 보다 정확한 결과를 산출한다.

  • PDF

Ranking Decision Method of Retrieved Documents Using User Profile from Searching Engine (검색 엔진에서 사용자 프로파일을 이용한 문서 순위결정 방법)

  • Kim Yong-Ho;Kim Hyeong-Gyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.10 no.9
    • /
    • pp.1590-1595
    • /
    • 2006
  • This paper proposes a technique of user oriented document ranking using user refile to provide more satisfied results which reflect preference of specific users. User profile is constructed to represent his or her preference. User pfofile consists of 'term array' and 'preference vector' according to the interest field of one. And the User profile for a particular person is updated by 'user access', 'latent relaeon', 'User Profile' proposed in this paper. The latent structures of documents in same domain are analysed by singular value decomposition(SVD). Then, the rank of documents is determined by comparison of user profile with analyzed document on the basis of relevance.

Paging Mechanism for Efficient XML Document Updates and Retrieval (효율적 XML 문서 변경 및 검색을 위한 페이징 기법)

  • 연제원;이강찬;이규철;나중철;이미영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.99-101
    • /
    • 1999
  • 최근 들어 XML에 대한 연구가 늘어나면서, XML(eXtensible Markup Language)문서에 대한 저장/검색에 대한 다양한 방법들이 제시되고 있다. 특히 XML 문서의 구조적인 특성을 살리면서 문서의 저장 및 변경을 원활하게 지원할 수 있는 방안에 대한 요구가 늘고 있다. 기존의 저장관리 시스템을 위한 저장 모델로는 크게, XML 문서의 빠른 검색을 지원할 수 있는 가상분할모델(Virtual Fragmentation Model)과 문서에 대한 변경을 빠르게 지원해 줄 수 있는 분할모델(Decomposition Model)로 나누어 볼 수 있는데, 본 연구에서는 이 두가지 모델의 장점을 취합하여 문서의 검색 속도는 가상분할모델정도로, 문서의 변경속도는 분할모델정도로 빠르게 지원해 줄 수 있는 페이징(Paging)기법에 대해 설계하였다. 본 페이징 기법은 XML문서뿐만 아니라, HTML(HiperText Markup Language) 문서의 저장관리 시스템에서도 똑같이 적용될 수 있다. 본 연구의 후반부에서는 페이징 기법과 다른 기법에 대한 비교를 통하여 페이징 기법의 성능을 분석하였다.

  • PDF

A Study on Clustering Query-answer Documents with Structural Features (문서구조를 이용한 질의응답문서 클러스터링에 관한 연구)

  • Choi, Sang-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.39 no.4
    • /
    • pp.105-118
    • /
    • 2005
  • As the number of users who ask and give answers in the query-answer documents retrieval system is growing exponentially, the query-answer document become a crucial information resource, as a new type of information retrieval service. A query-answer document Consists of three structural parts : a query, explanation on query, and answers Chosen by users who asked the query. To identify the role of each structural part in representing the topics of documents, the three structural parts were clustered automatically and the results of several clustering tests were compared in this study.

A Method of Object Model based Packet Processing for Interface Control Document Analysis (연동통제문서 분석을 위한 객체 모델 기반의 패킷 처리 방법)

  • Shim, Jun-Yong;Wi, Soung-Hyouk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.636-638
    • /
    • 2014
  • 본 논문은 개발 무기체계의 통합점검 단계에서 각 장비의 교환 데이터 분석을 용이하게 할 수 있는 연동통제문서 기반의 분석 소프트웨어 설계 구조를 기술한다. 특히, XML 형식의 객체 모델을 정의하여 수집된 패킷을 연동 메시지로 객체화하는 방법을 제안한다. 이러한 객체 모델은 메시지 교환 방법에 따라 Object와 Interaction 모델로 구분되며, 연동통제문서의 메시지에 대한 작성 규칙과 표현 형식을 정의하고 있다. 분석 소프트웨어는 객체 모델로 기술된 연동통제문서를 처리하여 실시간으로 연동 데이터를 전시하고, 체계통합점검의 결과 분석에 필요한 정보를 사용자에게 제공한다.

The Effective Structure of XML -based Lecture Contents (효과적인 XML 기반 강의 컨텐츠 구조에 대한 연구)

  • 신행자;박경환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.04a
    • /
    • pp.245-249
    • /
    • 2000
  • 현재 웹 기반 가상 교육 시스템은 가상 강의실에서 학습자들이 볼 수 잇는 강의내용은 HTML 형식의 문서이다. 이는 HTML문서의 한계 때문에 학습자들은 강의 컨텐츠를 읽어 단순히 강의내용을 이해하는 수준으로만 학습이 가능하다. 본 논문에서는 최근 인터넷상에서 표준 공통포맷으로 대두되고 있는 XML을 이용하여 게시될 강의내용을 구조화하여 효율적인 학습이 가능하도록 XML기반의 강의 컨텐츠 구조를 제안하였다. XML기반의 강의 컨텐츠는 학습자들의 요구에 따른 유연성을 제공할 뿐만아니라 내용을 기반으로 한 분석이 가능하여 데이터 중심의 구조화가 가능하므로 처리 응용에도 의미정보로 저장하여 다양하고 효과적인 가상 강의실을 지원할 수 있는 가상교육시스템구축이 가능하다.

  • PDF

Document Interchange System in Community Information Service Computer Network (종합정보서비스 전산망에서의 문서유통시스템)

  • Kim, Y.H.;Nam, S.W.;Kim, H.K.
    • Electronics and Telecommunications Trends
    • /
    • v.9 no.2
    • /
    • pp.23-35
    • /
    • 1994
  • 본 고에서는 체신부의 종합정보서비스 전산망에서 운영될 수 있는 문서유통시스템을 설계하였다. 체신부 문서유통시스템은 체신부의 우체국(주사국, 감독우체국, 체신청, 본부)에서 처리되는 각종 정기보고 문서와 지시문서, 공용문서, 서식관리등을 처리하는 시스템으로, 워드프로세서, 스프레드시트 등의 PC 응용과 전자우편시스템, 관계형 데이터베이스 시스템이 접목되도록 설계되었다. 따라서 본 문서유통시스템 S/W는 데이터베이스 관리블록, 전자우편 블록, 집계 블록, 자료관리 블록, 사용자 인터페이스 블록과 시스템 소프트웨어 및 유틸리티 등으로 구성된다. 체신부의 종합정보서비스전산망은 주컴퓨터인 TICOM-II, 서버로서 체신청과 감독우체국별로 설치된 PC486, 주사국 및 감독국에 설치된 업무용 PC들로 이루어져 있다. 본 시스템의 처리방식은 이러한 컴퓨터 구조에서 효율적으로 처리될 수 있도록 문서생성은 PC에서, 문서유통은 각 서버에서, 데이터베이스 관리는 주컴퓨터에서 수행되도록 지역분산처리 방식으로 설계되었다.

A Research of Anomaly Detection Method in MS Office Document (MS 오피스 문서 파일 내 비정상 요소 탐지 기법 연구)

  • Cho, Sung Hye;Lee, Sang Jin
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.6 no.2
    • /
    • pp.87-94
    • /
    • 2017
  • Microsoft Office is an office suite of applications developed by Microsoft. Recently users with malicious intent customize Office files as a container of the Malware because MS Office is most commonly used word processing program. To attack target system, many of malicious office files using a variety of skills and techniques like macro function, hiding shell code inside unused area, etc. And, people usually use two techniques to detect these kinds of malware. These are Signature-based detection and Sandbox. However, there is some limits to what it can afford because of the increasing complexity of malwares. Therefore, this paper propose methods to detect malicious MS office files in Computer forensics' way. We checked Macros and potential problem area with structural analysis of the MS Office file for this purpose.

The Study of Storing and Query Pattern for OWL Documents (OWL 문서의 저장과 질의 형태에 관한 연구)

  • 고명석;김연희;김병곤;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.244-246
    • /
    • 2004
  • 차세대 웹 환경을 위한 시맨틱 웹에 대한 관심이 날로 증대되고 있다. 이와 더불어 시맨틱 웹에서 자원의 의미적인 관계를 표현하기 위한 언어들에 대한 연구가 활발히 진행중이다. 특히 이러한 연구의 시작점으로 RDF, DAML+OIL 같은 여러 온톨로지 언어들이 등장하였지만 자원의 특성에 대한 기술이나 그들간의 관계에 대한 정의를 명확하게 표현하기에는 미흡한 점이 많다. 그러나 최근에 제안된 OWL은 RDF나 RDF 스키마를 확장하여 보다 의미 있는 자원의 관계를 정의할 수 있다. 본 논문에서는 OWL로 표현된 문서를 저장하기 위한 구조를 관계형 데이터베이스를 기반으로 제안한다. 본 논문에서 제안한 저장 구조는 기존의 RDF와 RDF 스키마를 위한 저장 구조를 확장하여, OWL을 통해 제공되는 클래스나 속성간의 동일성, 또는 이질성, 여러 클래스의 집합 관계 등의 추가적 기능을 지원하는데 목적을 두고 있다. 또한 제안한 저장구조를 이용한 OWL 문서의 질의 형태를 분석하고 이를 기존 RQL을 이용하여 표현하기 위해 OWL의 특성을 반영하도록 RQL을 확장했다.

  • PDF