• Title/Summary/Keyword: 내포된 문서

Search Result 55, Processing Time 0.025 seconds

A Change Detection Technique Supporting Nested Blank Nodes of RDF Documents (내포된 공노드를 포함하는 RDF 문서의 변경 탐지 기법)

  • Lee, Dong-Hee;Im, Dong-Hyuk;Kim, Hyoung-Joo
    • Journal of KIISE:Databases
    • /
    • v.34 no.6
    • /
    • pp.518-527
    • /
    • 2007
  • It is an important issue to find out the difference between RDF documents, because RDF documents are changed frequently. When RDF documents contain blank nodes, we need a matching technique for blank nodes in the change detection. Blank nodes have a nested form and they are used in most RDF documents. A RDF document can be modeled as a graph and it will contain many subtrees. We can consider a change detection problem as a minimum cost tree matching problem. In this paper, we propose a change detection technique for RDF documents using the labeling scheme for blank nodes. We also propose a method for improving the efficiency of general triple matching, which used predicate grouping and partitioning. In experiments, we showed that our approach was more accurate and faster than the previous approaches.

A Korean Sentence and Document Sentiment Classification System Using Sentiment Features (감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템)

  • Hwang, Jaw-Won;Ko, Young-Joong
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.3
    • /
    • pp.336-340
    • /
    • 2008
  • Sentiment classification is a recent subdiscipline of text classification, which is concerned not with the topic but with opinion. In this paper, we present a Korean sentence and document classification system using effective sentiment features. Korean sentiment classification starts from constructing effective sentiment feature sets for positive and negative. The synonym information of a English word thesaurus is used to extract effective sentiment features and then the extracted English sentiment features are translated in Korean features by English-Korean dictionary. A sentence or a document is represented by using the extracted sentiment features and is classified and evaluated by SVM(Support Vector Machine).

XML Document Analysis based on Similarity (유사성 기반 XML 문서 분석 기법)

  • Lee, Jung-Won;Lee, Ki-Ho
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.6
    • /
    • pp.367-376
    • /
    • 2002
  • XML allows users to define elements using arbitrary words and organize them in a nested structure. These features of XML offer both challenges and opportunities in information retrieval and document management. In this paper, we propose a new methodology for computing similarity considering XML semantics - meanings of the elements and nested structures of XML documents. We generate extended-element vectors, using thesaurus, to normalize synonyms, compound words, and abbreviations and build similarity matrix using them. And then we compute similarity between XML elements. We also discover and minimize XML structure using automata(NFA(Nondeterministic Finite Automata) and DFA(Deterministic Finite automata). We compute similarity between XML structures using similarity matrix between elements and minimized XML structures. Our methodology considering XML semantics shows 100% accuracy in identifying the category of real documents from on-line bookstore.

Representing and Processing Multimedia and Structured Documents For XML-Based Virtual Documents (XML 기반 가상문서에서의 멀티미디어 및 구조적 문서의 표현과 처리)

  • 박천수;임동수;박종현;강민구;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.246-248
    • /
    • 2000
  • 가상문서는 웹 상에 존재하는 내용 중에서 원하는 부분만을 링크를 이용해 새로운 문서를 생성하는 개념이다. 본 논문에서는 가상문서를 지원하는 디지털 도서관 시스템에서 텍스트, 이미지 데이터뿐 아니라 멀티미디어 데이터와 구조적 의미를 갖는 데이터를 처리 가능하도록 DTD의 표기법을 확장하였다. 또한, 저작도구에서 생성된 내포링크, 참조링크, 총칭링크 등 다양한 의미의 가상무서를 브라우징 가능하도록 문서 변환기에서 멀티미디어와 구조적 문서를 처리하기 위한 방법을 제시하였다.

  • PDF

A New Approach to Active Documents and its Application (능동문서에 대한 새로운 접근법과 그 응용)

  • 남철기;배재학;장길상
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.3_4
    • /
    • pp.347-357
    • /
    • 2003
  • The web is an important source of information and most of Web applications are based on form documents in HTML-based form documents only play a role as user interfaces, and they do not involve the procedures or rules if business process which form document designers assume. However, from documents imply methods for treating documents, and these embedded procedural knowledge can be utilized.actively in automation of business process. In this respect, we Investigate the activeness of documents with cognitive science to automate business processes based on from documents. Through this, we have a new concept and applicability of active documents. Our active documents include business rules and declarative knowledge to support the automation of document processing. Also, we propose a processing framework for the active documents. The framework has two phases: build-time and run-time. in order to demonstrate the usefulness of the proposed framework, a prototype called ActiveForm is designed and implemented for requisition processing them in an inference engine can enhance the intelligence of Internet applications.

시급한 전자문서의 개념통일과 법적효력인정

  • Sin, Dong-Jin
    • 정보화사회
    • /
    • s.100
    • /
    • pp.23-27
    • /
    • 1996
  • 컴퓨터의 발명은 인간의 사회생활을 혁신적으로 변화시켰다. 이러한 변화의 특징은 한마디로 정보화사회 또는 정보사회란 말로 표현되고 있다. 정보사회가 내포하는 의미는 수 없이 다양하지만 그 중에서 인류 문명의 계속적인 발전을 뒷받침해 온 기록방식 또는 문서화 방식의 혁신을 빠뜨릴 수 없다. 전통적으로 인간의 문서활동은 종이 위에 문자를 사용해서 자신의 의사를 표현하였고, 이러한 기록은 문서로 남아 차후 분쟁이 발생할 경우 증거로서의 기능을 발휘하였다.

  • PDF

Text Categorization Based on Terminology and Information Extraction (전문용어 및 정보추출에 기반한 문서분류시스템)

  • Lee, Kyung-Soon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.79-84
    • /
    • 1999
  • 본 연구에서는 문서분류시스템에서 자질의 표현으로 전문분야사전을 이용한 분야정보와 개체정보추출을 통한 개체정보를 이용한다. 또한 지식정보를 보완하기 위해 통계적인 방법으로 범주 전문용어를 인식하여 자질로 표현하는 방법을 제안한다. 문서에 나타난 용어들이 어떤 특정 전문분야에 속하는 용어들이 많이 나타나는 경우 그 문서는 용어들이 속한 분야의 문서일 가능성이 높다. 또한, 정보추출을 통해 용어가 어떠한 개체를 나타내는지를 인식하여 문서를 표현함으로써 문서가 내포하는 의미를 보다 잘 반영할 수 있게 된다. 분야정보나 개체정보를 알 수 없는 용어에 대해서는 학습문서로부터 전문분야를 자동 인식함으로써 문서표현의 지식정보를 보완한다. 전문분야, 개체정보 및 범주전문용어에 기반해서 표현된 문서의 자질에 대해서 지지벡터기계 학습에 기반한 문서분류기틀 이용하여 각 범주에 대해 이진분류를 하였다. 제안된 문서자질표현은 용어기반의 자질표현에 비해 좋은 성능을 보이고 있다.

  • PDF

Document Processing for Browsing XML-Based Virtual Documents (XML 기반 가상문서의 브라우징을 위한 문서 처리)

  • Yang, Jung-Shik;Lim, Dong-Soo;Kang, Ji-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.234-239
    • /
    • 2000
  • XML을 기반으로 하는 가상문서는 인터넷 상의 정보 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한다. 본 논문에서는 가상문서를 지원하는 디지털도서관 시스템에서 XML로 표현된 가상문서를 효과적으로 처리하도록 하는 문서처리기를 설계 구현하였다. 클라이언트의 요청에 따라 문서 처리 시스템은 가상문서를 클라이언트 브라우저에서 볼 수 있는 형태로 변환하여 전달한다. 그러므로 가장 중요한 기능은 내포링크, 참조링크, 총칭링크 등 다양한 의미의 링크들을 포함하는 가상문서를, 변환을 통하여 클라이언트에게 정확하게 전달하는 것이다. 부가적인 기능으로 우리의 디지털도서관 시스템의 다른 구성 요소인 저장 서버, 검색 서버, 링크 서버, 이름 서비스 등을 지원한다.

  • PDF

Connection Scheduling for Improving the Response Time (응답시간 향상을 위한 커넥션 스케줄링 기법)

  • Bang, Ji-Ho;Ha, Rhan
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.33 no.1_2
    • /
    • pp.69-78
    • /
    • 2006
  • The client request scheduling techniques for web server can classified into the scheduling techniques considering a document size to be requested and not. The scheduling techniques considering a document site to be requested provides a better average response time than another As the size-based SRPT(Shortest Remaining Processing Time first) is typical, and the most of scheduling techniques considering a web document size are based on SRPT. Most of existing researches, however, have not considered the feature of HTTP/1.1 which enable the clients to request concurrent multiple inlined-contents in a HTML document via each connection. In this paper we propose a connection scheduling technique with the scheduling window which provides a better response time in HTTP/1.1. The experimental results show that the performance with the proposed approach is improved about $10\%$ more than the connection scheduling with SRPT.

Dynamic Syntax-Directed SGML Document Editor (동적 구문지향 SGML 문서편집기)

  • 강춘길;신경희;유재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.71-73
    • /
    • 2000
  • 본 논문에서 다루는 SGML 문서편집기는 파서를 내포하는 구조로서, 문서편집을 위하여 DTD 가 입력되고, 입력된 DTD 는 DTD 파서에 의해 적합성을 점검하게 된다. DTD 파서는 표준규칙에 따라 DTD를 파싱하고, 결과를 편집처리에 적합한 BNF-스타일 형태로 변환된 문법 테이블을 생성한다. SGML 문서 편집은 문법테이블 정보에 따라 처리된다. 문법 테이블의 크기는 엘리먼트 선언내용 중 컨텐트 모델의 표현에 따라 결정된다. 그 중 and(&) 접속자는 엘리먼트 개수에 따라 문법수가 기하급수적으로 증가하므로 DTD 파서에 의해 처리된다면 속도나 비용면에서 비효율적이다. 이에 본 논문에서는 고정된 문법테이블을 이용하는 SGML 편집기에 and 접속자로 표현된 엘리먼트 문법을 동적으로 확정 처리할 수 있는 기능이 추가 향상된 구문지향적 SGML 문서편집기를 제시한다. 그러므로 향상된 구문지향 SGML 문서편집기는 고정된 문법을 이용한 문서편집 뿐 아니라 편집처리에 따른 변환에 능동적으로 처리할 수 있다는 특징을 갖게된다.

  • PDF