• 제목/요약/키워드: Documents Generation

검색결과 155건 처리시간 0.027초

웹에서 SMIL 기반 멀티미디어 문서의 동적 생성 (Dynamic Generation of SMIL based Multimedia Documents on the Web)

  • 김경덕
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.439-445
    • /
    • 2001
  • 본 논문에서는 SMIL 기반 멀티미디어 문서를 웹에서 동적으로 생성하는 방법을 제안한다. 생성되는 멀티미디어 문서는 W3C에서 권장하는 SMIL(Synchronized Multimedia Integration Language)을 사용한다. 제안한 방법은 사용자 프로파일에 따라 자동적으로 XSLT 문서를 생성한 후, 미리 작성된 XML 문서와 결합하여 SMIL 문서를 실시간으로 생성한다. 기존 대부분의 웹 문서가 HTML에 기반함으로써 재사용성 및 문서에 포함되는 객체들의 동기적 관계의 지원이 어렵지만, 제안된 방법은 XML에 기반함으로써 재사용성을 지원하고 SMIL에 기반한 다양한 멀티미디어 문서를 효율적으로 생성한다. 적용한 예로서, 원격 강의에서 학습자에 따라 문서 생성 시스템을 보였으며, 응용 분야로는 전자 상거래, 원격 강의, 웹기반 멀티미디어 문서 편집 등이다.

  • PDF

단문화와 변환 규칙을 이용한 온톨로지의 자동 생성 (Automatic Generation of Ontology with Simplified Sentences and Transfer Rules)

  • 박인철
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1092-1097
    • /
    • 2007
  • 온톨로지의 구축은 상당한 시간과 비용을 소모하기 때문에 상업적인 시맨틱 웹의 구축은 매우 어려운 작업이다. 이러한 문제의 해결 방법은 온톨로지를 자동적으로 구축하는 것이다. 본 논문에서는 대부분의 중요한 정보를 포함하고 있는 웹 문서를 분석하여 온톨로지를 자동으로 생성하는 시스템을 제안한다. 제안하는 시스템은 한국어 문장을 분석하여 문서 내 모든 문장을 단문으로 재구성하는 단문화 과정과 변환 규칙을 이용한 온톨로지 자동 생성 과정의 두 단계로 구성된다. 이러한 시스템은 온라인 쇼핑몰처럼 비슷한 내용을 포함하는 문서가 대다수 존재하고, 문서의 갱신 및 추가가 빈번한 응용 분야에서 매우 유용하게 사용될 수 있다.

  • PDF

지식분석도를 이용한 지식기반 웹 사이트 자동 생성 도구의 개발 (Development of an Automatic Generation and Management Tool for Web-based Inference Sites)

  • 송용욱;김우주;홍준석
    • Asia pacific journal of information systems
    • /
    • 제13권1호
    • /
    • pp.213-230
    • /
    • 2003
  • Most of existing expert systems developed for Web use CGI-based techniques and this frequently makes them suffer from the overburden of commercial Web servers, which deal with large-scale services. However, since HTML-based inference technique represents expert's knowledge by hyperlinks among HTML documents, the hypertext function of the Web can perform the inference efficiently in terms of time and space without the help of additional inference engines. In spite of such benefits, when the expert's knowledge is relatively large and/or complicated, the HTML-based inference technique has usually become to have a hard time of dealing with a lot of HTML documents because generation and management tasks of the numerous HTML documents would cause big trouble to the knowledge engineer. To resolve this problem, we developed an automatic generation and management tool for Web-based inference sites, called WeBIS. With this tool, a knowledge engineer can input and edit expert's knowledge using Expert's Diagram on the GUI(Graphical User Interface) environment and automatically generate hyper-linked HTML documents for Web-based inference from the Expert's Diagram.

폼에 기반한 HTML 문서 생성 방법 (A Method of Form-Based HTML Documents Generation)

  • 최준용;김병기
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.292-298
    • /
    • 1999
  • An information structure of large size hypermedia application is usually hierarchical, and the sibling nodes in this structure have same or similar tags and contents. a word "개그" that means the common set of sibling nodes in the hierarchical information structure is used in this paper. It proposes a design method that divides form and content from nodes and it proposes HTML page generation algorithm from forms and contents. This method has reusability of form, maintainability of documents and reduction of cost for authoring.

  • PDF

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성 (Semi-Automatic Ontology Generation about XML Documents using Data Mining Method)

  • 구미숙;황정희;류근호;홍장의
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.299-308
    • /
    • 2006
  • 최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

차세대 웹에서 온톨로지 기술을 통한 지식체계 적용 (Application of knowledge system through Ontology Technology in Next Generation Web)

  • 김민철
    • 기술혁신학회지
    • /
    • 제8권2호
    • /
    • pp.605-622
    • /
    • 2005
  • Because, next generation web, semantic web consists of documents with semantic information, it enables computer interpret the contents of the documents, so that the information retrieval, interpretation and integration can be automated. The web documents with the semantic information may be made in ontology. In this paper, collaborative approach among the ontology design techniques is more excellent than the other techniques because it design the ontology through continuous evaluations and modification in terms of multiple views. So, we propose the process of designing and implementing the ontology for specific domain, which is Yeomigi tour place. Delphi technique, that is a kind of collaborative approach, is used when the ontology is designed.

  • PDF

XML DTD 기반의 구문지향 문서 작성기 (Syntax-Directed Document Editor based XML DTD)

  • 김영철;김성근;최종명
    • 컴퓨터교육학회논문지
    • /
    • 제7권4호
    • /
    • pp.67-75
    • /
    • 2004
  • XML은 문서의 정적인 요소나 확장성을 해결할 수 있는 차세대 웹 문서 표준 언어이다. 그러나 XML 구조의 복잡성과 문법의 제약 때문에 일반 사용자는 잘 설계된 (Well-formed) 문서나 유효한 (valid) 문서를 만들기가 어렵다는 문제를 가지고 있다. 본 논문에서는 XML 구문지향 문서 작성기를 설계하고 구현한다. XML 구문지향 문서 작성기는 편집기에 제시되는 구문에 따라 쉽게 문서를 작성할 수 있으며, 작성된 문서는 모두 유효하다(valid) 는 특정을 가지고 있다. 본 편집기는 XML 초보자에게 도움을 줄 수 있으며, XML 문서를 작성하는데 높은 생산성을 줄 것이다.

  • PDF

Document Classification Model Using Web Documents for Balancing Training Corpus Size per Category

  • Park, So-Young;Chang, Juno;Kihl, Taesuk
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.268-273
    • /
    • 2013
  • In this paper, we propose a document classification model using Web documents as a part of the training corpus in order to resolve the imbalance of the training corpus size per category. For the purpose of retrieving the Web documents closely related to each category, the proposed document classification model calculates the matching score between word features and each category, and generates a Web search query by combining the higher-ranked word features and the category title. Then, the proposed document classification model sends each combined query to the open application programming interface of the Web search engine, and receives the snippet results retrieved from the Web search engine. Finally, the proposed document classification model adds these snippet results as Web documents to the training corpus. Experimental results show that the method that considers the balance of the training corpus size per category exhibits better performance in some categories with small training sets.

주의집중 및 복사 작용을 가진 Sequence-to-Sequence 순환신경망을 이용한 제목 생성 모델 (Title Generation Model for which Sequence-to-Sequence RNNs with Attention and Copying Mechanisms are used)

  • 이현구;김학수
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.674-679
    • /
    • 2017
  • 대용량의 텍스트 문서가 매일 만들어지는 빅데이터 환경에서 제목은 문서의 핵심 아이디어를 빠르게 집어내는데 매우 중요한 단서가 된다. 그러나 블로그 기사나 소셜 미디어 메시지와 같은 많은 종류의 문서들은 제목을 갖고 있지 않다. 본 논문에서는 주의집중 및 복사 작용을 가진 sequence-to-sequence 순환신경망을 사용한 제목 생성 모델을 제안한다. 제안 모델은 양방향 GRU(Gated Recurrent Unit) 네트워크에 기반 하여 입력 문장을 인코딩(encoding)하고, 입력 문장에서 자동 선별된 키워드와 함께 인코딩된 문장을 디코딩함으로써 제목 단어들을 생성한다. 93,631문서의 학습 데이터와 500문서의 평가 데이터를 가진 실험에서 주의집중 작용방법이 복사 작용방법보다 높은 어휘 일치율(ROUGE-1: 0.1935, ROUGE-2: 0.0364, ROUGE-L: 0.1555)을 보였고 사람이 정성평가한 지표는 복사 작용방법이 높은 성능을 보였다.

Semi Automatic Ontology Generation about XML Documents

  • Gu Mi Sug;Hwang Jeong Hee;Ryu Keun Ho;Jung Doo Yeong;Lee Keum Woo
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.730-733
    • /
    • 2004
  • Recently XML (eXtensible Markup Language) is becoming the standard for exchanging the documents on the web. And as the amount of information is increasing because of the development of the technique in the Internet, semantic web is becoming to appear for more exact result of information retrieval than the existing one on the web. Ontology which is the basis of the semantic web provides the basic knowledge system to express a particular knowledge. So it can show the exact result of the information retrieval. Ontology defines the particular concepts and the relationships between the concepts about specific domain and it has the hierarchy similar to the taxonomy. In this paper, we propose the generation of semi-automatic ontology based on XML documents that are interesting to many researchers as the means of knowledge expression. To construct the ontology in a particular domain, we suggest the algorithm to determine the domain. So we determined that the domain of ontology is to extract the information of movie on the web. And we used the generalized association rules, one of data mining methods, to generate the ontology, using the tag and contents of XML documents. And XTM (XML Topic Maps), ISO Standard, is used to construct the ontology as an ontology language. The advantage of this method is that because we construct the ontology based on the terms frequently used documents related in the domain, it is useful to query and retrieve the related domain.

  • PDF