• 제목/요약/키워드: Automatic Document Generation

검색결과 50건 처리시간 0.025초

사용자 인터페이스 에이전트를 통한 정보추출 규칙의 자동 생성 (Automatic Generation of Information Extraction Rules Through User-interface Agents)

  • 김용기;양재영;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.447-456
    • /
    • 2004
  • 정보추출은 한 문서에서 그 문서의 중심적 의미를 나타내는 특정 구성요소를 인식하여 추출하는 작업으로서, 이질적인 여러 정보소스로부터 균일화된 정보추출을 수행하기 위해서는 각 정보소스에 맞는 정보추출 규칙을 생성해야 한다. 기존 정보추출 규칙의 생성 방법에는 전문가에 의한 수동 생성 방법과 에이전트 프로그램에 의한 자동 생성 방법이 있는데, 수동 생성은 규칙의 정확성은 보장되나 확장성과 효율성에 문제가 있고, 자동 생성은 확장성은 있으나 규칙 생성 자체의 어려움과 생성된 규칙의 신뢰성이 문제점으로 대두된다. 본 논문에서는 이러한 두 가지 방법의 문제점을 보완하여 추출 규칙의 정확성과 확장성을 동시에 제공하기 위해 지도 학습(supervised teaming)을 적용한 정보추출 규칙 생성 기법을 제안한다. 본 논문에서 제시하는 방법은 사용자 인터페이스 에이전트를 사용하여 정보추출 규칙 생성을 위한 단서 정보를 사용자로부터 받고 이 정보를 바탕으로 에이전트가 XML로 표현된 규칙을 생성하는 것이다. 결과적으로 정보추출 규칙의 수동 생성과 자동 생성을 혼합한 형태가 된다. 사용자 인터페이스 에이전트는 규칙의 생성 뿐 아니라 기존의 규칙을 수정하거나 확장하는데도 이용된다. 구인 광고와 논문모집 공고와 관련된 정보소스에 대해 이 방법을 테스트한 결과 다른 기법에서 추출하지 못했던 정보를 추출할 수 있었고, 성능 면에서도 80% 이상의 정확도와 재현 율을 보였다. 본 시스템은 추후 정보 중재자 에이전트와 같은 응용 분야에 적용시킬 수 있을 것으로 기대한다.

CAD 뷰어 기반 대화형 3D PDF 문서 생성 자동화 (Automatic Generation of Interactive 3D PDF Document in a 3D Viewer Environment)

  • 박경호;최영;양상욱;송인호
    • 한국정밀공학회지
    • /
    • 제25권4호
    • /
    • pp.77-85
    • /
    • 2008
  • PDF is widely accepted as a standard document format and now it supports 3D contents as well. Within the engineering application areas, this new 3D feature may be used to support sharing of 3D documents and thus collaboration between engineering departments, suppliers and partners. In this paper, we describe a system that automatically generates formatted engineering documents including 3D data converted from 3D applications such as commercial 3D CAD viewer. The system consists of two major modules. One is U3D conversion module and the other is PDF conversion module. U3D conversion module extracts geometry, view data, assembly and disassembly information from 3D viewer and converts to U3D format, currently in IDTF text file format. PDF conversion module generates a PDF file and inserts U3D data, various annotation information, and scripts for custom generated operations such as assembly and disassembly in the PDF document.

메타모델 기반 요구사항 명세 기법인 의사 결정표를 통한 자동 테스트 케이스 생성 메커니즘 (Automatic Test case Generation Mechanism from the Decision Table of Requirement Specification Techniques based on Metamodel)

  • 손현승
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.228-234
    • /
    • 2023
  • 고품질 소프트웨어의 요구 증가로 국제표준, 산업 기능안전(IEC 61508), 자동차(ISO 26262), 무기체계 내장형 소프트웨어 지침 등 품질 인증 요구가 많다. 스타트 업, 벤처, 중소 업체들은 비용 및 인력 측면에서 체계적인 품질 획득이 어려움이 있다. 그들 업체에게 자동 테스트 케이스 생성은 비용, 시간, 인력 문제에도 소프트웨어 품질을 향상할 수 있는 해법으로 제시 될 수 있다. 이를 위해, 시스템 및 소프트웨어 설계 검증이 가능한 "의사 결정표" 기반 테스트 케이스 자동화를 제안한다. 이는 OMG의 표준 기법인 메타모델과 모델 변환 기법을 사용해 각각 의사 결정표(Model)와 테스트 케이스(Text)의 메타모델 설계 및 모델변환을 정의한다. 즉 의사 결정표 입력으로 테스트 케이스 발생 자동화이다. 이를 통해 MC/DC 커버리지등도 쉽게 적용 가능하다.

RNN과 강화 학습을 이용한 자동 문서 제목 생성 (Automatic Document Title Generation with RNN and Reinforcement Learning)

  • 조성민;김우생
    • Journal of Information Technology Applications and Management
    • /
    • 제27권1호
    • /
    • pp.49-58
    • /
    • 2020
  • Lately, a large amount of textual data have been poured out of the Internet and the technology to refine them is needed. Most of these data are long text and often have no title. Therefore, in this paper, we propose a technique to combine the sequence-to-sequence model of RNN and the REINFORCE algorithm to generate the title of the long text automatically. In addition, the TextRank algorithm was applied to extract a summarized text to minimize information loss in order to protect the shortcomings of the sequence-to-sequence model in which an information is lost when long texts are used. Through the experiment, the techniques proposed in this study are shown to be superior to the existing ones.

Improving Abstractive Summarization by Training Masked Out-of-Vocabulary Words

  • Lee, Tae-Seok;Lee, Hyun-Young;Kang, Seung-Shik
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.344-358
    • /
    • 2022
  • Text summarization is the task of producing a shorter version of a long document while accurately preserving the main contents of the original text. Abstractive summarization generates novel words and phrases using a language generation method through text transformation and prior-embedded word information. However, newly coined words or out-of-vocabulary words decrease the performance of automatic summarization because they are not pre-trained in the machine learning process. In this study, we demonstrated an improvement in summarization quality through the contextualized embedding of BERT with out-of-vocabulary masking. In addition, explicitly providing precise pointing and an optional copy instruction along with BERT embedding, we achieved an increased accuracy than the baseline model. The recall-based word-generation metric ROUGE-1 score was 55.11 and the word-order-based ROUGE-L score was 39.65.

코드 자동 생성을 위한 XML 기반의 효율적인 디자인패턴 구조 (An Efficient Design Pattern Framework for Automatic Code Generation based on XML)

  • 김운용;김영철;주복규;최영근
    • 정보처리학회논문지D
    • /
    • 제8D권6호
    • /
    • pp.753-760
    • /
    • 2001
  • 디자인패턴은 어플리케이션 개발 시에 고려된 문제들로부터 독립적이며 확장성과 유지보수성에 대한 문제를 해결하기 위한 디자인 지식이며 현재 광범위하게 이용되고있는 분야이다. 그러나 이러한 광범위한 디자인패턴의 활용에도 불구하고 디자인 패턴에 명세와 활용은 주로 개발자의 수작업에 의존하고 있다. 그 결과 일관된 형태의 분석과 활용이 어렵고 오류 발생 빈도를 높일 뿐 아니라 프로그램 개발에 많은 시간을 필요로 한다. 따라서 이러한 문제를 해결하기 위해 본 논문에서는 디자인 패턴을 구조화하기 위해 XML을 사용한 표현방법, 이를 이용한 디자인 패턴 활용시스템 구조를 제시한다. 또한 이러한 표기법과 활용구조를 통해 소스코드 자동생성 지원 시스템을 제시하고 적용 예를 보이고자한다. XML을 이용한 구조화된 문서활용은 소스코드 생성시 사용자들에게 더 작은 코드를 작성하게 만들고, 더 안정된 시스템을 구축할 수 있게 한다.

  • PDF

기술문서 작성을 위한 3 차원 CAD 데이터의 도해저작 알고리즘 (Automatic Generation of Explanatory 2D Vector Drawing from 3D CAD Data for Technical Documents)

  • 심현수;양상욱;최영;조성욱
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2005년도 춘계학술대회 논문집
    • /
    • pp.177-180
    • /
    • 2005
  • Three dimensional shaded images are standard visualization method for CAD models on the computer screen. Therefore, much of the effort in the visualization of CAD models has been focused on how conveniently and realistically CAD models can be displayed on the screen. However, shaded 3D CAD data images captured from the screen may not be suitable for some application areas. Technical document, either in the paper or electronic form, can more clearly describe the shape and annotate parts of the model by using projected 2D line drawing format viewed from a user defined view direction. This paper describes an efficient method for generating such a 2D line drawing data in the vector format. The algorithm is composed of silhouette line detection, hidden line removal and cleaning processes.

  • PDF

모델기반 설계를 통한 CBTC 차상장치 소프트웨어 개발 및 적용 (Development of CBTC Car-borne Software with Model-Based Design and Its Applications)

  • 전종화;최선아;최동혁;조찬호;박기수;류명선
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2011년도 춘계학술대회 논문집
    • /
    • pp.910-917
    • /
    • 2011
  • CBTC(Communication Based Train Control) car-borne equipment, a part of the communication based train control system, mainly consists of automatic train protection(ATP) functions, automatic train operation(ATO) functions as well as the interface functions with other equipment including CBTC wayside equipment and train control management system etc. The CBTC car-borne software implementing ATP/ATO functions is a real-time embedded software requiring a high level of safety and reliability. To satisfy the requirements of the CBTC car-borne software, the model-based design techniques are applied with SCADE(Safety-Critical Application Development Environment) to the development of the CBTC car-borne software. In this paper, we illustrate the process modeling the car-borne ATP/ATO functions satisfying system requirement specification with system requirement management, modeling and document generation tools etc. supported by SCADE. In addition, the developed models corresponding to the ATP/ATO functions are applied to the train with CBTC car-borne equipment through its corresponding EN-50128 standards-compliant C code generated by the code generator. It is shown from the test result that the ATP/ATO models developed by SCADE work well while the trains are running in driverless operation mode.

  • PDF

DTD 자동 생성 기법을 이용한 USN 미들웨어 설계 및 구현 (Design and Implementation of USN Middleware using DTD GenerationTechnique)

  • 남시병;권기현;유명한
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.41-50
    • /
    • 2012
  • 웹 서비스 어플리케이션 기반 모니터링 시스템에서 빈번히 발생되는 데이터 구조 변경에 따른 코드 재생산에 확장성 및 오류 복구능력 향상을 위하여 DTD(Document Type Definition)자동 생성 기법을 이용한 모니터링 시스템 설계방법을 제안하였다. 제안한 DTD자동 생성 기법은 센서 데이터 구조가 수정되어도 서버 측에서 동적 서버사이드 스크립트(Dynamic Server-side Script)로 DTD정보를 자동으로 생성해 주기 때문에 데이터 손실과 오류에 대한 능동적인 대처가 가능하며, AJAX(Asynchronous JavaScript and XML)를 이용한 XML데이터 파싱(Parsing)을 구성하여 대단위 데이터 전송이나 다양한 모니터링 시스템 분야에 데이터 손실이나 손상 확인 등의 예외처리 및 데이터 구조의 확장과 축소가 용이하였다. 제안된 시스템은 일시적인 데이터 깨짐 상황에서 정상화 복구에 필요한 평균시간이 기존의 XML을 이용한 방법보다 약 44.8ms감소되어 오류 복구처리 속도가 향상됨을 알 수 있었다.

복잡환 다단 문서 영상으로부터 구조화된 하이퍼문서의 자동 생성 (Automatic Generation of Structured Hyperdocuments from Multi-Column Document Images)

  • 이지연;강희중;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.458-460
    • /
    • 1999
  • 본 논문에서는 다양한 객체를 포함한 다단 문서 영상을 원본 문서와 거의 유사한 형태의 HTML 문서로 변환할 수 있는 방법을 제안한다. 또한 논문이나 매뉴얼, 책의 한 단원 등 여러장의 입력 문서의 경우, 문서의 논리적인 구조 분석을 수행하고 장이나 절 등의 섹션 제목들을 계층화하여 다단 문서의 변환과 동시에 구조화된 목차 페이지도 함께 자동 생성하는 방법을 제안한다. 제안된 다단 문서 변환 알고리즘을 잡지, 신문, 광고지, 매뉴얼 등, 비정형화된 문서에 적용한 결과, 원본 문서의 형태와 구조에 큰 변함없이 유사하게 변환되었고, 논리적인 구조 분석 및 섹션 제목들의 계층화 작업 또한 정확히 수행되어 구조화된 목차 페이지의 자동 생성이 가능하였다.

  • PDF