• Title/Summary/Keyword: 문서 처리 자동화

Search Result 114, Processing Time 0.026 seconds

Automatic Generation of Vocabulary Problem for Learning Korean as a Foreign Language (외국인의 한국어 학습을 위한 어휘 문제 자동 생성)

  • Kim, Seong-Uk;Lim, JaeHyun;Kim, Yein;Lee, Hyun Ah
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.247-250
    • /
    • 2014
  • 국내에서 거주하는 외국인들을 대상으로 한 여러 정책들이 만들어지고 있다, 그에 따른 한국어 교육의 수요는 증가하고 있지만 그에 적합한 한국어 교육시스템의 자동화 및 발전은 미약하다. 본 논문에서는 사전예문과 획득이 용이한 말뭉치를 가공하여 적절한 수준의 문제를 자동으로 생성하는 방법을 제안한다. 자동문제생성에서는 말뭉치와 사전 예문에서 문제와 보기문항을 생성하고, 보기 리스트를 생성한다. 웹문서 검색빈도를 이용하여 생성된 보기리스트의 적합성을 분석하여 정제된 보기 리스트를 획득한다. 얻어진 보기들을 임의로 선택하여 출력함으로써 사용자들이 다양한 문제를 접할 수 있도록 한다.

  • PDF

Design of Contents Curation System Based on Incremental Learning Technology for Big Data Mining (빅데이터 마이닝을 위한 점진적 학습 기반 콘텐츠 큐레이션 시스템 설계)

  • Min, Byung-Won
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2017.05a
    • /
    • pp.421-422
    • /
    • 2017
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 큐레이션 서비스에서는 개인비서, 금융 분야의 투자, 자율주행, 저널리즘, 효율적인 업무 지시/감독, 제조업의 자동화 공정, 교육, 콘텐츠 유통, 학술정보 등에서 컴퓨터가 방대한 양의 데이터로 부터 학습하여 사람의 일을 대신 처리하거나 의사결정에 도움을 줌으로써 업무의 효율을 높여주는 서비스 산업에 활용이 가능하다.

  • PDF

COAT: Manual Semantic Annotation Support Toolkit (COAT: 시맨틱 어노테이션 말뭉치 구축 지원 도구)

  • Choi, DongHyun;Kim, Eun-Kyung;Go, Eun-Bi;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.85-89
    • /
    • 2011
  • 수동 어노테이션을 통한 말뭉치 구축 작업은 많은 시간과 노력이 필요한 작업이지만, 자동화된 정보 추출 도구의 훈련 및 실험, 평가를 위해서는 꼭 필요한 작업이기도 하다. 본 논문에서는, 수동 시맨틱 어노테이션을 통한 말뭉치 구축 작업을 지원하는 수동 시맨틱 어노테이션 지원 도구 COAT를 소개한다. COAT는 각 어노테이터의 작업 효율을 높이기 위하여 GUI 기반 인터페이스를 제공하고, 작업의 대부분을 단축키만 이용하여 수행 가능하도록 설계되었다. 또한 최종 결과로 얻어지는 데이터의 신뢰성을 높이기 위하여, 최소 두 명 이상의 어노테이터가 같은 문서에 대하여 작업하면 고참 어노테이터가 각 결과물들을 통합하는 컨쥬게이션 도구를 구축하였으며, 각 어노테이터들의 작업 및 데이터들을 관리 감독하기 위한 관리자 도구를 개발하였다. 본 도구를 직접 사용하여 어노테이션 작업을 수행한 결과, 본 도구를 사용하지 않고 작업을 수행할 때와 비교하여 약 87%의 비용 절감 효과를 얻을 수 있었다.

  • PDF

Structure Recognition Method in Various Table Types for Document Processing Automation (문서 처리 자동화를 위한 다양한 표 유형에서 표 구조 인식 방법)

  • Lee, Dong-Seok;Kwon, Soon-Kak
    • Journal of Korea Multimedia Society
    • /
    • v.25 no.5
    • /
    • pp.695-702
    • /
    • 2022
  • In this paper, we propose the method of a table structure recognition in various table types for document processing automation. A table with items surrounded by ruled lines are analyzed by detecting horizontal and vertical lines for recognizing the table structure. In case of a table with items separated by spaces, the table structure are recognized by analyzing the arrangement of row items. After recognizing the table structure, the areas of the table items are input into OCR engine and the character recognition result output to a text file in a structured format such as CSV or JSON. In simulation results, the average accuracy of table item recognition is about 94%.

An Automatic Web Page Classification System Using Meta-Tag (메타 태그를 이용한 자동 웹페이지 분류 시스템)

  • Kim, Sang-Il;Kim, Hwa-Sung
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.38B no.4
    • /
    • pp.291-297
    • /
    • 2013
  • Recently, the amount of web pages, which include various information, has been drastically increased according to the explosive increase of WWW usage. Therefore, the need for web page classification arose in order to make it easier to access web pages and to make it possible to search the web pages through the grouping. Web page classification means the classification of various web pages that are scattered on the web according to the similarity of documents or the keywords contained in the documents. Web page classification method can be applied to various areas such as web page searching, group searching and e-mail filtering. However, it is impossible to handle the tremendous amount of web pages on the web by using the manual classification. Also, the automatic web page classification has the accuracy problem in that it fails to distinguish the different web pages written in different forms without classification errors. In this paper, we propose the automatic web page classification system using meta-tag that can be obtained from the web pages in order to solve the inaccurate web page retrieval problem.

An Efficient Design Pattern Framework for Automatic Code Generation based on XML (코드 자동 생성을 위한 XML 기반의 효율적인 디자인패턴 구조)

  • Kim, Un-Yong;Kim, Yeong-Cheol;Ju, Bok-Gyu;Choe, Yeong-Geun
    • The KIPS Transactions:PartD
    • /
    • v.8D no.6
    • /
    • pp.753-760
    • /
    • 2001
  • Design Patterns are design knowledge for solving issues related to extensibility and maintainability which are independent from problems concerned by application, but despite vast interest in design pattern, the specification and application of patterns is generally assumed to rely on manual implementation. As a result, we need to spend a lot of time to develop software program not only because of being difficult to analyze and apply to a consistent pattern, but also because of happening the frequent programing faults. In this paper, we propose a notation using XML for describing design pattern and a framework using design pattern. We will also suggest a source code generation support system, and show a example of the application through this notation and the application framework. We may construct more stable system and be generated a compact source code to a user based on the application of structured documentations with XML.

  • PDF

Korean Learning Assistant System with Automatically Extracted Knowledge (자동 추출된 지식에 기반한 한국어 학습 지원 시스템)

  • Park, Gi-Tae;Lee, Tae-Hoon;Hwang, So-Hyun;Kim, Byeong Man;Lee, Hyun Ah;Shin, Yoon Sik
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.1 no.2
    • /
    • pp.91-102
    • /
    • 2012
  • Computer aided language learning has become popular. But the level of automation of constructing a Korean learning assistant system is not so high because a practical language learning system needs large scale knowledge resources, which is very hard to acquire. In this paper, we propose a Korean learning assistant system that utilizes easily obtainable knowledge resources like a corpus, web documents and a lexicon. Our system has three modules - problem solving, pronunciation marker and writing assistant. Automatic problem generator uses a corpus and a lexicon to make problems with one correct answer and three distracters, then verifies their suitability by utilizing frequency information from web documents. We analyze pronunciation rules for a pronunciation marker and recommend appropriate words and sentences in real-time by using data extracted from a corpus. In experiment, we evaluate 400 automatically generated problems, which show 89.9% problem suitability and 64.9% example suitability.

ebXML based e-Logistics Process Modeling System Architecture (ebXML 기반 e-Logistics 프로세스 모델링 시스템 아키텍처)

  • Chun, Jong-Mi;Oh, Dong-Keun;Hong, Jung-Sun;Kim, Kwang-Hun;Oh, Se-Won;Hwang, Jae-Gak;Lee, Yong-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.2145-2148
    • /
    • 2002
  • e-비즈니스 활성화에 따른 물류 환경의 변화로 인해 시장의 확대와 경쟁력 강화를 위한 효과적인 물류망 관리 요구가 대두되고 있다. 인터넷 기반의 B2B는 서로 다른 플랫폼과 서로 다른 문서 구조를 가지고 있으므로 상호운용성에 많은 어려움이 존재하기 때문에 XML를 이용한 전자상거래의 표준인 ebXML를 이용하여 여러 기업간의 업무 프로세스 통합을 효율적으로 수행하도록 한다. e-Logistics 프로세스의 다자간 협업을 위해서 프로세스 자동화를 위한 프로세스 중심의 워크플로우 프로세스 모델링과 역할 중심의 양자간 협업을 위한 ebXML 프로세스 모델링을 기반으로 ebXML 기반의 e-Logistics 프로세스 모델링을 제안한다. 본 논문에서는 인터넷 기반의 B2B 물류 비즈니스 프로세스 모델링을 위한 ebXML 기반의 e-Logistics 프로세스 모델링 시스템 아키텍쳐를 설계한다.

  • PDF

Detecting Errors and Checking Consistency in the Object-Oriented Design Models (객체지향 설계방법에서 오류 검출과 일관성 점검기법 연구)

  • Jeong, Gi-Won;Jo, Yong-Seon;Gwon, Seong-Gu
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.8
    • /
    • pp.2072-2087
    • /
    • 1999
  • As software size ever increases and user's requirements become more and more sophisticated., the importance of software quality is more and more emphasized. However, we are not satisfied for the present techniques on detecting errors and checking consistency in the object-oriented design model. This paper proposes a systematic approach which produces implementable rules to detect errors and check consistency. At first, the meta-models for UML diagrams are constructed, generalized meta-rules are reduced from the meta-models, and then the meta-rules are applied to produce the implementable rules. This approach enables to pursue the completeness of the rules and the automation of rule application. An example of rule application shows the feasibility of the rule application.

  • PDF

Implementation of a Video Phone System using the IEEE-1394 Serial Bus (IEEE-1394 직렬버스를 이용한 화상 전화 시스템의 구현)

  • Gang, Seong-Il;Pyeon, Gi-Hyeon;Lee, Chung-Hun;Lee, Heung-Gyu;Gang, Seong-Bong
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.3
    • /
    • pp.351-359
    • /
    • 1999
  • 최근 IEEE-1394 직렬버스는 컴퓨터와 가전기기가 결합된 차세대 가정 자동화를 위한 통신 기술로 주목받고 있다. 본 논문은 이러한 1394 버스에서 사용할 수 있는 PC용 화상 전화시스템 (VPS) 구현에 대한 내용을 기술한 것이다. 개발된 화상 전화 시스템은 기본적으로 고품질의 오디오와 비디오를 실시간으로 전송할수 있으며 온라인 문자정보를 교환을 위한 채팅기능과 사용중 문서나 이미지를 전달할 수 있는 고속 파일 전송 기능을 부가적으로 제공하고 있다. VPS는 내부적으로 실시간 처리기능이 없는 일반 PC 운영체제에서 실시간 전송이 가능한 1394 버스를 사용할 때 컴퓨터 시스템이 불안정해지는 문제를 피하고 손실에 민감한 오디오를 보호하기 위하여 부하에 따라 비디오 처리를 조절하는 비대칭적 버퍼제어기법을 사용하고 있다.