• Title/Summary/Keyword: 전자문서처리

Search Result 457, Processing Time 0.034 seconds

DaHae: Japanese Morphological Analyzer for Japanese to Korean Machine Translation (DaHae: 일한 기계번역을 위한 일본어 형태소 분석기)

  • Yuh, Sang-Hwa;Jung, Han-Min;Chang, Won;Kim, Tae-Wan;Hwang, Do-Sam;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.195-207
    • /
    • 1995
  • 일본어는 한자, 히라가나, 가다가나 등 다양한 종류의 문자를 사용하며 이들의 혼용 비율이 매우 높아 띄어쓰기를 하지 않아도 문서의 가독성을 유지한다. ICOT 사전, EDR 사전, ATLAS I/JK사전 등 기존의 전자 사전에서 복합 자종의 표제어가 차지하는 비율(한자+히라가나의 표제어 제외)은 평균 8.8%로 그 수가 매우 작다. 따라서, 문장 내에서 자종의 변화는 단어를 구분하는 하나의 delimiter로 이용될 수 있다. 본 시스템에서는 형태소 분석의 전단계로 전처리기를 두어 자종정보(character type information)에 의한 fragment 분리 및 예외 단어, 정형표현 처리를 수행하며 각 fragment 의 형태소 분석 방법을 제시한다. 형태소 분석기는 전처리기의 처리 결과를 입력받아 각각의 fragment를 전처리기가 제시한 분석 방법에 따라 분석하여 입력 문장의 가능한 모든 분석을 추출한다. 이 방법은 불필요한 사전 탐색과 접속 체크 회수를 줄여 분석 성능을 향상시킨다.

  • PDF

Design and Implementation of Light Loaded Web Application Based on .NET (.NET 기반의 저부하형 웹 애플리케이션 설계 및 구현)

  • 최동우;안현식
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.2
    • /
    • pp.272-282
    • /
    • 2004
  • As Web services need to manage lots of information, it is indispensable to reduce server's load and speed up processing time. In this paper, we analyze the loading problems of server and suggest designing methods for light loaded Web applications based on .NET. The proposed methods include using a relative database to produce minimized modules and Stored Procedures to simplify SQL statements for reducing sever's load. Web pages are organized with scripts replacing server language, which improve server's capability by reducing loads. The execution time is also speeded up by organizing Web pages with User Controls. And XML/EDI is used for managing the effective exchange of documents. The proposed methods are implemented as an education management system and shows its effectiveness.

  • PDF

Considerations for Applying Korean Natural Language Processing Technology in Records Management (기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항)

  • Haklae, Kim
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.22 no.4
    • /
    • pp.129-149
    • /
    • 2022
  • Records have temporal characteristics, including the past and present; linguistic characteristics not limited to a specific language; and various types categorized in a complex way. Processing records such as text, video, and audio in the life cycle of records' creation, preservation, and utilization entails exhaustive effort and cost. Primary natural language processing (NLP) technologies, such as machine translation, document summarization, named-entity recognition, and image recognition, can be widely applied to electronic records and analog digitization. In particular, Korean deep learning-based NLP technologies effectively recognize various record types and generate record management metadata. This paper provides an overview of Korean NLP technologies and discusses considerations for applying NLP technology in records management. The process of using NLP technologies, such as machine translation and optical character recognition for digital conversion of records, is introduced as an example implemented in the Python environment. In contrast, a plan to improve environmental factors and record digitization guidelines for applying NLP technology in the records management field is proposed for utilizing NLP technology.

Design and Implementation of a RESTful SOAP-based Slip Data Processing System (RESTful SOAP 기반 전표 데이터 처리 시스템 설계 및 구현)

  • Hwang Eui-Chul
    • The Journal of the Korea Contents Association
    • /
    • v.5 no.1
    • /
    • pp.101-108
    • /
    • 2005
  • In this paper, we propose a design methodology of RESTful SOAP-based web services which try to solve extensibility problem of SOAP-based Web service by adopting REST concept into SOAP. And, we apply the proposed RESTful SOAP-based web services design methodology in constructing slip data processing web services, compare it with simple SOAP-based slip data web services, and try to propose a model for building Web Services in the future. REST is a model about architecture type of web distributed computing , the biggest distributed application in the world. In REST, identification of resources are made by URI, states(resources) are represented by document described by XML and transferred through HTTP our proposed RESTful SOAP-based web services are expected to contribute to constructing useful world wide web services which are essential in building E-Commerce society.

  • PDF

The syllable recovrey rule-based system and the application of a morphological analysis method for the post-processing of a continuous speech recognition (연속음성인식 후처리를 위한 음절 복원 rule-based 시스템과 형태소분석기법의 적용)

  • 박미성;김미진;김계성;최재혁;이상조
    • Journal of the Korean Institute of Telematics and Electronics C
    • /
    • v.36C no.3
    • /
    • pp.47-56
    • /
    • 1999
  • Various phonological alteration occurs when we pronounce continuously in korean. This phonological alteration is one of the major reasons which make the speech recognition of korean difficult. This paper presents a rule-based system which converts a speech recognition character string to a text-based character string. The recovery results are morphologically analyzed and only a correct text string is generated. Recovery is executed according to four kinds of rules, i.e., a syllable boundary final-consonant initial-consonant recovery rule, a vowel-process recovery rule, a last syllable final-consonant recovery rule and a monosyllable process rule. We use a x-clustering information for an efficient recovery and use a postfix-syllable frequency information for restricting recovery candidates to enter morphological analyzer. Because this system is a rule-based system, it doesn't necessitate a large pronouncing dictionary or a phoneme dictionary and the advantage of this system is that we can use the being text based morphological analyzer.

  • PDF

A Study on XML-Based Electronic Documents (XML기반의 전자문서 처리방안에 관한 연구)

  • Nam Cheol-Gi;Jang Gil-Sang
    • Proceedings of the Society of Korea Industrial and System Engineering Conference
    • /
    • 2002.05a
    • /
    • pp.57-62
    • /
    • 2002
  • Recently, due to the development of internet based information technology, organizations Is utilizing electronic documents as important media for processing business work and sharing Information exchange. These electronic documents are mos4 form like documents and are important user interfaces for business applications. But, presently web-based electronic documents are lack of the characteristics that are taken in documents, such as document writing rules and its workflow. This Paper deals with XML-based business document that include the structure, data, and logic and proposes the framework for validating the data and logic included within business documents using Prolog.

  • PDF

Design and Implementation of eBook Annotation System using Ontology (온톨로지를 이용한 eBook Annotation 시스템의 설계 및 구현)

  • 신성욱;김종석;고승규;임순범;최윤철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.211-215
    • /
    • 2002
  • 본 연구에서는 온라인 다중 사용자 환경의 eBook annotation 시스템 개발에서 데이터를 의미 기반으로 관리하고, 데이터에 대하여 상호 공통적인 이해를 표현하며, 그리고 데이터에 대한 무결성 검사 등을 지원하기 위해서 eBook annotation 온톨로지를 설계하였다. eBook annotation 데이터에 대한 상호 공통적인 이해의 표현을 위해서 한국 전자책 문서 표준인 EBKS(Electronic Book of Korea Standard)를 기반으로 설계 하였으며 설계 된 온톨로지는 Conceptual Graph(CG)를 사용하여 표현하였다. 의미 기반의 처리를 위해서 본 온톨로지에서는 동의어(synonym) 관계와 다국어(multilingua) 관계를 고려하였으며 또한 annotation 데이터 생성시 오류 방지와 중요도를 표현 하기 위해서 무결성 검사, 중요성 axiom을 고려 했다. 제안된 온톨로지는 annotation 데이터의 재사용성을 높일 수 있고 의미 정보를 활용함으로써 eLearning, cyberclass과 같은 다중사용자 환경에서 효과적인 협업을 가능하게 한다. 본 연구에서 구현한 eBook annotation 시스템은 설계한 온톨로지를 이용함으로써 의미 기반의 데이터 관리가 가능하다. 또한 annotation 생성 시 온톨로지 구조를 모르더라도 annotation을 생성할 수 있는 인터페이스를 구현하였다.

  • PDF

Analysis of Korean Compound Noun using Semantic Information (의미 정보를 이용한 한국어 복합명사 분석)

  • 김수남;원상현;권혁철;주종철;이상기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.195-197
    • /
    • 1998
  • 복합명사 분석은 조합이 자유롭고 제한이 없으므로 여러 가지 모호성을 발생시킨다. 이러한 모호성을 해결하는 기존 방법으로 사전을 이용하는 방법[2]과 통계적 정보를 이용하는 방법[3,4]이 있다. 본 논문에서는 하위 범주화된 어휘 정보를 가진 전자사전을 이용하여 복합명사를 분석한다. 그리고 어휘 정보만으로 처리했을 때 의미상으로 잘못된 분석이 발생할 수 있으므로 본 논문은 복합명사를 구성하는 어휘의 정보와 특정단어의 의미에 따른 복합명사 제약조건을 규칙베이스로 구축하여 분석에 이용한다. 또한 분석에 실패한 복합명사의 유형을 분석하여 각 유형에 따른 교정 방법도 제시한다. 실험 데이터는 부산일보, 교과서, 그리고 각종 문서에서 무작위로 추출한 27,945개의 복합명사를 사용하였다. 본 논문에서 제시한 의미적 제약조건을 이용하여 분석했을 때 복합명사로 잘못 쓴 어절의 검사율이 21% 향상되었다.

  • PDF

Studying of XML-based Mobile Flatform (XML기반 모바일 플랫폼에 관한 연구)

  • 신영호;천성광;권영직
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2003.11a
    • /
    • pp.207-210
    • /
    • 2003
  • 현재 무선 인터넷 환경은 음성 서비스 위주의 개인 사용자 시장이 한계에 도달하면서 이동 통신의 무선 단말기를 통하여 다양한 비즈니스를 할 수 있는 B2B 전자상거래 솔루션이 확대되고 있고, 모바일 데이터서비스 시장의 비중이 점차 확대되고 있다. 이러한 데이터 서비스 교환에 XML문서를 사용 할 경우, 데이터의 상호 처리 능력을 향상시키고 데이터의 공용성과 프로그램의 유용성을 향상시키는데 필요한 비용과 노력을 절감 할 수 있다. 따라서 본 논문에서는 모바일을 위한 M-commerce에 대한 현황을 살펴본 뒤, 모바일 환경에서 사용 할 수 있는 플랫폼에 대하여 살펴보았고, 향후 연구 방안으로는 모바일에서의 실시간 쇼핑몰 설계 및 구현과 분산 환경에서의 모바일 쇼핑몰을 설계 구현 할 예정이다.

  • PDF

A Study on the Improvement of Data Transmission Method of PORT-MIS (항만운영정보시스템의 데이터전송방식 개선에 관한 연구)

  • 김칠호;박남규;최형림
    • Journal of Korean Port Research
    • /
    • v.14 no.2
    • /
    • pp.133-142
    • /
    • 2000
  • In order to streamline the procedure of data transmission in port and logistics industries, MOMAF introduced EDI systems as the method of data transmission of 19 documents 5 years ago. While operating EDI system, MOMAF has found the inconvenience and the inefficiency of using EDI systems in the field of requesting fast response. This thesis focuses on finding the possible fields of on-line processing system. The result of the paper presents that if data transmission area such as 'application for pilot'is changed to on-line processing method, the processing cost and time will be reduced compared with EDI processing method.

  • PDF