• Title/Summary/Keyword: 동적 문서

Search Result 228, Processing Time 0.028 seconds

Design and Implementation of a BPEL Engine for Dynamic Function using Aspect-Oriented Programming (동적 기능 추가를 위하여 관점지향 프로그래밍 기법을 이용한 BPEL 엔진의 설계와 구현)

  • Kwak, Dong-Gyu;Choi, Jae-Young
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.37 no.4
    • /
    • pp.205-214
    • /
    • 2010
  • BPEL is a standard workflow language, which interacts with Web Services and is used in various applications. But it is difficult to use BPEL for specific applications which require additional functions. In this paper, we present a system which can add new functions to BPEL based on an aspect-oriented programming (AOP) technique. In order to add new functions to BPEL, we define a JWX document format that can describe new functions to apply to BPEL. JWX is XML-oriented document that can code the corresponding Java program in order to dynamically add new functions to BPEL documents. It is possible for BPEL workflow to add new functions without modifying the existing programs using the AOP technique, which guarantees low degree of coupling between key and additional requirements. Additionally this systems weaves based on new functions of Java program and JWX document by expanding BPEL engine called B2J based on AOP and execute them. Therefore it is possible to develop a new BPEL engine with additional functions easily and with low cost. The new system can execute additional conditions that the current BPEL engine doesn’t provide. The new system using functions of BPEL supplied by B2J. The new system can be used to add a new rule engine, which isn't currently provided.

Dynamic Management of Equi-Join Results for Multi-Keyword Searches (다중 키워드 검색에 적합한 동등조인 연산 결과의 동적 관리 기법)

  • Lim, Sung-Chae
    • The KIPS Transactions:PartA
    • /
    • v.17A no.5
    • /
    • pp.229-236
    • /
    • 2010
  • With an increasing number of documents in the Internet or enterprises, it becomes crucial to efficiently support users' queries on those documents. In that situation, the full-text search technique is accepted in general, because it can answer uncontrolled ad-hoc queries by automatically indexing all the keywords found in the documents. The size of index files made for full-text searches grows with the increasing number of indexed documents, and thus the disk cost may be too large to process multi-keyword queries against those enlarged index files. To solve the problem, we propose both of the index file structure and its management scheme suitable to the processing of multi-keyword queries against a large volume of index files. For this, we adopt the structure of inverted-files, which are widely used in the multi-keyword searches, as a basic index structure and modify it to a hierarchical structure for join operations and ranking operations performed during the query processing. In order to save disk costs based on that index structure, we dynamically store in the main memory the results of join operations between two keywords, if they are highly expected to be entered in users' queries. We also do performance comparisons using a cost model of the disk to show the performance advantage of the proposed scheme.

Using Dynamic Programming for Word Segmentation in OCR (동적 프로그래밍을 이용한 OCR에서의 띄어쓰기 교정)

  • Park, Ho-Min;Kim, Chang-Hyun;Noh, Kyung-Mok;Cheon, Min-Ah;Kim, Jae-Hoon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.243-245
    • /
    • 2016
  • 광학 문자 인식(OCR)을 통해 문서의 글자를 인식할 때 띄어쓰기 오류가 발생한다. 본 논문에서는 이를 해결하기 위해 OCR의 후처리 과정으로 동적 프로그래밍을 이용한 분절(Segmentation) 방식의 띄어쓰기 오류 교정 시스템을 제안한다. 제안하는 시스템의 띄어쓰기 오류 교정 과정은 다음과 같다. 첫째, 띄어쓰기 오류가 있다고 분류된 어절 내의 공백을 모두 제거한다. 둘째, 공백이 제거된 문자열을 동적 프로그래밍을 이용한 분절로 입력 문자열에 대하여 가능한 모든 띄어쓰기 후보들을 찾는다. 셋째, 뉴스 기사 말뭉치와 그 말뭉치에 기반을 둔 띄어쓰기 확률 모델을 참조하여 각 후보의 띄어쓰기 확률을 계산한다. 마지막으로 띄어쓰기 후보들 중 확률이 가장 높은 후보를 교정 결과로 제시한다. 본 논문에서 제안하는 시스템을 이용하여 OCR의 띄어쓰기 오류를 해결할 수 있었다. 향후 띄어쓰기 오류 교정에 필요한 언어 규칙 등을 시스템에 추가한 띄어쓰기 교정시스템을 통하여 OCR의 최종적인 인식률을 향상에 대해 연구할 예정이다.

  • PDF

Design of The Dynamic Binding Systems using API Information Repository (API 정보 저장소를 활용한 동적 재구성 지원 시스템의 설계)

  • Yoon, Seok-Jin;Kim, Sun-Ja;Kim, Hyeon-Soo
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.11a
    • /
    • pp.198-201
    • /
    • 2009
  • 오늘날 운영체계와 미들웨어는 수많은 API를 제공하고 있다. 최종 사용자들이 사용하는 응용 프로그램들은 이러한 API를 활용하여 개발되어지고 있다. 기존의 문서와 같은 형태의 API에 대한 기술은 기계가 자동적으로 처리하기 힘들며 개발자 입장에서도 API를 이해하기 위해서 책을 직접 읽고 이해해야 한다는 단점이 있다. 이를 극복하기 위하여 docgen과 같은 도구들이 있으나 결국은 개발자 관점에서는 API를 직접 숙지하여야 하며 응용 프로그램 상에서 직접 운영체계에서 제공하는 API 호출 부분을 작성하여 개발하여야 한다는 부분은 동일하다. 또한 서로 다른 다양한 운영체계에서는 형식은 다르지만 유사한 기능을 제공을 하는 API들이 있으나 개발자는 특정 운영체계의 API에 맞추어서 각각의 운용체계에 맞는 응용 프로그램을 개발하여야 하는 문제점이 있다. 본 연구에서는 API에 대한 정보에 대한 규격을 정의하고 각각의 API의 기능 및 특성에 대하여 메타 기술언어를 사용하여 기술하여 저장소에 저장해두고 실행시에 이러한 API정보를 사용하여 응용 프로그램과 동적으로 바인딩시켜서 실행시키는 체계에 대해서 논의한다. 응용 프로그램에서 사용하려고 하는 API와 운영체계에서 제공하는 API를 동적으로 결합시키는 엔진에서는 운영체계별 API의 차이에 의한 부분을 상쇄시키는 역할을 담당한다. 이러한 체계를 활용하면 동적으로 재구성 가능한 응용을 개발하는데 있어서 하부 시스템으로 활용될 수 있다. 향후 표준 API를 기술하는데 있어서도 본 연구에서 제시하는 메타 방식의 API 기술표현을 활용하면 보다 정확한 표준 규약 준수 여부를 확인할 수 있는 방법을 제공할 수 있다.

  • PDF

Using Dynamic Programming for Word Segmentation in OCR (동적 프로그래밍을 이용한 OCR에서의 띄어쓰기 교정)

  • Park, Ho-Min;Kim, Chang-Hyun;Noh, Kyung-Mok;Cheon, Min-Ah;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.243-245
    • /
    • 2016
  • 광학 문자 인식(OCR)을 통해 문서의 글자를 인식할 때 띄어쓰기 오류가 발생한다. 본 논문에서는 이를 해결하기 위해 OCR의 후처리 과정으로 동적 프로그래밍을 이용한 분절(Segmentation) 방식의 띄어쓰기 오류 교정 시스템을 제안한다. 제안하는 시스템의 띄어쓰기 오류 교정 과정은 다음과 같다. 첫째, 띄어쓰기 오류가 있다고 분류된 어절 내의 공백을 모두 제거한다. 둘째, 공백이 제거된 문자열을 동적 프로그래밍을 이용한 분절로 입력 문자열에 대하여 가능한 모든 띄어쓰기 후보들을 찾는다. 셋째, 뉴스 기사 말뭉치와 그 말뭉치에 기반을 둔 띄어쓰기 확률 모델을 참조하여 각 후보의 띄어쓰기 확률을 계산한다. 마지막으로 띄어쓰기 후보들 중 확률이 가장 높은 후보를 교정 결과로 제시한다. 본 논문에서 제안하는 시스템을 이용하여 OCR의 띄어쓰기 오류를 해결할 수 있었다. 향후 띄어쓰기 오류 교정에 필요한 언어 규칙 등을 시스템에 추가한 띄어쓰기 교정시스템을 통하여 OCR의 최종적인 인식률을 향상에 대해 연구할 예정이다.

  • PDF

A New Mobile Content Adaptation Based on Content Provider-Specified Web Clipping (컨텐츠 제공자 지정 웹 클리핑 방식의 이동 인터넷 컨텐츠 변환)

  • Yang, Seo-Min;Lee, Hyuk-Joon
    • The KIPS Transactions:PartB
    • /
    • v.11B no.1
    • /
    • pp.35-44
    • /
    • 2004
  • Web contents created for desktop screens give rise to problems when they are to be displayed on the small screens of mobile terminals. While in some cases some of the objects of a page may not be displayable due to the lack of browser capability, the entire page may not be displayable due to the incompatibility with the browser in other cases. In this paper, we introduce a new mobile content adaptation approach based on web clipping, which transforms an original page into one that is optimally displayed on a mobile terminal. In this method, a source page is automatically clipped and transformed according to the clip specification made by the content provider using a clip editing tool. The clip editing tool allows the user to specify group clips, multi-level cups and dynamic clips as well as simple clips, and the presentation layout through a graphic user interface. Based on the clip specifications, each clip is transformed into an intermediate meta-language document, which in turn is transformed into a presentation page in the target markup language. Transcoding of image objects in major image file formats is also supported.

FiST: XML Document Filtering by Sequencing Twig Patterns (가지형 패턴의 시퀀스화를 이용한 XML 문서 필터링)

  • Kwon Joon-Ho;Rao Praveen;Moon Bong-Ki;Lee Suk-Ho
    • Journal of KIISE:Databases
    • /
    • v.33 no.4
    • /
    • pp.423-436
    • /
    • 2006
  • In recent years, publish-subscribe (pub-sub) systems based on XML document filtering have received much attention. In a typical pub-sub system, subscribing users specify their interest in profiles expressed in the XPath language, and each new content is matched against the user profiles so that the content is delivered only to the interested subscribers. As the number of subscribed users and their profiles can grow very large, the scalability of the system is critical to the success of pub-sub services. In this paper, we propose a novel scalable filtering system called FiST(Filtering by Sequencing Twigs) that transforms twig patterns expressed in XPath and XML documents into sequences using Prufer's method. As a consequence, instead of matching linear paths of twig patterns individually and merging the matches during post-processing, FiST performs holistic matching of twig patterns with incoming documents. FiST organizes the sequences into a dynamic hash based index for efficient filtering. We demonstrate that our holistic matching approach yields lower filtering cost and good scalability under various situations.

Design and Implementation of Indexing and Query Languages for an Efficient Retrieval of SGML Documents (SGML 문서의 효율적인 검색을 위한 색인 및 질의 언어의 설계 및 구현)

  • Lee, Bong-Sin;Lee, Gyeong-Ho;Go, Seung-Gyu;Choe, Yun-Cheol
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.11
    • /
    • pp.2911-2921
    • /
    • 1999
  • We present new methods for an efficient retrieval of SGML documents. We define IDDL (index database description language) which is able to describe various information such as meta data, an indexing range, and the creation and manipulation of a database. In addition, we design IDQL (index database query language) that can deal with querying meta data as well as logical structure. Especially, the retrieval system based on IDDL and IDQL has been developed and implemented, and has been experimented on large number of documents. Experimental result shows that the proposed method provides the dynamic creation of an index database and a convenient retrieval environment.

  • PDF

A Korean Morphological Analyzer Supports Multi-Threads (정보 검색용 다중 스레드 한국어 형태소 해석기)

  • Choi, Yoo-Kyung;An, Dong-Un;Chung, Sung-Jong
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.41-47
    • /
    • 2001
  • 본 논문에서는 한국어 형태소 해석기에 다중 스레드 기법을 도입하여 다중 처리가 가능하도륵 하였다. 기존의 여러 형태소 해석기들은 언어 분석에만 관심이 있었기 때문에 다량의 문서를 동시에 처리하는 기능을 고려하지 않았다. 그러나 형태소 해석기가 정보 검색 시스템 분야에서 사용되기 시작하면서, 다수의 사용자가 대량의 문서를 처리해야 하는 필요성이 생겼다. 스레드 간에는 메모리 영역과 같은 자원을 공유한다. 이러한 특징 때문에 자칫하면 예상치 못한 결과가 야기될 수 있다. 따라서, 다중 스레드 기법을 사용하기 위해서는 스레드의 특징을 고려한 조치가 필요하다 기존의 한국어 형태소 해석기의 소스 코드를 분석하여 자주 사용되는 전역 변수는 하나의 구조체로 구성하였다. 그리고 이러한 전역 변수와 크기가 큰 지역 변수를 사용할 때 메모리를 동적으로 할당하였다. 또한, 파일에서 입력값을 읽어오거나 파일에 결과값을 쓰는 등 여러 스레드가 접근할 때 값이 변경될 위험이 있는 부분은 조건 변수를 이용하여 동기화 시켰다. 구현된 시스템의 검증을 위하여, 단일 스레드 방식으로 순차적인 처리를 하는 원래의 형태소 해석기와 비교 실험을 실시하였다. 35Kbyte 문서 30개를 처리하는 경우, 다중 처리가 가능한 형태소 해석기가 단일 스레드 방식의 형태소 해석기보다 처리속도가 약 12% 향상되었다.

  • PDF

A Distributed Simulation Platform for WED-based Distributed Simulation Environment (웹-기반 분산 시뮬레이션 환경을 위한 분산 시뮬레이션 플랫폼)

  • 한윤기;조상영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.187-189
    • /
    • 1998
  • 최근 웹을 폭발적인 확산과 웹 기술의 급속한 발달에 따라 웹 환경과 이산사건 시스텀 시뮬레이션 환경을 결합시키려는 웹-기반 시뮬레이션에 대한 연구가 활발히 진행되고 있다. 웹 문서 내에서 시뮬레이션 모델을 수행시키는 웹-기반 시뮬레이션은 교육, 광고, 제품 소개 및 훈련, 동적 문서의 제작 등 다양한 응용분야가 있다. 기존의 웹- 기반 시뮬레이션 환경은 전체 시뮬렝션이 한 시스템에서 수행되는 순차적 시뮬레이션에 기반을 두고 있다. 본 논문에서는 분산된 환경 하에서 동시 공학적인 시스템 개발에 이용될 수 있는 분산-모델 분산-시뮬레이션 형태의 웹-기반 시뮬레이션을 제시하며 이의 구현을 위한 전 단계로서 인터넷 하에서 구축된 분산 시뮬레이션 환경에 대해 설명한다. 본 환경에서는 네트웍 시스템 및 하드웨어 모델링을 용이하게 하기 위하여 확장된 DEVS 형식론을 도입하였고 개발된 모델이 이종의 시스템들 간에 자유로이 전송되어 수행될 수 있도록 Java를 사용하여 시뮬레이션 환경을 구축하였다.

  • PDF