• 제목/요약/키워드: 동적 문서

검색결과 228건 처리시간 0.027초

동적 기능 추가를 위하여 관점지향 프로그래밍 기법을 이용한 BPEL 엔진의 설계와 구현 (Design and Implementation of a BPEL Engine for Dynamic Function using Aspect-Oriented Programming)

  • 곽동규;최재영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권4호
    • /
    • pp.205-214
    • /
    • 2010
  • BPEL은 웹 서비스와 상호작용하는 워크플로우 언어의 표준으로서 다양한 응용에서 사용되고 있다. 하지만 특정 응용에서는 BPEL에 없는 추가적인 기능이 요구되어 적용하기 어렵다. 본 논문은 관점지향(aspect-oriented) 프로그래밍 기법을 이용하여 BPEL 엔진에 새로운 기능을 추가할 수 있는 시스템을 보인다. BPEL에 새로운 기능을 동적으로 추가하기 위해 새로운 기능을 기술할 수 있는 JWX 문서를 정의하고, 이를 BPEL에 적용하기 위한 관점지향 프로그래밍 기법의 시스템을 제안한다. JWX 문서는 BPEL 문서에 새로운 기능을 추가하기 위하여 자바 프로그램을 기술할 수 있는 XML 기반의 문서이다. 관점지향 프로그래밍 기법은 핵심적인 요구사항과 부가적인 요구사항 사이의 낮은 결합도를 보장하고 있으므로 기존의 프로그램을 수정하지 않고 기능을 추가할 수 있다. 또한 본 시스템은 B2J라는 BPEL 엔진을 관점지향 프로그래밍 기법을 통해 확장하여, 자바 프로그램과 JWX 문서의 새로운 기능 프로그램을 직조하고 실행시킨다. 이 방법을 이용하면, B2J가 제공하는 BPEL의 기능은 그대로 사용하면서 새로운 기능만 개발하여 적은 노력과 비용으로 기능이 추가된 BPEL 엔진을 개발할 수 있다. 본 시스템은 현재 BPEL이 제공하고 있지 않은 조건을 처리할 수 있는 규칙엔진을 BPEL에 추가하거나, 상황인지 환경에 사용할 수 있는 BPEL 워크플로우 시스템을 연구하는데 이용할 수 있다.

다중 키워드 검색에 적합한 동등조인 연산 결과의 동적 관리 기법 (Dynamic Management of Equi-Join Results for Multi-Keyword Searches)

  • 임성채
    • 정보처리학회논문지A
    • /
    • 제17A권5호
    • /
    • pp.229-236
    • /
    • 2010
  • 인터넷이나 기업체 안에서 생성되는 문서의 수가 빠르게 증가하고 있고 이에 따라 효율적인 문서 검색 서비스의 중요성도 함께 커지고 있다. 이런 검색 환경에서 사용자의 검색 질의를 미리 예측할 수 없기 때문에 문서 내의 키워드를 자동 추출하여 색인어로 사용하는 전문검색(full-text search)이 일반적으로 적용된다. 전문검색을 위해 생성된 색인 파일의 크기는 문서 수 증가로 대용량화 되고, 이런 대용량 색인에 대한 다중 키워드 질의 처리에는 과도한 디스크 비용이 초래될 수 있다. 논문에서는 이런 비용 문제를 해결하기 위해 대용량 문서의 전문검색 시스템에서 다중 키워드 질의를 효율적으로 처리할 수 있게 하는 색인 파일 구조 및 관리 기법을 제안한다. 제안된 방법은 다중 키워드 검색에 적합한 것으로 알려진 역파일을 기본 색인 구조로 하며, 질의 처리의 조인 연산과 랭킹 연산에 적합하도록 색인 파일을 계층화한다. 이를 바탕으로 다중 키워드 질의를 구성할 확률이 높은 키워드 쌍에 대한 조인 연산 결과를 주기억장치 공간에 동적으로 저장함으로써 디스크 사용량을 크게 줄일 수 있다. 논문에서는 제안된 기법의 우수성을 보이기 위해 디스크 비용 모델에 기반한 성능 비교도 수행한다.

동적 프로그래밍을 이용한 OCR에서의 띄어쓰기 교정 (Using Dynamic Programming for Word Segmentation in OCR)

  • 박호민;김창현;노경목;천민아;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.243-245
    • /
    • 2016
  • 광학 문자 인식(OCR)을 통해 문서의 글자를 인식할 때 띄어쓰기 오류가 발생한다. 본 논문에서는 이를 해결하기 위해 OCR의 후처리 과정으로 동적 프로그래밍을 이용한 분절(Segmentation) 방식의 띄어쓰기 오류 교정 시스템을 제안한다. 제안하는 시스템의 띄어쓰기 오류 교정 과정은 다음과 같다. 첫째, 띄어쓰기 오류가 있다고 분류된 어절 내의 공백을 모두 제거한다. 둘째, 공백이 제거된 문자열을 동적 프로그래밍을 이용한 분절로 입력 문자열에 대하여 가능한 모든 띄어쓰기 후보들을 찾는다. 셋째, 뉴스 기사 말뭉치와 그 말뭉치에 기반을 둔 띄어쓰기 확률 모델을 참조하여 각 후보의 띄어쓰기 확률을 계산한다. 마지막으로 띄어쓰기 후보들 중 확률이 가장 높은 후보를 교정 결과로 제시한다. 본 논문에서 제안하는 시스템을 이용하여 OCR의 띄어쓰기 오류를 해결할 수 있었다. 향후 띄어쓰기 오류 교정에 필요한 언어 규칙 등을 시스템에 추가한 띄어쓰기 교정시스템을 통하여 OCR의 최종적인 인식률을 향상에 대해 연구할 예정이다.

  • PDF

API 정보 저장소를 활용한 동적 재구성 지원 시스템의 설계 (Design of The Dynamic Binding Systems using API Information Repository)

  • 윤석진;김선자;김현수
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 추계학술대회
    • /
    • pp.198-201
    • /
    • 2009
  • 오늘날 운영체계와 미들웨어는 수많은 API를 제공하고 있다. 최종 사용자들이 사용하는 응용 프로그램들은 이러한 API를 활용하여 개발되어지고 있다. 기존의 문서와 같은 형태의 API에 대한 기술은 기계가 자동적으로 처리하기 힘들며 개발자 입장에서도 API를 이해하기 위해서 책을 직접 읽고 이해해야 한다는 단점이 있다. 이를 극복하기 위하여 docgen과 같은 도구들이 있으나 결국은 개발자 관점에서는 API를 직접 숙지하여야 하며 응용 프로그램 상에서 직접 운영체계에서 제공하는 API 호출 부분을 작성하여 개발하여야 한다는 부분은 동일하다. 또한 서로 다른 다양한 운영체계에서는 형식은 다르지만 유사한 기능을 제공을 하는 API들이 있으나 개발자는 특정 운영체계의 API에 맞추어서 각각의 운용체계에 맞는 응용 프로그램을 개발하여야 하는 문제점이 있다. 본 연구에서는 API에 대한 정보에 대한 규격을 정의하고 각각의 API의 기능 및 특성에 대하여 메타 기술언어를 사용하여 기술하여 저장소에 저장해두고 실행시에 이러한 API정보를 사용하여 응용 프로그램과 동적으로 바인딩시켜서 실행시키는 체계에 대해서 논의한다. 응용 프로그램에서 사용하려고 하는 API와 운영체계에서 제공하는 API를 동적으로 결합시키는 엔진에서는 운영체계별 API의 차이에 의한 부분을 상쇄시키는 역할을 담당한다. 이러한 체계를 활용하면 동적으로 재구성 가능한 응용을 개발하는데 있어서 하부 시스템으로 활용될 수 있다. 향후 표준 API를 기술하는데 있어서도 본 연구에서 제시하는 메타 방식의 API 기술표현을 활용하면 보다 정확한 표준 규약 준수 여부를 확인할 수 있는 방법을 제공할 수 있다.

  • PDF

동적 프로그래밍을 이용한 OCR에서의 띄어쓰기 교정 (Using Dynamic Programming for Word Segmentation in OCR)

  • 박호민;김창현;노경목;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.243-245
    • /
    • 2016
  • 광학 문자 인식(OCR)을 통해 문서의 글자를 인식할 때 띄어쓰기 오류가 발생한다. 본 논문에서는 이를 해결하기 위해 OCR의 후처리 과정으로 동적 프로그래밍을 이용한 분절(Segmentation) 방식의 띄어쓰기 오류 교정 시스템을 제안한다. 제안하는 시스템의 띄어쓰기 오류 교정 과정은 다음과 같다. 첫째, 띄어쓰기 오류가 있다고 분류된 어절 내의 공백을 모두 제거한다. 둘째, 공백이 제거된 문자열을 동적 프로그래밍을 이용한 분절로 입력 문자열에 대하여 가능한 모든 띄어쓰기 후보들을 찾는다. 셋째, 뉴스 기사 말뭉치와 그 말뭉치에 기반을 둔 띄어쓰기 확률 모델을 참조하여 각 후보의 띄어쓰기 확률을 계산한다. 마지막으로 띄어쓰기 후보들 중 확률이 가장 높은 후보를 교정 결과로 제시한다. 본 논문에서 제안하는 시스템을 이용하여 OCR의 띄어쓰기 오류를 해결할 수 있었다. 향후 띄어쓰기 오류 교정에 필요한 언어 규칙 등을 시스템에 추가한 띄어쓰기 교정시스템을 통하여 OCR의 최종적인 인식률을 향상에 대해 연구할 예정이다.

  • PDF

컨텐츠 제공자 지정 웹 클리핑 방식의 이동 인터넷 컨텐츠 변환 (A New Mobile Content Adaptation Based on Content Provider-Specified Web Clipping)

  • 양서민;이혁준
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.35-44
    • /
    • 2004
  • 작은 화면을 가진 이동 단말기에서 데스크탑 화면에 맞추어 제작된 웹 컨텐츠들을 브라우징 하는 것은 많은 어려움을 갖는다. 웹 페이지에는 이동 단말기용 브라우저의 제한된 기능으로 인해 표시할 수 없는 객체가 일부 포함되어 있는 경우도 있고, 브라우저에서 호환되지 않는 마크업 표준을 사용하여 브라우징 자체가 불가능할 수도 있다. 본 논문에서는 웹 페이지를 이동 단말기에 최적화된 형태로 변환할 수 있는 웹 클리핑 방식의 새로운 이동 인터넷 컨텐츠 적응 방법을 소개한다. 이 방법에서는 컨텐츠 제공자가 클립 편집기를 이용하여 설정한 클립 명세에 따라 원본 웹 문서가 자동으로 클리핑 되고 변환된다. 클립 편집기는 컨텐츠 제공자가 단일 클립, 그룹 클립, 다중 레벨 클립, 동적 클립을 설정하고, 문서의 레이아웃을 수정할 수 있도록 한다. 이렇게 설정된 클립 명세에 따라 원본 문서로부터 추출된 각 클립들은 먼저 중간 언어 형태의 문서로 변환되고, 이는 다시 이동 단말기를 위한 최종 마크업 문서로 변환된다. 또한 다양한 이미지 타입에 대한 변환기능을 제공한다.

가지형 패턴의 시퀀스화를 이용한 XML 문서 필터링 (FiST: XML Document Filtering by Sequencing Twig Patterns)

  • 권준호;;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.423-436
    • /
    • 2006
  • 최근 XML 문서 필터링에 기반한 출판 -구독 (publish-subscribe) 시스템이 많은 관심을 받고 있다. 전형적인 출판 구독 시스템에서, 구독자들은 XPath 언어로 명세된 프로파일로 자신들의 관심을 표현하고, 새로운 내용들은 사용자 프로파일에 대하여 매칭 여부를 판단하여 관심을 가지고 있는 사용자들에게만 배달된다. 구독자의 수와 그들의 프로파일이 증가할수록, 시스템의 확장성이 출판 구독 시스템의 중요한 성공 요소가 된다. 이 논문에서는 XPath 로 명세된 가지형 패턴과 입력 XML 문서들을 Prufer의 방법을 사용하여 시퀀스로 변환하는 FiST라 불라는 새로운 필터링 시스템을 제안한다. FiST 시스템은 가지형 패턴을 구성하는 선형 경로들에 대하여 각각 매칭을 수행하고 후처리 과정에서 그 결과들을 병합하는 방법을 이용하는 대신에 가지형 패턴 전체를 사용하여 입력 문서에 대하여 매칭을 수행한다. 또한 효율적인 필터링을 위하여 시퀀스들을 해시 기반의 동적 인덱스로 구성한다. 실험 결과를 통해 전체 매칭 접근 방법이 다양한 환경에서 낮은 필터링 비용과 좋은 확장성을 가짐을 알 수 있다.

SGML 문서의 효율적인 검색을 위한 색인 및 질의 언어의 설계 및 구현 (Design and Implementation of Indexing and Query Languages for an Efficient Retrieval of SGML Documents)

  • 이봉신;이경호;고승규;최윤철
    • 한국정보처리학회논문지
    • /
    • 제6권11호
    • /
    • pp.2911-2921
    • /
    • 1999
  • 본 논문에서는 SGML 문서의 효율적인 검색을 위한 방법론을 제안한다. 이를 위하여 메타 데이터, 색인 범위, 엘리먼트 이롬의 재정의, 그리고 데이터베이스 생성에 관한 정보를 기술할 수 있는 언어로 IDDL을 정의한다. 또한 메타 데이터와 구조에 대한 복합 질의를 효과적으로 표현할 수 있는 질의 언어인 IDQL을 제안한다. 본 논문에서는 제안된 방법론의 유효성을 입증하기 위하여 IDDL과 IDQL에 기반한 검색시스템을 개발하였으며 이를 상이한 구조의 대용량의 문서 집합에 실험하였다. 그 결과, 제안된 방법론은 데이터베이스를 동적으로 구성하며 사용자에게 편리한 검색 환경을 제공하였다.

  • PDF

정보 검색용 다중 스레드 한국어 형태소 해석기 (A Korean Morphological Analyzer Supports Multi-Threads)

  • 최유경;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-47
    • /
    • 2001
  • 본 논문에서는 한국어 형태소 해석기에 다중 스레드 기법을 도입하여 다중 처리가 가능하도륵 하였다. 기존의 여러 형태소 해석기들은 언어 분석에만 관심이 있었기 때문에 다량의 문서를 동시에 처리하는 기능을 고려하지 않았다. 그러나 형태소 해석기가 정보 검색 시스템 분야에서 사용되기 시작하면서, 다수의 사용자가 대량의 문서를 처리해야 하는 필요성이 생겼다. 스레드 간에는 메모리 영역과 같은 자원을 공유한다. 이러한 특징 때문에 자칫하면 예상치 못한 결과가 야기될 수 있다. 따라서, 다중 스레드 기법을 사용하기 위해서는 스레드의 특징을 고려한 조치가 필요하다 기존의 한국어 형태소 해석기의 소스 코드를 분석하여 자주 사용되는 전역 변수는 하나의 구조체로 구성하였다. 그리고 이러한 전역 변수와 크기가 큰 지역 변수를 사용할 때 메모리를 동적으로 할당하였다. 또한, 파일에서 입력값을 읽어오거나 파일에 결과값을 쓰는 등 여러 스레드가 접근할 때 값이 변경될 위험이 있는 부분은 조건 변수를 이용하여 동기화 시켰다. 구현된 시스템의 검증을 위하여, 단일 스레드 방식으로 순차적인 처리를 하는 원래의 형태소 해석기와 비교 실험을 실시하였다. 35Kbyte 문서 30개를 처리하는 경우, 다중 처리가 가능한 형태소 해석기가 단일 스레드 방식의 형태소 해석기보다 처리속도가 약 12% 향상되었다.

  • PDF

웹-기반 분산 시뮬레이션 환경을 위한 분산 시뮬레이션 플랫폼 (A Distributed Simulation Platform for WED-based Distributed Simulation Environment)

  • 한윤기;조상영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.187-189
    • /
    • 1998
  • 최근 웹을 폭발적인 확산과 웹 기술의 급속한 발달에 따라 웹 환경과 이산사건 시스텀 시뮬레이션 환경을 결합시키려는 웹-기반 시뮬레이션에 대한 연구가 활발히 진행되고 있다. 웹 문서 내에서 시뮬레이션 모델을 수행시키는 웹-기반 시뮬레이션은 교육, 광고, 제품 소개 및 훈련, 동적 문서의 제작 등 다양한 응용분야가 있다. 기존의 웹- 기반 시뮬레이션 환경은 전체 시뮬렝션이 한 시스템에서 수행되는 순차적 시뮬레이션에 기반을 두고 있다. 본 논문에서는 분산된 환경 하에서 동시 공학적인 시스템 개발에 이용될 수 있는 분산-모델 분산-시뮬레이션 형태의 웹-기반 시뮬레이션을 제시하며 이의 구현을 위한 전 단계로서 인터넷 하에서 구축된 분산 시뮬레이션 환경에 대해 설명한다. 본 환경에서는 네트웍 시스템 및 하드웨어 모델링을 용이하게 하기 위하여 확장된 DEVS 형식론을 도입하였고 개발된 모델이 이종의 시스템들 간에 자유로이 전송되어 수행될 수 있도록 Java를 사용하여 시뮬레이션 환경을 구축하였다.

  • PDF