• 제목/요약/키워드: Finite Automata

검색결과 86건 처리시간 0.021초

자연어 처리, 통계적 기법, 적합성 검증을 이용한 자동색인 시스템에 관한 연구 (A Study on Automatic Indexing System Using natural language Processing, Statistical Technique, Relevance Verification)

  • 유춘식;우선미;유철중;이종득;권오봉;김용성
    • 한국정보처리학회논문지
    • /
    • 제5권6호
    • /
    • pp.1552-1562
    • /
    • 1998
  • 형태소 분석(Morphological Analysis)과 같은 언어학적 처리에 의존하는 기존의 한국어 문헌에 대한 자동색인 기법들은 품사의 애매모호함이나 복합명사의 처리 등으로 부담(overhead)이 크다. 또한 불용어 처리에 사용되는 불용어 리스트가 대상 문헌의 주제 분야별로 따로 구축되어야 하며 그 크기가 방대하다는 문제점이 있다. 이러한 문제점들을 해결하기 위해, 본 논문에서는 각 문헌의 텍스트에 대해 복합명사 처리나 애매모호함에 대한 엄격한 분석을 수행하지 않는 간단한 형태의 형태소 분석을 수행하여 단순명사들을 추출한다. 그런 후 이들 단순명사들을 이용하여 유한 오토마타(Finite Automata)를 구성하고, 구성된 유한 오토마타와 각 명사의 단어빈도(Term Frequency)에 의해 각 색인어 후보들의 중요도를 계산하는 자동색인 기법을 제안한다. 그 결과 품사의 애매모호함에 대한 처리나 복합명사의 처리에따른 부담을 줄일 수 있었으며, 선정된 색인어들과 수작업으로 선정한 색인어들의 비교 실험에 의해 제안한 자동색인 기법의 성능을 검증하였다.

  • PDF

SYNTACTIC 패턴인식에 의한 생체신호처리 (Biological signal processing using syntactic pattern recognition)

  • 김용만;김정훈;정희교;이명호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1284-1287
    • /
    • 1987
  • A method of quantitative electrocardiogram analysis, based on concepts drawn from syntactic pattern recognition theories, is described. The algorithm can be used for removing the Interference noises and base line drift as a filter function, and for reducing the number of points representing the digitized ECG waveform. The Parsing is performed with simple finite state automata inferred by experiments and suitable to be updated during experiment execution. Two parameters are utilized for defining the noise and these make the algorithm flexible. The examples for testing the algorithm is real ECG waveforms with noise. Some experimental results lire presented.

  • PDF

한글 한자 자동변환이 가능한 WC

  • 이기식;서용무
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1983년도 춘계학술발표회논문집
    • /
    • pp.18-28
    • /
    • 1983
  • This paper describes the result of a series of fundamental researches on a word processing system, named WORD80. Given the text consisting of Ilanguel characters, Chinese characters, English alphabets and other special characters, it can provide-ㄴo-see printout, after having processed according to the commands used to control the output format of the text. Since each Hanguel character in input text is made up of and is represented as some compoents, it uses the deterministic finite automata for the formation of Hanguel from its components. When developed at first, the WORD80 can perform Hanguel to Chinese transition character by character by character. But it was thought to be more practical to do this word by word.

  • PDF

정규표현을 이용한 연속 및 불연속 복합단위 인식기 (An Interrupted and Uninterrupted Compound Unit Recognizer using Regular Expression)

  • 여상화;서정연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.487-490
    • /
    • 2003
  • 기계번역 시스템에서 복합단위 처리는 원문의 분석 부담을 줄이고 조합적으로 대역문의 의미를 생성하지 못하는 원문의 처리를 위해 필수적이다. 본 논문에서는 정규표현(Regular Expression)을 이용하여 영어의 연속(Non-Interrupted) 및 불연속(Interrupted) 복합 단위를 인식하는 복합단위 인식기를 제안한다. 제안된 방법은, 기존에 trie 와 같은 index 의 갱신 과정이 불필요하므로, 다수의 작업자에 의해 복합단위 사전을 동시에 구축하는 경우에, 한 작업자의 결과가 실시간으로 다른 작업자의 작업에 반영되는 장점이 있으며, 복합단위 인식에 있어 정규 표현을 이용함으로써 복합단위 인식기의 성능을 선언적으로 향상시킬 수 있다. 번역 실행시의 고속 탐색을 위해서는 전체 복합단위로부터 FSA(finite State Automata) 를 자동으로 구축하여 빠른 속도로 인식 가능하도록 하였다.

  • PDF

유한 오토마타를 이용한 정보 추출 시스템의 구현 및 분석 (An Information Extraction System Using Finite State Automata)

  • 오효정;임정묵;이만호;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-104
    • /
    • 1998
  • 인터넷의 사용자가 폭발적으로 증가함에 따라, 인터넷을 이용한 다양한 정보 서비스가 생성되었으며, 이로 인해 일반 사용자들이 접할 수 있는 디지털 문서의 양은 기하 급수적으로 증가 되었다. 본 논문에서는 유사한 정보를 갖는 다량의 문서들로부터 사용자가 원하는 정보만을 추출하는 정보 추출 시스템의 개발 과정 및 결과를 기술한다. 개발된 시스템은 필요한 정보를 포함하는 문장들을 걸러 낸 후, 필요한 사실정보의 출현을 나타내는 패턴을 사용한 유한 오토마타를 통하여 사용자가 원하는 정보를 추출한다. 관광지 안내 텍스트를 대상으로 한 실험 및 분석 결과를 기술한다.

  • PDF

유비쿼터스 환경에서 커뮤니티 컴퓨팅 지원을 위한 코디네이터 개발 (A Formal Model of Coordination for Supporting Community Computing in a Ubiquitous Environment)

  • 남진규;김현우;신동민;박재일;허선
    • 산업경영시스템학회지
    • /
    • 제31권3호
    • /
    • pp.43-51
    • /
    • 2008
  • Recent advances in mobile computing technologies and platform-independent information systems have enabled to realize a ubiquitous environment. Community computing has been developed as a useful tool for realizing collaborative services in a ubiquitous environment. In this paper, we present a formal model of a ubiquitous space that takes community concept into consideration and propose two management frameworks that prevent conflicts among communities. To demonstrate the validity of the proposed frameworks, an example for coordinating two communities is provided.

A Transformation-Based Learning Method on Generating Korean Standard Pronunciation

  • Kim, Dong-Sung;Roh, Chang-Hwa
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.241-248
    • /
    • 2007
  • In this paper, we propose a Transformation-Based Learning (TBL) method on generating the Korean standard pronunciation. Previous studies on the phonological processing have been focused on the phonological rule applications and the finite state automata (Johnson 1984; Kaplan and Kay 1994; Koskenniemi 1983; Bird 1995). In case of Korean computational phonology, some former researches have approached the phonological rule based pronunciation generation system (Lee et al. 2005; Lee 1998). This study suggests a corpus-based and data-oriented rule learning method on generating Korean standard pronunciation. In order to substituting rule-based generation with corpus-based one, an aligned corpus between an input and its pronunciation counterpart has been devised. We conducted an experiment on generating the standard pronunciation with the TBL algorithm, based on this aligned corpus.

  • PDF

동적 과점시장의 관리제어: 기업들은 어떻게 이윤극대화에 이를 수 있는가? (Supervisory Control of Dynamic Oligopolistic Markets: How can Firms Reach Profit-Maximization?)

  • 박성진
    • 제어로봇시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.304-312
    • /
    • 2011
  • In an oligopolistic market, only a few firms account for most or all of total production, e.g., automobile, steel, and computer industries. For a dynamic oligopolistic market with two firms competing in quantities, we show that supervisory control theory of discrete event systems provides a novel approach to solve the dynamic oligopoly problem with the aim of maximizing the profits of both firms. Specifically, we show that the controllability, observability, and nonblocking property (which are the core concepts in supervisory control theory) are the necessary and sufficient conditions for two oligopolistic firms in disequilibrium to eventually reach equilibrium states of maximizing the profits of both firms.

음성학적 특징을 이용한 연속 숫자음인식 (Connected Digit Recognition Using Phonetical Features)

  • 김민정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제5권
    • /
    • pp.72-75
    • /
    • 1998
  • 본 논문에서는 숫자음 인식시스템의 인식률 향상을 위한 연구로서 4연속 숫자음을 대상으로 연음 현상 및 경음화 현상등과 같은 음성학적 특징을 고려하여 숫자음에 강건한 모델을 작성하는 방법을 제안하고 인식실험을 통하여 그 유효성을 확인하고자 한다. 이를 위하여 음성자료로서는 국어공학센터(KLE)에서 채록한 4연속 숫자음을 사용하며 인식의 기본단위로서 음향학적 특징을 고려한 19개의 연속분포 HMM을 유사음소 단위(Phoneme Like Units ; PLUS) 로 사용한다. 또한 , 인식실험에 있어서는 기존의 방법으로 모델을 작성한 경우와 연음 현상과 경음화 현상 등과 같은 음성학적 특징을 고려하여 모델을 작성한 경우에 대해서 유한상태 오토마타(finite State Automata ; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming)법으로 인식실험을 수행하여 그 결과를 비교 검토하였다. 그 결과, 기존이 방법의 경우 64.6%, 음성학적 특징을 고려한 경우 68.6%의 인식률을 보여, 음성학적 특징을 고려한 경우가 4.0% 향상된 인식률을 얻어 제안한 방법의 유효성을 확인하였다.

  • PDF

어떤 정규언어와 Prefix Coding (Some Regular Languages and Prefix Coding)

  • ;나현숙
    • 한국통신학회논문지
    • /
    • 제30권2C호
    • /
    • pp.1-9
    • /
    • 2005
  • 코드는 단어들의 집합이다. 어떤 단어도 다른 것의 Prefix가 아닌 단어들의 집합을 Prefix(-Free) Code라 부르고, 여기서 Prefix Coding이란, 주어진 수 n에 대하여, n개의 단어로 이루어진 Prefix 코드들 중에서 단어길이의 총합이 최소인 최적 Prefix 코드를 찾는 것을 말한다. 이 논문에서는 이의 특수한 경우로서, 특정 정규언어군에 속하는 임의의 정규언어 L에 대하여, L에 속하는 Prefix 코드들 중 최적의 코드를 찾는 방법을 제시한다. 또, 수 n이 변함에 따라 최적 Prefix 코드의 구조가 어떻게 변하는지, 그 성질을 트리구조를 이용해 밝힌다.