• Title/Summary/Keyword: 규칙 자동 구축

Search Result 132, Processing Time 0.04 seconds

Chinese Segmentation and POS-Tagging by Automat ic POS Dictionary Training (품사 사전 자동 학습을 통한 중국어 단어 분할 및 품사 태깅)

  • Ha, Ju-Hong;Zheng, Yu;Lee, Gary G.
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.33-39
    • /
    • 2002
  • 중국어의 품사 태깅(part-of-speech tagging)을 위해서는 중국어 문장들은 내부 단어간의 명확한 분리가 없기 때문에 단어 분할(word segmentation)과 품사 태깅을 동시에 처리해야 한다. 본 논문은 규칙 기반(rule base)과 사전 기반(dictionary base) 기법을 혼합하여 구현한 단어 분할 시스템을 사용하여 입력 문장을 단어 단위로 분할하고, HMM(hidden Markov model) 기반 통계적 품사 태깅 기법을 사용한다. 특히, 본 논문에서는 주어진 말뭉치(corpus)로부터 자동 학습(automatic training)을 통해 품사 사전을 구축하여 구현된 시스템과 말뭉치간의 독립성을 유지한다. 말뭉치는 중국어 간체와 번체 모두를 대상으로 하고, 각 말뭉치로부터 자동 학습을 통해 얻어진 품사 사전으로 단어 분할과 품사 태깅을 한다. 실험결과들은 간체, 번체 각각의 단어 분할 성능과 품사 태깅 성능을 보여준다.

  • PDF

Automatic 5 Layer Model construction of Business Process Framework(BPF) with M2T Transformation (모델변환을 이용한 비즈니스 프로세스 프레임워크 5레이어 모델 자동 구축 방안)

  • Seo, Chae-Yun;Kim, R. Youngchul
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.13 no.1
    • /
    • pp.63-70
    • /
    • 2013
  • In previous research, we suggested a business process structured query language(BPSQL) for information extraction and retrieval in the business process framework, and used an existing query language with the tablization for each layer within the framework, but still had a problem to manually build with the specification of each layer information of BFP. To solve this problem, we suggest automatically to build the schema based business process model with model-to-text conversion technique. This procedure consists of 1) defining each meta-model of the entire structure and of database schema, and 2) also defining model transformation rules for it. With this procedure, we can automatically transform from defining through meta-modeling of an integrated information system designed to the schema based model information table specification defined of the entire layer each layer specification with model-to-text conversion techniques. It is possible to develop the efficiently integrated information system.

A Bidirectional Korean-Japanese Statistical Machine Translation System by Using MOSES (MOSES를 이용한 한/일 양방향 통계기반 자동 번역 시스템)

  • Lee, Kong-Joo;Lee, Song-Wook;Kim, Jee-Eun
    • Journal of Advanced Marine Engineering and Technology
    • /
    • v.36 no.5
    • /
    • pp.683-693
    • /
    • 2012
  • Recently, statistical machine translation (SMT) has received many attention with ease of its implementation and maintenance. The goal of our works is to build bidirectional Korean-Japanese SMT system by using MOSES [1] system. We use Korean-Japanese bilingual corpus which is aligned per sentence to train the translation model and use a large raw corpus in each language to train each language model. The proposed system shows results comparable to those of a rule-based machine translation system. Most of errors are caused by noises occurred in each processing stage.

A Study on the Automatic Abstracting System for Journal Articles in Korean in the Field of Microbiology (한국어 초록 작성의 자동화에 관한 연구 -미생물학분야 학술지의 논문을 대상으로-)

  • 이태영
    • Journal of the Korean Society for information Management
    • /
    • v.9 no.2
    • /
    • pp.43-79
    • /
    • 1992
  • This study proposes a Korean aut.omatic abstracting system in microbiology by applying Case Grammar, Concept Dependency Grammar, and Unification-Based Grammar(PATR- I[. DCG). The sample abstracts are analyzesd to clarify the ideal structure of abstract-a purpose sentence as first sentcnce, 2-3 method and result sentences as middle sentences, and a conclusion sentence as last sentences. To extract and refine the representative sentences constructing an automated abstract requires tht. rules giving the role features to nouns. And t.he rules rearranging the extracted sentences and the rules generating the abstract sentences arc also required. Evaluat.ing the effic~ency of this system. the method used in this automatic abstracting system needs thc more precise role features and the rules of sentence generation to reach the level of the author abstracts.

  • PDF

Competitor Extraction based on Machine Learning Methods (기계학습 기반 경쟁자 자동추출 방법)

  • Lee, Chung-Hee;Kim, Hyun-Jin;Ryu, Pum-Mo;Kim, Hyun-Ki;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

A Study on the Automatic Lexical Acquisition for Multi-lingustic Speech Recognition (다국어 음성 인식을 위한 자동 어휘모델의 생성에 대한 연구)

  • 지원우;윤춘덕;김우성;김석동
    • The Journal of the Acoustical Society of Korea
    • /
    • v.22 no.6
    • /
    • pp.434-442
    • /
    • 2003
  • Software internationalization, the process of making software easier to localize for specific languages, has deep implications when applied to speech technology, where the goal of the task lies in the very essence of the particular language. A greatdeal of work and fine-tuning has gone into language processing software based on ASCII or a single language, say English, thus making a port to different languages difficult. The inherent identity of a language manifests itself in its lexicon, where its character set, phoneme set, pronunciation rules are revealed. We propose a decomposition of the lexicon building process, into four discrete and sequential steps. For preprocessing to build a lexical model, we translate from specific language code to unicode. (step 1) Transliterating code points from Unicode. (step 2) Phonetically standardizing rules. (step 3) Implementing grapheme to phoneme rules. (step 4) Implementing phonological processes.

A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules (확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기)

  • Lee, Su-Gwang;Ok, Cheol-Yeong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.5
    • /
    • pp.48-460
    • /
    • 2001
  • 국어사전의 뜻풀이말은 표제어의 의미를 기술할 뿐만 아니라, 상위/하위개념, 부분-전체개념, 다의어, 동형이의어, 동의어, 반의어, 의미속성 등의 많은 의미정보를 내재하고 있다. 본 연구는 뜻풀이말에서 다양한 의미정보를 획득을 위한 기본적인 도구로서 국어사전의 뜻풀이말 구문분석기를 구현하는 것을 목적으로 한다. 이를 위해서 우선 국어사전의 뜻풀이말을 대상으로 일정한 수준의 품사 및 구문 부착 말 뭉치를 구축하고, 이 말뭉치들로부터 품사 태그 중의성 어절의 빈도 정보와 통계적 방법에 기반한 문법규칙과 확률정보를 자동으로 추출한다. 본 연구의 뜻풀이말 구문분석기는 이를 이용한 확률적 차트파서이다. 품사 태그 중의성 어절의 빈도 정보와 문법규칙 및 확률정보는 파싱 과정의 명사구 중의성을 해소한다. 또한, 파싱 과정에서 생성되는 노드의 수를 줄이고 수행 속도를 높이기 위한 방법으로 문법 Factoring, Best-First 탐색 그리고 Viterbi 탐색의 방법을 이용한다. 문법규칙의 확률과 왼쪽 우선 파싱 그리고 왼쪽 우선 탐색 방법을 사용하여 실험한 결과, 왼쪽 우선 탐색 방식과 문법확률을 혼용하는 방식이 가장 정확한 결과를 보였으며 비학습 문장에 대해 51.74%의 재현률과 87.47%의 정확률을 보였다.

  • PDF

Recommendation System Using Multi-Strategy Learning. (복수전략 학습을 이용한 추천 시스템)

  • Han, Hyun-Ku;Suh, Euy-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.338-339
    • /
    • 2010
  • 사용자가 원하는 정보를 자동으로 찾아내어 제공하는 추천시스템은 최근 사용자의 만족도를 높이기 위해 많은 연구들이 진행되고 있다. 본 논문은 사용자의 프로파일, 음식 주문 내용 및 날씨/온도 등 외부요인을 기반으로 의사 결정나무를 이용하여 개인의 선호도를 분석하고 연관규칙을 이용하여 음식의 연관성을 분석한 후 음식을 추천하는 유연성 있는 개인화 추천시스템을 제안하고 구축하였다. 본 시스템은 복수 전략 학습을 이용하여 추천함으로써 단일 학습방법을 사용했을 때보다 만족도가 높아지는 것을 알 수 있었다.

The Analysis of Introduction of Real-Time Active Database Technologies for Advanced Alarm Processing of Nuclear Power Plant (원전의 개량형 경보처리를 위한 실시간 능동 데이터베이스 기술 도입 분석)

  • Jang, Gwi-Sook;Park, Heui-Youn;Keum, Jong-Yong;Kim, Young-Kuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.38-42
    • /
    • 2007
  • 최근 원전 경보시스템은 운전원이 상황을 판단하는 데 불필요한 일시적인 경보나 결과 경보를 감축 및 억제하여 운전원의 주의가 특별히 필요한 경보에 집중하도록 하는 개량형 경보처리를 필요로 한다. 데이터베이스를 기반으로 원전 개량형 경보 시스템은 데이터베이스에 어떤 이벤트가 발생하면, 특정 공정을 검사해 조건이 맞는 경우 어떤 행동을 자동적으로 수행하여 경보처리를 수행할 필요가 있다. 또한 능동규칙의 사용으로 데이터베이스 상태 변화에 자동으로 대응하는 유용성을 확보해야 한다. 따라서 시간제한 개념을 가지는 데이터베이스 모델과 이를 바탕으로 한 능동 처리 기능을 가진 실시간 시스템을 구축하여 경보감축 및 억제를 수행할 수 있다. 본 논문은 원전의 개량형 경보처리를 위한 데이터베이스 설계 고려 사항들을 분석하여 실시간 능동 데이터베이스 기술을 도입하기 위한 분석을 수행한다. 그리고 능동 규칙을 이용한 개량형 경보처리 예와 구현 고려사항을 파악한 후 개발 계획을 정립한다.

  • PDF

Design of Automatic Trader Agent for Comparison (비교쇼핑을 위한 자동 거래 에이전트의 모델링)

  • 김민선;김수동
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.373-375
    • /
    • 2000
  • B2B, B2C, B2G, C2C로 구체화된 전자 상거래는 관련 국제 컨소시엄이 구축되고 그 유형에 있어서도 경매, 교환, 직구매, 입찰 등으로 다양해지는 등 이미 차세대 기업 비즈니스 모델로서의 위치를 확고히 하고 있고, 나아가 차별화 된 솔루션으로서 점원이 있는 시장, 실시간 인터넷 대금 납부 등의 서비스들이 국내외적으로 많이 모색되고 있는 실정이다. 본 논문에서는 비교쇼핑 에이전트를 지원하는 B2C 솔루션(ISPA:mIn Seon comparison Agent)을 제안하고 있는데, 비교 쇼핑 에이전트 역시 그러한 노력의 일례로서 이는 동종의 상품을 취급하는 여러 몰 간에도 그 제시 가격이 서로 다른 것에 착안하여 최저가격을 제시하는 사이트를 안내하는 기능을 한다. ISPA는 현 업계에서 웹 기반 시스템의 솔루션으로서 각광 받고 있는 EJB를 플랫폼으로 하며, 각 정보소스에 대한 정보 추출 규칙을 활용해서 온라인으로 비교 정보를 제공하는 종래의 인공지능의 접근과는 달리 J2EE 웹 개발 기술을 이용하여 오프라인으로 비교 정보를 구축하는 웹 기반 시스템으로써 에이전트를 지원한다. 나아가 핵심 클래스인 상품 클래스를 메타 데이터의 부분집합으로써 정의하는 기법을 적용하였는데 이는 개체 지향 패러다임의 시스템 구축 시에 전략적으로 응용될 수 있다.

  • PDF