• Title/Summary/Keyword: 생성규칙

Search Result 1,200, Processing Time 0.043 seconds

명사 어형의 생성과 그 조건

  • Lee, Gi-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.268-283
    • /
    • 1996
  • 동사 어간과는 달리 명사 어간은 그 자체로도 어형(word form)이 될 수 있다. 그러나 일반적으로는 명사 어간에 조사가 하나 또는 여러 개가 결합되어 어형이 형성된다. 이 논문은 이러한 명사 어형을 효율적으로 생성할 수 있는 규칙기반의 어형 생성 시스템 골몰(KORean MORphological system)이 어떻게 운용되는가를 시연하는 것이 그 목적이다. 이 시스템 변이형 포함한 기본 조사 108개를 기초로 하여 3,000여개의 복합형 조사를 생성한다. 그러나 국어의 명사 어간에 조사가 하나뿐 아니라 6개까지도 결합될 수 있으므로 명사 어형 생성과정에서 과잉 생성의 문제 발생한다. 생성 과정을 통제하기 위하여 골몰은 기본 조사에 결합 순서치(Order)를 할당하고 좌연접 요구(Requires) 조건을 명시하여 줌으로써 조사가 이미 도입된 좌측의 명사 어간과 적절히 결합될 수 있도록 장치되었다. 이 논문은 명사 어간과 조사의 이러한 결합 통제 조건을 논하고 골몰을 통해 명사 어형들이 어떻게 분석되고 생성되는가를 간단히 예를 보여 줌으로써 시스템의 충족성을 뒷받침한다.

  • PDF

Automatic Wrapper Generating Agent based on XML (XML 기반의 Wrapper 자동 생성 에이전트)

  • 서희경;양재영;정현섭;최중민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.48-50
    • /
    • 2000
  • 본 논문은 사용자를 대신해서 웹상의 여러 곳에 존재하는 정보를 추출하고 통합하여 사용자에게 제공하기 위한 에이전트 시스템을 설계하고자 한다. 정확한 정보 추출을 위해서는 추출하고자 하는 정보의 위치를 찾아내는 정보 추출 규칙이 요구된다. 이러한 규칙을 알아내기 위해서 본 논문에서 제안하는 시스템은 XML로 기술된 도메인 지식을 이용한다. 이 도메인 지식은 논리적 라인의 의미 분석에 사용되며, 논리적 라인의 의미를 기반으로 도메인 문서에서 추출해야 하는 정보의 패턴을 학습한다. 학습된 패턴에서 XML로 기술된 규칙을 생성하는데, 이 규칙은 Wrapper이 된다. 이렇게 생성된 규칙을 이용해서 정보를 추출하게 되며, 추출된 정보를 통합해서 사용자에게 제공하게 된다.

  • PDF

An Association Rules Mining System based-on SQL (SQL을 이용한 연관 규칙 탐사 시스템)

  • 전수정;김영지;우용태
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.89-94
    • /
    • 2000
  • 본 논문에서는 연관 규칙 탐사 시스템을 설계하고 구현하였다. 본 시스템은 관계형 데이터베이스의 표준 질의어를 이용하여 사용자가 제시한 질의 조건을 만족하는 항목집합에 대해 다양한 형태의 연관규칙을 탐사하기 위한 시스템이다. 질의처리 모듈에서는 사용자가 제시한 조건을 만족하는 질의를 동적으로 구성하여, 연관 규칙 탐사를 위해 사용되는 대상 트랜잭션 데이타베이스의 범위를 조절할 수 있다. 연관 규칙을 발견하기 위한 후보 항목집합을 생성하기 위해 연관 규칙 탐사 알고리즘을 사용하였다. 연관 규칙 알고리즘에서는 한 트랜잭션 데이타에 대해 생성될 수 있는 후보 항목집합을 배열을 이용하여 처리하는 효율적인 방법을 제안하였다.

  • PDF

Automatic Pronunciation Generation System Using Minimum Morpheme Information (최소 형태소 정보를 이용한 자동 발음열 생성 시스템)

  • 김선희;안주은;김순협
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.216-219
    • /
    • 2003
  • 본 논문은 최소한의 형태소 정보를 이용한 자동 발음열 생성 시스템을 제안한다 일반적으로 발음열 생성 시스템은 입력된 문장에 대하여 형태소 단위로 분석한 다음, 각 형태소와 형태소의 결함 관계를 고려한 음운 규칙을 적용함으로써 상응하는 발음열을 생성한다. 지금까지의 연구는 이러한 발음열 생성시의 형태소 분석에 관하여 그 범위에 관한 연구 없이, 가능한 최대한의 분석을 상정하고 있다. 본 논문은 한국어 음운현상을 체계적인 텍스트 분석을 통하여 모든 형태론적 음운론적인 환경에서 가능한 모든 음운현상을 분류하여 발음열 생성시에 실제로 필요한 형태소 분석의 범위를 규명하는 것을 그 목적으로 한다. 음운 현상을 분석하기 위해 사용한 텍스트 자료로는 어휘가 중복되지 않으면서도 많은 종류의 어휘가 수록된 5만 여 어휘의 연세한국어사전과 2200 여 개의 어미와 조사를 수록한 어미조사사전을 이용하였다. 이와 같이 텍스트를 분석한 결과, 음운현상은 규칙적인 음운 현상과 불규칙적인 음운현상으로 나뉘는데, 이 가운데 형태소 정보가 필요한 형태음운규칙으로는 두 가지가 있으며, 이러한 형태음운규칙을 위한 형태소 분석의 범위로는 세세한 분류를 필요로 하지 않는 최소한의 정보로 가능함을 보인다. 이러한 체계적인 분석을 기반으로 제안하는 자동 발음열 생성 시스템은 형태음운규칙과 예외규칙, 그리고 일반음운 규칙으로 구성된다. 본 시스템에 대한 성능 실험은 PBS 1637 어절과 ETRI 텍스트 DB 19만 여 어절을 이용하여 99.9%의 성능결과를 얻었다.

  • PDF

The Intelligent Intrusion Detection Systems using Automatic Rule-Based Method (자동적인 규칙 기반 방법을 이용한 지능형 침입탐지시스템)

  • Yang, Ji-Hong;Han, Myung-Mook
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.12 no.6
    • /
    • pp.531-536
    • /
    • 2002
  • In this paper, we have applied Genetic Algorithms(GAs) to Intrusion Detection System(TDS), and then proposed and simulated the misuse detection model firstly. We have implemented with the KBD contest data, and tried to simulated in the same environment. In the experiment, the set of record is regarded as a chromosome, and GAs are used to produce the intrusion patterns. That is, the intrusion rules are generated. We have concentrated on the simulation and analysis of classification among the Data Mining techniques and then the intrusion patterns are produced. The generated rules are represented by intrusion data and classified between abnormal and normal users. The different rules are generated separately from three models "Time Based Traffic Model", "Host Based Traffic Model", and "Content Model". The proposed system has generated the update and adaptive rules automatically and continuously on the misuse detection method which is difficult to update the rule generation. The generated rules are experimented on 430M test data and almost 94.3% of detection rate is shown.3% of detection rate is shown.

Automatic Fuzzy Rule Generation by Simulating Human Knowledge Gathering Process (사람의 지식 축정과정 모사를 통한 자동 퍼지규칙의 생성)

  • 정성훈
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.5 no.4
    • /
    • pp.12-17
    • /
    • 1995
  • Fuzzy rules, developed by experts thus far, may be often inconsistent and incomplete. This paper proposes a new methodology for automatic generation of fuzzy rules which are nearly complete and not inconsistent. This is accomplished by simulating a knowledge gathering process of humans from control experiences. This method is simpler and more efficient than existing ones. It is shown through simulation that our method even generates better rules than those generated by experts, under fine tuned parameters.

  • PDF

Design and Implementation User Profile Creation System using XML Document (XML문서를 이용한 사용자 프로필 생성 시스템 설계 및 구현)

  • 권순덕;고재진;정승훈;양상석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.19-21
    • /
    • 2003
  • 본 논문은 다양한 인터넷 컨텐츠를 제공하는 시스템에서 XML문서를 이용한 사용자 프로필 생성 시스템을 설계하고 구현하였다. 본 시스템은 구매와 같은 하나의 트랜잭션이 발생하기 전에 사용자 구매 패턴을 분석하기 위해서 필요한 프로필을 정의하는 모듈과 이를 적용한 사용자 프로필 생성 모듈로 구성되어 있다. 프로필 정의 단계에서는 XML의 DTD를 이용해서 사용자 프로필 규칙을 정의하고 저장한다. 그리고 사용자 프로필 생성 모듈에서는 트랜잭션이 일어날 때 발생되는 XML문서를 파싱해서 XPath형태로 저장되어 있는 규칙 리스트에 적용한 후 필요한 XML문서의 요소 값들을 이용해서 사용자 프로필을 생성한다. 또한 추가적인 장점으로는 하나의 복잡한 모듈이나 패키지로만 제공되어지는 규칙을 사용하지 않고 관리자나 사이트를 운용하는 운영자가 직접 규칙을 정의하고 규칙에 대한 설명을 통해서 자신의 환경에 맞는 사용자 프로필에 대한 정보 추출 및 CRM(Customer Relationship Management)을 지원 할 수 있다.

  • PDF

Construction of Korean Linguistic Information for the Korean Generation on KANT (Kant 시스템에서의 한국어 생성을 위한 언어 정보의 구축)

  • Yoon, Deok-Ho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.12
    • /
    • pp.3539-3547
    • /
    • 1999
  • Korean linguistic information for the generation modulo of KANT(Knowledge-based Accurate Natural language Translation) system was constructed. As KANT has a language-independent generation engine, the construction of Korean linguistic information means the development of the Korean generation module. Constructed information includes concept-based mapping rules, category-based mapping rules, syntactic lexicon, template rules, grammar rules based on the unification grammar, lexical rules and rewriting rules for Korean. With these information in sentences were successfully and completely generated from the interlingua functional structures among the 118 test set prepared by the developers of KANT system.

  • PDF

Weighted Fuzzy Backward Reasoning Using Weighted Fuzzy Petri-Nets (가중 퍼지 페트리네트를 이용한 가중 퍼지 후진추론)

  • Cho Sang Yeop;Lee Dong En
    • Journal of Internet Computing and Services
    • /
    • v.5 no.4
    • /
    • pp.115-124
    • /
    • 2004
  • This paper presents a weighted fuzzy backward reasoning algorithm for rule-based systems based on weighted fuzzy Petri nets. The fuzzy production rules in the knowledge base of a rule-based system are modeled by weighted fuzzy Petri nets, where the truth values of the propositions appearing in the fuzzy production rules and the certainty factors of the rules are represented by fuzzy numbers. Furthermore, the weights of the propositions appearing in the rules are also represented by fuzzy numbers. The proposed weighted fuzzy backward reasoning generates the backward reasoning path from the goal node to the initial nodes and then evaluates the certainty factor of the goal node. The algorithm we proposed can allow the rule-based systems to perform weighted fuzzy backward reasoning in more flexible and human-like manner.

  • PDF

Compression of the Rules of Producing Phonetic Values (음가 생성 규칙의 압축)

  • 이계영;임재걸;김경징
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.201-203
    • /
    • 1999
  • 음성합성에서 자연스러운 합성음을 생성하기 위하여 표준 발음법을 페트리넷 근저행렬로 모델링하는 방법으로 표준 발음법을 음가 생성 규칙으로 만들 수 있다. 본 논문은 페트리넷으로 모델링된 음가 생성 규칙의 크기를 줄이는 방법을 제안하고 구현하였다. 압축하기 전의 음가 생성 테이블의 크기는 719*107의 2차원 배열이었으며 구현된 시스템으로 압축한 결과 41*40의 2차원 구조체 배열로 압축되었다.

  • PDF