• Title/Summary/Keyword: 규칙언어

Search Result 684, Processing Time 0.029 seconds

Hybrid Part-of-Speech Tagging using Context Information among Words (어절간 문맥 정보를 이용한 혼합형 품사 태깅)

  • Lim, Hee-Dong;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.376-380
    • /
    • 2000
  • 본 논문에서는 규칙 정보와 통계 정보의 상호 보완적 특성을 이용한 혼합형 방법을 기반으로 규칙 정보와 통계 정보의 추출 및 적용 시에 어절간 문맥 정보를 보다 효율적으로 이용하는 혼합형 품사 태깅 시스템을 제안한다. 먼저 규칙이 적용되는 중의성들에 대해서 높은 정확률로 태깅을 수행한 후, 규칙으로 해결할 수 없는 중의성들에 대해서는 통계 정보를 이용하여 태깅을 수행한다. 규칙 정보는 중의성을 갖는 어절과 주변 어절들의 형태소 및 태그를 이용하여 정의하고 통계 정보는 문맥에 영향을 많이 미치고 많은 중의성의 원인이 되는 조사와 어미의 형태를 그대로 활용하여 추출함으로써 어절간 문맥을 보다 효율적으로 이용한다.

  • PDF

Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge (강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합)

  • JoongMin Shin;Sanghyun Cho;Seunglyul Park;Seongki Choi;Minho Kim;Miyeon Kim;Hyuk-Chul Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.289-294
    • /
    • 2022
  • 의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

  • PDF

PRAiSE: A Rule-based Process-centered Software Engineering Environment (PRAiSE : 규칙 기반 프로세스 중심 소프트웨어 공학 환경)

  • Lee, Hyung-Won;Lee, Seung-Iin
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.11 no.3
    • /
    • pp.246-256
    • /
    • 2005
  • Rule-based paradigm is one of the principal types of software process modeling and enaction approaches, as they provide formality and flexibility sufficient to handle complex processes. However, the systems adopting rule-based paradigms are hard to define and understand process models, and their inference engine should be modified or redeveloped at worst according to the change of process language. In this paper, we describe a rule-based PSEE(Process-Centered Software Engineering Environment) PRAiSE that solves the above limitations of existing rule-based PSEEs as well as maintains the merits of rule-based paradigm such as the ability to incorporate the nature of software processes flexibly in which dynamic changes and parallelism are pervasive and prevalent. PRAiSE provides RAiSE, a graphical Process modeling language, and defined process models are interpreted and enacted by process engine implemented using CLiPS, a rule based expert system tool.

The Method of Classification Considering Rule Weights in the Interval-Valued Fuzzy Sets (구간값 퍼지집합에서 규칙 가중치를 고려한 분류방법)

  • Son Chang-Sik;Jeong Hwan-Muk
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.85-89
    • /
    • 2006
  • 구간값 퍼지집합은 일반적인 퍼지집합보다 언어적인 의사결정 절차에서 매핑의 정확성과 계산의 효율성이 뛰어나고, 규칙의 가중치는 패턴 분류문제에서 분류 경계를 효율적으로 조정할 수 있다는 장점을 가지고 있다. 따라서 본 논문에서는 퍼지규칙 기반 분류방법을 구간값 퍼지규칙 기반 분류방법으로 확장하고 규칙의 가중치를 고려한 분류방법을 제안한다. 모의실험에서는 일반 퍼지집합에서 규칙 가중치를 고려한 분류방법과 구간값 퍼지집합에서 규칙 가중치를 고려한 분류방법을 비교하였다.

  • PDF

Ontology-Based Context Aware System for Ubiquitous Environment (유비쿼터스 환경을 위한 온톨로지기반 상황인지 시스템)

  • Kwon, Sun-Hyon;Park, Young-Tack
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.281-286
    • /
    • 2007
  • 유비쿼터스 컴퓨팅이란 사용자에게 지속적인 서비스를 제공해주는 컴퓨팅 환경을 말한다. 끊임없이 동적으로 변하는 유비쿼터스 환경에서 수많은 상황데이터가 발생을 하고 상황정보로 추상화하는 과정이 필수적이다. 상황인지시스템은 동적인 상황정보에 대한 생성, 조작, 공유 등이 일관성 있게 이루어져야 한다. 이러한 상황정보의 조작을 위한 수많은 상황인지 모델이 제시되고 연구되어 왔다. 본 논문에서는 유비쿼터스 환경을 위한 온톨로지 기반 상황인지 시스템을 제시한다. 상황정보에 대한 생성, 컨텍스트 추론, 지식의 공유을 위해 온톨로지 표준언어인 OWL을 사용한 컨텍스트 온톨로지를 생성한다. 디바이스의 상황정보 생성을 위해 SWRL 규칙언어를 사용하고 생성된 디바이스 상황에 고장진단 및 수리서비스를 제공하기 위해 규칙추론기반 언어인 Jess를 사용하고 OWL기반의 컨텍스트 온톨로지와의 연계를 위해 Jess Tab API를 사용한다.

  • PDF

The Corpus-probability Based Generation of Korean Standard Pronunciation (코퍼스 확률에 기반한 한국어 표준발음 생성)

  • Kim, Dong-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.210-215
    • /
    • 2007
  • 본 연구에서는 코퍼스 확률에 기반하여 한국어 표준 발음 생성에 대한 연구를 한다. 기존의 이은영 외 (2005)에서 연구된 규칙기반의 한국어 IPA 발음 변환방식과는 달리 본 연구에서는 음운변환 코퍼스를 바탕으로 표준발음을 변환한다. 이 방식을 위해서 Brill(1995)에서 제안한 변형기반 학습방식이 활용되었으며, 단계적인 처리방식이 아닌 입-출력 대응 방식의 확률적 처리 방식이 제안되었다. 음운변환 방식은 음운규칙에 근거한 처리가 아닌 언어자원인 코퍼스를 활용해서 처리하였다는 점에서 기존의 연구방식과 차이가 있다. 또한, 기존 연구에서는 음운규칙을 단계적으로 적용하여서 입력형이 출력형으로 도출되기 위해서 여러 단계를 거쳤지만, 본 연구에서는 입력형과 출력형의 일대일 대응이라는 점에서 차이점을 보인다.

  • PDF

Design and Implementation of XHTML Code Generator (XHTML 코드 생성기의 설계와 구현)

  • 계승철;전서현
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.24-29
    • /
    • 2001
  • XHTML은 HTML의 요소와 XML의 문법을 가진 마크업 언어이다. XML과 HTML의 장점을 결합하여 발표되었으며, HTML에서 XML로 가는 중간단계로, HTML을 대체할 언어로, 또는 유무선 통합을 위한 마크업 언어로 보고 있다. XHTML 언어를 이용하기 위해 텍스트나 기존에 널리 쓰이고 있는 HTML을 규칙에 맞는 HTML로 바꾸고, 간단한 조작으로 쉽게 XHTML로 바꿀 수 있도록 하는 XHTML 코드 생성기를 설계·구현하였다.

  • PDF

A study on the ambiguous adnominal constructions in product documentation (제품 설명서에 나타나는 중의적 명사 수식 구문 연구 - 통제 언어의 관점에서-)

  • Park, Arum;Ji, Eun-Byul;Hong, Munpyo
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.23-28
    • /
    • 2012
  • 번역을 지원하는 도구로 자동 번역 시스템을 효율적으로 활용하기 위해 중요한 것은 자동 번역에 적합하도록 원문을 작성하거나 이미 작성된 원문에 대한 전처리 작업을 하는 것이다. 본 연구의 궁극적인 목표는 제품 설명서 작성자가 통제언어 체커를 통해 통제언어 규칙들을 적용하여 원문을 작성하도록 하는 것이다. 본 논문은 그 중간 단계로써 제품 설명서에 나타나는 문제 사항이 번역 품질에 어떠한 영향을 미치는지 밝혀내는 것을 목적으로 한다. 연구 대상은 제품 설명서에서 자동 번역의 성능을 저해시키는 요소 중 중의적 명사 수식 구문이다. 이러한 명사 수식 구문들은 분석 단계에서 구조적인 모호성을 초래하여 한국어 분석의 정확도를 떨어뜨리기 때문에 결과적으로 번역 품질을 악화시킬 수 있다. 이를 검증하기 위해 우선 제품 설명서 데이터를 분석하여 자동 번역 결과에 부정적인 영향을 미치는 명사 수식 구문을 다음과 같이 4가지로 유형화 하였다. (유형 1) 관형격 명사구 + 명사 병렬 접속, (유형 2) 동사의 관형형이 수식하는 명사구 + 명사 병렬 접속, (유형 3) 관형격 조사 '의' 중복, (유형 4) 병렬 접속어를 잘못 쓴 경우, 각각의 유형에 대해서 한국어 분석 단계에서 발생할 수 있는 문제에 대해 설명하였으며, 문제 사항에 대해 통제언어 규칙을 제시하였다. 통제언어 규칙에 따라 중의적 명사 수식 구문을 수정한 결과, 한국어 원문의 번역결과보다 한국어 수정문의 번역결과가 작성자의 의도를 더 잘 나타낸다는 것을 확인할 수 있었다.

  • PDF

A Study on a Multilingual name Retrieval (다중 언어 인명 검색에 관한 연구)

  • Cho, Young-Hwa;Song, Jae-Yong;Ryu, Keun-Ho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.9
    • /
    • pp.2271-2280
    • /
    • 1998
  • In this paper, we propose a method to retneve english written korcan names efficientl, and design a multilingual name retrieval system, It is very difficult to retrieve english-written korean names in typical IR sytems. For example, "홍길동" is written in english as vanous forms such like "Hong, gildong", "Gildong Hong", "Hong kil dong", "Hong kil dong" and so on, We not only propose a rule-based querv expansion method to retrieve english-written korean names efficiently but also design a multiligual name retneval system which is consisted of query classifier, exception handler, query expander, query executor, exception list and rulebase, Finally we will try to show that english-written korean names could be efficiently retrieved with rule based name generator.

  • PDF