• 제목/요약/키워드: 규칙언어

검색결과 682건 처리시간 0.049초

기계학습 기반 경쟁자 자동추출 방법 (Competitor Extraction based on Machine Learning Methods)

  • 이충희;김현진;류법모;김현기;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

하이브리드 방법을 이용한 개선된 문장경계인식 (Advanced detection of sentence boundaries based on hybrid method)

  • 이충희;장명길;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.61-66
    • /
    • 2009
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반 하여 개선된 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 음절을 대상으로 학습하여 문장경계 인식을 수행하였고, 문장경계인식 성능을 최대화 하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 다양한 기계학습 기반 분류 모델을 비교하여 최적의 분류모델을 선택하였으며, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 형태의 문서별 성능 측정을 위해서 문어체와 구어체가 복합적으로 사용된 신문기사와 블로그 문서(평가셋1), 문어체 위주로 구성된 세종말뭉치와 백과사전 본문(평가셋2), 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 사이트의 게시판 글(평가셋3)을 대상으로 성능 측정을 하였다. 성능척도로는 F-measure를 사용하였으며, 구두점만을 대상으로 문장경계 인식 성능을 평가한 결과, 평가셋1에서는 96.5%, 평가셋2에서는 99.4%를 보였는데, 구어체의 문장경계인식이 더 어려움을 알 수 있었다. 평가셋1의 경우에도 규칙으로 후처리한 경우 정확률이 92.1%에서 99.4%로 올라갔으며, 이를 통해 후처리 규칙의 필요성을 알 수 있었다. 최종 성능평가로는 구두점만을 대상으로 학습된 기본 엔진과 모든 문장경계후보를 인식하도록 개선된 엔진을 평가셋3을 사용하여 비교 평가하였고, 기본 엔진(61.1%)에 비해서 개선된 엔진이 32.0% 성능 향상이 있음을 확인함으로써 제안한 방법이 웹 문서에 효과적임을 입증하였다.

  • PDF

능동형 규칙 기반 유비쿼터스 프로세스 설계의 워크플로우 패턴 분석 (Pattern-based Analysis of Ubiquitous Process Design Based on Active Rules)

  • 정재윤;박종헌
    • 한국전자거래학회지
    • /
    • 제14권1호
    • /
    • pp.35-56
    • /
    • 2009
  • 프로세스 설계에는 Petri-net, EPC, UML Activity Diagram 등 다양한 모델 기법이 사용되고 있다. 업무 프로세스 내에 복잡한 업무 규칙이 다수 결합되어 있거나, 유비쿼터스 컴퓨팅과 같이 분산 환경에서 복합한 상호운용 규칙이 산재되어 있는 경우에는 정형적인 프로세스 모델링 기법이 비효율적이므로 규칙 기반의 분산 프로세스 설계를 사용할 수 있다. 본 연구는 유비쿼터스 환경에서의 규칙 기반 프로세스 설계 방법을 분석한다. 특히, 이벤트-조건-액션(ECA) 형태의 능동형 규칙을 이용한 프로세스 설계를 대상으로 분석하며, ECA 스키마는 웹 서비스 기술을 위해 개발된 WS-ECA 언어를 사용한다. ECA 규칙을 이용한 여러가지 프로세스 통제 흐름 표현 방법을 분석하기 위하여 워크플로우 패턴을 활용하였다. 워크플로우 패턴에 따라 ECA 규칙 기반 프로세스 표현법을 제공함으로써 규칙 기반 프로세스를 설계하기 위한 가이드라인을 제시하였다는 데 연구의 의의가 있다.

  • PDF

규칙기반 표의 추이 방법을 이용한 퍼지제어기의 성능개선 (The Performance Improvement of Fuzzy Controller using the Shifting Method of Rule Base Table)

  • 차문철;이철우;김흥수
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.55-62
    • /
    • 2005
  • 퍼지논리제어기가 이상적인 제어효과를 나타내게 할려면 적합한 규칙집합을 사용하는 것이 아주 중요하다. 퍼지논리제어기의 언어구조는 가상언어정책을 초기 규칙기반으로 사용하는 것을 허용한다. 만약 설계단계에서 적당한 규칙들을 일정하게 잘 조합시킨다면 제어기의 성능을 훨씬 더 향상시킬 수 있을 것이다. 본 논문에서 퍼지제어기 성능을 개선하기 위한 규칙기반 표에서의 원소추이방법을 제안하였다. 제안된 방법은 에러가 증가되면 시스템을 조절하는 출력의 제어효과가 증대될 것이고 반대로 에러가 감소되면 그에 따른 출력의 제어효과가 감소할 것이라는 원리를 기반으로 하였다. 모의실험결과에 의해 제안된 방법은 퍼지제어 규칙기반과 퍼지논리제어기의 성능을 향상시키기 위한 아주 효과적인 방법임을 알 수 있다.

프로토콜 공학기술 : 적합성시험언어 번역기술 (Translation Technology of Conformance Test Language)

  • 김광수;강태운;임주환
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1991년도 추계종합학술발표회논문집
    • /
    • pp.196-198
    • /
    • 1991
  • 분산 시스팀 환경하에서 여러 다양한 구성요소사이의 상호작용과 통신을 관장하는 규칙들인 프로토콜을 설계하는데 있어서 컴퓨터 과학 및 공학 영역의 형식방법과 소프트웨어 공학기법이 적용되고 있다. 그 결과로서 새로운 영역인 프로토콜 공학(Protocol Engineering)의 중요성이 점차 대두되고 있다. 본 연구에서는 프로토콜 공학 사이클(프로토콜과 서비스 명세, 프로토콜 검정과 검증, 프로토콜 종합, 프로토콜 변환, 성능 평가, 자동 구현, 그리고 적합성 시험) 중에서 적합성시섬 즉, 적합성 시험언어인 TTCN(Tree and Tabular Combined Notation) 특성, 시험시나리오, 그리고 추상적 시험 시나리오를 수행하는 시험언어 번역기(TTCN2C)에 관해서 논하였다.

내장헝 시스템 설계 언어인 SystemC로 부터의 Blif-MV 변환 규칙 연구 (A Study on the Translation Rule from SystemC to Blif-MV : SC2MV)

  • 김민숙;안영정;방기석;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.76-78
    • /
    • 2002
  • 내장형 시스템의 개발에 있어서 자원의 효율적인 활용과 정확한 설계를 위해 SystemC를 이용한 통합설계 방식이 많이 사용되고 있다. 하지만 시스템이 점점 복잡해 지면서 단순한 언어차원에서의 개발 뿐 아니라 개발 이전에 시스템의 정확성을 검증해야 할 필요성이 대두되었다. 이를 위해 정형기법 및 테스팅과 같은 방법을 사용하게 되었다. 본 논문에서는 SystemC로부터 정형기법 도구인 VIS의 입력 언어인 BLIF-MV로 자동 변환하는 알고리즘을 제시하고, SystemC 코드로부터의 자동 검증 방법을 제안하고자 한다.

  • PDF

확률적 명제 논리 프로그래밍

  • 신양규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제6권1호
    • /
    • pp.13-21
    • /
    • 1995
  • 논리 언어로 불확실한 정보의 표현과 처리가 가능하도록 논리 프로그램을 확장하였다. 이러한 확장을 위해 의미론이 명확한 확률 논리를 응용하였고, 확률적 연역 추론을 위해 추론 규칙들을 공리화하여 기본 지식과 함께 처리될 수 있게 하였다. 여기서는 기존 논리 프로그램의 명제 부분만을 대상으로 하였으며, 확장된 논리 프로그래밍 언어는 기존 언어에서 간단한 인터프리터를 사용하여 쉽게 구현하여 이용할 수 있다.

  • PDF

제한 논리 프로그래밍 언어에서 DCG를 이용한 생물학적 서열의 구조 검색 (Structure Searching of Biological Sequence using DCG in Constraint Logic Programming Language)

  • 이근우;이수현;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.352-354
    • /
    • 2001
  • 생물학적 서열의 구조 검색은 생물학적 특성을 예측하는데 많은 도움을 주며, 서열에서 나타나는 구조의 패턴은 촘스키의 형식 언어로 기술 가능하다. 본 논문에서는 문맥무관문법의 확장된 표기법인 DCG를 이용하여 구조 검색을 위한 구조 패턴의 생성 규칙을 정의하였다. 또한 구조 검색의 효율향상을 위하여 구조와 관련한 제한(constraint)을 정의하였고 이를 제한 논리 프로그래밍 언어로 구현하였다. 구현된 구조 검색 엔진은 웹 인터페이스를 통하여 접근할 수 있다.

  • PDF

Jess를 이용한 OWL과 SWRL의 통합추론에 관한 연구 (Integration of OWL and SWRL Inference using Jess)

  • 이기철;이지형
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.875-880
    • /
    • 2005
  • W3C에서는 온톨로지의 표준언어로 OWL(Web Ontology Language)을 발표하였고 이를 활용한 온톨로지가 다양한 곳에 적용되어 구축되고 있다. 하지만, DL(Description Logic)기반인 OWL언어가 표현할 수 있는 규칙의 한계로 인하여 이를 화장하기 위한 연구가 활발히 진행되고 있다. 이러한 연구를 통하여 W3C에서는 OWL과 RuleML(Rule Markup Language)을 통합하여 규칙(Rule)에 대한 표현력이 더욱 향상된 SWRL(Semantic Web Rule Language) 언어를 제안하였다. 따라서 최근에는 온톨로지 구축을 위해 OWL과 SWRL언어가 함께 사용되기 시작하였다. 그러나 이렇게 통합적으로 구성된 온톨로지의 추론을 위한 방법에 대한 연구는 시작단계에 있다. 현재의 일반적인 방법은 OWL로 기술된 부분은 Racer등을 이용한 DL추론을 수행하고 SWRL로 기술된 부분은 Jess등을 이용한 Rule-base 추론이 병렬적으로 사용되고 있다. 이에 따라 본 논문에서는 OWL과 SWRL로 기술된 온톨로지를 추론하기 위한 엔진으로 Racer와 Jess의 병행이 아닌, Jess를 이용한 통합추론엔진의 개발에 관하여 기술한다. 이러한 시스템을 구축하기 위해 OWL을 Jess언어를 이용하여 추론할 수 있도록 개발된 OWL Jess KB와 SWRL 언어를 Jess 언어로 변환하는 SWRL Factory를 이용하는 세 가지 통합 추론 플랫폼을 제안한다.