• 제목/요약/키워드: 규칙 자동 구축

검색결과 132건 처리시간 0.027초

자동 구축된 구문패턴사전과 규칙을 이용한 구묶음 (Chunking Using Automatic Constructed Syntactic Pattern Dictionary and Rule)

  • 임지희;최호섭;이정철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.35-39
    • /
    • 2004
  • 본 논문은 실용적인 구문분석기의 전단계로서, 자동 구축된 구문패턴사전과 규칙을 이용하여 구묶음하는 방법을 제안한다. 우선 규칙은 구문분석 말뭉치(30,875어절)를 대상으로 자동 추출된 고빈도의 규칙(Rewriting Rule)을 본 논문에 맞게 수동으로 구축하였다. 규칙은 조건부, 행위부로 이루어진 이진 규칙(binary rule)의 형태를 이루며, 명사구(NP), 수식어구(AP, DP), 인용구(X), 용언구(VP, VC)을 대상으로 15개를 구축하였다. 그리고 구문패턴은 중심어와 중심어 선행 요소의 특성뿐만 아니라 중심어 후행 요소도 고려하여 형식화시킨 것으로, 중심어의 복합용언 여부에 따라 일반용언패턴과 본+보조용언패턴으로 구분한다. 부분적인 언어 현상의 처리보다는 실세계에서 사용되는 수많은 문장들에 내재되어 있는 매우 광범위한 언어 현상의 처리를 하기 위해, 구문패턴은 형태소주석 말뭉치(460만 어절)을 대상으로 자동 구축하였다. 구축된 구문패턴사전과 규칙을 이용하여 구묶음을 수행한 결과 정확율 83.09%가 나타났다.

  • PDF

그래프 탐색을 이용한 웹으로부터의 온톨로지 기반 규칙습득

  • 박상언;이재규;강주영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.245-254
    • /
    • 2006
  • 지능형 에이전트와 규칙기반 시스템을 이용해 보다 지능적안 웹 환경을 구축하고자 하는 노력이 시맨틱 웹의 발전과 함께 증가하고 있다. 이러한 에이전트와 규칙기반 시스템에 필요한 규칙들을 이미 많은 지식들이 산재해 있는 웹으로부터 습득 할 수 있다면 보다 효율적으로 시스템을을 구축하는 것이 가능하며, 이러한 응용시스템의 확장은 시맨틱 웹의 발전을 더욱 가속화하는 계기가 될 수 있을 것이다. XRML 방법론은 웹으로부터 규칙을 습득하기 위한 단계적 방법을 제시하고 있으며, 온톨로지를 이용함으로써 규칙의 구성 요소들을 자동으로 추출할 수 있도록 지원한다. 그러나 추출된 규칙구성요소들을 조합하여 완전한 규칙을 만드는 과정이 규칙관리자의 수작업에 의존하고 있다. 본 연구는 온톨로지와 그래프 탐색 을 사용함으로써 이과정을 자동화하고자 하는 연구이다. 온톨로지에 있는 규칙의 일반적 패턴을 기반으로 하여 그래프 탐색을 이용해 규칙구성요소들을 조합함으로써 웹 페이지로부터 자동으로 규칙을 추출할 수 있다.

  • PDF

표준 통계 분류 코드 자동 생성 (Automatic Generation of Standard Classification Code)

  • 임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.388-390
    • /
    • 2006
  • 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용하는 한국어 표준 산업/직업 코드 자동분류 시스템을 제안한다. 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다.

  • PDF

유한상태변환기만을 이용한 한국어 형태소 분석 및 품사 태깅 (Korean Morphological Analyzer and POS Tagger Just Using Finite-State Transducers)

  • 박원병;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.165-168
    • /
    • 2006
  • 이 논문은 유한상태변환기만을 이용하여 한국어 형태소 분석 및 품사 태깅 시스템을 제안한다. 기존의 한국어 형태소 분석 시스템들은 규칙기반 형태소 분석기가 주를 이루고 한국어 품사 태깅 시스템은 은닉마르코프 모델 기반 품사 태깅이 주를 이루었다. 한국어 형태소 분석의 경우 유한상태변환기를 이용한 경우도 있었으나, 이 방법은 변환기를 작성하기 위한 규칙을 수작업으로 구축해야 하며, 그 규칙에 따라서 사전이 작성되어야 한다. 이 논문에서는 품사 태깅 말뭉치를 이용해서 유한상태변환기에서 필요한 모든 변환 규칙을 자동으로 추출한다. 이런 방법으로 네 종류의 변환기, 즉, 자소분리변환기, 단어분리변환기, 단어형성변환기, 품사결정변환기를 자동으로 구축한다. 구축된 변환기들은 결합연산(composition operation)을 이용하여 하나의 유한상태변환기를 구성하여 한국어 형태소 분석과 동시에 한국어 품사 태깅을 수행한다. 이 방법은 하나의 유한상태변환기만을 이용하기 때문에 복잡도는 선형시간(linear complexity)을 가지면, 형태소 분석기와 품사 태깅 시스템을 매우 짧은 시간 내에 개발 할 수 있었다.

  • PDF

지도 자동구축을 통한 Fuzzy-GA 기반 Reactive 시스템의 성능 향상 (Improving Fuzzy-GA based Reactive System by Automatic Mar Building)

  • 김영철;조성배;오상록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.563-566
    • /
    • 2001
  • 이 논문에서는 이동로봇의 자유로운 배회 및 목적지 찾기 행동을 위한 진화형 퍼지 제어기의 설계 방법을 제안 한다. 전체 실험공간을 장애물과 충돌없이 자유롭게 움직이기 위해서 진화연산 알고리즘을 이용한 퍼지규칙과 소속함수의 자동생성을 거친 뒤 이를 통해 전체 지도정보를 구축한다. 여러 시스템에서 응용되는 퍼지 제어기는 일반적으로 시스템을 잘 이해하고 있는 전문가로부터 구축되어 사용되어진다. 그러나 사람의 지식과 경험은 간혹 알려진 범위 내에서란 완벽하게 작동하기 때문에 그 범위를 벗어나면 오류를 범할 수 있다. 이러한 알려진 해법외의 새로운 규칙과 제어 방법을 찾기 위하여 유전 알고리즘을 이용한 퍼지규칙과 소속함수를 구축하려는 시도가 많이 이루어지고 있다. 이 논문에서도 유전 알고리즘을 이용하여 이동로봇의 퍼지 제어기에 사용된 규칙과 소속함수의 최적화를 통해 견고한 퍼지 제어기를 설계한다. 이를 통해 구축된 지도정보는 로봇의 Deliberative한 행동을 위해 사용되며, Fuzzy-GA 제어기는 센서기반 Reactive 시스템에서 이용된다. 전체 실험환경의 구성부터 제안한 이동로봇 퍼지 제어기 구축과 지도 구축작업을 컴퓨터 시뮬레이션을 통해 검증하였다.

  • PDF

단문화와 변환 규칙을 이용한 온톨로지의 자동 생성 (Automatic Generation of Ontology with Simplified Sentences and Transfer Rules)

  • 박인철
    • 한국산학기술학회논문지
    • /
    • 제8권5호
    • /
    • pp.1092-1097
    • /
    • 2007
  • 온톨로지의 구축은 상당한 시간과 비용을 소모하기 때문에 상업적인 시맨틱 웹의 구축은 매우 어려운 작업이다. 이러한 문제의 해결 방법은 온톨로지를 자동적으로 구축하는 것이다. 본 논문에서는 대부분의 중요한 정보를 포함하고 있는 웹 문서를 분석하여 온톨로지를 자동으로 생성하는 시스템을 제안한다. 제안하는 시스템은 한국어 문장을 분석하여 문서 내 모든 문장을 단문으로 재구성하는 단문화 과정과 변환 규칙을 이용한 온톨로지 자동 생성 과정의 두 단계로 구성된다. 이러한 시스템은 온라인 쇼핑몰처럼 비슷한 내용을 포함하는 문서가 대다수 존재하고, 문서의 갱신 및 추가가 빈번한 응용 분야에서 매우 유용하게 사용될 수 있다.

  • PDF

가도까와(かどかわ) 시소러스를 이용한 구문관계에서 의미관계로의 사상(寫像) 규칙 (Mapping Rules form Syntactic Relations to Thematic Relations by Using kadokawa(かどかわ) Thesaurus)

  • 박정혜;강신재;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.358-360
    • /
    • 2001
  • 본 논문에서는 의미분석을 위해서 구문관계와 의미관계를 자동으로 사상하는 규칙을 구축한다. 5 만개의 패턴을 수작업으로 사상해서 학습데이터로 만들고 이의 분석을 통해 규칙을 구축했다. 규칙에서는 의미역 결정을 위해서 가도까와 시소러스를 이용하는데, 본 논문에서는 한일 기계번역사전을 이용하여 추출한 구문 패턴을 대상으로 실험한 결과, 정확률 90%, 적용율 93.5%를 얻었다.

  • PDF

그래프 탐색을 이용한 웹으로부터의 온톨로지 기반 규칙습득 (Rule Acquisition Using Ontology Based on Graph Search)

  • 박상언;이재규;강주영
    • 지능정보연구
    • /
    • 제12권3호
    • /
    • pp.95-110
    • /
    • 2006
  • 지능형 에이전트와 규칙기반 시스템을 이용해 보다 지능적인 웹 환경을 구축하고자 하는 노력이 시맨틱 웹의 발전과 함께 증가하고 있다. 이러한 에이전트와 규칙기반 시스템에 필요한 규칙들을 이미 많은 지식들이 산재해 있는 웹으로부터 습득할 수 있다면 보다 효율적으로 시스템을 구축하는 것이 가능하며, 이러한 응용시스템의 확장은 시맨틱 웹의 발전을 더욱 가속화하는 계기가 될 수 있을 것이다. XRML 방법론은 웹으로부터 규칙을 습득하기 위한 단계적 방법을 제시하고 있으며, 온톨로지를 이용함으로써 규칙의 구성요소들을 자동으로 추출할 수 있도록 지원한다. 그러나 추출된 규칙구성요소들을 조합하여 완전한 규칙을 만드는 과정이 규칙관리자의 수작업에 의존하고 있다. 본 연구는 온톨로지와 그래프 탐색을 사용함으로써 이 과정을 자동화하고자 하는 연구이다. 온톨로지에 있는 규칙의 일반적 패턴을 기반으로 하여 그래프 탐색을 이용해 규칙구성요소들을 조합함으로써 웹 페이지로부터 자동으로 규칙을 추출할 수 있다.

  • PDF

어휘 및 형태 정보를 이용한 한국어 Two-level 어휘사전 자동 구축 (Automatic Construction of Korean Two-level Lexicon using Lexical and Morphological Information)

  • 김보겸;이재성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.865-872
    • /
    • 2013
  • Two-level 형태소 분석 방법은 규칙 기반 방법 중 하나로 형태소의 변화 현상을 규칙으로 처리하고, 기본 어휘 사전을 기반으로 형태소 결합관계를 분석한다. 이는 언어에 독립적인 방법으로 한국어에 대해서도 일부 구축되어 적용됨이 증명되었다. 그러나 기존 한국어에 대한 Two-level 형태소 분석기는 사전을 수동으로 구축하여 규모가 매우 작고 실제 사용에 제한적이었으며, 과분석이 많아 효율성이 매우 떨어졌다. 본 논문은 세종 품사부착 말뭉치에서 대규모의 Two-level 어휘 사전을 자동으로 구축하여 형태소 분석기의 적용 범위를 넓히고, 형태소간의 결합관계를 어휘 정보와 어휘 형태에 따른 하위품사 정보를 이용하여 분석함으로써 형태소 분석기의 성능을 향상시킬 수 있는 방법을 제시한다. 실험 결과, 기존의 방법보다 형태소 분석기의 과분석을 68% 이상 줄여 f-measure를 25.5% point 이상 향상시킬 수 있었다.

인공지능기법에 근거한 철도 전자연동장치의 연동 지식베이스 자동구축 S/W 개발 (Software Development for Auto-Generation of Interlocking Knowledgebase Using Artificial Intelligence Approach)

  • 고윤석;김종선
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 A
    • /
    • pp.440-442
    • /
    • 1999
  • 본 연구에서는 전자연동장치의 확장성과 신뢰성 제고를 위해 전자연동장치의 실시간 연동전략으로 활용될 수 있는 연동 지식베이스를 자동 생성, 구축할 수 있는 지능형 연동지식베이스 자동 구축 소프트웨어(IIKBAGS)를 개발한다. IIKBAGS의 추론부는 주어진 역 모델의 동적탐색하에서 휴리스틱 규칙들의 우선순위에 따라 모든 진로를 탐색함은 물론 각 진로들에 대해 진로상 신호설비들간의 연쇄관계를 확인하여 연동패턴들을 자동생성하는 연동지식 자동생성기능을 가진다. 지식베이스는 전자연동장치상의 실시간 전문가 시스템이 직접적으로 활용할 수 있는 구조로 설계됨으로써 연동도표 입력과정에서 발생할 수 있는 오류를 배제, 연동장치의 정확성과 신뢰성을 높인다.

  • PDF