• 제목/요약/키워드: 규칙 기반 방법

검색결과 1,165건 처리시간 0.032초

문장구조분석을 위한 서술성 명사 복원 (Restoring a Predicative Noun to Verb for Parsing)

  • 임수종;이창기;장명길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.475-477
    • /
    • 2005
  • 본 연구는 신문기사나 백과사전 등의 문서에서 빈번히 발생하는 동사 파생 접미사와 어미가 생략된 형태의 서술성 명사를 동사로 복원하는 방법에 대한 것으로 이러한 복원은 문장구조 분석에 영향을 미친다. 기존 연구는 간단한 규칙만을 사용하지만 규칙을 사용하는 방법은 재현률에서 성능 저하를 보이기 때문에 본 연구에서는 이러한 생략 형태를 구분하여 규칙과 통계 방법을 사용하여 각각 적합한 형태에 적용하였다. 본 연구의 접근 방법은 규칙 기반에 비해 약 $30\%$, 통계 기반에 비해 약 $8\%$의 성능 향상을 보여서 문장 구조 분석에서는 $3.6\%$의 성능 향상을 보였다.

  • PDF

지능형 e-비즈니스를 위한 플랫폼에 관한 연구: DAML-S의 규칙기반 프레임워크로의 확장 및 통합방안 (A Study on the Platform for the Intelligent e-Business: A Method on Extension and Integration of DAML-S into Rule-based Framework)

  • 양진혁;민재홍;이윤수;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.373-376
    • /
    • 2004
  • 본 논문에서 우리는 시맨틱 웹을 기반으로 하는 웹 서비스 발견, 실행, 구성 및 모니터링을 자동화하기 위한 목적을 가지는 DAML-S를 규칙기반 프레임워크로의 확장 및 통합방안에 관한 연구결과를 제시한다. 확장 및 통합된 형태의 DAML-S는 온톨로지 내부에 DamlRuleML로 인코딩된 형태의 규칙들을 포함한다. 내포된 규칙들로 보완된 DAML-S 서비스 온톨로지들은 서비스 발견, 실행, 구성 및 모니터링에서 확장 이전의 DAML-S가 가지는 한계점들을 극복하고 나아가 보다 지능적인 서비스의 구현을 가능하게 한다. 본 논문에서 제안된 우리의 접근법은 온톨로지를 마크업하기 위한 노력과 규칙을 표현하기 위한 노력이 자연스러운 방법으로 통합될 수 있는 근간을 마련할 뿐만 아니라 규칙들을 이용하여 온톨로지들을 보완하고, 규칙들에서 사용되는 용어들을 온톨로지들에서 정의된 용어들 및 속성들로 표현할 수 있다는 장점을 가진다. 이와 같은 공헌이외에 우리는 실제 시나리오를 통하여 언급된 사항들이 가능하게 되는 방법들을 구체적으로 보인다.

  • PDF

품사태깅을 위한 어휘규칙의 자동획득 (Automatic Acquisition of Lexical Rules for Part-of-Speech Tagging)

  • 이상주;류원호;김진동;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.20-27
    • /
    • 1998
  • 기존의 어휘규칙기반 품사태거는 품사문맥이나 어휘확률만을 사용하는 통계적 품사태거에 의해 해결되지 않는 형태론적 중의성을 어휘문맥을 참조하는 어휘규칙을 사용함으로써 효과적으로 해결할 수 있었다. 그러나 어휘규칙을 수작업으로 획득하기 때문에 규칙 획득에 많은 시간이 소요되어 소량의 규칙만이 사용되었다. 본 논문에서는 품사부착말뭉치로부터 어휘규칙을 자동으로 획득하는 방법을 제안한다. 제안된 방법으로 자동획득된 어휘규칙을 사용하여 실험말뭉치의 66.1%를 98.8%의 정확률로 태깅하였다. 이로써 통계적 품사태거만을 사용할 때(95.43% 정확률) 보다 어휘규칙과 결합할 때(96.12% 정확률) 통계적 품사태거의 성능이 약 15.1%(0.69% 정확률)만큼 향상되었다. 또한 제안된 방법은 영어 품사태깅에 대해서도 효과적임이 실험을 통해 증명되었다.

  • PDF

전자 상거래 에이전트를 위한 연관 규칙 발견 및 확장 (Association Rule Discovery & Expansion for Electronic Commerce Agents)

  • 문홍기;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.33-35
    • /
    • 1999
  • 대용량 데이터베이스의 데이터로부터 지식을 발견하는 방법으로 사용되고 있는 연관 규칙 발견은 기존에는 알려지지 않았던 지식을 찾아 이를 이용할 수 있는 형태로 제공된다. 하지만, 제공되는 형태는 단순한 데이터베이스에 포함되어 있는 정보만을 이용하여 보여주므로, 특정한 부분에만 제한적으로 활용된다. 따라서, 본 연구에서는 데이터로부터 연관 규칙을 발견하여 이를 개념 계층구조를 이용하여 일반적인 규칙으로 확장하는 방법을 제안한다. 또한 발견된 규칙을 기반으로 전자 상거래 에이전트를 위해 어떻게 활용될 수 있는지를 제안한다.

  • PDF

제한된 언어집합과 온톨로지를 활용한 반자동적인 규칙생성 방법 연구 (Methodology for semi-autonomous rule extraction based on Restricted Language Set and ontology)

  • 손미애;최윤규
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 한국지능정보시스템학회
    • /
    • pp.297-306
    • /
    • 2007
  • 지능정보시스템 구축에 있어서 자동화가 어려운 단계중의 하나인 규칙 습득을 위해 활용되는 방법중의 하나가 제한된 언어집합 기법을 이용하는 것이다. 그러나 제한된 언어집합 기법을 이용해 규칙을 생성하기 위해서는 규칙을 구성하는 변수와 그 값들에 대한 정보가 사전에 정의되어 있어야 하는데, 유동성이 큰 웹 환경에서 예상 가능한 모든 변수와 그 값을 사전에 정의하는 것이 매우 어렵다. 이에 본 연구에서는 이러한 한계를 극복하기 위해 제한된 언어집합 기법과 온톨로지를 이용한 규칙 생성 방법론을 제시하였다. 이를 위해 지식의 습득 대상이 되는 특정 문장은 문법구조 분석기를 이용해 파싱을 수행하며, 파싱된 단어들을 이용해 규칙의 구성 요소인 변수와 그 값을 식별한다. 그러나 규칙을 내포한 자연어 문장의 불완전성으로 인해 변수가 명확하지 않거나 완전히 빠져 있는 경우가 흔히 발생하며, 이로 인해 온전한 형식의 규칙 생성이 어렵게 된다. 이 문제는 도메인 온톨로지의 생성을 통해 해결하였다. 이 온톨로지는 특정 도메인을 구성하고 있는 개념들간의 관계를 포함하고 있다는 점에서는 기존의 온톨로지와 유사하지만, 규칙을 완성하는 과정에서 사용된 개념들의 사용빈도를 기반으로 온톨로지의 구조를 변경하고, 결과적으로 더 정확한 규칙의 생성을 지원한다는 점에서 기존의 온톨로지와 차별화된다. 이상의 과정을 통해 식별된 규칙의 구성요소들은 제한된 언어집합 기법을 이용해 구체화된다. 본 연구에서 제안하는 방법론을 설명하기 위해 임의의 인터넷 쇼핑몰에서 수행되는 배송관련 웹 페이지를 선정하였다. 본 방법론은 XRML에서의 지식 습득 과정의 효율성 제고에 기여할 수 있을 것으로 기대된다.

  • PDF

규칙기반 온톨로지 자동생성 및 검색 (Ontology Generation and Information Retrieval using Rule-based Approach)

  • 윤현주;김영민;이상준;변영철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.655-657
    • /
    • 2004
  • 본 논문에서는 특정 도메인에 대한 온톨로지를 규칙에 기반하여 자동으로 생성하고, 이를 기반으로 원하는 정보를 추론을 통하여 효과적으로 검색하는 방법에 대해 제안한다. 제안하는 방법이 실생활에 적용 할 수 있음을 보이기 위하며 실행과 관련된 정보중 숙박 정보를 담고 있는 HTML 웹 페이지를 테스트에 이용하였다. 웹 페이지에 표시되어 있는 숙박 정보에서 문서 구조 및 단어 측면에서의 규칙을 발견하고 이를 이용하여 온톨로지를 자동으로 생성한다. 숙박 정보 검색시 온톨로지에 정의된 관계를 이용하면 키워드는 다르더라도 동일한 의미를 갖는 다양한 키워드에 대한 효율적인 검색이 가능하다. 온톨로지 자동 생성을 통하여 기존 웹 페이지에 온톨로지 추가시 드는 시간 및 비용을 줄일 수 있으며, 온톨로지 기반 검색 방법을 이용함으로써 사용자에게 보다 양질의 정보를 제공할 수 있다.

  • PDF

데이터웨어하우스 환경에서의 설명기반 데이터마이닝 (Explanation-Based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 지능정보연구
    • /
    • 제5권2호
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF

의미기반 취약점 식별자 부여 기법을 사용한 취약점 점검 및 공격 탐지 규칙 통합 방법 연구 (A Study for Rule Integration in Vulnerability Assessment and Intrusion Detection using Meaning Based Vulnerability Identification Method)

  • 김형종;정태인
    • 정보보호학회논문지
    • /
    • 제18권3호
    • /
    • pp.121-129
    • /
    • 2008
  • 본 논문은 소프트웨어의 취약점을 표현하기 위한 방법으로 단위 취약점을 기반으로 한 의미기반 취약점 식별자 부여 방법을 제안하고 있다. 의미기반 취약점 식별자 부여를 위해 기존의 취약점 단위를 DEVS 모델링 방법론의 SES 이론에서 사용되는 분할 및 분류(Decomposition/Specialization) 절차를 적용하였다. 의미기반 취약점 식별자는 취약점 점검 규칙 및 공격 탐지 규칙과 연관 관계를 좀 더 낮은 레벨에서 맺을 수 있도록 해주고, 보안 관리자의 취약점에 대한 대응을 좀더 편리하고 신속하게 하는 데 활용될 수 있다. 특히, 본 논문에서는 Nessus와 Snort의 규칙들이 의미기반 취약점 식별자와 어떻게 맵핑되는 지를 제시하고, 보안 관리자 입장에서 어떻게 활용 될 수 있는 지를 3가지 관점에서 정리하였다. 본 논문의 기여점은 의미기반 취약점 식별자 개념 정의 및 이를 기반으로 한 취약점 표현과 활용 방법의 제안에 있다.

개념 기반 질의-응답 시스템에서의 정답 추출 (Answer Extraction of Concept based Question-Answering System)

  • 안영민;오수현;강유환;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.448-451
    • /
    • 2005
  • 본 논문에서는 개념 기반 질의-응답 시스템에서의 정답 추출 방법에 대하여 기술한다. 개념 기반 질의-응답 시스템은 개념 정보를 이용하여 해답을 추출하는 시스템을 말하며, 질의분석을 통해 분류되고 추출된 개념 그에 따른 정답 추출 규칙을 이용하여 정답을 추출하는 방법과 시스템에 대하여 연구하였다. 질의에 대한 정답이 들어 있는 문서들을 분석하여 정답 추출 규칙을 작성한다. 규칙은 개념과 구문정보를 포함하고 있으며 작성된 규칙을 통하여 문서로부터 정답후보를 생성하고 정답을 선택한다.

  • PDF

객체기반의 비즈니스 룰 구축 방법론에 관한 연구 (A Study on Object-based Business Rule Discovery Methodology)

  • 김한기;홍도석
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2006년도 추계학술대회
    • /
    • pp.163-169
    • /
    • 2006
  • 비즈니스 환경의 실시간 변화에 대응하기 위해서 최근에 기업은 특정 업무에 대해서 업무 규칙을 비즈니스 룰로 구현하고 이를 처리하는 비즈니스 룰 엔진 기반의 어플리케이션을 구현하고 있다. 비즈니스 룰은 기업이 보유한 업무 규칙을 컴퓨터와 업무 담당자가 동시에 이해할 수 있는 형태로 구성되어야 하는 양면적인 특성을 가지고 있다. 비즈니스 용어 중심으로 되어 있는 업무 규칙과 컴퓨터가 이해할 수 있는 비즈니스 룰은 그 형태가 상이하나 의미적으로 연관관계를 가지고 있기 때문에 체계적인 도출과정이 필요하다. 본 논문에서는 비즈니스 룰 클래스 개념을 적용하여 업무 규칙으로부터 비즈니스 룰을 도출하는 기법에 대해서 알아보고 이를 기반으로 구성한 비즈니스 룰 구축 방법론을 소개하고자 한다.

  • PDF