• 제목/요약/키워드: rule generation

검색결과 377건 처리시간 0.032초

한국어 학술 문헌의 본문 인용문 인식을 위한 규칙 기반 방법 (A Rule-based Approach to Identifying Citation Text from Korean Academic Literature)

  • 강인수
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.43-60
    • /
    • 2012
  • 학술 문헌 원문에서 발견되는 인용문은 인용에 기초한 학술문헌 자동 요약, 리뷰 논문 자동 생성, 인용문 감성 분석, 인용문 기반 문헌 검색 등 다양한 학술 정보 서비스의 창출을 가능케 한다. 이러한 서비스가 가능하기 위해서는 원문 텍스트로부터 인용문의 자동 인식이 선행되어야 한다. 그러나 인용문의 인식은 인용 표지가 부착되지 않은 암묵 인용문의 존재로 인해 그 처리가 용이하지 않다. 영어의 경우 최근 이에 대한 연구가 집중되고 있으나 한국어 학술 문헌 내 인용문의 자동 인식 연구는 찾기 힘들다. 이 논문은 한국어 인용문을 자동 인식하는 규칙 기반의 방법을 제시하고 다양한 베이스라인 기법들과 인용문 인식 성능을 비교하였다. 제안된 방법은 테스트 셋 내 전체 암묵 인용문의 30%를 약 70%의 정확률로 인식할 수 있었다.

자동적인 규칙 기반 방법을 이용한 지능형 침입탐지시스템 (The Intelligent Intrusion Detection Systems using Automatic Rule-Based Method)

  • 양지홍;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제12권6호
    • /
    • pp.531-536
    • /
    • 2002
  • 본 연구는 유전자 알고리즘을 IDS에 적용된 오용 탐지 기법을 처음으로 제안하고 구현한 점에서 의미가 있다. 세계적인 대회인 KBD 콘테스트의 데이터를 사용하여 실험하였으며, 그에 따른 가능한 한 같은 환경 하에서 실험을 실시하였다. 실험은 레코드집합을 하나의 유전자로, 즉 하나의 공격패턴으로 간주하고 유전자 알고리즘을 활용하여 진화 시켜 침입 패턴,즉 침입 규칙(Rules)을 생성한다. 데이터 마이닝 기법중 분류(Classification)에 초점을 맞추어 분석과 실험을 하였다. 이 데이터를 중심으로 침입 패턴을 생성하였다. 즉, 오용탐지(Misuse Detection) 기법을 실험하였으며, 생성된 규칙은 침입데이터를 대표하는 규칙로 비정상 사용자와 정상 사용자를 분류하게 된다. 규칙은 "Time Based Traffic Model", "Host Based Traffic Model", "Content Model" 이 세가지 모듈에서 각각 상이한 침입 규칙을 생성하게 된다. 규칙 생성의 지속적인 업데이트가 힘든 오용탐지 기법에 지속적으로 성장하며 변화해 가는 규칙을 자동적으로 생성하는 시스템으로서, 생성된 규칙은 430M Test data 집합에서 테스트한 결과 평균 약 94.3%의 탐지율을 보였다. 테스트한 결과 평균 약 94.3%의 탐지율을 보였다.

시간 정보와 VQ를 이용한 DDD 지역명 인식에 관한 연구 (A Study on the Speech Recognition for DDD Area - Name Using Vector Quantization with Time Information)

  • 이성권;이강성;안태옥;조형제;변용규;김순협
    • 한국음향학회지
    • /
    • 제8권5호
    • /
    • pp.102-112
    • /
    • 1989
  • 본 논문은 불특정 화자의 DDD 지역명 인식 실험에 관한 것으로 VQ(Vector Quantization) 방식을 이용하여 실험하였고 인식대상 어휘로는 다이얼링 시스템의 응용을 목적으로 전국 146재의 DDD 지역명을 선정하였다. 특징 파라메타로는 12차 LPC Cepstrum 계수를 사용하여 코우드북을 작성하였으며, 중심점을 찾는 방법으로는 MINSUM 방법과 MINIMAX 방법을 사용하였고 코우드북 작성에는 Splitting rule 3가지를 사용하였다. 코우드북도 Single Section 코우드북과 시간정보를 포함하는 Multi Section 코우드북으로 나누어 작성하였고 Section을 Overlapping 하여가면서 코우드북을 작성하여 실험하였다. 실험 결과 minsum 방법이 minimax 보다 인식률이 좋은 것으로 나타났으며 화자 독립의 경우 약 $90\%$의 인식율을 얻을 수 있었다.

  • PDF

효율적인 기계학습 자질 선별을 통한 한국어 운율구 경계 예측 모델의 성능 향상 (Performance Improvement of a Korean Prosodic Phrase Boundary Prediction Model using Efficient Feature Selection)

  • 김민호;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.837-844
    • /
    • 2010
  • 운율구 경계 예측은 대화체 음성합성을 실현하기 위한 주요한 자연언어처리 기술 중 하나이다. 본 논문은 자연스러운 한국어 운율구 경계 예측을 실현하고자 기존의 학습 자질을 대신할 새로운 학습 자질을 제안한다. 이 새로운 자질들은 기존의 학습 자질보다 실제 언어생활에서 운율구 경계 발생에 영향을 미치는 여러 요인을 더 잘 반영한다. 특히, 수작업으로 구축한 운율구 경계 예측 규칙을 이용하여 추출한 학습 자질은 높은 정확도 향상에 이바지한다. 본 논문에서 제안한 새로운 학습 자질을 바탕으로 CRFs(Conditional Random Fields)를 이용하여 운율구 경계 예측 모델을 만들었다. 그 결과 3단계 운율구 경계(강한 경계, 약한 경계, 운율구 내부 비경계) 예측에서 86.63%의 정확도를, 6단계 운율구 경계(상승조/하강조 강한 경계, 상승조/하강조/평탄조 약한 경계, 운율구 내부 비경계) 예측에서는 81.14%의 정확도를 보였다.

길이에 대한 2차원 이진검색을 이용한 패킷분류 구조 (Packet Classification Using Two-Dimensional Binary Search on Length)

  • 문주형;임혜숙
    • 한국통신학회논문지
    • /
    • 제32권9B호
    • /
    • pp.577-588
    • /
    • 2007
  • 인터넷의 성장은 다양한 응용 프로그램들의 발달을 야기 시켰으며, 그로 인해 모든 패킷을 동일하게 처리하는 현재의 최선지원 서비스 보다 나은 서비스를 제공할 것을 요구하고 있다. 따라서 차세대 인터넷 라우터들은 다양한 레벨의 품질보장 서비스를 제공하여야 한다. 품질보장 서비스를 제공하기 위해서는 모든 입력 패킷을 미리 정의된 룰에 따라 구분하는 패킷 분류가 실시간으로 수행되어야 한다. 패킷분류는 패킷에 포함된 여러 헤더 필드에 대하여 다양한 종류의 검색을 수행하여야 하며, 일치하는 룰들 중에서 가장 높은 우선순위를 갖는 룰을 찾아야 하는 다차원 검색이다. 영역분할을 사용한 사분트라이 구조는 근원지와 목적지 프리픽스를 2차원 트라이 구조로 저장하여 검색을 진행하는 좋은 알고리즘이나, 길이에 대하여 선형검색을 하는 방법이므로 좋은 검색 성능을 보이지 못한다. 본 논문에서는 사분트라이 구조에서 길이에 대하여 이진검색을 진행하는 새로운 패킷분류 알고리즘을 제안한다. 또한 패킷이 여러 개의 룰과 일치하였을 경우 가장 높은 우선순위를 가지는 룰을 선택한다는 특성을 이용하여, 사분트라이를 만드는 과정에서 우선순위를 고려하여 검색 성능을 향상시킬 수 있는 방안을 제안한다.

Acoustic Metal Impact Signal Processing with Fuzzy Logic for the Monitoring of Loose Parts in Nuclear Power Plang

  • Oh, Yong-Gyun;Park, Su-Young;Rhee, Ill-Keun;Hong, Hyeong-Pyo;Han, Sang-Joon;Choi, Chan-Duk;Chun, Chong-Son
    • The Journal of the Acoustical Society of Korea
    • /
    • 제15권1E호
    • /
    • pp.5-19
    • /
    • 1996
  • This paper proposes a loose part monitoring system (LPMS) design with a signal processing method based on fuzzy logic. Considering fuzzy characteristics of metallic impact waveform due to not only interferences from various types of noises in an operating nuclear power plant but also complex wave propagation paths within a monitored mechanical structure, the proposed LPMS design incorporates the comprehensive relation among impact signal features in the fuzzy rule bases for the purposes of alarm discrimination and impact diagnosis improvement. The impact signal features for the fuzzy rule bases include the rising time, the falling time, and the peak voltage values of the impact signal envelopes. Fuzzy inference results based on the fuzzy membership values of these impact signal features determine the confidence level data for each signal feature. The total integrated confidence level data is used for alarm discrimination and impact diagnosis purposes. Through the perpormance test of the proposed LPMS with mock-up structures and instrumentation facility, test results show that the system is effective in diagnosis of the loose part impact event(i.e., the evaluation of possible impacted area and degree of impact magnitude) as well as in suppressing false alarm generation.

  • PDF

공기 정보를 이용한 비정상 SIP 패킷 공격탐지 기법 (Abnormal SIP Packet Detection Mechanism using Co-occurrence Information)

  • 김득용;이형우
    • 한국산학기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.130-140
    • /
    • 2010
  • SIP(Session Initiation Protocol)는 IP 기반의 VoIP(Voice over IP) 서비스를 실현하기 위한 시그널링 프로토콜이다. 그러나 SIP 프로토콜은 기존의 IP 망을 활용하기 때문에 많은 보안 취약점이 존재한다. 특히 SIP 헤더의 정보를 변경하여 전송하는 SIP Malformed 메시지 공격 같은 경우 VoIP 서비스의 오작동을 유발하거나, 악성코드를 삽입하여 SIP 클라이언트 시스템내 개인정보를 유출하는 등 심각한 문제점을 보이고 있어 이에 대한 대체 방안이 제시되어야 한다. 이에 본 논문에서는 SIP Malformed 메시지 공격탐지에 대한 기존의 연구를 분석하고, 언어 처리에서 단어의 연관성을 분석하는 기법으로 사용되는 공기 정보(Co-occurrence Information)와 네트워크에서 발생하는 실제 SIP 세션 상태 정보를 반영하여 SIP 연관규칙 패턴을 생성하는 기법을 제안하였다. 본 논문에서 제안한 공기정보 기반 SIP 연관규칙 패턴을 이용하여 SIP 비정상메시지 공격을 탐지한 결과 평균 87%의 탐지율을 보였다.

PLC 시뮬레이션에서 Plant model 자동 생성을 위한 PLC Symbol 규칙 (PLC symbol naming rule for auto generation of Plant model in PLC simulation)

  • 박형태;왕지남;박상철
    • 한국시뮬레이션학회논문지
    • /
    • 제17권4호
    • /
    • pp.1-9
    • /
    • 2008
  • 본 논문은 Programmable Logic Controller(PLC) 시뮬레이션을 하기 위한 공장 모델(Plant Model)을 자동으로 생성하는 절차에 대해 기술한다. PLC 프로그램은 공정을 제어하는 로직에 관한 정보이며 그 자체로 공장 모델에 대한 어떤 정보도 포함하고 있지 않기 때문에 시뮬레이션을 위해서는 PLC 프로그램에 대응하는 공장 모델이 반드시 필요하다. 지금까지 PLC 시뮬레이션을 위한 공장 모델은 사용자가 직접 구축하는 방식으로 모델링 되었으나 이는 많은 노력과 공정로직의 완전한 이해 및 시뮬레이션 지식이 요구된다. 이런 어려움을 극복하기 위해 논문은 PLC 프로그램의 심볼테이블(Symbol table)로부터 공장모델을 자동으로 생성하는 과정을 제안한다. 이를 위해P LC 심볼이 공장 모델의 생성을 위한 정보를 포함시키는 PLC 심볼의 작명 규칙을 제안한다. 입력된 심볼 리스트를 분석함으로써 공장 모델을 자동으로 추출할 수 있으며 간단한 예제 공정을 대상으로 구현해 본다.

  • PDF

규칙의 커플링문제를 최소화하기 위한 퍼지-러프 분류방법 (A Fuzzy-Rough Classification Method to Minimize the Coupling Problem of Rules)

  • 손창식;정환묵;서석태;권순학
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.460-465
    • /
    • 2007
  • 본 논문에서는 규칙의 커플링 문제를 최소화하기 위해 주어진 데이터의 통계적 특성과 퍼지-러프집합을 기반으로 한 새로운 패턴분류 방법을 제안한다. 제안한 방법 하에서 주어진 데이터의 통계적 특성은 입력부 퍼지집합의 파티션 개수를 결정하고, 생성된 규칙의 커플링문제를 최소화하기 위한 선택기준으로 사용하였다. 또한 러프집합은 수치적인 데이터로부터 생성된 규칙들 간의 불필요한 속성들을 제거하기 위한 도구로서 이용하였다. 제안된 방법의 타당성을 검증하기 위하여 Fisher의 IRIS 데이터를 사용하여 기존의 패턴분류 방법과 분류 정확도를 비교하였다. 실험결과, 제안한 방법이 기존의 학습에 의한 방법들보다 비교적 좋은 성능을 가진다는 것을 알 수 있었다.

과학적 규칙성 지식의 생성 과정: 경향성 지식의 생성을 중심으로 (A Grounded Theory on the Process of Scientific Rule-Discovery- Focused on the Generation of Scientific Pattern-Knowledge)

  • 권용주;박윤복;정진수;양일호
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제23권1호
    • /
    • pp.61-73
    • /
    • 2004
  • 본 연구는 다양한 경향성을 발견할 수 있는 과제를 피험자들에게 제시하고, 피험자들이 경향성 지식을 생성하는 과정에서 표상 된 지식의 종류와 사고 유형을 분석하여 경향성 지식의 생성 과정을 알아보고자 하였다. 본 연구의 결과, 경향성 지식의 생성 과정에서 표상 된 지식은 요소, 요소변화, 관련선지식, 예측경향성, 최종 경향성 지식 등 5가지 유형의 과정적 지식이 생성되었다. 그리고 사용된 사고 유형은 `대상인식', '관련지식회상', '요소 또는 요소변화의 탐색', '예측경향성 발견', '예측경향성 확인', 경향성 조합', '경향성 선택' 등 7가지 유형의 사고가 경향성 지식 생성 과정에 관여함을 볼 수 있었다. 또한 경향성 지식 생성과정은 `요소 \$\longrightarrow$요소변화 \$\longrightarrow$(관련선지식 \$\longrightarrow$)예측경향성 생성ㆍ확인 \$\longrightarrow$최종경향성'의 순으로 과정적 지식들이 단계적으로 표상 되어 생성되었으며, 이러한 과정에서 귀납적 추론뿐만 아니라, 귀추적 추론과 연역적 추론도 함께 관여하는 것을 볼 수 있었다.

  • PDF