• Title/Summary/Keyword: 규칙기반 모델

Search Result 610, Processing Time 0.027 seconds

Enhancing Korean Alphabet Unit Speech Recognition with Neural Network-Based Alphabet Merging Methodology (한국어 자모단위 음성인식 결과 후보정을 위한 신경망 기반 자모 병합 방법론)

  • Solee Im;Wonjun Lee;Gary Geunbae Lee;Yunsu Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.659-663
    • /
    • 2023
  • 이 논문은 한국어 음성인식 성능을 개선하고자 기존 음성인식 과정을 자모단위 음성인식 모델과 신경망 기반 자모 병합 모델 총 두 단계로 구성하였다. 한국어는 조합어 특성상 음성 인식에 필요한 음절 단위가 약 2900자에 이른다. 이는 학습 데이터셋에 자주 등장하지 않는 음절에 대해서 음성인식 성능을 저하시키고, 학습 비용을 높이는 단점이 있다. 이를 개선하고자 음절 단위의 인식이 아닌 51가지 자모 단위(ㄱ-ㅎ, ㅏ-ㅞ)의 음성인식을 수행한 후 자모 단위 인식 결과를 음절단위의 한글로 병합하는 과정을 수행할 수 있다[1]. 자모단위 인식결과는 초성, 중성, 종성을 고려하면 규칙 기반의 병합이 가능하다. 하지만 음성인식 결과에 잘못인식된 자모가 포함되어 있다면 최종 병합 결과에 오류를 생성하고 만다. 이를 해결하고자 신경망 기반의 자모 병합 모델을 제시한다. 자모 병합 모델은 분리되어 있는 자모단위의 입력을 완성된 한글 문장으로 변환하는 작업을 수행하고, 이 과정에서 음성인식 결과로 잘못인식된 자모에 대해서도 올바른 한글 문장으로 변환하는 오류 수정이 가능하다. 본 연구는 한국어 음성인식 말뭉치 KsponSpeech를 활용하여 실험을 진행하였고, 음성인식 모델로 Wav2Vec2.0 모델을 활용하였다. 기존 규칙 기반의 자모 병합 방법에 비해 제시하는 자모 병합 모델이 상대적 음절단위오류율(Character Error Rate, CER) 17.2% 와 단어단위오류율(Word Error Rate, WER) 13.1% 향상을 확인할 수 있었다.

  • PDF

An Automatic Korean Word Spacing System for Devices with Low Computing Power (저사양 기기를 위한 한국어 자동 띄어쓰기 시스템)

  • Song, Yeong-Kil;Kim, Hark-Soo
    • The KIPS Transactions:PartB
    • /
    • v.16B no.4
    • /
    • pp.333-340
    • /
    • 2009
  • Most of the previous automatic word spacing systems are not suitable to use for mobile devices with relatively low computing powers because they require many system resources. We propose an automatic word spacing system that requires reasonable memory usage and simple numerical computations for mobile devices with low computing powers. The proposed system is a two step model that consists of a statistical system and a rule-based system. To reduce the memory usage, the statistical system first corrects word spacing errors by using a modified hidden Markov model based on character unigrams. Then, to increase the accuracy, the rule-based system re-corrects miscorrected word spaces by using lexical rules based on character bigrams or more. In the experiments, the proposed system showed relatively high accuracy of 94.14% in spite of small memory usage of about 1MB.

Real-time Data Mining application Model In Electronic Commerce (전자상거래 상에서의 실시간 데이터 마이닝 활용 모델)

  • Kim, Ko-Eun;Ok, Jee-Woong;Kim, Ung-Mo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.155-158
    • /
    • 2007
  • 현재 전자상거래는 우리의 생활과 밀접히 연관되어 있다. 최근 인터넷을 기반으로 전자조달, 수출입 브로커 등과 같은 유형의 B2B 전자상거래가 활발히 이루어지고 있으며, 소비자를 대상으로 하는 전자상거래 또한 점차 확산되는 시장을 형성하고 있다. 국제적으로도 전자상거래 시장 규모가 급속도로 증가할 것이라는 전망은 자명한 사실이다. 전자상거래에 대한 의존도가 높아지면서 관리해야 하는 데이터의 양 또한 급속도로 증가하고 있다. 본 논문에서는 실시간으로 유입되는 데이터를 효율적으로 활용하기 위챈 실시간 데이터 마이닝 활용 모델을 제안한다. 이 실시간 데이터 마이닝 모델은 지속적으로 유입되는 데이터의 규칙화를 통해 저장 공간의 효율성을 극대화하고 중요도 분석을 통한 총체적인 접근 방법을 시도함으로써 전자상거래 상에서 유용하게 쓰일 수 있는 활용 모델이다. 이 실시간 데이터 마이닝 모델의 바탕은 데이터 마이닝의 기법인 SEMMA를 따르며, 그 특징에 따라 규칙 추출과 의사 결정 나무 기법을 이용하여 전자상거래 상에서 유용하게 사용될 수 있는 모델을 제시하고자 한다.

  • PDF

A Transforming Method between Extended Entity-relationship Model and Object-relational Database using Triple graph grammer (트리플 그래프 문법을 사용한 확장 개체-관계 모델과 객체-관계 모델간의 변환 방법)

  • Nhung, Nguyen Thi;Song, Sang-Geun;Shin, Jung-Hoon;Lee, Sang-Jun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.78-80
    • /
    • 2012
  • 개체 관계(ER) 모델과 확장 개체 관계(EER) 모델은 개념적 데이터베이스 설계분야에서 가장 많이 사용되는 모델이다. 확장 개체 관계 모델은 여전히 객체지향 데이터베이스를 처리하는데 강력하나 최신 객체관계 데이터베이스와 UML과 같은 새로운 데이터베이스 모델링을 처리하기에는 부족함이 많다. 따라서 본 논문에서는 이러한 객체 관계 데이터베이스를 지원하기 위한 확장 개체 관계 기반의 변환 방법을 제안한다. 변환 규칙은 트리플 그래프 문법을 사용하여 정의하고 MOFRON TGG 에디터를 이용하여 표현한다. 트리플 그래프 문법 규칙에 따라 본 제안 방법은 자동 ORDB 개발 프레임워크에 적용할 수 있다.

A Design and Implementation of Access Control Mechanism based on the Integrated Information Model (통합 전보 모델을 이용한 접근제어 메커니즘 설계 및 구현)

  • Kang, Chang-Goo;Park, Jin-Ho;Choi, Yong-Rak
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.9
    • /
    • pp.2354-2365
    • /
    • 1997
  • This paper presents a design of an access control mechanism that can resolves the complicated problems of access control requirements in modern information communication applications. In this paper, we proposed an integrated information model which can satisfy the combined goals of confidentiality, integrity and availability of any resource. We defined an integrated information model from the view points of identity-based, rule-based and role-based policy and implemented six access control operations. The proposed integrated information model can protect to unauthorized access to any resource based on the multilevel security policies of security label, integrity level, role and ownership.

  • PDF

MDA-Based Multi-Agent based System Development (MDA 기반의 다중 에이전트 기반 시스템 개발)

  • Jang, Su-Hyeon;Youn, Hyun-Sang;Lee, Eun-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.543-546
    • /
    • 2006
  • MDA 는 OMG 에서 제안한 소프트웨어 개발 방법론으로써, 플랫폼 독립적인 모델에서 플랫폼 종속적인 모델로의 모델 변환을 사용하여 소프트웨어의 이식성, 재사용성 등을 향상 시킬 수 있다. 다중 에이전트 기반 시스템을 개발하는 데 MDA 를 적용하는 것은, 다양한 유비쿼터스 환경에서 동작하는 지능형 시스템 개발을 효율적으로 지원한다. 최근 MDA 를 적용하여 다중 에이전트 기반 시스템을 개발한 연구가 있다. 그러나 이 연구는 에이전트 플랫폼이 고려되지 않고 모델 변환이 자동화 되지 못한 단점이 있다. 본 논문에서는 OMG 에서 표준화한 방법으로 UML 을 모델을 기술하고 모델 변환 규칙을 적용한다. 이를 통해 하나의 모델로부터 다양한 에이전트 플랫폼으로의 이식성을 얻을 수 있다. 이를 평가하기 위해 이전 연구에서 개발한 전자상거래 시스템의 시나리오를 가지고 에이전트 시스템을 구현하고 그 유효성을 입증하였다.

  • PDF

A Study on the Knowledge Base Development of Expert System for Naval Combat System (해군 전투체계 지원용 전문가시스템의 지식베이스 개발에 관한 연구(구축함 중심))

  • 김화수;이정훈
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.183-192
    • /
    • 2002
  • 본 논문에서는 구축함의 대공방어분야에 대한 업무를 IDEF0기능 모델링 방법을 통해 체계적으로 분석하였으며 미국방성의 산하기구인 DARPA에서 연구한 CPOF(Command Post Of Future) 의사결정 모델을 토대로 구축함의 대공방어분야에서 상황평가 단계에 대한 의사결정 과정을 심도 깊게 분석하였다. 또한 구축함의 대공방어분야에서 분석된 업무수행 절차를 토대로 상황평가 단계에서 의사결정과정에 따른 필요한 규칙집합을 식별하고 규칙집합 내부의 규칙들을 효과적으로 추출하기 위하여 규칙집합들에 대한 정의, 규칙에 입력되는 데이터, 규칙집합의 결과값, 규칙집합간의 상호관계를 분석하였다. 이러한 도메인 지식개발은 장차 해군 전투체계 지원용 전문가시스템을 개발하는데 중요한 기회기반이 될 것이다.

  • PDF

Evacuation Analysis for a Passenger Ship Using a Cellular Automata Model with Group Behavior (집단 행동을 나타내는 Cellular Automata 모델을 사용한 여객선 승객 탈출 분석)

  • Cha, Ju-Hwan;Ha, Sol;Lee, Kyu-Yeul
    • Journal of the Korea Society for Simulation
    • /
    • v.20 no.4
    • /
    • pp.149-155
    • /
    • 2011
  • This paper presents simulations of advance evacuation analysis using a cellular automata model for passenger behavior in an emergency of passenger ship. The proposed cellular automata model divides the space in a uniform grid called "cell." Each passenger is located in a cell and moves to another cell according to a set of local rules assumed to be associated with the individual and crowd behaviors of the passengers. To verify the usefulness of the proposed cellular automata model, 11 tests, all of which are specified in International Maritime Organization Maritime Safety Committee/ Circulation 1238 (IMO MSC/Circ. 1238), were implemented, and it was confirmed that all the requirements of these tests had been met.

Optimal Design of Interval Type-2 Fuzzy Set-based Multi-Output Fuzzy Neural Networks (다중 출력을 가지는 Interval Type-2 퍼지 집합 기반 퍼지 뉴럴 네트워크 최적 설계)

  • Park, Keon-Jun;Kim, Yong-Kab;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Proceedings of the KIEE Conference
    • /
    • 2011.07a
    • /
    • pp.1968-1969
    • /
    • 2011
  • 본 논문에서는 패턴 인식을 위한 다중 출력을 가지는 Interval Type-2 퍼지 집합을 이용한 퍼지 집합 기반 퍼지 뉴럴 네트워크를 소개한다. Interval Type-2 퍼지 집합 기반 퍼지 뉴럴 네트워크는 각 입력 변수에 따른 서로 분리된 입력 공간을 분할함으로서 네트워크 및 규칙을 구성한다. 규칙의 전반부는 퍼지 입력 공간을 개별적으로 분할하여 표현하고, 각 공간은 Interval Type-2 퍼지 집합으로 구성된다. 규칙의 후반부는 패턴 인식을 위한 다중 출력을 가지며 Interval 집합을 이용하여 다항식으로서 표현된다. 다항식의 계수인 연결가중치는 오류역 전파 알고리즘을 이용하여 학습한다. 또한 실수 코딩 유전자 알고리즘을 이용하여 제안된 네트워크를 최적화한다. 제안된 네트워크는 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF

Korean Analysis and Transfer in Unification-based Multilingual Machine Translation System (통합기반 다국어 자동번역 시스템에서의 한국어 분석과 변환)

  • Choi, Sung-Kwon;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.301-307
    • /
    • 1996
  • 다국어 자동번역이란 2개국어 이상 언어들간의 번역을 말한다. 기존의 다국어 자동번역 시스템은 크게 변환기반 transfer-based 방식과 피봇방식으로 분류될 수 있는데 변환기반 다국어 자동번역 시스템에서는 각 언어의 분석과 생성 규칙이 상이하게 작성됨으로써 언어들간의 공통성이 수용되지 못하였고 그로 인해 전체 번역 메모리의 크기가 증가하는 결과를 초래하였었다. 또한 기존의 피봇방식에서는 다국어에 적용될 수 있는 언어학적 보편성 모델을 구현하는 어려움이 있었다. 이러한 기존의 다국어 자동번역 시스템의 단점들을 극복하기 위해 본 논문에서는 언어들간의 공통성을 수용하며 또한 여러 언어에서 공유될 수 있는 공통 규칙에 의한 다국어 자동번역 시스템을 제안하고자 한다. 공통 규칙의 장점은 전산학적으로는 여러 언어에서 단지 한번 load 되기 때문에 전체 번역 메모리의 크기를 줄일 수 있다는 것과 언어학적으로는 문법 정보의 작성.수정.관리의 일관성을 유지할 수 있다는 것이다.

  • PDF