• 제목/요약/키워드: 단위모델

검색결과 2,098건 처리시간 0.037초

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition using the Transformed Successive State Splitting and Demi-syllable pair)

  • 김동옥;박노진
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1625-1631
    • /
    • 2005
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, FSN 노드를 두음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 연한 오 인식을 줄이기 위해 인식단위를 반음절쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징레벨에서 K-means 알고리즘(4)으로 클러스터링 하여 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문백종속 음소모델에서 $10.5\%$, 음향모델에서 인식단위를 반음절쌍으로 하였을 경우 문백종속 음소모델에 비해 $12.5\%$, 변형된 연쇄 상태분할을 하였을 경우 $1.5\%$의 인식률을 향상시킬 수 있었다.

한국어 음성/문자 공용인식기의 성능향상을 위한 가변 상태수 CHMM모델의 구성 (Difference State Number of CHMM Model to Improve the Performance of SCCRS)

  • 석수영;김민정;김광수;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.95-98
    • /
    • 2002
  • 문자인식 또는 음성인식을 위해 사용되어지는 CHMM(Continuous Hidden Markov Model)모델은 일반적으로 모델의 상태수를 일정한 수로 고정하는 고정 상태수 모델 구조를 가지고 있으나, 이는 개별적인 인식 단위의 특성을 고려하지 않은 경우로써 이를 고려한 가변 상태수 모델을 사용할 경우 인식률 향상을 기대할 수 있다. 개별적인 인식 단위에 적합한 모델 상태수를 결정하는 방법으로 파라미터 히스토그램 방법과, BIC(Bayesian Information Criterion)방법을 사용하는 것이 대표적이다. 이들 방법들은 개별적인 인식단위의 우도값만을 향상시키기 위한 방법으로 전체인식률과 직접적으로 비례하지는 않는다. 따라서, 본 논문에서는 고정 상태수를 갖는 모델 적용 방법과 인식단위별 상태수 변화에 따른 인식률을 비교하였으며, 이를 바탕으로 각 모델별 상태수를 달리하는 가변 상태수 CHMM모델 구성 방법을 제안한다. 제안된 가변상태수 모델의 유효성을 확인하기 위해 음성/문자 공용인식기 중 필기체 문자 인식에 적용한 결과 제안한 LM(Local Maximum)으로 구성된 가변 상태수 모델이 MLE와 BIC로 구성된 모델과 인식률 면에서는 거의 동일한 성능을 유지하면서 전체 상태수는 MLE 모델에 비해 $31\%$, BIC로 구성된 모델에 비해 $22\%$ 감소를 나타내어 제안한 모델의 유효성을 확인할 수 있었다.

  • PDF

문자소 기반의 한국어 음성인식 (Korean speech recognition based on grapheme)

  • 이문학;장준혁
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.601-606
    • /
    • 2019
  • 본 논문에서는 한국어 음성인식기 음향모델의 출력단위로 문자소를 제안한다. 제안하는 음성인식 모델은 한글을 G2P(Grapheme to Phoneme)과정 없이 초성, 중성, 종성 단위의 문자소로 분해하여 음향모델의 출력단위로 사용하며, 특별한 발음 정보를 주지 않고도 딥러닝 기반의 음향모델이 한국어 발음규정을 충분히 학습해 낼 수 있음을 보인다. 또한 기존의 음소기반 음성인식 모델과의 성능을 비교 평가하여 DB가 충분한 상황에서 문자소 기반 모델이 상대적으로 뛰어난 성능을 가진다는 것을 보인다.

단위 모듈러 구조체의 보-기둥 접합부 해석 모델 (Analytical Models of Beam-Column joints in a Unit Modular Frame)

  • 최경석;김형준
    • 한국전산구조공학회논문집
    • /
    • 제27권6호
    • /
    • pp.663-672
    • /
    • 2014
  • 최근, 모듈러 구조 시스템은 공기를 단축시킬 수 있는 장점으로 인해 건설 현장에 적용되고 있다. 모듈러 구조시스템은 단위 모듈로 구성되며, 모듈과 모듈의 볼트접합을 위해 보-기둥 접합부에 개구부를 가공하게 된다. 일반적으로 모듈러 구조시스템은 기존 철골모멘트골조와 유사한 하중전달체계를 가지는 것으로 가정하여 설계된다. 이와 같은 설계 가정의 타당성을 확보하기 위해, 단위 모듈의 보-기둥 접합부에 대한 회전 성능이 파악되어야 한다. 본 연구에서는 개구부의 구조적 영향이 고려된 접합부의 회전성능을 파악하기 위해 유한요소해석을 수행하였다. 해석결과 단위모듈은 충분한 변형능력을 가지고 안정적인 이력거동을 하는 것으로 나타났으며, 단위모듈의 접합부는 부분강접 접합부로 분류되었다. 또한 본 연구에서는 단위 모듈의 비선형 골조 해석을 위한 간단한 스프링 모델을 개발하였으며, 단위 모듈의 비선형 이력 거동을 구현하기 위해 Ramberg-Osgood 이력 모델을 제시하였다.

연속분포 HMM에서 평행분기 음성단위를 사용한 단어인식율 향상연구 (On the Use of a Parallel-Branch Subunit Mod디 in Continuous HMM for improved Word Recognition)

  • 박용규;은종관
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.25-32
    • /
    • 1995
  • 단어인식의 성능향상을 위하여 평행분기 음성단위(subunit) 모델의 사용을 제안하였으며 연속 분포 HMM에서 이 모델은 각 음성단위를 확률분포함수 (mixture components)를 이용하여 분기시킴에 의해 얻어진다. 제안된 방법을 사용한 결과에 따르면 기존에 제안된 평행분기 [1] 음성단위 모델이나 단일분기 모델보다 높은 인식률을 얻을 수 있었다. 본 연구에서는 각 음성단위에 대해 활률분포함수나 분기수의 적절한 결합을 통해 높은 인식률을 얻는데 이 1036 한국어 결리단어가 인시실험에 사용되었다.

  • PDF

공간 상호작용 모델에 대한 공간단위 수정가능성 문제(MAUP)의 영향 (Effects of the Modifiable Areal Unit Problem (MAUP) on a Spatial Interaction Model)

  • 김감영
    • 대한지리학회지
    • /
    • 제46권2호
    • /
    • pp.197-211
    • /
    • 2011
  • 공간 상호작용의 복잡성, 공간적 재현과 모델링의 필요성에 의해서 공간 상호작용 데이터의 합역이 불가피하다. 이러한 상황에서 본 연구의 목적은 공간 상호작용 데이터를 스케일을 달리하여 합역하거나 혹은 동일 스케일에서 합역 방식을 달리하여 합역하였을 때, 공간 상호작용 모델의 결과가 어떻게 달라지는지 평가하는 것이다. 공간 상호작용 데이터의 합역은 공간단위 수정가능성의 문제(Modifiable Areal Unit Problem: MAUP)를 야기한다. 공간 상호작용 데이터의 합역을 위하여 무작위로 구역 시드를 선정한 후 인접한 공간단위를 할당하는 방법, 구역 시드와 공간단위 사이의 연구 가중 거리를 최소화하는 방법, 구역 내 상호작용 비율을 최대화하는 방법, 구역 내 상호작용 비율을 최소화하는 방법을 사용하였다. MAUP의 영향을 평가하기 위한 공간 상호작용 모텔로 기원지-목적지 제약 포아송 회귀 모델을 이용하였다. 분석 결과는 모델 잔차의 공간적 특성뿐만 아니라 파라미터 추정값, 적합도 등이 MAUP의 영향을 받는다는 것을 보여주었다. 모델은 합역 방식 보다는 합역 수준에 더 민감하게 반응하였고, 모델에 대한 스케일 효과는 구획 방식에 따라 상이하게 나타났다.

궤도차량의 실시간 시뮬레이션을 위한 동운동 모델 개발 (Development of a Dynamic Model for Real-Time Simulation of Tracked Vehicle)

  • 안재준;오중석;윤석준
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2002년도 춘계학술대회논문집
    • /
    • pp.189-195
    • /
    • 2002
  • 궤도차량 운동의 실시간 시뮬레이션을 위해서 실시간 시간제약 조건을 만족하기 위한 모델링을 시도하였다. 단위 블록 열차로 연결된 전체 차체를 질점으로 가정하여 모델을 단순화함으로써 차량 설계 시 사용되는 궤도 차량 모델보다 실시간성을 향상시키고자 하였다. 당 모델에서 궤도차량의 운동은 트랙의 형상에 구속되는데, 차량의 운동 궤적은 궤도의 형상에 의해 결정된다. 단, 매 단위 시간마다에서 궤도 차량의 위치는 뉴턴의 제2법칙으로 결정된다. 본 모델링은 몇 개의 단위 트랙을 설정하여 이들의 조합으로 전체트랙을 설계할 수 있도록 사용자가 임의로 설계한 전체트랙에서 바로 실시간으로 시뮬레이션할 수 있는 특징을 갖는다. 당 궤도차량 운동 모델은 전동차, 철도, 롤러코스터의 궤도 설계 등에 사용될 수 있으며, 주 용도는 롤러코스터 게임 시뮬레이터에서 동 특성을 비교적 엄밀하게 시뮬레이션 하는데 있다.

  • PDF

음소 단위 임베딩 기반 한국어 모델 (Phoneme-level Embedding based Korean Language Model)

  • 최우성;현경석;정재화;정순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1026-1029
    • /
    • 2019
  • 최근 제안되고 있는 Bert 등의 딥러닝 언어 모델 기반 pre-training 기법은 다양한 NLP 분야에서 활용되고 있다. 텍스트로 작성된 데이터 셋을 딥러닝 언어 모델이 학습하기 위해서는 토크나이징(tokenizing) 기술이 필요하다. 그러나 기존 토크나이징 방식은 한국어 및 한글이 가지는 고유한 특성(교착어적 특성과 모아쓰기 반영)을 반영하기 어렵다는 한계를 가지고 있다. 본 논문에서는 한국어와 한글이 가지는 고유한 특성을 고려하기 위하여 음소 단위의 임베딩 기법을 제안하며, 이를 기반으로 언어 모델을 설계 및 구현한다. 또한 음소 단위 임베딩 기반 한국어 모델이 실제 데이터 집합(구약성서)에서 나타나는 언어적 패턴을 학습할 수 있다는 것을 실험을 통하여 밝힌다.

객체기반의 효율적인 갱신 및 이력 관리를 위한 공간 데이터 모델 설계 (Spatial Data Modeling for Feature-based Efficient Updating and History Management)

  • 김상엽;김형수;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.352-355
    • /
    • 2008
  • 최근 센서와 모바일 기술의 발달에 따라 대용량 데이터 처리가 가능해지고, 유비쿼터스와 텔레매틱스 등의 도입으로 공간 데이터가 다양한 환경에 응용되거나 활용 분야가 점차 증가하고 있다. 기존의 수치지도 관리시스템은 공간 데이터를 도엽 단위로 관리하여 데이터의 구축이 용이하지만, 객체 단위의 데이터 구축, 관리, 제공 및 갱신을 효율적으로 지원하기 어렵다. 따라서 이 논문에서는 기존 도엽기반 시스템의 문제점을 해결하기위해 객체기반 UFID 부여방안, 연속성 표현, 객체 단위의 효율적인 갱신 및 이력관리를 위한 객체기반 공간 데이터 모델을 설계한다. 제안하는 객체기반의 공간 데이터 모델은 지형지물에 UFID를 부여하고 도엽 단위로 구축된 수치지도 데이터의 조인 연산을 통해 연속적인 표현이 가능하다. 아울러 갱신으로 인해 변경된 데이터를 이력 DB에 시간간격 단위로 저장, 관리하여 사용자에게 객체단위 이력 정보를 제공할 수 있다.

KACTEIL-NER: 딥러닝과 앙상블 기법을 이용한 개체명 인식기 (KACTEIL-NER: Named Entity Recognizer Using Deep Learning and Ensemble Technique)

  • 박건우;박성식;장영진;최기현;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.324-326
    • /
    • 2017
  • 개체명 인식은 입력 문장에서 인명, 지명, 기관명, 날짜, 시간 등과 같은 고유한 의미를 갖는 단어 열을 찾아 범주를 부착하는 기술이다. 기존의 연구에서는 단어 단위나 음절 단위를 입력으로 사용하였다. 하지만 단어 단위의 경우 미등록어 처리가 어려우며 음절 단위의 경우 단어 고유의 의미가 희석되는 문제가 발생한다. 이러한 문제들을 해결하기 위해 본 논문에서는 형태소 단위 개체명 인식기와 음절 단위 개체명 인식기를 앙상블하여 보정된 결과를 예측하는 개체명 인식기를 제안한다. 제안된 모델은 각각의 단일 입력 모델보다 향상된 F1-점수(0.8049)를 보였다.

  • PDF