• Title/Summary/Keyword: 통계적 모델

Search Result 1,114, Processing Time 0.026 seconds

Comparative Analysis of Statistical Language Modeling for Korean using K-SLM Toolkits (K-SLM Toolkit을 이용한 한국어의 통계적 언어 모델링 비교)

  • Lee, Jin-Seok;Park, Jay-Duke;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.426-432
    • /
    • 1999
  • 통계적 언어 모델은 자연어 처리의 다양한 분야에서 시스템의 정확도를 높이고 수행 시간을 줄여줄 수 있는 중요한 지식원이므로 언어 모델의 성능은 자연어 처리 시스템, 특히 음성 인식 시스템의 성능에 직접적인 영향을 준다. 본 논문에서는 한국어를 위한 통계적 언어 모델을 구축하기 위한 다양한 언어 모델 실험을 제시하고 각 언어 모델들 간의 성능 비교를 통하여 통계적 언어 모델의 표준을 제시한다. 또한 형태소 및 어절 단위의 고 빈도 어휘만을 범용 언어 모델에 적용할 때의 적용률을 통하여 언어 모델 구축시 어휘 사전 크기 결정을 위한 기초적 자료를 제시한다. 본 연구는 음성 인식용 통계적 언어 모델의 성능을 판단하는 데 앞으로 큰 도움을 줄 수 있을 것이다.

  • PDF

Performance Comparison Between Neural Network Model and Statistical Models (통계적 모델과 신경회로망 모델의 성능 비교에 관한 연구)

  • Han, Seung-Soo;Kim, In-Taek
    • Proceedings of the KIEE Conference
    • /
    • 2000.07d
    • /
    • pp.2401-2403
    • /
    • 2000
  • 시스템의 특성을 이해하고 신뢰성 있는 제어를 위해서는 시스템에 대한 정확한 모델을 필요로 한다. 이러한 목적을 위해서 많은 연구자들에 의한 다양한 방법의 모델링 방법이 계속되어 연구되어지고 있다. 현재 많이 사용하는 모델링 방법 중에는 통계적 기법을 이용하는 것, first principle 방법을 이용하는 것, 지능형 기법을 이용하는 방법 등이 있다. 본 연구에서는 통계적 방법인 fractional factorial 방법을 이용한 모델, Taguchi 방법을 이용한 모델, 그리고 지능형 방법인 신경회로망을 이용한 모델의 3가지 모델을 사용해서 각 모델의 학습오차와 예측오차 등의 특성을 비교하였다. 모델에 사용된 데이터는 비선형 시스템인 플라즈마 화학 증착 장비(Plasma-Enhnaced Chemical Vapor Deposition : PECVD)에 의해 증착된 산화막 실험 데이터이다. 각 모델에 대해서 PECVD 데이터를 사용하여 모델을 만들었을 때 각 모델의 학습오차와 학습오차 변위, 그리고 예측오차와 예측오차변위를 조사하였다. 세가지 모델 모두 학습오차가 예측오차보다 작았으며 변위 또한 학습오차변위가 예측오차변위보다 작았다. 본 연구 결과는 일반적으로 신경회로망에 의한 오차가 다른 통계적인 방법에 의한 오차보다 작음을 보여준다.

  • PDF

A Stochastic Model for Leical Disambiguation in Korean (한국어 품사 모호성 해서를 위한 통계적 모델)

  • 이상호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.71-74
    • /
    • 1994
  • 종래의 자연언어 처리 시스템에서는 품사 모호성이 그대로 구문 분석기의 입력으로 사용되었으나, 최근에와서 품사 모호성 해소에 관한 논의가 활발히 진행되고 있다. 본 논문에서는 품사 모호성 해소를 위한 두 개의 통계적 모델이 경로 기반 태깅 모델과 상태 기반 태깅 모델을 설명한다. 그리고하나의 최적 품사열만을 구할 경우 단어당 94% 내외의 정확률을 가지므로 N개의 최적 품사열을 구하는 다중 출력 태거에 대해 각각 설명한다.끝으로 한국어에 이러한 통계적 모델들을 적용한 결과와 발생되는 문제점들을 논한다.

  • PDF

통계적 모델 검증 및 보정 기술

  • Yun, Byeong-Dong;Yun, Heon-Jun;Park, Jeong-Ho
    • Journal of the KSME
    • /
    • v.54 no.2
    • /
    • pp.52-57
    • /
    • 2014
  • 이 글에서는 컴퓨터 이용 공학(CAE : Computer Aided Engineering) 기술이 발달함에 따라 갈수록 중요해지는 통계적 모델 검증 및 보정(Statistical Model Validation and Calibration)을 수행하는 데 필요한 통계적인 기법들을 각 단계별로 상세하게 소개하고, 실제 제품 개발에 적용하는 데 있어서 예상되는 어려움과 향후 연구방향을 제시하고자 한다.

  • PDF

Statistical Space-Time Metamodels Based on Multiple Responses Approach for Time-Variant Dynamic Response of Structures (구조물의 시간-변화 동적응답에 대한 다중응답접근법 기반 통계적 공간-시간 메타모델)

  • Lee, Jin-Min;Lee, Tae-Hee
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.34 no.8
    • /
    • pp.989-996
    • /
    • 2010
  • Statistical regression and/or interpolation models have been used for data analysis and response prediction using the results of the physical experiments and/or computer simulations in structural engineering fields. These models have been employed during the last decade to develop a variety of design methodologies. However, these models only handled responses with respect to space variables such as size and shape of structures and cannot handle time-variant dynamic responses, i.e. response varying with time. In this research, statistical space-time metamodels based on multiple response approach that can handle responses with respect to both space variables and a time variable are proposed. Regression and interpolation models such as the response surface model (RSM) and kriging model were developed for handling time-variant dynamic responses of structural engineering. We evaluate the accuracies of the responses predicted by the two statistical space-time metamodels by comparing them with the responses obtained by the physical experiments and/or computer simulations.

Intuitive Quasi-Eigenfaces for Facial Animation (얼굴 애니메이션을 위한 직관적인 유사 고유 얼굴 모델)

  • Kim, Ig-Jae;Ko, Hyeong-Seok
    • Journal of the Korea Computer Graphics Society
    • /
    • v.12 no.2
    • /
    • pp.1-7
    • /
    • 2006
  • 블렌드 쉐입 기반 얼굴 애니메이션을 위해 기저 모델(Expression basis)을 생성하는 방법을 크게 두 가지로 구분하면, 애니메이터가 직접 모델링을 하여 생성하는 방법과 통계적 방법에 기초하여 모델링하는 방법이 있다. 그 중 애니메이터에 의한 수동 모델링 방법으로 생성된 기저 모델은 직관적으로 표정을 인식할 수 있다는 장점으로 인해 전통적인 키프레임 제어가 가능하다. 하지만, 표정 공간(Expression Space)의 일부분만을 커버하기 때문에 모션데이터로부터의 재복원 과정에서 많은 오차를 가지게 된다. 반면, 통계적 방법을 기반으로 한 기저모델 생성 방법은 거의 모든 표정공간을 커버하는 고유 얼굴 모델(Eigen Faces)을 생성하므로 재복원 과정에서 최소의 오차를 가지지만, 시각적으로 직관적이지 않은 표정 모델을 만들어 낸다. 따라서 본 논문에서는 수동으로 생성한 기저모델을 유사 고유 얼굴 모델(Quasi-Eigen Faces)로 변형하는 방법을 제시하고자 한다. 결과로 생성되는 기저 모델은 시각적으로 직관적인 얼굴 표정을 유지하면서도 통계적 방법에 의한 얼굴표정 공간의 커버 영역과 유사하도록 확장할 수 있다.

  • PDF

Statistical Model-Based Voice Activity Detection Using the Second-Order Conditional Maximum a Posteriori Criterion with Adapted Threshold (적응형 문턱값을 가지는 2차 조건 사후 최대 확률을 이용한 통계적 모델 기반의 음성 검출기)

  • Kim, Sang-Kyun;Chang, Joon-Hyuk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.29 no.1
    • /
    • pp.76-81
    • /
    • 2010
  • In this paper, we propose a novel approach to improve the performance of a statistical model-based voice activity detection (VAD) which is based on the second-order conditional maximum a posteriori (CMAP). In our approach, the VAD decision rule is expressed as the geometric mean of likelihood ratios (LRs) based on adapted threshold according to the speech presence probability conditioned on both the current observation and the speech activity decisions in the pervious two frames. Experimental results show that the proposed approach yields better results compared to the statistical model-based and the CMAP-based VAD using the LR test.

스마트폰 음성 통신용 음성 검출 기술

  • Kim, Sang-Gyun;Jang, Jun-Hyeok
    • Information and Communications Magazine
    • /
    • v.29 no.4
    • /
    • pp.10-14
    • /
    • 2012
  • 본고에서는 스마트폰 환경에서 음성 통신에 필요한 가변 전송률 음성 부호화기를 위한 음성 검출 기술을 알아본다. 소개할 음성 검출 기술은 통계적 모델(statistical model)을 기반으로 한 우도비 테스트(likelihood ratio test, LRT)를 이용하여 음성 존재 여부를 판단하는 결정법을 유도한다. 이후 통계적 모델을 기반으로 한 음성 검출 방법의 신뢰도를 높이기 위해 새로운 방법들이 연구되었으며 최근까지 연구가 진행 중인 통계적 모델 기반의 음성 검출 방법을 소개한다.

3D Scan Model Fitting by Using Statistics (통계를 이용한 3차원 스캔모델 맞춤 방법)

  • Soohyun Jeon;Hyewon Seo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.219-222
    • /
    • 2008
  • 3차원 인체 스캐너로부터 얻어진 인체형상데이터는 여러 인체에 대한 3차원 평균 모델을 만들어 내는 등의 통계적 분석이나 자세 변경을 위해 필요한 내부 골격 구조와 골격과 피부조직 사이의 관계 등을 계산해 내기 어렵다. 또, 이러한 통계적 분석을 위해서는 각 모델 간의 상응 관계가 확립되어야 하지만 스캐너로부터 얻어진 인체 형상 데이터들은 측정 환경이나 대상에 따라 각각이 서로 상이한 기하학적 구조로 이루어져 있다. 본 논문에서는 템플릿 모델을 3차원 인체데이터에 맞도록 변형함으로써 다수의 인체 형상에 대하여 토폴로지를 일치시키도록 한다. 3차원 인체 데이터에 대해 템플릿 모델이 가장 근사한 형상이 되도록 하는 변형을 자동으로 찾아내기 위해서 표면 위에 정의된 특징점들을 사용한다. 또한, 기존에 찾아둔 특징점군 및 변형정보 데이터가 충분히 많다면 새로운 변형을 계산하는 데 유용하게 사용될 수 있음을 보인다. 이렇게 상응 관계가 확립된 모델들은 삼차원 벡터 공간의 점들의 집합으로 표현 및 통계적 분석이 가능하게 된다.

Precise Positioning from GPS Carrier Phase Measurement Applying Stochastic Models for Ionospheric Delay (전리층 지연 효과의 통계적 모델을 이용한 반송파 정밀측위)

  • Yang, Hyo-Jin;Kwon, Jay-Hyoun
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.25 no.4
    • /
    • pp.319-325
    • /
    • 2007
  • In case of more than 50km baseline length, the correlation between receivers is reduced. Therefore, there are still some rooms for improvement of its positional accuracy. In this paper, the stochastic modeling of the ionospheric delay is applied and its effects are analyzed. The data processing has been performed by constructing a Kalman filter with states of positions, ambiguities, and the ionospheric delays in the double differenced mode. Considering the medium or long baseline length, both double differenced GPS phase and code observations are used as observables and LAMBDA has been applied to fix the ambiguities. The ionospheric delay is stochastically modeled by well-known 1st order Gauss-Markov process. And the correlation time and variation of 1st order Gauss-Markov process are calculated. This paper gives analyzed results of developed algorithm compared with commercial software and Bernese.