• Title/Summary/Keyword: 확률과정모델

Search Result 317, Processing Time 0.031 seconds

A Study on Speaker-Independent Speech Recognition Using a Hybrid System of Semi-Continuous HMM and RBF (반연속 HMM과 RBF 혼합 시스템을 이용한 화자독립 음성인식에 관한 연구)

  • Moon Yun Joo;June Sun Do;Kang Chul Ho
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.36-39
    • /
    • 1999
  • 본 논문에서는 기존의 반연속 HMM과 신경망 알고리즘인 RBF(Radial Basis Function)를 혼합한 형태를 음성인식에 적용한다. 기존의 반연속 HMM은 학습 과정에서 모든 모델과 상태에서 공유되는 L개의 가우시안 확률 밀도들과 각가우시안 확률 밀도들의 가중치를 결정하는 흔합 밀도계수 의해 입력 음성의 특징을 확률적으로 모델링하는 혼합 확률을 얻고 또 Maximum likelihood와 Baum-Welch 알고리즘을 이용해 초기확률, 전이확률, 관측확률, 평균벡터 $\mu$, 공분산 행렬 $\Sigma$을 학습해 나간다. 그러나 제안한 RBF/반연속 HMM 혼합형태는 RBF의 변형된 방식을 첨가해 반연속 HMM 관측 파라미터를 RBF에 의해 결정함으로써 보단 분별릭 있는 화자독립 인식 시스템이 된다. 그래서 인식 실험결과 인식률에 있어서 기존의 반연속 HMM보다 향상된 인식률을 얻는다.

  • PDF

Apparatus and Method for reproducing and forecasting event generation time-independently using multi-dimensional transition probability tables (다차원 전이확률표를 이용한 이벤트 발생 재현 및 시간 독립적인 예측을 위한 장치 및 방법)

  • Choi, Minn Seok;Ahn, Changwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.07a
    • /
    • pp.179-180
    • /
    • 2015
  • 에이전트 기반 마이크로 시뮬레이션에서 많이 사용하는 단순 전이확률(transition probability) 행렬이나 추정된 전이확률함수는 단순화하는 과정에서 정보 손실이 발생하고 복잡한 모델에서 사용할 수 없고 전이확률이 시간에 따라 변화하면 시간 변화를 따르는 별도의 추정이 필요로 한다. 본 연구는 이런 기존 방법의 한계를 해결하기 위하여, 다차원 전이확률표들을 이용해서 이벤트 발생을 결정함으로써 정보 손실을 줄이고 단순 행렬이나 함수로 표현하기 어려운 경우에도 이벤트 발생을 재현하고, 시간 독립적인 전이확률표를 이용해서 이벤트 발생을 결정함으로써 시간 변화를 별도로 추정하지 않고 이벤트 발생을 예측할 수 있는 방법을 제안하는데 있다.

  • PDF

A Unified Probablistic Model for Correcting Spacing Errors and Improving Accuracy of Morphological Analysis of Korean Sentences (한국어 문장의띄어 쓰기 오류 교정과 최적 형태소 분석을위한 통합 확률 모델)

  • Lee, Dong-Joo;Yeon, Jong-Heum;Lee, Sang-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.237-240
    • /
    • 2011
  • 띄어쓰기 오류는 한국어로 작성된 글에서 나타나는 가장 흔한 오류 중 하나로 문장의 의미적 모호성과 중의성을 가져온다. 규칙 기반 혹은 통계적접근 방법으로 띄어쓰기 오류를 교정하는다양한 방법이 제시되었으나, 기존의 방법들은 띄어쓰기를 형태소 분석의 전단계로 여기거나 띄어쓰기를 교정하기 위해서 형태소 분석을이용하는 등 각각을 독립된 과정으로 다루어, 한 과정에서 발생하는 오류가 다른 과정으로 전파되도록 하는 문제를 안고 있다. 본 논문에서는 띄어 쓰기와 최적 형태소 분석을 하나의 통합된 문제로 다루어각과정에서 발생할 수 있는 오류가 다른 과정에 영향을 주지 않도록 하고 상호 오류를 보완하여 좀더 정확한 띄어쓰기 오류 교정 및 형태소 분석을 가능하게 하는 확률적 접근 방법을 제시한다.

Pattern Classification of Hard Disk Defect Distribution Using Gaussian Mixture Model (가우시안 혼합 모델을 이용한 하드 디스크 결함 분포의 패턴 분류)

  • Jun, Jae-Young;Kim, Jeong-Heon;Moon, Un-Chul;Choi, Kwang-Nam
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.482-486
    • /
    • 2008
  • 본 논문에서는 하드 디스크 드라이브(Hard Disk Drive, HDD) 생산 공정 과정에서 발생할 수 있는 불량 HDD의 결함 분포에 대해서 패턴을 자동으로 분류해주는 기법을 제시한다. 이를 위해서 표준 패턴 클래스로 분류되어 있는 불량 HDD의 각 클래스의 확률 모델을 GMM(Gaussian Mixture Model)로 가정한다. 실험은 전문가에 의해 분류된 실제 HDD 결함 분포로부터 5가지의 특징 값들을 추출한 후, 결함 분포의 클래스를 표현할 수 있는 GMM의 파라미터(Parameter)를 학습한다. 각 모델의 파라미터를 추정하기 위해 EM(Expectation Maximization) 알고리즘을 사용한다. 학습된 GMM의 분류 테스트는 학습에 사용되지 않은 HDD 결함 분포에서 5가지의 특징 값을 입력 값으로 추정된 모델들의 파라미터 값에 의해 사후 확률을 구한다. 계산된 확률 값 중 가장 큰 값을 갖는 모델의 클래스를 표준 패턴 클래스로 분류한다. 그 결과 제시된 GMM을 이용한 HDD의 패턴 분류의 결과 96.1%의 정답률을 보여준다.

  • PDF

Image Interpolation Using Linear Modeling for the Absolute Values of Wavelet Coefficients Across Scale (스케일간 웨이블릿 계수 절대치의 선형 모델링을 이용한 영상 보간)

  • Kim Sang-Soo;Eom Il-Kyu;Kim Yoo-Shin
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.42 no.6
    • /
    • pp.19-26
    • /
    • 2005
  • Image interpolation in the wavelet domain usually takes advantage of the probabilistic models for the intrascale statistics and the interscale dependency. In this paper, we adopt the linear model for the absolute values of wavelet coefficients of interpolated image across scale to estimate the variances of extrapolated bands. The proposed algorithm uses randomly generated wavelet coefficients based on the estimated parameters for probabilistic model. Random number generation according to the estimated probabilistic model may induce the 'salt and pepper' noise in subbands. We reduce the noise power by Wiener filtering. We observe that the proposed method generates the histogram of the subband coefficients similar to the that of original image. Experimental results show that our method outperforms the previous wavelet-domain interpolation method as well as the conventional bicubic method.

Reliability-based Design Optimization using MD method (곱분해기법을 적용한 신뢰성 기반 최적 설계)

  • Lee, Tae-Hee;Kim, Tae-Kyun
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2009.04a
    • /
    • pp.101-104
    • /
    • 2009
  • 최적설계는 설계자가 요구하는 제한조건을 만족시키는 범위에서 목적함수가 최소가 되는 설계점을 찾는 방법이다. 그러나 기존의 최적설계는 불확실성의 영향을 고려하지 않아 최적해가 제한조건의 경계에 위치하고 이것은 모델링과정이나 가공 등으로 인한 오차에 대한 영향을 고려하지 않는 문제점이 있다. 신뢰성 기반 최적설계는 불확실성을 정량화하면서 신뢰도를 계산하는 신뢰도 해석과정과 최적설계과정을 포함한다. 일반적으로 신뢰성 해석은 크게 추출법, 급속 확률 적분법, 모멘트 기반 신뢰성해석이 있다. 가장 널리 사용되는 급속 확률 적분법 중 최대 손상 가능점(MPP) 방법은 많은 MPP점이 존재하는 경우 수치적 비용이 증가하는 문제점과 표준 정규분포 공간으로 변환하는 과정에서 제한조건의 비선형성을 증가시켜 큰 오차를 발생시키는 문제점이 있다. 본 논문에서는 RBDO를 수행하기에 앞서 선행되어야 할 신뢰성해석 방법으로 곱분해기법을 사용하였고 이로부터 민감도 정보를 유도하여 기울기 기반 최적화 알고리즘을 적용하였다.

  • PDF

Joint Probability Approach to Bias Correction on Rainfall Forecasting Using Climate State Variables (결합확률모델 및 기상변량을 이용한 예측강수의 편의보정 기법)

  • Jung, Min-Kyu;Kim, Tae-Jeong;Hwang, Kyu-Nam;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.309-309
    • /
    • 2019
  • 기후예측모델을 통해 일단위 강수의 예측정보가 제공되고 있지만, 실제 강수량자료와 시공간적 편의로 인해 수문학적 활용은 한계가 있다. 일반적으로 기후모델의 시공간적 해석 규모 및 예측정확성을 고려할 때 계절단위에서 예측정보의 활용이 가장 현실적인 것으로 알려지고 있다. 그러나 수문해석 시 시공간적 해상도가 낮아 직접적인 활용은 어려운 상황이며, 수문해석 모형의 입력자료로 활용 시 편의보정 및 상세화 과정이 일반적으로 요구된다. 본 연구에서는 기후모델로부터 얻은 강우예측결과에 Bayesian 모델 기반의 편의보정-상세화 기법을 개발하여 강우예측정보의 활용성을 개선하고자 한다. 이 과정에서 Bayesian Copula 모델을 이용한 이변량 형태의 예측강수의 검보정 방법을 개발하였으며, 특히 기후모델 이외의 기상 상태변량인 해수면온도(sea surface temperature, SST)를 예측인자로 추가하여 Hybrid 형태의 계절 앙상블 강우예측모델을 개발하고자 한다.

  • PDF

A Use of Expectation Maximization Clustering for Constructing a Markov Chain of Human Mobility Model (기대치 최대화 기반의 군집화를 통한 인간 이동 패턴의 마르코프 연쇄모델 도출)

  • Kim, Hyunuk;Song, Ha Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.864-867
    • /
    • 2012
  • 사람들이 휴대용 위치정보 수집 장비나 혹은 스마트폰을 사용하면서 사람의 이동 정보인 위치정보들을 모으는 일이 가능해 졌다. 이러한 위치정보들을 가지고 본 논문에서는 사람의 이동 모델을 나타내고자 하였다. 이동 정보들은 머물러 있는(Stay)상태와 이동하는(Moving) 상태로 나눌 수 있는데 이러한 상태 중 머물러 있는 상태가 군집화가 되어 연쇄 모델속의 하나의 상태(State)로 나타나 질 수 있다. 물론 이동 정보들을 통해 연쇄모델 속 각 상태간의 전이 확률 또한 계산 할 수 있다. 이러한 일련의 과정을 본 논문에서는 기대치 최대화 기반 군집화 과정을 통해 연속시간 연쇄 모델의 형태로 인간의 이동성을 표현하였다. 또한 이러한 모델에서 대표 군집(macro)과 그 부속 군집(micro)을 표현할 수 있었고 이러한 모습은 대표적인 큰 군집 속의 작은 군집의 형태로 나타나게 된다.

Two-step Boundary Extraction Algorithm with Model (모델 정보를 이용한 2단계 윤곽선 추출 기법)

  • Choe, Hae-Cheol;Lee, Jin-Seong;Jo, Ju-Hyeon;Sin, Ho-Cheol;Kim, Seung-Dae
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.39 no.1
    • /
    • pp.49-60
    • /
    • 2002
  • We propose an algorithm for extracting the boundary of a desired object with shape information obtained from sample images. Considering global shape obtained from sample images and edge orientation as well as edge magnitude, the Proposed method composed of two steps finds the boundary of an object. The first step is the approximate segmentation that extracts a rough boundary with a probability map and an edge map. And the second step is the detailed segmentation for finding more accurate boundary based on the SEEL (seed-point extraction and edge linking) algorithm. The experiment results using IR images show robustness to low-quality image and better performance than conventional segmentation methods.

Topographic Non-negative Matrix Factorization for Topic Visualization from Text Documents (Topographic non-negative matrix factorization에 기반한 텍스트 문서로부터의 토픽 가시화)

  • Chang, Jeong-Ho;Eom, Jae-Hong;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.324-329
    • /
    • 2006
  • Non-negative matrix factorization(NMF) 기법은 음이 아닌 값으로 구성된 데이터를 두 종류의 양의 행렬의 곱의 형식으로 분할하는 데이터 분석기법으로서, 텍스트마이닝, 바이오인포매틱스, 멀티미디어 데이터 분석 등에 활용되었다. 본 연구에서는 기본 NMF 기법에 기반하여 텍스트 문서로부터 토픽을 추출하고 동시에 이를 가시적으로 도시하기 위한 Topographic NMF (TNMF) 기법을 제안한다. TNMF에 의한 토픽 가시화는 데이터를 전체적인 관점에서 보다 직관적으로 파악하는데 도움이 될 수 있다. TNMF는 생성모델 관점에서 볼 때, 2개의 은닉층을 갖는 계층적 모델로 표현할 수 있으며, 상위 은닉층에서 하위 은닉층으로의 연결은 토픽공간상에서 토픽간의 전이확률 또는 이웃함수를 정의한다. TNMF에서의 학습은 전이확률값의 연속적 스케줄링 과정 속에서 반복적 파리미터 갱신 과정을 통해 학습이 이루어지는데, 파라미터 갱신은 기본 NMF 기반 학습 과정으로부터 유사한 형태로 유도될 수 있음을 보인다. 추가적으로 Probabilistic LSA에 기초한 토픽 가시화 기법 및 희소(sparse)한 해(解) 도출을 목적으로 한 non-smooth NMF 기법과의 연관성을 분석, 제시한다. NIPS 학회 논문 데이터에 대한 실험을 통해 제안된 방법론이 문서 내에 내재된 토픽들을 효과적으로 가시화 할 수 있음을 제시한다.

  • PDF