• Title/Summary/Keyword: 이산분포

Search Result 274, Processing Time 0.021 seconds

A Comparison of Discrete and Continuous Hidden Markov Models for Korean Digit Recognition (한국어 숫자음 인식을 위한 이산분포 HMM과 연속분포 HMM의 성능 비교 연구)

  • 홍형진
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.157-160
    • /
    • 1994
  • 본 논문에서는 한국어 숫자음 인식에 대한 이산분포 HMM과 연속분포 HMM의 인식 성능을 비교하였다. 일반적으로 연속분포 HMM은 많은 계산량이 필요하고, 학습시 초기값이 매우 민감하다는 단점이 있지만, 이산분포 HMM의 VQ로 인한 왜곡을 제거함으로써 인식률을 향상시킬 수 있다. 여기서는 성능비교를 위해서 mel-cepstrum의 분석차수, 이산분포 HMM의 codebook 크기, 연속분포 HMM의 miture 개수등에 따른 인식성능을 비교하였다. 실험 결과 이산분포 HMM에서는 mel-cepstrum 벡터가 14차이고, codebook 크기가 64일 때 가장 좋은 성능을 나타냈으며, 연속부포 HMM에서는 mel-cepstrum 벡터가 16차이고 miture가 3개일 때 가장 좋은 결과를 얻을 수 있었다. 특히 학습 데이터의 양이 적은 경우에는 연속분포 HMM이 이산분포 HMM보다 더 좋은 인식률을 나타내었다.

  • PDF

Korean Word Recognition Using Semi-continuous Hidden Markov Models (준영속분포 HMM을 이용한 한국어 단어 인식)

  • 조병서;이기영;최갑석
    • The Journal of the Acoustical Society of Korea
    • /
    • v.11 no.6
    • /
    • pp.46-52
    • /
    • 1992
  • 본 논문에서는 HMM 의 이산분포를 연속분포로 근사시키는 준 연속분포 HMM 에 의한 한국어 단어인식에 관하여 연구하였다. 이 모델의 생성과정에서는 입력벡터의 출력확률을 혼합 다차원 정규분 포로 가정하여 입력벡터의 확률함수와 코드위드의 심볼출력을 선형결합하므로써, 연속분포 모델로 근사 시켰으며, 단어인식과정에서는 생성모델에 의해 이산분포 모델에서 발생되는 양자와 왜곡을 감소시키므 로써 인식률을 향상시켰다. 이 방법을 평가하기 위하여 DDD 지역명을 대상으로 이산분포 HMM과 준연 속분포 HMM 의 비교실험을 수행하였다. 그 결과 준연속분포 HMM 에 의하여 이산분포 HMM 보다 향상된 인식률을 얻을 수 있었다.

  • PDF

A Study on the Estimation of Confidence Intervals for Discrete Distribution

  • Kim, Dae-Hak;Oh, Kwang-Sik;Lee, Sang-Bok
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2003.10a
    • /
    • pp.1-11
    • /
    • 2003
  • 일반적으로 모수에 대한 신뢰구간 추정량이 점 추정량보다 훨씬 더 선호되고 있으며 많이 알려져 있다. 그러나 이산형 분포의 경우에는 주로 대 표본 근사 이론에 입각한 근사 신뢰구간이 많이 사용되고 있다. 본 논문에서는 여러 가지 이산형 분포 가운데에서 가장 많이 활용되고 있는 이항분포와 포아송 분포의 모수에 대한 다양한 신뢰구간 추정량들을 소개하고 대 표본 근사 이론에 의한 신뢰구간뿐만 아니라 소 표본의 경우에도 유용하게 이용될 수 있는 신뢰구간 등을 살펴보고 이들 신뢰구간들을 비교하였다.

  • PDF

Criterion of discrete unimodal mixtures (이산분포 혼합의 단봉성이 성립하기 위한 조건)

  • 최대우
    • The Korean Journal of Applied Statistics
    • /
    • v.8 no.1
    • /
    • pp.159-167
    • /
    • 1995
  • Considering special discrete distribution of exponential family as a sequence with respect to the points of support, the squence is unimodal in some sense. In this paper, we study under what condition the mixture of that discrete distribution with respect to a parameter is unimodal. We derive the maximal interval of the parameter in which each mixture of the discrete distribution such as Binomial and Poisson is always unimodal.

  • PDF

Derivations of moments for discrete probability distributions using backward difference operators (후진 미분 연산자를 이용한 이산확률분포의 적률 유도)

  • Cho, Kil-Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.3
    • /
    • pp.505-513
    • /
    • 2011
  • In this paper, we obtain the derivations of moments of discrete probability distributions by using the backward difference operators. Also, we presents such derivations for several well-known distributions; they are the binomial, Poisson, geometric, hypergeometric and negative hypergeometric distributions.

The discretization method of Poisson equation by considering Fermi-Dirac distribution (Fermi-Dirac 분포를 고려한 Poisson 방정식의 이산화 방법)

  • 윤석성;이은구;김철성
    • Proceedings of the IEEK Conference
    • /
    • 1999.06a
    • /
    • pp.907-910
    • /
    • 1999
  • 본 논문에서는 고 농도로 불순물이 주입된 영역에서 전자 및 정공 농도를 정교하게 구현하기 위해 Fermi-Dirac 분포함수를 고려한 포아송 방정식의 이산화 방법을 제안하였다. Fermi-Dirac 분포를 근사시키기 위해서 Least-Squares 및 점근선 근사법을 사용하였으며 Galerkin 방법을 근간으로 한 유한 요소법을 이용하여 포아송 방정식을 이산화하였다. 구현한 모델을 검증하기 위해 전력 BJT 시료를 제작하여 자체 개발된 소자 시뮬레이터인 BANDIS를 이용하여 모의 실험을 수행한 결과, 상업용 2차원 소자 시뮬레이터인 MEDICI에 비해 최대 4%이내의 상대 오차를 보였다.

  • PDF

Discretization of continuous-valued attributes considering data distribution (데이터 분포를 고려한 연속 값 속성의 이산화)

  • 이상훈;박정은;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.217-220
    • /
    • 2003
  • 본 논문에서는 특정 매개변수의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(conti-nuous) 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

  • PDF

A Unified Approach for the Analysis of Discrete-time MAP/G/1 Queue: by Workload Analysis (일량분석에 의한 이산시간 MAP/G/1 대기행렬시스템의 통합적 분석)

  • Lee, Se Won
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.22 no.1
    • /
    • pp.23-32
    • /
    • 2017
  • In this paper, We suggest a unified approach for the analysis of discrete-time MAP/G/1 queueing system. Many researches on the D-MAP/G/1 queue have been used different approach to analyze system queue length and waiting time for the same system. Therefore, a unified framework for analyzing a system is necessary from a viewpoint of system design and management. We first derived steady-state workload distribution, and then waiting time and sojourn time are derived by the result of workload analysis. Finally, system queue length distribution is derived with generating function from the sojourn time distribution.

Discretization Method for Continuous Data using Wasserstein Distance (Wasserstein 거리를 이용한 연속형 변수 이산화 기법)

  • Ha, Sang-won;Kim, Han-joon
    • Database Research
    • /
    • v.34 no.3
    • /
    • pp.159-169
    • /
    • 2018
  • Discretization of continuous variables intended to improve the performance of various algorithms such as data mining by transforming quantitative variables into qualitative variables. If we use appropriate discretization techniques for data, we can expect not only better performance of classification algorithms, but also accurate and concise interpretation of results and speed improvements. Various discretization techniques have been studied up to now, and however there is still demand of research on discretization studies. In this paper, we propose a new discretization technique to set the cut-point using Wasserstein distance with considering the distribution of continuous variable values with classes of data. We show the superiority of the proposed method through the performance comparison between the proposed method and the existing proven methods.

Retrieval of Nitrogen Dioxide Column Density from Ground-based Pandora Measurement using the Differential Optical Absorption Spectroscopy Method (차등흡수분광기술을 이용한 지상기반 Pandora 관측으로부터의 대기 중 이산화질소 칼럼농도 산출)

  • Yang, Jiwon;Hong, Hyunkee;Choi, Wonei;Park, Junsung;Kim, Daewon;Kang, Hyeongwoo;Lee, Hanlim;Kim, Joon
    • Korean Journal of Remote Sensing
    • /
    • v.33 no.6_1
    • /
    • pp.981-992
    • /
    • 2017
  • We, for the first time, retrieved tropospheric nitrogen dioxide ($Trop.NO_2$) vertical column density (VCD) from ground-based instrument, Pandora, using the optical density fitting based on Differential Optical Absorption Spectroscopy (DOAS)in Seoul for the period from May 2014 to December 2014. The $Trop.NO_2$ VCDs retrieved from Pandora were compared with those obtained from Ozone Monitoring Instrument (OMI). A correlation coefficient (R) between those retrieved from Pandora and those obtained from OMI is 0.55. To compare with surface $NO_2$ VMRs obtained from in-situ, Trop. $NO_2$ VCDs retrieved from Pandora and those obtained from OMI are converted into $NO_2$ VMRs in boundary layer (BLH $NO_2$ VMRs) using data measured from Atmospheric Infrared Sounder (AIRS). Surface $NO_2$ VMRs obtained from in-situ range from 5.5 ppbv to 61.5 ppbv. BLH $NO_2$ VMRs retrieved from Pandora and OMI range from 2.1 ppbv to 44.2 ppbv and from 0.9 ppbv to 11.6 ppbv, respectively. The range of BLH $NO_2$ VMRs retrieved from OMI is narrower than that of BLH $NO_2$ VMRs retrieved from Pandora and surface $NO_2$ VMRs obtained from in-situ. There is a batter correlation between surface $NO_2$ VMRs obtained from in-situ and BLH $NO_2$ VMRs retrieved from Pandora (R= 0.50)than the correlation between surface $NO_2$ VMRs obtained from in-situ and BLH $NO_2$ VMRs retrieved from OMI (R = 0.36). This poor correlation is thought to be due to the lower near-surface sensitivity of the satellite-based instrument (OMI) than Pandora, the ground-based instrument.