• 제목/요약/키워드: 이산분포

검색결과 274건 처리시간 0.034초

한국어 숫자음 인식을 위한 이산분포 HMM과 연속분포 HMM의 성능 비교 연구 (A Comparison of Discrete and Continuous Hidden Markov Models for Korean Digit Recognition)

  • 홍형진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.157-160
    • /
    • 1994
  • 본 논문에서는 한국어 숫자음 인식에 대한 이산분포 HMM과 연속분포 HMM의 인식 성능을 비교하였다. 일반적으로 연속분포 HMM은 많은 계산량이 필요하고, 학습시 초기값이 매우 민감하다는 단점이 있지만, 이산분포 HMM의 VQ로 인한 왜곡을 제거함으로써 인식률을 향상시킬 수 있다. 여기서는 성능비교를 위해서 mel-cepstrum의 분석차수, 이산분포 HMM의 codebook 크기, 연속분포 HMM의 miture 개수등에 따른 인식성능을 비교하였다. 실험 결과 이산분포 HMM에서는 mel-cepstrum 벡터가 14차이고, codebook 크기가 64일 때 가장 좋은 성능을 나타냈으며, 연속부포 HMM에서는 mel-cepstrum 벡터가 16차이고 miture가 3개일 때 가장 좋은 결과를 얻을 수 있었다. 특히 학습 데이터의 양이 적은 경우에는 연속분포 HMM이 이산분포 HMM보다 더 좋은 인식률을 나타내었다.

  • PDF

준영속분포 HMM을 이용한 한국어 단어 인식 (Korean Word Recognition Using Semi-continuous Hidden Markov Models)

  • 조병서;이기영;최갑석
    • 한국음향학회지
    • /
    • 제11권6호
    • /
    • pp.46-52
    • /
    • 1992
  • 본 논문에서는 HMM 의 이산분포를 연속분포로 근사시키는 준 연속분포 HMM 에 의한 한국어 단어인식에 관하여 연구하였다. 이 모델의 생성과정에서는 입력벡터의 출력확률을 혼합 다차원 정규분 포로 가정하여 입력벡터의 확률함수와 코드위드의 심볼출력을 선형결합하므로써, 연속분포 모델로 근사 시켰으며, 단어인식과정에서는 생성모델에 의해 이산분포 모델에서 발생되는 양자와 왜곡을 감소시키므 로써 인식률을 향상시켰다. 이 방법을 평가하기 위하여 DDD 지역명을 대상으로 이산분포 HMM과 준연 속분포 HMM 의 비교실험을 수행하였다. 그 결과 준연속분포 HMM 에 의하여 이산분포 HMM 보다 향상된 인식률을 얻을 수 있었다.

  • PDF

A Study on the Estimation of Confidence Intervals for Discrete Distribution

  • 김대학;오광식;이상복
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 추계학술대회
    • /
    • pp.1-11
    • /
    • 2003
  • 일반적으로 모수에 대한 신뢰구간 추정량이 점 추정량보다 훨씬 더 선호되고 있으며 많이 알려져 있다. 그러나 이산형 분포의 경우에는 주로 대 표본 근사 이론에 입각한 근사 신뢰구간이 많이 사용되고 있다. 본 논문에서는 여러 가지 이산형 분포 가운데에서 가장 많이 활용되고 있는 이항분포와 포아송 분포의 모수에 대한 다양한 신뢰구간 추정량들을 소개하고 대 표본 근사 이론에 의한 신뢰구간뿐만 아니라 소 표본의 경우에도 유용하게 이용될 수 있는 신뢰구간 등을 살펴보고 이들 신뢰구간들을 비교하였다.

  • PDF

이산분포 혼합의 단봉성이 성립하기 위한 조건 (Criterion of discrete unimodal mixtures)

  • 최대우
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.159-167
    • /
    • 1995
  • 지수족(exponential family)에 속하면서 어떤 특별한 형태를 따르는 이산분포는 그 분포함수가 정의된 정수에 대한 단봉적 순열이다. 본 논문에서 그러한 분포함수의 모수에 대한 혼합형이 어떤 조건하에서 항상 단봉적 순열을 유지하는가에 대하여 연구하였다. 그 예로써 이항분포와 포아송분포 각각에 대한 최대모수구간을 구하여, 그 모수 구간안에서의 혼합형은 항상 단봉적임을 보였다.

  • PDF

후진 미분 연산자를 이용한 이산확률분포의 적률 유도 (Derivations of moments for discrete probability distributions using backward difference operators)

  • 조길호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.505-513
    • /
    • 2011
  • 본 논문의 목적은 후진 미분 연산자를 이용하여 이산확률분포에 대한 원점으로부터의 r차 적률을 구하는 공식을 유도한다. 이 공식을 이용함으로써 r차 적률은 0에서 계산된 $x^r$의 r번째 후진 미분 연산자까지의 일차결합으로써 계산됨을 알 수 있다.

Fermi-Dirac 분포를 고려한 Poisson 방정식의 이산화 방법 (The discretization method of Poisson equation by considering Fermi-Dirac distribution)

  • 윤석성;이은구;김철성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.907-910
    • /
    • 1999
  • 본 논문에서는 고 농도로 불순물이 주입된 영역에서 전자 및 정공 농도를 정교하게 구현하기 위해 Fermi-Dirac 분포함수를 고려한 포아송 방정식의 이산화 방법을 제안하였다. Fermi-Dirac 분포를 근사시키기 위해서 Least-Squares 및 점근선 근사법을 사용하였으며 Galerkin 방법을 근간으로 한 유한 요소법을 이용하여 포아송 방정식을 이산화하였다. 구현한 모델을 검증하기 위해 전력 BJT 시료를 제작하여 자체 개발된 소자 시뮬레이터인 BANDIS를 이용하여 모의 실험을 수행한 결과, 상업용 2차원 소자 시뮬레이터인 MEDICI에 비해 최대 4%이내의 상대 오차를 보였다.

  • PDF

데이터 분포를 고려한 연속 값 속성의 이산화 (Discretization of continuous-valued attributes considering data distribution)

  • 이상훈;박정은;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.217-220
    • /
    • 2003
  • 본 논문에서는 특정 매개변수의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(conti-nuous) 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

  • PDF

일량분석에 의한 이산시간 MAP/G/1 대기행렬시스템의 통합적 분석 (A Unified Approach for the Analysis of Discrete-time MAP/G/1 Queue: by Workload Analysis)

  • 이세원
    • 한국산업정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.23-32
    • /
    • 2017
  • 본 논문에서는 이산시간 마코비안 도착과정(discrete-time Markovian arrival process, 이하 이산시간 MAP)을 갖는 대기행렬시스템의 주요성능척도들을 분석하기 위한 통합적 접근방법을 제시한다. 기존의 이산시간 MAP/G/1 대기행렬시스템의 연구들을 보면 동일한 시스템에 대하여 시스템 내 고객수와 대기시간 등을 분석할 때 서로 다른 방법으로 접근하였기에 이 둘을 동시에 살펴보고자 할 때는 추가적인 시간과 노력이 뒤따랐다. 따라서 하나의 시스템을 여러 방면에서 포괄적으로 분석할 수 있는 통합적인 접근방법은 시스템을 설계하고 관리하는 입장에서 볼 때 중요한 분석의 틀이 된다. 본 논문에서는 이산시간 MAP/G/1 시스템의 안정상태 일량 분포를 유도하고 이를 이용하여 임의고객의 대기시간, 체재시간 분포를 유도한다. 체재시간 분포로부터 이탈시점 고객수 분포를 구하고 이탈시점 고객수와 임의시점 고객수와의 관계로부터 고객수 분포를 유도한다.

Wasserstein 거리를 이용한 연속형 변수 이산화 기법 (Discretization Method for Continuous Data using Wasserstein Distance)

  • 하상원;김한준
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.159-169
    • /
    • 2018
  • 연속형 변수의 이산화(Discretization)는 양적 변수(Quantitative variable)를 질적 변수(Qualitative variable)로 변형시켜 데이터 마이닝(Data mining) 기법 등 다양한 알고리즘의 성능을 향상시키는데 사용 목적이 있다. 데이터에 적절한 이산화 기법을 사용한다면 분류 알고리즘에 대해 더 좋은 성능뿐 아니라 간결한 결과 해석, 속도 향상까지 기대할 수 있다. 현재까지 다양한 이산화 기법들이 연구되었으며, 현재도 이산화와 관련한 연구에 수요가 많다. 본 논문은 데이터의 클래스에 대한 연속형 변수 값의 분포를 고려하여, Wasserstein 거리를 이용해 분할점을 자동 설정하는 이산화 기법을 제안한다. 본 논문에서 제안하는 기법과 우수함이 입증된 기존의 이산화 기법에 대해 성능비교를 통해 제안 기법의 우수성을 보인다.

차등흡수분광기술을 이용한 지상기반 Pandora 관측으로부터의 대기 중 이산화질소 칼럼농도 산출 (Retrieval of Nitrogen Dioxide Column Density from Ground-based Pandora Measurement using the Differential Optical Absorption Spectroscopy Method)

  • 양지원;홍현기;최원이;박준성;김대원;강형우;이한림;김준
    • 대한원격탐사학회지
    • /
    • 제33권6_1호
    • /
    • pp.981-992
    • /
    • 2017
  • 본 연구에서는 처음으로 차등흡수분광기술(Differential Optical Absorption Spectroscopy, DOAS) 중 광학 두께 피팅(optical density fitting) 방법을 이용하여 지상기반 원격 측정 장비인 Pandora의 복사휘도 자료로부터 2014년 5월부터 12월 사이 서울에서의 대류권 이산화질소 연직칼럼농도를 산출하였다. 본 연구에서는 Pandora로부터 산출된 대류권 이산화질소 연직칼럼농도와 Aura 위성의 OMI (Ozone Monitoring Instrument) 센서로부터 산출된 대류권 이산화질소 연직칼럼농도를 비교하였다. Pandora로 부터 산출된 대류권 이산화질소 연직칼럼농도와 OMI 센서로부터 산출된 대류권 이산화질소 연직칼럼농도 사이의 상관계수(Correlation coefficient, R)는 0.55로 나타났다. 현장 측정 장비로부터 측정된 지표 이산화질소 혼합비와의 비교를 위해 AIRS (Atmospheric Infrared Sounder) 관측 자료를 이용하여 Pandora와 OMI센서로부터 산출된 대류권 이산화질소 연직칼럼농도를 행성경계층 내 이산화질소 혼합비로 변환하였다. 현장 측정 자료의 지표 이산화질소 혼합비는 5.5 ppbv에서 61.5 ppbv의 범위로 분포하였으며 Pandora와 OMI 센서로부터 산출된 행성경계층 내 이산화질소 혼합비는 각각 2.1 ppbv에서 44.2 ppbv, 0.9 ppbv에서 11.6 ppbv의 범위로 분포하였다. Pandora로부터 산출된 행성경계층 내 이산화질소 혼합비는 현장 측정 장비로부터 측정된 지표 이산화질소 혼합비와 비교적 비슷한 범위로 분포하였으나, OMI센서로부터 측정된 지표 이산화질소 혼합비는 현장 측정 장비와 Pandora의 이산화질소 혼합비에 비해 좁은 범위로 분포하였다. 현장 측정 장비로부터 측정된 지표 이산화질소의 혼합비와 Pandora로부터 산출된 행성경계층 내 이산화질소 혼합비 사이의 상관관계(R = 0.50)는 현장 측정 장비로부터 측정된 지표 이산화질소의 혼합비와 OMI로부터 산출된 행성경계층 내 이산화질소 혼합비 사이의 상관관계(R = 0.36)보다 좋은 것으로 나타났다. 이는 위성 기반 원격 측정 장비인 OMI센서는 지상 기반 원격 측정 장비인 Pandora 장비와 현장 측정 장비에 비하여 높은 고도에서 측정함으로써 지표 부근에 이산화질소에 대한 민감도가 떨어지기 때문인 것으로 생각된다.