• 제목/요약/키워드: Hidden Markov model

검색결과 639건 처리시간 0.029초

HMM을 이용한 HDFS 동적 데이터 복제 알고리즘 (A Dynamic Data Replication Algorithm Using Hidden Markov Model for HDFS)

  • 박나영;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.327-328
    • /
    • 2014
  • 클라우드 컴퓨팅 환경에서는 시스템의 성능 및 비용적인 측면에서 정보 공유의 용이성, 장소의 제약성 최소화, 저장 공간의 효율적 사용을 위해 분산 파일시스템을 이용하고 있다. 하지만 현재 HDFS의 복제 정책은 모든 데이터에 3개의 복제복을 유지하도록 하고 있다. 하지만 이러한 정책은 데이터의 중요도, 이용빈도수를 반영하지 못한 정책으로 상이한 서비스 품질 및 신뢰성 수준을 반영하지 못한다. 본 논문에서는 Hidden Markov Model을 이용하여 데이터의 이용 빈도수에 따라 복사본의 개수를 조절하는 알고리즘을 제안한다.

  • PDF

은닉 마르코프 모델 기반의 교통량 예측 기법 연구 (A Study of Traffic Prediction Method Based on Hidden Markov Model)

  • 김민재;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.347-348
    • /
    • 2014
  • 최근 급증하는 교통 혼잡으로 인해 시간적/물질적 손실이 크게 발생하고 있다. 이러한 교통난 해소는 시설투자만으로는 근본적인 해결책이 될 수 없다는 판단 하에 지난 수년간 보다 정확한 교통량을 예측하기 위해 시계열 기반의 다양한 교통량 예측 모델들이 개발 되어 왔다. 그러나 시계열 기반의 모델들은 회귀분석을 통해 과거 교통량을 분석하고 과거의 교통패턴이 미래에도 지속적으로 연장된다는 가정 하에 연구되었기 때문에 실시간으로 급변하는 불규칙한 교통 패턴에 대한 예측의 신뢰성을 떨어트린다. 또한 시계열 기반의 예측 기법은 어떠한 회귀분석 모델을 사용하는지에 따라 성능의 차이가 많이 나타나기 때문에 회귀분석 모델 선택이 중요하다. 이러한 제약을 극복하기 위해 본 논문에서는 은닉 마르코프 모델(Hidden Markov model)을 이용해 동적인 교통 패턴에 따라 현재 상황에 맞는 회귀분석 모델을 선택하는 신뢰도 높은 교통량 예측 시스템을 제안한다.

  • PDF

MIN 모듈을 갖는 준연속 Hidden Markov Model (Semi-Continuous Hidden Markov Model with the MIN Module)

  • 김대극;이정주;정호균;이상희
    • 음성과학
    • /
    • 제7권4호
    • /
    • pp.11-26
    • /
    • 2000
  • In this paper, we propose the HMM with the MIN module. Because initial and re-estimated variance vectors are important elements for performance in HMM recognition systems, we propose a method which compensates for the mismatched statistical feature of training and test data. The MIN module function is a differentiable function similar to the sigmoid function. Unlike a continuous density function, it does not include variance vectors of the data set. The proposed hybrid HMM/MIN module is a unified network in which the observation probability in the HMM is replaced by the MIN module neural network. The parameters in the unified network are re-estimated by the gradient descent method for the Maximum Likelihood (ML) criterion. In estimating parameters, the variance vector is not estimated because there is no variance element in the MIN module function. The experiment was performed to compare the performance of the proposed HMM and the conventional HMM. The experiment measured an isolated number for speaker independent recognition.

  • PDF

은닉 마르코프 모델과 계층 정보를 이용한 개체명 경계 인식 (Named Entity Boundary Recognition Using Hidden Markov Model and Hierarchical Information)

  • 임희석
    • 한국산학기술학회논문지
    • /
    • 제7권2호
    • /
    • pp.182-187
    • /
    • 2006
  • 본 논문은 통계 기반 접근 방식인 HMM(Hidden Markov model)과 생물학의 개체명에 관한 온톨로지 정보를 이용한 생물학 문서에서의 개체명(named entity) 경계 인식 방법을 제안한다. 제안하는 방법은 31개의 자질 정보를 이용한 평탄화 기법을 사용하며 생물학 개체명의 계층 정보를 이용하여 HMM의 자료 부족 문제를 완화시킬 수 있도록 하였다. 개체명 경계 인식의 학습과 실험을 위하여 GENIA 코퍼스 ver 2.1을 사용하였으며 개체명 경계 인식 실험을 수행한 결과 모든 부류를 사용한 경우보다 정확도 및 실행 속도가 개선됨을 확인하였다.

  • PDF

Online Selective-Sample Learning of Hidden Markov Models for Sequence Classification

  • Kim, Minyoung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제15권3호
    • /
    • pp.145-152
    • /
    • 2015
  • We consider an online selective-sample learning problem for sequence classification, where the goal is to learn a predictive model using a stream of data samples whose class labels can be selectively queried by the algorithm. Given that there is a limit to the total number of queries permitted, the key issue is choosing the most informative and salient samples for their class labels to be queried. Recently, several aggressive selective-sample algorithms have been proposed under a linear model for static (non-sequential) binary classification. We extend the idea to hidden Markov models for multi-class sequence classification by introducing reasonable measures for the novelty and prediction confidence of the incoming sample with respect to the current model, on which the query decision is based. For several sequence classification datasets/tasks in online learning setups, we demonstrate the effectiveness of the proposed approach.

은닉 마코프 모형을 이용한 시공간적 수질 변동성 분석 (Analysis of spatio-temporal variation on water quality using hidden Markov model)

  • 정민규;조혜미;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.111-111
    • /
    • 2020
  • 하천환경과 기후의 변화로 인해 수질오염 과정의 메커니즘이 더욱 복잡해짐에 따라 다양한 요인을 고려한 불확실성 평가 연구가 요구되고 있다. 하천 수질 중에서도 부영양화 문제는 특히 개발로 인한 하천환경 변화 이후 사회 정치적 논점이 되어왔다. 본 연구에서는 지난 7년 동안의 수질 변화의 전반적인 양상을 조사하였으며, 클로로필-a(Chl-a, chlorophyll-a) 농도의 시공간적 의존성의 효과적으로 고려하기 위해 기계학습 기반 분류(classification) 접근법인 다변량 은닉 마코프 모형(MHMM, multivariate hidden Markov model)을 사용하였다. 월 단위 수질 및 수문 자료를 사용하여 Chl-a의 변동성을 군집화하여 수질 상태의 익월 천이확률을 효과적으로 추정하였다. Chl-a와 수질 및 수문기상 조건의 관계를 평가하였으며, 결과적으로 수질 상태의 시공간적 전이가 정확하게 식별되었고 이의 잠재적 원인에 대하여 논의하였다.

  • PDF

Selection of features and hidden Markov model parameters for English word recognition from Leap Motion air-writing trajectories

  • Deval Verma;Himanshu Agarwal;Amrish Kumar Aggarwal
    • ETRI Journal
    • /
    • 제46권2호
    • /
    • pp.250-262
    • /
    • 2024
  • Air-writing recognition is relevant in areas such as natural human-computer interaction, augmented reality, and virtual reality. A trajectory is the most natural way to represent air writing. We analyze the recognition accuracy of words written in air considering five features, namely, writing direction, curvature, trajectory, orthocenter, and ellipsoid, as well as different parameters of a hidden Markov model classifier. Experiments were performed on two representative datasets, whose sample trajectories were collected using a Leap Motion Controller from a fingertip performing air writing. Dataset D1 contains 840 English words from 21 classes, and dataset D2 contains 1600 English words from 40 classes. A genetic algorithm was combined with a hidden Markov model classifier to obtain the best subset of features. Combination ftrajectory, orthocenter, writing direction, curvatureg provided the best feature set, achieving recognition accuracies on datasets D1 and D2 of 98.81% and 83.58%, respectively.

Chow-Liu Tree 모형과 동질성 Hidden Markov Model을 연계한 다지점 일강수량 모의기법 개발 (Development of Multi-Site Daily Rainfall Simulation Based on Homogeneous Hidden Markov Chain Model Coupled with Chow-Liu Tree Structures)

  • 권현한;김태정;김운기;이동률
    • 한국수자원학회논문집
    • /
    • 제46권10호
    • /
    • pp.1029-1040
    • /
    • 2013
  • 본 연구에서는 유역의 공간상관성을 고려한 다지점 일단위 강수량을 동시에 모의할 수 있는 일강수량 모의기법을 개발하였다. 기존 Hidden Markov Chain Model(HMM)은 단일지점 강수모의에 적용되어 왔으나 관측지점간의 유역상관성을 충분히 고려하지 못하는 문제점을 가지고 있다. 따라서 본 연구에서는 Chow-Liu Tree (CLT) 모형을 적용하여 다변량(multivariate) 형태로써 유역내에 위치한 강우관측소간의 상호종속성을 고려하기 위하여 기존의 동질성 HMM 강우모의기법과 CLT 알고리즘을 결합한 동질성 CLT-HMM 모형을 개발하였다. 본 연구에서 개발된 동질성 CLT-HMM 모형을 사용하여장기간의수문자료를보유하고있는기상청산하의한강유역강수네트워크에대해서 적합성을 검토하였다. 동질성 CLT-HMM 모형을 적용하여 모의된 결과를 보면 일강수량의 계절적 특성뿐만 아니라 일강수량모의 시 강수시계열의 통계적인 특성들까지 우수하게 모의하였다. 추가적으로 상관행렬(correlation matrix)을 이용하여 기상관측소간의 공간상관 재현성을 검토한 결과 관측지점들 사이의 공간상관성도 비교적 우수하게 재현하는 것을 확인할 수 있었다.

SPHINX : Hidden Markov Model 기반 음성인식 시스템

  • 김명원;이영직;전인흥
    • 전자통신동향분석
    • /
    • 제5권2호
    • /
    • pp.63-77
    • /
    • 1990
  • HMM(Hidden Markov Model)은 음성을 기술하는데 적합한 model이다. 본 고는 최근 CMU에서 개발한 HMM에 기반을 둔 화자독립, 연속음성 system인 SPIHNX에 대하여 기술한다. SPHINX는 단순한 음소의 HMM model을 적용한 baseline SPHINX로부터 시작하여 새로운 지식의 추가 및 음성단위의 조정 등을 통하여 지속적으로 그 성능이 개선되어 왔다. SPHINX의 최종 version은 어휘 약 1000단어 정도의 재원 관리에 관한 질문 형태의 문장을 인식하는데 96%의 높은 인식율을 보인다. SPHINX는 가장 발전된 음성인식 시스템의 하나이며 이는 화자독립, 대용량어휘의 연속음성 인식 시스템의 실현 가능성을 제시한다.

Assessing Misdiagnosis of Relapse in Patients with Gastric Cancer in Iran Cancer Institute Based on a Hidden Markov Multi-state Model

  • Zare, Ali;Mahmoodi, Mahmood;Mohammad, Kazem;Zeraati, Hojjat;Hosseini, Mostafa;Naieni, Kourosh Holakouie
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권9호
    • /
    • pp.4109-4115
    • /
    • 2014
  • Background: Accurate assessment of disease progression requires proper understanding of natural disease process which is often hidden and unobservable. For this purpose, disease status should be clearly detected. But in most diseases it is not possible to detect such status. This study, therefore, aims to present a model which both investigates the unobservable disease process and considers the error probability in diagnosis of disease states. Materials and Methods: Data from 330 patients with gastric cancer undergoing surgery at the Iran Cancer Institute from 1995 to 1999 were analyzed. Moreover, to estimate and assess the effect of demographic, diagnostic and clinical factors as well as medical and post-surgical variables on transition rates and the probability of misdiagnosis of relapse, a hidden Markov multi-state model was employed. Results: Classification errors of patients in alive state without a relapse ($e_{21}$) and with a relapse ($e_{12}$) were 0.22 (95% CI: 0.04-0.63) and 0.02 (95% CI: 0.00-0.09), respectively. Only variables of age and number of renewed treatments affected misdiagnosis of relapse. In addition, patient age and distant metastasis were among factors affecting the occurrence of relapse (state1${\rightarrow}$state2) while the number of renewed treatments and the type and extent of surgery had a significant effect on death hazard without relapse (state2${\rightarrow}$state3)and death hazard with relapse (state2${\rightarrow}$state3). Conclusions: A hidden Markov multi-state model provides the possibility of estimating classification error between different states of disease. Moreover, based on this model, factors affecting the probability of this error can be identified and researchers can be helped with understanding the mechanisms of classification error.