• 제목/요약/키워드: HMM(HMM)

검색결과 963건 처리시간 0.026초

A streamlined pipeline based on HmmUFOtu for microbial community profiling using 16S rRNA amplicon sequencing

  • Hyeonwoo Kim;Jiwon Kim;Ji Won Cho;Kwang-Sung Ahn;Dong-Il Park;Sangsoo Kim
    • Genomics & Informatics
    • /
    • 제21권3호
    • /
    • pp.40.1-40.11
    • /
    • 2023
  • Microbial community profiling using 16S rRNA amplicon sequencing allows for taxonomic characterization of diverse microorganisms. While amplicon sequence variant (ASV) methods are increasingly favored for their fine-grained resolution of sequence variants, they often discard substantial portions of sequencing reads during quality control, particularly in datasets with large number samples. We present a streamlined pipeline that integrates FastP for read trimming, HmmUFOtu for operational taxonomic units (OTU) clustering, Vsearch for chimera checking, and Kraken2 for taxonomic assignment. To assess the pipeline's performance, we reprocessed two published stool datasets of normal Korean populations: one with 890 and the other with 1,462 independent samples. In the first dataset, HmmUFOtu retained 93.2% of over 104 million read pairs after quality trimming, discarding chimeric or unclassifiable reads, while DADA2, a commonly used ASV method, retained only 44.6% of the reads. Nonetheless, both methods yielded qualitatively similar β-diversity plots. For the second dataset, HmmUFOtu retained 89.2% of read pairs, while DADA2 retained a mere 18.4% of the reads. HmmUFOtu, being a closed-reference clustering method, facilitates merging separately processed datasets, with shared OTUs between the two datasets exhibiting a correlation coefficient of 0.92 in total abundance (log scale). While the first two dimensions of the β-diversity plot exhibited a cohesive mixture of the two datasets, the third dimension revealed the presence of a batch effect. Our comparative evaluation of ASV and OTU methods within this streamlined pipeline provides valuable insights into their performance when processing large-scale microbial 16S rRNA amplicon sequencing data. The strengths of HmmUFOtu and its potential for dataset merging are highlighted.

UV 차단 금속막을 이용한 잔류층이 없는 UV 나노 임프린트 패턴 형성 (UV-nanoimprint Patterning Without Residual Layers Using UV-blocking Metal Layer)

  • 문강훈;신수범;박인성;이헌;차한선;안진호
    • 마이크로전자및패키징학회지
    • /
    • 제12권4호통권37호
    • /
    • pp.275-280
    • /
    • 2005
  • 나노 임프린트 (NIL)와 포토 리소그라피를 접목시킨 combined nanoimprint and photolithography (CNP) 기술을 이용하여 나노 미세 패턴을 형성하였다. 일반적인 UV-NIL 스탬프의 양각 패턴 위에 Cr 금속막을 입힌 hybrid mask mold (HMM)을 E-beam writing과 plasma etching으로 제작하였다. HMM 전면에는 친수성 물질인 $SiO_2$를 코팅하여 점착방지막 역할의 self-assembled monolayer(SAM) 형성을 용이하게 함으로써 HMM과 transfer layer의 분리를 용이하게 하여 패턴 손상을 억제하였다. 또한, transfer layer에는 일반적인 monomer resin 대신에 건식 에칭에 대한 저항력이 높은 negative PR을 사용하였다. Photo-mask 역할을 하는 HMM의 Cr 금속막이 UV를 차단하여 잔류하게 되는 PR의 비경화층(unexpected residual layer)은 간단한 현상 공정으로 제거하여 PR 잔류층이 없는 나노 미세 패턴을 transfer layer에 형성하였다.

  • PDF

HMM기반 자동음소분할기의 음소분할 오류 유형 분석 (The Error Pattern Analysis of the HMM-Based Automatic Phoneme Segmentation)

  • 김민제;이정철;김종진
    • 한국음향학회지
    • /
    • 제25권5호
    • /
    • pp.213-221
    • /
    • 2006
  • 합성음의 음질을 향상시키기 위하여 분할된 corpora로부터 합성유닛을 선택하여 사용하는 연속음성합성에서 정확한 음소분할은 매우 중요하다. 일반적으로 음소분할은 사람에 의해 수행되지만 많은 작업량으로 인한 시간적 지연, 일관 성 유지 어려움 등 많은 문제가 발생한다. 이에 따라 음성인식에서 도입된 HMM 기반의 자동음소분할이 음성인식, 음성 합성에서 널리 사용되어지고 있지만 음성전문가의 수작업 결과와 비교할 때 HMM 기반 자동음소분할은 오류가 있고, 이는 합성음 품질의 열화의 주요 원인이 되고 있다. 본 논문에서는 HMM 기반의 자동음소분할기를 사용하여 나타난 자동음소분할 결과와 수작업에 의한 음소분할 결과를 비교하고 유형별로 분석함으로써 음성합성의 성능향상을 위해 개선해야 할 문제점들을 제시한다. 실험에서는 ETRI의 표준형 한국어 공통 음성 DB을 사용하였고, 오차의 범위가 20ms를 벗어난 경우를 분절 오류로 간주하였다. 실험 결과 여성화자의 경우 파열음 + 모음, 파찰음 + 모음, 모음 + 유음 음소쌍에서는 각각 약 99%, 99.5%, 99%의 높은 정확률을 보인 반면, 폐쇄음 + 비음, 폐쇄음 + 유음, 비음 + 유음 음소쌍에서는 44.89%, 50%, 55% 의 낮은 정확률을 보였으며, 남성화자에 대한 실험결과에서도 유사한 경향을 보였다.

A Study on the Syllable Recognition Using Neural Network Predictive HMM

  • Kim, Soo-Hoon;Kim, Sang-Berm;Koh, Si-Young;Hur, Kang-In
    • The Journal of the Acoustical Society of Korea
    • /
    • 제17권2E호
    • /
    • pp.26-30
    • /
    • 1998
  • In this paper, we compose neural network predictive HMM(NNPHMM) to provide the dynamic feature of the speech pattern for the HMM. The NNPHMM is the hybrid network of neura network and the HMM. The NNPHMM trained to predict the future vector, varies each time. It is used instead of the mean vector in the HMM. In the experiment, we compared the recognition abilities of the one hundred Korean syllables according to the variation of hidden layer, state number and prediction orders of the NNPHMM. The hidden layer of NNPHMM increased from 10 dimensions to 30 dimensions, the state number increased from 4 to 6 and the prediction orders increased from 10 dimensions to 30 dimension, the state number increased from 4 to 6 and the prediction orders increased from the second oder to the fourth order. The NNPHMM in the experiment is composed of multi-layer perceptron with one hidden layer and CMHMM. As a result of the experiment, the case of prediction order is the second, the average recognition rate increased 3.5% when the state number is changed from 4 to 5. The case of prediction order is the third, the recognition rate increased 4.0%, and the case of prediction order is fourth, the recognition rate increased 3.2%. But the recognition rate decreased when the state number is changed from 5 to 6.

  • PDF

HMM을 이용한 수기숫자 인식에 관한 연구 (A Study on the Hand-written Number Recognition by HMM(Hidden Markov Model))

  • 조민환
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.121-125
    • /
    • 2004
  • 대부분의 수기 숫자 인식 시스템에서는 자모 형태를 이용한 특징 점 추출과, 형태소 적 분석기법을 많이 사용하였다. 본 연구에서는 체인코드를 사용하고, 생성된 체인코드를 미분하여 최소 값이 되는 미분코드를 만들었다. 이 미분코드는 대부분의 수기 숫자에 적용해 본 결과 숫자 변별력이 매우 뛰어남을 알 수 있었다. 처리 순서는 몇 개의 수기숫자를 전 처리하고, 체인코드와 미분코드를 생성 한 후, HMM 인식 네트워크를 사용하여 숫자 인식하였다. 처리 결과 96.1%의 수기숫자를 인식하였으며, 매우 심하게 왜곡된 숫자는 인식하지 못하였다.

  • PDF

HMM인식기 상에서 방향, 속도 및 공간 특징량에 따른 제스처 인식 성능 비교 ((A Comparison of Gesture Recognition Performance Based on Feature Spaces of Angle, Velocity and Location in HMM Model))

  • 윤호섭;양현승
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.430-443
    • /
    • 2003
  • 본 논문은 카메라로부터 획득된 영상 시퀀스로부터 얻어진 제스처 궤적 정보를 바탕으로 가장 기본적인 방향, 속도 및 공간 특징을 추출한 후, 각각의 특징 정보들의 인식 결과를 비교하여 어떠한 정보가 가장 유용한지 평가한다. 이를 위해 제스처 궤적 추적을 위해선 컬러 정보 및 모션 정보를 사용하였고, 인식모델로는 시간 데이타 처리에 적합한 HMM을 구성하였다. 실험을 위한 제스처 DB로는 인식하고자 하는 그래픽, 숫자, 알파벳모양의 48개 제스처에 대해 20명으로부터 5개씩 총 4800개의 데이타를 구축하였다.

이산분포 HMM을 이용한 음성인식에서의 코드워드 Tying 알고리즘 (A Codeword Tying Algorithm in Speech Recognition based on Discrete Hidden Markov Model)

  • 김도영;김남수;은종관
    • 한국음향학회지
    • /
    • 제13권3호
    • /
    • pp.63-70
    • /
    • 1994
  • 본 논문에서는 수형구조 분류기를 이 용한 코드워드 tying 알고리즘을 제안한다. 코드워드와 상태간의 통계적 특성을 이용한 일종의 soft decision 방식이라고도 볼 수 있는 제안된 알고리즘은 빠른 트리 구성과 유일한 최적의 해를 제공하는 특징이 있다. 또한, 이산분포 hidden Markov model(HMM)을 이용한 인식 시스템에 쉽게 적용이 가능하다는 장점을 가진다. 제안된 알고리즘의 성능 평가를 위한 화자독립 격리단어 인식실험에서 코드북 크기가 256과 512일 경우에 대해 각각 $6\%$, $9\%$의 오차를 감소시켰으며, HMM 파라미터도 $20\%$ 정도 줄임을 확인하였다.

  • PDF

대용량 온라인 한자 인식을 위한 클러스터링 거리계산 척도 (Distance Measures in HMM Clustering for Large-scale On-line Chinese Character Recognition)

  • 김광섭;하진영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.683-690
    • /
    • 2009
  • 은닉 마코프 모델(Hidden Markov Model: HMM)에 기반을 둔 온라인 한자 인식에서 클래스의 수가 대용량일 경우에는 인식에 걸리는 시간 증가가 좋은 인식 시스템을 구현하는데 있어서의 걸림돌이 된다. 본 논문에서는 이러한 인식 속도 문제를 해결하고자 HMM을 클러스터링하여 인식 속도를 개선하는 방법과 이에 적합한 효율적인 HMM 간의 거리계산법을 제안한다. 유니코드 한 중 일 통합한자로 정의된 총 20,902개의 한자에 대한 온라인 한자 인식 시스템을 구축하는 실험에서 약 2배 정도로 인식속도가 향상됨을 확인할 수 있었고 클러스터링을 하지 않았을 때보다 0.9%의 인식률만 하락한 95.37%의 10순위 인식률을 달성했다.

이산 지속시간제어 연속분포 HMM을 이용한 연속 음성 인식 (Korean Continuous Speech Recognition Using Discrete Duration Control Continuous HMM)

  • 이종진;김수훈;허강인
    • 한국음향학회지
    • /
    • 제14권1호
    • /
    • pp.81-89
    • /
    • 1995
  • 본 논문에서는 연속분포 HMM에 이산 지속시간제어와 회귀계수를 파라메터로 추가한 이산 지속시간제어 연속분포 HMM 모델을 이용하여 한국어 연속음성 인식 시스템을 구성하였다. 또한 25 문장의 로보트 제어명령문을 유한상태 오토마타에 의해 구문제어를 실시한 One Pass DP법으로 인식 실험을 실시하였다. 4연 숫자음에 대한 인식 실험에서 이산 지속시간 제어와 회귀 계수를 포함한 경우 평균 $93.8\%$의 인식율을, 포함하지 않은 경우 $80.7\%$의 인식율을 얻었다. 로보트 제어 명령문의 인식에서는 구문제어를 실시하지 않은 경우 평균 $90.9\%$, 유한 상태 오토마타에 의한 구문제어를 이용한 경우 평균 $98.4\%$$7.5\%$의 인식율이 향상되었다.

  • PDF

모바일 봇넷 탐지를 위한 HMM과 SVM 기법의 비교 (Comparison of HMM and SVM schemes in detecting mobile Botnet)

  • 최병하;조경산
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.81-90
    • /
    • 2014
  • 스마트폰 같은 모바일 장치의 대중적 보급과 발전으로 인해 PC 기반의 악성코드가 모바일 기반으로 빠르게 이동하고 있다. 특히 봇넷은 PC에서의 강력한 악성행위와 피해를 모바일 장치에서 재생산하며 새로운 기법을 추가하고 있다. 기존 PC 기반의 봇넷과 달리 모바일 봇넷은 동시에 다양한 공격 경로의 탐지가 어려워 네트워크 기반보다는 호스트 기반의 탐지 기법이 주를 이루고 있다. 본 논문에서는 호스트 기반 기법의 한계를 극복하기 위하여 네트워크 기반으로 모바일 봇넷을 탐지하는 HMM과 SVM을 적용한 2 가지 기법을 비교한다. 기계학습에 많이 사용되는 시계열 데이터와 단위시간 데이터를 추출하여 두 기법에 적용하여, 실제 봇넷이 설치된 환경의 트래픽 검증 분석을 통해 이들 데이터에 따른 두 기법의 탐지율과 탐지 특성을 제시한다.