• 제목/요약/키워드: Gaussian Mixture Models (GMM)

검색결과 41건 처리시간 0.025초

알츠하이머 병의 검출을 위한 ML-SVM, PCA, VBM, GMM을 결합한 융합적 성능 비교 (Convergence performance comparison using combination of ML-SVM, PCA, VBM and GMM for detection of AD)

  • 사우라르 알람;권구락
    • 한국융합학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-7
    • /
    • 2016
  • 구조적 MRI 영상은 여러 단 변량과 다변량 방법을 위해 그레이 메터 (GM), 화이트 메터 (WM), 뇌척수액 (CSF) 세션화 과정을 하고 난후 형태계측학적 특징을 추출하기 위해 사용한다. 새로운 접근 방법은 매우 가벼운 알츠하이머 병에서 가벼운 알츠하이머병의 진단을 위해 적용된다. 간이정신상태검사에 따른 형태계측학적 특징과 가우시안 복합 모델 파라미터를 결합하여 정상인으로부터 알츠하이머 병 환자로 분류하는 방법을 제안한다. 결합한 특징은 주성분 분석 기법을 이용한 고차원의 저주를 제거한 후 다중 커널 SVM 분류기에 공급한다. 제안한 진단 방법의 실험적 결과는 90%이상의 특성도와 고민감도에 따라 다중 커널 SVM을 가진 층화 정확도가 96%까지 최대 산출한다.

화자식별 시스템의 계산량 감소를 위한 화자 프루닝 방법 (A Speaker Pruning Method for Reducing Calculation Costs of Speaker Identification System)

  • 김민정;오세진;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.457-462
    • /
    • 2003
  • 본 논문에서는 GMM (Gaussian Mixture Model)에 기반한 문맥독립 화자식별 시스템의 식별성능 향상과 실시간 처리를 위한 계산량 감소를 위하여 화자 프루닝 (Speaker Pruning) 방법을 제안한다. 기존의 화자식별 방법인 최대유사도(Maximum Likelihood) 방법과 가중모델순위 (Weighting Model Rank) 방법, 수정된 가중모델순위 (Modified WMR) 방법 등은 입력 음성 전체와 모든 화자모델들과의 유사도를 프레임 단위로 계산하여 가장 큰 누적 유사도를 가지는 화자를 식별화자로 결정하는 방법으로써, 입력 프레임 및 등록 화자수가 늘어남에 따라 계산량 및 식별시간이 늘어나는 단점이 있었다. 이러한 단점을 해결하기 위하여, 제안방법은 입력음성 프레임의 일부분만을 이용하여 화자모델들과의 프레임 유사도를 계산한 후 계산된 유사도를 이용하여 등록화자의 상위 일부분의 화자만을 선택하고, 선택된 화자들에서만 유사도 계산을 수행함으로서 계산량 및 식별시간을 줄이는 방법이다. 또한, 화자 프루닝을 적용할 경우 화자수가 가변 되더라도 수정된 가중모델 순위방법을 적용할 수 있어 식별성능을 높일 수 있다. 식별실험결과, 제안방법을 적용한 경우 기존의 최대 유사도 방법이나 가중모델순위 방법보다 최대 65%의 계산량 및 식별시간을 감소시킬 수 있었으며, 약 2%의 향상된 식별결과를 나타내어, 본 논문에서 제안한 방법의 유효성을 확인할 수 있었다.

Machine Learning-Based Transactions Anomaly Prediction for Enhanced IoT Blockchain Network Security and Performance

  • Nor Fadzilah Abdullah;Ammar Riadh Kairaldeen;Asma Abu-Samah;Rosdiadee Nordin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1986-2009
    • /
    • 2024
  • The integration of blockchain technology with the rapid growth of Internet of Things (IoT) devices has enabled secure and decentralised data exchange. However, security vulnerabilities and performance limitations remain significant challenges in IoT blockchain networks. This work proposes a novel approach that combines transaction representation and machine learning techniques to address these challenges. Various clustering techniques, including k-means, DBSCAN, Gaussian Mixture Models (GMM), and Hierarchical clustering, were employed to effectively group unlabelled transaction data based on their intrinsic characteristics. Anomaly transaction prediction models based on classifiers were then developed using the labelled data. Performance metrics such as accuracy, precision, recall, and F1-measure were used to identify the minority class representing specious transactions or security threats. The classifiers were also evaluated on their performance using balanced and unbalanced data. Compared to unbalanced data, balanced data resulted in an overall average improvement of approximately 15.85% in accuracy, 88.76% in precision, 60% in recall, and 74.36% in F1-score. This demonstrates the effectiveness of each classifier as a robust classifier with consistently better predictive performance across various evaluation metrics. Moreover, the k-means and GMM clustering techniques outperformed other techniques in identifying security threats, underscoring the importance of appropriate feature selection and clustering methods. The findings have practical implications for reinforcing security and efficiency in real-world IoT blockchain networks, paving the way for future investigations and advancements.

하나의 IMU를 이용한 앉은 자세 분류 연구 (Research on Classification of Sitting Posture with a IMU)

  • 김연욱;조우형;전유용;이상민
    • 재활복지공학회논문지
    • /
    • 제11권3호
    • /
    • pp.261-270
    • /
    • 2017
  • 바르지 못한 앉은 자세는 다양한 질병과 신체 변형을 유발한다. 하지만 오랜 시간동안 바른 앉은 자세를 유지하는 것은 쉬운 일이 아니다. 이러한 이유 때문에 그동안 자동으로 바른 앉은 자세를 유도하기 위한 다양한 시스템이 제안되어왔다. 이전에 제안되었던 앉은 자세 판별 및 바른 앉은 자세 유도 시스템은 영상 처리를 이용한 방법, 의자에 압력센서를 달아 측정하는 방법, IMU(Internal Measurement Unit)를 이용한 방법이 있었다. 이 중 IMU를 이용한 측정 방법은 하드웨어 구성이 간단하고, 공간, 광량 등의 환경적 제한이 적어 측정에 있어서 용이한 이점이 있었다. 본 논문에서는 하나의 IMU를 이용하여 적은 데이터로 효율적으로 앉은 자세를 분류하는 방법을 연구하였다. 특징추출 기법을 이용하여 데이터 분류에 기여도가 낮은 데이터를 제거하였으며, 머신러닝 기법을 이용하여 앉은 자세 분류에 적합한 센서 위치를 찾고, 여러 개의 머신러닝 모델 중 가장 분류 정확도가 높은 머신러닝 모델을 선정하였다. 특징추출 기법은 PCA(Principal Component Analysis)를 사용하였고, 머신러닝 모델은 SVM(Support Vector Machine), KNN(K Nearest Neighbor), K-means (K-means Algorithm) GMM (Gaussian Mixture Model), and HMM (Hidden Marcov Model)모델을 사용하였다. 연구결과 데이터 분류율이 높게나온 뒷목이 적합한 센서 위치가 되었으며, 센서 데이터 중 Yaw데이터는 분류 기여도가 가장 낮은 데이터임을 PCA 특징추출 기법을 이용하여 확인하고, 제거하여도 분류율에 영향이 매우 작음을 확인하였다. 적합 머신러닝 모델은 SVM, KNN 모델로 다른 모델에 비하여 분류율이 높게 나오는 것을 확인할 수 있었다.

심층신경망 기반의 음성인식을 위한 절충된 특징 정규화 방식 (Compromised feature normalization method for deep neural network based speech recognition)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.65-71
    • /
    • 2020
  • 특징 정규화는 음성 특징 파라미터들의 통계적인 특성의 정규화를 통해 훈련 및 테스트 조건 사이의 환경 불일치의 영향을 감소시키는 방법으로서 기존의 Gaussian mixture model-hidden Markov model(GMM-HMM) 기반의 음성인식 시스템에서 우수한 성능개선을 입증한 바 있다. 하지만 심층신경망(deep neural network, DNN) 기반의 음성인식 시스템에서는 환경 불일치의 영향을 최소화 하는 것이 반드시 최고의 성능 개선으로 연결되지는 않는다. 본 논문에서는 이러한 현상의 원인을 과도한 특징 정규화로 인한 정보손실 때문이라 보고, 음향모델을 훈련 하는데 유용한 정보는 보존하면서 환경 불일치의 영향은 적절히 감소시켜 음성인식 성능을 최대화 하는 특징 정규화 방식이 있는 지 검토해보고자 한다. 이를 위해 평균 정규화(mean normalization, MN)와 평균 및 분산 정규화(mean and variance normalization, MVN)의 절충 방식인 평균 및 지수적 분산 정규화(mean and exponentiated variance normalization, MEVN)를 도입하여, 잡음 및 잔향 환경에서 분산에 대한 정규화의 정도에 따른 DNN 기반의 음성인식 시스템의 성능을 비교한다. 실험 결과, 성능 개선의 폭이 크지는 않으나 분산 정규화의 정도에 따라 MEVN이 MN과 MVN보다 성능이 우수함을 보여준다.

Support Vector Machines에 의한 음소 분할 및 인식 (Phoneme segmentation and Recognition using Support Vector Machines)

  • 이광석;김현덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.981-984
    • /
    • 2010
  • 우리는 본 연구에서 학습방법으로서 연속음성을 초성, 중성, 종성의 음소단위로 분할하기 위하여 인공 신경회로망의 하나인 SVMs을 사용하였으며 분할한 음소단위의 음성으로 연속음성인식에 적용하여 그 성능을 살펴보았다. 음소경계는 단 구간에서의 최대 주파수를 가진 알고리듬에 의하여 결정되며 또한 음성인식처리는 CHMM에 의하여 이루어지며 목측에 의한 분할결과와도 비교하여 살펴보았다. 시뮬레이션 결과로부터 초성의 분할성능에서 제안한 SVMs를 적용한 결과가 GMMs보다 효율적인을 알 수 있었다.

  • PDF

CTC를 적용한 CRNN 기반 한국어 음소인식 모델 연구 (CRNN-Based Korean Phoneme Recognition Model with CTC Algorithm)

  • 홍윤석;기경서;권가진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.115-122
    • /
    • 2019
  • 지금까지의 한국어 음소 인식에는 은닉 마르코프-가우시안 믹스쳐 모델(HMM-GMM)이나 인공신경망-HMM을 결합한 하이브리드 시스템이 주로 사용되어 왔다. 하지만 이 방법은 성능 개선 여지가 적으며, 전문가에 의해 제작된 강제정렬(force-alignment) 코퍼스 없이는 학습이 불가능하다는 단점이 있다. 이 모델의 문제로 인해 타 언어를 대상으로 한 음소 인식 연구에서는 이 단점을 보완하기 위해 순환 신경망(RNN) 계열 구조와 Connectionist Temporal Classification(CTC) 알고리즘을 결합한 신경망 기반 음소 인식 모델이 연구된 바 있다. 그러나 RNN 계열 모델을 학습시키기 위해 많은 음성 말뭉치가 필요하고 구조가 복잡해질 경우 학습이 까다로워, 정제된 말뭉치가 부족하고 기반 연구가 비교적 부족한 한국어의 경우 사용에 제약이 있었다. 이에 본 연구는 강제정렬이 불필요한 CTC 알고리즘을 도입하되, RNN에 비해 더 학습 속도가 빠르고 더 적은 말뭉치로도 학습이 가능한 합성곱 신경망(CNN)을 기반으로 한국어 음소 인식 모델을 구축하여 보고자 시도하였다. 총 2가지의 비교 실험을 통해 본 연구에서는 한국어에 존재하는 49가지의 음소를 판별하는 음소 인식기 모델을 제작하였으며, 실험 결과 최종적으로 선정된 음소 인식 모델은 CNN과 3층의 Bidirectional LSTM을 결합한 구조로, 이 모델의 최종 PER(Phoneme Error Rate)은 3.26으로 나타났다. 이는 한국어 음소 인식 분야에서 보고된 기존 선행 연구들의 PER인 10~12와 비교하면 상당한 성능 향상이라고 할 수 있다.

모바일 레이저 스캐닝 데이터로부터 철도 선로 추출에 관한 연구 (Railway Track Extraction from Mobile Laser Scanning Data)

  • 좌윤석;손건호;원종운;이원춘;송낙현
    • 한국측량학회지
    • /
    • 제33권2호
    • /
    • pp.111-122
    • /
    • 2015
  • 본 연구에서는 모바일 레이저 스캐닝 데이터로부터 철도 선로탐지 및 선로모델 추출을 위한 방법을 제시하였다. 제안된 방법은 크게 세 단계로 구성된다. 첫째, 레이저 포인트로부터 잠재적인 철도 선로지역을 탐지하고, 초기 철도 선로궤적 방향을 추정한다. 둘째, 철도 선로에 관한 선 지식을 이용하여 첫번째 스트립에서 초기 선로위치를 결정한다. 여기서, 스트립은 국부 탐색공간을 나타내며 철도 선로궤적에 수직인 방향으로 정의된다. 마지막으로, 초기 선로위치에서 GMM-EM기반 분류방법을 통해 선로 포인트들을 탐지한 후 초기 선로 모델을 생성하고 스트립을 데이터 처리 기본단위로 하여 tracking by detection관점에서 연속적으로 선로모델을 생성하였다. 제안된 방법의 주요 특징은 다음과 같다. 첫째, 이전 스트립에서 생성된 선로 모델을 가이드 라인으로 다음 스트립에 전파되어 국부 탐색영역을 예측하여 선로 포인트를 탐지하는 하는데 있어서 처리 복잡성을 줄일 수 있었다. 둘째, 선로 포인트 탐지와 선로 모델링을 동시에 진행 함으로써 데이터 처리 시간을 최소화 할 수 있었다. 개발된 알고리즘은 C++ 프로그램 언어로 구현되었고 도시지역에서 MMS 측량을 통해 취득된 LiDAR 데이터(경부선 일부 구간)를 이용하여 성능 테스트를 진행하였다.

MCE기반의 다중 특징 파라미터 스코어의 결합을 통한 화자인식 성능 향상 (Performance Improvement of Speaker Recognition by MCE-based Score Combination of Multiple Feature Parameters)

  • 강지훈;김보람;김규영;이상훈
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.679-686
    • /
    • 2020
  • 본 논문에서는 화자인식 성능 향상을 위해 음원에서 개선된 특징추출 방식과 최소 분류 오차 기반의 다중 특징 벡터 스코어에 대한 가중치 추정을 사용하여 스코어 결합을 제안하였다. 제안한 특징 벡터는 Glottal Flow에서 무의미한 정보구간인 평탄한 스펙트럼 구간을 제거하기 위하여 저역통과 필터를 수행한 신호에서 인지적 선형 예측 캡스트럼 계수, 왜도, 첨도를 추출하여 구성하였다. 제안한 특징 벡터는 종래의 음원에서 멜-주파수 캡스트럼 계수, 인지적 선형 예측 캡스트럼 계수를 추출하여 가우시안 혼합 모델로 모델링한 화자인식 시스템을 개선하기 위해 사용된다. 또한, 스코어 추정과정의 신뢰성을 높이기 위하여 기존의 스코어의 확률 분포를 사용하여 가중치를 추정하는 대신 제안한 특징 벡터에서 평가된 점수와 종래의 특징 벡터에서 평가된 점수에 대하여 최소 분류 오차 기법으로 가중치를 추정하여 스코어를 결합함으로써 최적의 화자를 찾는다. 실험 결과 제안한 특징 벡터가 화자를 인식하는데 유효한 정보를 포함하고 있는 것을 확인하였다. 또한, 최소 분류 오차 기반의 다중 특징 파라미터 스코어를 결합하여 화자인식을 수행하였을 때, 종래의 화자인식 성능보다 더 우수한 성능을 나타내는 것을 확인할 수 있으며, 특히 가우시안 혼합 모델이 낮을 때 더 높은 성능향상을 보였다.

서브밴드 가중치를 이용한 잡음에 강인한 화자검증 (Noise Rabust Speaker Verification Using Sub-Band Weighting)

  • 김성탁;지미경;김회린
    • 한국음향학회지
    • /
    • 제28권3호
    • /
    • pp.279-284
    • /
    • 2009
  • 화자검증은 발성화자가 제시화자 (claimed speaker)인지 아닌지를 구별하는 것이다. 기존의 화자검증 시스템인 GMM-UBM 방식의 화자검증 시스템은 무잡음 환경에서는 높은 검증성능을 보이지만, 잡음환경에서는 성능이 급격히 떨어지는 단점이 있다. 이런 단점을 극복하기 위해 멀티밴드를 이용한 방법인 특징벡터 재결합방법이 제안되었지만, 특징벡터 재결합방법은 전체 서브밴드 특징벡터들을 사용하여 유사도를 계산하는 단점이 있다. 이런 단점을 극복하기 위해 기 발표된 이전 논문에서 각 서브밴드 유사도를 독립적으로 계산하는 변형된 특징벡터 재결합방법을 제안하였고, 본 논문에서는 변형된 특징벡터 재결합방법과 각 서브밴드들의 신뢰도를 나타내는 신호 대 잡음비를 이용한 가중치를 이용하여 잡음환경에서 기존의 특징벡터 재결합방법에 비해 에러를 28% 감소시켰다.