• Title/Summary/Keyword: Mixture of Gaussian

검색결과 509건 처리시간 0.023초

일상생활 계획을 위한 스마트폰-사용자 상호작용 기반 지속 발전 가능한 사용자 맞춤 위치-시간-행동 추론 방법 (Smartphone-User Interactive based Self Developing Place-Time-Activity Coupled Prediction Method for Daily Routine Planning System)

  • 이범진;김지섭;류제환;허민오;김주석;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.154-159
    • /
    • 2015
  • 과거 어플리케이션 다양성만 지향하던 사용자의 수요가 최근 스마트폰의 고도화된 센서와 기계학습이 결합된 지능형 어플리케이션으로의 선호로 전향되고 있다. 이러한 경향을 반영하여 본 논문에서는 스마트폰에 축적된 사용자의 라이프로깅 데이터에서 의미있는 정보를 추출하고, 추출한 정보를 통해 사용자의 인지적 행동을 대신 가능한 인지 에이전트(Cognitive Agent)개념의 스마트폰-사용자 상호작용 사용자 맞춤 위치-시간-행동 추론 기법을 제안한다. 제안 방법은 사용자의 라이프로깅데이터를 DPGMM (Dirichlet Process Gaussian Mixture Model) 클러스터링 기법으로 사용자 주요 관심지역 POI(Point of Interest)를 자동으로 추출하고, 평생학습이 가능한 강화학습의 한 종류인 POMDP(Partially Observable Markov Decision Process)를 사용하여 사용자의 위치-시간-행동을 추론 한다. 제안 방법으로 구현한 사용자 맞춤 일과 계획 시스템의 시간별 사용자 일과 추론 결과는 70%이상의 성능을 보였으며, 하루 일과 계획 지능형 서비스의 새로운 방향을 제시하고 있다.

관성센서를 이용한 버그균형검사 점수 분류 연구 (Berg Balance Scale Score Classification Study Using Inertial Sensor)

  • 홍상표;김연욱;조우형;좌경림;정한영;김규성;이상민
    • 재활복지공학회논문지
    • /
    • 제11권1호
    • /
    • pp.53-62
    • /
    • 2017
  • 본 논문에서는 균형평가도구 중 임상에서 가장 많이 사용되는 BBS(Berg Balance Scale)를 머신러닝 기법을 이용하여 점수 분류 정확도를 제시한다. 데이터취득은 Noraxon 시스템을 이용하여, 신체 8군데(왼쪽 오른쪽 발목, 왼쪽 오른쪽 엉덩이 위, 왼쪽 오른쪽 손목, 등(Back), 이마)에 관성센서를 부착하였다. 관성센서의 3축 가속도데이터를 기반으로 특징벡터 STFT(Short Time Fourier Transform), SAM(Signal Area Magnitude)를 추출하였다. 그 다음, BBS의 항목을 동작특성에 따라 정적인 동작(static movement)과 동적인 동작(dynamic movement)으로 나누었고, BBS의 각 항목에 대하여 점수에 영향이 있는 센서부착위치에 따라 특징벡터를 선별하였다. BBS의 항목마다 선별된 특징벡터는 GMM(Gaussian Mixture Model)을 이용하여 분류하였다. 실험대상자 40명에 대한 정확도 산출결과, 1번순으로 차례대로 55.5%, 72.2%, 87.5%, 50%, 35.1%, 62.5%, 43.3%, 58.6%, 60.7%, 33.3%, 44.8%, 89.2%, 51.8%, 85.1%의 분류 정확도를 확인하였다.

Deep neural network-hidden Markov model 하이브리드 구조의 모델을 사용한 사용자 정의 기동어 인식 시스템에 관한 연구 (A study on user defined spoken wake-up word recognition system using deep neural network-hidden Markov model hybrid model)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.131-136
    • /
    • 2020
  • 음성 인식기를 대기모드에서 동작 모드로 전환하기 위해 발화하는 짧은 단어를 기동어(Wake Up Word, WUW)라고 하며, 음성 인식기를 실제로 사용하는 사용자가 지정한 기동어를 사용자 정의 기동어라고 한다. 본 논문에서는 이러한 사용자 정의 기동어를 인식하기 위해 기존의 Gaussian Mixture Model-Hidden Markov Model(GMM-HMM) 기반의 시스템, Linear Discriminant Analysis(LDA)를 적용한 LDA-GMM-HMM 기반의 시스템과, LDA-GMM-HMM 모델에서 GMM을 Deep Neural Network(DNN)로 대체한 LDA-DNN-HMM 기반의 시스템을 제작하고 각 시스템의 사용자 정의 기동어 인식 성능 및 비기동어 거절 성능을 비교한다. 또한 기동어 인식기의 체감 성능을 향상시키고자 각 모델에 threshold를 적용하여 기동어 인식 실패율을 약 10 % 수준으로 감소 시킨 후에 비기동어(non-WUW)의 거절 실패율을 비교 평가한다. Threshold 적용시에 LDA-DNN-HMM 기반의 시스템의 경우 기동어 인식 실패율 9.84 % 수준에서 비기동어 거절 실패율이 0.0058 %의 인식 성능을 나타내어 LDA-GMM-HMM 시스템 보다 약 4.82배 향상된 비기동어 거절 성능을 나타낸다. 이러한 결과는 본 논문에서 제작한 LDA-DNN-HMM 모델이 사용자 정의 기동어 인식 시스템을 구축하는데 효과적임을 입증한다.

RGB 항공 영상을 이용한 하천 합류부 전단층 추출법 (Identification of shear layer at river confluence using (RGB) aerial imagery)

  • 노효섭;박용성
    • 한국수자원학회논문집
    • /
    • 제54권8호
    • /
    • pp.553-566
    • /
    • 2021
  • 하천 합류부는 두 개의 수체가 만나 전단층을 이루고 전단층을 따라 강한 혼합양상을 보이는 특징이 있다. 자연하천에서 합류하는 대비되는 두 하천의 색은 전단층을 따라 구분될 수 있는데, 이는 위성 또는 무인항공체를 이용해 촬영된 항공영상을 통해 쉽게 관측할 수 있다. 본 연구에서는 취득 비용이 저렴한 RGB 항공 영상을 이용해 합류부에서 발생하는 전단층을 추출하고 전단층 주변의 기하학적 특성을 정량적으로 산정하는 방법을 제시한다. 본 방법은 네 단계로 구분된다. 첫 번째로, 합류부 흐름에서 전단층 추출을 위해 가우시안 혼합 모형을 바탕으로 한 영상 분할을 수행하여 본류와 지류가 포함된 픽셀을 추출해낸다. 다음으로 추출된 하천 수역에 자기조직화지도를 적용해 하천의유선을 1차원 곡선으로 단순화한다. 추출된 수체 영역과 1차원 곡선들을 이용해 본류와 지류의 수역을 이미지상 직교좌표계에서 곡선좌표계로 투영한 뒤, 마지막으로 전단층의 기하학적 특성을 산정한다. 결과적으로 개발된 전단층 추출법을 경상남도의 낙동강과 남강의 합류부가 촬영된 위성 영상에 적용하여 자연하천 합류부의 기하학적 특성인 합류각, 합류하는 두 하천의 상하류 하천 폭, 전단층의 길이, 그리고 전단층의 최대 두께를 각각 정량적으로 추출하는 데에 성공하였다.

Mean Shift 분석을 이용한 그래프 컷 기반의 자동 칼라 영상 분할 (Graph Cut-based Automatic Color Image Segmentation using Mean Shift Analysis)

  • 박안진;김정환;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권11호
    • /
    • pp.936-946
    • /
    • 2009
  • 그래프 컷(graph cuts) 방법은 주어진 사전정보와 각 픽셀간의 유사도를 나타내는 데이터 항(data term)과 이웃하는 픽셀간의 유사도를 나타내는 스무드 항(smoothness term)으로 구성된 에너지 함수를 전역적으로 최소화하는 방법으로, 최근 영상 분할에 많이 이용되고 있다. 기존 그래프 컷 기반의 영상 분할 방법에서 데이터 항을 설정하기 위해 GMM(Gaussian mixture model)을 주로 이용하였으며, 평균과 공분산을 각 클래스를 위한 사전정보로 이용하였다. 이 때문에 클래스의 모양이 초구(hyper-sphere) 또는 초타원(hyper-ellipsoid)일 때만 좋은 성능을 보이는 단점이 있다. 다양한 클래스의 모양에서 좋은 성능을 보이기 위해, 본 논문에서는 mean shift 분석 방법을 이용한 그래프 컷 기반의 자동 영상분할 방법을 제안한다. 데이터 항을 설정하기 위해 $L^*u^*{\upsilon}^*$ 색상공간에서 임의로 선택된 초기 mean으로부터 밀도가 높은 지역인 모드(mode)로 이동하는 mean의 집합들을 사전정보로 이용한다. Mean shift 분석 방법은 군집화에서 좋은 성능을 보이지만, 오랜 수행시간이 소요되는 단점이 있다. 이를 해결하기 위해 특징공간을 3차원 격자로 변형하였으며, mean의 이동은 격자에서 모든 픽셀이 아닌 3차원 윈도우내의 1차원 모멘트(moment)를 이용한다. 실험에서 GMM을 이용한 그래프 컷 기반의 영상분할 방법과 최근 많이 이용되고 있는 mean shift와 normalized cut기반의 영상분할 방법을 제안된 방법과 비교하였으며, Berkeley dataset을 기반으로 앞의 세 가지 방법보다 좋은 성능을 보였다.

GMM 기반 실시간 문맥독립화자식별시스템의 성능향상을 위한 프레임선택 및 가중치를 이용한 Hybrid 방법 (Hybrid Method using Frame Selection and Weighting Model Rank to improve Performance of Real-time Text-Independent Speaker Recognition System based on GMM)

  • 김민정;석수영;김광수;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제5권5호
    • /
    • pp.512-522
    • /
    • 2002
  • 본 논문에서는 GMM(Gaussian Mixture Model)에 기반한 실시간문맥독립화자식별시스템[1][2]의 성능향상을 위하여 프레임선택(Frame Selection)방법과 프레임가중치(Weighting Model Rank)방법을 혼합한 hybrid방법을 제안한다. 본 시스템에서는 GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법과 인식 알고리즘으로 ML(Maximum Likelihood)을 기본적으로 사용하였다. 제안한 hybrid 방법은 두 단계로 이루어진다. 첫째, 화자모델과 테스트 데이터를 이용하여 프레임단위로 유사도를 계산하고, 가장 큰 유사도 값과 두 번째로 큰 유사도 값의 차를 계산한 후, 차가 문턱치보다 큰 프레임만을 선택한다 두 번째로, 선택되어진 프레임에서 계산되어진 유사도 값 대신에 가중치 값을 사용하여 전체 스코어를 계산한다. 특징 파라미터로서는 켑스트럼과 회귀계수를 사용하였으며, 학습과 테스트를 위한 데이터베이스는 채집기간이 다른 여러 데이터베이스들로 구성되어 있으며, 실험을 위한 데이터는 임의의 단어를 선택하여 사용하였다. 화자인식실험은 기본 시스템에 프레임선택방법, 프레임가중치방법, 제안한 Hybrid방법을 각각 적용하여 실험하였다. 실험결과, 프레임선택방법에 비해 평균 4%, 프레임가중치방법에 비해 평균 1%의 인식률 향상을 보여, 본 논문에서 적용한 hybrid방법의 유효성을 확인하였다.

  • PDF

얼굴인증 방법들의 조명변화에 대한 견인성 비교 연구 (Study On The Robustness Of Face Authentication Methods Under illumination Changes)

  • 고대영;김진영;나승유
    • 정보처리학회논문지B
    • /
    • 제12B권1호
    • /
    • pp.9-16
    • /
    • 2005
  • 본 논문은 얼굴인증 시스템 구현과 조명변화에 견인한 얼굴인증 방법들에 관한 연구에 초점을 둔다. 얼굴인증 시스템 구현을 위한 방법으로 PCA(Principal Component Analysis), GMM(Gaussian Mixture Models), 1차원 HMM(1 Dimensional Hidden Markov Models), 준 2차원 HMM(Pseudo 2 Dimensional Hidden Markov Models) 방법을 이용한다. 네 가지 다른 얼굴인증 방법들의 조명변화에 대한 성능비교 실험을 수행한다. 조명변화실험을 위해 얼굴이미지의 왼쪽에서 오른쪽으로 인공적인 조명효과(${\delta}=0,40,60,80$)를 준다. 얼굴특징벡터는 얼굴이미지에서 분할한 각 블록에 대한 2D DCT(2 Dimensional Discrete Cosine Transform) 계수를 이용하고 실험은 ORL(Olivetti Research Laboratory) 얼굴데이터베이스를 사용한다. 실험결과 모든 경우 조명변화 값이 커질수록 성능저하가 발생한다. 또한 조명변화가 없는 경우(${\delta}=0$) 준 2차원 HMM이 $2.54{\%}$, 1차원 HMM이 $3.18{\%}$, PCA가 $11.7{\%}$, GMM이 $13.38{\%}$의 EER(Equal Error Rate) 성능을 나타낸다. 조명변화가 없는 경우(${\delta}=0$) 1차원 HMM 방법이 PCA 방법보다 좋은 성능을 나타내지만 조명변화 ${\delta}{\geq}40$인 때에는 반대로 PCA 방법이 더 좋은 성능을 나타낸다. 마지막으로 준 2차원 HMM의 경우 조명변화에 관계없이 가장 좋은 EER성능을 나타낸다.

하나의 비디오 입력을 위한 모습 기반법과 모델 사용법을 혼용한 사람 동작 추적법 (Human Motion Tracking by Combining View-based and Model-based Methods for Monocular Video Sequences)

  • 박지헌;박상호
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.657-664
    • /
    • 2003
  • 사람의 동작을 믿을 수 있게 따라가는 것은 감시용 비디오나 사람과 컴퓨터간의 사용자 인터페이스 개발에 있어서 필수적이다. 이 논문은 모습 기반법(appearance-based method)과 모델 사용법을 혼용하여 사람을 추적하는 새로운 방법에 관한 논문이다. 하나의 비디오 입력이 화소 단위 및 물체 단위로 처리된다. 화소 단위의 처리에 있어서 개별 화소색을 분류하는 훈련방법으로, 가우스 혼합 모델(Gaussian mixture model)을 사용하였다. 물체 단위의 처리에 있어서 사람 몸에 대한 삼차원 모델링을 하고, 모델 몸체를 투사면(projection plane)에 투사시켰다. 투사된 몸체와 배경을 제외한 영상과 계산 기하 방법을 사용하여, 화소보다 작은 단위로 겹쳐지는 면적을 계산하였다. 우리의 방법은 정방향 기구학 (forward kinematics)을 사용하므로 역방향 기구학(inverse kinematics)을 사용하는 방법과 달리 계산 결함(singularity)을 갖지 않는다. 이 논문에서는 사람의 동작을 추적하기 위한 문제를 비선형 방정식 문제로 바꾸었다. 비선형 방정식의 비용 함수는 전경(foreground)의 영상 실루엣(silhouette)과 투사된 삼차원 모델 몸체의 실루엣의 겹쳐지는 면적이다. 화소 단위의 영상을 화소를 하나의 면적으로 계산함으로써, 겹쳐지는 면적에 대한 실수 단위의 계산은 계산 기하를 사용하였다. 이 논문의 방법은 다양한 사람 동작을 인식하기 위하여 사용되었다. 비디오에 나타나는 사람 동작 추적은 매우 우수하다.

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

웨이블릿 영역에서 훈련 없는 은닉 마코프 트리 모델을 이용한 영상 보간 (Image Interpolation Using Hidden Markov Tree Model Without Training in Wavelet Domain)

  • 우동헌;엄일규;김유신
    • 대한전자공학회논문지SP
    • /
    • 제41권4호
    • /
    • pp.31-37
    • /
    • 2004
  • 웨이블릿 변환은 영상을 분석하고 처리하는데 유용한 도구로써 영상 압축, 영상 잡음 제거 등의 분야에서 우수한 성능을 보여주었다. 웨이블릿 계수들은 은닉 마코프 트리(Hidden Markov Tree: HMT) 모델에 의해 효과적으로 모델링 될 수 있다. 그러나 영상 보간에서 은닉 마코프 트리 모델을 적용하기 위해서는 훈련 과정이 필요하며 훈련 과정에서 획득된 파라미터들이 입력 영상과 잘 맞지 않는 단점이 있다. 본 논문에서는 웨이블릿 영역에서 영상 보간을 위해 은닉 마코프 트리의 구조를 사용하되, 그 파라미터들은 훈련 과정 없이 부대역간의 통계적 특성을 이용하여 직접 추정한다. 제안 방법에서 웨이블릿 계수는 가우스 혼합 모델(Gauss Mixture Model: GMM)로 모델링 된다. 가우스 혼합 모델의 상태 천이 확률은 부대역간의 웨이블릿 계수의 통계적 천이 특성을 이용하여 결정하며, 각 상태의 분산은 웨이블릿 계수의 지수적 감소(exponential decay) 특성에 의해, 추정된다. 모의실험에서 제안 방법은 전통적인 bicubic 방법이나 훈련 과정을 필요로 하는 은닉 마코프 모델을 사용한 방법보다 여러 테스트 영상들에 대해서 개선된 성능을 보여주었다.