• 제목/요약/키워드: Mixture of Gaussian

검색결과 505건 처리시간 0.028초

IoT 디바이스에서 다차원 디지털 신호 처리를 위한 신경망 최적화 (Neural networks optimization for multi-dimensional digital signal processing in IoT devices)

  • 최권택
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1165-1173
    • /
    • 2017
  • 가장 대표적인 기계학습 알고리즘인 딥러닝 방법은 여러 응용 분야에서 활용성이 입증돼 디지털신호처리에 널리 사용되고 있다. 그러나 많은 학습데이터를 사용해 학습하는 과정에서 많은 메모리와 학습시간이 필요하기 때문에 CPU 성능과 메모리 용량이 제한된 IoT 디바이스에 딥러닝 기술을 적용하기는 어렵다. 특히 메모리 용량이 2K~8K 로 극히 적은 아두이노 기반의 디바이스를 사용한다면 알고리즘 구현에 많은 한계가 발생한다. 본 논문에서는 정확성과 효율성이 입증돼 여러 분야에서 활용되고 있는 ELM 알고리즘을 아두이노에서 최적화하는 방법을 제안하고, 실험을 통해 메모리 용량이 2KB인 아두이노 UNO와 메모리 용량이 8KB인 아두이노 MEGA에서 각각 15차원, 42차원의 다중 클래스 학습이 가능함을 보였다. 실험을 입증하기 위해 가우시안 혼합 모델링을 사용해 생성한 데이터셋과 범용적으로 사용하는 UCI 데이터셋을 사용해 제안한 알고리즘의 효율성을 입증하였다.

스마트폰 가속도 센서를 이용한 사용자 인증 방법 연구 (A Study on User Authentication with Smartphone Accelerometer Sensor)

  • 서준석;문종섭
    • 정보보호학회논문지
    • /
    • 제25권6호
    • /
    • pp.1477-1484
    • /
    • 2015
  • 스마트폰 기반 금융 산업의 발달로 스마트폰을 이용한 인증 기법에 관심이 높아지고 있다. 다양한 생체 기반 사용자 인증 방식이 존재하지만 아직까지 스마트폰 기반 사용자의 걸음 패턴(gait) 인증 방식은 뚜렷한 발전을 보이고 있지 않다. 본 논문에서는 스마트폰에 기본적으로 탑재된 가속도 센서를 이용해 사용자를 인증하는 방법을 제안한다. 구체적으로, 스마트폰에서 수집한 데이터를 3D 변환하여 자세를 교정하고, 변환된 데이터에서 특징을 추출한 뒤 주성분 분석, 가우시안 혼합 모델링 과정을 거쳐 데이터를 학습 시킨다. 다음으로, 신뢰구간 검증 방식을 사용해 사용자 데이터를 검증했다. 그 결과, 통제 요인과 한계점이 많았던 선행 가속도 연구들과 달리 최소한의 통제 요인과 높은 정확도(약 96%)로 사용자 인증이 가능함을 입증했다.

면적의 변화 특성을 이용한 위험 유기물 형상 추출 모델 (Dangerous Abandoned Object Extraction Model Using Area Variation Characteristics)

  • 김원
    • 한국융합학회논문지
    • /
    • 제11권8호
    • /
    • pp.39-45
    • /
    • 2020
  • 최근에 미국, 영국, 일본에서 폭발물, 독성 화학물 등에 의한 테러가 공공장소에서 시도되고 있다. 위험물을 공공장소에서 두고 가는 방식은 탐지하기 어려운 방법 중에 하나로 인식되고 있다. 공공장소에는 곳곳에 카메라가 영상을 녹화하고 있지만, 그 영상을 사람이 일일이 모니터링 하는 것은 쉽지 않은 일이다. 최근에는 자동으로 영상을 분석하는 지능형 소프트웨어를 유기물 탐지에 이용하고 있다. Lin 등의 방식은 비교적 높은 유기물 탐지율을 보이고 있으나, 단기 배경 영상의 특성으로 유기물에 관련한 픽셀의 수가 시간이 지날수록 급격히 감소하는 경향이 있어 그 형상 정보를 얻기가 어렵다. 본 논문에서는 면적의 변화 특성을 분석함으로써 유기물의 형태를 성공적으로 추출하기 위한 새로운 기법을 제안한다. 제안한 방식에 대해 실험을 한 결과 선행 연구보다 형태 추출에서 우수한 성능을 보인다.

흡연자 검출을 위한 새로운 방법 (New Scheme for Smoker Detection)

  • 이종석;이현재;이동규;오승준
    • 한국통신학회논문지
    • /
    • 제41권9호
    • /
    • pp.1120-1131
    • /
    • 2016
  • 본 논문은 흡연으로 인한 화재사고 방지를 위해, 비디오 영상에서 흡연자를 검출하는 알고리즘을 제안한다. 흡연자의 행동을 인식하기 위해 행동 인식 기법의 계층적 방법 중 서술 기반 접근 방법을 기반으로 제안하는 알고리즘은 배경 영역 분리, 객체 검출, 이벤트 탐지, 이벤트 판단 과정으로 구성된다. 배경 영역 분리 과정으로 학습률이 다른 두 개의 가우시안 혼합 모델을 이용하여 입력 영상으로부터 고속 움직임 전경, 저속 움직임 전경 영상을 생성하고, 저속움직임 전경 영상을 chain-rule 기반 외곽선 검출 알고리즘을 통하여 객체의 위치를 추출해낸다. 위치 정보를 기반으로 흡연자의 세 가지 특징인 얼굴, 연기, 손의 움직임을 이벤트 탐지 과정에서 검출한다. Haar-like feature를 이용하여 얼굴을 검출하며, 고속 움직임 전경에서 연기의 발생 빈도수와 방향성을 반영하여 연기를 검출한다. 움직임 추정을 통해 반복적인 손의 움직임을 검출한다. 일정 구간의 비디오 시퀀스 내 객체들에 대하여, 검출된 특징들의 서술적 관계를 반영하여 각각의 객체가 흡연자인지 판단한다. 제안하는 방법은 실시간으로 여러 다른 객체들 사이에서 강인하게 흡연자를 검출한다.

은닉 물체 검출을 위한 실시간 수동형 밀리미터파 영상 분할 (Real-time passive millimeter wave image segmentation for concealed object detection)

  • 이동수;염석원;이문교;정상원;장유신
    • 한국통신학회논문지
    • /
    • 제37권2C호
    • /
    • pp.181-187
    • /
    • 2012
  • 밀리미터파 영상시스템은 의복을 투과하는 성질이 뛰어나서 의복 속에 숨겨둔 은닉 물체를 탐지하는 분야에 활용된다. 더불어 수동형 밀리미터파 영상 시스템은 능동형 시스템과 달리 실내외의 개방된 공간에서 움직이는 대상자들의 탐지가 가능하다. 그러나 수동형 밀리미터파 영상은 일반적으로 회절의 제한과 낮은 신호 레벨로 해상도가 낮으며 잡음의 영향이 크다. 그러므로 영상을 효과적으로 처리하기 위한 신호의 모델링과 통계적 분석이 요구된다. 본 논문에서 은닉 물체 검출을 수행하는 밀리미터파 영상 분할 알고리즘을 C++로 구현하여 실시간으로 처리한다. 영상의 분석을 위하여 밀리미터파 영상의 히스토그램을 혼합 가우시안 모델로 추정하고 은닉 물체를 다단계 영상 분할 방법으로 추출한다. 다단계 분할은 배경에서 몸체를 분리하는 전역분할과 은닉물체를 몸체에서 분리하는 국소분할로 이루어진다. 각 분할단계는 $k$-means, EM 추정, 판정단계로 구성되어 있다. 실험에서 실외에서 획득한 수동형 밀리미터파 영상을 분석하여 은닉 물체를 실시간으로 검출할 수 있음을 확인한다.

초음파 도플러 신호를 이용한 음성 합성 (Speech synthesis using acoustic Doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.134-142
    • /
    • 2016
  • 본 논문에서는 40 kHz 초음파 신호를 입 주변에 쏘고, 되돌아오는 초음파 신호를 이용해 음성신호를 합성하는 방법을 소개하고 성능을 평가하였다. 발성하고 있는 입주변에 초음파를 방사하게 되면, 입술, 턱, 뺨 등의 움직임으로 인한 변위로 도플러 현상이 발생하고, 이에 따라 반사 신호에는 본래의 주파수 성분과는 다른 도플러 주파수가 관찰되는데, 본 논문에서는 이러한 도플러 주파수를 이용하여 음성 파라메터를 추정하도록 하였다. 음성합성에 앞서서 초음파 도플러 신호와 음성 신호 간의 상관관계를 각 주파수 별로 분석하였으며, 이로부터 초음파 도플러 신호를 이용한 음성 신호의 합성 가능성을 살펴보았다. 변환에는 초음파 도플러의 정적, 동적 특성을 함께 반영한 특징 변수를 사용하였으며 결합-혼합 가우시안 기법을 이용하여 음성 파라메터로 변환하였다. 5명의 피 실험자를 이용한 음성 합성 실험에서 필터뱅크 에너지 값을 초음파신호의 특징변수로, LPC(Linear Predictive Coefficient) 켑스트럼 계수를 음성 변수로 사용하는 경우 가장 우수한 변환 성능을 나타내었다. 음성신호에서 추출한 여기신호를 이용하여 합성음을 생성하고, 이를 청취하였을 때 72.2 %의 평균 인식율이 얻어짐을 확인할 수 있었다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

전역 임계치 벡터의 유전적 진화에 기반한 적응형 배경차분화 (Adaptive Background Subtraction Based on Genetic Evolution of the Global Threshold Vector)

  • 임양미
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1418-1426
    • /
    • 2009
  • 주어진 배경 이미지로부터 전경 객체를 분리하는 것을 목표로 하는 배경 차분화 기법에 관한 많은 연구가 있어 왔다. 최근에 발표된 몇 가지 통계 기반 배경 차분화 기법들은 동적인 환경에서 동작할 수 있을 정도로 안정된 성능을 보이는 것으로 보고되고 있다. 그러나 이들 기법은 일반적으로 매우 많은 계산 자원을 요구하며, 객체의 명확한 윤곽을 획득하는데 있어서는 아직 어려움이 있다. 본 논문에서는 점진적으로 변화하는 배경을 모델링하기 위해 복잡한 통계 기법을 적용하는 대신 간단한 이동-평균 기법을 사용한다. 또한 픽셀별로 할당되는 다중의 임계치 대신 유전자 학습에 의해 최적화되는 하나의 전역적 임계치를 사용한다. 유전자 학습을 위해 새로운 적합도 함수를 정의하여 학습하고 이를 이용하여 이미지의 분할 결과들을 평가한다. 본 논문의 시스템은 웹 카메라가 장착된 개인용 컴퓨터에서 구현하였으며, 실사 이미지들에 대한 실험 결과에 의하면 기존의 가우시안 믹스쳐 방식보다 우수한 성능을 보이는 것으로 나타났다.

  • PDF

OpenCV 기반 파이썬 프로그램에 의한 방송용 카메라의 객체 추적 기법 (An Object Tracking Method for Studio Cameras by OpenCV-based Python Program)

  • 양용준;이상구
    • 문화기술의 융합
    • /
    • 제4권1호
    • /
    • pp.291-297
    • /
    • 2018
  • 본 논문에서는 무대에서의 방송용 카메라를 위한 자동 객체추적 시스템을 구현한다. 객체추적을 위해서 Open-CV 기반의 파이썬 프로그램을 탑재한 PC, 라즈베리파이 3, 모바일 장치를 사용한다. 영상 객체추적 방법으로는 mean-shift, CAMshift, GMM을 이용한 백그라운드 모델링, SURF를 이용한 템플레이트 기반 추적, CMT, TLD 등의 방법들이 있다. CAMshift 알고리즘은 고속 및 성능의 강인함으로 실시간 추적에 효율적이지만, 본 논문에서는 CMT 알고리즘을 이용한 방송용 카메라의 영상 객체추적 시스템을 구현한다. 이것은 정적 및 적응형 일치성 때문에 최적의 영상 추적 방법이다. 제안된 시스템은 무대에서의 실시간 연속적인 객체추적을 위한 효율적이고 강인한 영상 추적 시스템에 잘 응용될 수 있다.

Baum-Welch 학습법을 이용한 HMM 기반 대역폭 확장법 (HMM-Based Bandwidth Extension Using Baum-Welch Re-Estimation Algorithm)

  • 송근배;김석호
    • 한국음향학회지
    • /
    • 제26권6호
    • /
    • pp.259-268
    • /
    • 2007
  • 본 논문에서는 HMM 기반 통계적인 대역폭 확장(Bandwidth Extension, BWE) 방법의 개선에 대해 다룬다. 이를 위해 우선, HMM 모델 학습을 위한 기존의 Jax의 학습법과 일반적인 Baum-Welch 학습법의 관계를 비교 검토하고, Jax의 학습법의 한계점 및 문제점을 검토한다. 그리고 이를 바탕으로 Baum-Welch학습법을 이용한 새로운 HMM 기반 BWE 방법을 제시한다. 결론적으로, Baum-Welch 학습법은 Jax의 학습법의 일반화된 형태로 볼 수 있으며, 보다 유연하고 적응적인 학습능력을 가진 알고리즘임을 알 수 있다. 따라서 학습 데이터에 대한 보다 정확한 HMM 모델링이 가능하며 아울러, 이와 같이 개선된 HMM 모델을 활용함으로써 BWE 시스템의 성능향상을 가져 올 수 있었다. 실험결과에 의하면, 제시된 새로운 방법이 기존의 Jax의 방법에 비해 실험의 모든 경우에서 우수한 성능을 보임을 알 수 있다. 주어진 실험조건하에서 근제곱평균(root-mean-square, RMS) 로그 스펙트럴 왜곡(Log Spectral Distortion, LSD) 값이 전체적으로 평균 0.52dB 그리고, 최소 0.31dB에서 최대 0.8dB까지 개선되었다.