• 제목/요약/키워드: Gaussian mixture method

검색결과 302건 처리시간 0.029초

전역 임계치 벡터의 유전적 진화에 기반한 적응형 배경차분화 (Adaptive Background Subtraction Based on Genetic Evolution of the Global Threshold Vector)

  • 임양미
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1418-1426
    • /
    • 2009
  • 주어진 배경 이미지로부터 전경 객체를 분리하는 것을 목표로 하는 배경 차분화 기법에 관한 많은 연구가 있어 왔다. 최근에 발표된 몇 가지 통계 기반 배경 차분화 기법들은 동적인 환경에서 동작할 수 있을 정도로 안정된 성능을 보이는 것으로 보고되고 있다. 그러나 이들 기법은 일반적으로 매우 많은 계산 자원을 요구하며, 객체의 명확한 윤곽을 획득하는데 있어서는 아직 어려움이 있다. 본 논문에서는 점진적으로 변화하는 배경을 모델링하기 위해 복잡한 통계 기법을 적용하는 대신 간단한 이동-평균 기법을 사용한다. 또한 픽셀별로 할당되는 다중의 임계치 대신 유전자 학습에 의해 최적화되는 하나의 전역적 임계치를 사용한다. 유전자 학습을 위해 새로운 적합도 함수를 정의하여 학습하고 이를 이용하여 이미지의 분할 결과들을 평가한다. 본 논문의 시스템은 웹 카메라가 장착된 개인용 컴퓨터에서 구현하였으며, 실사 이미지들에 대한 실험 결과에 의하면 기존의 가우시안 믹스쳐 방식보다 우수한 성능을 보이는 것으로 나타났다.

  • PDF

RAGMD를 이용한 클러스터 기반의 영상 검색 기법 (Cluster-based Image Retrieval Method Using RAGMD)

  • 정성환;이우선
    • 정보처리학회논문지B
    • /
    • 제9B권1호
    • /
    • pp.113-118
    • /
    • 2002
  • 본 논문에서는 클러스터 기반의 영상 검색 기법을 제시한다. 이 기법은 클러스터링 기법인 RAGMD를 이용하여 유사한 영상들을 클러스터로 분류한 후, 관련 클러스터로부터 영상을 검색하는 방법이다. 영상 검색시에 먼저, 전체 영상 데이터베이스를 차례대로 일일이 검색하는 것이 아니라, 질의 영상과 유사한 클러스터인 유사 영상 소집단에서 검색한다. 그러므로 이 방법은 직접 검색(Exhaustive Retrieval)과 거의 같은 검색 정밀도(Precision)를 유지하면서 검색 시간을 단축할 수 있다. 약 2,400개의 실제 영상들로 구성된 영상 데이터베이스를 사용한 실험에서, 제안된 검색 방법이 직접 검색과 거의 같은 정밀도를 유지하면서 약 18배의 빠른 검색 시간을 보였으며, 질의 영상과 같은 클래스에 속한 유사한 영상들을 더 많이 검색하는 것으로 나타났다.

음향방출을 이용한 금속의 피로 균열성장 패턴인식 기법 (A Pattern Recognition Method of Fatigue Crack Growth on Metal using Acoustic Emission)

  • 이수일;이종석;민황기;박철훈
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.125-137
    • /
    • 2009
  • 음향방출 기법은 작동중인 상태에서 기계 설비를 비파괴 검사할 수 있는 기법이며, 균열성장 같은 장애의 신뢰성 있는 감시를 위해서 순간적인 균열신호뿐만 아니라 동특성을 이용하는 것이 중요하다. 균열성장을 검출하기 위해 널리 사용되는 물리적 파괴 3단계는 음향방출 현상이 시간에 따라 서로 겹치는 문제점이 있어 정확한 균열성장 시간을 추정하기 어렵다. 제안한 패턴인식 기법은 오경보와 미탐지를 최소화하기 위해서 음향방출 동특성을 입력으로 사용하고, 균열성장 시간을 정확히 추정하기 위해 시간에 따른 클러스터링 기법을 사용한다. 실험결과는 제안한 패턴인식 기법이 압력의 변화에 의한 음향방출의 변화의 강인함 때문에 실용화에 효율적임을 보여준다.

효과적인 AR 영상통화 구현 방법을 위한 가설 방안과 연구 (The Study and Hypothesis of Realize AR Video Calling Method)

  • 곽대위;정진헌
    • 디지털융복합연구
    • /
    • 제16권9호
    • /
    • pp.413-419
    • /
    • 2018
  • 스마트폰은 현대사회에서 꼭 필요한 통신수단이 되었고 이미 인류의 일상생활에 융합되었다. 만약에 미니 헤드 마운트 표시 장치(HMD)를 활용하여 증강현실 기술로 통신 중인 양쪽 상대방의 용모, 표정, 동작 등의 요소가 통화 환경에 들어오면 사용하는 사람에게 직관적이고 특별한 느낌을 준다. 그리고 이 방식으로 시각의 한계성을 넘어설 수 있으므로 미래 시각예술 영역의 크게 발전을 촉진할 수 있어서 이런 기술적인 문제에 관한 연구의 의미가 있다. 본 논문은 효과적인 AR 영상통화 구현 방법에 대한 현재 사용되는 기술 중 몇 가지를 융복합하여 실현 가능한 두 가지 가설방안을 세우고 분석과 비교하여 두 가지 가설방안의 문제점을 발견한다. 그리고 문제점에 대한 해결 가능한 디자인 방안을 꺼낸다. 또 사례연구의 방식으로 실제 사례를 제출하여 두 가지 가설 방안은 미래에 실현 가능하다는 결론을 검증한다. 이러한 기술들은 우리의 일상에 더욱 재미요소와 편리함을 제공할 것이라 예상된다. AR 영상통화를 순조롭게 구현하는 것은 예견할 수 있고 나중에 무한한 발전 가능성이 있다.

알츠하이머 병의 검출을 위한 ML-SVM, PCA, VBM, GMM을 결합한 융합적 성능 비교 (Convergence performance comparison using combination of ML-SVM, PCA, VBM and GMM for detection of AD)

  • 사우라르 알람;권구락
    • 한국융합학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-7
    • /
    • 2016
  • 구조적 MRI 영상은 여러 단 변량과 다변량 방법을 위해 그레이 메터 (GM), 화이트 메터 (WM), 뇌척수액 (CSF) 세션화 과정을 하고 난후 형태계측학적 특징을 추출하기 위해 사용한다. 새로운 접근 방법은 매우 가벼운 알츠하이머 병에서 가벼운 알츠하이머병의 진단을 위해 적용된다. 간이정신상태검사에 따른 형태계측학적 특징과 가우시안 복합 모델 파라미터를 결합하여 정상인으로부터 알츠하이머 병 환자로 분류하는 방법을 제안한다. 결합한 특징은 주성분 분석 기법을 이용한 고차원의 저주를 제거한 후 다중 커널 SVM 분류기에 공급한다. 제안한 진단 방법의 실험적 결과는 90%이상의 특성도와 고민감도에 따라 다중 커널 SVM을 가진 층화 정확도가 96%까지 최대 산출한다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

IoT 디바이스에서 다차원 디지털 신호 처리를 위한 신경망 최적화 (Neural networks optimization for multi-dimensional digital signal processing in IoT devices)

  • 최권택
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1165-1173
    • /
    • 2017
  • 가장 대표적인 기계학습 알고리즘인 딥러닝 방법은 여러 응용 분야에서 활용성이 입증돼 디지털신호처리에 널리 사용되고 있다. 그러나 많은 학습데이터를 사용해 학습하는 과정에서 많은 메모리와 학습시간이 필요하기 때문에 CPU 성능과 메모리 용량이 제한된 IoT 디바이스에 딥러닝 기술을 적용하기는 어렵다. 특히 메모리 용량이 2K~8K 로 극히 적은 아두이노 기반의 디바이스를 사용한다면 알고리즘 구현에 많은 한계가 발생한다. 본 논문에서는 정확성과 효율성이 입증돼 여러 분야에서 활용되고 있는 ELM 알고리즘을 아두이노에서 최적화하는 방법을 제안하고, 실험을 통해 메모리 용량이 2KB인 아두이노 UNO와 메모리 용량이 8KB인 아두이노 MEGA에서 각각 15차원, 42차원의 다중 클래스 학습이 가능함을 보였다. 실험을 입증하기 위해 가우시안 혼합 모델링을 사용해 생성한 데이터셋과 범용적으로 사용하는 UCI 데이터셋을 사용해 제안한 알고리즘의 효율성을 입증하였다.

스마트폰 가속도 센서를 이용한 사용자 인증 방법 연구 (A Study on User Authentication with Smartphone Accelerometer Sensor)

  • 서준석;문종섭
    • 정보보호학회논문지
    • /
    • 제25권6호
    • /
    • pp.1477-1484
    • /
    • 2015
  • 스마트폰 기반 금융 산업의 발달로 스마트폰을 이용한 인증 기법에 관심이 높아지고 있다. 다양한 생체 기반 사용자 인증 방식이 존재하지만 아직까지 스마트폰 기반 사용자의 걸음 패턴(gait) 인증 방식은 뚜렷한 발전을 보이고 있지 않다. 본 논문에서는 스마트폰에 기본적으로 탑재된 가속도 센서를 이용해 사용자를 인증하는 방법을 제안한다. 구체적으로, 스마트폰에서 수집한 데이터를 3D 변환하여 자세를 교정하고, 변환된 데이터에서 특징을 추출한 뒤 주성분 분석, 가우시안 혼합 모델링 과정을 거쳐 데이터를 학습 시킨다. 다음으로, 신뢰구간 검증 방식을 사용해 사용자 데이터를 검증했다. 그 결과, 통제 요인과 한계점이 많았던 선행 가속도 연구들과 달리 최소한의 통제 요인과 높은 정확도(약 96%)로 사용자 인증이 가능함을 입증했다.

동적 베이지안 네트워크를 이용한 동영상 기반의 화재연기감지 (Fire-Smoke Detection Based on Video using Dynamic Bayesian Networks)

  • 이인규;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제34권4C호
    • /
    • pp.388-396
    • /
    • 2009
  • 본 연구는 CCD카메라로부터 입력된 영상을 분석하여 특징값을 추출하고, 패턴인식기술을 이용하여 화재연기영상을 감지하는 방법을 제안한다. 우선 CCD카메라로부터 획득된 영상들간의 차영상을 이용하여 움직임 영역만을 검출하고, 이후 연기색상모델을 적용하여 후보영역을 생성한다. 연기영역은 유사색상의 군집화를 이루고, 주변에 비해 단순한 질감을 가지며, 시간에 따른 모션정보의 상승 방향성을 가지는 특징을 가진다. 본 논문에서는 연기영역의 이러한 특성을 이용하여 학습영상으로부터 연기의 밝기, 웨이블릿 고주파 성분, 모션 벡터 등의 특징 값을 추출하고 이들 특징 값들에 대해 가우시안 확률 모델을 생성한다. 이렇게 추출된 확률모델은 연기영역의 시간적 연속성을 고려하기 위해 본 논문에서 새롭게 구성한 동적 베이지안 네트워크의 관찰노드에 적용된다. 본 논문에서 제안하는 방법은 산불을 비롯한 다양한 연기를 감지하였으며, 기존의 알고리즘에 비해 우수한 성능을 보여주었다.

모바일 환경에서의 시각 음성인식을 위한 눈 정위 기반 입술 탐지에 대한 연구 (A Study on Lip Detection based on Eye Localization for Visual Speech Recognition in Mobile Environment)

  • 송민규;;김진영;황성택
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.478-484
    • /
    • 2009
  • 음성 인식 기술은 편리한 삶을 추구하는 요즘 추세에 HMI를 위해 매력적인 기술이다. 음성 인식기술에 대한 많은 연구가 진행되고 있으나 여전히 잡음 환경에서의 성능은 취약하다. 이를 해결하기 위해 요즘은 청각 정보 뿐 아니라 시각 정보를 이용하는 시각 음성인식에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 모바일 환경에서의 시각 음성인식을 위한 입술의 탐지 방법을 제안한다. 시각 음성인식을 위해서는 정확한 입술의 탐지가 필요하다. 우리는 입력 영상에서 입술에 비해 보다 찾기 쉬운 눈을 이용하여 눈의 위치를 먼저 탐지한 후 이 정보를 이용하여 대략적인 입술 영상을 구한다. 구해진 입술 영상에 K-means 집단화 알고리듬을 이용하여 영역을 분할하고 분할된 영역들 중 가장 큰 영역을 선택하여 입술의 양 끝점과 중심을 얻는다. 마지막으로, 실험을 통하여 제안된 기법의 성능을 확인하였다.