• 제목/요약/키워드: 소리 인식

검색결과 212건 처리시간 0.035초

보안카메라에서 소리인식 구현 (Implementation of Sound Recognition for Security Camera)

  • 윤태인;구하늘;김도은;장원석;권순각;권오준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.491-493
    • /
    • 2012
  • 소리인식이란 우리 귀에 들리는 모든 소리를 받아 들여 소리의 값과 저장되어 있는 데이터의 값을 비교하여 인식 결과를 도출해내는 과정을 의미한다. 보안 카메라는 현재 다양한 장소에서 설치되어 있어도 여전히 보안의 사각지대는 존재하며, 이를 보완하기 위해서는 여러 방향을 촬영하기 위한 아주 많은 보완 카메라가 설치될 수 밖에 없다. 그렇게 되면 설치비용이 더욱 증가되고, 무수한 카메라는 사람들에게 심적 부담감을 줄 것이다. 본 논문은 보안 카메라에 마이크를 설치하고, 입력되는 소리를 인식하여 발생되는 상황을 판단하는 시스템을 설계하고 구현하기 위한 것이다. 이를 바탕으로 보안 카메라의 사각지대를 소리인식으로 해결할 수 있어서 보완 카메라의 설치 비용을 줄일 수 있다.

  • PDF

광역 스펙트로그램과 심층신경망에 기반한 중첩된 소리의 인식과 영향 분석 (Recognition of Overlapped Sound and Influence Analysis Based on Wideband Spectrogram and Deep Neural Networks)

  • 김영언;박구만
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.421-430
    • /
    • 2018
  • 많은 음성인식 시스템들은 MFCC와 HMM등의 분류 기법을 사용하여 사람의 음성을 인식한다. 그러나 이러한 음성인식 시스템은 단일 음성신호를 인식하는 것을 목적으로 설계되어, 인간과 기계사이의 일대일 음성 인식에는 적합하나, 애완동물 소리와 실내 소리같은 음성보다 다양하고 넓은 주파수의 소리 군으로 중첩된 음향 속에서 설정된 소리를 인식하기에는 제한이 있다. 중첩된 소리들의 주파수는 사람의 목소리보다 높은 최대 20 kHz까지 넓은 주파수 범위로 구성된다. 본 논문에서는 광역 사운드 스펙트로그램과 DNN에 기반한 케라스 시?셜 모델 기법을 활용하여 인지 주파수 범위를 넓게 확대하는 새로운 인식방법을 제안한다. 광역 사운드 스펙트로그램이 본 논문에서 설계된 특징 추출 및 분류 시스템과 같이 넓은 주파수 범위의 다양한 소리를 분석하고 실험하도록 채택되었다. 소리 인식률을 개선하기 위하여, 케라스 시?셜 모델이 사운드 스펙트로그램에 의하여 생성되어 추출된 특징을 사용하여 패턴인식을 수행하기 위한 방법으로 채용되었다. 제안된 특징 추출 및 분류 시스템이 광역 사운드 스펙트로그램과 케라스 시?셜 모델을 채용하여 애완동물 소리와 실내 소리같은 다양한 주파수들로 구성되어 중첩된 음향 속에서 설정된 소리를 우수하게 분류하는 것을 확인하였다. 그리고 중첩된 소리의 크기에 비례하여 인식에 미치는 특성과 영향을 단계별로 비교 분석하였다.

능동형 기울기 가중치 제약에 기반한 환경소리 인식시스템용 DTW 알고리듬 (Active Slope Weighted-Constraints Based DTW Algorithm for Environmental Sound Recognition System)

  • 정영진;이윤정;김필운;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.471-480
    • /
    • 2008
  • 농자들은 청각장애를 가지고 있기 때문에 알람, 도어 벨, 싸이렌, 경적, 전화 벨 등과 같은 유용한 소리정보를 인식할 수 없다. 이러한 문제를 해결하기 위해서는 주요한 환경소리 인식방법을 탑재한 휴대형 청각보조 장구가 요구되어진다. 본 논문에서는 환경소리 인식시스템에 적용할 수 있는 능동형 기울기 가중치제약 방식의 새로운 동적 시간정합 알고리듬을 제안하였다. 환경소리 인식방법은 크게 세 단계로 구성된다. 첫 번째 단계에서는 소리의 주파수 성분과 크기를 이용하여 시작점과 끝점을 추출한다. 두 번째 단계에서는 추출된 구간에 대하여 특징을 추출하며 세 번째 단계에서는 추출된 특징들을 분류한다. 실험 결과 제안한 방법의 인식률이 거의 90%가 되었다. 그리고 기존의 동적 시간정합 알고리듬과 비교하였을 때 인식율에 있어서 약 20%정도의 개선이 있었다. 따라서 제안된 방법을 사용하여 농자가 환경소리를 인식할 수 있는 휴대형 청각 보조 장구가 개발된다면 그들의 생활에 편리함을 줄 수 있을 것으로 판단된다.

  • PDF

소리를 이용한 센서 네트워크 위치인식 기법에서의 에러보정 기법 (Error Recovery Scheme for Acoustic-based Localization in Wireless Sensor Networks)

  • 이영화;차호정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.80-84
    • /
    • 2006
  • 센서 네트워크에서 노드들의 위치 인식에는 여러 가지 기법이 이용된다. 그 중 소리를 이용한 위치인식 기법은 정확도가 높고 넓은 지역에서도 활용이 가능하다는 장점이 있다. 소리를 이용한 위치 인식 기법은 음원으로부터 노드까지의 거리 정보 수집을 통하여 위치 인식이 가능하다. 하지만 기존의 기법에서는 거리를 정확하게 측정을 하는 것에만 초점이 맞춰져 있었으며 위치인식에 필요한 정보의 부족으로 위치인식 과정을 진행시키지 못하는 경우에 있어서는 고려를 하고 있지 않다. 본 논문에서는 소리를 이용한 위치인식 과정에서 발생할 수 있는 에러 보정 기법을 제안한다.

  • PDF

다양한 소리 환경에서 UBM 기반의 비명 소리 검출 (Scream Sound Detection Based on Universal Background Model Under Various Sound Environments)

  • 정용주
    • 한국전자통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.485-492
    • /
    • 2017
  • GMM(: Gaussian Mixture Model)은 비명 소리를 검출하기 위해서 가장 많이 사용되는 기법의 하나이다. 기존의 GMM 방식에서는 전체 훈련데이터를 비명소리와 비-비명 소리로 나누고, 훈련과정을 통하여 각각의 GMM 모델을 생성하게 된다. 그러나 본 연구에서는 비명 소리 검출 과정이 화자인식과 매우 유사하다는 점에 착안하여 화자인식에서 매우 효과적으로 사용된 UBM(: Universal Background Model) 방식을 비명소리 검출에 적용할 것을 제안하였다. 제안된 UBM 방식을 통한 검출 실험 결과 기존의 GMM 방식에 비하여 더 나은 검출 성능을 보임을 인식 실험을 통하여 확인 할 수 있었다.

최대 빈도모델 탐색을 이용한 동물소리 인식용 소리모델생성 (Sound Model Generation using Most Frequent Model Search for Recognizing Animal Vocalization)

  • 고유정;김윤중
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권1호
    • /
    • pp.85-94
    • /
    • 2017
  • 본 논문에서는 동물소리 인식시스템을 위하여 최대 빈도모델 탐색 알고리즘을 고안하고 이를 이용한 소리모델을 생성하는 방법을 제안하였다. 소리모델 생성 방법은 동물종의 소리 데이터로부터 학습과정, 비터비 탐색과정 및 최대 빈도모델 탐색과정을 반복하면서 HMM(Hidden Makcov Model)모델의 구조(상태의 수와 GMM의 수)를 탐색하여 최적의 인식률을 갖는 모델집합이 생성하는 방법이다. 최대 빈도모델 탐색 알고리즘은 입력 소리 데이터를 비터비(Viterbi) 알고리즘으로 탐색하여 모델리스트를 생성하고 이 리스트 중에서 최대 빈도수의 모델을 탐색하여 최종 인식결과로 결정하는 방법이다. 알고리즘에서 소리특징으로 MFCC(Mel Frequency Cepstral Coefficient), 모델형식으로 HMM을 이용하고 C# 프로그래밍언어로 구현 하였다. 알고리즘의 성능을 평가하기 위하여 27종의 동물소리를 선정하고 실험을 하였으며 27개의 HMM 모델집합이 97.29 퍼센트의 인식률로 생성됨을 확인하였다.

도형을 그리는 소리: 소리를 이용한 형태정보의 전달 가능성 탐색 (Auditory shaping _Conveying shape information using auditory images)

  • 박영현;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.506-512
    • /
    • 2006
  • 시각적인 정보전달이 어려운 상황에서의 대상인식, 혹은 시각장애인의 대상인식에 있어서 소리는 어느 정도의 역할을 할 수 있을까? 이 연구는 소리를 통해 대상의 형태정보를 전달하기 위해 진행되었다. 하나의 음(musical tone)을 음높이와 음색, 지속시간을 조정한 후, 머리전달함수(Head-Related Transfer Function: HRTF)를 이용하여 수평선, 수직선, 대각선, 곡선의 형태로 운동하는 3-D 사운드 형태소로 만들었다. 그리고 이들의 연속적인 조합을 통해 단순한 도형에서부터 복잡한 도형, 이들 2차원상의 도형을 단면으로 하는 3차원상의 도형들까지 그려내는 소리자극을 구성하였다. 성인 대학생을 대상으로 한 실험에서, 이렇게 만들어진 청각이미지(auditory image)를 듣고 표상된 형태를 여러 개의 시각적인 이미지들(visual images) 중에서 선택하는 과제를 실시하였는데, 실험 결과는 평균 78%의 정확율을 보였다. 이는 소리를 이용한 형태정보 전달의 가능성이 있음을 시사하는 것이며, 이러한 시도는 청각 인터페이스의 응용범위를 확장하는데 도움이 될 것이다.

  • PDF

2차원 변환과 CNN 딥러닝 기반 음향 인식 시스템에 관한 연구 (A Study on Sound Recognition System Based on 2-D Transformation and CNN Deep Learning)

  • 하태민;조성원;;;이기성
    • 스마트미디어저널
    • /
    • 제11권1호
    • /
    • pp.31-37
    • /
    • 2022
  • 본 논문은 일상생활에서 흔히 들을 수 있는 소리(비명소리, 박수 소리, 여러 명의 박수 소리, 자동차 지나가는 소리, 배경음 등)를 감지하는 음향 인식을 위하여, 신호처리 및 딥러닝을 적용하는 연구에 관한 것이다. 제안된 음향 인식에서는, 인식 정확도의 향상을 위해서 음향 파형의 스펙트럼, 음향 데이터의 증강, 2차원(2-D) 이미지 변환에 관한 기술들이 사용되었고, 예측의 정확도를 향상을 위한 앙상블 학습, Convolution Neural Network(CNN) 딥러닝 기술들이 적용된다. 제안된 음향 인식 기술은 실험을 통해 다양한 음향을 정확하게 인식할 수 있음을 보여준다.

센서 네트워크에서 이동음원을 이용한 자기위치 인식기법 (Localization Scheme using Mobile Acoustic Beacon in Wireless Sensor Networks)

  • 이영화;차호정
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (D)
    • /
    • pp.31-33
    • /
    • 2006
  • 센서 네트워크를 구성함에 있어서 센서 노드들의 자기위치 인식은 가장 기본이 되며 중요한 부분 중 하나이다. 이런 자기 위치 인식 기법 중에서도 소리를 이용한 기법은 정확도가 높은 장점이 있어 많은 연구가 있어 왔지만 기존의 방법들은 추가적으로 고가의 하드웨어를 이용하거나 중앙 집중식 연산을 함으로써 시스템의 부하가 크며 소리의 발생시간을 미리 계획하여야 한다는 단점이 있었다. 본 논문에서는 일반 음원감지 센서를 장착한 노드들을 이용하여 임의의 시간에 소리를 발생시키고 이를 감지한 각 개별 노드들이 독립적으로 자기위치 인식의 연산을 수행함으로써 에너지 소모를 줄이고, 시스템 설계의 비용은 낮추며 소리의 특성 또한 사용자의 요구에 맞게 설계하여 실용성을 높이는 자기 위치 인식 기법을 제안하고, 실제 구현을 통한 성능 분석을 제시한다.

  • PDF

HTM 기반의 소리 연식을 이용한 부품의 양.불량 판별 시스템 (A Quality Identification System for Molding Parts Using HTM-Based Sound Recognition)

  • 배선갑;한창영;서대호;김성진;배종민;강현석
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1494-1505
    • /
    • 2010
  • 하나의 프레스로 여러 종류의 부품을 소량으로 생산하는 중 소형 공장에서는 부품 생산 과정에 발생하는 소리가 다양하게 나타난다. 이에 우리는 제품의 생산 순간의 소리를 인식하여 제품의 양 불량을 판별하는 시스템을 계층형 시간적 메모리(HTM Hierarchical Temporal Memory) 기술을 이용하여 개발하였다. HTM 이론은 인간 두뇌의 신피질(neocortex)의 동작 원리를 컴퓨터에 접목시킨 이론이다. 이는 실세계에 대한 시공간적인 패턴을 계층적으로 기억하는 것으로 기존의 인식 기술보다 여러 경우에 인식률이 뛰어난 것으로 알려져 있다. 우리는 이 HTM 기술을 소리 인식에 적용하여 부품에 대한 양 불량 판별 시스템을 개발하였다. 개발 결과를 검증하기 위해 실제 공장에서 부품 생산 순간의 다양한 소리들을 녹음하고, 소리 HTM 네트워크를 구성한 후, 학습과 훈련을 반복하여 해당 부품의 불량여부를 판정하도록 하였다. 그 결과 잡음이 많은 생산 현장에서도 판정의 정확도가 높은 것으로 확인하였다.