• Title/Summary/Keyword: 소리 인식

Search Result 212, Processing Time 0.029 seconds

Implementation of Sound Recognition for Security Camera (보안카메라에서 소리인식 구현)

  • Yun, Tae-In;Ku, Ha-Neul;Kim, Do-Eun;Jang, Won-Serk;Kwon, Soon-Kak;Kwon, Oh-Jun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2012.05a
    • /
    • pp.491-493
    • /
    • 2012
  • 소리인식이란 우리 귀에 들리는 모든 소리를 받아 들여 소리의 값과 저장되어 있는 데이터의 값을 비교하여 인식 결과를 도출해내는 과정을 의미한다. 보안 카메라는 현재 다양한 장소에서 설치되어 있어도 여전히 보안의 사각지대는 존재하며, 이를 보완하기 위해서는 여러 방향을 촬영하기 위한 아주 많은 보완 카메라가 설치될 수 밖에 없다. 그렇게 되면 설치비용이 더욱 증가되고, 무수한 카메라는 사람들에게 심적 부담감을 줄 것이다. 본 논문은 보안 카메라에 마이크를 설치하고, 입력되는 소리를 인식하여 발생되는 상황을 판단하는 시스템을 설계하고 구현하기 위한 것이다. 이를 바탕으로 보안 카메라의 사각지대를 소리인식으로 해결할 수 있어서 보완 카메라의 설치 비용을 줄일 수 있다.

  • PDF

Recognition of Overlapped Sound and Influence Analysis Based on Wideband Spectrogram and Deep Neural Networks (광역 스펙트로그램과 심층신경망에 기반한 중첩된 소리의 인식과 영향 분석)

  • Kim, Young Eon;Park, Gooman
    • Journal of Broadcast Engineering
    • /
    • v.23 no.3
    • /
    • pp.421-430
    • /
    • 2018
  • Many voice recognition systems use methods such as MFCC, HMM to acknowledge human voice. This recognition method is designed to analyze only a targeted sound which normally appears between a human and a device one. However, the recognition capability is limited when there is a group sound formed with diversity in wider frequency range such as dog barking and indoor sounds. The frequency of overlapped sound resides in a wide range, up to 20KHz, which is higher than a voice. This paper proposes the new recognition method which provides wider frequency range by conjugating the Wideband Sound Spectrogram and the Keras Sequential Model based on DNN. The wideband sound spectrogram is adopted to analyze and verify diverse sounds from wide frequency range as it is designed to extract features and also classify as explained. The KSM is employed for the pattern recognition using extracted features from the WSS to improve sound recognition quality. The experiment verified that the proposed WSS and KSM excellently classified the targeted sound among noisy environment; overlapped sounds such as dog barking and indoor sounds. Furthermore, the paper shows a stage by stage analyzation and comparison of the factors' influences on the recognition and its characteristics according to various levels of noise.

Active Slope Weighted-Constraints Based DTW Algorithm for Environmental Sound Recognition System (능동형 기울기 가중치 제약에 기반한 환경소리 인식시스템용 DTW 알고리듬)

  • Jung, Young-Jin;Lee, Yun-Jung;Kim, Pil-Un;Kim, Myoung-Nam
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.4
    • /
    • pp.471-480
    • /
    • 2008
  • The deaf can not recognize useful sound informations such as alarm, doorbell, siren, car horn, and phone ring etc., because they have the hearing impairment. To solve this problems, portable hearing assistive devices which have suitable environment sound recognition methods are needed. In this paper, the DTW algorithm for sound recognition system with new active slope weighting constraint method was proposed. The environment sound recognition methods consist of three processes. First process is extraction of start point and end point using frequency and amplitude of sound. Second process is extraction of features and third process is classification of features for given segments. As a result of the experiment, the recognition rate of the proposed method is over 90%. And, the recognition rate of the proposed method increased about 20% than the conventional algorithm. Therefore if there are developed portable assistive devices which use developed method to recognize environment sound for hearing-impaired persons, they could be more convenient in life.

  • PDF

Error Recovery Scheme for Acoustic-based Localization in Wireless Sensor Networks (소리를 이용한 센서 네트워크 위치인식 기법에서의 에러보정 기법)

  • Lee, Young-Hwa;Cha, Ho-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10d
    • /
    • pp.80-84
    • /
    • 2006
  • 센서 네트워크에서 노드들의 위치 인식에는 여러 가지 기법이 이용된다. 그 중 소리를 이용한 위치인식 기법은 정확도가 높고 넓은 지역에서도 활용이 가능하다는 장점이 있다. 소리를 이용한 위치 인식 기법은 음원으로부터 노드까지의 거리 정보 수집을 통하여 위치 인식이 가능하다. 하지만 기존의 기법에서는 거리를 정확하게 측정을 하는 것에만 초점이 맞춰져 있었으며 위치인식에 필요한 정보의 부족으로 위치인식 과정을 진행시키지 못하는 경우에 있어서는 고려를 하고 있지 않다. 본 논문에서는 소리를 이용한 위치인식 과정에서 발생할 수 있는 에러 보정 기법을 제안한다.

  • PDF

Scream Sound Detection Based on Universal Background Model Under Various Sound Environments (다양한 소리 환경에서 UBM 기반의 비명 소리 검출)

  • Chung, Yong-Joo
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.12 no.3
    • /
    • pp.485-492
    • /
    • 2017
  • GMM has been one of the most popular methods for scream sound detection. In the conventional GMM, the whole training data is divided into scream sound and non-scream sound, and the GMM is trained for each of them in the training process. Motivated by the idea that the process of scream sound detection is very similar to that of speaker recognition, the UBM which has been used quite successfully in speaker recognition, is proposed for use in scream sound detection in this study. We could find that UBM shows better performance than the traditional GMM from the experimental results.

Sound Model Generation using Most Frequent Model Search for Recognizing Animal Vocalization (최대 빈도모델 탐색을 이용한 동물소리 인식용 소리모델생성)

  • Ko, Youjung;Kim, Yoonjoong
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.10 no.1
    • /
    • pp.85-94
    • /
    • 2017
  • In this paper, I proposed a sound model generation and a most frequent model search algorithm for recognizing animal vocalization. The sound model generation algorithm generates a optimal set of models through repeating processes such as the training process, the Viterbi Search process, and the most frequent model search process while adjusting HMM(Hidden Markov Model) structure to improve global recognition rate. The most frequent model search algorithm searches the list of models produced by Viterbi Search Algorithm for the most frequent model and makes it be the final decision of recognition process. It is implemented using MFCC(Mel Frequency Cepstral Coefficient) for the sound feature, HMM for the model, and C# programming language. To evaluate the algorithm, a set of animal sounds for 27 species were prepared and the experiment showed that the sound model generation algorithm generates 27 HMM models with 97.29 percent of recognition rate.

Auditory shaping _Conveying shape information using auditory images (도형을 그리는 소리: 소리를 이용한 형태정보의 전달 가능성 탐색)

  • Park, Young-Hyun;Han, Kwang-Hee
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.506-512
    • /
    • 2006
  • 시각적인 정보전달이 어려운 상황에서의 대상인식, 혹은 시각장애인의 대상인식에 있어서 소리는 어느 정도의 역할을 할 수 있을까? 이 연구는 소리를 통해 대상의 형태정보를 전달하기 위해 진행되었다. 하나의 음(musical tone)을 음높이와 음색, 지속시간을 조정한 후, 머리전달함수(Head-Related Transfer Function: HRTF)를 이용하여 수평선, 수직선, 대각선, 곡선의 형태로 운동하는 3-D 사운드 형태소로 만들었다. 그리고 이들의 연속적인 조합을 통해 단순한 도형에서부터 복잡한 도형, 이들 2차원상의 도형을 단면으로 하는 3차원상의 도형들까지 그려내는 소리자극을 구성하였다. 성인 대학생을 대상으로 한 실험에서, 이렇게 만들어진 청각이미지(auditory image)를 듣고 표상된 형태를 여러 개의 시각적인 이미지들(visual images) 중에서 선택하는 과제를 실시하였는데, 실험 결과는 평균 78%의 정확율을 보였다. 이는 소리를 이용한 형태정보 전달의 가능성이 있음을 시사하는 것이며, 이러한 시도는 청각 인터페이스의 응용범위를 확장하는데 도움이 될 것이다.

  • PDF

A Study on Sound Recognition System Based on 2-D Transformation and CNN Deep Learning (2차원 변환과 CNN 딥러닝 기반 음향 인식 시스템에 관한 연구)

  • Ha, Tae Min;Cho, Seongwon;Tra, Ngo Luong Thanh;Thanh, Do Chi;Lee, Keeseong
    • Smart Media Journal
    • /
    • v.11 no.1
    • /
    • pp.31-37
    • /
    • 2022
  • This paper proposes a study on applying signal processing and deep learning for sound recognition that detects sounds commonly heard in daily life (Screaming, Clapping, Crowd_clapping, Car_passing_by and Back_ground, etc.). In the proposed sound recognition, several techniques related to the spectrum of sound waves, augmentation of sound data, ensemble learning for various predictions, convolutional neural networks (CNN) deep learning, and two-dimensional (2-D) data are used for improving the recognition accuracy. The proposed sound recognition technology shows that it can accurately recognize various sounds through experiments.

Localization Scheme using Mobile Acoustic Beacon in Wireless Sensor Networks (센서 네트워크에서 이동음원을 이용한 자기위치 인식기법)

  • Lee Young-Hwa;Cha Ho-Jung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06d
    • /
    • pp.31-33
    • /
    • 2006
  • 센서 네트워크를 구성함에 있어서 센서 노드들의 자기위치 인식은 가장 기본이 되며 중요한 부분 중 하나이다. 이런 자기 위치 인식 기법 중에서도 소리를 이용한 기법은 정확도가 높은 장점이 있어 많은 연구가 있어 왔지만 기존의 방법들은 추가적으로 고가의 하드웨어를 이용하거나 중앙 집중식 연산을 함으로써 시스템의 부하가 크며 소리의 발생시간을 미리 계획하여야 한다는 단점이 있었다. 본 논문에서는 일반 음원감지 센서를 장착한 노드들을 이용하여 임의의 시간에 소리를 발생시키고 이를 감지한 각 개별 노드들이 독립적으로 자기위치 인식의 연산을 수행함으로써 에너지 소모를 줄이고, 시스템 설계의 비용은 낮추며 소리의 특성 또한 사용자의 요구에 맞게 설계하여 실용성을 높이는 자기 위치 인식 기법을 제안하고, 실제 구현을 통한 성능 분석을 제시한다.

  • PDF

A Quality Identification System for Molding Parts Using HTM-Based Sound Recognition (HTM 기반의 소리 연식을 이용한 부품의 양.불량 판별 시스템)

  • Bae, Sun-Gap;Han, Chang-Young;Seo, Dae-Ho;Kim, Sung-Jin;Bae, Jong-Min;Kang, Hyun-Syug
    • Journal of Korea Multimedia Society
    • /
    • v.13 no.10
    • /
    • pp.1494-1505
    • /
    • 2010
  • A variety of sounds take place in medium and small-sized manufactories producing many kinds of parts in a small quantity with one press. We developed the identification system for the quality of parts using HTM(Hierarchical Temporal Memory)-based sound recognition. HTM is the theory that the operation principle of human brain's neocortex is applied to computer, suggested by Jeff Hopkins. This theory memorizes temporal and spatial patterns hierarchically about the real world, which is known for its cognitive power superior to the previous recognition technologies in many cases. By applying the HTM model to the sound recognition, we developed the identification system for the quality of molding parts. In order to verify its performance we recorded the various sounds at the moment of producing parts in the real factory, constructed the HTM network of sound, and then identified the quality of parts by repeating learning and training. It reveals that this system gets an excellent and accurate results at the noisy factory.