• Title/Summary/Keyword: 소리식별

Search Result 38, Processing Time 0.068 seconds

Abnormal Active Pig Detection System using Audio-visual Multimodal Information (Audio-visual 멀티모달 정보 기반의 비정상 활성 돼지 탐지 시스템)

  • Chae, Heechan;Lee, Junhee;Lee, Jonguk;Chung, Yonghwa;Park, Daihee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.661-664
    • /
    • 2022
  • 양돈을 관리하는 데에 있어 비정상 개체를 식별하고 사전에 추적하거나 격리할 수 있는 양돈업 시스템을 구축하는 것은 효율적인 돈사관리를 위한 필수 요소이다. 그러나 돈사내의 이상 상황을 탐지하는 연구는 보고되었지만, 이상 상황이 발생한 돼지를 특정하여 식별하는 연구는 찾아보기 힘들다. 따라서, 본 연구에서는 소리를 활용하여 이상 상황이 발생함을 탐지한 후 영상을 활용하여 소리를 낸 특정 돼지를 식별할 수 있는 시스템을 제안한다. 해당 시스템의 주요 알고리즘은 활성 화자 탐지 문제에서 착안하여 이를 돈사에 맞게 적용하여, 비정상 소리를 내는 활성 돼지를 식별 가능하도록 구현하였다. 제안한 방법론은 모의 실험을 통해 돈사 내의 이상 상황이 발생한 돼지를 식별할 수 있음을 확인하였다.

A Study on Elemental Technology Identification of Sound Data for Audio Forensics (오디오 포렌식을 위한 소리 데이터의 요소 기술 식별 연구)

  • Hyejin Ryu;Ah-hyun Park;Sungkyun Jung;Doowon Jeong
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.34 no.1
    • /
    • pp.115-127
    • /
    • 2024
  • The recent increase in digital audio media has greatly expanded the size and diversity of sound data, which has increased the importance of sound data analysis in the digital forensics process. However, the lack of standardized procedures and guidelines for sound data analysis has caused problems with the consistency and reliability of analysis results. The digital environment includes a wide variety of audio formats and recording conditions, but current audio forensic methodologies do not adequately reflect this diversity. Therefore, this study identifies Life-Cycle-based sound data elemental technologies and provides overall guidelines for sound data analysis so that effective analysis can be performed in all situations. Furthermore, the identified elemental technologies were analyzed for use in the development of digital forensic techniques for sound data. To demonstrate the effectiveness of the life-cycle-based sound data elemental technology identification system presented in this study, a case study on the process of developing an emergency retrieval technology based on sound data is presented. Through this case study, we confirmed that the elemental technologies identified based on the Life-Cycle in the process of developing digital forensic technology for sound data ensure the quality and consistency of data analysis and enable efficient sound data analysis.

Abnormal Detection of Railway Point-Machine Under Noise Conditions (잡음 환경에서 선로 전환기 이상 상황 탐지)

  • Choi, Yongju;Lee, Jonguk;Park, Daihee;Chung, Yongwha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.394-397
    • /
    • 2019
  • 센서 및 정보 통신 기술의 발전은 산업 현장에서 취득한 정보를 기반으로 다양한 연구를 수행할 수 있는 토대가 되었다. 본 연구에서는 철도의 진로 방향을 전환하는 선로 전환기 주변에 설치한 소리 센서에서 수집한 소리를 기반으로 선로 전환기의 이상 상황을 탐지하고자 한다. 이와 같은 소리 데이터 기반의 이상 상황 탐지 시스템을 실제 산업 현장에서 성공적으로 운용되기 위해서는 소리 취득 시 발생하는 다양한 잡음 환경에서도 이상 상황을 식별할 수 있는 강인함이 보장되어야 한다. 본 논문에서는 소리 음질을 향상시키기 위하여 SEGAN(Speech Enhancement Generative Adversarial Network)을 활용하며, CNN(Convolutional Neural Network)을 기반으로 선로 전환기의 이상 상황을 식별하는 시스템을 제안한다. 수집된 소리 데이터를 기반으로 제안한 시스템을 실험적으로 검증한 바 잡음에 강인한 성능을 확인하였다.

A Realization of Injurious moving picture filtering system with Gaussian Mixture Model and Frame-level Likelihood Estimation (Gaussian Mixture Model과 프레임 단위 유사도 추정을 이용한 유해동영상 필터링 시스템 구현)

  • Kim, Min-Joung;Jeong, Jong-Hyeog
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.2
    • /
    • pp.184-189
    • /
    • 2013
  • In this paper, we propose the injurious moving picture filtering system using certain sounds contained in the injurious moving picture to filter injurious moving picture which is distributed without limitation in internet and internet storage space. For this purpose, the Gaussian Mixture Model which can well represent the characteristics of the sound, is used and frame level likelihood estimation is used to calculate the likelihood between filtering target data and the sound models. Also, the pruning method which can real-time proceed by reducing the comparing number of data, is applied for real-time processing, and MWMR method which showed good performance from existing speaker identification, is applied for the distinguish performance of high precision. In the identification experiment result, in case of the frame rate which is the proportion of total frame to high likelihood frame, is set to 50%, identification error rate is 6.06%, and in case of frame rate is set to 60%, error rate is 3.03%. As the result, the proposed system can distinguish between general and injurious moving picture effectively.

Classification of Porcine Wasting Diseases using Deep Learning (딥러닝 기반의 돼지 호흡기 질병 식별)

  • Lee, Jonguk;Cho, Hyun Seok;Park, Daihee;Chung, Yongwha
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.735-737
    • /
    • 2017
  • 본 논문에서는 이유자돈의 건강에 심각한 문제를 발생시키고, 농가의 생산성을 급격하게 저하시키는 돼지 호흡기 질환을 효과적으로 식별하는 시스템을 제안한다. 제안된 시스템은 먼저, 돼지가 내는 소리에서 스펙트로그램 정보를 추출한다. 추출된 정보는 최근 각광을 받고 있는 딥러닝 기법 중 하나인 CNN에 적용되어, 효과적인 특징으로 변환된 후 돼지 호흡기 질환을 탐지 및 식별한다. 세종시에 위치한 돼지농장에서 취득한 실제 소리 데이터 셋을 이용하여 본 논문에서 제안하는 소리 센서 환경에서의 돼지 호흡기 질병 탐지 시스템의 성능을 실험적으로 검증한다.

Abnormal Sound Detection and Identification in Surveillance System (감시 시스템에서의 비정상 소리 탐지 및 식별)

  • Joo, Young-min;Lee, Eui-jong;Kim, Jeong-sik;Oh, Seung-geun;Park, Dai-hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.592-595
    • /
    • 2010
  • 본 논문에서는 감시카메라 환경에서 취득한 오디오 데이터를 입력으로 하여, 비정상 상황을 인식하는 시스템을 제안한다. 제안된 시스템은 단일클래스 SVM의 대표적인 모델인 SVDD와 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 신호 처리 분야의 SRC를 계층적으로 결합한 구조로써, 첫 번째 계층에서는 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 유형별로 세분화 식별하여 관리자에게 비상 상황을 보고함으로써 관리자의 위기 상황 대처를 돕는다. 제안된 시스템은 실시간 처리가 가능하며, 점증적 갱신의 학습 능력으로 인하여 비정상 오디오 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 실험을 통하여 제안된 시스템의 성능을 검증한다.

Development of Open Platform for collecting and classifying animal sounds (동물 소리 수집 및 분류를 위한 오픈 플랫폼 개발)

  • Jung, Seungwon;Kim, Chung-Il;Moon, Jihoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.839-841
    • /
    • 2018
  • 인공지능 기술을 활용하여 동물 소리를 분석하고 그 종을 구별하는 기술은 지역의 야생동물 현황 파악이나 생태계 조사 등에 효과적으로 사용될 수 있다. 인공지능 기술을 활용하기 위해서는 많은 동물 소리 샘플이 필요하지만, 현재 그러한 데이터는 녹음 환경이 고도화되어 있는 상용 DB나 전문가 DB 형태로 존재한다. 이러한 데이터만을 학습한 인공지능의 경우 실제 환경에서 녹음된 동물 소리를 식별하는 데 많은 어려움이 예상된다. 따라서 본 논문에서는 다양한 동물 소리를 수집하기 위해 동물 관련 전문가나 일반 사용자 모두 자유롭게 사용할 수 있는 동물 울음소리 수집과 분류를 위한 오픈 플랫폼을 제안한다. 플랫폼에 업로드된 소리 파일은 인공지능의 학습 데이터로 사용하며, 이 인공지능은 사용자에게 소리 파일을 분석한 결과로 해당 동물종과 그에 대한 다양한 생태정보를 제공하고 부가적으로 지역별 동물 통계 및 소리 파일에서의 소리 구간 추출, 소리 파일 공유 등 다양한 기능을 제공한다.

Analysis of Characteristics of Athmatic Cough Sound (천식 기침소리의 음향적 특정 분석)

  • Jo Cheol-Woo;Han Man-Yong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.177-180
    • /
    • 1999
  • 본 논문에서는 천식기침소리의 음향적 특성을 신호처리 방법을 이용하여 분석하고 통계처리한 결과를 보고한다. 정상인과 천식 환자의 기침소리 신호의 특징을 비교 분석함으로써 신호의 특징에 의해 자동식별할 수 있는 가능성을 제시하였다.

  • PDF

Noise-Robust Porcine Respiratory Diseases Classification Using Texture Analysis and CNN (질감 분석과 CNN을 이용한 잡음에 강인한 돼지 호흡기 질병 식별)

  • Choi, Yongju;Lee, Jonguk;Park, Daihee;Chung, Yongwha
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.3
    • /
    • pp.91-98
    • /
    • 2018
  • Automatic detection of pig wasting diseases is an important issue in the management of group-housed pigs. In particular, porcine respiratory diseases are one of the main causes of mortality among pigs and loss of productivity in intensive pig farming. In this paper, we propose a noise-robust system for the early detection and recognition of pig wasting diseases using sound data. In this method, first we convert one-dimensional sound signals to two-dimensional gray-level images by normalization, and extract texture images by means of dominant neighborhood structure technique. Lastly, the texture features are then used as inputs of convolutional neural networks as an early anomaly detector and a respiratory disease classifier. Our experimental results show that this new method can be used to detect pig wasting diseases both economically (low-cost sound sensor) and accurately (over 96% accuracy) even under noise-environmental conditions, either as a standalone solution or to complement known methods to obtain a more accurate solution.

Screaming data analysis for security system with audio capability (오디오 취득 기반의 방범용 시스템을 위한 비명 분석)

  • Lee, So-Min;Byun, Sung-Woo;Li, Shi-Cong;Kim, Kwang-Yong;Chung, Il-Gu;Lee, Seok-Pil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.85-87
    • /
    • 2013
  • 본 논문에서는 환경 잡음에서 사람들의 비명소리를 검출하여, 위험상황을 식별하는 방법용 시스템을 구축하기 위해 비명소리의 특징을 분석한다. 비명 소리는 놀랬을 때, 다급할 때, 아플 때, 세 가지 상황으로 나누어 녹음을 진행하였고, 이를 주파수 신호로 바꾸어 분석을 하였다. 비명소리 데이터에서 amplitude 가 가장 크게 나타나는 주파수 대역을 분석하고, 상황 별로 비명소리에 대한 주파수 분포의 차이, 남성과 여성의 주파수 대역과 분포의 차이를 분석한다.

  • PDF