• 제목/요약/키워드: 소리 결

검색결과 521건 처리시간 0.088초

소리정보와 DNN을 이용한 선로전환기의 비정상 상황 분류 (Anomaly Classification of Railway Point Machine Using Sound Information and DNN)

  • 노병준;이종욱;박대희;정용화;김희영;윤석한
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.611-614
    • /
    • 2016
  • 최근 철도 산업의 비중이 증가함에 따라 열차의 안정적인 주행이 그 어느 때보다 중요한 이슈로 부각되고있다. 특히, 열차의 진로 변경을 위한 핵심 요소인 선로전환기의 결함은 열차의 사고와 직결되는 장비 중 하나로써, 그 이상 여부를 사전에 인지하여 선로전환기의 안정성을 확보하기 위한 유지보수의 지능화 시스템이 필요하다. 본 논문에서는 선로전환기의 작동 시 발생하는 소리정보를 활용하여 선로전환기의 비정상 상황을 분류하는 시스템을 제안한다. 제안하는 시스템은 먼저, 선로전환기의 상황별 소리를 수집하고, 다양한 소리정보를 추출하여 특징 벡터를 생성한다. 다음으로, 딥러닝 모델 중 하나인 DNN(Deep Neural Network)을 이용하여 선로전환기의 비정상 상황을 분류한다. 실제 선로전환기의 전환 시 발생하는 소리 데이터를 기반으로 DNN의 파라미터에 따른 다양한 실험을 수행한 결과, 약 93.10%의 정확도를 갖는 안정적인 DNN 모델을 설계하였다.

다양한 소리 환경에서 UBM 기반의 비명 소리 검출 (Scream Sound Detection Based on Universal Background Model Under Various Sound Environments)

  • 정용주
    • 한국전자통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.485-492
    • /
    • 2017
  • GMM(: Gaussian Mixture Model)은 비명 소리를 검출하기 위해서 가장 많이 사용되는 기법의 하나이다. 기존의 GMM 방식에서는 전체 훈련데이터를 비명소리와 비-비명 소리로 나누고, 훈련과정을 통하여 각각의 GMM 모델을 생성하게 된다. 그러나 본 연구에서는 비명 소리 검출 과정이 화자인식과 매우 유사하다는 점에 착안하여 화자인식에서 매우 효과적으로 사용된 UBM(: Universal Background Model) 방식을 비명소리 검출에 적용할 것을 제안하였다. 제안된 UBM 방식을 통한 검출 실험 결과 기존의 GMM 방식에 비하여 더 나은 검출 성능을 보임을 인식 실험을 통하여 확인 할 수 있었다.

Deep Neural Network를 이용한 산란계의 고온 스트레스 탐지 (A Heat Stress Detection on Laying Hens Using Deep Neural Network)

  • 노병준;최장민;이종욱;박대희;정용화;장홍희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.776-778
    • /
    • 2015
  • 논문에서는 DNN(Deep Neural Network)의 dropout 기법을 이용하여 산란계가 고온 스트레스를 받고 있는지 여부를 닭의 울음소리 정보를 통해 탐지하는 방법을 제안한다. 실험에서는 $21^{\circ}C$ 정상 온도에서 100개의 소리 데이터, $35^{\circ}C$ 고온에서 200개의 소리 데이터를 사용한다. 먼저, DNN의 학습을 위해서 취득한 울음소리에서 54개의 소리 특징 정보를 추출한다. 둘째, CFS(Correlation Feature Selection)을 이용하여, 추출된 특징 중 온도 구분을 위한 중요한 특정 10개를 선택한다. 셋째, 선택된 소리특징을 DNN에 적용하여 온도 환경을 구분하는 시스템이다. DNN의 과적합(over-fitting) 영향을 감소시키고, 성능 향상을 위하여 dropout 비율을 조정하여 실험을 진행하였다. 본 연구에서는 실제 계사에서 수집된 소리 정보를 이용하여 모의실험을 수행한 결과 매우 우수한 성능을 보임을 확인하였다.

HTM 기반의 소리 연식을 이용한 부품의 양.불량 판별 시스템 (A Quality Identification System for Molding Parts Using HTM-Based Sound Recognition)

  • 배선갑;한창영;서대호;김성진;배종민;강현석
    • 한국멀티미디어학회논문지
    • /
    • 제13권10호
    • /
    • pp.1494-1505
    • /
    • 2010
  • 하나의 프레스로 여러 종류의 부품을 소량으로 생산하는 중 소형 공장에서는 부품 생산 과정에 발생하는 소리가 다양하게 나타난다. 이에 우리는 제품의 생산 순간의 소리를 인식하여 제품의 양 불량을 판별하는 시스템을 계층형 시간적 메모리(HTM Hierarchical Temporal Memory) 기술을 이용하여 개발하였다. HTM 이론은 인간 두뇌의 신피질(neocortex)의 동작 원리를 컴퓨터에 접목시킨 이론이다. 이는 실세계에 대한 시공간적인 패턴을 계층적으로 기억하는 것으로 기존의 인식 기술보다 여러 경우에 인식률이 뛰어난 것으로 알려져 있다. 우리는 이 HTM 기술을 소리 인식에 적용하여 부품에 대한 양 불량 판별 시스템을 개발하였다. 개발 결과를 검증하기 위해 실제 공장에서 부품 생산 순간의 다양한 소리들을 녹음하고, 소리 HTM 네트워크를 구성한 후, 학습과 훈련을 반복하여 해당 부품의 불량여부를 판정하도록 하였다. 그 결과 잡음이 많은 생산 현장에서도 판정의 정확도가 높은 것으로 확인하였다.

임신돈의 분만시기 예측을 위한 음성 분석 시스템 개발 (Development of a sow voice analysis system for forecasting parturition time)

  • 장동일;임정택
    • 농업과학연구
    • /
    • 제27권2호
    • /
    • pp.107-116
    • /
    • 2000
  • 신호 분석용 컴퓨터와 음성을 획득하기 위한 고성능 마이크로폰, 획득된 음성에서 노이즈 제거 및 음성 신호 증폭을 위한 증폭기 그리고 음성 신호를 저장하기 위한 데이터 레코더와 신호 분석용 오실로스코프로 이루어진 음성 분석 시스템을 개발하여 임신돈의 분만시기 예측한 결과는 다음과 같다. 1. 임신돈은 분만일에 가까워지면서 소리지르는 회수가 증가하고, 눕는 위치를 바꾸는 행동을 빈번하게 함으로써 이러한 행동시 발생되는 소리의 회수가 증가하는 것을 관찰할 수 있다. 따라서 임신돈의 분만 예측을 위해 이러한 소리의 발생회수와 시간을 기록 분석하도록 알고리즘을 개발하였고, Labwindows/CVI로 Software를 개발하였다. 2. 임신돈의 음성 특성은 오실로스코프와 상용 프로그램(Sound Forge)을 사용하여 분석하였으며, 그 결과 임신돈의 순수 음성은 30~2,500Hz 사이의 진동수와 -35~-75dB의 크기로 나타났다. 3. 임신돈의 분만 예측을 위해 분만시간과 음성 및 발생 소리의 출현회수의 상관관계를 분석하였으며, 그 결과 분만 예정일로부터 3일 동안 발생된 소리의 출현 횟수는 8일 동안 발생된 총 소리의 출현 합계의 85%에 해당되었고, 분만 예정 8시간 동안 발생된 소리의 출현 횟수는 46%에 해당되었다. 4. 음성 및 소리의 출현 회수에 의한 분만 예측의 성공률은 분만 1일전임을 예측하는 것에 목표를 두고 이루어졌으며, 그 결과 공시 돼지 모두 분만일에 가까워지면서 계속적인 자리바꿈 행동에 의해 소리 출현 횟수가 증가하여 분만 1일전과 6시간전임을 예측시 모두 100% 성공률을 보였다.

  • PDF

비대칭 FM합성방식을 이용한 피리 소리의 합성 (Sound Synthesis of Piri by Asymmetric Frequency Modulation)

  • 변중배;조상진;정의필
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.37-40
    • /
    • 2006
  • FM(Frequency Modulation) 음 합성방식은 오랫동안 연구되어 왔고 여러 가지 효과를 주기에 유용하고 비교적 낮은 사양으로 높은 수준의 배음을 합성할 수 있지만 그 응용분야가 대부분이 서양악기 위주의 연구였다. 이에 본 논문에서는 국악 관악기인 피리를 주파수 영역에서 저주파 영역과 고주파 영역으로 나누어 분석하고 이 결과를 이용하여 FM 파라미터를 추출하고 비대칭 FM합성방식으로 1차적인 소리를 합성하였다. 분석된 저주파 영역과 고주파 영역의 특성을 각각의 역 필터링을 위한 2개의 필터를 설계하여 이를 다시 합성된 소리를 통과시켜 두 소리를 합산함으로써 더욱 원음과 유사한 소리를 합성할 수 있었다.

  • PDF

반려묘 울음소리를 이용한 감정 분류 시스템 (Cat Emotion Classification System using Cat Meowing)

  • 채희찬;이종욱;최윤아;박대희;정용화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.666-668
    • /
    • 2018
  • 최근 반려동물을 키우는 가구 수의 증가와 함께, 반려묘에 대한 관심도 상당히 증가하고 있다. 특히 반려인은 반려묘와의 원활한 의사소통과 교감을 바라지만 반려묘의 세세한 감정 상태를 24시간 내내 파악하는 것은 어려운 일이다. 본 논문에서는 반려묘의 울음소리에 많은 감정 및 상태 정보가 담겨있는 것에 착안하여, 반려묘의 울음소리를 기반으로 감정을 분류하는 시스템을 제안한다. 제안된 시스템은 먼저, 이미 수집된 소리 데이터를 데이터 증폭 방법론을 이용하여 데이터를 확장 한 후, 해당 소리들의 멜 스펙트로그램 정보를 추출한다. 이를 시계열 정보 처리에 효과적인 LSTM에 적용하여 반려묘의 감정 상황을 식별할 수 있도록 학습을 수행한다. 실험 결과, 반려묘의 감정 상태 분류의 가능성을 확인하였다.

소리 데이터 분류에 대한 데이터 증대 방법 연구 (A study on data augmentation methods for sound data classification)

  • 장일식;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1308-1310
    • /
    • 2022
  • 소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.

  • PDF

ResNet 모델을 이용한 일상생활 소리 예측 및 알림 애플리케이션 (ResNet Model Based Real Life Sound Event Prediction and Notification Application)

  • 박유진;정은이;신지혜;박태정;양회석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1004-1007
    • /
    • 2020
  • 본 논문에서는 청각 장애인이 가정에서 듣지 못해 발생하는 낭비와 위험을 미리 예방하기 위하여 가정에서 현재 발생하고 있는 소리를 알려주는 시스템을 구현하였다. 무지향성 마이크로 일상 소리 감지 후 음향 데이터에서 Mel-Spectogram 특징 벡터를 추출하여 Convolutional Neural Network(CNN) 모델의 Resnet 알고리즘을 진행한다. 서버에서 소리에 대한 분석을 진행한 후 그 결과를 안드로이드에서 실시간으로 5 초마다 확인하여 사용자에게 알림 서비스를 제공한다. 이를 통해 낭비를 줄이고 위험에 대처할 수 있게 한다. 청각 장애인의 소리에 대한 접근성을 다양한 측면으로 고려해야 한다는 사회적 인식을 확산시키고자 한다.

북한 어업노동요의 음악적 특징 (A Study on the Musical Characteristics of Fishing songs in North Korea)

  • 김정희
    • 공연문화연구
    • /
    • 제39호
    • /
    • pp.279-323
    • /
    • 2019
  • 『북녘 땅 우리소리』에 수록된 북한 어로요의 음악적 특징에 대해 고찰한 결과는 다음과 같다. 북한 어로요 중 <노젓는소리>, <그물당기는소리>, <고기푸는소리>는 조기잡이와 명태잡이에 모두 보이며, <닻내리는소리>와 <만선풍장소리>는 조기잡이에서, <닻올리는소리>와 <고기벗기는소리>, <만선노젓는소리>, <명태거는소리>는 명태잡이에서 보인다. 그 외 <돛다는소리>, <조개잡는소리> 등이 보인다. 리듬요소 중 빠르기에서 <돛다는소리>는 보통빠르기이며, 멸치나 청어잡이의 <고기푸는소리>는 상당히 느리다. <노젓는소리>(조기)는 빠르기가 다양하며, 모두 보통빠르기 이상이고, 대체로 뒤로 갈수록 빨라진다. 그 외의 곡들은 모두 빠른 편이다. 박자구조는 4/♩.가 가장 많고, 간혹 2, 3, 5박자도 보이며, 각각 4박으로 구성된 받는소리와 메기는소리가 맞물려서 2박이 겹치는 6박 주기의 리듬을 쓰거나 불규칙박자를 쓰는 경우도 있다. 음조직은 메나리조가 가장 많고, 그 외 수심가조, 창부타령조, 난봉가조, 오돌또기조 등이 있으며, 음고가 뚜렷치 않은 구령조도 있다. 메나리조의 곡에서 창부타령조의 전조나 변이가 관찰되었다. 갈래별로 특정 음조직을 선호하는 경향이 있다. 형식에서는 메기고받는형식이 압도적이나, 선후창보다 독창으로 부른 경우가 더 많다. 선후창 다수에서 메기는소리와 받는소리가 부분적으로 겹치는 양상을 보인다. 통절형식은 교창이나 독창으로 불렀으며, 독창으로 부른 경우도 작업의 특성을 고려하면 원래는 교창이나 제창으로 불렀을 것으로 추측된다. 함북 선봉군과 강원도 양양군의 <고기푸는소리>, 평남 증산군의 <만선풍장소리-봉죽타령>과 충남 태안군의 <만선풍장소리-배치기소리>, 남포시와 경기도 강화군의 <노젓는소리>는 닮은꼴의 어로요이다. 인접 지역의 경우 갈래가 달라도 선율을 공유하는 경우가 있으며, 특정 갈래에서는 상당히 먼 거리까지 선율을 공유한다. 멸치 청어 양미리잡이에서 <고기푸는소리>가 동해안 일대에서 널리 공유되고 있다는 점이 최초로 확인되었다.