• Title/Summary/Keyword: Sound classification

검색결과 298건 처리시간 0.024초

스마트 베개를 위한 효율적인 스펙트럼 특징과 SVM을 이용한 코골이 판별 방법 (Snoring Sound Classification using Efficient Spectral Features and SVM for Smart Pillow)

  • 김병만;문창배
    • 한국산업정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.11-18
    • /
    • 2018
  • 코골이가 심한경우 무호흡증(OSA : Obstructive Sleep Apnea)으로 연결되어 생명을 위협하는 경우도 발생할 수 있고, 코골이로 인하여 주변인과의 관계가 심각해지는 경우도 발생할 수 있다. 이런 코골이 문제를 해결하기 위해 최근 여러 형태의 스마트 베개들을 출시하고 있는데, 핵심 기술은 코골이 판별 기술, 즉 입력 사운드에 코골이 소리가 포함되어 있는지를 판별하는 기술이다. 본 논문에서는 스마트 베개에 적용하기 위한 코골이 판별 방법을 제안하였는데, 입력 신호로부터 코골이 소리의 특징을 추출 후 SVM을 이용하여 코골이를 판별하는 방법을 사용하였다. 제안한 방법의 성능을 측정하기 위해 기존 방법과 비교 실험을 실시하였고, 실험결과 기존방법 코골이 판별성능보다 약 6% 좋은 판별성능을 보였다.

성문(聲紋)과 사상체질(四象體質)과의 상관성(相關性)에 관(關)한 연구(硏究) (A Study on the Correlation between Sound Spectrogram and Sasang Constitution)

  • 양승현;김달래
    • 사상체질의학회지
    • /
    • 제8권2호
    • /
    • pp.191-202
    • /
    • 1996
  • 사상의학(四象醫學)에 있어서 체질변증(體質辨證)은 매우 중요한 과제로서 많은 의가(醫家)들에 의해 연구되고 있으나 지금까지 객관적으로 인정된 방법은 없다고 하겠다. 본 연구는 성문(聲紋)과의 상관성(相關性)을 통하여 사상체질(四象體質) 변증(辨證)에 도움이 되고자 하였다. 태음인(太陰人) 26명, 소음인(少陰人) 25명, 소양인(少陽人) 15명의 음성(音聲)울 녹음하여 시간 측정을 하였고, 성문분석기로 음성의 기본주파수(基木周波數)를 분석하여 비교하였으며 결과는 다음과 같다. 1. 태음인, 소음인, 소양인의 측정된 문장 발음 속도는 유사한 경향을 보였다. 2. 기본주파수 빈도분포그래프와 정규분포 그래프에서 태음인의 중심값이 소음인과 소양인에 비해 낮게 나타났으며, 소음인과 소양인 사이의 중심값은 유사한 경향을 보였다. 3. 기본주파수 빈도분포 그래프와 정규분포 그래프에서 폭의 경우는 체질 간에 유사한 경향을 보였다. 4. 세 체질의 기본주파수 평균값의 경우 태음인은 소음인에 비해 낮게 나타나서 태음인과 소음인은 통계학적으로 유의적인 차이점이 인정되었으며, 이는 태음인의 저음 사용이 소음인에 비하여 많음을 의미 한다고 볼 수 있다. 따라서 성문의 기본주파수 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다. 제언 및 문제점 1. 문장뿐만 아니라 실제 대화음성의 분석이 필요할 것으로 생각된다. 2. 좀 더 많은 자료의 수집 분석이 필요하며, 남성뿐만 아니라 여성과 연령별로의 분석도 연구되어야 한다고 생각된다. 3. 녹음시의 여러 변수, 예를 들연 녹음시의 잡음, 조사대상자의 긴장, 또는 감기나 기타 질병으로 인한 음성변화 등에 대한 문제점도 주의해야 할 것으로 생각된다. 4. 기본주파수이외의 다른 변수, 예를 들어 공명주파수나 음의 강도등을 이용한 체질과의 상관성에 관한 연구가 필요하다고 생각된다.

  • PDF

배경음 및 잡음에 강인한 위험 소리 탐지에 관한 연구 (A Study on Hazardous Sound Detection Robust to Background Sound and Noise)

  • 하태민;강상훈;조성원
    • 한국멀티미디어학회논문지
    • /
    • 제24권12호
    • /
    • pp.1606-1613
    • /
    • 2021
  • Recently various attempts to control hardware through integration of sensors and artificial intelligence have been made. This paper proposes a smart hazardous sound detection at home. Previous sound recognition methods have problems due to the processing of background sounds and the low recognition accuracy of high-frequency sounds. To get around these problems, a new MFCC(Mel-Frequency Cepstral Coefficient) algorithm using Wiener filter, modified filterbank is proposed. Experiments for comparing the performance of the proposed method and the original MFCC were conducted. For the classification of feature vectors extracted using the proposed MFCC, DNN(Deep Neural Network) was used. Experimental results showed the superiority of the modified MFCC in comparison to the conventional MFCC in terms of 1% higher training accuracy and 6.6% higher recognition rate.

Harmonic Line Association 기반 특징벡터 추출에 의한 드론 음향 식별 및 분류 (Drone Sound Identification and Classification by Harmonic Line Association Based Feature Vector Extraction)

  • 정형찬;임원호;하유경;장경희
    • 한국항행학회논문지
    • /
    • 제20권6호
    • /
    • pp.604-611
    • /
    • 2016
  • UAV (unmanned aerial vehicles)을 지칭하는 드론 관련 산업은 기존의 원격조종 무선모형 항공기 수준에서 벗어나 급속도로 발전하고 있으며, 현재는 자동화와 클라우드 네트워크 기술을 접목시키면서 새로운 산업으로 성장해가는 상황이다. 최근 무인 항공기의 능력은 폭발물 및 기타 위험 물질 운반 등 공공 안전에 대한 심각한 위협을 가져올 수 있으며, 불법 드론에 의한 이러한 위험을 감소시키기 위해, 음향 특징 추출 및 분류 기술에 의하여 이들 불법 드론을 탐지할 필요가 있다. 본 논문에서는 고조파 특징 추출 방법(HLA)에 의한 음향 특징벡터 추출 방법을 소개한다. HLA에 기초한 특징 벡터 추출 방법은 음향 데이터의 보다 특징적인 특성을 추출하여 무인 항공기 음향을 식별할 수 있게 한다. 실외 환경에 존재하는 음향의 식별성능을 평가하기 위해 여러 사물 및 실제 드론의 음향을 비교 분석 하였으며, 각 음원에 대한 시뮬레이션으로 드론 및 기타의 음향을 분류하였다.

CNN을 이용한 음성 데이터 성별 및 연령 분류 기술 연구 (A Study on the Gender and Age Classification of Speech Data Using CNN)

  • 박대서;방준일;김화종;고영준
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.11-21
    • /
    • 2018
  • 본 논문에서는 사람을 대신하여 분류, 예측 하는 딥러닝 기술을 활용하여 목소리를 통해 남녀노소를 분류하는 연구를 수행한다. 연구과정은 기존 신경망 기반의 사운드 분류 연구를 살펴보고 목소리 분류를 위한 개선된 신경망을 제안한다. 기존 연구에서는 도시 데이터를 이용해 사운드를 분류하는 연구를 진행하였으나, 얕은 신경망으로 인한 성능 저하가 나타났으며 다른 소리 데이터에 대해서도 좋은 성능을 보이지 못했다. 이에 본 논문에서는 목소리 데이터를 전처리하여 특징값을 추출한 뒤 추출된 특징값을 기존 사운드 분류 신경망과 제안하는 신경망에 입력하여 목소리를 분류하고 두 신경망의 분류 성능을 비교 평가한다. 본 논문의 신경망은 망을 더 깊고 넓게 구성함으로써 보다 개선된 딥러닝 학습이 이루어지도록 하였다. 성능 결과로는 기존 연구와 본 연구의 신경망에서 각각 84.8%, 91.4%로 제안하는 신경망에서 약 6% 더 높은 정확도를 보였다.

기관 호흡음 검출 시스템을 이용한 정상인과 폐기능 질환자의 분류 (Classification of Normal Subjects and Pulmonary Function Disease Patients using Tracheal Respiratory Sound Detection System)

  • 임재중;이영주;전영주
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제49권4호
    • /
    • pp.220-224
    • /
    • 2000
  • A new auscultation system for the detection of breath sound form trachea was developed in house. Small size microphone(panasonic pin microphone) was encapsuled in a housing for resonant effect, and hardware for the sound detection was fabricated. Pulmonary function test results were compared with the parameters extracted from frequency spectrum of breath sound obtained from the developed system. Results showed that the peak frequency and relative ratio of integral values between low(80∼400Hz) and high(400∼800Hz) frequency ranges revealed the significant differences. Developed system could be used for distinguishing normal subject and the patients who have pulmonary disease.

  • PDF

능동형 음장조정시스템의 현장적용 평가 (Evaluation on the Field Application of Spontaneous Acoustic Field Reproduction System)

  • 전지현;신용규;강상우;민병철;국찬
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 추계학술대회논문집
    • /
    • pp.616-621
    • /
    • 2006
  • A began of this study is to verify Spontaneous Acoustic Field Reproduction System(SAFRS), developed as an embodiment of creating agreeable sound environment, with evaluation on the field application. SAFRS is a system to sense changes of surroundings and produce sounds, which can go well with environment elements sensed by the system in to the space. The sound which can go well with environment elements is sound which judged by individual evaluation to be so, the classification of the preferred sounds according to the mood of the space was suggested in the former study. So, SAFRS was applied into the Square of D University to evaluate effectiveness of the system. The executed evaluations were 1) evaluation on sounds perception, frequency, volume and matchability with the space, 2) image evaluation on the square and sound environment and 3) evaluation on sound environment with existing sounds, fountains sound, sound produced by SAFRS, and both fountains sound and sound produced by SAFRS. Verifying SAPRS of field application was deduced from those evaluations. Theresultsofthestudyarefollowing: Though the system was applied into the space, the volume of the sounds shouldn't be too high. And with visual surroundings, the effectiveness of the system would be increased. At the results of four evaluations, the result of day evaluation is; both fountains sound and sound produced by SAFRS>fountains sound>sound produced by SAFRS>existing sounds, the result of night evaluation is; sound produced by SAFRS>both fountains sound and sound produced by SAFRS>fountains sound>existing sounds and these results pointed out that sounds environment produced by the system was highly evaluated due to less background sounds.

  • PDF

지역기반 음악사조로서의 '홍대 사운드' : 미8군 사운드와 런던 펑크와의 비교를 중심으로 ('Hongdae Sound' as a Historic Musical Trend Based on Regional Classification: through Comparative Analysis with 'US 8th Army Sound' and 'London Punk')

  • 김민오
    • 트랜스-
    • /
    • 제8권
    • /
    • pp.1-28
    • /
    • 2020
  • 본 연구는 지역기반 음악사조로서 '홍대 사운드'의 정체성을 '미8군 사운드'와 영국 '런던 펑크'와의 비교분석을 통해 고찰해본다. 홍대음악은 90년대 클럽을 중심으로 활동하던 밴드들이 연주하던, 주류의 음악과는 장르적·산업적으로 다른 비주류적 감성의 음악을 통칭한다. 하지만 '인디'라는 산업적인 관점에서의 정체성이 음악사조로서의 홍대음악에 대한 학술적 접근을 어렵게 만드는 것도 사실이다. 그러므로 서구의 다른 음악사조와 마찬가지로 지역기반의 음악사조로서 홍대 사운드의 정체성을 명확하게 재정립하는 것이 필요하다. '미8군 사운드'는 50년대 미군의 한국 주둔 이후 자연스럽게 형성된 미8군부대 내 공연무대에서 연주되던 음악적 경향을 통칭한다. 미군 커뮤니티의 위문공연을 위해 오디션 시스템을 통해 선발된 국내 뮤지션들은 그들의 입맛에 맞는 서양의 최신 대중음악을 자연스럽게 익혔고, 이는 한국대중문화에 빠르게 전파되어갔다. 미8군 사운드의 산업시스템은 오늘날 '케이팝'과 매우 흡사하지만, 새롭게 등장한 록 장르를 수용하여 새로운 음악경향을 주도했다는 점에서 홍대 사운드와 유사한 면을 발견할 수 있다. 런던 펑크는 70년대 중반 영국 젊은이들의 사회적 불만과 저항정신을 담은 록 장르로, 기본에 충실한 음악적 구성과 인디의 DIY정신을 내세운 대안적 음악이었다. 홍대 사운드는 산업구조나 음악 스타일, 정신적인 면에서 런던 펑크의 많은 부분을 계승하였다. 하지만 시류의 변화에 영합하여 주류로 편입된 런던펑크와 달리 홍대 사운드는 끊임없는 변화를 모색하면서도 인디의 기본정신과 진정성을 포기하지 않으며 음악사적으로 유래를 찾기 힘든 지속성을 유지하고 있다.

  • PDF

A study on Visual Expression to express Sound Characteristics of Public Places

  • Park, Dong-Cheol
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권4호
    • /
    • pp.11-21
    • /
    • 2021
  • The causes of noise generation according to the classification of indoor spaces are very diverse. Individual happiness is infringed by this noise. In this paper, We tried to visualize the spatial sound characteristics of public places using sound color to express them so that anyone can sympathize. The noise inside a conference room of a medical device company was measured for 100 minutes, and the frequency band was divided into three different types of existing sound pressure expression units. Because the size of the noise is expressed differently depending on the situation, There are cases where there is a difference of opinion between the measurer and the researcher. This noise measurement experiment was conducted, and the sound color was applied to classify it on a log scale considering auditory characteristics. As a result of comparing this with the result expression for different loudness expression units, A specific table in different units yielded almost similar results. In addition, the sound source section for 100 minutes was divided into three analysis sections, the analysis sections were different, and the size of the energy ratio for each analysis section was divided in the form of an envelope. The characteristics of the low-frequency region of the space have a high energy ratio, and the decrease in the energy ratio according to the increase in frequency is constant and regular. You can see that conversations are possible.

음향 이벤트 검출을 위한 DenseNet-Recurrent Neural Network 학습 방법에 관한 연구 (A study on training DenseNet-Recurrent Neural Network for sound event detection)

  • 차현진;박상욱
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.395-401
    • /
    • 2023
  • 음향 이벤트 검출(Sound Event Detection, SED)은 음향 신호에서 관심 있는 음향의 종류와 발생 구간을 검출하는 기술로, 음향 감시 시스템 및 모니터링 시스템 등 다양한 분야에서 활용되고 있다. 최근 음향 신호 분석에 관한 국제 경연 대회(Detection and Classification of Acoustic Scenes and Events, DCASE) Task 4를 통해 다양한 방법이 소개되고 있다. 본 연구는 다양한 영역에서 성능 향상을 이끌고 있는 Dense Convolutional Networks(DenseNet)을 음향 이벤트 검출에 적용하기 위해 설계 변수에 따른 성능 변화를 비교 및 분석한다. 실험에서는 DenseNet with Bottleneck and Compression(DenseNet-BC)와 순환신경망(Recurrent Neural Network, RNN)의 한 종류인 양방향 게이트 순환 유닛(Bidirectional Gated Recurrent Unit, Bi-GRU)을 결합한 DenseRNN 모델을 설계하고, 평균 교사 모델(Mean Teacher Model)을 통해 모델을 학습한다. DCASE task4의 성능 평가 기준에 따라 이벤트 기반 f-score를 바탕으로 설계 변수에 따른 DenseRNN의 성능 변화를 분석한다. 실험 결과에서 DenseRNN의 복잡도가 높을수록 성능이 향상되지만 일정 수준에 도달하면 유사한 성능을 보임을 확인할 수 있다. 또한, 학습과정에서 중도탈락을 적용하지 않는 경우, 모델이 효과적으로 학습됨을 확인할 수 있다.