• 제목/요약/키워드: Sound classification

검색결과 300건 처리시간 0.025초

LCD 라인의 음향 특성신호에 웨이브렛 변환과 인경신경망회로를 적용한 공정로봇의 건정성 감시 연구 (Condition Monitoring of an LCD Glass Transfer Robot Based on Wavelet Packet Transform and Artificial Neural Network for Abnormal Sound)

  • 김의열;이상권;장지욱
    • 대한기계학회논문집A
    • /
    • 제36권7호
    • /
    • pp.813-822
    • /
    • 2012
  • LCD 생산라인의 공정 로봇에서 방사되는 비정상 작동 소음은 로봇의 결함 탐지에 사용된다. 이 신호의 장점은 상대적으로 낮은 민감도에 비해 단지 마이크로폰을 이용하여 다수의 결함을 확인할 수 있는 것이다. 결함요소 추출을 위한 웨이브렛 변환(WPT)과 불량의 분류를 위한 인공신경망 회로(ANN)이 본 논문에서 사용되었다. 결과적으로, 비정상 작동 소음이 기계요소의 결함 진단에 효율적으로 사용될 수 있다.

한방 복합 치료 및 소리 재활 치료로 호전된 노인성 난청 치험 1례 (Therapeutic Effects of Korean Medical Treatment Combined with Threshold Sound Conditioning on Presbycusis: A Case Report)

  • 제하경;민예은;오연주;강준혁
    • 한방안이비인후피부과학회지
    • /
    • 제34권3호
    • /
    • pp.102-111
    • /
    • 2021
  • Objectives : The purpose of this study is to report the case of a presbycusis patient whose hearing had improved. Methods : A 81-year-old male diagnosed with presbycusis were treated with Korean medical interventions (acupuncture combined with electromagnetic stimulation and pharmacoacupuncture) and Threshold sound conditioning(TSC) for 3 months. Pure tone audiometry(PTA) was performed for the evaluation. Results : The patient's hearing was improved from moderate to mild level according to the Classification of Hearing Loss(International Organization for Standardization, 1969). The average hearing were improved from 40.5 dB to 32.7dB on the left side, 46.9dB to 34.1dB on the right side. Conclusions : We observed an improvement in a presbycusis patient's hearing and hereby suggest the possibility of Korean medical treatment and TSC's ameliorating effect on sensorineural hearing loss as well as prebyscusis.

대두의 광학적 선별장치 개발을 위한 선별 인자 구명 (Identification of Discrimination Factors for Development of Optical Soybean Sorter)

  • 노상하;김현룡;황인근
    • Journal of Biosystems Engineering
    • /
    • 제23권4호
    • /
    • pp.343-350
    • /
    • 1998
  • Spectroscopic analysis of soybean kernels were made in the wavelength range of 400 to 1100 nm to find effective discrimination factors which are required for developing an opitical soybean sorter. Soybean samples used for the test were the sound and five classes of the defective kernels such as the immature, discolored(brown and violet), damaged by insect and diseased. Effective discrimination factors to classify the soybean kernels into the sound and the defective were found to be $R_{640}$, $R_{580}$/ $R_{990}$, $R_{600}$- $R_{820}$ and ( $R_{590}$- $R_{820}$)/ $R_{990}$. with classification error of less than 4%. Mahalanobis distance was used as a criterion to select significant wavelengths involved in the discrimination factors.s.

  • PDF

Neuro-Fuzzy Classification System of The New and Used Bills

  • Kang, Dong-Shik;Miyagi, Hayao;Omatu, Sigeru
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.818-821
    • /
    • 2002
  • In this paper, we propose Neuro-Fuzzy discrimination method of the new and old bill using bill money acoustic data. The concept of the histogram is introduced to improve the processing time into the proposal system. The adaptative filter is used in order to remove the motor sound from an observed bill money acoustic data. The output signal of this adaptive digital filter is converted into not only a spectrum but also a histogram. It became easy that features of the paper money sound were extracted from the bill money acoustic data. The spectral data and the histogram is obtained like this, and it become an input pattern of the neural network(NN). Then, the discrimination result of the NN is finally judged by the fuzzy inferece in the new bill or the exhaustion bill.

  • PDF

5음의 분석과 분류 (A study on the 5-Tone Analysis and Classification)

  • 조병서;이용동;;허웅;박영배
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(5)
    • /
    • pp.219-222
    • /
    • 2001
  • The human speech sounds are use to diagnosis in oriental medicine with ‘0-sung’theory. In general, human voice are sound waves which generated by phonation. Two major parts of phonation are vocal cords and vocal tract. The uniqueness of individual vocal sound depend on structure and usage of their vocal cords and tract. In the oriental medicine, “0-sung (5-tones)” has been used to classify constitution of human body In order to characterize the “0-sung”, their frequency characteristics are investigated, and a principal frequency component is extracted. Then, the principal component is applied to classify sounds into “0-sung.”

  • PDF

노랫말에 나타난 한국인의 음풍경 인식 조사 연구 (Study on Korean's recognition of soundscape reflected on the songs)

  • 신훈;국찬;장길수
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 추계학술대회논문집
    • /
    • pp.802-805
    • /
    • 2004
  • It is requures to understand the meaning of sound and cultural background of target spaces for soundscape design. The purpose of this study is to derive the general soundscape preserved in the mind of Korean people. Four kinds of traditional Korean songs, that is to say, Sijo (Korean verse), folk-song, Pansori (song for drama by Chang reciter), and popular songs, were used as tools of research subjects. That is because the sounds expressed in literature are very useful subjects for soundscape survey. Paragraphs containing description of sounds were selected from the lyrics of the songs. Then 11 sound categories were named, and 13 meaning categories were classified according to referential and emotional aspects, respectively.

  • PDF

소리 데이터 분류에 대한 데이터 증대 방법 연구 (A study on data augmentation methods for sound data classification)

  • 장일식;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1308-1310
    • /
    • 2022
  • 소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.

  • PDF

효과음 자막 생성을 위한 딥러닝 기반의 다중 사운드 분류 (A Multiclass Sound Classification Model based on Deep Learning for Subtitles Production of Sound Effect)

  • 정현영;김규미;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.397-400
    • /
    • 2020
  • 본 논문은 영화에 나오는 효과음을 자막으로 생성해주는 자동자막생성을 제안하며, 그의 첫 단계로써 다중 사운드 분류 모델을 제안하였다. 고양이, 강아지, 사람의 음성을 분류하기 위해 사운드 데이터의 특정벡터를 추출한 뒤, 4가지의 기계학습에 적용한 결과 최적모델로 딥러닝이 선정되었다. 전처리 과정 중 주성분 분석의 유무에 따라 정확도는 81.3%와 33.3%로 확연한 차이가 있었으며, 이는 복잡한 특징을 가지는 사운드를 분류하는데 있어 주성분 분석과 넓고 깊은 형태의 신경망이 보다 개선된 분류성과를 가져온 것으로 생각된다.

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

Music Similarity Search Based on Music Emotion Classification

  • Kim, Hyoung-Gook;Kim, Jang-Heon
    • The Journal of the Acoustical Society of Korea
    • /
    • 제26권3E호
    • /
    • pp.69-73
    • /
    • 2007
  • This paper presents an efficient algorithm to retrieve similar music files from a large archive of digital music database. Users are able to navigate and discover new music files which sound similar to a given query music file by searching for the archive. Since most of the methods for finding similar music files from a large database requires on computing the distance between a given query music file and every music file in the database, they are very time-consuming procedures. By measuring the acoustic distance between the pre-classified music files with the same type of emotion, the proposed method significantly speeds up the search process and increases the precision in comparison with the brute-force method.