• Title/Summary/Keyword: 사운드 분류

Search Result 60, Processing Time 0.026 seconds

Adult Contents Filtering using Speech Information (음성 정보를 이용한 성인 컨텐츠 필터링)

  • Cho, Jung-Ik;Jo, Jin-Su;Lee, Yill-Byung
    • Annual Conference of KIPS
    • /
    • 2008.05a
    • /
    • pp.145-147
    • /
    • 2008
  • 현재까지 유해한 컨텐츠(Contents)를 차단하기 위한 활발한 연구가 있었으나, 사람의 음성(speech)정보를 이용한 필터링(filtering) 기법에 대한 연구는 활발히 이루어지지 않은 측면이 있다. 본 논문은 동영상 데이터를 가지고 있는 여러 데이터 중에서 음성 정보의 분석을 통하여 일반 컨텐츠와 성인 컨텐츠를 분류하기 위함이다. 본 논문은 음성 정보 중에서 음성 정보의 특징을 가장 잘 다루는 피치 검출을 통한 정보의 분석을 통한 성인 컨텐츠의 필터링에 그 목적이 있다. 현재까지 진행되고 있는 필터링(filtering)방법에 대한 수행 결과보다 개선된 성능을 보이고자 한다. 즉, 음성 정보의 특징 정보를 이용한 성인 컨텐츠(Adult Contents)분류 기법을 활용하는 것으로 성인 컨텐츠(Adult Contents)에서 두드러지는 특징을 보이는 사운드 패턴을 분석하는 것이다.

Performance comparison of lung sound classification using various convolutional neural networks (다양한 합성곱 신경망 방식을 이용한 폐음 분류 방식의 성능 비교)

  • Kim, Gee Yeun;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.5
    • /
    • pp.568-573
    • /
    • 2019
  • In the diagnosis of pulmonary diseases, auscultation technique is simpler than the other methods, and lung sounds can be used for predicting the types of pulmonary diseases as well as identifying patients with pulmonary diseases. Therefore, in this paper, we identify patients with pulmonary diseases and classify lung sounds according to their sound characteristics using various convolutional neural networks, and compare the classification performance of each neural network method. First, lung sounds over affected areas of the chest with pulmonary diseases are collected by using a single-channel lung sound recording device, and spectral features are extracted from the collected sounds in time domain and applied to each neural network. As classification methods, we use general, parallel, and residual convolutional neural network, and compare lung sound classification performance of each neural network through experiments.

Sound Visualization based on Emotional Analysis of Musical Parameters (음악 구성요소의 감정 구조 분석에 기반 한 시각화 연구)

  • Kim, Hey-Ran;Song, Eun-Sung
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.6
    • /
    • pp.104-112
    • /
    • 2021
  • In this study, emotional analysis was conducted based on the basic attribute data of music and the emotional model in psychology, and the result was applied to the visualization rules in the formative arts. In the existing studies using musical parameter, there were many cases with more practical purposes to classify, search, and recommend music for people. In this study, the focus was on enabling sound data to be used as a material for creating artworks and used for aesthetic expression. In order to study the music visualization as an art form, a method that can include human emotions should be designed, which is the characteristics of the arts itself. Therefore, a well-structured basic classification of musical attributes and a classification system on emotions were provided. Also, through the shape, color, and animation of the visual elements, the visualization of the musical elements was performed by reflecting the subdivided input parameters based on emotions. This study can be used as basic data for artists who explore a field of music visualization, and the analysis method and work results for matching emotion-based music components and visualizations will be the basis for automated visualization by artificial intelligence in the future.

Drone Location Tracking with Circular Microphone Array by HMM (HMM에 의한 원형 마이크로폰 어레이 적용 드론 위치 추적)

  • Jeong, HyoungChan;Lim, WonHo;Guo, Junfeng;Ahmad, Isitiaq;Chang, KyungHi
    • Journal of Advanced Navigation Technology
    • /
    • v.24 no.5
    • /
    • pp.393-407
    • /
    • 2020
  • In order to reduce the threat by illegal unmanned aerial vehicles, a tracking system based on sound was implemented. There are three main points to the drone acoustic tracking method. First, it scans the space through variable beam formation to find a sound source and records the sound using a microphone array. Second, it classifies it into a hidden Markov model (HMM) to find out whether the sound source exists or not, and finally, the sound source is In the case of a drone, a sound source recorded and stored as a tracking reference signal based on an adaptive beam pattern is used. The simulation was performed in both the ideal condition without background noise and interference sound and the non-ideal condition with background noise and interference sound, and evaluated the tracking performance of illegal drones. The drone tracking system designed the criteria for determining the presence or absence of a drone according to the improvement of the search distance performance according to the microphone array performance and the degree of sound pattern matching, and reflected in the design of the speech reading circuit.

Analysis of Coen Brothers's Directing Style: Centering around Crime Movies (코엔 형제의 연출 스타일 분석 :범죄 영화를 중심으로)

  • Lee, Jeong-Gook
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.6
    • /
    • pp.236-248
    • /
    • 2010
  • Through this thesis, I analyzed Coen brothers's directing style centering around Crime movies: Blood simple, Barton Fink, Fargo, The man who wasn't thers, No country for old man. About directing style of Coen brothers, plot is an epic depiction, habitual use of narration, refusal of happy ending. They concern subject matters about human original nature and tragedy by greed. And as motifs, they often use misunderstanding, crossing over, chase. Also they likes characters of ordinary people who is destroyed by greed. How about their technical style? They usually use steady-cam and wide lens in camera, and in his early crime movies he used expressionistic lights, but after that they usually used realistic natural lights. About sound, they likes more sound effects than music. Also they directed realistic acting and emphasized actor's personality. Coen brothers has been directed many crime movies and comedy films. But their unique directing style was particularly outstanding in the crime movies

Integrated Analysis of Visual Story Telling and Original Sound Track of 'Alladin' Animation ('알라딘' 애니메이션에서 비주얼 스토리텔링과 오리지널 사운드 트랙 융합 분석)

  • Jang, So Eun;Lou, Liang;Kim, Jae Ho
    • Korea Science and Art Forum
    • /
    • v.24
    • /
    • pp.375-388
    • /
    • 2016
  • Integrated analysis of OST and VST of animation Alladin is carried out in this study. The OST is classified into 4 stages (Introduction, Bridge Passage, Climax, and Ending) and their OST and VST characteristics are found for each step. Especially, high dynamic characteristics of OST elements (sound, tonality, tempo, major range, intensity, and instrumentation) and VST elements (image structure, camera shot, camera movement) are found in the Climax stage. Full Shot is highly used up to 47.9% and this helps to show that the two characters become one in the completion stage of love. This is common factor shown in the previous analysis of OST "Beauty and the Beast". It is also found that specific musical instruments are matched to specific characters in "Beauty and the Beast" and high/low position or up/down movement of the object in the screen are matched to specific musical instruments in 'Alladin'.

협력적 태그를 이용한 추천 시스템

  • Yeon, Cheol;Kim, Heung-Nam;Ji, Ae-Tti;Jo, Geun-Sik
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2007.05a
    • /
    • pp.179-188
    • /
    • 2007
  • 디지털 기기 가 보편 화 되 면서 많 은 디지털 컨텐츠가 생성되고 있다. 또한, 인터넷 서비스의 발전으로 이들 컨텐츠를 과거에 비해 손쉽게 웹 상에 개제할 수 있게 되 었다. 따라서, 많은 컨텐츠를 추 천해 주기 위해 추천 시스템에 관한 연구가 활발히 진행되고 있다. 이들 컨텐츠가 기존의 텍스트 기반에서 사진이나 동영상, 사운드 등 컴퓨터가 자동으로 내용을 파악하기 힘든 컨텐츠로 변화하면서, 내용의 파악이 필요 없 는 협력적 여 과(Collaborative Filtering)가 추천 시스템에서 유 용하게 이 용될 수 있다. 또한 web 2.0의 영향으로 컨텐츠를 분류하고 재검색을 용이하게 하기 위해 태깅(tagging)을 제공하는 서비스가 많아지고 있다. 본 논문에서는 내용 파 악이 힘든 컨텐츠의 효과적인 추천을 위해 협력적 여과(Collaborative Filtering)와 협력적 태깅(Collaborative Tagging)을 접목시킨 방법을 제안하고, 전통적인 협력적 여과 방법과 제안한 방법의 비교 실험을 통하여 협력적 여과 방법에서의 태 깅의 효과에 대 해 논한다.

  • PDF

Soccer Video Highlight Summarization for Intelligent PVR (지능형 PVR을 위한 축구 동영상 하이라이트 요약)

  • Kim, Hyoung-Gook;Shin, Dong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2009.11a
    • /
    • pp.209-212
    • /
    • 2009
  • 본 논문에서는 MDCT기반의 오디오 특징과 영상 특징을 이용하여 축구 동영상의 하이라이트를 효과적으로 요약하는 방식을 제안한다. 제안하는 방식에서는 입력되는 축구 동영상을 비디오 신호와 오디오 신호로 분리한 후에, 분리된 연속적인 오디오 신호를 압축영역의 MDCT계수를 통해 이벤트 사운드별로 분류하여 오디오 이벤트 후보구간을 추출한다. 입력된 비디오 신호에서는 장면 전환점을 추출하고 추출된 장면 전환점으로부터 페널티 영역을 검출한다. 검출된 오디오 이벤트 후보구간과 검출된 페널티 영역장면을 함께 결합하여 축구 동영상의 이벤트 장면을 검출한다. 검출된 페널티 영역 장면을 통해 검출된 이벤트 구간을 다른 이벤트 구간보다 더 높은 우선순위를 갖는 하이라이트로 선정하여 요약본이 생성된다. 생성된 하이라이트 요약본의 평가는 precision과 recall을 통해 정확도를 평가하였다.

  • PDF

A Preliminary Study for Emotional Expression of Software Robot -Development of Hangul Processing Technique for Inference of Emotional Words- (소프트웨어 로봇의 감성 표현을 위한 기반연구 - 감성어 추론을 위한 한글 처리 기술 개발 -)

  • Song, Bok-Hee;Yun, Han-Kyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2012.05a
    • /
    • pp.3-4
    • /
    • 2012
  • 사용자 중심의 man machine interface 기술의 발전은 사용자 인터페이스 기술과 인간공학의 접목으로 인하여 많은 진전이 있으며 계속 진행되고 있다. 근래의 정보전달은 사운드와 텍스트 또는 영상을 통하여 이루어지고 있으나, 감성적인 측면에서의 정보전달에 관한 연구는 활발하지 못한 실정이다. 특히, Human Computer Interaction분야에서 음성이나 표정의 전달에 관한 감성연구는 초기단계로 이모티콘이나 플래쉬콘 등이 감정전달을 위하여 사용되고 있으나 부자연스럽고 기계적인 실정이다. 본 연구는 사용자와 상호작용에서 컴퓨터 또는 응용소프트웨어 등이 자신의 가상객체(Software Robot, Sobot)를 활용하여 인간친화적인 상호작용을 제공하기위한 기반연구로써 한글에서 감성어를 추출하여 분류하고 처리하는 기술을 개발하여 컴퓨터가 전달하고자하는 정보에 인공감정을 이입시켜 사용자들의 감성만족도를 향상시키는데 적용하고자한다.

  • PDF

Design of direction control system for camera, Using sound source recognition and delay time. (음원인식 및 지연시간을 이용한 카메라의 방향제어 시스템 설계)

  • Lee, Hui-Tae;Kim, Young-Sub
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.1076-1078
    • /
    • 2017
  • 본 연구는 이상음원(비명, 유리창 파손음, 경적소리 등) 발생 시, 2개의 마이크로폰에 입력되는 사운드에 대하여 음원 방향추적 장치와 연결된 카메라에 음원의 방향 정보를 전송함으로써, 카메라의 View Point를 음원 발생방향으로 이동시켜 사고현장을 더욱 신속하게 대처할 수 있는 시스템에 대한 연구이다. 일반적인 음성을 이용한 감시카메라는 단순히 소리 발생 여부만 감지하지만, 본 시스템은 이상음원 발생 지점으로 카메라의 방향 제어를 가능하게 한다. 이상음원의 검출은 기존에 수집한 DB를 기반으로 비교, 분석 과정을 통하여 이상음원을 분류한다. 음원 발생 방향은 음원 발생 시, 마이크로폰에 도달하는 음원의 시간차에 따른 음파의 위상차를 계산하여 음원 발생 방향을 판단하게 된다.