• Title/Summary/Keyword: 소리 인식

Search Result 212, Processing Time 0.034 seconds

A Study on Dog-emotion judgment method Based on Deep Learning (딥러닝 기반의 반려견 감정 판단 기법에 관한 연구)

  • Kim, Mingu;Kim, Seha;Go, Yujeong;Lee, Hyunseo;Park, Joonho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.449-450
    • /
    • 2022
  • 반려견의 행동인식기술은 다양한 센서들에서 입력되는 반려견의 동작과 관련된 정보를 분석하고 해석하여 반려견이 어떤 행동을 취하고 있는지를 인식하는 기술이다. 음성인식기술은 컴퓨터가 청각 자료를 수집, 분석하여 훈련된 데이터와 비교를 통해 소리를 분류하는 기술이다. 본 논문에서는 딥러닝을 기반으로 행동인식기술과 음성인식기술을 적용하여 반려견의 감정을 판단하는 기법을 제안한다. 이러한 기법은 반려견의 감정을 쉽게 파악하여 반려견 보호자가 반려견의 행동과 감정에 대한 이해를 쉽고 빠르게 할 수 있으므로, 보호자에게 즐거운 반려 생활이 가능하도록 도움을 줄 수 있다.

  • PDF

Efficient Implementation of IFFT and FFT for PHAT Weighting Speech Source Localization System (PHAT 가중 방식 음성신호방향 추정시스템의 FFT 및 IFFT의 효율적인 구현)

  • Kim, Yong-Eun;Hong, Sun-Ah;Chung, Jin-Gyun
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.46 no.1
    • /
    • pp.71-78
    • /
    • 2009
  • Sound source localization systems in service robot applications estimate the direction of a human voice. Time delay information obtained from a few separate microphones is widely used for the estimation of the sound direction. Correlation is computed in order to calculate the time delay between two signals. In addition, PHAT weighting function can be applied to significantly improve the accuracy of the estimation. However, FFT and IFFT operations in the PHAT weighting function occupy more than half of the area of the sound source localization system. Thus efficient FFT and IFFT designs are essential for the IP implementation of sound source localization system. In this paper, we propose an efficient FFT/IFFT design method based on the characteristics of human voice.

The Analysis of Reading Strategies from Errors of Children's Oral Reading Action (소리내어 책읽기에서 나타나는 실수를 통한 유아의 읽기전략 분석)

  • Kim, Jungwha;Lee, Moonjung
    • Korean Journal of Child Studies
    • /
    • v.24 no.5
    • /
    • pp.91-104
    • /
    • 2003
  • This study analized the strategies in beginning readers by age and reading ability. Sixty 4-and 5-year old subjects took a reading test based on Bsatjes & Brown(1997) and Park, et a1.(1989). They read contextual and non-contextual storybooks. Errors in oral reading were recorded as mispronunciations, substitutions, omissions, insertions, teacher-assistance and self-corrections. Mispronunciations and substitutions were Specifically evaluated for graphic and contextual reading strategies. Data were analyzed by percentage and mean. Results revealed that children made more mispronunciation errors in reading the non-contextual story book. They used graphic information more than contextual information. Fine-year olds and high-level readers developed the use of graphic and contextual cues simultaneously.

  • PDF

Design of direction control system for camera, Using sound source recognition and delay time. (음원인식 및 지연시간을 이용한 카메라의 방향제어 시스템 설계)

  • Lee, Hui-Tae;Kim, Young-Sub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.1076-1078
    • /
    • 2017
  • 본 연구는 이상음원(비명, 유리창 파손음, 경적소리 등) 발생 시, 2개의 마이크로폰에 입력되는 사운드에 대하여 음원 방향추적 장치와 연결된 카메라에 음원의 방향 정보를 전송함으로써, 카메라의 View Point를 음원 발생방향으로 이동시켜 사고현장을 더욱 신속하게 대처할 수 있는 시스템에 대한 연구이다. 일반적인 음성을 이용한 감시카메라는 단순히 소리 발생 여부만 감지하지만, 본 시스템은 이상음원 발생 지점으로 카메라의 방향 제어를 가능하게 한다. 이상음원의 검출은 기존에 수집한 DB를 기반으로 비교, 분석 과정을 통하여 이상음원을 분류한다. 음원 발생 방향은 음원 발생 시, 마이크로폰에 도달하는 음원의 시간차에 따른 음파의 위상차를 계산하여 음원 발생 방향을 판단하게 된다.

Crisis coping system using the user's voice loudness in android environment (안드로이드 환경에서 사용자 소리세기를 이용한 위기대처 시스템)

  • Lee, Tae Kyung;Kim, Min Seo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.231-234
    • /
    • 2011
  • 본 논문에서는 긴급통화만 가능하던 기존의 위기대처시스템들과 차별화를 두기 위해, 안드로이드에서 제공하는 시스템 중 하나인 미디어 부분을 이용하여 사용자의 음성을 입력받아 소리세기를 출력시켰다. 또한 GoogleAPI를 활용하여 현재위치를 찾아 긴급 메시지로 전송 가능한 시스템을 제공한다. 본 시스템은 사용자의 편리성과 효율성을 높이기 위하여, 단 1회 실행만으로도 연속적인 위기대처시스템의 인식과 주기적인 실시간 위치를 찾아 메시지 전송이 가능하다. 부가적으로 현재위치를 위도 경도로만 출력 되어 전송 되어지는 것이 아니라, 위도 경도의 값을 주소로 변환하여 출력 하므로서 보다 정확하고 편리하게 서비스를 이용할 수 있다.

Trend analysis and shapes of the visual expressions of the sounds (음의 시각화와 그 표현의 경향)

  • 김민호;정성환;강민수
    • Archives of design research
    • /
    • v.16 no.3
    • /
    • pp.101-110
    • /
    • 2003
  • People are surrounded with numerous sounds. The sound is generated from nature and people. For example, the sound enables people or animal responsive to instinctive action. Music or fine arts are presented differently by its distinctive medium. On the other hand, those art forms are similar in a way that people uses right side of brain and intuitions for creative effects. Conjunctions between sounds and visual arts have been progressed to data. From art forms in subjective views to art forms using high technology such as the computer, experiments for sounds visualization are practiced constantly. For that reason, intrinsic attributes of sounds in design area and distinctive qualities are discussed in this study. With respect to existing category of studies and consideration of the tendency in recent researches, the object is to propose direction for the study in regards to methodology of design, which is reconstructing visualized expression.

  • PDF

Temporal attention based animal sound classification (시간 축 주의집중 기반 동물 울음소리 분류)

  • Kim, Jungmin;Lee, Younglo;Kim, Donghyeon;Ko, Hanseok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.39 no.5
    • /
    • pp.406-413
    • /
    • 2020
  • In this paper, to improve the classification accuracy of bird and amphibian acoustic sound, we utilize GLU (Gated Linear Unit) and Self-attention that encourages the network to extract important features from data and discriminate relevant important frames from all the input sequences for further performance improvement. To utilize acoustic data, we convert 1-D acoustic data to a log-Mel spectrogram. Subsequently, undesirable component such as background noise in the log-Mel spectrogram is reduced by GLU. Then, we employ the proposed temporal self-attention to improve classification accuracy. The data consist of 6-species of birds, 8-species of amphibians including endangered species in the natural environment. As a result, our proposed method is shown to achieve an accuracy of 91 % with bird data and 93 % with amphibian data. Overall, an improvement of about 6 % ~ 7 % accuracy in performance is achieved compared to the existing algorithms.

Distance Measurement System Between Sensor in the Wireless Sensor Network (센서네트워크에서 센서노드들 사이의 거리측정 시스템)

  • Jo Young-Tae;Park Chong-Myung;Kim Yong-Gon;Kim Yoon;Jung In-Bum
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.1263-1266
    • /
    • 2006
  • 센서 네트워크는 환경 정보를 이용하여 재난방제, 스마트홈, 환경감시 등의 다양한 서비스를 제공할 수 있으며, 특히 위치인식 기반 서비스에 관한 연구가 활발히 진행되고 있다. 위치인식을 하기 위해 기본적이고 가장 중요한 기술은 센서와 사물 사이의 거리를 측정하는 것이다. 초음파와 RSSI, GPS 등 위치인식을 위해 거리를 측정하는 방식은 여러 가지가 있다. 본 논문에서는 소리와 RF신호를 이용하여 거리를 측정하는 시스템을 구현하고 평가한다.

  • PDF

DRM 솔루션 시장 ‘가속페달’밟는다

  • Sin, Seon-Ja
    • Digital Contents
    • /
    • no.7 s.146
    • /
    • pp.32-39
    • /
    • 2005
  • 디지털콘텐츠 시장의 확대와 더불어 DRM 적용에 대한 요구가 증가함에 따라 DRM 솔루션 시장 역시 동반 상승세를 타고 있다.DRM은 디지털콘텐츠 유통, 상업성에 대한 완전성을 보장할 것이라는 기대감 때문이다. 아직 유료화 시장이 완전히 정착되지 않아 관련업체들의 수익은 미비한 편이고 그 규모 또한 영세하지만 향후 높은 성장률이 예상된다는 데는 이견이 없다. 관련업계에 따르면 그간 냅스터, 소리바다 등 음원 시장을 중심으로 여러 공방전이 펼쳐지고 인식의 전환이 이뤄지면서 DRM 시장도 이제 어느정도 안정화 단계에 접어들고 있는 것으로 보인다. 업계 한 전문가는“지금까지가 기술개발 및 시장 형성의 과도기였다면 올해 는 인식 전환에 따른 DRM 기반 상용서비스가 봇물을 이뤄 시장 활성화 원년이 될 것”이라고 내다봤다. 이처럼 콘텐츠 유료화에 대한 인식 제고, 디지털멀티미디어방송(DMB) 등 신규 콘텐츠 생성, 기업 내 기밀문서에 대한 보안의 중요성이 증대되면서 올해 국내 DRM 솔루션 시장 규모는 지난해보다 30% 성장한 600억원대를 형성할 전망이다. 특히 올해는 업체들이 개인정보보호법이 발효된 일본을 위시한 해외시장 판로가 열리면서 더 큰 신장세가 예고되고 있다. 관련업체들은 시장을 선점하기 위한 사업다각화에 나서고 있고 앞으로의 비즈니스 모델 개발에 매진하고 있다.

  • PDF

Wearable system for sound visualization and disaster alarm for the Hearing-Impaired (청각장애인을 위한 사운드-시각화 및 재난 경보 웨어러블 시스템)

  • Lee, Se-Hoon;Kong, Jin-yong;Yeom, Dae-hoon;Kang, Eun-ho;Baek, Yong-Tae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.257-258
    • /
    • 2017
  • 본 논문에서는 청각 장애인들은 시각에 의존하지 않고는 소리를 인지할 수 없다는 문제를 해결하기 위해 사운드를 시각화하는 웨어러블 시스템을 구현하였다. 시스템의 음성 인식 센서가 음성을 인식해 웨어러블 디스플레이에 전송된 메시지를 확인하고, 기상 재난 메시지를 웨어러블에서 실시간으로 확인하여 안전사고를 예방할 수 있게 하여 청각장애인의 어려움을 해결하였다.

  • PDF