• 제목/요약/키워드: 소리 인식

Search Result 214, Processing Time 0.046 seconds

Trained Creativity by the Teach Aloud (소리내어 가르치기 방법을 통해 훈련된 창의성)

  • 강석민;한광희
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.235-240
    • /
    • 2000
  • 창의성 연구는 개인적, 사회적 맥락에서 고려해야 할 다양한 시사점을 가진 분야이다. 하지만 지금까지 창의성 연구는 창의성 자체에 대한 개념이 명확하지 않을 뿐 아니라, 창의성을 태어날 때부터 타고나는 고유한 영역이라는 인식 때문에 그에 대한 연구가 비교적 부족한 실정이다. 본 연구에서는 창의성이 새로운 정보를 기존 지식과 결합하여 이를 문제상황에서 적용하여 유용함을 입증하는 행위라는 전제하에, 각 개인에게 내재된 창의적 사고 능력이 특정한 지시 혹은 학습방법(소리내어 가르치기)의 경험을 통해 발현될 수 있으리라 보았다. 창의성의 핵심요소인 통합적, 분석적, 실용적 사고능력을 측정하여 창의성이 높고, 낮은 집단을 구분하고, 이를 근거로 게임 규칙을 소리내어 가르치기 경험을 한 집단과 통제집단(단순암기)으로 각각 구분하여 게임에서 승리, 즉 창의적 문제해결이 소리내어 가르치기 방법을 통해 실현될 수 있음을 알아보고자 했다. 창의적 사고능력은 소리내어 가르치기를 경험한 집단에서 유의미하게 발현되었다. 또한 소리내어 가르치는 경험을 한 실험참가자들은 프로토콜 분석에서 보다 정교화된 게임의 규칙을 생성하였으며, 게임의 규칙을 정확히 알고 있는 것으로 나타났다. 이는 가르치는 경험을 통해 새로운 정보를 보다 잘 조직화하고, 이를 실제 문제상황에 적용한 것으로 해석되었다.

  • PDF

A Real-time Audio Surveillance System Detecting and Localizing Dangerous Sounds for PTZ Camera Surveillance (PTZ 카메라 감시를 위한 실시간 위험 소리 검출 및 음원 방향 추정 소리 감시 시스템)

  • Nguyen, Viet Quoc;Kang, HoSeok;Chung, Sun-Tae;Cho, Seongwon
    • Journal of Korea Multimedia Society
    • /
    • v.16 no.11
    • /
    • pp.1272-1280
    • /
    • 2013
  • In this paper, we propose an audio surveillance system which can detect and localize dangerous sounds in real-time. The location information about dangerous sounds can render a PTZ camera to be directed so as to catch a snapshot image about the dangerous sound source area and send it to clients instantly. The proposed audio surveillance system firstly detects foreground sounds based on adaptive Gaussian mixture background sound model, and classifies it into one of pre-trained classes of foreground dangerous sounds. For detected dangerous sounds, a sound source localization algorithm based on Dual delay-line algorithm is applied to localize the sound sources. Finally, the proposed system renders a PTZ camera to be oriented towards the dangerous sound source region, and take a snapshot against over the sound source region. Experiment results show that the proposed system can detect foreground dangerous sounds stably and classifies the detected foreground dangerous sounds into correct classes with a precision of 79% while the sound source localization can estimate orientation of the sound source with acceptably small error.

Design of a Self-Organizing Robot by Embedded System (임베디드 시스탬에 의한 자기변신 로봇의 설계)

  • Gang, Dae-Heon;Kim, Tae-Gyun;Choe, Byeong-Jae
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.333-336
    • /
    • 2007
  • 지능로봇에 관한 열기가 확산되면서 다양한 로봇이 연구, 개발되고 있다. 본 논문에서는 소리 인식, 변신 기능, 무게 중심 인식, 장애물 감지 및 4족 자율보행의 기능을 가지는 로봇의 설계 및 제작에 관하여 기술한다. 자기변신 로봇의 무게 중심이 아래로 향할 수 있도록 현재 상태를 파악한 후 중심 추를 이동시켜서 무게 중심을 변화시킨다. 이동 중 소리 인식과 장애물 인식 및 낭떠러지 인식으로 원활한 이동을 하기위해 다양한 센서들을 사용 한다. 시뮬레이션을 통해 제안한 방법의 유용성을 검증하고, 이를 실제 자기변신 로봇의 설계 및 제작에 적용하여 타당성을 입증한다.

  • PDF

A Study on the Expression Recognition of the Experience of the Sinmyung and the Movement in the Korean Dance of College Students Majoring in Musical: A Qualitative (뮤지컬 전공대학생들의 한국 춤 신명체험(神明體驗)과 움직임 표현인식;질적 접근)

  • Jeong, Tae-seon;Ahn, Byoung-Soon
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.12
    • /
    • pp.383-393
    • /
    • 2018
  • The purpose of this paper is to study on the elements of the Sinmyung and the expression recognition of body movement in Korean dance of college students majoring in musical. The participants were 12 male and female college students in musical major who experienced in dance, song and acting. The program was composed of the experience of the Sinmyung: recognition of sound and dance, breathing and movement in the Korean dance, 8 hours twice a week for four weeks. As a qualitative approach is the discovery of the center of the process, we carried out an inductive analysis of the area on the basis of observation, in-depth interview and student report. The core of this analysis is to attempt to analyze contents concentrating on the recognition exploration of the Sinmyung sentiment and the body expression through sound and breathing. In conclusion, for college students majoring in musical, the expression recognition of the experience of the Sinmyung and the movement in the Korean dance contributes to the improvement of creative thinking through body perception, and the practical use of the capacity of image expression through concentration of sound and breathing. Finally, the results of this research could articulate with the value of body expression and the creative factors of college students majoring in musical.

Abnormal Sound Detection and Identification in Surveillance System (감시 시스템에서의 비정상 소리 탐지 및 식별)

  • Joo, Young-min;Lee, Eui-jong;Kim, Jeong-sik;Oh, Seung-geun;Park, Dai-hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.592-595
    • /
    • 2010
  • 본 논문에서는 감시카메라 환경에서 취득한 오디오 데이터를 입력으로 하여, 비정상 상황을 인식하는 시스템을 제안한다. 제안된 시스템은 단일클래스 SVM의 대표적인 모델인 SVDD와 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 신호 처리 분야의 SRC를 계층적으로 결합한 구조로써, 첫 번째 계층에서는 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 유형별로 세분화 식별하여 관리자에게 비상 상황을 보고함으로써 관리자의 위기 상황 대처를 돕는다. 제안된 시스템은 실시간 처리가 가능하며, 점증적 갱신의 학습 능력으로 인하여 비정상 오디오 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 실험을 통하여 제안된 시스템의 성능을 검증한다.

Sound Recognition Devices for audibly impaired Individuals (Hearing impaired accident prevention application using artificial intelligence) (청각 장애인의 소리 인식 보조기기 (인공지능을 이용한 청각 장애인 사고 예방 어플리케이션) )

  • Jung-Ho Ko;Wan-Ho Lee;Hee-Seung Shin;Sung-Hwan KIm;Youl-hun Seoung;Ho-Sup Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.1010-1011
    • /
    • 2023
  • 코로나19 팬데믹 이후 배달 앱 사용량이 증가에 따라 배달 오토바이 수가 급증하면서 이와 관련 사고 또한 급격히 증가하는 추세를 보이고 있다. 특히 청각 장애인들은 도로에서 이러한 종류의 사고 위험에 더욱 노출되어 있으며, 이 문제를 해결하기 위해 구글 앱 인벤터를 사용하여 도로에서 오토바이 소리를 인식하는 인공지능 학습 모델을 개발하였다. 개발된 어플리케이션은 도로에서 오토바이 소리를 감지하고 사용자에게 진동과 사진으로 알림을 보냄으로써 사고를 예방에 기여할 수 있다.

A study on data augmentation methods for sound data classification (소리 데이터 분류에 대한 데이터 증대 방법 연구)

  • Chang, Il-Sik;Park, Goo-man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.1308-1310
    • /
    • 2022
  • 소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.

  • PDF

ResNet Model Based Real Life Sound Event Prediction and Notification Application (ResNet 모델을 이용한 일상생활 소리 예측 및 알림 애플리케이션)

  • Park, Yu-Jin;Chung, Eun-Ee;Shin, Ji-Hye;Park, Tae-jung;Yang, Hoi Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1004-1007
    • /
    • 2020
  • 본 논문에서는 청각 장애인이 가정에서 듣지 못해 발생하는 낭비와 위험을 미리 예방하기 위하여 가정에서 현재 발생하고 있는 소리를 알려주는 시스템을 구현하였다. 무지향성 마이크로 일상 소리 감지 후 음향 데이터에서 Mel-Spectogram 특징 벡터를 추출하여 Convolutional Neural Network(CNN) 모델의 Resnet 알고리즘을 진행한다. 서버에서 소리에 대한 분석을 진행한 후 그 결과를 안드로이드에서 실시간으로 5 초마다 확인하여 사용자에게 알림 서비스를 제공한다. 이를 통해 낭비를 줄이고 위험에 대처할 수 있게 한다. 청각 장애인의 소리에 대한 접근성을 다양한 측면으로 고려해야 한다는 사회적 인식을 확산시키고자 한다.