• 제목/요약/키워드: 소리인식

검색결과 214건 처리시간 0.033초

양서류 울음 소리 식별을 위한 특징 벡터 및 인식 알고리즘 성능 분석 (Performance assessments of feature vectors and classification algorithms for amphibian sound classification)

  • 박상욱;고경득;고한석
    • 한국음향학회지
    • /
    • 제36권6호
    • /
    • pp.401-406
    • /
    • 2017
  • 본 논문에서는 양서류 울음소리를 통한 종 인식 시스템 개발을 위해, 음향 신호 분석에서 활용되는 주요 알고리즘의 인식 성능을 평가했다. 먼저, 멸종위기 종을 포함하여 총 9 종의 양서류를 선정하여, 각 종별 울음소리를 야생에서 녹음하여 실험 데이터를 구축했다. 성능평가를 위해, MFCC(Mel Frequency Cepstral Coefficient), RCGCC(Robust Compressive Gammachirp filterbank Cepstral Coefficient), SPCC(Subspace Projection Cepstral Coefficient)의 세 특징벡터와 GMM(Gaussian Mixture Model), SVM(Support Vector Machine), DBN-DNN(Deep Belief Network - Deep Neural Network)의 세 인식기가 고려됐다. 추가적으로, 화자 인식에 널리 사용되는 i-vector를 이용한 인식 실험도 수행했다. 인식 실험 결과, SPCC-SVM의 경우 98.81 %로 가장 높은 인식률을 확인 할 수 있었으며, 다른 알고리즘에서도 90 %에 가까운 인식률을 확인했다.

소리내어 가르치기 방법을 통해 훈련된 창의성 (Trained Creativity by the Teach Aloud)

  • 강석민;한광희
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.235-240
    • /
    • 2000
  • 창의성 연구는 개인적, 사회적 맥락에서 고려해야 할 다양한 시사점을 가진 분야이다. 하지만 지금까지 창의성 연구는 창의성 자체에 대한 개념이 명확하지 않을 뿐 아니라, 창의성을 태어날 때부터 타고나는 고유한 영역이라는 인식 때문에 그에 대한 연구가 비교적 부족한 실정이다. 본 연구에서는 창의성이 새로운 정보를 기존 지식과 결합하여 이를 문제상황에서 적용하여 유용함을 입증하는 행위라는 전제하에, 각 개인에게 내재된 창의적 사고 능력이 특정한 지시 혹은 학습방법(소리내어 가르치기)의 경험을 통해 발현될 수 있으리라 보았다. 창의성의 핵심요소인 통합적, 분석적, 실용적 사고능력을 측정하여 창의성이 높고, 낮은 집단을 구분하고, 이를 근거로 게임 규칙을 소리내어 가르치기 경험을 한 집단과 통제집단(단순암기)으로 각각 구분하여 게임에서 승리, 즉 창의적 문제해결이 소리내어 가르치기 방법을 통해 실현될 수 있음을 알아보고자 했다. 창의적 사고능력은 소리내어 가르치기를 경험한 집단에서 유의미하게 발현되었다. 또한 소리내어 가르치는 경험을 한 실험참가자들은 프로토콜 분석에서 보다 정교화된 게임의 규칙을 생성하였으며, 게임의 규칙을 정확히 알고 있는 것으로 나타났다. 이는 가르치는 경험을 통해 새로운 정보를 보다 잘 조직화하고, 이를 실제 문제상황에 적용한 것으로 해석되었다.

  • PDF

PTZ 카메라 감시를 위한 실시간 위험 소리 검출 및 음원 방향 추정 소리 감시 시스템 (A Real-time Audio Surveillance System Detecting and Localizing Dangerous Sounds for PTZ Camera Surveillance)

  • 응웬비엣쿡;강호석;정선태;조성원
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1272-1280
    • /
    • 2013
  • 본 논문에서는 실시간으로 위험한 소리를 인식하고 그 방향을 파악하여 이를 통해 PTZ Camera가 위험한 소리 방향으로 회전하여 해당 지역 영상을 획득하여 전송할 수 있도록 지원하는 소리 감시 시스템을 제안한다. 제안 소리 감시 시스템은 적응 혼합 가우시안 모델(AGMM)을 사용하여 일상적인 배경 소리와는 비정상적인 소리를 전경 소리로 검출하고, AGMM 모델로 미리 학습된 전경 소리들 중의 하나로 분류한다. 분류된 소리가 위험한 소리에 속하는 경우, Dual delay-line 방법에 기반을 둔 음원 방향 추정 기법을 사용하여 그 방향을 파악한다. 최종적으로 방향 정보를 사용하여 PTZ 카메라를 조절하여 그 방향 지역의 해당 영상을 획득하고 전송될 수 있도록 지원한다. 제안하는 소리 감시 시스템은 전경 위험 소리들을 안정적으로 검출하고, 79%의 정확도로 위험소리들을 분류하고, 작은 오차범위 이내 음원 방향 추정 성능을 나타냄을 실험결과를 통해 확인하였다.

임베디드 시스탬에 의한 자기변신 로봇의 설계 (Design of a Self-Organizing Robot by Embedded System)

  • 강대헌;김태균;최병재
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.333-336
    • /
    • 2007
  • 지능로봇에 관한 열기가 확산되면서 다양한 로봇이 연구, 개발되고 있다. 본 논문에서는 소리 인식, 변신 기능, 무게 중심 인식, 장애물 감지 및 4족 자율보행의 기능을 가지는 로봇의 설계 및 제작에 관하여 기술한다. 자기변신 로봇의 무게 중심이 아래로 향할 수 있도록 현재 상태를 파악한 후 중심 추를 이동시켜서 무게 중심을 변화시킨다. 이동 중 소리 인식과 장애물 인식 및 낭떠러지 인식으로 원활한 이동을 하기위해 다양한 센서들을 사용 한다. 시뮬레이션을 통해 제안한 방법의 유용성을 검증하고, 이를 실제 자기변신 로봇의 설계 및 제작에 적용하여 타당성을 입증한다.

  • PDF

고시조에 표현된 한국인의 소리인식 조사에 관한 연구 (The Korean's Sound Recognition Impressed in Ancient Sijo)

  • 이태강;장길수
    • 한국소음진동공학회논문집
    • /
    • 제15권6호
    • /
    • pp.724-730
    • /
    • 2005
  • Literary works contain various human emotion and historical, cultural background. It is very significant to understand sound recognition and receptions represented in many literary works. This study aims to investigate the sound impression on ancient Korean Sijo( Korean Verse) involved various traditional korean emotion, which were expressed in different situations. Firstly we selected the appropriate Sijo to express sounds, and then classified the sound, analyzed the meaning of recognition to the sound. The number of 297 sounds were classified into 13 categories, and 20 emotional meanings. Especially, 'internal sadness' characterized the korean rooted emotion were more expressed than other meanings and this meaning were symbolized by the sound of wild geese and cuckoos.

감시 시스템에서의 비정상 소리 탐지 및 식별 (Abnormal Sound Detection and Identification in Surveillance System)

  • 주영민;이의종;김정식;오승근;박대희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.592-595
    • /
    • 2010
  • 본 논문에서는 감시카메라 환경에서 취득한 오디오 데이터를 입력으로 하여, 비정상 상황을 인식하는 시스템을 제안한다. 제안된 시스템은 단일클래스 SVM의 대표적인 모델인 SVDD와 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 신호 처리 분야의 SRC를 계층적으로 결합한 구조로써, 첫 번째 계층에서는 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 유형별로 세분화 식별하여 관리자에게 비상 상황을 보고함으로써 관리자의 위기 상황 대처를 돕는다. 제안된 시스템은 실시간 처리가 가능하며, 점증적 갱신의 학습 능력으로 인하여 비정상 오디오 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 실험을 통하여 제안된 시스템의 성능을 검증한다.

청각 장애인의 소리 인식 보조기기 (인공지능을 이용한 청각 장애인 사고 예방 어플리케이션) (Sound Recognition Devices for audibly impaired Individuals (Hearing impaired accident prevention application using artificial intelligence) )

  • 고정호;이완호;신희승;김성환;성열훈;이호섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1010-1011
    • /
    • 2023
  • 코로나19 팬데믹 이후 배달 앱 사용량이 증가에 따라 배달 오토바이 수가 급증하면서 이와 관련 사고 또한 급격히 증가하는 추세를 보이고 있다. 특히 청각 장애인들은 도로에서 이러한 종류의 사고 위험에 더욱 노출되어 있으며, 이 문제를 해결하기 위해 구글 앱 인벤터를 사용하여 도로에서 오토바이 소리를 인식하는 인공지능 학습 모델을 개발하였다. 개발된 어플리케이션은 도로에서 오토바이 소리를 감지하고 사용자에게 진동과 사진으로 알림을 보냄으로써 사고를 예방에 기여할 수 있다.

소리 데이터 분류에 대한 데이터 증대 방법 연구 (A study on data augmentation methods for sound data classification)

  • 장일식;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1308-1310
    • /
    • 2022
  • 소리 데이터 분류는 단순 소리를 통한 분류, 감정 인식등 다양한 연구가 진행중이다. 심층 신경망에서 데이터의 부족과 과적합 문제를 개선하는 방법으로 데이터 증강은 중요하다. 본 논문에서는 3가지의 소리데이터(UrbanSound8K, RAVDESS, IRMAS)를 사용하였으며, 소리데이터는 멜 스펙트로그램을 통한 변환과정을 거쳐 네트워크 망에 입력된다. 입력된 신호는 다양한 네크워크 신경망(Bidirection LSTM, Bidirection LSTM Attention, Multi-Head Attention, CNN)을 통해 학습되어지며, 각각의 네트워크 신경망에서 데이터 증강 전후의 분류 정확도를 확인 하였다. 다양한 데이터셋과 다양한 네트워크 망에서의 데이터 증강 방법의 결과 비교를 통한 통찰을 얻을수 있을 것이다.

  • PDF