• 제목/요약/키워드: 소리신호

검색결과 198건 처리시간 0.024초

한국어 오디오 캡션 시스템 개발 (Development of Korean Audio Caption System)

  • 강태호;김주희;이준하
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.364-367
    • /
    • 2020
  • 오디오 캡셔닝(Audio Captioning)은 시스템이 입력으로 오디오 신호를 받아들이고 해당 신호의 텍스트 설명을 출력하는 중간 번역 작업이다. 이 논문에서는 컨볼루셔널 뉴럴 네트워크(CNN), 트랜스포머의 딥러닝 알고리즘을 사용하여 주변 환경 소리에 대한 오디오 캡셔닝을 자동으로 수행하고 한글화된 출력 결과를 제공하는 모델을 제시한다. 본 연구 결과, 모델의 성능 평가 척도인 SPIDEr 점수는 0.1977이 나왔다.

  • PDF

역문제를 이용한 디지털 필터 시스템의 소스 추정 (Source Estimation of Digital Filter System using Inverse Problem)

  • 김태용;이훈재
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.57-58
    • /
    • 2014
  • 디지털 필터는 신호처리 시스템에서 매우 중요한 역할을 수행한다. 일반적으로 입력 신호는 디지털 필터의 전달함수에 의해 출력이 결정된다. 그러나 입력신호가 다양한 소리 환경에 노출되어 있어 확인이 어려운 경우가 발생할 수도 있다. 본 연구에서는 노이즈 환경에 노출된 입력신호로부터 원입력신호를 추출하기 위한 역문제를 고려하였다.

  • PDF

디지털 경제를 주도할 디지털 컨텐츠 산업의 육성방향

  • 박영일
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 국제컨퍼런스 디지털컨텐츠 활용을 통한 지식경영의 확산
    • /
    • pp.1-11
    • /
    • 1999
  • o 디지털컨텐츠(멀티미디어컨텐츠)란 무엇인가\ulcorner 멀티미디어 : 기존 아날로그 기술에서 개별적으로 성장했던 문자, 음성, 사진, 비디오, 애니메이션의 미디어 영역들이 디지털 기술이 발달하면서 통합된 미디어를 말함. 디지털화는 글, 소리, 그림, 영상, 숫자 등의 온갖 정보들을 컴퓨터가 인식할 수 있는 신호(2진수 코드)로 바꾸는 것임. (중략)

  • PDF

무대 공연에서 현악기 소리에 반응하는 실시간 영상에 관한 연구 (Research of real-time image which is responding to the strings sound in art performance)

  • 장은선;홍성대;박진완
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.185-190
    • /
    • 2009
  • 최근 문화공연은 전통적인 공연예술의 틀을 벗어나 여러 장르를 도입하여 새로운 문화콘텐츠를 만들고 있으며, 특히 무대를 갖는 공연에는 영상예술과 첨단기술을 이용한 이색적인 공연이 나타나고 있다. 그 중에서도 무대 공연은 소리를 이용한 퍼포먼스가 행해지는 공연 같은 경우, 소리를 재해석하여 영상과 결합시킨 실험적인 공연이 나타나고 있다. 하지만 아직 대중 공연예술에서는 실시간 소리에 따라 영상을 시각화하는 과정이 자동화 되지 않고 있다. 이 경우 연주자와 관객이 즉흥적으로 내는 소리를 실시간으로 보여줄 수 없기 때문에 영상과 관객, 그리고 공연자의 상호교류가 이루어질 수 없다. 본 논문에서는 공연영상을 위한 실시간 사운드 시각화(Real-time sound visualization)를 실험함으로써 즉흥적인 공연 환경과 소통하는 영상 시각화를 제안한다. 영상 시각화는 공연예술에서 사용되는 악기 중 현악기를 중심으로 한다. 미디 환경을 기반으로 하는 맥스엠에스피/지터(MaxMSP/Jitter)를 이용하여 사운드 신호에 따른 영상 제어 시스템을 구축하고 코르그 나노 컨트롤(Korg Nano Kontrol) 기기를 활용하여 영상을 실험 및 제어한다. 이를 통해 공연 환경에 따라 미묘하게 달라지는 공연자의 감정과 박자감 그리고, 공연자의 행태에 따라 즉흥적으로 변화하는 실시간 인터랙티브 영상을 확인할 수 있다.

  • PDF

오픈소스 컨트롤러를 사용한 층간 소음 방지 시스템 (An Inter-floor Noise Prevention System using an Open-source Controller)

  • 김태훈;장혁재;이원영
    • 한국전자통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.899-906
    • /
    • 2017
  • 본 논문은 다세대 공동 주택에서 윗층과 아래층 간에 발생하는 층간 소음을 줄일 수 있도록 도와주는 층간소음 방지 시스템을 제안하고 있다. 제안하는 시스템에서는 오픈소스 컨트롤러 중 하나인 아두이노 보드에 소리 감지 센서와 진동 감지 센서를 연결하여 층간 소음으로 판단하는 소리와 진동을 입력 받고 이를 고속 푸리에 변환을 이용하여 주파수 대역에서의 신호 분석을 수행한다. 특정 주파수 대역의 신호 크기가 구조물의 투과 손실을 고려한 기준을 넘을 때에는 LCD화면에 경고 메시지를 보내고 휴대폰으로 이메일 또는 메시지를 전송하도록 하였다. 이를 통해 시스템은 사용자가 소음 발생 상황을 인지하여 스스로 주의할 수 있도록 돕는다. 시스템 검증을 위한 실험에서 제안하는 시스템은 외부 입력 신호에서 130 Hz~1040 Hz의 대역 성분 추출을 수행하였으며, 추출된 신호의 크기와 투과 손실의 차이 값이 45 dB를 초과할 경우 기기의 연결된 디스플레이와 Wi-Fi로 연결된 모바일 기기에 현재 소음이 발생하고 있음을 공지하는 동작을 수행하였다.

청각자극의 반송 주파수에 따른 뇌전위 신호의 해석 (The Analysis of EEG Signal Responding to the Pure Tone Auditory Stimulus)

  • 최정미;배병훈;김수용
    • 대한의용생체공학회:의공학회지
    • /
    • 제15권4호
    • /
    • pp.383-388
    • /
    • 1994
  • 일정한 단속 주파수(triggering frequency)를 지닌 청각자극의 반송 주파수(carrier ferquency, pure tone)를 1kHz에서 3kHz까지 0.5kHz단위로 증가시키면서, 이에 반응하는 뇌전위를 디지탈 EEG측정장치를 이용하여 총 7초 동안 1kHz의 sampling frequency로 컴퓨터로 전송하였다. 먼저 신호의 pseudo-phase space분석을 통해 뇌전위의 진폭특성을 파악하였다. 이러한 해석은 생리학적으로 밝져진 소리의 반송주파수와 소리의 크기 인지사이의 상관관계와 잘 일치함이 확인되었다. 또한 이 신호외 Lyapunov exponent 분석을 통해 신호의 발산 특성을 물리적으로 파악하고, 이러한 특성을 이미 여러가지 접근법에 의해 밝혀져 있는 생리학적 실험결과와 관련지어 해석함으로써 반송 주파수에 반응하는 뇌의 mechanism을 뇌전위 측정에 의해서 검출이 가능함을 확인할 수 있었다.

  • PDF

음성신호 분석에 의한 판소리의 음성학적 특징 연구 (A Study on the Acoustic Characteristics of the Pansori by Voice Signals Analysis)

  • 김현숙
    • 한국산학기술학회논문지
    • /
    • 제14권7호
    • /
    • pp.3218-3222
    • /
    • 2013
  • 판소리는 우리나라 전통 성악곡이며 소리, 대화, 몸짓이 어울린 종합 예술로 독창성과 우수성을 세계적으로 인정받은 세계무형유산이다. 특히, 판소리는 소리꾼의 해학적 표현과 청중의 참여도가 높은 점에서 예술적 가치가 있으며 모든 계층이 두루 즐기는 예술로서 사회적 통합의 기능을 담당한 것으로 평가되고 있다. 따라서 본 논문에서는 사회와 시대를 표현한 판소리의 음향학적 특징을 분석하기 위해 판소리 다섯 마당을 대상으로 음성신호 분석 기술을 적용한 상관성 추출 연구를 수행하였다. 이를 위해 판소리 다섯 마당에 대한 스펙트로그램, 피치, 안정도 및 강도 분석을 실험하였다. 실험 결과를 통해 판소리는 청중들에게 집중과 흥미를 지속적으로 유지시키면서 이야기를 풀어가는 특징을 잘 반영하기 위해 목소리의 파동 및 성대 떨림의 변화 폭이 크고 안정적이며 음성 에너지가 큰 소리로 표현하고 있는 것으로 분석되었다.

Convolutional neural network 기법을 이용한 턱수염물범 신호 판별 (Classification of bearded seals signal based on convolutional neural network)

  • 김지섭;윤영글;한동균;나형술;최지웅
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.235-241
    • /
    • 2022
  • 수동 음향 관측을 통해 수집된 방대한 양의 데이터에서 해양포유류의 소리를 탐지하고 식별하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)을 활용한 연구가 많이 수행되고 있다. 본 연구는 2017년 8월부터 2018년 8월까지 동시베리아 해에서 수집된 수중음향 스펙트럼 이미지를 기반으로 CNN을 활용하여 턱수염물범 소리의 분류 자동화 가능성을 확인해 보았다. 학습 데이터로서 다른 소음이 거의 포함되지 않은 뚜렷한 턱수염물범 소리를 사용하였을 때, 암기로 인한 과적합이 발생하였다. 일부 데이터를 소음이 포함된 데이터로 교체하여 학습시켜 수집된 전체 데이터로 평가한 결과 정확도(0.9743), 정밀도(0.9783), 재현율(0.9520)으로 모델이 이전보다 일반화되어 과적합이 방지되는 것을 확인하였다. 본 연구를 통해 물범신호 분류는 학습 데이터에 소음이 포함되었을 때 성능이 증가하는 것으로 나타났다.

선교알람관리시스템의 청각아이콘 개발을 위한 연구 (Development of Auditory Icon in Ship Bridge Alarm Management System)

  • 오승빈;장준혁;김홍태
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2012년도 추계학술대회
    • /
    • pp.5-7
    • /
    • 2012
  • 선교에는 항해사에게 정보를 전달하기 위하여 다양한 신호가 존재한다. 항해 및 통신 장비로부터 나오는 음향 신호 등 다양한 청각 신호들이 존재하지만 이러한 청각 신호, 청각 경고음에 대한 인간의 인지능력에 관한 연구는 미흡한 실정이다. 청각 경고음은 크게 음성(speech), 함축적 소리(abstract sound), 청각 아이콘(auditory icon)으로 구분 할 수 있다. 본 연구에서는 청각 경고음 중 청각아이콘을 활용하여 5가지의 경보상황(엔진, 화재, 조타, 전기, 충돌)에서 청각아이콘에 대한 감성평가를 통해 각 상황에 적합한 청각아이콘을 선별하였다. 본 연구 결과는 선교 내 청각표시장치와 통합선교알람관리시스템을 위한 기초자료로 활용될 수 있을 것으로 기대된다.

  • PDF

입력 신호범위가 넓은 아날로그 다중필터의 설계 (Design of Wide Input Range Multiple Filter-Banks for Analog Cochlear Chip)

  • 최배근;이광;류승탁;조규형
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 D
    • /
    • pp.2613-2615
    • /
    • 2001
  • 청각시스템의 저전력 및 가격의 저렴화를 위해 달팽이관의 BM(Basilar Membrain)모델을 아날로그 VLSI 마이크로 파워 공정으로 구현하고 있다. 본 논문에서는 소리의 주파수 정보 추출기능을 하는 직렬 연결된 트리구조(TSBF : Tree-structured Cascaded Bandpass Filter)의 16채널의 아날로그 중간대역통과 필터회로를 CMOS VLSI 공정을 이용하여 설계하였다. 특히 큰 입력 신호에 대해서도 파형왜곡 없이 선형적인 특성을 가지는 트랜스 컨턱터를 이용하여 필터를 구현하였다. 필터는 저대역통과필터와 출력이득의 감쇄를 줄이기 위해서 중간대역통과필터를 이용하여 전체 시스템을 설계했다. 본 논문에서 기존의 150mVp-p 입력신호 범위의 트랜스 컨턱터를 Substrate 입력을 가지는 트랜스 컨턱터를 이용하여 입력신호 범위를 1Vp-p 까지 늘였다.

  • PDF