• 제목/요약/키워드: 사운드 생성

검색결과 67건 처리시간 0.019초

PC 기반의 Békésy 청력검사 시스템 개발 (Development of a Békésy Audiometry System based on PC)

  • 강덕훈;송복득;신범주;김진동;왕수건
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.77-84
    • /
    • 2011
  • B$\'{e}$k$\'{e}$sy 청력검사는 피검자의 청력 역치를 결정할 수있을 뿐만 아니라 누가현상을 추정 할 수 있고 난청의 병변위치를 규명하는데도 도움을 주는 청력검사 방법이다. 본 논문은 가격 경쟁력을 제공하기 위한 방법으로 PC 사운드카드를 사용하여 ANSI 표준을 준수하는 B$\'{e}$k$\'{e}$sy 청력검사 시스템의 개발에 대해 기술한다. 본 시스템은 동적으로 검사 신호를 생성하며, 실시간으로 검사 결과를 확인할 수 있는 인터페이스를 제공한다. 또한 표준에서 요구하는 최대 청력 레벨을 지원하기 위해 증폭기를 구현한다. 그리고 구현된 시스템이 ANSI 표준을 준수하는지 검증한다.

모바일 기반 증강현실 기술을 활용한 3D전래동화 콘텐츠 연구 (3D Graphic Nursery Contents Developed by Mobile AR Technology)

  • 박영숙;박대우
    • 한국정보통신학회논문지
    • /
    • 제20권11호
    • /
    • pp.2125-2130
    • /
    • 2016
  • 본 논문에서는 모바일 증강현실기술 기반을 활용한 3D전래동화 콘텐츠에 관한 연구이다. 지식기반사회의 핵심콘텐츠 산업으로 주목받고 있는 시공간을 연결하는 SW기술 증강현실(Augmented Reality) 기술을 활용하여 흥미로운 전래동화를 한국어, 중국어, 영어로 자막언어선택으로 외국어학습에 적용한다. 이를 위해 상호작용 AR게임(놀이)으로 재구성하였다. 전래동화는 3D 콘텐츠 제작을 위해 6~8개의 scene으로 분량을 구성하고, 각색하여 번역하였다. 더빙은 모국어로 사용하는 원어민 성우를 통해 표준발음을 사용하여 더빙하였고, 효과음은 장면에 어울리도록 별도 제작하여 편집하였다. 시나리오를 구성하고, 3D 모델구성, 인터렉션 구성, 사운드 이펙트를 구성하고 콘텐츠 메타데이터를 작성한 후, Unity 3D 게임엔진을 실행하여 프로젝트를 생성하고, 스크립터로 기술한다. 재미있고 유익한 전래동화를 ICT기술을 접목한 융복한 콘텐츠로 경험하면서, 첨단기술기반 교육을 수용하며, 생활주변에서 소프트웨어를 인식할 수 있는 기회를 가지게 한다.

패널 스피커의 가진기 및 스피커 배치에 관한 연구 (A study on the arrangement of actuators and speaker zones of the panel speaker)

  • 우정한;이성현;서윤호;마평식;김동준
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.388-394
    • /
    • 2023
  • 얇은 패널에서 음향 정보를 전달하기 위해서 단일 지점을 가진하는 방법은 패널 자체의 진동 특성의 영향으로 방사되는 음장에 영향을 끼치게 된다. 기존의 패널 자체를 방사체로 활용 하고자 하는 스피커 시스템은 단일 또는 스테레오 사운드 제공 목적으로 음원이 되도록 하는 패널 특정 위치에 부착된 가진기를 이용하게 된다. 이렇게 방사하는 음향은 판이 갖는 모달 특성으로 인해 쉽게 왜곡될 수 있어 충분한 음향 파워를 갖거나 높은 방사효율을 기대하기 어렵다. 또한, 몰입감 높은 음장을 구현하기 위해서 한정된 가진기를 이용하는데 한계가 있다. 본 논문에서는 얇은 패널에 고정적으로 부착된 가진기를 이용하여, 패널 임의의 위치에서 음향이 방사되도록 진동-음향 역문제적 기법을 이용하여 진동장을 제어하도록 스피커 영역을 렌더링하여 제어하는 기법에 대해 다루었다. 국소화된 스피커 영역을 패널에서 생성하여 음원의 위치를 변화 시킬 수 있도록 하고, 가지기의 배치와 구현 가능한 스피커 영역의 위치 간 관계를 모사실험을 통해 제어 결과를 비교 및 검토하였다.

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

  • 조민수;권철홍
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.675-681
    • /
    • 2021
  • 최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.

연상 몽타주에서 나타난 수직적 몽타주 분석 -애니메이션 파프리카 중심으로- (Analytic study on Vertical Montage as expressed in Assoziation Montage -Focused on animation, Paprika-)

  • 임운주
    • 한국콘텐츠학회논문지
    • /
    • 제13권1호
    • /
    • pp.83-90
    • /
    • 2013
  • 이 연구는 애니메이션 <파프리카> 작품을 통하여 연상 몽타주에서 나타나는 수직적 몽타주에 관한 해석을 시도하고 있다. 몽타주는 프도프킨, 에이젠슈테인, 자끄 오몽 등 현재까지 지속적으로 연구되어지고 있다. 하지만 기존의 연구들은 몽타주를 시각적 이미지에 보다 더 비중을 두었다. 영상은 시각과 청각으로 이루어져 있고, 이 두 관계는 서로 상호 작용을 하여 효과를 극대화시키는 요소로 작용한다고 볼 수 있다. 이에 앞서 연구한 시각 영상을 분석한 연상 몽타주에 기초하여 청각적 요소를 분석한다면, 좀 더 심층적으로 접근할 수 있을 것이다. 그러므로 이 연구에서 수직적 몽타주는 논리적 몽타주와 충돌 몽타주에서 어떻게 사용되었으며 어떠한 의미를 생성하고 있는지 분석하고자 하는 것이다. 분석 결과, 수직적 몽타주는 논리적 몽타주와 충돌 몽타주에서 전체적으로는 자연적인 일치로 시각 영상에 대한 보완을 하고 선율적 일치로 전체적인 정서를 반영하게 하는 연결 관계를 보였다. 또한 시간과 장소, 그리고 명확하지 않은 공간들에서 운율적 일치를 나타낸다면, 그 요소들이 서로 관계적으로 이어지게 하는 연속성을 나타낸다. 하지만 그 연속성을 끊어내는 역할, 즉 부분적으로 관객을 몰입하게 하는 음조적 요소가 공간과 시간을 뒤집거나 변화할 때 적절하게 사용된다면, 효과를 극대화 시키고 사건의 전환점을 나타내며 등장인물에 대한 집중도를 높이는 것으로 분석되었다.

1차 Ambisonics에 의해 생성되는 가상현실 오디오용 양이 사운드의 한계에 대한 분석 (Analyses on limitations of binaural sound based on the first order Ambisonics for virtual reality audio)

  • 장지호;조완호
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.637-650
    • /
    • 2019
  • 이 논문은 가상현실 오디오에서 널리 사용되는 Ambisonics에 기반하여 헤드폰을 통해 재생하는 binaural sound의 한계를 분석한 것이다. 가상현실 오디오는 청자의 머리 움직임을 보상하는 binaural sound를 통해 제공된다. Ambisonics는 가상현실 오디오에서 청자를 둘러싼 배경음장을 레코딩하고 재생하는데에 널리 사용되는데, 1차 Ambisonics가 간단하다는 장점 때문에 여전히 가상현실 오디오에서 사용되고 있다. 그러나, 물리적인 관점에서 1차의 상한 주파수는 너무 낮아서 귀 위치의 신호를 완벽히 재현하지 못한다. 따라서 이렇게 재생된 binaural sound는 스펙트럼과 음원 위치 형성에서 근본적인 한계를 갖는다. 이 논문은 이러한 한계를 기준 음장과 재생 음장에서의 귀 위치의 신호 비교를 통해 알아 본다. 하나의 입사파를 기준 음장으로 정의하고, 이 것을 가상 스피커를 이용해서 Ambisonics를 통해 재생한다. 주파수 응답, 양이 레벨차, 양이 위상차가 비교된다. 비교 결과, 상한 주파수 이상에서 재생음장의 음압 레벨은 감소하고 수평면 상에서의 음원 위치는 청자의 정면 방향 근처에서만 잘 형성됨을 알 수 있었다.

PC 기반 순음청력검사기를 위한 자동보정시스템 개발 (Development of Automatic Calibration System for PC-Based Pure Tone Audiometer)

  • 김진동;강덕훈;송복득;이일우;공수근;권순복;전계록;신범주;왕수건
    • 한국산학기술학회논문지
    • /
    • 제11권7호
    • /
    • pp.2586-2594
    • /
    • 2010
  • 순음청력검사기는 정확한 주파수와 음압을 갖는 순음과 차폐 음을 생성하여 출력할 수 있어야 한다. 이를 위해 일정한 기간마다 보정을 하는 것이 불가피하다. 그러나 수동 보정을 사용하는 일반 순음청력검사기의 음향 보정은 집중력이 필요할 뿐 아니라 시간이 많이 걸리는 단점이 있다. 반면, PC 기반 순음청력검사기의 경우 소프트웨어를 이용하여 자동으로 보정을 수행하는 것이 가능하다. 본 논문에서는 PC 기반 순음청력검사기의 자동 보정을 지원하기 위해 PC 사운드카드를 이용하여 구현한 음압측정기와 이를 이용한 순음청력검사기의 자동보정모듈을 기술한다. 자동 보정모듈을 이용하여 보정한 PC 기반 순음청력검사기를 국제표준기구가 제공하는 기준등가역치음압수준과의 적합 여부를 검증한다.