• 제목/요약/키워드: 컴퓨터 소리합성

검색결과 15건 처리시간 0.024초

스크린드 군집화 기반의 사운드 합성을 이용한 효율적인 거품 사운드 생성 (Efficient Foam Sound Generation with Screened Clustering Based Sound Synthesis)

  • 신영찬;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.553-556
    • /
    • 2022
  • 본 논문에서는 거품 입자를 활용하여 시뮬레이션 장면에 맞는 소리를 효율적으로 합성할 수 있는 기법을 제안한다. 물리 기반 시뮬레이션 환경에서 소리를 표현하는 대표적인 방법은 생성과 합성이다. 사운드 생성의 경우 시뮬레이션 장면마다 물리 기반 접근법을 사용하여 소리를 생성할 수 있는데 계산 시간과 재질 표현의 어려움으로 다양한 시뮬레이션 장면에 대한 소리를 만들어 내기에는 쉽지 않다. 사운드 합성의 경우 소리 데이터를 미리 구축해야 하는 사전 준비가 필요하지만, 한 번 구축하면 비슷한 장면에서는 같은 소리 데이터를 활용할 수 있는 점이 있다. 따라서 본 논문에서는 거품 시뮬레이션의 소리 합성을 위해 소리 데이터를 구축하고 거품 입자의 효율적인 군집화를 통해 계산 시간을 줄이면서 소리의 사실감은 개선할 수 있는 사운드 합성 기법을 제안한다.

  • PDF

가상환경에서 지형의 형태와 고도를 고려한 인터렉티브한 사운드 합성 (Interactive Synthesizing of Sound in Virtual Environments with considering Shape and Elevation of the Terrain)

  • 박소연;박성아;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.593-596
    • /
    • 2021
  • 본 논문에서는 지형의 고도와 기울기를 고려하여 사운드의 확산과 회절을 인터렉티브하게 표현할 수 있는 사운드 합성 기법을 제안한다. 우리의 접근 방식은 광선 추적법(Raytracing)을 기반으로 소리의 크기를 보여줄 수 있는 사운드 강도 맵을 빠르게 계산한다. 지형의 고도와 기울기 값을 고려하여 소리의 강도 맵에 가중치를 적용하여, 결과적으로 지형의 지오메트리 분석인 큰 계산 과정을 피하고 지형을 고려한 소리의 크기를 인터렉티브하게 업데이트한다. 이 과정에서 소리의 근원지에 따른 고도 간의 격차를 계산하여 소리의 크기를 자동으로 감쇠시키며, 주변 지형의 공간 기울기를 기반으로 기울기의 차에 따라 소리의 크기를 자동으로 감쇠시킨다. 본 논문에서 제안하는 방법을 이용한 소리는 실제 높낮이가 있는 현실의 지형에서 듣는 소리의 전파 및 감쇠와 유사한 형태를 보여주며, 소리의 위치에 따라서 소리 감소 패턴이 변경되고, 또한, 지형에 따라서 소리의 크기가 제어되는 결과를 보여준다.

  • PDF

옷감 시뮬레이션의 절차적 사운드 합성을 위한 새로운 사운드의 에너지와 반전 매핑 (Novel Sound Energy and Reversal Mapping for Procedural Sound Synthesis in Cloth Simulation)

  • 김동희;문성혁;신영찬;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.587-590
    • /
    • 2022
  • 본 논문에서는 물리기반 옷감 시뮬레이션에 적합한 소리를 효율적으로 생성하기 위한 데이터 기반 합성 기법을 제안한다. 시뮬레이션에서 소리를 표현하는 방법은 크게 생성과 합성이 있지만, 합성은 실시간 애플리케이션에서 활용이 가능하기 때문에 인터랙티브한 환경에서 자주 활용되고 있다. 하지만, 데이터에 의존하기 때문에 원하는 장면에 부합하는 사운드를 합성하기는 어려우며, 기존 방법은 한 방향으로만 사운드 데이터를 검색하기 때문에 불연속으로 인한 끊김 현상이 발생한다. 본 논문에서는 양방향 사운드 합성 기법을 제시하며, 이를 통해 불연속적으로 합성되는 사운드 결과를 효율적으로 개선될 수 있음을 보여준다.

  • PDF

장애물 객체의 회전 벡터를 이용한 VR 환경에서의 효율적인 음향 처리 및 합성 (Efficient Sound Processing and Synthesis in VR Environment Using Curl Vector of Obstacle Object)

  • 박성아;박소연;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.369-372
    • /
    • 2022
  • 본 논문에서는 장애물 객체의 회전 벡터를 이용하여 VR 환경에서의 효율적으로 음향 처리 및 합성하는 방법을 제안한다. 현실에서 소리와 장애물이 있을 때, 소리는 장애물의 형태에 따라 퍼지면서 전파되는 형태를 보여준다. 이 같은 특징을 가상현실 환경에 유사하게 음향 처리하고자 하며 이를 위해 장애물 객체의 위치와 소리의 근원지 위치를 입력으로 소리의 전파 형태를 근사한다. 이때 모서리 부근에서 표현되는 소리의 회전을 계산하기 위해 장애물의 회전벡터(Curl vector)를 기반으로 소리의 회전을 추출하였으며, 장애물 형태를 컨볼루션(Convolution)하여 소리가 바깥 방향으로 전파되는 형태를 모델링한다. 또한, 장애물과 소리 벡터 사이의 거리, 소리 근원지와 소리 벡터 사이의 거리를 계산하여 소리의 크기를 감쇠 시켜 주며, 최종적으로 장애물 주변으로 퍼지는 벡터 모양인 외부벡터를 합성하여 장애물로부터 외부로 퍼지는 벡터의 방향을 설정한다. 본 논문에서 제안하는 방법을 이용한 소리는 장애물과의 거리와 형태를 고려하여 퍼지는 사운드 벡터 형태를 보여주며, 소리 위치에 따라 소리 감소 패턴이 변경되고, 장애물 모양에 따라 흐름이 조절되는 결과를 보여준다. 이 같은 실험은 실제 현실에서 소리가 장애물의 모양에 따라 나타나는 소리의 변화 및 패턴을 거의 유사하게 표현할 수 있다.

  • PDF

캡스트럼 포락선을 이용한 해금 소리의 포만트 합성 (Formant Synthesis of Haegeum Sounds Using Cepstral Envelope)

  • 홍연우;조상진;김종면;정의필
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.526-533
    • /
    • 2009
  • 본 논문에서는 전통 현악기 해금의 스펙트럼 모델링을 위해 캡스트럼 포락선을 이용한 포만트 합성법을 제안한다. 스펙트럼 모델링은 입력 신호를 정현파 성분과 노이즈 성분의 합으로 해석하여 음을 합성하는 기술로 주기성이 있는 현악기나 관악기의 음 합성에 효과적이다. 캡스트럼 포락선의 포만트는 정현파 성분 합성을 위한 파라미터로 활용하였다. 정현파 성분을 합성하기 위해 기존의 가산합성 방식과는 달리 IIT (Impulse Invariant Transform)로 공명기를 설계하였으며 배음간 크기 보완을 위해 대역 통과 필터를 추가하였다. 원음과 합성된 정현파 성분의 차로 구해진 노이즈 성분에 포함된 일부 유효배음을 제거하면 완전한 노이즈 성분을 구할 수 있으며 선형 보간법 (linear interpolation)에 기초하여 그 주파수 특성을 파라미터화 하였다. 최종적으로 합성된 노이즈 성분과 정현파 성분을 더하여 해금 단위음을 합성하였고 합성음은 원음과 매우 유사하였다.

음향 양자 이론의 사운드 디자인적 응용 (Theory of Acoustic Quanta and its Application on Sound Design)

  • 구자환
    • 한국산학기술학회논문지
    • /
    • 제19권9호
    • /
    • pp.420-426
    • /
    • 2018
  • 데니스 게이버(Dennis Gabor)의 음향 양자(Acoustic Quanta) 이론은 음향 합성법의 하나인 그래뉼러 합성법(Granular Synthesis)의 이론적 토대가 되어 많은 컴퓨터 음악 작곡가들과 사운드 디자이너들에게 영감을 주었다. 음향 양자는 1에서 100 ms의 지속시간을 가진, 시간적으로 더 이상 짧게 분해될 수 없는 소리를 뜻한다. 그래뉼러 합성법은 원음을 매우 짧은 시간 간격으로 분할하여 소리 입자들(Sound Grain)로 만든 다음, 이 소리 입자들을 조합하여 새로운 음악 또는 음색을 구현하는 방법이다. 음향 양자 개념은 그래뉼러 합성법의 소재가 되는 소리 입자의 이론적 근거가 되었다. 기존 음향 합성법과는 전혀 다른 음색의 사운드를 만들어 낼 수 있는 그래뉼러 합성법은 사운드 디자인 분야에서 다양한 용도로 사용 가능하다. 본 논문에서는 게이버의 음향 양자 개념을 소개하고 이를 그래뉼러 합성법에 적용하여 활용 가능한 사운드 디자인 방법, 특히 동기식(Synchronous) 그래뉼러 방식에 의한 신디사이저(Synthesizer) 제작 가능성과 그 응용에 대하여 논하였다. 연구결과 가청주파수를 감안한 음향 양자의 지속시간은 0.239에서 33.367 ms 사이가 되어야하기 때문에 음향 양자의 본래 개념과는 차이가 있었다.

Csound를 이용한 음악 프로그래밍 언어 제작 (Music Programming Language Composition Using Csound)

  • 여영환
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.365-370
    • /
    • 2005
  • 본 논문은 Csound 프로그래밍 언어에 대한 발전된 학술 연구 혹은 독창적인 학술 아이디어를 탐구하기에 앞서, 현재 한국에서는 학술적 연구나 소개가 전혀 이루어지지 않은 Csound 음악 프로그래밍 언어를 누구도 쉽게 접근할 수 있도록 체계화된 이론을 정립하고 보급하기 위해 제안한 것이다. Csound는 세계적인 컴퓨터 음악음향 제작 프로그래밍 언어이며, 세계적으로 유명한 사운드 디자이너들이 이용하는 전문적인 텍스트 기반 소프트웨어 신디사이저로, 1985년 M.I.T. Media Lab의 Barry Vercoe에 의해 개발되었다. 본 본문은 서양 전통음악의 역사적인 관점에서 음악과 자연의 소리 혹은 특정 매체로부터 발생되는 소리와의 결합시기를 전자음악과 음악음향 제작의 출발점으로 제시하였다. 그리고 기초적인 Csound의 작동원리를 서술하고. 이를 기초로 Csound를 이용한 음악 프로그래밍의 적용예를 제시하였으며, 결론에서는 본 논문의 연구 목표와 앞으로의 연구 과제를 서술하였다.

캡스트럼 분석을 이용한 해금의 스펙트럼 모델링 (Spectral Modeling of Haegeum Using Cepstral Analysis)

  • 홍연우;강명수;조상진;김종면;이정철;정의필
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.243-250
    • /
    • 2010
  • 본 논문에서는 해금 소리의 시간에 따른 변화를 사실적으로 묘사하기 위해 캡스트럼 분석을 이용한 전통 악기 해금의 스펙트럼 모델링을 제안한다. 정확한 캡스트럼 분석 결과를 얻기 위해 프레임 사이즈는 입력 신호의 3주기로 하였고 포만트 추출에 더 많은 캡스트럼 계수를 활용하였다. 정현파 성분 합성 과정에서 대역통과 필터의 차단주파수를 공명점 별로 유동적으로 조절하고 노이즈 성분에 남아있는 피크 성분들을 제거하는 과정을 추가하여 성능을 향상시켰다. 음 높이의 변화를 판단하기 위해 입력 프레임을 묵음구간, 어택구간, 지속구간으로 분류하였고 기본주파수에 따라 프레임 사이즈를 가변적으로 조절하였으며 지속구간에서의 기본주파수 검출 오류를 수정함으로써 정확도를 향상시켰다. 해금 연주 전문가의 청취테스트를 통해 원음과 합성음이 96~100 % 유사하다는 평가 결과를 얻었다.

이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템 (Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features)

  • 임정우;장윤나;손준영;이승윤;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

인터렉티브 하이브리드 미디어 응용기술 -MPEG-4 SNHC를 중심으로-

  • 김형곤
    • 방송과미디어
    • /
    • 제3권2호
    • /
    • pp.44-58
    • /
    • 1998
  • 최근의 멀티미디어 기술은 정보의 디지털화와 온라인화에 따라 가전, 컴퓨터, 통신 및 방송 기술이 융화되어 가는 추세에 있으며, 대화형의 하이브리드 멀티미디어 기술을 그 특징으로 하고있다. 하이브리드 멀티미디어는 컴퓨터 그래픽 및 미디(MIDI) 기술로 인위적으로 생성한 2D/3D그래픽 및 음향을 실제의 자연적인 영상과 소리에 추가하여 합성하므로 생성된다. MPEG-4는 이렇게 인위적으로 합성되거나 자연적인 영상 혹은 음향 정보의 디지털 하이브리드 멀티미디어 부호화를 목적으로 하며, 활성화된 혼합 미디어의 내용기반 처리, 상호, 동작 및 사용자의 쉬운 접근 등을 가능하게 한다. SNHC(Synthetic-Natural Hybrid Coding)는 기존의 수동적인 미디어의 전달뿐 아니라 실시간 처리가 가능한 인터랙티브 응용 분야까지 다루고 있으며, 통합된 시공간 부호화 기법을 사용하여 시각, 청각, 2차원, 3차원 컴퓨터 그래픽스 등 다양한 형태의 표준 AV(Aural/Visual) 객체를 처리한다. 표준화는 주로mesh-segmented 비디오 부호화, 구조물 부호화, 객체간의 동기화, AV 객체 스트림의 멀티플렉싱, 혼합 미디어 형태의 시-공간 통합화 등에서 이루어지게 되는데, 이는 궁극적으로 네트워크로 연결되는 가상 환경(Virtual Environment)에서 다수의 사용자가 서로 상호작용 할 수 있는 틀을 제공하는데 있다. 이러한 틀이 제공되면, 대화형 하이브리드 멀티미디어라는 새로운 형태의 정보를 사용함으로써 기존의 미디어로는 경험하지 못하는 다양한 응용과 서비스를 경험할 수 있을 것이다.

  • PDF