• 제목/요약/키워드: spatial cue

검색결과 38건 처리시간 0.022초

An Efficient Time-Frequency Representation for Parametric-Based Audio Object Coding

  • Beack, Seung-Kwon;Lee, Tae-Jin;Kim, Min-Je;Kang, Kyeong-Ok
    • ETRI Journal
    • /
    • 제33권6호
    • /
    • pp.945-948
    • /
    • 2011
  • Object-based audio coding can provide new music applications with interactivity. To efficiently compress a lot of target audio objects, a subband-based parametric coding scheme has been adopted for MPEG spatial audio object coding. In this letter, the time-frequency (T/F) subband analysis structure is investigated. A reconfigured T/F structure is also proposed to enhance the generating performance of sound scenes such as 'karaoke' and 'solo' play in interactive music scenarios. From the experimental results, it was confirmed that the proposed scheme remarkably improves the SNR and sound quality.

가상 공간 개념 스케치를 위한 음향 반향을 포함하는 새로운 곡선 모델링 도구 (A New Curve Modeling Tool with the Acoustic Reflection for the Virtual Spatial Conceptual Sketch)

  • 최상민;김학수;채영호
    • 한국멀티미디어학회논문지
    • /
    • 제12권2호
    • /
    • pp.281-289
    • /
    • 2009
  • 본 논문에서는 공간 스케치에 일반적으로 나타나는 깊이 입력 오차를 줄이는 효과적인 공간 입력을 구현하기 위해 깊이 값 인지를 도와주는 한 면 혹은 두 면의 가상 음향 반향판을 통한 새로운 상호작용 기술을 소개하고, 다양한 실험을 통해 음향 반향판을 가진 가상의 벽이 현실적인 가상 개념 디자인을 위한 효과적인 피드백으로 사용된 것을 보여 준다. 제안된 아이디어를 이용하여 깊이 값이 일정한 평면에서는 한 면 가상 음향 반향판의 피드백을 이용하여 모델과의 일치도를 약 35% 높일 수 있었고, 기울어진 평면에서는 두면 반향을 이용하여 한 면에 비해 악 4%의 일치도를 증가시킬 수 있었으며, 곡면 꽃병에서는 약 15%의 일치도를 증가시킬 수 있었다.

  • PDF

Design and Development of T-DMB Multichannel Audio Service System Based on Spatial Audio Coding

  • Lee, Yong-Ju;Seo, Jeong-Il;Beack, Seung-Kwon;Jang, Dae-Young;Kang, Kyeong-Ok;Kim, Jin-Woong;Hong, Jin-Woo
    • ETRI Journal
    • /
    • 제31권4호
    • /
    • pp.365-375
    • /
    • 2009
  • In this paper, a terrestrial digital multimedia broadcasting (T-DMB) multichannel audio broadcasting system based on spatial audio coding is presented. The proposed system provides realistic multichannel audio service via T-DMB with a small increase of data rate as well as backward compatibility with the conventional stereo-based T-DMB player. To reduce the data rate for additional multichannel audio signals, we compress the multichannel audio signals using the sound source location cue coding algorithm, which is an efficient parametric multichannel audio compression technique. For compatibility, we use the dependent property of an elementary stream descriptor, and this property should be ignored in a conventional T-DMB player. To verify the feasibility of the proposed system, we implement the T-DMB multichannel audio encoder and a prototype player. We perform a compatibility test using the T-DMB multichannel audio encoder and conventional T-DMB players. The test demonstrates that the proposed system is compatible with a conventional T-DMB player and that it can provide a promisingly rich audio service.

공간격자의 내부정점 조합에 의한 가상 개념 스케치용 곡면 모델링 알고리즘 (A Surface Modeling Algorithm by Combination of Internal Vertexes in Spatial Grids for Virtual Conceptual Sketch)

  • 남상훈;김학수;채영호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.217-225
    • /
    • 2009
  • 디자이너가 생각하는 모델을 3차원 입력 장치를 사용하여 공간상에서 스케치를 할 경우 상대적으로 깊이 방향의 위치를 정확히 입력하기 어렵기 때문에 원하는 모델을 단시간에 그리기 어렵다. 본 논문에서는 2차원 스케치에서 습관적으로 사용하는 다중, 반복 스트로크를 공간 스케치 시스템에 적용하여 입력 위치의 에러를 보정함과 동시에 효율적으로 개념상의 모델을 실체화 할 수 있는 모델링 알고리즘을 제안한다. 디자이너는 곡면을 그리기 위하여 스트로크를 입력한 후 바로 그 결과를 확인할 수 있으며, 추가적인 스트로크를 입력할 때마다 곡면은 변형되고 자신이 원하는 형태로 변형되는 지 확인하면서 새로운 스트로크를 입력할 수 있다. 이를 위하여 드로잉 공간을 격자 형태의 공간으로 나누고, 각각의 격자 내부에는 격자안에서 이동이 자유로운 내부 정점을 정의하여 드로잉 공간에서의 데이타를 단순화하였다. 이정점을 인접격자와의 상호관계 패턴으로 정의하여 디자이너가 의도한 개념상의 모델을 효과적으로 3차원모델로 구체화하는 3차원 공간 스케치 시스템을 구현하였다.

유아의 물체위치 기억에 관한 연구 (Memory-for-Object Location in Toddlers)

  • 김미해
    • 아동학회지
    • /
    • 제7권1호
    • /
    • pp.85-95
    • /
    • 1986
  • The purpose of the present research was to study effects of experimental conditions and developmental tendency in the use of external cues in memory-for-object location in toddlers. This study consisted of two experiments. In study 1, the subjects were 12 toddlers, 18 to 23 months old ; in study 2, 30 toddlers, 24 to 41 months old. The findings showed that memory-for-object location in toddlers was different in accordance with experimental conditions; that is, memory-for-object location in the natural condition was significantly better than in the artificial condition. Effects of external cues were found ; that is, memory-for-object location was best in the condition of spatial cues, and next best in the condition of picture cues, and least good in the no cue condition.

  • PDF

복소 공간큐를 활용한 다채널 오디오 코딩 기술 (Complex Spatial Cue based Channel Audio Coding)

  • 백승권;임우택;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.58-60
    • /
    • 2022
  • 본 논문에서는 복소(complex) 공간큐를 활용한 다채널 오디오 부호화 기술을 제안한다. 복소 공간큐 방식의 다채널 오디오 부호화 기술은 시간영역에서 수행된다. 시간영역의 오디오 채널 신호를 복소 데이터로 변환하여 각 오디오 채널 간의 상관관계를 복소 공간큐로 표현하고, 이를 활용하여 채널 부호화를 수행하기 위한 오디오 채널 신호를 생성한다. 참조 기술로는 최고 성능의 오디오 코덱인 USAC의 예측 부호화 방식의 다채널 오디오 부호화 기술과 비교하여 정보량 감축 측면에 있어서 평균 2.24 dB 이상의 높은 SNR을 나타냄을 관측할 수 있었다.

  • PDF

장소지시단서로서의 지하철역 환경디자인 기법에 관한 연구 -서울, 동경, 타이페이 사례를 중심으로- (A Study on Environmental Design Treatments of Subway Stations in Terms of Visual Cues for Place Indication - Focused on the Cases of Seoul, Tokyo and Taipei -)

  • 박혜경
    • 디자인학연구
    • /
    • 제19권5호
    • /
    • pp.351-362
    • /
    • 2006
  • 현대 대도심 지하철은 밀폐된 공간으로 노선에 따라 다수의 역이 연결되어 있어 길찾기의 문제의 발생 빈도가 높은 것으로 알려져 있다. 따라서 이용자가 자신의 위치를 인지할 수 있도록 장소적 정보를 최대한 표현하는 시각적 장소지시단서(visual cue)가 제공되어야 할 필요성이 제기되고 있다. 본 연구는 대중교통수단으로서의 지하철 사용이 늘어감에 따라 길찾기 관련 문제들에 대한 관심이 증가하는 상황에서 서울, 동경, 타이페이 주요 지하철역의 장소지시적 단서로서 역할하는 환경디자인 사례 및 사용된 디자인 기법을 조사 분석함으로써 이용자를 위한 길찾기 지원 디자인 가이드라인 도출에 기여하는 목적을 가진다. 이론연구 결과, 시각적 장소지시단서의 유형으로 유도표식, 구역차별화, 랜드마크의 방법이 도출되었고 사례조사를 통하여 유도표식에서 노선색선의 상하배열, 양면배열, 변형 그래픽 기법이, 구역차별화에서는 벽면과 바닥패턴, 기둥과, 벽면의 강조색, 마감 재료 사용에 의한 차별화 기법이, 그리고 랜드마크에서는 수퍼그래픽, 상징물, 예술장식, 장식조명 등에 의한 기법들이 도출되었다. 서울 조사대상역의 경우, 연결노선의 색을 이용한 유도 표식이 가장 적극적으로 사용되고 있었으며 바닥패턴이나 강조색을 이용한 벽면과 기둥에 의한 구역차별화도 적극 도입하고 있었다. 또한 호돌이, 훈민정음과 같은 장소의 이해를 돕는 랜드마크적 요소도 적극 활용되고 있었다. 동경 조사대상역의 경우, 유도표식에 의존하기 보다는 구역 차별화의 방법을 적극 활용하는 것으로 나타났는데 이는 공간구조와 지시내용의 복잡성 때문인 것으로 해석된다. 타이페이시 조사대상역의 경우, 전반적으로 단순하며 통일된 이미지로서 장소지시는 최소한의 표식선이나 랜드마크에 의존하고 있었다. 특히 구역차별화의 사례가 미약하였는데 이는 대부분 역이 광장형의 오픈 스페이스로서 개방된 시야가 확보되기 때문인 것으로 해석된다. 본 연구의 결과는 향후 다양한 검증을 통하여 보다 정확한 길찾기 지원적 측면의 환경디자인 가이드라인 제시로 이어져야 할 것이다.

  • PDF

표적과 방해자극의 반구간 분리가 반응 간섭에 미치는 영향 (Between-hemisphere Separation of Target and Distractor Reduces Response Interference)

  • 김민식;손영숙
    • 인지과학
    • /
    • 제17권1호
    • /
    • pp.29-52
    • /
    • 2006
  • 이 연구는 Weissman과 Banich(1999)가 제안했던 반구 간의 상호작용보다도 표적자극과 방해자극의 반구 간 분리처리가 간섭을 감소시키는 데 더 효과적이라는 것을 밝히기 위해 수행되었다. 이를 위해 사각형의 색과 단어가 의미하는 색을 비교하는 세 개의 실험이 수행되었다. 실험 1에서는 표적자극 중의 하나인 단어의 색 차원이, 실험 2와 3에서는 단어의 글자 색이 검정색으로 고정된 상태에서 제 3의 자극인 원의 색이 방해자극으로 사용되었다. 실험 결과 두 표적자극의 비교를 위해 반구간 상호작용이 요구되는 반구간 비교조건에서, 반구간 상호작용은 요구하지 않지만 방해자극이 표적자극과 다른 반구로 투사된 반구내 비교 조건보다 더 큰 간섭효과가 관찰되었다. 이 결과는 반구간 상호작용보다도 표적과 방해자극의 반구간 분리가 간섭 감소에 더 효과적임을 시사한다. 실험 3에서는 원이 단어나 사각형과 분리되어 다른 반구에 제시될 때 주변단서를 이용하여 원의 위치로 주의를 유도하면 방해자극의 반구간 분리 효과가 사라지면서 반구간 비교와 반구내 비교 조건의 간섭효과가 유사해지는 것을 보여 주었다.

  • PDF

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

  • 김현휘;김인철
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.369-379
    • /
    • 2016
  • 본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.

ILD DISTORTION을 이용한 MPEG SURROUND의 음질 개선 (Sound Quality Enhancement in MPEG Surround by Using ILD Distortion)

  • 전상배;최인용;성굉모
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.241-242
    • /
    • 2006
  • MPEG Surround is an audio coding technology that represents multi-channel audio signal with downmixed audio signal(s) and very low bitrate side information based on Binaural Cue Coding. The side information consists of Inter-Channel Level Difference, Inter-Channel Correlation, and payloads. These two parameters are correspondent to the well-known spatial parameters in psycho-acoustics, Inter-aural Level Difference (ILD) and Inter-Aural Cross Correlation (IACC). Though ICLD is to provide perceptually equivalent ILD to the listener, however, the ILD of the original multi-channel audio signal and that of the MPEG Surround encoded signal was different. The difference between two ILD values is defined as ILD Distortion (ILDD). This paper provides how ILDD can be applied to enhance sound quality in MPEG Surround and how much ILDD is decreased.

  • PDF