• 제목/요약/키워드: auditory signal design

검색결과 14건 처리시간 0.035초

Aurally Relevant Analysis by Synthesis - VIPER a New Approach to Sound Design -

  • Daniel, Peter;Pischedda, Patrice
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2003년도 춘계학술대회논문집
    • /
    • pp.1009-1009
    • /
    • 2003
  • VIPER a new tool for the VIsual PERception of sound quality and for sound design will be presented. Requirement for the visualization of sound quality is a signal analysis modeling the information processing of the ear. The first step of the signal processing implemented in VIPER, calculates an auditory spectrogram by a filter bank adapted to the time- and frequency resolution of the human ear. The second step removes redundant information by extracting time- and frequency contours from the auditory spectrogram in analogy to contours of the visual system. In a third step contours and/or auditory spectrogram can be resynthesised confirming that only aurally relevant information were extracted. The visualization of the contours in VIPER allows intuitively to grasp the important components of a signal. Contributions of parts of a signal to the overall quality can be easily auralized by editing and resynthesising the contours or the underlying auditory spectrogram. Resynthesis of time contours alone allows e.g. to auralize impulsive components separately from the tonal components. Further processing of the contours determines tonal parts in form of tracks. Audible differences between two versions of a sound can be visually inspected in VIPER through the help of auditory distance spectrograms. Applications are shown for the sound design of several interior noises of cars.

  • PDF

가전제품의 청각 사용자 인터페이스(AUI) 디자인을 위한 가이드라인 개발 사례 (Developing the Design Guideline of Auditory User Interface for Digital Appliances)

  • 이주환;전명훈;한광희
    • 감성과학
    • /
    • 제10권3호
    • /
    • pp.307-320
    • /
    • 2007
  • 본 연구는 가전제품의 제품군과 그 기능들에 따라 차별화 가능한 인지적, 감성적 '청각 사용자 인터페이스 디자인 가이드라인(Auditory User Interface Design Guideline)'을 마련하고, 가전제품의 작동기능 정보와 직관적으로 연합 가능한 청각신호(auditory signal)를 제작할 수 있는 지침을 제시하여 GUI 중심의 제품 설계에서 한차원 확장되고 사용자의 다중감각적 특성이 적용된 디자인 방법을 실무에 적용하고자 하였다. 특히 AUI에 대한 체계를 확립함으로써 브랜드 정체성(Brand Identity) 및 기업 이미지를 제고할 수 있다는 목적을 함께 고려하였다. 이러한 연구가 필요했던 이유는 가전제품에 대한 소비자의 심적 모형(mental model)과 감성 측면에서의 접근에 대한 요구 때문인데, 이는 AUI의 체계적 적용이 아닌 임의적 연결(mapping)으로 인한 버저(buzzer) 청각신호의 짜증(annoying) 발생이 빈번한 사례들에서 출발한다. 또한 GUI의 변화와 수준에 미치지 못하는 AUI의 업그레이드 필요성과 가전제품에서의 감성 마케팅 경향을 반영하는 의미론 지니고 있다. 이와 함께 멀티미디어 환경의 급속한 확산으로 다중감각적 정보제시(multimodal display)가 요구되는 상황에 걸맞은 시도이다. 본 연구는 특정 가전제품이나 특정 기능이 지니고 있는 인지적, 감성적 차원의 속성을 청각신호(auditory signal)의 다양한 속성들로 유발하는 관계를 추출하고, 이를 형성하는 기본 메커니즘에 대한 경험적 자료를 제시하여, 가전제품의 AUI 디자인에 유용한 가이드라인을 제공하고자 하였다. 그러나 본 논문에서는 연구의 구체적이고 세부적인 결과보다는 전체적인 계획과 진행과정의 절차를 소개하여 관련분야 연구 진행의 참조적 틀을 마련하고자 한다.

  • PDF

가전제품의 청각 사용자 인터페이스(AUI) 설계를 위한 가이드라인 개발 연구 (Developing the Design Guideline of Auditory User Interface for Domestic Appliances)

  • 이주환;전명훈;안정희;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.1-8
    • /
    • 2006
  • 본 연구는 가전제품의 제품군과 그 기능들에 따라 차별화 가능한 인지적, 감성적 '청각 사용자 인터페이스 디자인 가이드라인(Auditory User Interface Design Guideline)'을 마련하고, 가전제품의 작동기능 정보와 직관적으로 연합 가능한 청각신호(auditory signal)를 제작할 수 있는 지침을 제시하여 GUI 중심의 제품 설계에서 한 차원 확장되고 사용자의 다중감각적 특성이 적용된 디자인 방법을 실무에 적용하고자 하였다. 특히 AUI 에 대한 체계를 확립함으로써 브랜드 정체성(Brand Identity) 및 기업 이미지를 제고할 수 있다는 목적을 함께 고려하였다. 이러한 연구가 필요했던 이유는 가전제품에 대한 소비자의 심적 모형(mental model)과 감성 측면에서의 접근에 대한 요구 때문인데, 이는 AUI 의 체계적 적용이 아닌 임의적 연결(mapping)으로 인한 버저(buzzer) 청각신호의 짜증(annoying) 발생이 빈번한 사례들에서 출발한다. 또한 GUI 의 변화와 수준에 미치지 못하는 AUI 의 업그레이드 필요성과 가전제품에서의 감성 마케팅 경향을 반영하는 의미를 지니고 있다. 이와 함께 멀티미디어 환경의 급속한 확산으로 다중감각적 정보제시(multimodal display)가 요구되는 상황에 걸맞은 시도이다. 본 연구는 특정 가전제품이나 특정 기능이 지니고 있는 인지적, 감성적 차원의 속성을 청각신호(auditory signal)의 다양한 속성들로 유발하는 관계를 추출하고, 이를 형성하는 기본 메커니즘에 대한 경험적 자료를 제시하여, 가전제품의 AUI 디자인에 유용한 가이드라인을 제공하고자 하였다. 그러나 본 논문에서는 연구의 구체적이고 세부적인 결과보다는 전체적인 계획과 진행과정의 절차를 소개하여 관련분야 연구 진행의 참조적 틀을 마련하고자 한다.

  • PDF

Auditory Model Design for Objective Audio Quality Measurement

  • Dongil Seo;Park, Se-Hyoung;Ryu, Seung-wan;Jaeho Shin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -3
    • /
    • pp.1717-1720
    • /
    • 2002
  • Objective quality measurement schemes that in- corporate properties of the human auditory system. The basilar membrane(BM) acts as a spectrum analyzer, spatially decomposing the signal into frequency components. Each filterbank is an implementation of the ERB, gam-machirp function. This filterbank is level-dependent asymmetric compensation filters. And for the validation of the auditory model, we calculate the CPD. Quality measurement is obtained from the result.

  • PDF

Ergonomic Recommendation for Optimum Positions and Warning Foreperiod of Auditory Signals in Human-Machine Interface

  • Lee, Fion C.H.;Chan, Alan H.S.
    • Industrial Engineering and Management Systems
    • /
    • 제6권1호
    • /
    • pp.40-48
    • /
    • 2007
  • This study investigated the optimum positions and warning foreperiod for auditory signals with an experiment on spatial stimulus-response (S-R) compatibility effects. The auditory signals were presented at the front-right, front-left, rear-right, and rear-left positions from the subjects, whose reaction times and accuracies at different spatial mapping conditions were examined. The results showed a significant spatial stimulus-response compatibility effect in which faster and more accurate responses were obtained in the transversely and longitudinally compatible condition while the worst performance was found when spatial stimulus-response compatibility did not exist in either orientation. It was also shown that the transverse compatibility effect was found significantly stronger than the longitudinal compatibility effect. The effect of signal position was found significant and post hoc test suggested that the emergent warning alarm should be placed on the front-right position for right-handed users. The warning foreperiod prior to the signal presentation was shown to influence reaction time and a warning foreperiod of 3 s is found optimal for the 2-choice auditory reaction task.

인간 청각 모델의 설계 및 성능 평가 (Human Auditory Model Design and Quality Assessment)

  • Ryu, Seung-Wan;Kim, Su-Kweor;Park, Jeong-Yeol;Jaeho Shin
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2144-2147
    • /
    • 2003
  • Objective quality measurement schemes that incorporate properties of the human auditory system. The basilar membrane (BM) acts as a spectrum analyzer, spatially decomposing the signal into frequency components. Filterbanks were used to complementing the linearity of BM. Each filterbank is an implementation or the Equivalent rectangular Bandwidth (ERB), gammachirp function. This filterbank is level-dependent asymmetric compensation filters. And for the validation of the auditory model, we calculate the calculated perceived difference(CPD).

  • PDF

청각시스템을 기반으로 한 새로운 오디오 워터마킹 시스템 설계 (Design of a New Audio Watermarking System Based on Human Auditory System)

  • 신동환;신승원;김종원;최종욱;김덕영;김성환
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제51권7호
    • /
    • pp.308-316
    • /
    • 2002
  • In this paper, we propose a robust digital copyright-protection technique based on the concept of human auditory system. First, we propose a watermarking technique that accepts the various attacks such as, time scaling, pitch shift, add noise and a lot of lossy compression such as MP3, AAC WMA. Second, we implement audio PD(portable device) for copyright protection using proposed method. The proposed watermarking technique is developed using digital filtering technique. Being designed according to critical band of HAS(human auditory system), the digital filers embed watermark without nearly affecting audio quality. Before processing of digital filtering, wavelet transform decomposes the input audio signal into several signals that are composed of specific frequencies. Then, we embed watermark in the decomposed signal (0kHz~11kHz) by designed band-stop digital filer. Watermarking detection algorithm is implemented on audio PD(portable device). Proposed watermarking technology embeds 2bits information per 15 seconds. If PD detects watermark '11', which means illegal song. PD displays "Illegal Song" message on LCD, skips the song and plays the next song, The implemented detection algorithm in PD requires 19 MHz computational power, 7.9kBytes ROM and 10kBytes RAM. The suggested technique satisfies SDMI(secure digital music initiative) requirements of platform3 based on ARM9E core.

High Embedding Capacity and Robust Audio Watermarking for Secure Transmission Using Tamper Detection

  • Kaur, Arashdeep;Dutta, Malay Kishore
    • ETRI Journal
    • /
    • 제40권1호
    • /
    • pp.133-145
    • /
    • 2018
  • Robustness, payload, and imperceptibility of audio watermarking algorithms are contradictory design issues with high-level security of the watermark. In this study, the major issue in achieving high payload along with adequate robustness against challenging signal-processing attacks is addressed. Moreover, a security code has been strategically used for secure transmission of data, providing tamper detection at the receiver end. The high watermark payload in this work has been achieved by using the complementary features of third-level detailed coefficients of discrete wavelet transform where the human auditory system is not sensitive to alterations in the audio signal. To counter the watermark loss under challenging attacks at high payload, Daubechies wavelets that have an orthogonal property and provide smoother frequencies have been used, which can protect the data from loss under signal-processing attacks. Experimental results indicate that the proposed algorithm has demonstrated adequate robustness against signal processing attacks at 4,884.1 bps. Among the evaluators, 87% have rated the proposed algorithm to be remarkable in terms of transparency.

Folded Architecture for Digital Gammatone Filter Used in Speech Processor of Cochlear Implant

  • Karuppuswamy, Rajalakshmi;Arumugam, Kandaswamy;Swathi, Priya M.
    • ETRI Journal
    • /
    • 제35권4호
    • /
    • pp.697-705
    • /
    • 2013
  • Emerging trends in the area of digital very large scale integration (VLSI) signal processing can lead to a reduction in the cost of the cochlear implant. Digital signal processing algorithms are repetitively used in speech processors for filtering and encoding operations. The critical paths in these algorithms limit the performance of the speech processors. These algorithms must be transformed to accommodate processors designed to be high speed and have less area and low power. This can be realized by basing the design of the auditory filter banks for the processors on digital VLSI signal processing concepts. By applying a folding algorithm to the second-order digital gammatone filter (GTF), the number of multipliers is reduced from five to one and the number of adders is reduced from three to one, without changing the characteristics of the filter. Folded second-order filter sections are cascaded with three similar structures to realize the eighth-order digital GTF whose response is a close match to the human cochlea response. The silicon area is reduced from twenty to four multipliers and from twelve to four adders by using the folding architecture.

생체신호를 이용한 감정인지시스템의 설계 및 구현 (Design and Implementation of an Emotion Recognition System using Physiological Signal)

  • 오지수;강정진;임명재;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.57-62
    • /
    • 2010
  • 최근에 모바일 시장에서는 시각과 청각, 촉각에 의존하여 상대방에게 의사를 전달하는 기술이 발전되고 있지만, 인간이 의사소통을 하는데 있어서 시각 촉각 청각 후각 미각인 오감의 요소를 필요로 한다. 그러므로 본 논문에서는 음성과 체온, 맥박 같은 생체신호를 통하여 감정을 인지하고 향기가 나는 모바일 기기를 사용하여 상대방에게 의사를 전달 할 때 오감의 요소 중 후각적인 요소를 접목하였다. 또한 사용자 감정의 변화에 따라 적절한 향기를 발산하도록 하여 사용자의 감정을 컨트롤 할 수 있는 시스템을 설계하고 구현하였다.