• Title/Summary/Keyword: 청취 모델

Search Result 51, Processing Time 0.026 seconds

HRTF Interpolation Using a Spherical Head Model (원형 머리 모델을 이용한 머리 전달 함수의 보간)

  • Lee, Ki-Seung;Lee, Seok-Pil
    • The Journal of the Acoustical Society of Korea
    • /
    • v.27 no.7
    • /
    • pp.333-341
    • /
    • 2008
  • In this paper, a new interpolation model for the head related transfer function (HRTF) was proposed. In the method herein, we assume that the impulse response of the HRTF for each azimuth angle is given by linear interpolation of the time-delayed neighboring impulse responses of HRTFs. The time delay of the HRTF for each azimuth angle is given by sum of the sound wave propagation time from the ears to the sound source, which can be estimated by using azimuth angle, the physical shape of the underlying head and the distance between the head and sound source, and the refinement time yielding the minimum mean square error. Moreover, in the proposed model, the interpolation intervals were not fixed but varied, which were determined by minimizing the total number of HRTFs while the synthesized signals have no perceptual difference from the original signals in terms of sound location. To validate the usefulness of the proposed interpolation model, the proposed model was applied to the several HRTFs that were obtained from one dummy-head and three human heads. We used the HRTFs that have 5 degree azimuth angle resolution at 0 degree elevation (horizontal plane). The experimental results showed that using only $30\sim40%$ of the original HRTFs were sufficient for producing the signals that have no audible differences from the original ones in terms of sound location.

A Study on Generation Method of Intonation using Peak Parameter and Pitch Lookup-Table (Peak 파라미터와 피치 검색테이블을 이용한 억양 생성방식 연구)

  • Jang, Seok-Bok;Kim, Hyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.184-190
    • /
    • 1999
  • 본 논문에서는 Text-to-Speech 시스템에서 사용할 억양 모델을 위해 음성 DB에서 모델 파라미터와 피치 검색테이블(lookup-table)을 추출하여 미리 구성하고, 합성시에는 이를 추정하여 최종 F0 값을 생성하는 자료기반 접근방식(data-driven approach)을 사용한다. 어절 경계강도(break-index)는 경계강도의 특성에 따라 고정적 경계강도와 가변적 경계강도로 세분화하여 사용하였고, 예측된 경계강도를 기준으로 억양구(Intonation Phrase)와 액센트구(Accentual Phrase)를 설정하였다. 특히, 액센트구 모델은 인지적, 음향적으로 중요한 정점(peak)을 정확하게 모델링하는 것에 주안점을 두어 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞뒤 기울기를 추정하여 4개의 파라미터로 설정하였고, 이 파라미터들은 CART(Classification and Regression Tree)를 이용하여 예측규칙을 만들었다. 경계음조가 나타나는 조사, 어미는 정규화된(normalized) 피치값과 key-index로 구성되는 검색테이블을 만들어 보다 정교하게 피치값을 예측하였다. 본 논문에서 제안한 억양 모델을 본 연구실에서 제작한 음성합성기를 통해 합성하여 청취실험을 거친 결과, 기존의 상용 Text-to-Speech 시스템에 비해 자연스러운 합성음을 얻을 수 있었다.

  • PDF

Music classification system through emotion recognition based on regression model of music signal and electroencephalogram features (음악신호와 뇌파 특징의 회귀 모델 기반 감정 인식을 통한 음악 분류 시스템)

  • Lee, Ju-Hwan;Kim, Jin-Young;Jeong, Dong-Ki;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.41 no.2
    • /
    • pp.115-121
    • /
    • 2022
  • In this paper, we propose a music classification system according to user emotions using Electroencephalogram (EEG) features that appear when listening to music. In the proposed system, the relationship between the emotional EEG features extracted from EEG signals and the auditory features extracted from music signals is learned through a deep regression neural network. The proposed system based on the regression model automatically generates EEG features mapped to the auditory characteristics of the input music, and automatically classifies music by applying these features to an attention-based deep neural network. The experimental results suggest the music classification accuracy of the proposed automatic music classification framework.

Speech Recognition Performance Improvement using Gamma-tone Feature Extraction Acoustic Model (감마톤 특징 추출 음향 모델을 이용한 음성 인식 성능 향상)

  • Ahn, Chan-Shik;Choi, Ki-Ho
    • Journal of Digital Convergence
    • /
    • v.11 no.7
    • /
    • pp.209-214
    • /
    • 2013
  • Improve the recognition performance of speech recognition systems as a method for recognizing human listening skills were incorporated into the system. In noisy environments by separating the speech signal and noise, select the desired speech signal. but In terms of practical performance of speech recognition systems are factors. According to recognized environmental changes due to noise speech detection is not accurate and learning model does not match. In this paper, to improve the speech recognition feature extraction using gamma tone and learning model using acoustic model was proposed. The proposed method the feature extraction using auditory scene analysis for human auditory perception was reflected In the process of learning models for recognition. For performance evaluation in noisy environments, -10dB, -5dB noise in the signal was performed to remove 3.12dB, 2.04dB SNR improvement in performance was confirmed.

A Data Dissemination Model for Location-based Services (위치 기반 서비스를 위한 데이타 전달 모델)

  • Park Kwangjin;Song Moonbae;Hwang Chong-sun
    • Journal of KIISE:Databases
    • /
    • v.32 no.4
    • /
    • pp.405-415
    • /
    • 2005
  • Indexing techniques are used to implement selective tuning in wireless environments Indices are broadcast together with data to help mobile clients locate the required information. As a result, clients stay in doze mode most of the time. The drawback of this solution is that broadcast cycles are lengthened due to additional index information. In location-aware mobile services(LAMSs), it is important to reduce the query response time, since a late query response nay contain out-of-date information. In this paper, we present a broadcast-based spatial query processing method (BBS) designed to support k-NN query processing. In the BBS, broadcasted data objects are sorted sequentially based on their locations, and the server broadcasts the location dependent data along with an index segment. The performance of this scheme is investigated in relation to various environmental variables, such as the distributions of the data objects, the average speed of the clients and the size of the service area.

A Sound Externalization Method for Realistic Audio Rendering in a Headphone Listening Environment (헤드폰 청취환경에서의 실감 오디오 재현을 위한 음상 외재화 기법)

  • Kim, Yong-Guk;Chun, Chan-Jun;Kim, Hong-Kook;Lee, Yong-Ju;Jang, Dae-Young;Kang, Kyeong-Ok
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.47 no.5
    • /
    • pp.1-8
    • /
    • 2010
  • In this paper, a sound externalization method is proposed for out-of-the-head localization in a headphone listening environment. In order to reduce timbre distortion by the conventional methods using a measured a head-related transfer function (HRTF) or early reflections, the proposed method integrates a model-based HRTF with reverberation. In addition, for improving frontal externalization performance, techniques such as decorrelation and spectral notch filtering are included. To evaluate the performance of the proposed externalization method, subjective listening tests are conducted by using different types of sound sources such as white noise, sound effects, speech, and music. It is shown from the test results that the proposed externalization method can localize sound sources farther away from out of the head than the conventional method.

A study on optimizing the acoustic properties of concert halls for Korean traditional music (국악 공연에 적합한 공연장의 음향특성에 관한 연구)

  • Kim Beom Soo;Park Kyoungsoo;Choi Chulmin;Sung Koeng-Mo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.451-454
    • /
    • 1999
  • 서양음악의 연구는 음향학의 측면에서 수십년 동안 연구가 진행되어왔다. 이를 통해 콘서트홀의 음향학적 특성을 평가할 수 있는 객관적 지표들을 제시할 수 있었다. 하지만 국악에 있어서는 공연장에 대한 음향학적인 지표가 공식화된 것이 없고, 게다가 지표를 찾기 위한 충분한 국악전용 공연장의 수가 부족하다. 따라서 본 논문에서는 국립국악원 예악당의 모델을 기초로 한 컴퓨터 모의실험을 통해서 얻어진 가상 국악공연장을 바탕으로 RT, Warmth, IACC, ITDG 등의 4가지 지표를 가지고 각기 다양한 시료를 제작하여 청취실험을 실시하였다. 그 결과 서양음악과는 다른 경향의 RT, Warmth 선호도를 추출할 수 있었다.

  • PDF

A Study of Optimal Acoustic Parameters for Korean Traditional Music (국악 공연장의 음향 지표에 관한 연구)

  • 김범수;박경수;최철민;성굉모
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.11b
    • /
    • pp.207-210
    • /
    • 1999
  • 서양음악의 음향학적인 측면에서의 연구는 오랜 기간 동안 진행되어왔다. 이를 통해 콘서트홀의 음향학적 특성을 평가할 수 있는 객관적 지표들을 제시할 수 있었다. 하지만 국악에 있어서는 공연장에 대한 음향학적인 지표가 공식화된 것이 없고, 게다가 지표를 찾기 위한 충분한 국악전용 공연장의 수가 부족하다. 따라서 본 논문에서는 국립국악원 예악당의 모델을 기초로 한 컴퓨터 모의실험을 통해서 얻어진 가상 국악공연장을 바탕으로 RT, Warmth, IACC, ITDG 등의 4가지 지표를 가지고 각기 다양한 시료를 제작하여 청취실험을 실시하였다. 그 결과 서양음악과는 다른 경향의 RT, Warmth 선호도를 추출할 수 있었다.

  • PDF

Conversion of Stereo to Surround Audio Signal Using Hidden Markov Model (은닉 마르코프 모델을 이용한 스테레오에서 서라운드 오디오 신호로의 변환)

  • Jeong, Seok Hee;Chun, Chan Jun;Kim, Hong Kook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.1-2
    • /
    • 2014
  • 본 논문에서는 hidden Markov model (HMM) 기반의 스테레오 신호로부터 서라운드 오디오 신호를 생성하는 기법을 제안한다. 먼저 5.1 채널 오디오 훈련 데이터베이스로부터 MDCT 영역에서 전방/서라운드 채널의 서브밴드 에너지를 프레임 단위로 계산하고, 이를 특징 벡터로 하여 좌측과 우측 채널 두 개의 HMM 이 구성된다. 다음으로, 입력된 스테레오 신호에 대해 HMM decoding 을 통해 서라운드 채널의 MDCT 영역의 서브밴드 에너지가 예측된다. 이 예측된 서브밴드 에너지로부터 역 MDCT 를 통해 서라운드 오디오 신호가 생성된다. 제안된 방법의 성능평가를 위해 MUSHRA 청취 실험을 수행한 결과, 제안된 HMM 기반의 방식으로 생성된 서라운드 오디오 신호가 기존의 패시브 서라운드 디코딩 기반으로 생성된 서라운드 신호에 비해 높은 선호도를 보였다.

  • PDF

Music Recommendation System Using Extended Collaborative Filtering Based On Emotion & Context Information Fusion (감성 및 상황 정보 융합 기반의 확장된 협업 필터링 기법을 이용한 음악추천시스템)

  • Choi, Hyunsuk;Bae, Hyochul;Seo, Jungjin;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.82-84
    • /
    • 2011
  • 본 논문에서는 사용자의 개인적 취향에 맞는 음악을 추천할 수 있는 사용자 감성/상황 정보 융합 기반의 협업 필터링의 확장을 이용한 음악추천시스템을 소개한다. 본 논문에서 제안하는 시스템은 확장된 협업 필터링 방식을 사용하여 추천을 해준다. 이를 위해 본 논문에서는 추천의 근거가 되는 감성과 무드를 Thayer 음악 무드 모델을 이용하여 총 12 가지의 감성 정보, 8 cluster 의 무드 정보로 분류했다. 또한 사용자의 상황 정보, 활동 & 날씨 & 시간에 대해서도 분류하였다. 분류된 정보는 음악감상 UI 를 이용하여 사용자 별 감성, 상황 그리고 음원의 무드 정보로 수집이 되었고, 수집된 정보를 기반으로 사용자 감성과 청취 곡 횟수를 퓨전하여 평가치 매트릭스를 만들었으며, 이를 바탕으로 단계적 협업 필터링에 의해 사용자 취향에 맞는 음악을 추천해 주는 방법이다.

  • PDF