• 제목/요약/키워드: 심리음향모델

검색결과 71건 처리시간 0.025초

정현파 모델링을 이용한 폴리포닉 오디오 신호의 시간축 변화 (Time-Scale Modification of Polyphonic Audio Signals Using Sinusoidal Modeling)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2001
  • 본 논문에서는 폴리포닉 음과 같은 복잡한 스펙트럼을 갖는 오디오 신호를 정현파 성분으로 모델링하고, 이를 바탕으로 고음질의 시간축 변화된 음을 얻는 방법을 제안한다. 입력 신호는 옥타브 밴드 구조의 다중 해상도 필터 뱅크를 통과하고 여기에서 나온 각 서브밴드 신호로부터 정현파 성분이 축출된다. 서브밴드 신호의 정현파 분석시 정현파 성분을 추출하는 구간의 크기를 국지적인 신호의 특성에 따라 다르게 해 주는 동적 세그멘테이션 방법을 적용한다. 이렇게 함으로써 기존 정현파 모델링에서 신호의 천이 구간에서 발생하는 퍼짐 현상을 개선하고, 시간축 변화 시에도 원래 음에 가까운 음질을 얻을 수 있다. 정현파 분석을 위한 스펙트럼 분석 도구로는 심리 음향 모델을 적용한 matching pursuit을 사용함으로써 정현파 성분의 갯수를 줄이고, matching pursuit의 반복 과정에 대한 합리적인 정지 조건을 제공할 수 있다. 정현파 성분으로 표현하기 어려운 신호의 잡음 성분은 원래 신호에서 정현파 성분으로 합성된 신호를 뺀 것으로 얻을 수 있으며, 스펙트럼 포락선 근사화 방법으로써 모델링된다. 본 논문의 알고리즘을 적용해 다양한 폴리포닉 음에 대해 실험한 결과 제안한 정현파 모델링 방법이 원래 신호의 음질을 잘 복원할 수 있고, 시간축 변화율이 큰 경우에도 신호의 천이 구간을 잘 표현할 수 있음을 확인하였다.

  • PDF

공격에 강인한 고음질 디지털 오디오 워터마킹 시스템에 관한 연구 (Study for A Robust Digital Audio Watermarking System)

  • 김현욱;오현오;윤대희;차일환
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.771-774
    • /
    • 2000
  • 디지털 워터마킹은 오디오, 이미지, 영상과 같은 고품질 디지털 멀티미디어 컨텐츠의 불법적인 복제와 유통을 막고 저작권을 보호하기 위한 최후의 방어 수단으로 인식되고 있는 신호처리 기술이다. 오디오 신호에 삽입되는 워터마크 신호는 들리지 않아야 하는 특성과 함께, 압축이나 필터링과 같은 신호처리 과정 후에도 추출이 가능한 강인성을 지녀야 한다 본 연구에서는 현재 제안되고 있는 여러가지 오디오 워터마킹 방법 중에서 대역확산을 기반으로 한 PN 시퀸스 오디오 워터마킹 시스템에 대해서 다루었다. 삽입된 워터마크 신호가 들리지 않도록 하기 위해 인간의 청각 시스템에 기반한 심리음향모델을 적용하였으며, 효율적인 검출과 청각상의 특성을 고려한 여러 가지 실험을 수행하였다. 워터마크 정보의 검출에 있어서는 원 신호가 필요하지 않은Blind Detection 방법을 제안하여 효율적인 워터마킹 시스템을 구현할 수 있도록 하였다.

  • PDF

심리음향 모델을 이용한 무선 음성인식 시스템 (Wireless Speech Recognition System using Psychoacoustic Model)

  • 노진수;이강현
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.110-116
    • /
    • 2006
  • 본 논문에서는 무선 음성 센서를 사용하여 스위치 제어나 생체신호 인증과 같은 유비쿼터스 센서 네트워크 응용 서비스를 지원하기 위한 음성인식 시스템을 구현하였다. 제안된 시스템은 무선 음성센서와 심리음향 모델을 이용한 음성인식 알고리즘과 에러정정을 위한 LDPC(Low Density Parity Check) 모듈로 구성된다. 제안된 음성인식 알고리즘은 센서의 소비 에너지를 효율적으로 사용하기 위하여 호스트 컴퓨터에 삽입되며, 음성인식의 정확도를 향상시키기 위하여 전방향 에러정정 알고리즘을 사용하였다. 또한, 효율적으로 무선채널의 잡음을 제거하고 무선채널 에러를 정정하기 위하여 실험 환경과 실험 계수를 최적화하였다. 결과적으로, 센서와 음원 사이의 거리가 1.0m 이하 일 때 FAR 0.126%와 FRR 7.5%를 얻었다.

심리음향 모델 II와 MDCT를 이용한 오디오 포렌식 마킹 (Audio Forensic Marking using Psychoacoustic Model II and MDCT)

  • 이강현
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.16-22
    • /
    • 2012
  • 본 논문에서는 심리음향 모델(Psychoacoustic model) II와 MDCT를 이용한 고음질 오디오 포렌식 마킹 알고리즘을 제안한다. 제안된 알고리즘은 오디오 신호의 에너지가 스펙트럼 마스킹 레벨보다 적은 서브밴드를 선택하여 콘텐츠 사용자의 핑거프린팅 코드를 삽입하는 포렌식 마킹 방법이다. 원 오디오 신호의 FFT 처리를 위한 2,048 샘플의 한 프레임 범위에서, 3개의 서브밴드를 선택하여 포렌식 마킹을 한다. 핑거프린팅 코드의 평균화 공격에 따른 공모코드의 100% 추적율을 갖는 범위에서, 한 프레임의 SNR을 측정하였다. 핑거프린팅 코드의 최저강도 0.1 삽입에서 SNR은 38.44dB 이며, 화이트 가우시안 노이즈의 강도 0.5가 추가된 SNR은 19.09dB로 제안된 오디오 포렌식 마킹 알고리즘은 핑거프린팅 코드의 마킹 강인성과 오디오 고음질이 유지됨을 확인하였다.

5.1채널 스피커 시스템에서 트랜스오럴 필터 구현에 관한 연구 (A Study on the Transaural Filter Implementation for 5.1 Channel Speaker System)

  • 최갑근;방승범;김순협;정완섭
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.245-255
    • /
    • 2002
  • 5.1채널 스피커 시스템을 이용하여 음향을 재현시 나타나는 현상인 크로스토크를 제거하여 청취자에게 보다 입체적인 음을 재현하는 방법에 관한 것이다. 본 논문에서는 크로스토크를 제거하기 위하여 자유음장 모델을 사용하였다. 이것을 구현함에 있어 주파수 영역에서 심리음향에 기초한 바크 스케일 (bark scale)을 사용한 복소이득 보상을 실시하였으며, 서라운드 채널에 관해서는 밴드패스 필터를 추가하여 주파수 제한적인 음질 보상을 실시하였다. 정면 채널과 서라운드채널의 음원을 제작하여 기존의 2채널 및 5.1 시스템에서 제시하는 음원과 비교하여 객관적인 음질 평가 및 청취자를 대상으로 한 주관 평가를 실시하였다. 제안된 방법에 따라 측정한 결과에 따르면 ±30°의 정면 스피커를 배치한 돌비 표준 스피커 배치에서 38 dB이상의 분리도를 얻었으며 확산감에 대해 전문가를 대상으로 한 주관 평가는 5점 평가를 기준으로 0.4점이 향상되었다.

저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상 (Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding)

  • 이창헌;강홍구
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.62-68
    • /
    • 2010
  • 본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.

스포츠 아우터웨어용 나일론 직물의 소리 감각과 이와 관련된 객관적 파라미터들 (Sound Sensation and Its Related Objective Parameters of Nylon Fabrics for Sports Outerwear)

  • Yi, Eunjou;Cho, Gilsoo
    • 한국의류학회지
    • /
    • 제25권9호
    • /
    • pp.1593-1602
    • /
    • 2001
  • 본 연구는 스포츠 아우터웨어용 나일론 직물의 소리에 대한 주관적 감각과 이에 관련된 객관적 측정치를 규명하기 위하여, 서로 다른 8종의 나일론 직물의 소리의 스펙트럼 파형을 고찰하였으며, 소리 파라미터로 총음압(level pressure of total sound, LPT),세 가지 AR (autoregressive)계수, Zwicker의 심리음향학적 모델에 따른 크기(Z)와 날카로움(Z)를 계산하였고, Kawabata Evaluation System(KES)으로 직물의 물리적 성질을 측정하였다. 주관적 감각 평가를 위하여 피험자에게 녹음된 각 직물소리를 들려주어 7개 소리 감각 (부드러움, 시끄러움, 날카로움, 맑음, 거 침, 높음, 유쾌함)을 의미분별척도로 답하게 한 후, 단계적 선형 회귀식을 이용하여 직물 소리의 주관적 감각에 대한 예측 모델을 제시하였다. 울트라스웨이드를 제외한 태피터 나일론 직물들은 스펙트럼 파형 에서 다른 조성 섬유의 직물들보다 음압 값이 높고, 총음압이 60dB 안팎의 값을 보여, 착용자에게 불쾌감을 줄 것으로 예상되었으며, 주관적 감각 평가에서도 소리의 부드러움과 맑음, 유쾌함에서 음의 점수를, 시끄러움과 날카로움, 거침, 높음에서 양의 점수를 얻었다. 주관적 감각의 예측모델에서 총음압은 시끄러움과 거침에 정적 영향을, 유쾌함에 부적 영향을 미쳐서 나일론 직물 소리의 총음압이 50dB 이하일 때 주관적으로 유쾌하게 느껴지는 것으로 나타났다.

  • PDF

지각 모델링을 이용한 디지털 오디오 워터마킹 방법 (Digital Audio Watermarking Scheme Using Perceptual Modeling)

  • 석종원;홍진우
    • 방송공학회논문지
    • /
    • 제6권2호
    • /
    • pp.195-202
    • /
    • 2001
  • 디지털 워터마킹 기법은 디지털 멀티미디어 컨텐츠의 저작권 보호를 위한 새로운 해결책으로 제시되고 있으며, 국내외에서 이와 관련된 연구가 활발히 진행되고 있다. 본 논문에서는 최근 들어 많은 관심을 끌고있는 디지털 오디오의 저작권 보호를 위한 새로운 워터마킹 방법을 소개한다. 제안된 워터마킹 기법은 MPEG의 심리음향모델을 사용하여 지각적으로 감지되지 않을 뿐 아 니라, 워터마크 검출 시에도 전처리 과정을 거쳐 원본 오디오 신호 없이도 워터마크의 검출이 가능하다. 개발된 오디오 워터마킹기술은 원본 오디오에 비해 오디오의 품질이 떨어지지 않을 뿐 아니라, 워터마크를 제거하고자 가해지는 다양한 공격에도 워터마크가 제거되지 않는 특징을 가지고 있다. 또한, 기존의 확산대역 방식을 이용하는 워터마킹 방법이 시간축 변형 공격에 상당히 취약한 단점을 가지는 것에 비해, 제안된 방법은 변형된 형태의 원본 신호를 워터마크로 사용하여 시간축 공격에도 안정적으로 워터마크를 검출할 수 있었다.

  • PDF

직물 마찰음의 주관적 평가에 시각적 변수가 미치는 영향 (Effect of Visual Factor on Subjective Evaluation of Frictional Fabric Sounds)

  • 한아름;양윤정;조길수
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2009년도 추계학술대회
    • /
    • pp.62-65
    • /
    • 2009
  • 본 연구는 동작 속도별 마찰음의 주관적 평가에 있어서 시각적 변수의 영향을 분석하는 것을 목적으로 한다. 현재 유통되고 있는 79 종의 스포츠웨어용 투습발수직물 중 음향 특성으로 계층적 군집분석에 의해 나누어진 3 개의 군집에서 각각 하나씩 추출한 총 3가지 시료를 대상으로 walking, jogging, running의 속도로 마찰시켜 총 9가지의 소리에 대하여 실험하였다. 직물 소리에 대한 주관적 평가 시 시각적 변수의 영향을 분석하기 위하여 두 가지 방법으로 직물 소리에 대한 주관적 반응을 평가하였다. 첫 번째는 기존의 연구에서 주로 이루어진 방법으로, 실험 진행자가 피험자에게 직물소리를 들려주면서 설문을 하게 하였다. 두 번째는 녹음된 직물의 소리와 함께 모니터를 통해 해당 자극물의 마찰 속도에 따라 인체 모델이 움직이는 동작을 보여줌으로써 청각과 시각 자극을 동시에 제시하여 주관적 평가의 자극물로 사용하였다. 주관적 평가는 8개의 형용사 쌍에 대해 의미미분척도로 평가되었고, 두 가지 방법을 비교하기 위하여 '실제 옷을 착용하고 움직일 때 발생하는 직물 소리와 유사하게 들린다.' 와 '옷을 착용하고 움직일 때 발생하는 소리라고 느껴진다.' 두 문항을 추가하여 평가하였다. 그 결과 시각 자극의 유무에 의한 감성평가 결과에는 큰 영향을 미치지는 않았지만, 피험자가 소리만으로 직물이 마찰되는 장면을 의식적으로 상상해야 하는 심리적 부담을 줄여주었고, 주관적 평가 몰입도를 향상시켰다고 사료된다.

  • PDF

냉장고 소음의 객관적 평가 모델 (Objective Assessment Model for Refrigerator Noises)

  • 박종근;조연;이상욱;황대선;이철희
    • 대한전자공학회논문지SP
    • /
    • 제46권5호
    • /
    • pp.80-90
    • /
    • 2009
  • 본 논문에서는 냉장고로부터 방사되는 소음에 대한 사용자의 불쾌도를 객관적으로 평가하기 위한 방법을 제안하였다. 이를 위해 8개의 상용 냉장고로부터 방사되는 소음이 무향실과 아파트로부터 녹음되었다. 사용자가 냉장고 소음으로부터 느끼는 주관적 청감을 알아보기 위하여 100명의 평가자로부터 청감 실험을 통하여 각 냉장고 소음의 주관적 평가 데이터가 얻어졌다. 그리고 이로부터 심리 음향 속성을 나타내는 파라미터인 5개의 Sound Quality Metric (SQM) 도출하였다. 마지막으로 주관적 소음 평가 데이터와 5개의 객관적 SQM 값 사이에 높은 상관도를 부여하는 냉장고 소음에 대한 객관적 평가 모델이 제시된다.