• 제목/요약/키워드: 청취 모델

검색결과 51건 처리시간 0.019초

음향 장면 분류에서 히트맵 청취 분석 (Listenable Explanation for Heatmap in Acoustic Scene Classification)

  • 서상원;박수영;정영호;이태진
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.727-731
    • /
    • 2020
  • 인공신경망의 예측 결과에 대한 원인을 분석하는 것은 모델을 신뢰하기 위해 필요한 작업이다. 이에 컴퓨터 비전 분야에서는 돌출맵 또는 히트맵의 형태로 모델이 어떤 내용을 근거로 예측했는지 시각화 하는 모델 해석 방법들이 제안되었다. 하지만 오디오 분야에서는 스펙트로그램 상의 시각적 해석이 직관적이지 않으며, 실제 어떤 소리를 근거로 판단했는지 이해하기 어렵다. 따라서 본 연구에서는 히트맵의 청취 분석 시스템을 제안하고, 이를 활용한 음향 장면 분류 모델의 히트맵 청취 분석 실험을 진행하여 인공신경망의 예측 결과에 대해 사람이 이해할 수 있는 설명을 제공할 수 있는지 확인한다.

  • PDF

사용자 청취 로그의 음악 청취 순서를 이용한 다음 음악 추천 (The Next Song Recommendation Using Item Sequences in Music Usage Data)

  • 박성은;이동주;이상근;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.41-44
    • /
    • 2011
  • 본 연구는 현재 사용자가 청취한 음악과 청취한 순서를 기반으로 다음에 사용할 아이템을 추천하는 문제를 다룬다. 우리가 제시하는 모델은 아이템 사용 로그를 기반으로 하며, 정보검색에서 많이 사용하는 N-gram모델을 사용하여 아이템의 순서열을 추출한 후 다음에 올 확률이 높은 아이템을 학습한다. 그리고 사용자가 현재 선택한 아이템의 순서열을 기반으로 다음에 가장 들을 확률이 높은 아이템을 추천한다. 또 실 세계 데이터를 기반으로 실험하여 협업적 필터링 방식과 성능을 비교한다.

2채널 트랜스오럴 필터를 이용한 최적 청취영역 확대에 관한 연구 (A Study on the Sweet-Spot Widening using 2-Channel Sound Transaural Filter)

  • 안찬식;황신;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.53-56
    • /
    • 2002
  • 본 논문은 2채널 스피커를 사용하여 청취자에게 보다 입체적인 음향 효과를 제시하기 위하여 크로스토크현상을 제거하고 청취자의 보다 자유로운 청취를 위해 최적 청취영역 확대를 위한 실험과 시스템 구현에 관한 것이다. 정면에 위치한 두 스피커로부터 교차경로인 크로스토크를 제거하기 위해 음질의 왜곡을 최소화하는 자유음장 모델을 이용하여 구현한 트랜스오럴 필터 사용하였고 최적 청취영역의 확대를 위해 스피커는 BPF(Band Pass Filter)를 이용하여 저주파와 고주파를 분리하여 각각 재생할 수 있는 스피커를 구성하였으며 저주파 영역은 제외하고 중고주파 영역을 이용하였으며 기존 크로스토크제거 시스템을 사용하여 고정된 한 점의 청취영역에서 좌${\cdot}$우로 5Cm씩 이동하au 100Cm까지 측정한 결과 30Cm, 55Cm, 75Cm, 90Cm, 100Cm에서 크로스토크제거됨을 알 수 있는 음의 분리도가 5dB이상 나타났다. 실험 결과 얻어진 각 지점들로부터 자유음장 모델을 이용하여 트랜스오럴 필터링 하였으며 각각의 간섭현상을 막기 위해 주파수 영역에서 심리음향에 기초한 1/3-Octave Band Pass Filter를 사용하여 음질 보상을 실시하였다. 음원을 제작하여 기존의 2채널 시스템에서 제시하는 음원을 각각의 위치의 음원과 비교하여 음질 평가를 실시하였으며 기존의 트랜스오럴 필터와 비교평가를 실시하였다.

  • PDF

청취실험에 의한 에코확산 오디오 워터마킹방법의 최적화에 관한 검토 (A Study of Optimum Time-Spread Echo Audio Watermarking via Listening Test)

  • 고병섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.545-546
    • /
    • 2004
  • 서브밴드 분리에 의한 에코확산 오디오 워터마킹법은 호스트 신호를 특정 주파수 대역으로 분리하고, MPEG 심리음향 모델을 이용하여 각 대역별로 삽입되는 워터마크의 파워를 파라미터 설정 함수에 의하여 설정한다. 여기서, 본 방법의 강인성과 비지각성을 좌우하는 것은 파라미터 설정 함수가 된다. 따라서, 본 연구에서는 최대의 강인성과 최소의 음질 열화를 구현하기 위하여 청취실험을 실시하여 최적의 파라미터 설정 함수 설정방법에 대한 검토를 수행하였다.

  • PDF

RFC 모델의 한국어 억양 곡선에의 적용 (Application of Rise/Fall/Connection(RFC) Model to Korean Intonation)

  • 표경란
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.214-217
    • /
    • 1998
  • 합성음에 사용할 한국어 억양 모델을 세우기 위한 기초적 연구로서 한국어 억양 곡선에 RFC 모델을 적용해 보았다. 억양 곡선의 구조는 피치 액센트와 억양구 경계 음조의 연속으로 되어 있는데, RFC 모델은 각각의 진폭과 지속기간을 가지는 상승 음조 요소와 하강 음조요소, 그리고 연결 요소로 이러한 억양 곡선의 모양을 모델링한다. 본 논문에서는 한국어 억양 곡선의 특징을 잘 반영하도록 RFC 모델의 구성요소를 수정하고, 청취 실험을 통해서 원래의 RFC 모델과 수정된 RFC 모델을 비교해 보았다. 실험 결과는 수정된 RFC 모델이 원래의 RFC 모델보다 13%정도 음조 표지 개수가 줄었음에도 불구하고 청각적으로 인지하는데 차이가 없는 것으로 나타났다.

  • PDF

확장된 음향적 시차 모델을 이용한 음상 거리정위의 모델화 (Modeling of Distance Localization by Using an Extended Auditory Parallax Model)

  • 김해영
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.30-39
    • /
    • 2004
  • 본 연구는 3차원 공간상에 있어서의 음상정위를 제어하기 위한 디지털 신호처리 기술, 특히, 음상의 거리정위에 있어서의 머리전달함수 (HRTF)의 역할에 착안한 신호처리 기술을 확립하기 위한 것을 목적으로 한다. 이러한 목적을 달성하기 위하여 본 논문에서는 청각에 있어서의 거리 지각을 제어하기 위한 중요한 요소를 밝혀내기 위해 기존의 Hirsch-Tahara 모델과 음향적 시차 모델에 대해서 청각 실험을 행했다. 그 결과 이 두 모델에 있어서는 음상의 거리지각을 설명하기에는 한계와 전 방향에 있어서는 적용할 수 없는 문제점이 있었다. 이러한 문제점들을 고려해 본 논문에서는 음향적 시차 모델을 전 방향에 있어서 적용 가능하도록 확장된 음향적 시차 모델을 제안해 그 유효성에 대해 청취 실험을 통해 고찰했다. 그 결과, 본 논문에서 제안한 확장된 음향적 시차 모델을 이용하면 수평면 상의 전 방향에 있어서 약 2m 까지의 범위 내에서는 실제 음원에서 지각할수 있는 거리와 거의 같은 수준으로 음상의 거리를 제어함으로써 본 모델의 유효성을 인간을 대상으로한 청취실험을 통해 증명했다.

고령자의 청력손실을 배려한 재가보호 주거시설의 음향설계 (Listening environment design of houses for the seniors aging at home)

  • 장유경;오양기
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.152-161
    • /
    • 2024
  • 고령자 청력손실은 노령화에 따른 대표적 현상이다. 그러나 고령자를 위한 홈케어, 노인복지주택 등의 설계는 고령자의 이동성 확보 및 안전에 초점을 맞춰 시행되고 있어 청력상실 문제를 간과하는 경우가 많다. 본 연구에서는 주거공간 내 청취환경을 개선하여 노인의 삶의 질을 향상시키는 것을 목표로 한다. 노인들의 청취 환경 개선을 위해 잔향 감소, 소음 최소화, 음질 향상에 중점을 둔 기술을 제안하고 그 효과를 검증하였다. 이를 바탕으로 고령자의 청력 손실을 배려한 재가보호 주거시설의 음향 설계 모델을 제안하고자 하였다.

기적음관련 해양사고 분석.평가 시뮬레이션 시스템 개발 (Analysis and Evaluation Simulation System for Whistle Sound Related Marine Casualty)

  • 임정빈;김창경
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2004년도 춘계학술대회 논문집
    • /
    • pp.61-67
    • /
    • 2004
  • 이 연구에서는, 인간(해기사)의 두 귀에 주목한 머리전달함수(HRTF)를 이용하여, 기적음과 관련된 해양사고를 분석-평가하기 위한 시뮬레이션 시스템(3D-LSS)을 개발하였다. 해양사고당시 상황을 분석해서 가청화 모델을 구축하고, 3차원음 생성방법과 평가방법을 제시하였다. 개발한 시스템은 CUI 방식의 그래픽과 3차원 음향으로 해양사고 당시의 상황을 묘사하고, 시뮬레이션할 수 있도록 구성하였다. 3D-LSS을 이용하여, 해양사고 중에서 기적음 청취여부를 판단하지 못했던 6가지 사건을 대상으로 실험하였다. 5명의 평가자에 의한 심리음향평가결과, 6가지 사건을 시각적 청각적으로 명확하게 평가할 수 있었기 때문에 3D-LSS의 해양사고 심판보조 장치로서의 활용가능성을 확인할 수 있었다.

  • PDF

기적음관련 해양사고 분석·평가 시뮬레이션 시스템 개발 (Development of Analysis and Evaluation Simulation System for Whistle Sound Related Marine Casualty)

  • 임정빈;김창경
    • 한국항해항만학회지
    • /
    • 제28권8호
    • /
    • pp.659-666
    • /
    • 2004
  • 이 연구에서는, 인간(해기사)의 두 귀에 주목한 머리전달함수(HRTF)를 이용하여, 기적음과 관련된 해양사고를 분석-평가하기 위한 시뮬레이션 시스템(3D-LSS)을 개발하였다. 해양사고당시 상황을 분석해서 가청화 모델을 구축하고, 3차원음 생성방법과 평가방법을 제시하였다. 개발한 시스템은 GUI 방식의 그래픽과 3차원 음향으로 해양사고 당시의 상황을 묘사하고, 시뮬레이션 할 수 있도록 구성하였다. 3D-LSS을 이용하여, 해양사고 중에서 기적음 청취여부를 판단하지 못했던 6가지 사건을 대상으로 실시하였다. 5명의 평가자에 의한 심리음향 평가결과, 6가지 사건을 시각적 청각적으로 명확하게 평가할 수 있었기 때문에 3D-LSS의 해양사고 심판보조 장치로서의 활용가능성을 확인할 수 있었다.

라우드니스 복원에 기반한 잡음 환경에서의 오디오 청취 향상 (Audio Listening Enhancement in Adverse Environment based on Loudness Restoration)

  • 박준형;신종원
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.210-216
    • /
    • 2013
  • 잡음이 있는 환경에서 음악을 들을 경우 잡음의 영향으로 인해 명료한 음악의 청취가 힘들다. 본 논문에서는 잡음 환경에서 오디오 신호를 자동으로 변화시킴으로써 잡음 환경에서의 오디오 청취 경험을 향상시킬 수 있는 방법을 제안한다. 구체적으로, 잡음이 있는 환경에서 밴드 별 오디오 신호의 지각적 크기가 잡음이 없는 경우와 비슷해지도록 오디오 신호를 변화시키는 방법을 제안하였다. 이를 위해 Moore의 라우드니스 지각 모델을 도입하였으며, 기존의 음성 강화를 목적으로 한 논문을 더욱 발전시켜 48kHz로 샘플링된 전대역 신호를 증폭시키는 기법을 제안하였다. 잡음이 심할 때에는 라우드니스를 복원시켜도 명료성이 떨어지므로 이를 위해 라우드니스를 복원하는 데에 그치지 않고 일부러 고주파의 라우드니스를 약간 더 증폭하는 방법도 제안하였다. 실험 결과를 통해 우리는 제안된 알고리즘이 잡음 환경에서의 오디오 청취 경험을 얼마나 향상시킬 수 있는지를 알 수 있었다.