• 제목/요약/키워드: 음향 모델

검색결과 1,253건 처리시간 0.023초

일반화된 음원 모델로서 기저함수합계 모델 (Sum-of-Basis-Functions Model As a Generalized Voice Source Model)

  • 홍준모
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.55-60
    • /
    • 1994
  • 본 논문에서는 음원을 모델링하기 위한 새로운 음원 모델로서 기저함수합계 모델을 제안하고 그 모델의 변수를 추정하는 방법에 관하여 설명한다. 기존 모델들이 다양한 음원신호를 표현하는데 부족함이 많았던데 비해 기저함수합계 모델은 다양한 음원신호를 표현하기에 적합하며 ML 이라는 통일된 추정 방법을 통해 모델의 변수들을 구할 수 있다. 또한 기저함수합계 모델은 기존의 모델들을 포함하는 일반화된 음원 모델이 됨을 보인다.

  • PDF

미전사 음성 데이터베이스를 이용한 가우시안 혼합 모델 적응 기반의 음성 인식용 음향 모델 변환 기법 (Acoustic Model Transformation Method for Speech Recognition Employing Gaussian Mixture Model Adaptation Using Untranscribed Speech Database)

  • 김우일
    • 한국정보통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1047-1054
    • /
    • 2015
  • 본 논문에서는 음성 인식 성능 향상을 위해 미전사된 음성 데이터베이스를 이용한 효과적인 음향 모델 변환 기법을 기술한다. 본 논문에서 기술하는 모델 변환 기법에서는 기존의 적응 기법을 이용하여 환경에 적응된 GMM을 얻는다. HMM의 가우시안 요소와 유사한 요소를 선택하여 선택된 가우시안 요소의 변환 벡터를 구하고 이를 평균 파라미터 변환에 이용한다. GMM 적응 기반의 모델 변환 기법을 기존의 MAP, MLLR 적응 기법과 결합하여 적용한 결과, 자동차 잡음과 음성 Babble 잡음 환경에서 기존의 MAP, MLLR을 단독으로 사용할 경우보다 높은 음성 인식성능을 나타낸다. 온라인 음향 모델 적응 실험에서도 MLLR과 결합할 경우 기존의 MLLR을 단독으로 사용할 때보다 효과적인 모델 적응 성능을 나타낸다. 이와 같은 결과는 본 논문에서 소개한 GMM 적응 기반의 모델 변환 기법을 채용함으로써 미전사된 음성 데이터베이스를 음향 모델 적응 기법에 효과적으로 활용할 수 있음을 입증한다.

이중 여진 음성모델을 이용한 음질개선 (A Voice/Unvoice Decomposition in Noisy Background)

  • 유창동
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.175-178
    • /
    • 1998
  • 음질개선에 이줄 여진(Double Excitation) 음성모델을 적용하는 방법이 있다. 유성음과 무성음 성분들로 분리하는 이 방법은 각 성분들의 고유한 성질을 이용하여 음질을 저하시키는 wideband 잡음을 제거할 수 있다. 이중 여진 음성모델을 이용한 음질개선 시스팀과 기존의 스펙트랄 제거(spectal subtraction) 알고리즘을 비공식적으로 비교한 결과 이중 여진 모델을 이용한 방법이 더 나은 성능을 보였다.

  • PDF

다이버시티 기법을 이용한 서해에서의 음선 모델기반 수중음향통신 시스템 (Underwater acoustic communication system using diversity based on ray modeled underwater acoustic channel in Yellow Sea)

  • 강지웅;김현수;안종민;정재학
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.1-7
    • /
    • 2016
  • 본 논문은 서해의 수중음향 통신 네트워크의 물리계층에 적합한 수중음향통신 시스템을 제안한다. 서해정점의 해양 관측정보와 Bellhop 음선 추적프로그램을 이용하여 서해정점의 수중 채널 모델을 구하고 이 수중 채널 모델을 이용하여 통신 변수들을 산출하고 다이버시티 기법이 응용된 CDMA(Code Division Multiple Access)와 SC-FDM(Single Carrier-Frequency Division Multiplexing) 전송방식을 이용한 음향 통신시스템을 설계한다. 설계된 통신시스템의 성능을 검증하기 위해 여러 통신환경에 대한 비트 오류율과 데이터 전송률을 연산하고 이로부터 서해안에서 긴 지연시간을 가지는 수중 채널과 낮은 Eb/No에서 사용가능한 수중 음향통신 기법을 제안한다.

한국어 음성인식 성능향상을 위한 문맥의존 음향모델에 관한 연구 (A Study-on Context-Dependent Acoustic Models to Improve the Performance of the Korea Speech Recognition)

  • 황철준;오세진;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.9-15
    • /
    • 2001
  • 본 연구에서는 한국어 음성인식 성능향상을 위한 문맥의존 음향 모델을 개선하기 위하여 한국어 음성학적 지식과 결정트리를 접목한 음소결정트리 기반 상태분할 알고리즘으로 한국어에 적합한 문맥의존 음향 모델에 관해 고찰한다. HMM (Hidden Markov Model)의 각 상태를 네트워크로 연결하여 문맥의존 음향모델로 표현하는 HM-Net(Hidden Markov Network)이 있는데 이는 SSS(Successive State Splitting) 알고리즘으로 작성한다. 이 방법은 음향 모델의 상태공유관계와 모델의구조를 결정하는데 효율적이지만 모델을 학습할때 문맥환경에 따라 출현하지 않는 문맥이 존재하는 문제점이 있다 본 연구에서는 이러한 문제점을 해결하기 위해 2진 결정트리와 SSS 알고리즘의 장점을 결합하여 문맥방향 상태분할을 수행할 때 각 노드에서 한국어 음성학적 지식으로 구성된 음소 질의어에 따라 상태분할 하는 방법으로서 PDT-SSS(Phonetic Decision Tree-based SSS) 알고리즘을 적용한다. 적용한 방법으로 작성한 문맥의존 음향 모델의 유효성을 확인하기 위해 국어공학센터 (KLE)m이 452 단어와 항공편 예약관련 200문장(YNU 200)에 대해 화자독립 음소, 단어 및 연속음성인식 실험을 수행하였다. 인식실험결과, 문맥 의존 음향모델에 대한 화자독립 음소, 단어 및 연속음성 인식실험에서 기존의 단일 HMM 모델보다 향상된 인식률을 보여, 한국어에 적합한 문맥의존 음향 모델을 작성하는데 한국어 음성학적 지식과 음소결정트리 기반 상태분할 알고리즘이 유효함을 확인하였다.

  • PDF

RFC 모델의 한국어 억양 곡선에의 적용 (Application of Rise/Fall/Connection(RFC) Model to Korean Intonation)

  • 표경란
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.214-217
    • /
    • 1998
  • 합성음에 사용할 한국어 억양 모델을 세우기 위한 기초적 연구로서 한국어 억양 곡선에 RFC 모델을 적용해 보았다. 억양 곡선의 구조는 피치 액센트와 억양구 경계 음조의 연속으로 되어 있는데, RFC 모델은 각각의 진폭과 지속기간을 가지는 상승 음조 요소와 하강 음조요소, 그리고 연결 요소로 이러한 억양 곡선의 모양을 모델링한다. 본 논문에서는 한국어 억양 곡선의 특징을 잘 반영하도록 RFC 모델의 구성요소를 수정하고, 청취 실험을 통해서 원래의 RFC 모델과 수정된 RFC 모델을 비교해 보았다. 실험 결과는 수정된 RFC 모델이 원래의 RFC 모델보다 13%정도 음조 표지 개수가 줄었음에도 불구하고 청각적으로 인지하는데 차이가 없는 것으로 나타났다.

  • PDF

중주파수 양상태 잔향음 모델 (Mid-Frequency Bistatic Reverberation Model)

  • 오택환;나정열;박치형;라형술
    • 한국음향학회지
    • /
    • 제25권8호
    • /
    • pp.389-394
    • /
    • 2006
  • 중주파수 양상태 잔향음 준위는 음선이론을 사용하여 산출되었다. 제안된 알고리즘은 음파전달 경로 내 전방/후방 산란의 상호작용을 가정한다. 해양환경 (지형. 해저면 산란, 해수면 산란 등)은 거리 독립 해양환경으로 가정되었고 중주 파수 산란 모델이 사용되었다. 해상실험 자료를 사용한 알고리즘 검증 결과 양상태 잔향음 모델 알고리즘이 관측 해역의 양상태 잔향음 특성을 잘 반영하고 있음을 확인하였다.

위상이 고려된 기하음향모델에 의한 내부음장 해석 (Acoustic Analysis of Interior Spaces by Using the Phased Geometric Acoustic Model)

  • 신호철;이정권
    • 한국음향학회지
    • /
    • 제17권6호
    • /
    • pp.54-61
    • /
    • 1998
  • 중주파수대역은 내부 음향 모드의 공명 및 모드간 상호 간섭 특성을 완전히 무시할 수는 없으나 모드 밀도가 비교적 높기 때문에, 기존의 저주파수용 모드기법이나 고주파수에 대한 통계적 및 기하학적 해석방법과는 다른 기법이 필요한 구간이다. 본 논문에서는 위상 을 포함한 기하음향모델을 이용하여 중주파수 특성을 고려하는 개념을 이용하여 해석기법을 확립하였으며, 삼각형빔법을 기초로 한 모델링을 하였다. 세 개의 서로 다른 특성을 지닌 대 상 공간에 대해 음향 경계요소법 및 실험에 의한 음향 주파수응답함수와 본 연구 결과를 비 교함으로써 유효성과 오차특성을 검토하였다. 이로부터 위상으로 고려한 중주파수 대역에 잘 적용될 수 있음을 확인하였고, Schroeder의 차단주파수 이하의 저주파수에서는 내부구조 에 의한 회절이, 차단주파수의 네 배 이상인 고주파수에서는 벽면에서의 산란이 간섭현상과 함께 고려되어야 함을 보였다. 이러한 해석기법은 중주파수대역에 있어서 청감특성을 고려 한 내부공간의 음향설계에 매우 유용할 것으로 사료된다.

  • PDF

강체원뿔표적에 대한 초음파 방사힘 계산과 음향파워측정모델에 관한 연구 (Calculation of the ultrasonic radiation force acting on a rigid circular cone and the study on the metrology for the acoustic power measurement)

  • 백경민;이주호;프리치;김용태
    • 한국음향학회지
    • /
    • 제43권3호
    • /
    • pp.335-343
    • /
    • 2024
  • 본 논문은 초음파 방사힘을 이용하여 음향파워를 측정하는 방법에 대한 이론적 모델을 세우고 이에 대한 이론적 결과를 다루었다. 이를 위해 Kirchhoff approximation 기반으로 강체원뿔표적에 대한 산란모델을 세우고 음향파워를 계산한 후 이를 방사힘으로 환산하였다. 이를 통해 원뿔표적을 사용하는 기존 방법의 정확성 및 측정 한계, 그리고 임의의 경사각의 원뿔표적으로도 측정할 수 있는 음향파워측정에 관한 확장된 이론을 제시하였다. 이를 이용하여 초음파 방사힘을 이용한 음향파워측정 방법의 주파수 및 표적 크기에 대한 의존도도 본 논문에서 제시하였다. 그 결과로 주파수 및 표적 크기를 고려하였을 때 국제표준규격(International Electrotechnical Commission, IEC)에서 제시하는 방법으로 계산한 음향파워값에 추가되어야 할 보정값을 산출하였다.

심리음향 모델을 이용한 오디오 워터마킹 (Audio Watermark Using Psychoacoustic Model)

  • 이희숙;이우선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.859-861
    • /
    • 2001
  • 본 논문은 오디오의 masking특성을 적용한 심리음향 모델을 이용하여 오디오의 고음질을 보장하면서 잡음과 압축 등의 공격에 강한 오디오 워터마킹 방법을 제안한다. 제안하는 워터마킹 방법은 심리음향 모델에 의해 생산되는 masking thresholds와 원신호의 power spectral density의 각 주파수별 차이 에너지를 이용하여 시간도메인에서 워터마크를 삽입하는 방법으로 오디오의 품질을 유지할 수 있다. 워터마크로는 자기상관성이 강한 PN-시퀀스를 이용하여 강인한 워터마킹을 구현한다. 그리고 PN-시퀀스와 같은 이진 시퀀스 워터마크의 검출을 위한 유사도 측정식을 제안한다.

  • PDF