• 제목/요약/키워드: 열음향 모델

검색결과 110건 처리시간 0.028초

음향 신호의 양방향적 연관성을 고려한 유해 콘텐츠 검출 기법 (Pornographic Content Detection Scheme Using Bi-directional Relationships in Audio Signals)

  • 송광호;김유성
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.1-10
    • /
    • 2020
  • 본 논문에서는, 최근 인터넷을 통해 빠르게 확산하고 있는 음향 중심의 음란 콘텐츠를 정확하게 검출하기 위해, 음향의 이웃 신호들 사이에 존재하는 양방향적 연관성을 기반으로 콘텐츠의 유해성을 판단하는 기법을 제안한다. 이웃한 음향 신호들간의 양방향적 연관성을 추출하기 위하여, 양방향 확장-인과 컨벌루션 연산(bi-directional dilated-causal convolution operation)들을 수행하는 확장-인과 컨벌루션 블록을 쌓아 만든 다층구조 양방향 확장-인과 컨벌루션 네트워크를 제안한다. 제안된 유해 콘텐츠 검출 기법의 효용성 검증을 위한 실험에서는 음향 신호의 각 시점으로부터 추출한 단순 특징 벡터를 기계학습 모델로 분류하는 기존 방법, 기존의 확장-인과 컨벌루션 블록을 적용해 음향 시계열 데이터의 순 방향 연관성만을 이용하는 기법, 그리고 본 연구에서 제안한 음향 시계열 데이터의 양방향 연관성까지 이용하여 유해성을 판단하는 기법의 분류 정확성을 비교하였다. 실험 결과에 의하면 본 연구에서 제안한 기법이 최대 84.38%의 인식 정확도를 가지며 이는 기존의 단순 특징 벡터를 이용하는 방법보다 약 25.80% 높고 순 방향 연관성만을 이용하는 기법보다 약 3.10% 높은 것으로 분석되었다.

강건한 한국어 연속음성인식을 위한 유사음소단일에 대한 연구 (A Study on PLU (Phone-Likely Unit) for Korean Continuous Speech Recognition)

  • 서준배;김주곤;김민정;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.37-40
    • /
    • 2004
  • 본 논문은 한국어 연속음성인식에 효율적인 문맥의존 음향모델 수에 대한 연구로써 유사음소단위 수에 따른 인식 성능을 비교, 평가하였다. 기존에 본연구실에서는 48음소를 기본인식단위로 이용하고 있으나 연속음성인식의 경우 문맥종속모델이 사용되고 문맥종속모델은 변이 음을 고려한 음소가 이미 포함되어 있어 이를 고려하면 기본 음소를 줄이므로서 계산량의 감소와 인식 성능 향상을 기대할 수 있을 것으로 생각된다. 따라서 , 본 논문에서는 기존의 48음소와 이를 39음소로 줄여 인식실험에 사용하여 그 성능을 비교 평가하기로 하였다. 이를 위하여 다양한 태스크의 데이터베이스를 통합하여 부족한 문맥요소들을 확장한 후 인식실험을 수행하였다. 실험결과 변이음의 개수를 줄이면서도 인식 성능저하가 없음을 확인할 수 있었으며 연속 음성의 경우 39음소를 이용한 경우가 $10\%$정도의 향상된 인식성능을 얻을 수 있음을 확인할 수 있었다.

  • PDF

가스터빈 연소기에서 1D 열음향 모델을 이용한 연소불안정 예측 (Combustion Instability Prediction Using 1D Thermoacoustic Model in a Gas Turbine Combustor)

  • 김진아;김대식
    • 한국분무공학회지
    • /
    • 제20권4호
    • /
    • pp.241-246
    • /
    • 2015
  • The objective of the current study is to develop an 1D thermoacoustic model for predicting basic characteristics of combustion instability and to investigate effects of key parameters on the instabilities such as effects of flame geometry and acoustic boundary conditions. Another focus of the paper is placed on limit cycle prediction. In order to improve the model accuracy, the 1D model was modified considering the actual flame location and flame length (i.e. distribution of time delay). As a result, it is found that the reflection coefficients have a great effect on the growth rate of the instabilities. In addition, instability characteristics are shown to be strongly dependent upon the fuel compositions.

Class Flextensional 트랜스듀서의 최적설계 및 특성해석 (Optimal Design and Analysis of a Class IV Flextensional Transducer)

  • 강국진;노용래
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.69-76
    • /
    • 2000
  • 본 연구에서는 Class IV Flextensional 트랜스듀서의 여러 설계변수들에 따른 음압 변화 및 열 발생 경향성을 유한요소 해석법으로 해석하였다. 해석되어진 결과를 바탕으로 최대 음압을 구현하고, 열 발생이 최소인 중심 주파수 1 kHz를 가지는 Class IV extensional 트랜스듀서의 최적구조를 설정하였다. 본 연구에서 설정한 최적구조는 기본모델에 비해 음압이 2배 이상 크고 열 발생은 아주 작은 것으로 나타났다. 본 연구의 결과는 향후 다양한 중심 주파수 및 최대 음압을 구현하고 열 발생이 최소인 Class IV Flextensional 트랜스듀서를 설계함에 있어 유용한 자료로 활용될 수 있을 것이다.

  • PDF

청각 구조를 이용한 잡음 음성의 인식 성능 향상 (Performance Improvement of Speech Recognizer in Noisy Environments Based on Auditory Modeling)

  • 정호영;김도영;은종관;이수영
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.51-57
    • /
    • 1995
  • 본 논문에서는 청각 모델을 기초로 잡음에 강한 음성 특징 추출을 연구하였다. 청각모델은 basilar membrane 모델, 섬모세포(hair cell) 모델과 스펙트럼 출력단으로 구성하였다. Basilar membrane 모델은 음파의 진동에 따른 전달 특성을 묘사한 것으로 대역 통과 필터의 열로 나타난다. 섬모 세포 모델은 basilar membrane의 진동에 의한 신경 물질로의 변환을 나타낸다. 이것은 입력의 상대적인 값에 크게 반응하는 adaptation 기능을 이용하게 되며, 잡음 제거에 중요한 역할을 하게 된다. 스펙트럼 출력 단은 각 채널의 평균 firing rate를 이용하여 mean rate spectrum을 형성한다. 그리고 mean rate spectrum을 이용하여 특징 벡터를 추출하였다. 실험 결과는 청각 구조에 기초한 특징 추출이 다른 특징 추출 방법에 비해 잡음에서 더 향상된 성능을 가짐을 보였다.

  • PDF

초고속 비행체 열방어 시스템 패널의 열구조 특성 분석 (Analysis on Thermal Structural Characteristics of Thermal Protection System Panel for a High-speed Vehicle)

  • 이희수;김용하;박정선;구남서;김재영
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2017년도 제48회 춘계학술대회논문집
    • /
    • pp.942-944
    • /
    • 2017
  • 초고속 비행체는 발사 시 엔진에 의한 음향 압력과 비행 중 공력 가열 및 공기역학적 압력 등 복합적인 하중을 받는다. 이러한 외부환경으로부터 비행체의 연료 탱크 등 내부 시스템을 보호하기 위해 열방어 시스템 패널(Thermal Protection System Panel)이 필요하다. 본 논문에서는 온도 조건에 대해 유한차분법을 이용하여 열방어 시스템 패널의 열전달 모델을 정의하고, 구한 절점별 온도 데이터를 회귀분석을 통해 두께방향 온도 구배의 함수로 정리하였다. 도출한 온도 이력과 극한 압력 하에서 열방어 시스템 패널의 열구조 특성에 대한 해석적 모델을 정의하였다. 해석적 모델을 이용하여 열방어 시스템 패널의 열구조 특성에 대해 매개변수 분석을 수행하였다. 이를 통해 열방어 시스템 패널의 경량화 및 열구조적 설계 요구조건을 충족하는 설계변수를 도출하였다.

  • PDF

이산 시간 제어 CHMM을 이용한 한국어 연속 음성 인식에 관한 연구 (A Study on Recognition of Korean Continuous Speech using Discrete Duration CHMM.)

  • 김상범
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.368-372
    • /
    • 1994
  • 확률적 모델을 이용한 HMM 으로 한국어 연속 음성 인식시스템을 구성하였다. 학습 모델로서는 양자화 DCK가 없는 연속출력 확률밀도를 사용한 연속출력 확률분포 HMM과 과도 구간 및 정상 구간의 시간구조를 충분히 BYGUS할 수 없는 것을 계속시간 확률 파라메터를 추가하여 보완한 이산 지속시간 제어 연속출력 확률분포 HMM을 이용하였다. 인식 알고리즘은 시계열 패턴의 시간축상에서의 비선형 신축을 고려한 에 매칭으로서, 음절의 경계를 자동으로 검출하는 O에을 이용하였다. 실험에서 사용된 연속음성데이타는 4연 숫자음과 연속음성 10문장으로 하였다. 인식 실험 결과 4연 숫자음에서 CHMM은 80.7%, DDCHMM은 92.9%의 인식률을 얻었고, 신문 사설에서 발췌한 연속 음성문장의 경우 CHMM 54.2%, DDCHMM에서는 68.9%을 얻어, 시간장 제어를 고려한 DDCHMM이 CHMM보다 SHB은 인식률을 얻었다.

  • PDF

다중 펄스와 다중 대역 이차 장구간 예측을 이용한 CELP 음성 부호화기 (A CELP Speech Coder Using Secondary Long Term Prediction with Multi-Band Pass Filtered Multi-Pulses)

  • 서정태;최용수;강홍구;윤대희
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.9-16
    • /
    • 1998
  • 본 논문에서는 낮은 비트율 CELP 음성 부호화기의 장구간 예측기의 성능 향상 방 법을 제안한다. 비트율을 낮추기 위해서는 분석 구간의 길이가 길어져야하며 이에 따라 장 구간 예측기의 성능이 저하되어 장구간 예측 후에도 준 주기성 성분이 상당량 존재하므로 백색 잡음으로 구성된 통계 코드북만으로는 이를 모델링하기 어려워진다. 제안 방법에서는 다중 대역 필터와 다중 펄스열을 이용하여 한 번 더 필터링(이차 장구간 예측)함으로써 장 구간 예측 후의 신호가 통계 코드북에 적합한 백색 잡음 형태로 되도록 모델링한다. 제안된 방법의 성능을 평가하기 위해 4.8kbps 비트율로 양자화한 후, 기존에 제안된 같은 전송률의 MBCELP와 DoD-CELP와 비교하였다. 실험 결과 제안된 방법이 기존 부호화기들에 비해 주/객관적인 음질에서 우수한 성능을 보여준다.

  • PDF

발음열 자동 생성기를 이용한 한국어 음운 변화 현상의 통계적 분석 (Statistical Analysis of Korean Phonological Variations Using a Grapheme-to-phoneme System)

  • 이경님;정민화
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.656-664
    • /
    • 2002
  • 본 논문에서는 한국어 발음열 자동 생성기를 이용하여 한국어의 음운 규칙에 대한 통계적 분석을 수행하였다. 실험에 사용한 발음열 자동 생성기는 한국어 음운 변화 현상에 대해 형태음운론에 기반 한 언어학적 분석과 문교부 표준어 규정의 표준 발음법에서 유도된 필수 및 수의적 음소 변동 규칙과 변이음 규칙의 단계적 적용 모델을 사용해서 구현되었으며, 특히 연속음성 인식을 위한 학습용 발음열과 인식용 발음사전 생성의 최적화를 목표로 하였다. 본 논문에서는 대어휘 연속음성 인식기의 음향 모델을 구축하기 위해 만들어진 삼성 PBS(Phonetically Balanced Sentence) 음성 데이터 베이스의 60,000문장에 적용된 발음열 생성기의 음소 변동규칙들의 분포 및 그 통계를 사용해서 한국어 음운 변화 양상을 분석하였다. 적용된 빈도수를 기준으로 분석한 결과, 필수음소 변동규칙의 경우는 연음법칙, 경음화, 격음화, 장애음의 비음화순으로, 수의적 음소 변동규칙의 경우는 초성 ㅎ 탈락, 중복 자음화, 동일 조음위치 자음탈락 순으로 음운 변화가 발생하였다. 이러한 적용 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 양상을 파악할 수 있었으며, 나아가 본 논문의 연구 결과는 음성 인식 시스템을 개발하는데 유용하게 사용할 수 있을 것이다.