• 제목/요약/키워드: non-stationary input

검색결과 53건 처리시간 0.026초

차량용 음성인식을 위한 주변잡음에 강건한 브라인드 음원분리 (Robust Blind Source Separation to Noisy Environment For Speech Recognition in Car)

  • 김현태;박장식
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.89-95
    • /
    • 2006
  • 독립성분분석을 사용한 암묵신호분리의 성능은 잔향이 존재하는 환경에서 잔류 누설 성분 (cross-talk) 때문에 현저히 저하된다. 본 논문에서는 잔류 누설 성분을 제거하기 위한 후처리 방법을 제안한다. 제안하는 방법은 주파수 영역에서의 변형된 NLMS(normalized least mean square) 필터를 사용하며 필터의 역할은 잔류 누설 성분을 유발하는 누설 경로를 추정하는 데 있다. 특정 채널에서 잔류하는 누설 성분은 상대 채널의 직접 성분에 해당되므로 관측되는 상대 채널의 입력신호를 이용하여 누설 경로를 추정할 수 있다. 변형된 NLMS 필터는 필터 입력 신호의 전력과 추정 오차 신호의 전력을 함께 고려하여 정규화한다. 특정 채널의 직접 신호 성분은 적응 필터에서 잡음처럼 동작하여 결국 적응필터가 오조정되기 때문에 제안하는 방법을 통해 적응필터의 오조정을 방지할 수 있다. 음성 신호를 사용한 컴퓨터 시뮬레이션 결과를 통해 제안하는 방법이 후처리를 사용하지 않은 경우에 비해 잡음 제거 성능(NRR)이 약 3dB 정도 개선되는 것을 확인 할 수 있다.

  • PDF

음성향상을 위한 가중치 갱신제어방식의 적응소음제거기 (Adaptive Noise Canceller by Weight Updating Control Method for Speech Enhancement)

  • 김규동;이윤정;김필운;장용민;조진호;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.1004-1016
    • /
    • 2007
  • 본 논문에서는 기준신호를 획득하기 어려운 환경에서 환경소음이 정상적인 특성을 가질 경우 음성을 향상시킬 수 있는 가중치 갱신제어 적응소음제거기를 제안하였다. 일반적인 적응소음제거기의 경우 소음만의 기준신호를 획득하여야 한다. 그러나 다수의 기기에 의한 복합적인 소음과 작업자에 의한 음성이 혼합되는 공장 환경에서는 소음발생원들로 부터 순수한 소음신호를 획득하기가 어렵다. 따라서 기준신호를 이용할 수 없기 때문에 이러한 환경에서는 기존의 적응잡음제거기를 사용하기가 어렵다. 제안한 방법에서는 입력신호를 임의의 상수로 하고 기준신호에 마이크로폰의 신호를 입력한다. 그런 다음 음성이 없는 구간에서 적응필터의 가중치를 갱신하여 소음을 제거하고 음성이 발생한 구간에서는 가중치를 고정하여 소음이 제거된 변형 음성신호를 획득한다. 그리고 변형 음성신호를 복원 필터링하여 음성신호를 출력한다. 이것은 다수의 공장소음이 정상적이고 짧은 대화구간에서 소음이 변하지 않는 점을 고려하였다. 실험의 결과 제안한 소음제거기가 공장소음을 효과적으로 제거할 수 있었고 신호 대 잡음비 면에서도 우수함을 확인하였다.

  • PDF

코드북 기반 음성향상 기법을 위한 게인 보상 방법 (Gain Compensation Method for Codebook-Based Speech Enhancement)

  • 정승모;김무영
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.165-170
    • /
    • 2014
  • 음성 인식을 위한 전처리기로 주변 잡음을 제거해 주는 음성향상 기법이 강조되고 있다. 다양한 음성향상 기법들 중 코드북 기반 음성향상 기법은 nonstationary 잡음 환경에서도 효율적으로 동작한다. 하지만, 기존 코드북 기반 음성향상 기법에서는 입력 신호와 음성 및 잡음 코드벡터 간에 미스매치가 발생하여 부정확한 게인이 추정되는 문제가 있다. 본 논문에서는 부정확한 게인을 보상하기 위해 long-term 잡음 추정 알고리즘을 사용하여 매 프레임 별로 신호 대 잡음비기반의 Normalized Weighting Factor (NWF)를 구하고, 이것을 기존 게인에 보상하는 방식을 제안한다. 제안된 코드북 기반 음성향상 기법은 기존 코드북 기반 음성향상 기법에 비해 향상된 성능을 보였다.

FEM을 이용한 상용차용 S-cam 브레이크슈의 구조해석 (Structural Analysis of S-cam Brake Shoe for Commercial Vehicle by FEM)

  • 서창민;지현철
    • 한국해양공학회지
    • /
    • 제23권4호
    • /
    • pp.69-77
    • /
    • 2009
  • Structural analysis of a brake shoe for commercial vehicle was performed using finite element method. Since the strength of a brake shoe is affected by the magnitude and distribution shape of the contact pressure with the drum, the contact pressure between the shoe friction material and drum was calculated using a 2-Dimensional non-linear contact analysis in a state. And the brake was actuated by input air pressure and the drum of it was calculated both stationary and dynamic based on forced torque applied to the drum during the static state analysis. The results of the above analysis were then used as the load boundary conditions for a 3-Dimensional shoe model analysis to determine the maximum strain on the shoes. In the analysis model, the values of tensile test were used for the material properties of the brake shoes and drum, while the values of compression test were used for the friction material. We assumed it as linear variation, even though the properties of friction material were actually non-linear. The experiments were carried out under the same analysis conditions used for fatigue test and under the same brake system which equipped with a brake drum based on the actual axle state in a vehicle. The strains were measured at the same locations where the analysis was performed on the shoes. The obtained results of the experiment matched well with those from the analysis. Consequently, the model used in this study was able to determine the stress at the maximum air pressure at the braking system, thereby a modified shoe model in facilitating was satisfied with the required endurance strength in the vehicle.

추계학적(推計學的) 해석법(解析法)에 의한 선형비례감쇠(線形比例減衰) 시스템의 층응답(層應答)스펙트럼 (Stochastic Analysis in the Generation of Floor Response Spectra for Liner Systems with Proportional Damping)

  • 박영석;서정문
    • 대한토목학회논문집
    • /
    • 제8권1호
    • /
    • pp.77-85
    • /
    • 1988
  • 본 연구(硏究)에서는 지진(地震)하중을 받는 선형비례감쇠(線形比例減衰) 시스템의 층응답(層應答) 스펙트럼을 random vibration 이론(理論)을 적용하여 계산(計算)하는 방법을 제시(提示)하였다. 해석(解析)방법으로는 모드가속도법(加速度法)을 사용하였으며 구조물(構造物)-기기(機器)의 상호작용(相互作用)은 고려하지 않았다. 입력지진운동(入力地震運動)과 기기(機器)의 응답(應答)을 평균(平均)값이 영(零)인 정상(定常) Gauss 과정(過程)으로 가정하였다. 입력지진(入力地震)의 천이특성을 Vanmarcke 방법(方法)에 따라 첨두계수(尖頭係數) 계산시 고려하였다. 층응답(層應答) 스펙트럼을 공진(共振)과 비공진(非共振)으로 구분(區分)하여 계산하였으며 응답(應答)계산시 구조물(構造物)과 진동체(振動體)의 첨두계수(尖頭係數)는 지반응답(地盤應答) 스펙트럼의 첨두계수(尖頭係數)와 동일(同一)하다고 가정하였다. 적용예(適用例)에서는 시간이력해석(時間履歷解析)의 결과와 비교(比較)함으로써 본 연구(硏究)의 타당성(妥當性)을 입증(立證)하였다. 본(本) 논문(論文)의 해석방법(解析方法)을 사용(使用)하면 비교적(比較的) 정확(正確)한 안전측(安全側)의 결과(結果)를 얻을 수 있으며 시간이력해석법(時間履歷解析法)에 비해 계산시간(計算時間)을 상당(相當)히 절약할 수 있다.

  • PDF

프레임 신뢰도 가중에 의한 강인한 음성인식 (Frame Reliability Weighting for Robust Speech Recognition)

  • 조훈영;김락용;오영환
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.323-329
    • /
    • 2002
  • 본 논문에서는 임의의 시점에서 발생하여 음성 신호의 일부분을 심하게 손상시키는 시간선택 잡음 (time-selective noise)을 보상하기 위한 프레임 신뢰도 가중 방법을 제안한다. 음성 프레임들은 서로 다른 정도의 신뢰도를 갖으며, 신뢰도는 프레임의 신호대잡음비 (signal-to-noise ratio)에 비례한다. 잡음이 일정한 경우에는 무음구간에서 획득한 잡음 정보를 이용하여 프레임의 신호대잡음비 추정이 용이하나, 시간선택 잡음은 잡음추정이 어렵다. 따라서, 본 연구에서는 프레임 신뢰도를 추정하기 위해 깨끗한 음성의 통계적 모델을 사용하였다. 제안한 MFR (model-based frame reliability) 방법은 탐조 모델의 평균 벡터열과 입력 MFCC (mel-frequency cepstral coefficient) 특징 벡터 열의 역변환에 의해 얻은 필터뱅크 에너지를 이용하여 프레임 신호대잡음비를 근사한다. 다양한 버스트 (burst) 잡음에 대한 인식 실험 결과, 제안한 방법은 프레임의 신뢰도를 효과적으로 나타낼 수 있었으며, 이 신뢰도를 우도 계산에서 가중치로 적용하여 인식 성능을 향상시킬 수 있었다.

비선형 순시추종형 PWM 제어기법을 적용한 강압형 DC-DC 컨버터 (The Buck DC-DC Convener with Non-Linear Instantaneous Following PWM Control Method)

  • 김상돈;라병훈;이현우;김광태
    • 조명전기설비학회논문지
    • /
    • 제17권2호
    • /
    • pp.73-80
    • /
    • 2003
  • 제안된 제어 기법은 아날로그 적분기의 적분시간이 적분기 입력전압의 크기에 반비례하는 원리를 이용하여 이 펄스 변조 스위칭 컨버터를 순시 추종 제어하는 방법을 제시한다. 제안된 제어 방법은 정주파수로 동작하며 제어 스위치가 턴 온 되는 시점에서 시작하여 턴 오프 되는 시간을 아날로그 적분기를 사용하여 계산한다. 전력 변환기의 스위칭 시간을 나타내는 듀티비는 스위칭 변수의 평균치에 의하여 결정되며 추종시간은 한 사이클 내에서 이루어진다. 정상 상태는 물론 과도 상태에서도 정확하게 지령치에 추종하며, 제어기는 제어 변수의 평균치와 제어 기준값을 보정하여 제어 오차가 제로가 되게 제어한다. 제안된 제어 방법은 벅 컨버터를 사용하여 실험하였으며 이를 통하여 실험 결과와 이론이 잘 일치하고 있음을 알 수 있었다.

농촌유역 물순환 해석을 위한 웹기반 자료 전처리 및 모형 연계 기법 개발 (Web-Based Data Processing and Model Linkage Techniques for Agricultural Water-Resource Analysis)

  • 박지훈;강문성;송정헌;전상민;김계웅;류정훈
    • 한국농공학회논문집
    • /
    • 제57권5호
    • /
    • pp.101-111
    • /
    • 2015
  • Establishment of appropriate data in certain formats is essential for agricultural water cycle analysis, which involves complex interactions and uncertainties such as climate change, social & economic change, and watershed environmental change. The main objective of this study was to develop web-based Data processing and Model linkage Techniques for Agricultural Water-Resource analysis (AWR-DMT). The developed techniques consisted of database development, data processing technique, and model linkage technique. The watershed of this study was the upper Cheongmi stream and Geunsam-Ri. The database was constructed using MS SQL with data code, watershed characteristics, reservoir information, weather station information, meteorological data, processed data, hydrological data, and paddy field information. The AWR-DMT was developed using Python. Processing technique generated probable rainfall data using non-stationary frequency analysis and evapotranspiration data. Model linkage technique built input data for agricultural watershed models, such as the TANK and Agricultural Watershed Supply (AWS). This study might be considered to contribute to the development of intelligent watercycle analysis by developing data processing and model linkage techniques for agricultural water-resource analysis.

State detection of explosive welding structure by dual-tree complex wavelet transform based permutation entropy

  • Si, Yue;Zhang, ZhouSuo;Cheng, Wei;Yuan, FeiChen
    • Steel and Composite Structures
    • /
    • 제19권3호
    • /
    • pp.569-583
    • /
    • 2015
  • Recent years, explosive welding structures have been widely used in many engineering fields. The bonding state detection of explosive welding structures is significant to prevent unscheduled failures and even catastrophic accidents. However, this task still faces challenges due to the complexity of the bonding interface. In this paper, a new method called dual-tree complex wavelet transform based permutation entropy (DTCWT-PE) is proposed to detect bonding state of such structures. Benefiting from the complex analytical wavelet function, the dual-tree complex wavelet transform (DTCWT) has better shift invariance and reduced spectral aliasing compared with the traditional wavelet transform. All those characters are good for characterizing the vibration response signals. Furthermore, as a statistical measure, permutation entropy (PE) quantifies the complexity of non-stationary signals through phase space reconstruction, and thus it can be used as a viable tool to detect the change of bonding state. In order to more accurate identification and detection of bonding state, PE values derived from DTCWT coefficients are proposed to extract the state information from the vibration response signal of explosive welding structure, and then the extracted PE values serve as input vectors of support vector machine (SVM) to identify the bonding state of the structure. The experiments on bonding state detection of explosive welding pipes are presented to illustrate the feasibility and effectiveness of the proposed method.

이동형 단말기를 위한 다채널 입력 기반 비정상성 잡음 제거기 (Multi-channel input-based non-stationary noise cenceller for mobile devices)

  • 정상배;이성독
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.945-951
    • /
    • 2007
  • 잡음의 제거는 음성을 인터페이스로 하는 기기들에 필수적이라고 할 수 있다. 실질적으로 통화 품질이나 음성 인식률은 음성 입력부의 주변에서 들어오는 원치 않는 가산성 잡음에 의해서 크게 열화된다. 본 논문에서는 기본적으로 두 개의 마이크로폰을 이용한 잡음제거 방법을 제안한다. 마이크를 여러 개 사용했을 때의 장점은 방향 정보를 이용할 수 있다는 것인데 이는 사람 목소리, 음악 소리 등의 비정상성 잡음을 제거하는 데에 유용하다. 제안된 잡음제거 알고리즘은 위너필터에 기반 한다고 볼 수 있다. 위너필터에 의한 잡음제거를 위해서는 검출하고자 하는 음성과 제거하고자 하는 잡음의 주파수 응답이 동시에 추정 가능해야 한다. 이를 위해서 주파수 영역에서 스펙트럼 분류를 시행하여 위너필터 기반의 잡음제거에 필요한 정보를 얻는다. 제안된 알고리즘을 이용한 성능은 잘 알려진 프로스트 (Frost) 알고리즘 및 적응 모드 컨트롤러를 갖는 generalized sidelobe canceller (GSC)와 비교하였다. 성능의 지표로는 객관적 음질 평가의 방법 중에서 널리 쓰이고 있는 perceptual evaluation of speech quality (PESQ) 및 음성 인식률이 사용되었다.