• 제목/요약/키워드: HOS(higher-order-statistics)

검색결과 8건 처리시간 0.021초

고차 통계를 이용한 잡음 환경에서의 화자식별 (Speaker Identification Using Higher-Order Statistics In Noisy Environment)

  • 신태영;김기성;권영욱;김형순
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.25-35
    • /
    • 1997
  • 음성 신호 처리에 널리사용되어 온 2차 통계에 의한 음성 분석 방법은 잡음 환경에서 성능이 크게 저하되는 단점을 지닌다. 이에 반하여 고차 통계 방법은 Gaussian 잡음 등을 억제하는 특성을 가지고 있어서 잡음 환경에 상대적으로 강인한 음성 특징 추출을 가능하게 한다. 본 논문에서는 고차 통계에 의한 음성 분석 방법을 이용하여 백색 및 유색 잡음 환경에서의 문맥 독립형(text-independent) 화자식별 시스템을 제안하고, 기존의 2차 통계에 의한 방식과 성능을 비교하였다. 본 논문에서의 화자식별 시스템은 벡터 양자화 방법에 기반을 두고 있으며, 고차 통계 방법에 의한 유성음/무성음 판별을 통해 non-Gaussian 특징을 가지면서도 화자 정보가 집중되어 있는 유성음 부분에 대해서만 음성 특징을 추출하여 인식에 사용하였다. 50명의 화자를 대상으로 한 화자식별 실험 결과, 고차 통계 방법이 2차 통계에 의한 방법보다 잡음 환경에서 상대적으로 우수한 인식 성능을 나타냄을 확인하였다.

  • PDF

고차 통계 초점 척도를 이용한 3D 모델 복원 알고리즘 (3D Model Reconstruction Algorithm Using a Focus Measure Based on Higher Order Statistics)

  • 이주현;윤현주;한규필
    • 한국멀티미디어학회논문지
    • /
    • 제16권1호
    • /
    • pp.11-18
    • /
    • 2013
  • 본 논문에서는 정확한 깊이를 추출하기 위해 고차 통계기반 초점 척도를 이용한 SFF(shape from focus) 알고리즘을 제시한다. 기존의 SFF기반 3차원 깊이 복원 기법들은 초점 척도로 SML(sum of modified Laplacian)을 사용하기 때문에, 성능이 영상의 특성에 크게 의존하여 초점이 정밀하거나 질감이 풍부한 영상에서만 효율적이다. 그러므로, 본 논문에서는 비교적 질감과 초점이 빈약한 영상에서도 초점 값을 추출할 수 있도록 고차 통계(HOS:higher order statistics)를 이용한 알고리즘을 제안한다. 이 초점 척도에 의해 초점 영역 맵이 생성되고 국부적으로 최적의 초점 값을 갖는 화소를 추출하기 위해 영역개선, 세선화, 모서리 검출과정이 순서적으로 적용된다. 최종적으로 추출된 점에 대해서 Delaunay 삼각화를 사용하여 3차원 모델정보를 생성한다.

고차통계를 이용한 충격/불량신호 탐지 (BLIND IDENTIFICATION OF IMPACTING SIGNAL USING HIGHER ORDER STATISTICS)

  • Seo, Jong-Soo;J.K. Hammond
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2001년도 추계학술대회논문집 II
    • /
    • pp.1044-1049
    • /
    • 2001
  • Classical deconvolution methods for source identification following linear filtering can only be used if the transfer function of the system is known. For many practical situations, however, this information is not accessible and/or is time varying. The problem addressed here is that of reconstruction of the original input from only the measured signal. This is known as 'blind deconvolution'. By using Higher Order Statistics (HOS), the restoration of the input signal is established through the maximisation of higher order moments (cumulants) with respect to the characteristics of the signals concerned. This restoration is achieved by constructing an inverse filter considering the choice of the initial inverse filter type. As a practical application, an experimental verification is carried out for the restoration of our impacting signal arising in the response of a cantilever beam with an end stop when randomly excited.

  • PDF

Blind Neural Equalizer using Higher-Order Statistics

  • Lee, Jung-Sik
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제2권3호
    • /
    • pp.174-178
    • /
    • 2002
  • This paper discusses a blind equalization technique for FIR channel system, that might be minimum phase or not, in digital communication. The proposed techniques consist of two parts. One is to estimate the original channel coefficients based on fourth-order cumulants of the channel output, the other is to employ RBF neural network to model an inverse system fur the original channel. Here, the estimated channel is used as a reference system to train the RBF. The proposed RBF equalizer provides fast and easy teaming, due to the structural efficiency and excellent recognition-capability of R3F neural network. Throughout the simulation studies, it was found that the proposed blind RBF equalizer performed favorably better than the blind MLP equalizer, while requiring the relatively smaller computation steps in tranining.

낮은 피사계 심도 영상에서 관심 물체의 효율적인 추출 방법 (An Efficient Object Extraction Scheme for Low Depth-of-Field Images)

  • 박정우;이재호;김창익
    • 한국멀티미디어학회논문지
    • /
    • 제9권9호
    • /
    • pp.1139-1149
    • /
    • 2006
  • 본 논문은 낮은 피사계 심도 영상(low depth-of-field image)에 대해 사용자의 도움 없이 포커스 된 관심 영역을 고속으로 추출하는 효율적인 방법을 제안한다. 우리는 입력 영상에 존재하는 고주파 성분을 HOS(higher order statistics) 계산을 함으로써 영상의 포커스 된 영역을 찾아내는 중요한 지표로 활용한다. 본 논문에서 제안하는 방법은 크게 4가지 단계로 구분할 수 있다. 첫 번째 단계에서는 기존 연구[1] 방법과 동일하게 모든 화소에 관해 HOS 지도를 계산하고 블록화한다. 두 번째 단계에서는 블록화 된 HOS를 이용하여 포커스 된 물체가 존재하는 후보 관심 영역을 대략적으로 구한다. 이후 관심 영역 내부에 존재하는 구멍(hole)을 제거하기 위해 구멍(hole) 추적 및 제거 연산을 수행한다. 마지막으로 최종 관심 후보 영역에서 배경 부분의 화소만 제거하여 포커스 된 관심 물체만을 섬세하게 추출한다. 제안하는 방법은 기존 방법[1]에 비해 정지 영상에서 고속으로 관심 영역을 추출하므로 추후 알고리즘의 변형 없이 낮은 피사계 심도의 동영상에 확장 적용하여 관심 영역을 실시간으로 추출할 수 있다. 본 논문에서 제안하는 방법은 가상 현실(VR)이나 실감 방송, 비디오 인덱싱 시스템과 같은 여러 응용 분야에 효과적으로 적용될 수 있고, 이러한 유용성은 실험 결과를 통해 보였다.

  • PDF

다중경로 페이딩 환경에서 HOS와 WT을 이용한 디지털 변조형태 인식 (Digital Modulation Types Recognition using HOS and WT in Multipath Fading Environments)

  • 박철순
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.102-109
    • /
    • 2008
  • 본 논문은 다중경로 페이딩 채널 조건에서 사전 정보없이 입사하는 디지털 신호 10종의 변조형태를 고정확도로 인식할 수 있도록 고차 통계량(HOS)과 웨이브릿 변환(WT)에서 선정된 특징(key features)을 이용한 견실한 하이브리드 분류기를 제안하였다. 제안된 분류기는 실제 시나리오를 고려하여 다양한 다중경로 환경(즉, 농촌, 소도시, 도심지역)에서 측정된 채널 데이터를 이용하였다. 실제 측정된 다중경로 페이딩 채널 데이터를 이용하여 Holdout-like 방식으로 총 15개 채널 중 9개 채널은 트레이닝용으로 사용하고, 나머지 6개 채널은 테스트용으로 사용하였다. 제안된 분류기는 다중경로 환경에서 높은 변별력을 유지하는 HOS 특징을 기반으로 구현되었고, AMA(Alphabet Matched Algorithm) 또는 MMA(Multi-modulus Algerian)와 같은 등화기법의 적용없이 분류가 어렵다고 알려진 MQAM신호(M=16, 64, 256)들에 대해서만 WT 특징을 적용하였다. 선정된 특징들을 이용한 변조인식은 입력공간에서 최대 마진을 갖는 하이퍼 공간으로 매핑시킴으로서 분류 능력이 우수하다고 알려진 SVM 메소드를 적용하여 시뮬레이션을 실시하였다. 제안된 분류기의 성능은 트레이닝 채널과 테스트 채널에서 WT 또는 HOS 특징만을 단독으로 사용하는 분류기에 비해 현저한 성능 향상을 보였고, 특히, MQAM 신호의 인식률은 낮은 SNR레벨에서도 거의 완전하게 분류되었다.

신경망을 이용한 Super-RENS 시스템의 비선형 모델링 (Nonlinear Modeling of Super-RENS System Using a Neural Networks)

  • 서만중;임성빈;이재진
    • 대한전자공학회논문지TC
    • /
    • 제45권3호
    • /
    • pp.53-60
    • /
    • 2008
  • 최근 들어, 광 기록 저장 시스템을 위한 다양한 기록 방식들이 연구되고 있다. BD (Blue-ray Disc)나 HD-DVD (High-Definition Digital Versatile Disc) 기록 방식의 표준화가 진행된 후에 차세대 광 기록 방식에 대한 관련 업계의 초점이 모아지고 있다. 이러한 차세대 광 기록 저장 시스템 가운데 기술의 호환성이 장점인 Super-RENS (Super-Resolution Near field Structure) 기술이 유력한 후보 중 하나이다. 본 논문에서는 HOS (Higher-Order Statistics)에서 사용되는 bicoherence 테스트를 통해 Super-RENS read-out 신호의 비선형성을 분석하고, Super-RENS 시스템의 비선형 모델링을 위해 신경망을 적용하고자 한다. 본 논문에서 고려하는 모델 구조는 NARX (Nonlinear AutoRegressive eXogenous) 모델이다. 모의실험 결과, Super-RENS read-out 신호의 비선형성이 존재함을 알 수 있었고, Super-RENS 시스템의 비선형 모델링을 위해 신경망이 유용하게 활용될 수 있다는 가능성을 확인하였다.

장애 음성 판별을 위한 의료/전자 융복합 소프트웨어 개발 (Development of medical/electrical convergence software for classification between normal and pathological voices)

  • 문지혜;이지연
    • 디지털융복합연구
    • /
    • 제13권12호
    • /
    • pp.187-192
    • /
    • 2015
  • 장애음성을 판별할 수 있는 소프트웨어가 개발 될 경우, 원격의료와 언어치료 등 여러 융복합 분야에서의 활용도가 매우 높다. 본 논문은 성대 진동에 대한 변화율을 나타내는 의료정보인 음향학적 파라미터와 신호처리 기반 고차 통계량에 기반을 둔 파라미터를 융합하여, CART(Classification And Regression Trees) 분석을 통해서 정상/장애음성 판별 프로그램을 구현하였다. 사용된 음향학적 파라미터는 Jitter(%)와 shimmer(%)이다. 그리고 본 연구에서 제안된 고차통계량 기반 파라미터는 왜도(Skewness)와 첨도(Kurtosis)의 평균과 분산이다. Kay Elemetrics의 데이터베이스에서 무작위로 발췌된 정상음성 53명, 장애 음성 173명의 /아/ 발화를 이용하여 결정트리(Decision tree) 기반장애음성 판별을 위해 평균적으로 83.15%의 성능을 보이는 알고리즘을 구현하였다. 그 결과를 바탕으로 추후 상용화를 고려하여 사용자 친화적인 프레임 워크에 의해 컨텐츠를 생성하는 융복합형 기능이 포함된 장애음성 판별 프로그램을 개발하였다.