• 제목/요약/키워드: maximum a posteriori

검색결과 162건 처리시간 0.021초

음성/음악 분류 향상을 위한 2차 조건 사후 최대 확률기법 기반 SVM (Improving SVM with Second-Order Conditional MAP for Speech/Music Classification)

  • 임정수;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.102-108
    • /
    • 2011
  • Support vector machine (SVM)은 패턴인식 분야에 많이 사용되어지고 있고 그 한 예로서 3GPP2 selectable mode vocoder(SMV)와 같은 규격화된 코덱에 쓰여 코덱의 음성/음악 분류 성능을 향상시킬 수 있다. 본 논문에서는 SVM을 개선시켜 음성/음악의 분류성능을 더욱 향상시키는 새로운 방법을 제안한다. 음성/음악신호의 각 프레임들은 서로 강한 상관관계를 가지고 있는데, 이를 바탕으로 2차 조건 사후 최대 확률기법을 SVM에 적용하여 음성/음악 분류성능을 향상시킨다. 또한 SVM을 학습시킬 때 적용되는 기존의 기법들과는 달리 제안되는 기법은 SVM이 패턴분류를 행할 때 사용된다. 그렇기 때문에 기존의 기법들과 독립적으로 개발되고 사용될 수 있고, 따라서 패턴분류의 성능을 한층 더 향상시킬 수 있다. 실험을 통해 제안된 기법의 독립성과 성능향상을 기존의 기법들과 비교하여 증명하였다.

은닉 마르코프 모델을 이용한 음성에서의 감정인식 (Emotion recognition in speech using hidden Markov model)

  • 김성일;정현열
    • 융합신호처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.21-26
    • /
    • 2002
  • 본 논문은 분노, 행복, 평정, 슬픔, 놀람 등과 같은 인간의 감정상태를 인식하는 새로운 접근에 대해 설명한다. 이러한 시도는 이산길이를 포함하는 연속 은닉 마르코프 모델(HMM)을 사용함으로써 이루어진다. 이를 위해, 우선 입력음성신호로부터 감정의 특징 파라메타를 정의한다. 본 연구에서는 피치 신호, 에너지, 그리고 각각의 미분계수 등의 운율 파라메타를 사용하고, HMM으로 훈련과정을 거친다. 또한, 화자적응을 위해서 최대 사후확률(MAP) 추정에 기초한 감정 모델이 이용된다. 실험 결과로서, 음성에서의 감정 인식률은 적응 샘플수의 증가에 따라 점차적으로 증가함을 보여준다.

  • PDF

Effect of filters and reconstruction method on Cu-64 PET image

  • Lee, Seonhwa;Kim, Jung min;Kim, Jung Young;Kim, Jin Su
    • 대한방사성의약품학회지
    • /
    • 제3권2호
    • /
    • pp.65-71
    • /
    • 2017
  • To assess the effects of filter and reconstruction of Cu-64 PET data on Siemens scanner, the various reconstruction algorithm with various filters were assessed in terms of spatial resolution, non-uniformity (NU), recovery coefficient (RC), and spillover ratio (SOR). Image reconstruction was performed using filtered backprojection (FBP), 2D ordered subset expectation maximization (OSEM), 3D reprojection algorithm (3DRP), and maximum a posteriori algorithms (MAP). For the FBP reconstruction, ramp, butterworth, hamming, hanning, or parzen filters were used. Attenuation or scatter correction were performed to assess the effect of attenuation and scatter correction. Regarding spatial resolution, highest achievable volumetric resolution was $3.08mm^3$ at the center of FOV when MAP (${\beta}=0.1$) reconstruction method was used. SOR was below 4% for FBP when ramp, Hamming, Hanning, or Shepp-logan filter were used. The lowest NU (highest uniform) after attenuation & scatter correction was 5.39% when FBP (parzen filter) was used. Regarding RC, 0.9 < RC < 1.1 was obtained when OSEM (iteration: 10) was used when attenuation and scatter correction were applied. In this study, image quality of Cu-64 on Siemens Inveon PET was investigated. This data will helpful for the quantification of Cu-64 PET data.

Low Dimensional Multiuser Detection Exploiting Low User Activity

  • Lee, Junho;Lee, Seung-Hwan
    • Journal of Communications and Networks
    • /
    • 제15권3호
    • /
    • pp.283-291
    • /
    • 2013
  • In this paper, we propose new multiuser detectors (MUDs) based on compressed sensing approaches for the large-scale multiple antenna systems equipped with dozens of low-power antennas. We consider the scenarios where the number of receiver antennas is smaller than the total number of users, but the number of active users is relatively small. This prior information motivates sparsity-embracing MUDs such as sparsity-embracing linear/nonlinear MUDs where the detection of active users and their symbol detection are employed. In addition, sparsity-embracing MUDs with maximum a posteriori probability criterion (MAP-MUDs) are presented. They jointly detect active users and their symbols by exploiting the probability of user activity, and it can be solved efficiently by introducing convex relaxing senses. Furthermore, it is shown that sparsity-embracing MUDs exploiting common users' activity across multiple symbols, i.e., frame-by-frame, can be considered to improve performance. Also, in multiple multiple-input and multiple-output networks with aggressive frequency reuse, we propose the interference cancellation strategy for the proposed sparsity-embracing MUDs. That first cancels out the interference induced by adjacent networks and then recovers the desired users' information by exploiting the low user activity. In simulation studies for binary phase shift keying modulation, numerical evidences establish the effectiveness of our proposed MUDs exploiting low user activity, as compared with the conventional MUD.

Optimizations for Mobile MIMO Relay Molecular Communication via Diffusion with Network Coding

  • Cheng, Zhen;Sun, Jie;Yan, Jun;Tu, Yuchun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1373-1391
    • /
    • 2022
  • We investigate mobile multiple-input multiple-output (MIMO) molecular communication via diffusion (MCvD) system which is consisted of two source nodes, two destination nodes and one relay node in the mobile three-dimensional channel. First, the combinations of decode-and-forward (DF) relaying protocol and network coding (NC) scheme are implemented at relay node. The adaptive thresholds at relay node and destination nodes can be obtained by maximum a posteriori (MAP) probability detection method. Then the mathematical expressions of the average bit error probability (BEP) of this mobile MIMO MCvD system based on DF and NC scheme are derived. Furthermore, in order to minimize the average BEP, we establish the optimization problem with optimization variables which include the ratio of the number of emitted molecules at two source nodes and the initial position of relay node. We put forward an iterative scheme based on block coordinate descent algorithm which can be used to solve the optimization problem and get optimal values of the optimization variables simultaneously. Finally, the numerical results reveal that the proposed iterative method has good convergence behavior. The average BEP performance of this system can be improved by performing the joint optimizations.

MAP 추정법과 Huber 함수를 이용한 초고해상도 영상복원 (Super-Resolution Reconstruction Algorithm using MAP estimation and Huber function)

  • 장재용;조효문;조상복
    • 대한전자공학회논문지SD
    • /
    • 제46권5호
    • /
    • pp.39-48
    • /
    • 2009
  • 1984년 처음 SR 알고리즘이 제안된 이후, 많은 SR 복원 알고리즘이 제안되었다 SR의 접근방법 중에서도 공간적 접근방법은 저해상도 이미지의 픽셀 값을 고해상도 이미지 격자에 매핑 함으로써 이루어진다. 이때, 저해상도 이미지들 간의 각각 다른 노이즈와 다른 PSF(Point Spread Function) 함수, 왜곡으로 인해 매핑 시 문제가 된다. 때문에 저해상도 이미지들의 노이즈 성분을 최소화하는 방법이 필요하다. 본 논문에서는 노이즈 성분을 최소화하는 방법으로 L1 norm의 방법을 사용하고 이와 동시에 이미지의 경계를 보완해주는 Huber norm을 사용하는 SR의 구조를 제안한다. 실험에서는 타 알고리즘과의 비교를 통해 제안한 알고리즘이 저해상도 이미지 상에 존재하는 노이즈를 줄이고 이미지 경계부분의 보완을 확인하였다.

터보부호를 이용한 반복 위상 추정기법 (Iterative Phase estimation based on Turbo code)

  • 류중곤;허준
    • 대한전자공학회논문지TC
    • /
    • 제43권12호
    • /
    • pp.1-8
    • /
    • 2006
  • 본 논문은 유럽의 디지털 방송 규격인 DVB(Digital Video Broadcast)의 업 링크 채널 규격인 DVB-RCS에서 사용되는 터보부호의 특성을 이용하여 반송파의 위상을 추정하는 기법을 제안한다. 위상 추정기는 위치에 따라 크게 외부 단일 추정기와 내부 복수 추정기로 나누었고, 외부 추정 방식은 ML(Maximum Likelihood)과 LMS(Least Mean Square)을 이용하였으며 복수 추정기의 경우에는 LMS(Least Mean Square)와 PSP(Per Survivor Processing)방식 적용하였다. 단일 추정기의 경우 3가지 다른 APP(A Posteriori Probability)알고리즘의 성능을 비교하였으며 단일 추정기와 복수 추정기사이의 성능을 AWGN채널에서 위상오차와 위상잡음(Winner process)이 더해진 모델에서 비교하였다. 복수 추정기의 경우 향상된 2가지 알고리즘을 제안한다. 첫째는 Forward-Backward(Bi-directional)방식의 채널추정기법이고 둘째는 Forward 채널추정 값과 Backward 채널추정 값의 차이의 정보를 이용하는 Binding기법이다.

고속 전력선 통신을 위한 터보 부호화된 OFDM (Turbo Coded OFDM Scheme for a High-Speed Power Line Communication)

  • 김진영;구성완
    • 한국산학기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.141-150
    • /
    • 2010
  • 본 논문은 전력선 통신 채널에서 터보 부호와 OFDM 시스템의 성능을 분석하고 시뮬레이션 하였다. 전력선통신 시스템은 최악의 환경에서 동작되기 때문에 터보 부호는 전송 데이터의 신뢰성을 보장하기 위해서 사용되었다. 시뮬레이션의 성능은 비트 오류 확률로써 표현하였다. 터보 복호 알고리즘으로써 MAP과 Max-Log MAP 알고리즘, 그리고 SOVA를 선택하였고, 이것들의 성능을 비교하였다. 시뮬레이션 결과로부터, Max-Log MAP 알고리즘이 성능과 복잡도면에서 유망하다는 것이 입증되었다. 그리고 터보 부호기의 인터리버 길이가 100에서 5000으로 변할 때와 반복 횟수가 2번에서 8번으로 증가할 때, 각 각 3dB증가하였음을 알 수 있다. 본 논문에서의 결과는 OFDM를 기반으로 하는 전력선 통신 시스템에 적용될 수 있음을 보여준다.

계층적 트리 구조를 이용한 라만스펙트럼 판별 성능 개선 (Improvement in the classification performance of Raman spectra using a hierarchical tree structure)

  • 박준규;백성준;서유경;서성일
    • 한국산학기술학회논문지
    • /
    • 제15권8호
    • /
    • pp.5280-5287
    • /
    • 2014
  • 본 논문에서는 라만스펙트럼의 효과적인 판별을 위해 계층 트리 구조로 클래스를 그룹화 하는 방식을 제안하였다. 실험데이터로는 28종 화학물질의 라만 스펙트럼을 준비하였고 잡음제거, 정규화 등의 전처리 수행하였다. 다음으로 사전실험을 통해 서로 간에 분류오류를 발생시키는 물질들을 그룹화 하여 계층 구조의 클래스를 구성하였고, 각각의 상위, 하위 클래스에 PCA(principal component analysis) 특징추출과 MAP(maximum a posteriori probability) 방식의 분류실험을 수행하였다. 실험 결과에 의하면 계층 구조의 클래스를 적용한 경우 평균 2.7개의 특징을 사용하여 분류가 100% 이루어짐을 확인할 수 있었다. 계층 구조를 적용하지 않는 기존의 방식에서 6개의 특징을 사용할 때 동일한 분류결과를 보였음을 감안해 보면, 제안한 방식이 전체 계산 복잡도의 측면에서 훨씬 뛰어남을 알 수 있다. 따라서 제안한 방식이 실제 응용에 보다 적합하다고 할 수 있다.

배경 분리 기반의 실시간 객체 추적을 위한 개선된 적응적 배경 혼합 모델 (An Improved Adaptive Background Mixture Model for Real-time Object Tracking based on Background Subtraction)

  • 김영주
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.187-194
    • /
    • 2005
  • 연속 영상을 이용하여 실시간으로 움직임 객체를 추출하고 추적하기 위해 배경분리(Background Subtraction) 기법을 주로 사용한다. 외부 환경에서는 조명 조건의 변화, 나무의 흔들림과 같은 반복적인 움직임 그리고 급격히 움직이는 객체 등과 같이 고려해야할 많은 환경 변화 요인들이 존재한다. 이러한 외부 환경의 변화를 적응적으로 반영하여 배경을 분리할 수 있는 배경 모델로는 주로 가우시안 혼합 모델 (GMM: Gaussian Mixture Model)이 적용되고 있으며, 실시간 성능 등을 개선시킨 적응적 가우시안 혼합 모델 등이 제안되어 사용되고 있다. 본 논문은 개선된 적응적 가우시안 혼합 모델을 적용하고 고정된 학습률 a(일반적으로 작은 값)을 사용함으로써 물체의 갑작스러운 움직임 등에 빠르게 적응하지 못하는 문제점을 해결하기 위해 가우시안 분포 수의 적응적 조절 기능과 픽셀 값의 분산 등을 이용하여 학습률 a값을 동적으로 제어하는 방법을 제안하고 성능을 평가하였다.

  • PDF