• 제목/요약/키워드: Viterbi

검색결과 394건 처리시간 0.021초

은닉 마르코프 모델을 이용한 MPEG 압축 비디오에서의 점진적 변환의 검출 (Detection of Gradual Transitions in MPEG Compressed Video using Hidden Markov Model)

  • Choi, Sung-Min;Kim, Dai-Jin;Bang, Sung-Yang
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.379-386
    • /
    • 2004
  • 비디오 요약의 첫 걸음은 샷(shot) 변환의 검출이다. 이러한 샷 변환은 점진적인 변환과 급진적인 변환이 있다. 지금까지 급진적인 샷 변환은 이미 주어진 한계치나 연속된 두 프레임의 이미지에 기반을 둔 거리를 이용하여 검출하였고 점진적 변환 또한 일반적으로 한계치를 이용하여 검출하였다. 그러나 한계치에 따라 그 결과가 확연히 달라지고 또한 그 한계치를 정하는 것도 어려운 문제이다. 이 논문에서는 이런 문제의 해결과 MPEG 압축 비디오 상에서 점진적 변화의 검출뿐만 아니라 분류를 해결하는 방법을 제시하였다. 논문에서는 한계치를 사용하지 않은 은닉 마르코프 모델과 MPEG의 근사 DC 값을 이용하여 보다 빠르고 정확한 결과를 얻도록 하였다. 그리고 히스토그램의 차이뿐만 아니라 매크로 블록 (macro block)의 차이라 불리는 새로운 척도를 도입하여 보다 정확한 값을 얻도록 하였다. 은닉 마르코프 모델은 샷, 페이드(fade), 디졸브(dissolve), 컷(cut) 등의 4개의 상태를 갖게 하고 학습은 Baum-Welch 알고리즘으로 필요한 변수들을 추정하였다. 그리고 특정 벡터에 Viterbi 알고리즘을 적용하여 원하는 상태를 얻을 수 있다. 대부분의 실험 결과를 보면 새로 제안한 척도를 사용한 방법이 히스토그램의 차만을 이용한 방법보다 더 좋은 결과를 나타내었으며 이산적 마르코프 모델보다 연속적 마르코프 모델이 좋은 결과를 보여준다.

실내 무선 채널 환경에서 무선 LAN용 OFDM 시스템의 성능 분석 (Performance Analysis of a OFDM System for Wireless LAN in Indoor Wireless Channel)

  • 최연주;김항래;김남;고영훈;안재형
    • 한국전자파학회논문지
    • /
    • 제12권2호
    • /
    • pp.268-277
    • /
    • 2001
  • 본 논문에서는 IEEE 802.11a 무선 LAN에 적합한 OFDM 시스템에 비터비 복호를 사용하는 길쌈 부호와 단일 탭의 LMS 등화기를 적용하여 실내 무선 채널 환경에서 시스템 성능을 시뮬레이션을 통해 분석한다. 실내 무선 채널은 라이시안 페이딩 모델링하고, 부채널변조 방식으로는 QPSK와 16QAM을 사용한다. 직접 파 대 간섭파 전력비 K=5 dB 인 라이시안 페이딩 채널에서 길쌈 부호 및 비터비 복호를 사용하는 경우, 경판정에서 QPSK는 8.6 dB, 16QAM 은 19.2dB, 연판정에서 QPSK는 5.3dB, 16QPSK는 5.3dB, 16QAM은 9.8dB에서 $10^{-4}$의 BER을 만족하였다. 또한 16QAM/OEFM 방식에 단일 탭의 LMS 등화기를 사용하면 길쌈 부호만을 사용한 경우보다 경판정 비터비 복호의 경우 8.6dB,연판정의 경우에는 2dB의 성능이 향상됨을 알 수 있었다.

  • PDF

콜퍼스에 기반한 한국어 문장/음성변환 시스템 (Corpus-based Korean Text-to-speech Conversion System)

  • 김상훈;박준;이영직
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.24-33
    • /
    • 2001
  • 이 논문에서는 대용량 음성 데이터베이스를 기반으로 하는 한국어 문장/음성변환시스템의 구현에 관해 기술한다. 기존 소량의 음성데이타를 이용하여 운율조절을 통해 합성하는 방식은 여전히 기계음에 가까운 합성음을 생성하고 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 대용량 음성 데이터베이스를 기반으로 하여 운율처리없이 합성단위 선정/연결에 의해 합성음질을 향상시키고자 한다. 대용량 음성 데이터베이스는 다양한 운율변화를 포함하도록 문장단위를 녹음하며 이로부터 복수개의 합성단위를 추출, 구축한다. 합성단위는 음성인식기를 훈련, 자동으로 음소분할하여 생성하며, 래링고그라프 신호를 이용하여 정교한 피치를 추출한다. 끊어 읽기는 휴지길이에 따라 4단계로 설정하고 끊어읽기 추정은 품사열의 통계정보를 이용한다. 합성단위 선정은 운율/스펙트럼 파라미터를 이용하여 비터비 탐색을 수행하게 되며 유클리디언 누적거리가 최소인 합성단위열을 선정/연결하여 합성한다. 또한 이 논문에서는 고품질 음성합성을 위해 특정 서비스 영역에 더욱 자연스러운 합성음을 생성할 수 있는 영역의존 음성합성용 데이터베이스를 제안한다. 구현된 합성시스템은 주관적 평가방법으로 명료도와 자연성을 평가하였고 그 결과 대용량 음성 데이터베이스를 기반으로한 합성방식의 성능이 기존 반음절단위를 사용한 합성방식보다 더 나은 성능을 보임을 알 수 있었다.

  • PDF

비선형 HPA 환경을 고려한 4D-8PSK-TCM 시스템의 설계 및 분석 (Design and Analysis of 4D-8PSK-TCM System Considering the Nonlinear HPA Environment)

  • 안창영;유상범;이상규;유흥균
    • 한국전자파학회논문지
    • /
    • 제29권4호
    • /
    • pp.299-307
    • /
    • 2018
  • 본 논문에서는 X밴드 위성통신을 위해 권고되는 4D-8PSK-TCM(Four Dimensional 8-ary Phase Shift Keying Trellis Coded Modulation) 시스템을 비선형 HPA(High Power Amplifier)와 전치왜곡기를 고려하여 설계하고, 스펙트럼, BER(Bit Error Rate) 성능을 평가 및 분석한다. 위성통신에서는 한정적인 전력으로 인해 전력을 가장 많이 소모하는 HPA의 동작점을 결정하는 비선형 특성 분석이 매우 중요하다. 본 논문에서는 2, 2.25 bits/channel-symbol의 효율을 갖는 4D-8PSK-TCM 시스템을 설계하였다. 시뮬레이션 결과로, 낮은 PAPR(Peak to Average Power Ratio) 특성과, 스펙트럼의 점유 대역폭을 기준으로 SRRC(Square Root Raised Cosine) 필터의 Roll-off 값은 0.35가 효율적이며, 전치왜곡기를 사용하지 않을 경우 HPA에서 약 15~20 dB의 OBO(Output Back-Off)가 요구되며, 전치왜곡기를 사용할 경우 약 1 dB 내외의 OBO가 요구됨을 확인하였다.