• 제목/요약/키워드: multi-decoder

검색결과 194건 처리시간 0.032초

다양한 오디오 포맷을 지원하는 비디오/오디오 시스템 구현에 관한 연구 (A study on the implementation of a digital video/audio system to support multi-audio format)

  • 박인규
    • 전자공학회논문지CI
    • /
    • 제43권4호
    • /
    • pp.123-132
    • /
    • 2006
  • 현재 가정에 널리 보급되어 있는 비디오/오디오 기기 중 비디오 레코더 플레이어는 영상 기기로 분류되고 있지만 DVD 플레이어의 경우에는 오디오 기기로 분류될 정도로 오디오의 기능과 성능을 강조하고 있다. 따라서 비디오/오디오 시스템에서 오디오 재생 기능과 성능을 높이는데 많은 연구가 이루어지고 있다. 본 논문에서는 DVD 전용 프로세서를 이용한 비디오/오디오 시스템을 구성하는데 있어서 기존에 비디오 및 오디오 데이터의 처리를 DVD 전용 프로세서가 전담하는 구조에서 발생되는 DVD 전용 프로세서의 시스템 리소스의 한계성으로 인한 기능의 제약을 개선한 오디오 기능을 분화한 비디오/오디오 시스템의 구조를 제안하고 시스템 구현을 통해 제안된 구조의 우수성을 증명한다. 본 논문에서 제안한 시스템은 오디오 기능의 분화로 여러 가지 오디오 포맷이 지원 가능할 뿐만 아니라 원음에 특수한 효과를 부여하여 재생할 수 있도록 함으로써 사용자 취향에 맞는 설정으로 오디오를 감상할 수 있도록 하였고 다양한 음장 모드를 지원하도록 하였다. 다양한 포맷의 오디오를 지원하기 위해서는 각 오디오 포맷에 맞는 디코더를 모두 채용하는 방법이 가장 좋은 방법이겠으나 이러한 방법은 시스템 구성상의 효율성이 떨어지게 된다. 따라서 오디오를 재생할 때 필요한 오디오 포맷만을 재생 가능하도록 하기 위해 오디오 데이터를 검출하고 검출된 포맷만을 지원하는 방식으로 오디오 시스템을 구현함으로써 시스템의 유연성을 개선하였다.

분산산술연산방식을 이용한 MPEG-1 오디오 계층 3 합성필터의 FPGA 군현 (An FPGA Implementation of the Synthesis Filter for MPEG-1 Audio Layer III by a Distributed Arithmetic Lookup Table)

  • 고성식;최현용;김종빈;구대성
    • 한국음향학회지
    • /
    • 제23권8호
    • /
    • pp.554-561
    • /
    • 2004
  • 반도체 기술과 멀티미디어 통신기술이 발달하면서 고품위 영상과 다중 채널의 오디오에 관심을 갖게 되었다. MPEG 오디오 계층 3 디코더는 표준안에 기반을 둔 프로세서로써 기존에 많이 구현되어 있다. MPBG-1오디오 계층3 디코더의 합성필터는 디코더 전체에서 가장 많은 연산을 필요로 하기 때문에 고속 프로세서를 설계하기 위해서는 연산량을 줄일 수 있는 새로운 방식의 합성필터를 필요로 한다. 따라서 본 논문에서는 MPEG-1 오디오 계층 3의 핵심부분인 합성필터 부분을 DALUT (distributed arithmetic look-up table)방식을 이용하여 FPGA (Field Programmable Gate Array)에 구현하였다. 고속 필터를 설계하기 위해서 승산기 대신에 DALUT방식을 사용하였고, 파이프라인 구조를 사용하였으며, 데이터를 코사인 함수와 곱셈한 결과를 테이블로 만듦으로써 곱셈기를 제거하여 30%의 성능향상을 얻었다. 본 논문에서의 하드웨어 설계는 모두 VHDL (VHSIC Hardware Description Language)로 기술하였다. VHDL 시뮬레이션은 ALDEC사의 Active-HDL 6.1과 Model-sim 및 합성은 Synplify Pro 7.2v을 사용하였다. 대상 라이브러리는 XILINX사의 XC4010E, XC4020BX, XC4052 XL, P&R 툴은 XACT Ml.4를 사용하여 구현하였다. 구현된 프로세서는 20MHz∼70MHz사이에서 동작한다.

The Softest handoff Design using iterative decoding (Turbo Coding)

  • Yi, Byung-K.;Kim, Sang-G.;Picknoltz, Raymond-L.
    • Journal of Communications and Networks
    • /
    • 제2권1호
    • /
    • pp.76-84
    • /
    • 2000
  • Communication systems, including cell-based mobile communication systems, multiple satellite communication systems of multi-beam satellite systems, require reliable handoff methods between cell-to-cell, satellite-to-satellite of beam-to-team, respectively. Recent measurement of a CDMA cellular system indicates that the system is in handoff at about 35% to 70% of an average call period. Therefore, system reliability during handoff is one of the major system performance parameters and eventually becomes a factor in the overall system capacity. This paper presents novel and improved techniques for handoff in cellular communications, multi-beam and multi-satellite systems that require handoff during a session. this new handoff system combines the soft handoff mechanism currently implemented in the IS-95 CDMA with code and packet diversity combining techniques and an iterative decoding algorithm (Turbo Coding). the Turbo code introduced by Berrou et all. has been demonstrated its remarkable performance achieving the near Shannon channel capacity [1]. Recently. Turbo codes have been adapted as the coding scheme for the data transmission of the third generation international cellular communication standards : UTRA and CDMA 2000. Our proposed encoder and decoder schemes modified from the original Turbo code is suitable for the code and packet diversity combining techniques. this proposed system provides not only an unprecedented coding gain from the Turbo code and it iterative decoding, but also gain induced by the code and packet diversity combining technique which is similar to the hybrid Type II ARQ. We demonstrate performance improvements in AWGN channel and Rayleigh fading channel with perfect channel state information (CSI) through simulations for at low signal to noise ratio and analysis using exact upper bounding techniques for medium to high signal to noise ratio.

  • PDF

H.264/AVC 감시 어플리케이션용 멀티 채널 트릭 모드 재생 알고리즘 및 하드웨어 구현 (A Multi-Channel Trick Mode Play Algorithm and Hardware Implementation of H.264/AVC for Surveillance Applications)

  • 조현수;홍유표
    • 한국통신학회논문지
    • /
    • 제41권12호
    • /
    • pp.1834-1843
    • /
    • 2016
  • DVR은 감시를 위한 가장 기본적인 저장 및 전송 장비다. 영상 압축은 DVR 저장 공간의 절약을 위해 중요한 역할을 하는데 영상 압축의 표준인 H.264/AVC가 최근 DVR을 위해 주로 선택 되고 있다. DVR은 빠른 순방향, 역방향 재생과 정지 같은 다양한 출력 모드를 요구하는데, 이러한 것들을 트릭 모드라고 한다. 정밀한 트릭 모드재생의 구현은 복잡한 연산을 처리하기 위한 매우 높은 디코딩 능력이나 지능적인 구조가 요구된다. 이 복잡 도는 하나 이상의 카메라를 사용하여 여러 장소를 모니터 하거나 하나의 장소를 다양한 각도에서 모니터하는 많은 감시 어플리케이션일 때 증가한다. 본 논문에는 여러 채널을 위한 하드웨어 기반의 H.264/AVC 코덱의 트릭 모드재생 구현과 프레임 버퍼 운용 기법을 제시하고 있다. 실험 결과는 비트스트림 크기의 증가를 대가로 키 프레임 인코딩 특성으로 H.264/AVC 비디오 코덱 표준을 사용한 정확한 트릭 모드 재생이 가능하다는 것을 보여준다.

음성인식 성능 개선을 위한 다중작업 오토인코더와 와설스타인식 생성적 적대 신경망의 결합 (Combining multi-task autoencoder with Wasserstein generative adversarial networks for improving speech recognition performance)

  • 고조원;고한석
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.670-677
    • /
    • 2019
  • 음성 또는 음향 이벤트 신호에서 발생하는 배경 잡음은 인식기의 성능을 저하시키는 원인이 되며, 잡음에 강인한 특징을 찾는데 많은 노력을 필요로 한다. 본 논문에서는 딥러닝을 기반으로 다중작업 오토인코더(Multi-Task AutoEncoder, MTAE) 와 와설스타인식 생성적 적대 신경망(Wasserstein GAN, WGAN)의 장점을 결합하여, 잡음이 섞인 음향신호에서 잡음과 음성신호를 추정하는 네트워크를 제안한다. 본 논문에서 제안하는 MTAE-WGAN는 구조는 구배 페널티(Gradient Penalty) 및 누설 Leaky Rectified Linear Unit (LReLU) 모수 Parametric ReLU (PReLU)를 활용한 변수 초기화 작업을 통해 음성과 잡음 성분을 추정한다. 직교 구배 페널티와 파라미터 초기화 방법이 적용된 MTAE-WGAN 구조를 통해 잡음에 강인한 음성특징 생성 및 기존 방법 대비 음소 오인식률(Phoneme Error Rate, PER)이 크게 감소하는 성능을 보여준다.

전류 모드 CMOS를 이용한 4치 Hybrid FFT 연산기 설계 (Four-valued Hybrid FFT processor design using current mode CMOS)

  • 서명웅;송홍복
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권1호
    • /
    • pp.57-66
    • /
    • 2002
  • 본 논문에서는 전류모드 CMOS의 기본회로를 이용해 다치 논리(Multiple-Valued Logic) 연산기를 설계하고자 한다. 우선, 2진(Binary)FFT(Fast Fourier Transform)를 확장해 다치 논리회로를 이용해서 고속 다치 FFT 연산기를 구현하였다. 다치 논리회로를 이용해서 구현한 FFT연산은 기존의 2치 FFT과 비교를 해 본 결과 상당히 트랜지스터의 수를 줄일 수 있으며 회로의 간단함을 알 수가 있었다. 또한, 캐리 전파 없는 가산기를 구현하기 위해서 {0,1,2,3}의 불필요한(Redundant) 숫자 집합을 이용한 양의 수 표현을 FFT회로에 내부적으로 이용하여 결선의 감소와 VLSI 설계시 정규성과 규칙성으로 효과적이다. FFT승산을 위해서는 승산기의 연산시간과 면적을 다치 LUT(Look Up Table)로 이용해 승산의 역할을 하였다. 마지막으로 이진시스템(Bin system)과의 호환을 위해 다치 하이브리드형 FFT 프로세서를 제시하여 2진4치 부호기와 4치 2진 복호기 및 전류모드 CMOS회로를 사용하여 상호 호환성을 갖도록 설계를 하였다.

  • PDF

산업 자동화 장비의 상태감시를 위한 상황인지 시스템 (Context-Aware System for Status Monitoring of Industrial Automation Equipment)

  • 김경남;전민호;강철규;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.552-555
    • /
    • 2010
  • 본 논문에서는 산업체 공장 환경에서 장비의 상태를 감시하기 위해 무선 다중 센서 모듈을 이용한 상황인지 시스템을 제안한다. 무선 다중 센서 모듈은 가속도, 압력, 온도, 가스의 센서를 이용해 센싱 값을 수집 및 통합하고, 이 센싱 정보를 RS코드를 이용해 부호화 한 후 서버로 전송한다. RS디코더는 서버에 수신된 데이터들을 원래의 데이터로 복원하고, 이때 무선 통신 과정에서 발생한 오류를 복구하게 된다. 복원된 정보를 기반으로 상황인지 알고리즘에서는 임계값을 설정하고, 이후 센서의 센싱 정보들과 임계값을 비교하여 센싱 정보가 임계값의 범위를 벗어나면 이벤트를 생성하고, 대기시간 T초 동안 다른 센서에 장애가 발생하면 상황에 맞는 3단계의 알람을 발생시킨다. 실험결과를 통해 이 시스템이 상태감시에 효과적임을 확인하였다.

  • PDF

다중 사용자 환경에서의 광 CDMA 시스템 성능 분석 (Performance Analysis of an Optical CDMA System for multi-user Environment)

  • 전상영;김영일;이주희
    • 한국통신학회논문지
    • /
    • 제24권6B호
    • /
    • pp.1134-1141
    • /
    • 1999
  • 본 논문에서는 광 코드분할 다중접속(optical code division multiple access)시스템을 구현하고 그 구현된 시스템의 성능을 분석한다. 구현된 OCDMA 시스템에서 송신단은 레이저 다이오드를 이용하여 데이터를 광 펄스로 변환하며, 4단의 지연단으로 구성한 인코더를 이용하여 펄스 열로 확산한다. 수신단에서는 인코더의 지연선 구조와 동일한 구조의 디코더에서 펄스를 지연시킨 후 결합하여 수신된 신호를 복원한다. 성능분석에 있어서는, 먼저 단일 사용자 및 다중 사용자 환경 하에서 광 CDMA 신호의 auto-correlation과 cross-correlation을 분석하고, 실험을 통해 시뮬레이션 결과를 검증하였다. 또한 광섬유 지연선의 단 수 및 코드 길이 등 시스템의 성능에 영향을 미치는 파라메타를 컴퓨터 시뮬레이션을 통해 분석하였다. 실험 결과는 인코더와 디코더의 지연선 구조가 동일한 경우 펄스 열의 중앙에서 피크값의 펄스가 발생하는 auto-correlation 특성에 의해 데이터를 복원할 수 있었고, 지연선 구조가 동일하지 않은 경우 cross-correlation 특성에 의해 데이터를 복원할 수 없었다. 성능 분석 결과는 코드 길이가 감소하거나, 지연단위의 단 수를 증 $]$쳔갭\ulcorner비트 에러 확률이 감소하지만 요구되는 레이저 광원의 펄스폭이 점차로 감소하므로 시스템 구현이 어렵게 된다. 이러한 실험 및 분석 결과를 이용하면 CDMA 기술을 광 통신 네트워크로 적용할 수 있다.

  • PDF

도로 노면 파손 인식을 위한 Multi-scale 학습 방식의 암호화 형식 의미론적 분할 알고리즘 (Encoder Type Semantic Segmentation Algorithm Using Multi-scale Learning Type for Road Surface Damage Recognition)

  • 심승보;송영은
    • 한국ITS학회 논문지
    • /
    • 제19권2호
    • /
    • pp.89-103
    • /
    • 2020
  • 고령화 사회에 접어들면서 거동이 어려운 장애인과 고령자의 개인 교통수단에 대한 수요가 증가하고 있다. 실제로 2017년 기준 전국 전동보장구 보급수는 9만여 대로 지속해서 증가하는 추세다. 하지만 장애인 및 고령자의 판단 능력과 조정 능력은 정상인보다 상대적으로 차이가 있는 관계로 주행 중 사고 발생의 가능성이 크다. 다양한 사고의 원인 중 하나는 도로 노면상태의 불균형으로 인해 개인 이동 수단 조향 제어의 간섭이다. 본 논문에서는 이 같은 사고를 예방하고자 도로 노면 상태를 고속으로 인지할 수 있는 암호화 형식 의미론적 분할 알고리즘을 소개한다. 이를 위하여 도로 노면 파손이 포함된 1,500여 장의 학습용 데이터와 150여 장의 테스트용 데이터를 새롭게 구성하였다. 그리고 이를 활용하여 기존의 Encoder와 Decoder 단계로 구성된 Auto-encoder 방식과 달리 Encoder 단계로 이루어진 심층 신경망을 제안하였다. 이 심층 신경망은 기존의 방식과 비교했을 때 평균 정확도(Mean Accuracy)는 4.45% 증가하였고 파라미터는 59.2% 감소하였으며 연산 속도는 11.9% 향상되었다. 이 같은 고속 알고리즘을 활용하여 안전한 개인 이동 수단이 확대 적용되길 기대한다.

유역정보 기반 Transformer및 LSTM을 활용한 다목적댐 일 단위 유입량 예측 (Prediction of multipurpose dam inflow utilizing catchment attributes with LSTM and transformer models)

  • 김형주;송영훈;정은성
    • 한국수자원학회논문집
    • /
    • 제57권7호
    • /
    • pp.437-449
    • /
    • 2024
  • 딥러닝을 활용하여 유역 특성을 반영한 유량 예측 및 비교 연구가 주목받고 있다. 본 연구는 셀프 어텐션 메커니즘을 통해 대용량 데이터 훈련에 적합한 Transformer와 인코더-디코더(Encoder-Decoder) 구조를 가지는 LSTM-based multi-state-vector sequence-to-sequence (LSTM-MSV-S2S) 모형을 선정하여 유역정보(catchment attributes)를 고려할 수 있는 모형을 구축하였고 이를 토대로 국내 10개 다목적댐 유역의 유입량을 예측하였다. 본 연구에서 설계한 실험 구성은 단일유역-단일훈련(Single-basin Training, ST), 다수유역-단일훈련(Pretraining, PT), 사전학습-파인튜닝(Pretraining-Finetuning, PT-FT)의 세 가지 훈련 방법을 사용하였다. 모형의 입력 자료는 선정된 10가지 유역정보와 함께 기상 자료를 사용하였으며, 훈련 방법에 따른 유입량 예측 성능을 비교하였다. 그 결과, Transformer 모형은 PT와 PT-FT 방법에서 LSTM-MSV-S2S보다 우수한 성능을 보였으며, 특히 PT-FT 기법 적용 시 가장 높은 성능을 나타냈다. LSTM-MSV-S2S는 ST 방법에서는 Transformer보다 높은 성능을 보였으나, PT 및 PT-FT 방법에서는 낮은 성능을 보였다. 또한, 임베딩 레이어 활성화 값과 원본 유역정보를 군집화하여 모형의 유역 간 유사성 학습 여부를 분석하였다. Transformer는 활성화 벡터가 유사한 유역들에서 성능이 향상되었으며, 이는 사전에 학습된 다른 유역의 정보를 활용해 성능이 개선됨을 입증하였다. 본 연구는 다목적댐별 적합한 모형 및 훈련 방법을 비교하고, 국내 유역에 PT 및 PT-FT 방법을 적용한 딥러닝 모형 구축의 필요성을 제시하였다. 또한, PT 및 PT-FT 방법 적용 시 Transformer가 LSTM-MSV-S2S보다 성능이 더 우수하였다.