• 제목/요약/키워드: 멀티 디코더

검색결과 46건 처리시간 0.026초

다양한 무선단말을 위한 다운로더블 디코더 시스템 구현 (Implementation Downloadable Decoder System For Variable Mobile Terminal)

  • 김진렬;서덕영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.349-351
    • /
    • 2003
  • 다양한 무선단말에서는 멀티미디어 서비스를 적용하기 위해서는 데스크탑과 달리 다양한 시스템에 따라서 다양한 컨텐츠에 대한 디코더가 필요하게 된다. 디코더만 보더라도 표준화에 따라 여러 종류에 따라 디코더들이 있고 각 업체따라 독립적인 디코더들이 있다 이런 디코더들을 모두 무선단말을 처리하기 위해선 시스템의 너무 커지게 된다. 특히 표준화에 정의하는 디코더는 여러 가지 기능을 갖추기 때문에, 가 디코더 크기가 커지기 때문에. 시스템 역시 따라서 커지게 된다. 본 논문에선 위에 문제점들을 해결하기 위해 각 컨텐츠에 대해 특성화하여 크기가 작은 디코더를 개발하여 디코더를 컨텐츠와 함께 전송하는 효율적인 시스템을 제안하고자 한다.

  • PDF

인코더-디코더 사이의 특징 융합을 통한 멀티 모달 네트워크의 의미론적 분할 성능 향상 (Improved Semantic Segmentation in Multi-modal Network Using Encoder-Decoder Feature Fusion)

  • 손찬영;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.81-83
    • /
    • 2018
  • Fully Convolutional Network(FCN)은 기존의 방법보다 뛰어난 성능을 보였지만, FCN은 RGB 정보만을 사용하기 때문에 세밀한 예측이 필요한 장면에서는 다소 부족한 성능을 보였다. 이를 해결하기 위해 인코더-디코더 구조를 이용하여 RGB와 깊이의 멀티 모달을 활용하기 위한 FuseNet이 제안되었다. 하지만, FuseNet에서는 RGB와 깊이 브랜치 사이의 융합은 있지만, 인코더와 디코더 사이의 특징 지도를 융합하지 않는다. 본 논문에서는 FCN의 디코더 부분의 업샘플링 과정에서 이전 계층의 결과와 2배 업샘플링한 결과를 융합하는 스킵 레이어를 적용하여 FuseNet의 모달리티를 잘 활용하여 성능을 개선했다. 본 실험에서는 NYUDv2와 SUNRGBD 데이터 셋을 사용했으며, 전체 정확도는 각각 77%, 65%이고, 평균 IoU는 47.4%, 26.9%, 평균 정확도는 67.7%, 41%의 성능을 보였다.

  • PDF

후보 레이블 정보를 반영한 멀티 디코더 모델 (Multi-decoder Model Reflecting Candidate Label Information)

  • 박원재;최기현;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.307-310
    • /
    • 2021
  • 지도 학습을 하기 위해선 레이블이 부착된 데이터셋이 필요하다. 크라우드소싱 서비스를 통해 데이터셋을 구축하는데 다수의 주석자(Annotator)가 관여한다. 다수의 주석자가 레이블을 할당하고 과반수인 레이블을 최종 정답으로 결정한다. 이 과정에서 최종 정답과 다른 후보 레이블의 정보가 누락된다. 이를 완화하고 목표 작업에 대한 성능을 높이기 위해 후보 레이블에 대한 정보를 반영하는 멀티 디코더 모델을 제안한다. KLUE-TC, SNLI, MNLI 데이터셋으로 정량적 성능 평가를 수행하였으며 실험한 데이터셋 모두 일괄적인 성능 향상을 보였다.

  • PDF

MPEE-2 AAC 오디오 인코더 및 디코도 구현 (Implementation of Audio Encoder and Decoder Using MPEG-2 AAC)

  • 홍진우;장대영;김진웅
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.217-222
    • /
    • 1999
  • 본 논문에서는 멀티채널 오디오 부호화 방식인 MPEG-2 AAC(Advanced Audio Coding) 국제 표준을 수용한 AAC 인코더 및 디코더의 실시간 구현에 대해 기술한다. 범용 DSP 인 TMS320C6701 DSP를 이용한 하드웨어 플랫폼과 이 플랫폼에서 실시간으로 동작되는 인코더와 디코더 소프트웨어를 설계, 개발(MASIC 시스템)하였다. 구현한 MASIC 시스템은 오디오 입력 장치, 출력 장치, 인코더 보드, 그리고 디코더 보드로 구성되어 있으며, 개인용 컴퓨터의 PCI 슬롯을 이용하여 인코더의 경우 최대 6채널의 오디오를, 디코더의 경우 8채널의 오디오를 실시간 동작으로 처리할 수 있다. 인코더 및 디코더의 실시간 처리를 위한 소프트웨어 최적화 기술 및 인코더와 디코더의 연동시험에 대해서도 기술하며, 개인용 컴퓨터에서 실시간으로 수행되는 스테레오 AAC 디코더 소프트웨어의 개발 결과를 기술한다.

  • PDF

DVS를 이용한 저전력 WPEG 디코더 (Low Power MPEG Decoder with DVS Algorithms)

  • 손동환;이형석;김선잔
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.35-40
    • /
    • 2001
  • 동적 전압 조정(DVS)은 모바일 환경에서 프로세서에서의 전력 소모를 줄일 수 있는 가장 효율적인 방법으로 많은 연구가 진행중이다 또한 MPEG 디코딩은 모바일 기기에서 가장 중요하고 또한 전력 소모가 큰 어플리케이션 중 하나이다. 본 논문에서는 모바일 환경에 적합한 MPEG 디코더를 DVS를 이용하여 구현하였고 전력 소모를 측정하였다. 제안된 첫번째 DVS 알고리즘은 이전의 workload에 의해 다음 workload를 예측하여 전압을 조정하는 것이고, 두번째 알고리즘은 MPEG 프레임의 종류 및 크기를 이용하여 다음 프레임의 디코딩 시간을 예측 한 후 전압을 조절하는 것이다. 실험을 통하여 두번째 알고리즘에 의한 MPEG 디코더가 더 정확한 workload 예측을 통하여 QoS의 저하를 최소화하면서 전력 소모를 더 많이 줄일 수 있었다.

  • PDF

멀티채널 오디오(MPEG-2 AAC) 인코더 및 디코더의 실시간 구현 (Real-time Implementation of Encoder and Decoder for Multi-channel Audio(MPEG-2 AAC))

  • 홍진우;김진웅;박재홍;양재우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.79-86
    • /
    • 1999
  • 본 논문에서는 ISO/IEC MPEG-2 AAC 표준을 기반으로 한 멀티채널 오디오 인코더 및 디코더(MASIC) 시스템의 실시간 구현 기술에 대해서 기술한다. MPEG-2 AAC 기술은 멀티채널 오디오 부호화 방식의 국제 표준으로써, 지금까지 개발된 멀티채널 오디오 부호화 방식중 최신의 기술이며, 압축율과 오디오 품질이 가장 우수한 것으로 알려져 있다. MASIC 시스템은 인코딩 및 디코딩 기술의 실시간 처리를 위하여 범용 DSP인 TMS320C6701을 사용하였고, 멀티채널 오디오의 고속 입력과 출력을 위한 디지털 인터페이스를 가지고 있으며, 개인용 컴퓨터와의 인터페이스를 위한 PCI 기술이 적용되어 다양한 입출력 모드를 지원하는 특징을 갖는다.

  • PDF

MPEG-2 시스템계층의 엔코더와 디코더 간 System Time Clock 동기화 기법 (The Synchronization Method of System Time Clock between Encoder and Decoder on MPEG-2 System Layer)

  • 서희돈;기재훈
    • 한국멀티미디어학회논문지
    • /
    • 제8권10호
    • /
    • pp.1403-1410
    • /
    • 2005
  • 멀티미디어, 특히 실시간 통신에서 동기화 문제는 서비스 품질과 직결된다고 할 수 있다. 본 연구에서는 MPEG-2의 시스템계층의 표준 디코더가 고정 지연요소의 경우만 고려하여 설계되어 엔코더와 디코더간의 동기화가 되지 못함을 알게 되었다. 이를 해결하기 위해 MPEG-2에 적용할 수 있는 Extended-SRTS (extended-synchronous residual-time stamp)기법을 제안했다. 이 알고리즘은 MPEG-2의 STC(system time clock)를 서비스클럭(27MHz)으로 사용하여 전송스트림과 동기 시킨다. 그 결과 주파수 드리프트, 시변망 지터 및 패킹지터 등의 영향을 개선시킬 수 있다. 또한 망 클럭의 의존도를 낮출 수 있어 종단 간에 동기화를 쉽게 하고 투명한 연결을 할 수 있어, 실시간 멀티미디어 통신 분야에 폭넓게 적용할 수 있으리라 기대한다.

  • PDF

발화 내 페르소나 트리플 추출 방법 연구 (A Method for Extracting Persona Triples in Dialogue)

  • 장윤나;양기수;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.726-729
    • /
    • 2023
  • 본 논문에서는 대화 중 발화에서 페르소나 트리플을 추출하는 방법을 연구한다. 발화 문장과 그에 해당하는 트리플 쌍을 활용하여 발화 문장 혹은 페르소나 문장이 주어졌을 때 그로부터 페르소나 트리플을 추출하도록 모델을 멀티 태스크 러닝 방식으로 학습시킨다. 모델은 인코더-디코더 구조를 갖는 사전학습 언어모델 BART [1]와 T5 [2]를 활용하며 relation 추출과 tail 추출의 두 가지 태스크를 각각 인코더, 디코더 위에 head를 추가하여 학습한다. Relation 추출은 분류로, tail 추출은 생성 문제로 접근하도록 하여 최종적으로 head, relation, tail의 구조를 갖는 페르소나 트리플을 추출하도록 한다. 실험에서는 BART와 T5를 활용하여 각 태스크에 대해 다른 학습 가중치를 두어 훈련시켰고, 두 모델 모두 relation과 tail을 추출하는 태스크 정확도에 있어서 90% 이상의 높은 점수를 보임을 확인했다.

  • PDF

가상 음원 위치 정보를 이용한 능동 메트릭스 디코더 (A Perception Based Active Matrix Decoder with Virtual Source Location Information)

  • 문한길
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.18-24
    • /
    • 2010
  • 본 논문에서는 돌비 프로로직 II/IIx를 대체하기 위한 가상 음원 위치 정보 기반의 새로운 메트릭스 디코더 시스템을 제안하고자 한다. 제안하는 신규 메트릭스 디코더는 역행렬 계산을 통해 얻어지는 수동 메트릭스 디코딩부와 수동 메트릭스 디코딩을 통해서 얻은 신호들을 멀티채널 신호의 채널간 이미지 특성에 따라서 적응적으로 가변시키는 능동 메트릭스 디코딩부로 구성된다. 멀티채널 환경에서 채널 간에 형성되는 다수의 이미지는 실제 청각 시스템에 의해서 인지되어 만들어지는 가상의 사운드 이벤트와 연결이 되어 있다. 따라서 이 이미지의 위치와 크기에 기반하여 멀티채널 신호를 적응적으로 가변시키면, 인지적인 관점에서 우수한 성능의 메트릭스 디코더를 설계할 수 있다. 더불어 채널간 분리도를 향상시키기 위해서 비선형 삼각함수의 조합을 사용하였다.

모바일 멀티 코어 GP-GPU를 이용한 H.264/AVC 디코더 구현 (Implementation of IQ/IDCT in H.264/AVC Decoder Using Mobile Multi-Core GPGPU)

  • 김동한;이광엽;정준모
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.321-324
    • /
    • 2010
  • 최근 멀티코어 프로세서의 이용이 증가함에 따라, 멀티코어를 이용한 다양한 병렬화 기법들이 제안되고 있다. 모바일 환경에서도 멀티코어 구조를 적용한 프로세서들이 등장하면서 병렬화 기법들이 연구되고 있다. 하지만, 아직까지 모바일 환경에서의 CPU의 성능은 한계가 있다. 이를 병렬처리와 실수 연산이 뛰어난 GPGPU(General-Purpose computing in Graphics Processing Units)를 멀티코어 구조로 설계함으로써 다른 전용 하드웨어의 추가 없이 성능을 향상 시킬 수 있다. 본 논문에서는 모바일 환경에 적합하게 설계된 멀티코어 GPGPU를 이용하여 H.264 디코더의 Inverse Quantization, Inverse DCT, Color Space Conversion 모듈을 구현하였다. 멀티코어 GPGPU를 이용한 H.264 전체 시스템 동작 시 50%의 성능 향상이 있었다.

  • PDF