• 제목/요약/키워드: Encoder Layer

검색결과 96건 처리시간 0.025초

A Simple One-pass Variable Rate Control Method for Fixed-Size Storage Systems

  • Kyungheon Noh;Jeong, Seh-Woong;Park, Jeahong;Byeungwoo Jeon
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.289-292
    • /
    • 2002
  • This paper provides a frame-layer method for controlling bit rate of compressed video data in real time. Our approach is easy to operate and can store encoded video data in real time without deteriorating the quality of an image. To provide ameliorated and consistent visual quality, a new concept named SOP (Set Of Pictures) and a new quantization parameter variation control algorithm based on a second-order rate-distortion model 〔2〕 are introduced. The total bit-budget is allocated efficiently to cope with unpredictable recording time by using the proposed algorithm and it is distributed to each frame. In the end, we show improved and consistent video quality with experimental results obtained from C-model of a MPEG-4 (simple-profile) encoder.

  • PDF

MPEG-2 오디오를 위한 MDCT 설계에 관한 연구 (A Study on the MDCT Design for MPEG-2 Audio)

  • 김정태;구대성;이강현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.97-100
    • /
    • 2000
  • The most important technology is the compression methods in the multimedia society. Audio files are rapidly propagated through internet. MP-3(MPEG-1 Layer3) is offered to CD tone quality in 128kbps, but 64kbps below tone-quality is abruptly down. On the other hand, MPEG-II AAC (Advanced Audio Coding) is not compatible with MPEG-I, but AAC has a high compression ratio 1.4 times better than MP-3 and it has max. 7.1 channel and 96KHz sampling rate. In this paper, we designed the optimized MDCT (Modified Discrete Cosine Transform) that could decrease the capacity of enormous computation and could increase the processing speed in the MPEG-2 AAC encoder.

  • PDF

무선 LAN용 직접대역확산 방식 모뎀 아키텍쳐 설계 (Design of a DSSS MODEM Architecture for Wireless LAN)

  • 장현만;류수림;선우명훈
    • 전자공학회논문지C
    • /
    • 제36C권6호
    • /
    • pp.18-26
    • /
    • 1999
  • 본 논문에서는 무선 LAN 표준안 IEEE 802.11의 직접대역확산(Direct Sequence Spread Spectrum) 물리계층을 지원하는 기저대역 모뎀 ASIC 칩의 아키텍쳐와 설계에 대해 기술한다. 구현된 모뎀 칩은 크게 송신부와 수신부로 구성되어 있으며, CRC 부호화/복호화기, 차동 부호화/복호화기, 주파수 옵셋 보상기(frequency offset compensator) 및 타이밍 복구 회로를 포함한다. 구현된 모뎀 칩은 4, 2 및 1Mbps의 다양한 데이타 전송률을 지원하고, DBPSK와 DQPSK의 변조방식을 사용한다. 구현한 모뎀 아키텍쳐는 $SAMSUNG^{TM}$ $0.6{\mu}m$ 게이트 어레이 라이브러리(gate array library)를 사용하여 논리합성을 수행하였으며, 칩의 전체 게이트 수는 53,355개이다. 칩의 동작 주파수는 44MHz이며, 칩의 패키지는 100-pin QFP이고, 전력소모는 44MHz에서 1.2watt이다. 구현된 모뎀 아키텍쳐는 상용화된 HSP3824 칩 보다 우수한 BER성능을 나타낸다.

  • PDF

지상파 MMS 가변 비트율 모드 방송에서 TV 채널 전환 시 발생하는 영상 표출 시간 지연의 개선 (Improvement to Video Display Time Delay when TV Channel switching in Variable Bit Rate Mode of Terrestrial MMS)

  • 박성환;장해랑;전형준;권순철;이승현
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권5호
    • /
    • pp.775-781
    • /
    • 2015
  • 2015년 2월 11일 국내 최초 2HD MMS 시험방송이 EBS에서 시작되었다. MPEG-2 코덱기반의 영상 압축 방식을 사용하고 있으며, 화질 최적화를 위해서 1080i 와 720p 주사방식에 따른 변화 및 효율적 데이터 사용을 위한 가변 비트율(Variable Bit Rate) 연구결과를 반영하였다. MMS 방송에서 화질 최적화를 위하여 2개의 HD 채널에 가변 비트율을 적용하여 인코딩하는 경우 가변 GOP(Group Of Picture) 동작으로 수신 TV에서 채널 전환 시 영상 표출에 걸리는 시간이 길어지는 현상이 발생한다. 본 연구에서는 ON-AIR TS 분석 및 실험을 통해서 인코딩 단계에서 GOP 설정에 따른 I 프레임 디코딩 시간 관계를 검증하였다. 검증 데이터를 활용하여 Encoder GOP 파라미터를 조정하는 방법으로 1080i와 720p 주사방식에 따라서 다르게 나타나는 영상 표시 시간 지연문제를 개선하였다.

TMS320C541 DSP를 이용한 MP3 디코더 구현 (Implementation of MP3 decoder with TMS320C541 DSP)

  • 윤병우
    • 융합신호처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.7-14
    • /
    • 2003
  • MPEG-1 오디오 표준은 고음질 디지털 오디오 신호의 압축 알고리즘이다. 이 표준은 인코더와 디코더의 기능을 규정하고 있고, 인코더와 디코더 알고리즘의 복잡도와 성능에 따라 세 가지 다른 계층으로 분류된다. 본 논문에서는 MPEG-1 오디오 계층3(MP3) 디코더를 고정소수점 DSP인 TMS320C541 칩으로 구현하였다 MP3 알고리즘은 인간의 청각구조의 심리음향 특성을 이용하는 알고리즘으로 인간의 귀에 들리지 않는 주파수의 성분은 미리 제거함으로써 데이터의 량을 줄이면서 음질의 손실을 최대한 줄이는 알고리즘이다. 이 알고리즘은 다이나믹 레인지가 매우 크기 때문에 고정 소수점으로 구현하기가 쉽지 않다. 본 연구에서는 가중 참조표를 적용하여 계산량을 줄이고 다이나믹 레인지 문제를 해결함으로써 고정 소수점 DSP칩을 이용하여 실시간 시스템을 구현하였다.

  • PDF

Hierarchical Flow-Based Anomaly Detection Model for Motor Gearbox Defect Detection

  • Younghwa Lee;Il-Sik Chang;Suseong Oh;Youngjin Nam;Youngteuk Chae;Geonyoung Choi;Gooman Park
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권6호
    • /
    • pp.1516-1529
    • /
    • 2023
  • In this paper, a motor gearbox fault-detection system based on a hierarchical flow-based model is proposed. The proposed system is used for the anomaly detection of a motion sound-based actuator module. The proposed flow-based model, which is a generative model, learns by directly modeling a data distribution function. As the objective function is the maximum likelihood value of the input data, the training is stable and simple to use for anomaly detection. The operation sound of a car's side-view mirror motor is converted into a Mel-spectrogram image, consisting of a folding signal and an unfolding signal, and used as training data in this experiment. The proposed system is composed of an encoder and a decoder. The data extracted from the layer of the pretrained feature extractor are used as the decoder input data in the encoder. This information is used in the decoder by performing an interlayer cross-scale convolution operation. The experimental results indicate that the context information of various dimensions extracted from the interlayer hierarchical data improves the defect detection accuracy. This paper is notable because it uses acoustic data and a normalizing flow model to detect outliers based on the features of experimental data.

실시간 처리를 위한 멀티채널 오디오 코덱의 구현 (The Implementation of Multi-Channel Audio Codec for Real-Time operation)

  • 홍진우
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.91-97
    • /
    • 1995
  • 본 논문은 저비트율을 갖는 고품질의 HDTV용 멀티채녈 오디오 코덱을 구현에 대해 기술한다. 이 코덱은 저주파수 효과 채널을 포함한 최대 3/2 스테레오 채널 구성, 최대 채널 구성보다 낮은 채널 구성과의 호환성, 기존 2채널 스테레오 시스템과의 호환성(MPEG-1 오디오), 그리고 다중 대화 채널 등을 제공하는 특징을 갖는다. 구현한 멀티채널 오디오 코덱의 인코더는 3개의 DSP(TI의 TMS320C40)로 구성되었고, 최대 48KHz 샘플링율과 16비트의 부호화를 갖는 5.1 채널의 아날로그 및 AES/EBU, IEC 958등의 포맷을 갖는 스테레오 2채널의 디지털 오디오를 이력으로 받아 지각 심리음향 모델을 사용하여 압축한후 384Kbps의 빛 스트림으로 전송하는 특징을 가지며, 디코더는 2개의 DSP로 구성되어 있고, 384Kbps로 입력되는 비트 스트림을 받아 최대 5.1 채널의 아날로그 및 2개의 2채널 스테레오의 디지털 오디오 신호로 출력시키는 특징을 갖는다. DSP를 이용한 다중처리는 DMA를 통한 통신포트를 이용한 DSP들간의 고속 데이터 전송에 의해 이루어진다. 끝으로, 멀티 채널 오디오 코덱의 구현을 통하여 나타난 실시간 처리는 위해 고려해야할 기술적 사항을 제안한다.

  • PDF

리뷰 데이터와 제품 정보를 이용한 멀티모달 감성분석 (Multimodal Sentiment Analysis Using Review Data and Product Information)

  • 황호현;이경찬;유진이;이영훈
    • 한국전자거래학회지
    • /
    • 제27권1호
    • /
    • pp.15-28
    • /
    • 2022
  • 최근 의류 등의 특정 쇼핑몰의 온라인 시장이 크게 확대되면서, 사용자의 리뷰를 활용하는 것이 주요한 마케팅 방안이 되었다. 이를 이용한 감성분석에 대한 연구들도 많이 진행되고 있다. 감성분석은 사용자의 리뷰를 긍정과 부정 그리고 필요에 따라서 중립으로 분류하는 방법이다. 이 방법은 크게 머신러닝 기반의 감성분석과 사전기반의 감성분석으로 나눌 수 있다. 머신러닝 기반의 감성분석은 사용자의 리뷰 데이터와 그에 대응하는 감성 라벨을 이용해서 분류 모델을 학습하는 방법이다. 감성분석 분야의 연구가 발전하면서 리뷰와 함께 제공되는 이미지나 영상 데이터 등을 함께 고려하여 학습하는 멀티모달 방식의 모델들이 연구되고 있다. 리뷰 데이터에서 제품의 카테고리와 사용자별로 사용되는 단어 등의 특징이 다르다. 따라서 본 논문에서는 리뷰데이터와 제품 정보를 동시에 고려하여 감성분석을 진행한다. 리뷰를 분류하는 모델로는 기본 순환신경망 구조에서 Gate 방식을 도입한 Gated Recurrent Unit(GRU), Long Short-Term Memory(LSTM) 그리고 Self Attention 기반의 Multi-head Attention 모델, Bidirectional Encoder Representation from Transformer(BERT)를 사용해서 각각 성능을 비교하였다. 제품 정보는 모두 동일한 Multi-Layer Perceptron(MLP) 모델을 이용하였다. 본 논문에서는 사용자 리뷰를 활용한 Baseline Classifier의 정보와 제품 정보를 활용한 MLP모델의 결과를 결합하는 방법을 제안하며 실제 데이터를 통해 성능의 우수함을 보인다.

H.264 기반 선택적인 미세입자 스케일러블 코딩 방법 (A H.264 based Selective Fine Granular Scalable Coding Scheme)

  • 박광훈;유원혁;김규헌
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.309-318
    • /
    • 2004
  • 본 논문에서는 선택적으로 강화계층의 시간적 예측 정보를 사용하는 H.264 기반 선택적인 미 세입자 스케일러블 비디오 코딩 방법을 제안한다. 제안된 방법의 기본계층은 최근 표준화되었으며 고압축률이 특징인 H.264 (MPEG-4 Part 10 AVC) 알고리즘으로 코딩한다. 강화계층은 기본적으로 국제표준인 비트플레인 기반 MPEG-4 (Part 2) 미세입자스케일러블 코딩 방법으로 코딩한다. 본 논문에서는 엔코더측에서 강화계층간 시간적 예측 방법에 의해 발생된 효과적인 영상 정보를 드리프트 현상이 최소화하는 방향으로 선택적으로 적용하여 디코더측에 전송하는 방안을 제안하였다. 강화계층간 예측 방법만을 추가했을 때는 시간적 중복성을 줄여주는 효과를 볼 수 있지만 저비트율 대역에서 엔코더와 디코더간의 참조 저장 영상 불일치로 인한 드리프트 현상이 심하게 발생한다. 제안된 알고리즘은 시간적 예측 결과가 우수하여 코딩효율을 현저히 높혀줄 수 있는 경우에만 선택적으로 강화계층간의 시간적 예측 정보를 사용하였으며, 이로 인하여 저비트율 대역에서의 드리프트 현상을 현저하게 줄 일수 있었으며, 전반적으로 코딩 효율을 높여주는 효과를 가져왔다. 여러 영상 시퀀스를 대상으로 실험한 결과, 제안된 코딩 방법은 현존하는 국제표준인 MPEG-4 기반 미세입자 스케일러블 코딩 방법보다 같은 비트율 대역에서 영상화질이 약 3∼5 dB 높은 성능을 보여주고 있으며, H.264를 기반으로한 미세입자 스케일러블 코딩 방법보다도 약 1∼3 dB 높은 성능을 보여주고 있음을 발견할 수 있었다.

우선순위화 기반 적응형 전송 기능을 가진 MPEG-4 스트리밍 시스템의 설계 및 구현 (Design and Implementation of MPEG-4 Streaming System with Prioritized Adaptive Transport)

  • 박상훈;장혜영;권영우;김종원;유웅식;권오형
    • 한국통신학회논문지
    • /
    • 제29권8A호
    • /
    • pp.859-867
    • /
    • 2004
  • 최선형 서비스를 지향하는 인터넷에서 양질의 미디어 스트리밍을 서비스하기 위해서는 시간에 따라 변하는 네트워크 대역폭에 적응할 수 있는 스트리밍 기법이 필요하다. 본 논문에서는 미디어 패킷들의 중요도에 기반 한 적응형 전송 기능을 가진 MPEG-4 스트리밍 시스템을 설계하고 구현한다. 구현 시스템은 기초 스트림 제공자, 동기계층, DMIF 계층 등의 기본 MPEG-4 시스템 구성요소들과 데이터 우선순위화에 따른 FEC 제어 기반 적응형 전송 모듈로 구성된다. 구체적으로, 동기 계층 패킷들은 객체 단위에 기반하여 우선순위화되어 전송모듈로 전달되며 신뢰적 전송을 위해 FEC 부호화된다. FEC 조합은 수신측 피드백 정보에 따라 동적으로 조절되며 대역폭 제한에 맞추어 중요도가 떨어지는 패킷들을 폐기한다. 에뮬레이션기반 테스트베드에서의 실험 결과는 제안 시스템이 네트워크 대역폭 변동의 영향을 줄이고 스트리밍 서비스의 질을 향상시킬 수 있음을 보여준다.