• Title/Summary/Keyword: Encoder Model

Search Result 354, Processing Time 0.023 seconds

저속 영상부호화를 위한 최적 프레임 율과 공간 양자화 결정 (An Optimal Selection of Frame Skip and Spatial Quantization for Low Bit Rate Video Coding)

  • Bu, So-Young;Lee, Byung-Uk
    • 한국통신학회논문지
    • /
    • 제29권6C호
    • /
    • pp.842-847
    • /
    • 2004
  • 본 논문에서는 낮은 전송률에서 공간적 시간적 해상도를 tradeoff하는 새로운 비디오 코딩 알고리듬을 제안한다. 먼저 영상의 움직임을 측정하여 최적의 frame rate를 선택한다. DCT quantization parameter (QP)는 앞에서 결정된 frame rate와 주어진 bit rate에 따라 결정한다. 마지막으로, 본 논문은 skip된 비디오 영상에 대해 단순하고 효과적인 distortion 측정방법을 제안한다. 실험결과, 제안한 알고리듬이 H.263 TMN5 보다 영상 품질이 2 ㏈ 정도 개선되었다.

한국어 text-to-speech(TTS) 시스템을 위한 엔드투엔드 합성 방식 연구 (An end-to-end synthesis method for Korean text-to-speech systems)

  • 최연주;정영문;김영관;서영주;김회린
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.39-48
    • /
    • 2018
  • A typical statistical parametric speech synthesis (text-to-speech, TTS) system consists of separate modules, such as a text analysis module, an acoustic modeling module, and a speech synthesis module. This causes two problems: 1) expert knowledge of each module is required, and 2) errors generated in each module accumulate passing through each module. An end-to-end TTS system could avoid such problems by synthesizing voice signals directly from an input string. In this study, we implemented an end-to-end Korean TTS system using Google's Tacotron, which is an end-to-end TTS system based on a sequence-to-sequence model with attention mechanism. We used 4392 utterances spoken by a Korean female speaker, an amount that corresponds to 37% of the dataset Google used for training Tacotron. Our system obtained mean opinion score (MOS) 2.98 and degradation mean opinion score (DMOS) 3.25. We will discuss the factors which affected training of the system. Experiments demonstrate that the post-processing network needs to be designed considering output language and input characters and that according to the amount of training data, the maximum value of n for n-grams modeled by the encoder should be small enough.

광 마우스 센서를 이용한 이동로봇 좌표추정 (Coordinate Estimation of Mobile Robot Using Optical Mouse Sensors)

  • 박상형;이수영
    • 제어로봇시스템학회논문지
    • /
    • 제22권9호
    • /
    • pp.716-722
    • /
    • 2016
  • Coordinate estimation is an essential function for autonomous navigation of a mobile robot. The optical mouse sensor is convenient and cost-effective for the coordinate estimation problem. It is possible to overcome the position estimation error caused by the slip and the model mismatch of robot's motion equation using the optical mouse sensor. One of the simple methods for the position estimation using the optical mouse sensor is integration of the velocity data from the sensor with time. However, the unavoidable noise in the sensor data may deteriorate the position estimation in case of the simple integration method. In general, a mobile robot has ready-to-use motion information from the encoder sensors of driving motors. By combining the velocity data from the optical mouse sensor and the motion information of a mobile robot, it is possible to improve the coordinate estimation performance. In this paper, a coordinate estimation algorithm for an autonomous mobile robot is presented based on the well-known Kalman filter that is useful to combine the different types of sensors. Computer simulation results show the performance of the proposed localization algorithm for several types of trajectories in comparison with the simple integration method.

메카넘 바퀴 볼 로봇의 자세제어 및 주행 (Balancing and Driving Control of a Mecanum Wheel Ball Robot)

  • 황승익;하휘명;이장명
    • 제어로봇시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.336-341
    • /
    • 2015
  • This paper proposes a balancing and driving control system for a Mecanum wheel ball robot which has a two axis structure and four motors. The inverted pendulum control method is adopted to maintain the balance of the ball robot while it is driving. For the balancing control, an anon-model-based controller has been designed to control the device simply without the need of a complex formula. All the gains of the controller are heuristically adjusted during the experiments. The tilt angle is measured by IMU sensors, which is used to generate the control input of the roll and pitch controller to make the tilt angle zero. For the driving control, the PID control algorithm has been adopted with angles of the wheels and the encoder data. The performance of the designed control system has been verified through the real experiments with the suggested ball robot.

Visual Basic 학습을 위한 웹기반 멀티미디어 코스웨어의 설계 및 구현 (Design and Implementation of Web Based Multimedia Courseware for Visual Basie Learning)

  • 박선영;방기천;차재혁
    • 디지털콘텐츠학회 논문지
    • /
    • 제1권1호
    • /
    • pp.111-124
    • /
    • 2000
  • 웹의 발달로 세계 각국에서는 웹상에서 교육할 수 있는 코스웨어 개발이 활발히 진행되고 있다. 비주얼 베이직 언어도 웹기반 교육으로 많이 개발되고 있으나 실용적인 내용과 실습을 필요로 하는 주제임에도 불구하고 실습 환경이나 다양한 상호작용을 제공하지 않아 학습 효과를 높이지 못하고 있다. 이에 본 연구에서는 웹기반 교수-학습 체제 설계모형을 기반으로 하여 1) 멀티미디어 요소를 가미하고 2) 실습환경으로 학습자의 학습효과를 높이고 3) 학습자의 반응을 분석, 평가하여 적절한 피드백을 제공하고 4) 학습자들간의 상호작용이 활발히 이루어질 수 있도록 하기 위해 5) Real Active X등의 기술을 이용해 멀티미디어 코스웨어를 개발하고 이를 학교 현장에 적용시켜 보았다.

  • PDF

질의응답 시스템에서 형태소임베딩 모델과 GRU 인코더를 이용한 문장유사도 측정 (Measuring Sentence Similarity using Morpheme Embedding Model and GRU Encoder for Question and Answering System)

  • 이동건;오교중;최호진;허정
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.128-133
    • /
    • 2016
  • 문장유사도 분석은 문서 평가 자동화에 활용될 수 있는 중요한 기술이다. 최근 순환신경망을 이용한 인코더-디코더 언어 모델이 기계학습 분야에서 괄목할만한 성과를 거두고 있다. 본 논문에서는 한국어 형태소임베딩 모델과 GRU(Gated Recurrent Unit)기반의 인코더를 제시하고, 이를 이용하여 언어모델을 한국어 위키피디아 말뭉치로부터 학습하고, 한국어 질의응답 시스템에서 질문에 대한 정답을 유추 할 수 있는 증거문장을 찾을 수 있도록 문장유사도를 측정하는 방법을 제시한다. 본 논문에 제시된 형태소임베딩 모델과 GRU 기반의 인코딩 모델을 이용하여 문장유사도 측정에 있어서, 기존 글자임베딩 방법에 비해 개선된 결과를 얻을 수 있었으며, 질의응답 시스템에서도 유용하게 활용될 수 있음을 알 수 있었다.

  • PDF

Steady State and Transient Analysis of Switched Reluctance Motor Drive Fed from a Controlled AC-DC Rectifier

  • Moussa, Mona Fouad
    • Journal of Electrical Engineering and Technology
    • /
    • 제12권4호
    • /
    • pp.1495-1502
    • /
    • 2017
  • The Theory of operation of switched reluctance motors (SRM) depends on the reluctance torque, where energy is transferred to stator winding only. Although its construction is simple, the electrical design is complex, due to the switching configuration needed to deliver power to stator coils. However, because of the nonlinearly of magnetic circuit, SRM has torque ripple. This paper proposes a new strategy to drive SRM from a single-phase AC supply. Each stator winding is connected to AC-DC or AC-AC converters, which is called branch. All branches are connected in parallel to a single-phase AC supply. A shaft encoder allows current production in stator winding during the positive torque production region and terminates it during the negative torque production region. A magnetic flux is produced between stator poles when current is supplied from AC supply to stator coil and repeats many cycles as long as the rate of change of stator inductance is positive. Different possibilities for the configurations of AC-AC or AC-DC converters are introduced to drive SRM from the single-phase AC supply. A case study is presented for a SRM fed from AC supply through semi-controlled AC-DC converter is presented. A simulation model is introduced and verified by experimental rig for two-phase SRM.

실시간 HEVC 인코더 구현을 위한 병렬화 기법에 관한 연구 (Study of parallelization methods for real-time HEVC encoder implementation)

  • 안용조;황태진;이동규;김상민;오승준;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.119-122
    • /
    • 2013
  • ITU-T VCEG 과 ISO/IEC MPEG 이 공동으로 구성한 JCT-VC (Joint Collaborative Team on Video Coding)이 표준화를 진행 중인 HEVC (High Efficiency Video Coding)은 H.264/AVC 대비 약 2 배의 압축효율을 갖는다. 하지만, 계층적 구조를 갖는 가변크기 블록의 사용과 재귀적 부호화 구조에 따른 인코더의 복잡도 증가는 개선해야 할 문제점으로 지적되고 있다. 본 논문에서는 현재 표준화가 진행 중인 HEVC 인코더의 실시간 구현을 위한 SIMD 명령어를 이용한 data-level 병렬화 기법, CPU 및 GPU 를 이용한 multi-threading 기법과 같은 다양한 병렬화 기법을 소개한다. 또한, 이러한 병렬화 기법들을 HEVC 인코더에 적용하기 위해 적합한 연산 및 기능 모듈에 대하여 소개한다. 본 연구를 통하여 HM (HEVC reference model)에 적용한 결과 $832{\times}480$ 영상의 경우 20-30fps 의 부호화 속도를 나타냈으며, $1920{\times}1080$ 영상의 경우 5-10fps 의 부호화 속도를 나타내었다.

  • PDF

패리티 비트 요구량 모델링에 의한 분산 비디오의 고속 복호화 기법 (Fast Decoding Method of Distributed Video Based on Modeling of Parity Bit Requests)

  • 김만재;김진수
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2465-2473
    • /
    • 2012
  • 최근에 연구되어 온 초경량 비디오 부호화 기법으로 분산 비디오 부호화 기법에 대한 연구가 활발히 진행되고 있다. 우수한 부호화 효율을 얻기 위해 분산 비디오 부호화 기법은 패리티 비트 제어용으로 피드백 채널을 필요로 하고 있다. 그러나 이 방법은 매우 높은 복호화 지연을 야기하여 실시간 구현과 상용화에 극복해야 할 문제가 되고 있다. 이를 위해, 본 논문에서는 복호화기에서 보조정보를 생성할 때 생성되는 움직임 벡터를 부호화기측으로 전송하는 환경을 위한 고속 분산 비디오 복호화기법을 제안한다. 제안한 방법은 수신된 움직임벡터를 이용하여 비트-에러율을 계산하고, 이를 이용하여 복호화기측에서 전송함으로써 복호화 속도를 개선하는 방법을 사용한다. 모의실험을 통하여, 제안 방식은 기존에 제안된 기법에 비해 성능을 크게 개선시킬 수 있음을 보인다.

H.264 동영상 압축을 위한 고속 부호화 모드 결정 방법 (Fast Coding Mode Decision for H.264 Video Coding)

  • 이제윤;전병우
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.165-173
    • /
    • 2004
  • 최근에 표준화가 완료된 H.264 비디오 부호화 표준은 기존 표준에 비해 높은 부호화 효율을 제공한다. H.264에는 움직임 보상 부호화를 위해 블록 크기에 따른 7가지 모드가 있으며, 인트라 부호화를 위해서는 인트라 예측 방향에 따라 다양한 모드를 지원한다. 이렇게 다양한 모드 중에서 가장 부호화 효율이 높은 모드를 결정하기 위하여, H.264 참조 모델은 복잡도가 높은 비트율-왜곡(Rate distortion) 최적화 기법을 채택하고 있다. 본 논문에서 제안한 '조기 SKIP 모드 결정법'과 '선택적 인트라 모드 생략법'은, 부호화 효율의 큰 감소 없이 H.264의 모드 결정에 소요되는 비트율-왜곡치(Rate distortion cost) 계산수를 평균 72% 감소 시켰으며, 전체 부호화 시간도 평균 30% 감소시켰다.