통합 검색 | Korea Science

심층적 강화학습 기반 적응적 GOP 선택을 통한 HEVC/H.265 인코더 제어 (Deep Reinforcement Learning based Adaptive GOP Selection for HEVC/H.265 Encoder)

이정경;김나영;강제원
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.140-142
- /
- 2020
본 논문에서는 심층적 강화학습 기반 GOP (Group of Picture) 크기를 선택하여 HEVC/H.265의 인코더를 제어하는 방법을 제안한다. 기존 방법에서는 현재 비디오 신호를 부호화 하는 과정에서 이미 부호화한 정보를 사용해야하는 부호화 의존성에 관한 문제가 있었다. 제안 방법은 강화학습 방식을 도입하여 이러한 문제를 극복하고 입력 비디오의 시간적 상관도에 따라 GOP의 크기를 적응적으로 선택하여 부호화 한다. 본 논문에서는 GOP 선택을 위한 강화학습 환경을 새롭게 정의하고 부호화 성능에 따른 보상을 부여하는 방식으로 학습을 수행한다. 제안된 적응적 GOP 선택에 따라 인코더 제어 시, 부호화 방법의 부호화 효율이 -6.07% BD-rate 향상된 실험 결과를 보이며 본 방법의 우수성을 입증한다.
PDF

多入力 시스템의 자율학습제어를 위한 차등책임 적응비평학습 (Differentially Responsible Adaptive Critic Learning ( DRACL ) for the Self-Learning Control of Multiple-Input System)

김형석
- 전자공학회논문지S
- /
- 제36S권2호
- /
- pp.28-37
- /
- 1999
재 강화 학습 방법을 다수의 제어입력을 가진 시스템에 대한 자율적 제어 기법 습득에 활용하기 위해서 차등책임 적응비평 학습구조를 제안하였다. 재 강화 학습은 여러 단계의 제어동작 끝에 얻어지는 최종 비평값을 활용하여 그 전에 행해졌던 제어 동작을 강화 혹은 약화 학습하는 자율적 학습방법이다. 대표적인 재강화학습 방법은 적응비평학습 구조를 이용하는 방법인데 비평모듈과 동작모듈을 이용하여 외부 비평 값을 최대로 활용함으로써 학습효과를 극대화시키는 방법이다. 이 학습방법에서는 단일한 제어입력을 갖는 시스템으로만 적용이 제한된다는 단점이 있다. 제안한 차등책임 적응비평 학습 구조에서는 비평함수를 제어 입력 인자의 함수로 구축한 다음 제어인자에 대한 차별 화된 비평 값을 부분미분을 통하여 산출함으로써 다수의 제어입력을 가진 시스템의 제어기술 학습이 가능하게 하였다. 제안한 학습제어 구조는 학습속도가 빠른 CMAC 신경회로망을 이용하여 구축하였으며 2개의 제어입력을 갖는 2-D Cart-Pole 시스템과 3 개의 제어입력을 갖는 인간구조 로봇시스템의 앉는 동작의 학습제어 시뮬레이션을 통하여 효용성을 확인하였다.
PDF

AC MOTOR의 속도제어 개선을 위한 신경망제어기의 설계 (Design of Neuro Controller for Improving Velocity Control of AC Motor)

설재훈;임영도
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 1995년도 추계학술대회 학술발표 논문집
- /
- pp.243-248
- /
- 1995
본 논문에서는 신경회로망의 학습능력을 이용하여 AC 모터의 속도제어에 이용된 기 존의 PI제어기의 문제점을 보완하고자 한다. 기존의 아날로그 PI제어기에서는 각 비례, 적분 파라메타를 개발자가 조정하여 고정하면 부하가 변동될 경우 적응성이 떨어지는 문제점을 안고 있었다. 본 논문에서 제시된 디지털 신경망제어기는 학습을 통해 새로운 환경에 적응 가능하다는 점에 가정하여 설계하고 성능을 비교 평가하였다. 본 논문에서 사용된 신경회로 망의 구조는 신경망중에서 가장 범용적으로 사용되는 다층 퍼셉트론 모델구조를 선택하였 다. 신경망 제어기장치로는 인텔 8097 마이크로 콘트롤러를 이용하였다.
PDF

기업의 동태적 진화 및 적응 이론에 대한 비판적 고찰 : 적응에 있어 조직학습과 재구조화 관점을 중심으로 (Reconceptualizing the Dynamic Evolution of the Firm : On Learning and Restructuring in Adaptation)

이종호
- 한국지역지리학회지
- /
- 제13권6호
- /
- pp.623-638
- /
- 2007
본 논문은 환경 변화에 대한 기업의 동태적 적응 메카니즘을 설명하는 대조적인 두 이론을 고찰하고, 두 이론 간에 보완적 연계의 필요성을 밝히는 것이 그 목적이다. 1980년대 까지 재구조화론은 기업의 성공과 적응을 설명하는 지배적인 접근이었다. 그러나 이 접근은 환경 변화에 대해 어떻게 기업이 적응하는지, 기업들 간의 적응의 성패가 왜 상이하게 나타나는지에 대해 설명하지 않는다. 즉 재구조화론은 기업의 학습과 적응에 대한 맥락 특수적인 해석 시각을 제공하지 못한다. 한편 1990년대 이후에 기업의 학습과 진화에 대한 학문적 관심은 기업의 동태적 경쟁력을 이끄는 기업 학습의 본질을 고찰하는 것에 초점이 두어져 왔다. 조직학습론은 조직 진화에 있어 지식, 학습 그리고 역량의 중요성을 강조한다. 하지만 이 접근 또한 급진적인 환경 변화에 대한 기업의 적응 메커니즘에 대해서는 효과적으로 설명하지 못하고 있다. 본 연구는 이러한 맥락에서 기업의 동태적 적응과 진화는 재구조화 과정과 점진적 및 급진적 학습 과정의 길함을 통해 나타나는 사실을 설명하고, 이를 토대로 기업의 진화와 적응을 효과적으로 설명하기 위해서는 두 이론을 보완적으로 연계한 통합적 이론 체계가 구축될 필요가 있음을 제안한다.
PDF

이산 시간 스위칭 선형 시스템의 적응 LQ 준최적 제어를 위한 Q-학습법 (Q-learning for Adaptive LQ Suboptimal Control of Discrete-time Switched Linear System)

전태윤;최윤호;박진배
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2011년도 제42회 하계학술대회
- /
- pp.1874-1875
- /
- 2011
본 논문에서는 스위칭 선형 시스템의 적응 LQ 준최적 제어를 위한 Q-학습법 알고리즘을 제안한다. 제안된 제어 알고리즘은 안정성이 증명된 기존 Q-학습법에 기반하며 스위칭 시스템 모델의 변수를 모르는 상황에서도 준최적 제어가 가능하다. 이 알고리즘을 기반으로 기존에 스위칭 시스템에서 고려하지 않았던 각 시스템의 불확실성 및 최적 적응 제어 문제를 해결하고 컴퓨터 모의실험을 통해 제안한 알고리즘의 성능과 결과를 검증한다.
PDF

비선형 시스템에 대한 강인성 적응 학습 제어기의 개발 (Development of Robust Adaptive Learning Control for Nonlinear System)

유영순;하환수
- 대한기계학회논문집A
- /
- 제25권12호
- /
- pp.1895-1902
- /
- 2001
This paper gives an overview of the relationships between methods of loaming and adaptive control. It is the objective of this paper to develop adaptive learning control algorithms that combine the advantages of adaptive control with those of leaning control to the extent possible for the type of system model used. The robustness of this adaptive loaming control with respect to reinitialization errors and fluctuation of dynamics from disturbance is analyzed extensively. Simulation results have shown to verify the effectiveness of the proposed control algorithm.
https://doi.org/10.22634/KSME-A.2001.25.12.1895 인용 PDF

접촉 작업을 위한 로봇의 스킬 학습 전략 (Robot Skill Learning Strategy for Contact Task)

김병찬;강병덕;박신석;강성철
- 로봇학회논문지
- /
- 제3권2호
- /
- pp.146-153
- /
- 2008
본 논문에서는 인간 운동 제어 이론과 기계학습을 기반으로 하여 로봇의 접촉 작업 수행을 위한 새로운 운동 학습 전략을 제시하였다. 성공적인 접촉 작업 수행을 위한 본 연구의 전략은 강화학습 기법을 통하여 최적의 작업 수행을 위한 임피던스 매개 변수를 찾는 것이다. 본 연구에서는 최적의 임피던스 매개 변수를 결정하기 위하여 Recursive Least-Square (RLS) 필터 기반 episodic Natural Actor-Critic 알고리즘이 적용되었다. 본 논문에서는 제안한 전략의 효용성을 증명하기 위해 동역학 시뮬레이션을 수행하였고, 그 결과를 통하여 접촉작업에서의 작업 최적화 및 환경이 가지는 불확실성에 대한 적응성을 보여 주었다.
PDF

동적 링크를 지원하는 적응형 학습시스템의 구현 (Implementation of a Adaptive Learning System Supporting Dynamic Link)

이재무;김두규
- 정보교육학회논문지
- /
- 제16권3호
- /
- pp.275-282
- /
- 2012
웹의 기술적 수준의 향상과 이를 이용하는 하드웨어의 급속한 발달은 문자 중심의 일방적 자료 탐색 기능만을 제공하던 웹을 쌍방향적이고 멀티미디어적인 환경으로 변화 시켰다. 그리고 이러한 변화는 웹의 교육적 활용성을 높이고 있다. 현존의 웹 기반 코스웨어는 개개인의 학습 능력에 따라 학습 내용과 학습 방법을 다르게 제시하는 개별화 학습이 부족하다. 따라서 학습자들은 개개의 학습능력에 상관없이 누구나 일률적으로 동일한 학습내용을 제공받고 있다. 본 연구는 학습자의 학습 성취정도와 학습과정에 따라 학습내용과 학습 방법을 다르게 제공하고자 한다. 즉, 학습자의 학습 성취정도와 학습과정을 분석하여 학습자에게 같은 학습내용이라 할지라도 각각의 습자에게 학습의 효율을 높일 수 있는 학습방법이 무엇인지를 찾아내어 학습자에게 가장 적합한 학습방법을 제공해 줄 수 있는 시스템을 설계 및 개발하였다. 특히 본 적응형 학습 시스템은 학습 과정마다 적절한 학습 스타일을 체크하여 동적 링크를 제공한다.
PDF

퍼지신경회로망을 이용한 동적 학습내용 기반 적응형 학습시스템의 설계 및 구현 (Design and Implementation for Adaptive Learning System based Dynamic Contents Using Fuzzy Neural Network)

박태오;황진;이배호
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2008년도 춘계학술발표대회
- /
- pp.761-763
- /
- 2008
최근 온라인교육의 필요성이 높아지고 요구 수준이 커짐에 따라 교육 서비스를 제공하는 시스템의 지능화된 처리능력이 필요하다. 퍼지신경회로망은 각각의 가중치(weight)를 갖는 채널로 연결한 망형태의 계산모델이다. 퍼지신경회로망을 학습시스템에 적용하여 학습자의 문항테스트 결과에서 학습과정을 재설정 할 수 있는 출력 값을 생성한다. 적응형 학습시스템은 퍼지신경회로망을 적용하여 개별화된 강의 코스로 학습을 진행하고 결과의 feedback을 통해 학습자의 최적 커리큘럼을 찾아내는 방법을 구현하였다.
https://doi.org/10.3745/PKIPS.y2008m05a.761 인용 PDF

신경회로망을 이용한 물체 추적에 관한 연구 (A Study on Target Tracking using Neural Networks)

육창근;문옥경;차의영
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
- /
- pp.426-428
- /
- 1998
본 논문은 움직임 추정기법 중의 하나인 차영상 분석 기법을 기반으로한 이동 물체 추적 시스템을 제안한다. 실세계와 같은 복잡한 환경에서의 적응성을 높이기 위해 동적인 배경 추출 방법을 제안하고, 이를 바탕으로한 차영상 분석 기법을 이용하여 이동 물체를 탐지한 후 개선된 인공신경망의 경쟁학습 모델인 ART2 학습알고리즘을 이용하여 추적한다. 또한 이동 물체의 평가도 값이 아닌 RGB 컬러정보를 이용한 물체의 특징 벡터를 구한다. 이러한 특징 벡터들은 이동 물체의 모양이나 명암의 변화를 반영한다. 이러한 정보의 변화에 적응성을 갖게 하기위해 개선된 ART2를 사용한다. 그리고 실제 환경에서 보행자를 탐지, 추적하는 실험 결과 Gray 영상보다 정확한 추적이 가능하였다.
PDF

검색결과 429건 처리시간 0.029초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)