통합 검색 | Korea Science

강화학습에 기초한 로봇 축구 에이전트의 동적 위치 결정 (Reinforcement Learning based Dynamic Positioning of Robot Soccer Agents)

권기덕;김인철
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
- /
- pp.55-57
- /
- 2001
강화학습은 한 에이전트가 자신이 놓여진 환경으로부터의 보상을 최대화할 수 있는 최적의 행동 전략을 학습하는 것이다. 따라서 강화학습은 입력(상태)과 출력(행동)의 쌍으로 명확한 훈련 예들이 제공되는 교사 학습과는 다르다. 특히 Q-학습과 같은 비 모델 기반(model-free)의 강화학습은 사전에 환경에 대한 별다른 모델을 설정하거나 학습할 필요가 없으며 다양한 상태와 행동들을 충분히 자주 경험할 수만 있으면 최적의 행동전략에 도달할 수 있어 다양한 응용분야에 적용되고 있다. 하지만 실제 응용분야에서 Q-학습과 같은 강화학습이 겪는 최대의 문제는 큰 상태 공간을 갖는 문제의 경우에는 적절한 시간 내에 각 상태와 행동들에 대한 최적의 Q값에 수렴할 수 없어 효과를 거두기 어렵다는 점이다. 이런 문제점을 고려하여 본 논문에서는 로봇 축구 시뮬레이션 환경에서 각 선수 에이전트의 동적 위치 결정을 위해 효과적인 새로운 Q-학습 방법을 제안한다. 이 방법은 원래 문제의 상태공간을 몇 개의 작은 모듈들로 나누고 이들의 개별적인 Q-학습 결과를 단순히 결합하는 종래의 모듈화 Q-학습(Modular Q-Learning)을 개선하여, 보상에 끼친 각 모듈의 기여도에 따라 모듈들의 학습결과를 적응적으로 결합하는 방법이다. 이와 같은 적응적 중재에 기초한 모듈화 Q-학습법(Adaptive Mediation based Modular Q-Learning, AMMQL)은 종래의 모듈화 Q-학습법의 장점과 마찬가지로 큰 상태공간의 문제를 해결할 수 있을 뿐 아니라 보다 동적인 환경변화에 유연하게 적응하여 새로운 행동 전략을 학습할 수 있다는 장점을 추가로 가질 수 있다. 이러한 특성을 지닌 AMMQL 학습법은 로봇축구와 같이 끊임없이 실시간적으로 변화가 일어나는 다중 에이전트 환경에서 특히 높은 효과를 볼 수 있다. 본 논문에서는 AMMQL 학습방법의 개념을 소개하고, 로봇축구 에이전트의 동적 위치 결정을 위한 학습에 어떻게 이 학습방법을 적용할 수 있는지 세부 설계를 제시한다.
PDF

다중 분포 학습 모델을 위한 Haar-like Feature와 Decision Tree를 이용한 학습 알고리즘 (Learning Algorithm for Multiple Distribution Data using Haar-like Feature and Decision Tree)

곽주현;원일용;이창훈
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제2권1호
- /
- pp.43-48
- /
- 2013
Adaboost 알고리즘은 얼굴인식을 위한 Haar-like feature들을 이용하기 위해 가장 널리 쓰이고 있는 알고리즘이다. 매우 빠르며 효율적인 성능을 보이고 있으며 하나의 모델이미지가 존재하는 단일분포 데이터에 대해 매우 효율적이다. 그러나 정면 얼굴과 측면 얼굴을 혼합한 인식 등 둘 이상의 모델이미지를 가진 다중 분포모델에 대해서는 그 성능이 저하된다. 이는 단일 학습 알고리즘의 선형결합에 의존하기 때문에 생기는 현상이며 그 응용범위의 한계를 지니게 된다. 본 연구에서는 이를 해결하기 위한 제안으로서 Decision Tree를 Harr-like Feature와 결합하는 기법을 제안한다. Decision Tree를 사용 함으로서 보다 넓은 분야의 문제를 해결하기 위해 기존의 Decision Tree를 Harr-like Feature에 적합하도록 개선한 HDCT라고 하는 Harr-like Feature를 활용한 Decision Tree를 제안하였으며 이것의 성능을 Adaboost와 비교 평가하였다.
https://doi.org/10.3745/KTSDE.2013.2.1.043 인용 PDF KSCI

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

김병재;박찬민;최윤영;권명준;서정연
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
- /
- pp.333-337
- /
- 2017
본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.
PDF

근골격 모델과 참조 모션을 이용한 이족보행 강화학습 (Reinforcement Learning of Bipedal Walking with Musculoskeletal Models and Reference Motions)

전지웅;권태수
- 한국컴퓨터그래픽스학회논문지
- /
- 제29권1호
- /
- pp.23-29
- /
- 2023
본 논문은 강화학습을 통해 이족보행에 대한 모션 캡처를 통해 참조 모션의 데이터들을 기반으로 근골격 캐릭터의 시뮬레이션을 적은 비용으로 높은 품질의 결과를 얻을 방법을 소개한다. 우리는 참조 모션 데이터를 캐릭터 모델이 수행할 수 있게끔 재설정을 한 후, 강화학습을 통해 해당 모션을 학습하도록 훈련시킨다. 참조 모션 모방과 근육에 대한 최소한의 메타볼릭 에너지를 결합하여 원하는 방향으로 근골격 모델이 이족보행을 수행하게끔 학습한다. 이러한 방법으로 근골격 모델은 기존의 수동으로 설계된 컨트롤러보다 적은 비용으로 학습할 수 있으며 높은 품질의 이족보행을 수행할 수 있게 된다.
https://doi.org/10.15701/kcgs.2022.29.1.23 인용 PDF

시-공간 특징을 이용한 효율적인 3차원 인체 자세 재구성 (Efficient Reconstruction of 3D Human Body Pose Using Spatio-Temporal Features)

양희덕;아마드;이성환
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
- /
- pp.892-894
- /
- 2005
본 논문에서는 스테레오 영상에서 깊이 정보를 추출하여 사람의 자세를 학습된 2차원 깊이 영상들의 선형 결함으로 표현하여 3차원 인체 모델을 재구성하는 방법을 제안한다. 한 장의 2차원 깊이 영상으로 최소 제곱법을 이용하여 프로토타입 깊이 영상의 선형 결합으로 표현되는 최적의 계수를 찾을 수 있다. 입력된 깊이 영상의 3차원 인체 모델은 프로토타입 깊이 영상에서 예측된 계수를 적용하여 생성한다. 학습 단계에서는 데이터를 계층적으로 나누어 모델을 생성한다. 또한, 재구성 단계에서는 실루엣 영상과 깊이 영상으로부터 계층적으로 나누어진 학습 데이터를 이용하여 3차원 인체 자세를 재구성한다. 학습 및 재구성의 마지막 단계에서는 실루엣 영상 대신 깊이 영상을 이용하여 3차원 인체 모델을 재구성한다. 한 장의 실루엣 영상을 이용하면 영상의 노이즈에 민감하기 때문에 재구성 단계의 상위 레벨에서는 실루엣 영상의 누적 영상을 이용한다. 실험 결과는 제안된 방법이 효율적으로 3차원 인체 자세를 재구성함을 보여준다.
PDF

ARIMA 모델을 이용한 데이터 흐름 예측 기법 (Data Flow Prediction Scheme using ARIMA Model)

김동현;김민우;이병준;김경태;윤희용
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
- /
- pp.141-142
- /
- 2018
기존 데이터의 패턴 예측에는 통계를 기반으로 한 수학적 모델이 주로 사용되었으나 새로운 데이터에 대한 피드백이 부족하기 때문에 장기간의 데이터 예측에 한계가 있다. 또한 데이터의 특성이 다양하고 복잡한 경우에는 수학적 모델의 결합 및 계산과정이 어려워진다. 따라서 본 논문에서는 데이터의 학습 및 예측에 기존 정적 모델이 아닌 기계학습 중 시계열 데이터 분석 (Time Series Analysis) 을 기반으로 연구를 진행하였다. 기계학습은 복잡한 특성을 가진 데이터를 학습하여 미래의 데이터 값을 예측하거나 분류하는데 있어서 정확도 및 처리시간 측면에서의 성능을 향상시킬 수 있다.
PDF

CTC Ratio Scheduling을 이용한 Joint CTC/Attention 한국어 음성인식 (Joint CTC/Attention Korean ASR with CTC Ratio Scheduling)

문영기;조용래;조원익;조근식
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
- /
- pp.37-41
- /
- 2020
본 논문에서는 Joint CTC/Attention 모델에 CTC ratio scheduling을 이용한 end-to-end 한국어 음성인식을 연구하였다. Joint CTC/Attention은 CTC와 attention의 장점을 결합한 모델로서 attention, CTC 단일 모델보다 좋은 성능을 보여주지만, 학습이 진행될수록 CTC가 attention의 학습을 저해하는 요인이 된다. 본 논문에서는 이러한 문제를 해결하기 위해, 학습 진행에 따라 CTC의 비율(ratio)를 줄여나가는 CTC ratio scheduling 방법을 제안한다. CTC ratio scheduling를 이용하여 학습한 결과물은 기존 Joint CTC/Attention, 단일 attention 모델 대비 좋은 성능을 보여주는 것을 확인하였다.
PDF

재난관련 트윗 분류를 위한 딥 러닝 결합 모델 (Combining Deep Learning Models for Crisis-Related Tweet Classification)

최원규;이경순
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
- /
- pp.649-651
- /
- 2018
본 논문에서는 CNN에서 클래스 활성화 맵과 원샷 러닝을 결합하여 트위터 분류를 위한 딥 러닝 모델을 제안한다. 클래스 활성화 맵은 트윗 분류에 대한 분류 주제와 연관된 핵심 어휘를 추출하고 강조 표시하도록 사용되었다. 특히 작은 학습 데이터 셋을 사용하여 다중 클래스 분류의 성능을 향상시키기 위해 원샷 러닝 방법을 적용한다. 제안하는 방법을 검증하기위해 TREC 2018 태스크의 사건 스트림(TREC-IS) 학습데이터를 사용하여 비교실험을 했다. 실험 결과에서 CNN 기본 모델의 정확도는 58.1%이고 제안 방법의 정확도는 69.6%로 성능이 향상됨을 보였다.
PDF

비교사 학습과 교사 학습 알고리즘을 결합한 구조 적응형 자기구성 지도 (A Structure-Adaptive Self-Organizing Map with Combination of Supervised and Unsupervised Learning Algorithms)

김현돈;조성배
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
- /
- pp.333-335
- /
- 1999
일반적으로 자기구성 지도에서는 구조가 초기에 결정되어 학습이 끝날때까지 변하기 않기 때문에 각 문제에 대한 구조를 반복된 실험을 통해서 최적화시켜야 한다. 그러나, 지도의 구조가 학습중에 적절하게 변경된다면, 해당 문제에 가장 알맞은 구조의 지도를 생성할 수 있을 것이다. 이 논문에서는 기존의 적응형 자기 구성 지도의 비교사 학습방법에 LVQ 알고리즘을 이용한 교사 학습방법을 결합한 구조 적응형 자기 구성 지도 모델을 제안한다. 이 방법은 일반적인 자기구성 지도 알고리즘보다 작은 수의 노드를 가지고 높은 성능을 보일 뿐만 아니라, 자기 구성 지도의 특성인 위상 보존도 잘 이루어진다. 오프라인 필기 숫자 데이터로 실험한 결과, 제안한 방법이 유용함을 알 수 있었다.
PDF

도메인 특정 지식을 결합한 End-to-End Learning 방식의 한국어 식당 예약 대화 시스템 모델 개발 (Development of a Dialogue System Model for Korean Restaurant Reservation with End-to-End Learning Method Combining Domain Specific Knowledge)

이동엽;김경민;임희석
- 한국어정보학회:학술대회논문집
- /
- 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
- /
- pp.111-115
- /
- 2017
목적 지향적 대화 시스템(Goal-oriented dialogue system)은 텍스트나 음성을 통해 특정한 목적을 수행할 수 있는 시스템이다. 최근 RNN(recurrent neural networks)을 기반으로 대화 데이터를 end-to-end learning 방식으로 학습하여 대화 시스템을 구축하는데에 활용한 연구가 있다. End-to-end 방식의 학습은 도메인에 대한 지식 없이 학습 데이터 자체만으로 대화 시스템 구축을 위한 학습이 가능하다는 장점이 있지만 도메인 지식을 학습하기 위해서는 많은 양의 데이터가 필요하다는 단점이 존재한다. 이에 본 논문에서는 도메인 특정 지식을 결합하여 end-to-end learning 방식의 학습이 가능한 Hybrid Code Network 구조를 기반으로 한국어로 구성된 식당 예약에 관련한 대화 데이터셋을 이용하여 식당 예약을 목적으로하는 대화 시스템을 구축하는 방법을 제안한다. 실험 결과 본 시스템은 응답 별 정확도 95%와 대화 별 정확도 63%의 성능을 나타냈다.
PDF

검색결과 410건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)