통합 검색 | Korea Science

탐색 강화 계층적 강화 학습 (Hierachical Reinforcement Learning with Exploration Bonus)

이승준;장병탁
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
- /
- pp.151-153
- /
- 2001
Q-Learning과 같은 기본적인 강화 학습 알고리즘은 문제의 사이즈가 커짐에 따라 성능이 크게 떨어지게 된다. 그 이유들로는 목표와의 거리가 멀어지게 되어 학습이 어려워지는 문제와 비 지향적 탐색을 사용함으로써 효율적인 탐색이 어려운 문제를 들 수 있다. 이들을 해결하기 위해 목표와의 거리를 줄일 수 있는 계층적 강화 학습 모델과 여러 가지 지향적 탐색 모델이 있어 왔다. 본 논문에서는 이들을 결합하여 계층적 강화 학습 모델에 지향적 탐색을 가능하게 하는 탐색 보너스를 도입한 강화 학습 모델을 제시한다.
PDF

블록체인 기반 연합학습을 위한 레퍼런스 아키텍처 (A Reference Architecture for Blockchain-based Federated Learning)

고은수;문종현;이광기;손채봉
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 추계학술대회
- /
- pp.119-122
- /
- 2022
연합학습은, 데이터 샘플을 보유하는 다수의 분산 에지 디바이스 또는 서버들이 원본 데이터를 공유하지 않고 기계학습 문제를 해결하기 위해 협력하는 기술로서, 각 클라이언트는 소유한 원본 데이터를 로컬모델 학습에만 사용함으로써, 데이터 소유자의 프라이버시를 보호하고, 데이터 소유 및 활용의 파편화 문제를 해결할 수 있다. 연합학습을 위해서는 통계적 이질성 및 시스템적 이질성 문제 해결이 필수적이며, 인공지능 모델 정확도와 시스템 성능을 향상하기 위한 다양한 연구가 진행되고 있다. 최근, 중앙서버 의존형 연합학습의 문제점을 극복하고, 데이터 무결성 및 추적성과 데이터 소유자 및 연합학습 참여자에게 보상을 효과적으로 제공하기 위한, 블록체인 융합 연합학습기술이 주목받고 있다. 본 연구에서는 이더리움 기반 블록체인 인프라와 호환되는 연합학습 레퍼런스 아키텍처를 정의 및 구현하고, 해당 아키텍처의 실용성과 확장성을 검증하기 위하여 대표적인 연합학습 알고리즘과 데이터셋에 대한 실험을 수행하였다.
PDF

대학수학에서 문제해결지도

정치봉
- 한국수학교육학회지시리즈E:수학교육논문집
- /
- 제15권
- /
- pp.207-214
- /
- 2003
수학교육에서 학생들이 학습을 통하여 습득하여할 중요한 주제는 수학 지식과 수학을 다루는 인지적 조작 기술일 것이다. 특히 수학지식과 지식의 활용은 문제해결을 통한 학습에서 의미 있게 학생에게 나타나며 이를 통하여 수학 학습 동기를 강화하고 수학의 가치를 느끼게 한다는 점에서 중요한 의의를 갖는다. 대학수준의 수학교육과정에서도 문제해결은 중요한 수학교육의 중심 수단으로서 목적으로서 선언되어 있지만 실제 수업에서 잘 다루고 있지 못하다. 문제해결 지도에 대한 접근 방식으로 1950년대의 문제해결전략을 다룬 Polya, 1990년대의 메타인지적 접근을 강조한 Schoenfeld 및 최근의 여러 연구자들의 활발한 연구가 이어지고 있다. 본 논문에서 대학 수준의 문제해결 수업의 접근 방법을 소개함으로 문제해결 수업을 구현할 수 있는 지식을 제공한다. 특히 Schoenfeld의 문제해결 수업 모델은 수학 교육의 교실 수업으로의 구현 측면에서 갖는 다양한 함의를 제시한다.
PDF

TAI 모델과 STAD 모델을 혼합한 협동학습이 수학과의 문제 해결 능력에 미치는 효과 (A Study on the Effect of Cooperative Learning Blended with the TAI and STAD Models on the Students' Ability of Problem Solving in Mathematics)

김희정;김응환
- 한국학교수학회논문집
- /
- 제9권1호
- /
- pp.1-17
- /
- 2006
현재 학교수학이 추구하는 목표는 수학의 기본적인 지식과 기능을 습득하고 수학적으로 사고하는 능력을 길러 실생활의 여러 가지 문제를 합리적으로 해결할 수 있는 능력과 태도를 기르는 것이다. 이에 부합하기 위해서 본 연구는 협동학습 모델 중 개별화 학습프로그램이 큰 장점인 TAI 모델과 특별한 소집단 성적 산출로 인해 모든 소집단 구성원이 소집단 성공에 기여할 수 있다는 장점을 가지고 있는 STAD 모델을 혼합하여 새로운 모델을 제시하였다. 이 새로운 혼합모델을 학교 현장에 적용하여 학습자의 문제해결능력 및 정의적 영역에 있어서 어떤 영향을 주는지 알아보았다.
PDF

다중 도메인 답변 생성 모델을 위한 인간의 기억 시스템을 모방하는 지속 학습 기법 (Continual Learning with Mimicking Human Memory System For Multi-domain Response Generator)

이준범;박형준;송현제;박성배
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
- /
- pp.215-220
- /
- 2021
다중 도메인에 대해 답변 생성 모델이 동작 가능하도록 하는 가장 쉬운 방법은 모든 도메인의 데이터를 순서와 상관없이 한번에 학습하는 것이다. 하지만 이경우, 발화에 상관 없이 지나치게 일반적인 답변을 생성하는 문제가 발생한다. 이에 반해, 도메인을 분리하여 도메인을 순차적으로 학습할 경우 일반적인 답변 생성 문제를 해결할 수 있다. 하지만 이경우 새로운 도메인의 데이터를 학습할 때, 기존에 학습한 도메인에 대한 성능이 저하되는 파괴적 망각 현상이 발생한다. 파괴적 망각 현상을 해결하기 위하여 다양한 지속학습기법이 제안되었으며, 그 중 메모리 리플레이 방법은 새로운 도메인 학습시 기존 도메인의 데이터를 함께 학습하는 방법으로 파괴적 망각 현상을 해결하고자 하였다. 본 논문에서는, 사람의 기억 시스템에 대한 모형인 앳킨슨-쉬프린 기억 모형에서 착안하여 사람이 기억을 저장하는것과 유사한 방법으로 메모리 리플레이 방법의 메모리 관리방법을 제안하였고, 해당 메모리 관리법을 활용하는 메모리 리플레이 방법을 통해 답변 생성 모델의 파괴적 망각 현상을 줄이고자 하였다. 다중 도메인 답변 생성에 대한 데이터셋인 MultiWoZ-2.0를 사용하여 제안 모델을 학습 및 평가하였고, 제안 모델이 다중 도메인 답변 생성 모델의 파괴적 망각 현상을 감소시킴을 확인하였다.
PDF

단어 생성 이력을 이용한 시퀀스-투-시퀀스 요약의 어휘 반복 문제 해결 (Reduce Redundant Repetition Using Decoding History for Sequence-to-Sequence Summarization)

류재현;노윤석;최수정;박세영
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
- /
- pp.120-125
- /
- 2018
문서 요약 문제는 최근 심층 신경망을 활용하여 활발히 연구되고 있는 문제 중 하나이다. 많은 기존 연구들이 주로 시퀀스-투-시퀀스 모델을 활용하여 요약을 수행하고 있으나, 아직 양질의 요약을 생성하기에는 많은 문제점이 있다. 시퀀스-투-시퀀스 모델을 활용한 요약에서 가장 빈번히 나타나는 문제 중 하나는 요약문의 생성과정에서 단어나 구, 문장이 불필요하게 반복적으로 생성되는 것이다. 이를 해결하기 위해 다양한 연구가 이루어지고 있으며, 이들 대부분은 요약문의 생성 과정에서 정확한 정보를 주기 위해 모델에 여러 모듈을 추가하였다. 하지만 기존 연구들은 생성 단어가 정답 단어로 나올 확률을 최대화 하도록 학습되기 때문에, 생성하지 말아야 하는 단어에 대한 학습이 부족하여 반복 생성 문제를 해결하는 것에는 한계가 있다. 따라서 본 논문에서는 기존 요약 모델의 복잡도를 높이지 않고, 단어 생성 이력을 직접적으로 이용하여 반복 생성을 제어하는 모델을 제안한다. 제안한 모델은 학습할 때 생성 단계에서 이전에 생성한 단어가 이후에 다시 생성될 확률을 최소화하여 실제 모델이 생성한 단어가 반복 생성될 확률을 직접적으로 제어한다. 한국어 데이터를 이용하여 제안한 방법을 통해 요약문을 생성한 결과, 비교모델보다 단어 반복이 크게 줄어들어 양질의 요약을 생성하는 것을 확인할 수 있었다.
PDF

시각-언어 이동 에이전트를 위한 모방 학습과 강화 학습의 결합 (Combining Imitation Learning and Reinforcement Learning for Visual-Language Navigation Agents)

오선택;김인철
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2020년도 춘계학술발표대회
- /
- pp.559-562
- /
- 2020
시각-언어 이동 문제는 시각 이해와 언어 이해 능력을 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각-언어 이동 에이전트를 위한 새로운 학습 모델을 제안한다. 이 모델은 데모 데이터에 기초한 모방 학습과 행동 보상에 기초한 강화 학습을 함께 결합한 복합 학습을 채택하고 있다. 따라서 이 모델은 데모 데이타에 편향될 수 있는 모방 학습의 문제와 상대적으로 낮은 데이터 효율성을 갖는 강화 학습의 문제를 상호 보완적으로 해소할 수 있다. 또한, 제안 모델은 서로 다른 두 학습 간에 발생 가능한 학습 불균형도 고려하여 손실 정규화를 포함하고 있다. 또, 제안 모델에서는 기존 연구들에서 사용되어온 목적지 기반 보상 함수의 문제점을 발견하고, 이를 해결하기 위해 설계된 새로은 최적 경로 기반 보상 함수를 이용한다. 본 논문에서는 Matterport3D 시뮬레이션 환경과 R2R 벤치마크 데이터 집합을 이용한 다양한 실들을 통해, 제안 모델의 높은 성능을 입증하였다.
https://doi.org/10.3745/PKIPS.y2020m05a.559 인용 PDF

다단계 기계학습 기법을 이용한 구묶음 성능향상 (Performance Improvement of Chunking Using Cascaded Machine Learning Methods)

전길호;서형원;최명길;남유림;김재훈
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
- /
- pp.107-109
- /
- 2011
기계학습은 학습말뭉치로부터 문제를 해결하기 위한 규칙을 학습하여 모델을 생성한다. 생성된 모델의 성능을 높이기 위해서는 문제에 적합한 자질들을 많이 이용해야 하지만 많은 자질들을 사용하면 모델의 생성시간은 느려지는 것이 사실이다. 이 문제를 해결하기 위해 본 논문에서는 다단계 기법을 적용한 기계학습으로 구묶음 시스템을 제작하여 학습모델의 생성시간을 단축하고 성능을 높이는 기법을 제안한다. 많은 종류의 자질들을 두 단계로 분리하여 학습하는 기법으로 1단계에서 구의 경계를 인식하고 2단계에서 구의태그를 결정한다. 1단계의 학습자질은 어휘 정보, 품사 정보, 띄어쓰기 정보, 중심어 정보를 사용하였으며, 2단계 학습자질은 어휘 정보와 품사 정보 외에 1단계 결과에서 추출한 구의 시작 품사 정보와 끝 품사 정보, 구 정보, 구 품사 정보를 자질로 사용하였다. 평가를 위해서 본 논문에서는 ETRI 구문구조 말뭉치를 사용하였다.
PDF

확률 라이브러리 모델(PLM)에 의한 애너그램 문제 해결 (Molecular Simulation of Anagram Problem Solving with PLM)

강윤정;이은석;태강수;장병탁
- 한국인지과학회:학술대회논문집
- /
- 한국인지과학회 2005년도 춘계학술대회
- /
- pp.130-134
- /
- 2005
본 연구는 애너그램(anagram) 문제해결 과제에서 발생하는 제약들(영어 철자연쇄 집합의 출현 확률과 단어 내 위치 확률)을 동시에 병렬적으로 만족시키는 확률 모델 학습과정을 보인다. 애너그램에 관한 많은 선행연구들은 이 문제해결 과정이 단순히 기호처리적인 층위뿐만 아니라 하위기호적(subsymbolic) 층위에서의 상향식 처리로 인해 일어남을 밝혀왔고, 주로 영어 철자의 연쇄체의 확률값을 이용해왔다. 본 연구는 확률 라이브러리 모델(Probabilistic Library Model)을 통해 애너그램 문제해결이 한 번씩 끝날 때마다 철자 연쇄체의 출현 및 위치 분포 확률이 어떻게 유연한 변화를 갖는지에 집중한다. 하나의 문제를 풀고 나면 본 모델은 그 전 문제를 풀었을 때의 상태 패턴으로부터 변화를 보인다. 이러한 분포 변화를 통해 하위기호적 활동의 영향이 문제해결에 있어서 학습구조의 유연한 변화에 중요한 영향을 끼친다는 점을 확인했다.
PDF

초등학교 수학교과서에 나타난 문제해결 전략의 양식에 대한 분석 (Analysis of Strategies for Problem Solving Presented in Elementary School Mathematics Textbooks)

Kim, Jin Ho
- 대한수학교육학회지:학교수학
- /
- 제4권4호
- /
- pp.565-580
- /
- 2002
연구자들은 학생들에게 문제해결 전략을 지도하는 것이 학생들의 문제해결력을 신장시켜 준다는 보고하고 있다. 이와 같은 연구결과를 배경으로 수학 교과서를 통하여 문제해결 전략을 지도하려는 시도들이 미국을 비롯하여 한국에서도 있어 왔다. 본 논문은 문제해결 전략을 교과서에 제시할 수 있는 가능한 세 가지 모델들을 논의하고, 미국과 한국의 수학교과서에서 문제해결 전략을 제시하는 방법을 분석하였다. 한 가지 모델은 문제해결 전략에 한 단원을 할애하는 것이다. 두 번째 모델은 각 수학내용을 지도하는 단원에 문제해결 전략의 지도를 위한 하위단원을 할당하는 것이다. 마지막, 세 번째 모델은 문제해결 전략 지도를 위한 특정 단원이나 하위 단원을 설정하는 것이 아니라 가능한 많은 쪽에 전략을 제시하는 것이다. 위에 언급한 세 가지 가능한 모델을 바탕으로 미국과 한국의 초등학교 수학교과서에서 문제해결 전략을 제시하는 양상을 비교하였다. 이 비교를 위하여 각 학년별로 제시되는 모든 전략들을 교과서와 교사용 지도서를 토대로 추출하였다. 각 교과서에서 전략을 제시한 양식을 비교한 결과 다음과 같은 결론을 얻게 되었다. 한국의 수학교과서는 전형적으로 첫 번째 모델의 양식으로 문제해결전략을 제시하고 있었다. 각 단원마다 별개의 문제해결 전략이 제시되었다. 또한, 학년별 지도 전략을 살펴보면 학년별로 연계성이 있게 전략이 제시 되었다기 보다는 학년별로 다른 다양한 전자의 지도에 중점을 둔 듯하다. 미국의 수학교과서는 두 번째 모델과 세 번째 모델의 중간적인 양식으로 문제해결 전략을 제시하고 있다. 즉, 각 단원마다 문제해결 전략 지도를 위한 하위 단원을 지정하였으며 필요한 경우에는 본 단원의 주 학습요소와 관련된 문제해결 전략은 단원 중에도 제시되고 있었다. 따라서, 차기 수학교과서 개정시기에는 세 번째 모델을 그 모형으로 삼아 문제해결 전략들을 제시하는 방안을 강구해야 할 것으로 기대된다.
PDF

검색결과 730건 처리시간 0.034초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)