통합 검색 | Korea Science

효율적인 멀티 에이전트 강화학습을 위한 RBFN 기반 정책 모델 (RBFN-based Policy Model for Efficient Multiagent Reinforcement Learning)

권기덕;김인철
- 한국지능정보시스템학회:학술대회논문집
- /
- 한국지능정보시스템학회 2007년도 추계학술대회
- /
- pp.294-302
- /
- 2007
멀티 에이전트 강화학습에서 중요한 이슈 중의 하나는 자신의 성능에 영향을 미칠 수 있는 다른 에이전트들이 존재하는 동적 환경에서 어떻게 최적의 행동 정책을 학습하느냐 하는 것이다. 멀티 에이전트 강화 학습을 위한 기존 연구들은 대부분 단일 에이전트 강화 학습기법들을 큰 변화 없이 그대로 적용하거나 비록 다른 에이전트에 관한 별도의 모델을 이용하더라도 현실적이지 못한 가정들을 요구한다. 본 논문에서는 상대 에이전트에 대한RBFN기반의 행동 정책 모델을 소개한 뒤, 이것을 이용한 강화 학습 방법을 설명한다. 본 논문에서는 제안하는 멀티 에이전트 강화학습 방법은 기존의 멀티 에이전트 강화 학습 연구들과는 달리 상대 에이전트의 Q 평가 함수 모델이 아니라 RBFN 기반의 행동 정책 모델을 학습한다. 또한, 표현력은 풍부하나 학습에 시간과 노력이 많이 요구되는 유한 상태 오토마타나 마코프 체인과 같은 행동 정책 모델들에 비해 비교적 간단한 형태의 행동 정책 모델을 이용함으로써 학습의 효율성을 높였다. 본 논문에서는 대표적이 절대적 멀티 에이전트 환경인 고양이와 쥐 게임을 소개한 뒤, 이 게임을 테스트 베드 삼아 실험들을 전개함으로써 제안하는 RBFN 기반의 정책 모델의 효과를 분석해본다.
PDF

정규문법과 동등한 일반화된 이진 이차 재귀 신경망 (Generalized Binary Second-order Recurrent Neural Networks Equivalent to Regular Grammars)

정순호
- 지능정보연구
- /
- 제12권1호
- /
- pp.107-123
- /
- 2006
이 논문은 정규문법과 동등한 의미를 가지는 일반적인 이진 이차 재귀 신경망(Generalized Binary Second-order Recurrent Neural Networks: GBSRNN)의 구조 및 학습 방법을 제안하며 이를 이용하여 정규언어를 인식하는 어휘분석기 구현을 소개한다. GSBRNN는 성분들의 이진값 표현으로 정규문법과 동치인 모든 표현에 대하여 하드웨어로 표현할 수 있는 방법을 제공하며 정규 문법과의 구조적 관련성을 보여준다. 정규문법에서 심볼들의 개수 m, 비단말 심볼의 개수 p, 단말 심볼의 개수 q, k인 문자열이 입력된다고 할 때, GBSRNN의 크기는 $O(m(p+q)^2)$ 이고 병렬처리 시간은 O(k)이며 순차처리 시간은 $O(k(p+q)^2)$이다.
PDF

우리말 연속음성의 음절 분할법 (A Syllabic Segmentation Method for the Korean Continuous Speech)

한학용;고시영;허강인
- 한국음향학회지
- /
- 제20권3호
- /
- pp.70-75
- /
- 2001
본 논문은 우리말 연속음성에 대한 음절단위 분할법을 제안한다. 이 방법은 다음 3단계로 이루어진다: (1) 음성의 시간영역 분할 파라메터인 피치, 에너지, ZCR, PVR을 이용하여 음성데이터를 자음, 자음. 묵음 단위로 라벨링하여 토큰 (Token)을 형성, (2) 형성된 토큰을 유한상태오토마타를 이용하여 한국어 음절구조로 파서 (Parser)를 설계하여 스캐닝 (Scanning), (3) 의사 음절핵 정보를 이용하여 두개 혹은 여러 개의 음절을 가지는 음성부분에 대한 재분할을 통하여 음절단위 분할 완성. 제안된 방법에 대한 성능 평가를 위해서 문장과 단어단위 연속음성에 대한 분할 실험결과 각각 73.7％와 85.9％의 분할률을 얻었다.
PDF

임베디드 시스템에서의 상황인식 제어를 위한 상태전이 기반 상황 모델링과 이를 응용한 상황-동작 변환기 (SAC)의 설계 (A state transition based situation modeling and its application to design of SAC(Situation-Action Converter) for situation-aware control for embedded systems)

허길;박희정;조위덕;최재영
- 한국정보과학회논문지:시스템및이론
- /
- 제33권9호
- /
- pp.642-649
- /
- 2006
지능형 서비스를 제공하는 환경에서 상황을 인식하기 위하여 임베디드 시스템이 갖는 제한적인 리소스와 컴퓨팅 파워 환경에 적합한 상태 전이 기반 상황 표현 모델을 제안하고, 이를 인식하는 상황 인식기와 제어 신호를 발생시키는 동작 발생기를 결합한 임베디드 시스템에 탑재하기에 적합한 상황-동작 변환기(SAC)를 설계하였다. 또한 ARM 프로세서 기반의 임베디드 보드에 설계된 상황-동작 변환기를 응용한 상황 관리기를 구현하여 이를 스마트 스케줄러 서비스에 활용하였다.
PDF KSCI

90/150 HCA를 이용한 MWCA 판정법 (MWCA Test using 90/150 HCA)

최언숙;조성진;김한두;김진경;강성원
- 한국전자통신학회논문지
- /
- 제14권1호
- /
- pp.235-242
- /
- 2019
유한체 상에서 자기상반다항식은 역방향읽기 성질을 갖는 가역 부호를 설계하는 데 유용하다. 본 논문은 자기상반다항식 중 하나인 최대무게 다항식을 특성다항식으로 갖는 90/150 CA에 관한 연구이다. 전이규칙이 <$100{\cdots}0$>인 n-셀 90/150 CA를 이용하여 2n차 최대무게 다항식에 대응하는 90/150 MWCA가 존재하는지에 대한 판정법을 제안한다. 제안하는 방법은 실험을 통하여 검증한다.
https://doi.org/10.13067/JKIECS.2019.14.1.235 인용 PDF KSCI HTML

2ⁿ 차 최대무게 다항식에 대응하는 90/150 RCA (90/150 RCA Corresponding to Maximum Weight Polynomial with degree 2ⁿ)

최언숙;조성진
- 한국전자통신학회논문지
- /
- 제13권4호
- /
- pp.819-826
- /
- 2018
일반화된 해밍무게는 선형부호의 중요한 파라미터의 하나로써 암호시스템에 적용할 때 부호의 성능을 결정한다. 그리고 격자도를 이용하여 블록부호를 연판정으로 복호할 때 구현에 필요한 상태복잡도를 평가하는 척도가 되기도 함으로써 그 중요성이 한층 부각되고 있다. 특별히 삼항다항식을 기반으로 하는 유한체 상의 비트-병렬 곱셈기에 대한 연구가 진행되어왔다. 셀룰라오토마타(Cellular Automata, 이하 CA)는 국소적 상호작용에 의해 상태가 동시에 업데이트되는 성질이 있어서 LFSR보다 랜덤성이 우수하다. 본 논문에서는 효과적인 암호시스템 설계에 있어 중요한 요소 중 하나인 의사난수열 생성기의 효과적 합성에 관하여 다룬다. 먼저 간단한 90/150 전이규칙 블록의 특성 다항식의 성질을 분석하고, 이 규칙블록을 이용하여 삼항다항식 $x^2^n+x^{2^n-1}+1$($n{\geq}2$)에 대응하는 가역 90/150 CA와 $2^n$차 최대무게다항식에 대응하는 90/150 가역 CA(RCA)의 합성알고리즘을 제안한다.
https://doi.org/10.13067/JKIECS.2018.13.4.819 인용 PDF KSCI

K-L 동적 계수를 이용한 단어 인식 (Word Recognition Using K-L Dynamic Coefficients)

김주곤
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
- /
- pp.103-106
- /
- 1998
본 논문에서는 음성인식 시스템의 인식 정도의 향상을 위해서 동적 특징으로서 K-L(Karhanen-Loeve)계수를 이용하여 음소모델을 구성하는 방법을 제안하고, 음소, 단어, 숫자음 인식 실험을 통하여 그 유효성을 검토하였다. 인식 실험을 위한 음성자료는 한국 전자통신 연구소에서 채록한 445단어와 국어정보공학연구소에서 채록한 4연속 숫자음을 사용하였으며, K-L계수 동적 특징의 유효성을 확인하기 위해 정적 특징으로서 멜-켑스트럼과 동적 특징으로서 K-L계수 및 회귀계수를 추출한 후 음소, 단어, 숫자음 인식 실험을 수행하였다. 인식의 기본 단위로는 48개의 유사음소단위(Phoneme Likely Unite ; PLUs)를 음소모델로 사용하였으며, 단어와 숫자음 인식을 위해서는 유한상태 오토마타(Finite State Automata; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming)법을 이용하였다. 인식 실험 결과, 음소인식에 있어서는 정적특징인 멜-켑스트럼을 사용한 경우 39.8%, K-L 동적 계수를 사용한 경우가 52.4%로 12.6%의 향상된 인식률을 얻었다. 또한, 멜-켑스트럼과 회수계수를 사용한 경우 60.1%, K-L계수와 회귀계수를 결합한 경우에 있어서도 60.4%로 높은 인식률은 얻었다. 이 결과를 단어인식에 확장하여 인식 실험을 수행한 결과, 기존의 멜-켑스트럼 계수를 사용한 경우 65.5%, K-L계수를 사용한 경우 75.8%로 10.3% 향상된 인식률을 얻었으며, 멜-켑스트럼과 회귀계수를 결합한 경우 91.2%, K-L계수와 회귀계수를 결합한 경우 91.4%의 높은 인식률을 보였다. 도한, 4연속 숫자음에 적용한 경우에 있어서도 멜-켑스트럼을 사용한 경우 67.5%, K-L계수를 사용한 경우 75.3%로 7.8%의 향상된 인식률을 보였으며 K-L계수와 회귀계수를 결합한 경우에서도 비교적 높은 인식률을 보여 숫자음에 대해서도 K-L계수의 유효성을 확인할 수 있었다.
PDF

음성인식 기능을 가진 주소입력 시스템의 개발과 평가 (Development and Evaluation of an Address Input System Employing Speech Recognition)

김득수;황철준;정현열
- 한국음향학회지
- /
- 제18권2호
- /
- pp.3-10
- /
- 1999
본 논문은 음성인식 기술을 사용자 인터페이스로 하여 국내 행정 단위 시(도), 구(군), 동(읍,면), 번지로 구성되는 주소를 인식의 대상으로 하는 주소 입력 시스템 구축에 대하여 기술한다. 본 시스템은 사운드카드가 장착된 개인용 컴퓨터상의 윈도우 95환경에서 동작하며, 음성인식부는 인식의 기본단위로 유사음소단위(Phoneme Like Units: PLUs)를 이용하여 CHMM(Continuous Hidden Markov Model) 음소모델을 작성하고, 주소인식을 위해서 주소명의 특징을 고려하여 이에 적합한 유한상태 오토마타(Finite State Automata)를 구성하여 OPDP(One Pass Dynamic Programming)법으로 인식을 수행하였다. 실용성있는 시스템 성능을 얻기 위하여 마이크, 환경잡음 및 화자의 변화 등의 사용환경변화에 대해 최대사후확률추정법(Maximum A Posteriori Probability Estimation: MAP)으로 적응화시켜 인식률의 향상을 도모하였고, 개인용 컴퓨터상에서의 인식속도를 향상시키기 위하여 가변프루닝 문턱치를 이용한 고속화 기법을 제안하였다. 평가결과, 화자적응화 후의 성인 남자 3인에 대한 100개의 연결주소명의 연결단어 인식률은 평균 96.0%이상, 인식속도는 발성완료후 약 2초 이내로 인식이 완료되어 본 시스템의 유효성을 확인할 수 있었다.
PDF

멀티 에이전트 기반의 지능형 시뮬레이션 도구의 개발 (A Development of Intelligent Simulation Tools based on Multi-agent)

우종우;김대령
- 한국컴퓨터정보학회논문지
- /
- 제12권6호
- /
- pp.21-30
- /
- 2007
시뮬레이션이란 실세계의 다양한 객체들의 구조와 행위에 대한 자료를 수집하여 모델링하고 이를 컴퓨터 프로그램으로 모의 실험함을 말하며, 주요 기반기술들로서 DEVS (Discrete Event System Specification) 형식론을 비롯하여 페트리 넷 이나 구조적 오토마타 등이 연구되고 있다. 그러나 이러한 시뮬레이션의 연구영역이 보다 다양화되고 복잡하게 발전됨에 따라, 최근에는 인공지능의 지능형 에이전트기법을 도입하여 해결하는 연구가 활성화되고 있다. 본 연구에서는 시뮬레이션에 관한 모의실험을 보다 원활히 수행하기 위해서 지능형 멀티 에이전트기반의 시뮬레이션 도구를 개발하고자 한다. 이러한 도구의 특징은 첫째, 인공지능의 기능들을 라이브러리로 제공할 수 있고, 둘째, 유한상태기계(FSM)기반으로 에이전트 시스템을 설계하여, 시뮬레이션의 설계 모델을 보다 단순화 할 수 있는 장점이 있으며, 셋째, 모델러, 스크립터, 시뮬레이터등의 보조툴들을 제공함으로서 사용자들이 보다 편리하게 시뮬레이션 시스템을 개발할 수 있는 프레임워크를 제공한다. 시스템의 구성은 코어 시뮬레이션 엔진 유틸리티, 그리고 기타 보조툴들로 구성하였으며, 현재까지 개발된 시스템으로 몇 가지 영역을 대상으로 실험을 하였고 그 결과를 기술하였다.
PDF

효율적인 멀티 에이전트 강화 학습을 위한 나이브 베이지만 기반 상대 정책 모델 (A Naive Bayesian-based Model of the Opponent's Policy for Efficient Multiagent Reinforcement Learning)

권기덕
- 인터넷정보학회논문지
- /
- 제9권6호
- /
- pp.165-177
- /
- 2008
멀티 에이전트 강화학습에서 중요한 이슈 중의 하나는 자신의 성능에 영향을 미칠 수 있는 다른 에이전트들이 존재하는 동적 환경에서 어떻게 최적의 행동 정책을 학습하느냐 하는 것이다. 멀티 에이전트 강화 학습을 위한 기존 연구들은 대부분 단일 에이전트 강화 학습기법들을 큰 변화 없이 그대로 적용하거나 비록 다른 에이전트에 관한 별도의 모델을 이용하더라도 현실적이지 못한 가정들을 요구한다. 본 논문에서는 상대 에이전트에 대한 나이브 베이지안 기반의 행동 정책 모델을 소개한 뒤, 이것을 이용한 강화 학습 방법을 설명한다. 본 논문에서 제안하는 멀티 에이전트 강화학습 방법은 기존의 멀티 에이전트 강화 학습 연구들과는 달리 상대 에이전트의 Q 평가 함수 모델이 아니라 나이브 베이지안 기반의 행동 정책 모델을 학습한다. 또한, 표현력은 풍부하나 학습에 시간과 노력이 많이 요구되는 유한 상태 오토마타나 마코프 체인과 같은 행동 정책 모델들에 비해 비교적 간단한 형태의 행동 정책 모델은 이용함으로써 학습의 효율성을 높였다. 본 논문에서는 대표적인 적대적 멀티 에이전트 환경인 고양이와 쥐게임을 소개한 뒤, 이 게임을 테스트 베드 삼아 실험들을 전개함으로써 제안하는 나이브 베이지안 기반의 정책 모델의 효과를 분석해본다.
PDF

검색결과 55건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)