• 제목/요약/키워드: S-MCTS

검색결과 15건 처리시간 0.023초

삼목 게임을 위해 개선된 몬테카를로 트리탐색 알고리즘 (Enhanced strategic Monte-Carlo Tree Search algorithm to play the game of Tic-Tac-Toe)

  • 이병두
    • 한국게임학회 논문지
    • /
    • 제16권4호
    • /
    • pp.79-86
    • /
    • 2016
  • 몬테카를로 트리탐색은 최대우선탐색 알고리즘이며, 많은 게임 특히 바둑 게임에 성공적으로 적용되어 왔다. 삼목 게임에서 MCTS 간의 대국을 통해 성능을 평가하고자 했다. 첫 번째 대국자는 항상 두 번째 대국자에 비해 압도적인 우위를 보였으며, 최선의 게임 결과가 무승부가 됨에도 불구하고 첫 번째 대국자가 두 번째 대국자에 비해 우월한 이유를 찾고자 했다. MCTS는 반복적인 무작위 샘플링을 기반으로 하는 통계적 알고리즘이기 때문에, 특히 두 번째 대국자를 위해 전략을 요하는 시급한 문제를 적절히 대처하지 못한다. 이를 위해 전략적 MCTS(S-MCTS)를 제안하며, S-MCTS는 결코 삼목 게임에서 지지 않는다는 것을 보였다.

삼목 게임에서 최상의 첫 수를 구하기 위해 적용된 신뢰상한트리 알고리즘 (The UCT algorithm applied to find the best first move in the game of Tic-Tac-Toe)

  • 이병두;박동수;최영욱
    • 한국게임학회 논문지
    • /
    • 제15권5호
    • /
    • pp.109-118
    • /
    • 2015
  • 고대 중국에서 기원된 바둑은 인공지능 분야에서 가장 어려운 도전 중의 하나로 간주된다. 지난 수년에 걸쳐 MCTS를 기반으로 하는 정상급 컴퓨터바둑 프로그램이 놀랍게도 접바둑에서 프로기사를 물리쳤다. MCTS는 게임이 끝날 때까지 일련의 무작위 유효착수를 시뮬레이션 하는 접근법이며, 기존의 지식기반 접근법을 대체했다. 저자는 MCTS의 변형인 UCT 알고리즘을 삼목 게임에 적용하여 최선의 첫 수를 찾고자 했으며, 순수 MCTS의 결과와 비교를 했다. 아울러 UCB 이해를 위한 다중슬롯머신 문제를 풀기 위해 엡실론-탐욕 알고리즘과 UCB 알고리즘을 소개 및 성능을 비교하였다.

순수 몬테카를로 트리탐색을 기반으로 한 소형 바둑판에서의 가장 유망한 첫 수들 (The most promising first moves on small Go boards, based on pure Monte-Carlo Tree Search)

  • 이병두
    • 한국게임학회 논문지
    • /
    • 제18권6호
    • /
    • pp.59-68
    • /
    • 2018
  • 간단한 규칙에도 불구하고 바둑은 인공지능 분야에서 가장 복잡한 전략적 보드게임 중의 하나이다. 몬테카를로 트리탐색(MCTS)은 최상우선 트리탐색 알고리즘으로 컴퓨터바둑 제작을 위해 사용되어 왔다. 저자는 9줄바둑판보다 작은 바둑판에서의 바둑게임 행위를 위해 MCTS를 활용하여 가장 유망한 첫 수를 찾고자 한다. 실험결과에 의하면 MCTS는 첫 수로 홀수형 바둑판에서는 정중앙, 짝수형 바둑판에서는 중앙 부근에 착수하기를 선호하는 것으로 나타났다.

Convolutional Neural Network와 Monte Carlo Tree Search를 이용한 인공지능 바둑 프로그램의 구현 (Implementation of Artificial Intelligence Computer Go Program Using a Convolutional Neural Network and Monte Carlo Tree Search)

  • 기철민;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.405-408
    • /
    • 2016
  • 바둑, 체스, 장기와 같은 게임은 사람들의 두뇌발달에 도움을 주어왔다. 이 게임들은 컴퓨터 프로그램으로도 개발되었으며, 혼자서도 게임을 즐길 수 있도록 많은 알고리즘들이 개발되었다. 사람을 이기는 체스 프로그램은 1990년대에 개발된 것에 비해 바둑은 경우의 수가 너무 많아서 프로 바둑기사를 이기기는 불가능한 것으로 여겨졌다. 하지만 MCTS(Monte Carlo Tree Search)와 CNN(Convolutional Neural Network)의 이용으로 바둑 알고리즘의 성능은 큰 향상을 이루었다. 본 논문에서는 CNN과 MCTS를 사용하여 바둑 알고리즘의 개발을 진행하였다. 바둑의 기보가 학습된 CNN을 이용하여 최적의 수를 찾고, MCTS를 이용하여 게임의 시뮬레이션을 진행하여 이길 확률을 계산한다. 또한 기존 기보를 이용하여 바둑의 패턴 정보를 추출하고, 이를 이용하여 속도와 성능 향상을 도모하였다. 이 방법은 일반적으로 사용되는 바둑 알고리즘들에 비해 성능 향상이 있었다. 또한 충분한 Computing Power가 제공되면 더욱 성능이 향상될 것으로 보인다.

  • PDF

무전략 몬테카를로 트리탐색을 활용한 9줄바둑에서의 첫 수 (The first move in the game of 9⨯9 Go, using non-strategic Monte-Carlo Tree Search)

  • 이병두
    • 한국게임학회 논문지
    • /
    • 제17권3호
    • /
    • pp.63-70
    • /
    • 2017
  • 인공지능 연구에서 바둑은 위치평가의 어려움과 엄청난 분기수로 인해 가장 도전적인 보드게임으로 여겨지고 있다. 몬테카를로 트리탐색은 이러한 문제점을 극복할 수 있는 고무적인 돌파구이다. 알파고의 숨겨진 아이디어는 주어진 위치에서의 승률을 예상하여 깊은 탐색을 유도한 후 가장 고무적인 착수를 찾아내는 것이었다. 본 논문에서는 무전략 MCTS를 활용하여 9줄바둑에서 프로기사들이 최상의 첫수로 여기는 천원점이 옳다는 것을 확인했으며, 또한 가장 유행하는 첫 수들의 평균승률을 비교했다.

몬테카를로 트리탐색을 활용한 초소형 바둑에서의 최상의 수순과 덤의 크기 (The Best Sequence of Moves and the Size of Komi on a Very Small Go Board, using Monte-Carlo Tree Search)

  • 이병두
    • 한국게임학회 논문지
    • /
    • 제18권5호
    • /
    • pp.77-82
    • /
    • 2018
  • 바둑은 최상의 착점을 찾기 위해 컴퓨터가 완전탐색을 하여 모든 가능한 착점들을 탐색할 수 없는 가장 복잡한 보드게임이다. AlphaGo 이전에 모든 강력한 컴퓨터바둑 프로그램들은 게임트리 내 매우 큰 분기수와 국면평가에서의 어려움을 극복하기 위해 몬테카를로 트리탐색(Monte-Carlo Tree Search)을 사용해 왔다. 본 논문에서는 MCTS를 활용하여 초소형 바둑에서의 최상의 수순과 덤의 크기를 알고자 했다. 2줄바둑에서의 게임결과는 빅이 되었으며 덤의 크기는 0집, 반면에 3줄바둑에서는 흑이 항상 승리하고 덤의 크기는 9집이 되어야 함을 알아냈다.

흰쥐의 부정소에서 Monocarboxylate Transporters(MCTs)와 조절 단백질, Basigin과 Embigin의 생후 발달 과정 동안 발현 양상 (Postnatal Ontogeny of Expression of Monocarboxylate Transporters(MCTs) and Two Regulatory Proteins, Basigin and Embigin, in The Epididymis of Male Rat)

  • 이기호
    • Journal of Animal Science and Technology
    • /
    • 제50권1호
    • /
    • pp.45-56
    • /
    • 2008
  • 본 연구는 생후 발달 과정 동안 monocarboxylate transporter(MCT) isoform과 MCT의 발현 조절 단백질로 알려진 basigin(Bsg)과 embigin의 mRNA 발현을 흰쥐의 부정소에서 부위별로 real-time PCR 방법을 사용하여 알아보았으며, 에스트로젠과 에스트로젠 수용체 α의 작용에 의해 MCT1 발현이 조절되는지를 알아보기 위해 estrogen receptor α knockout(αERKO) 마우스를 이용하여 immunohistochemistry 방법을 통해 탐구하였다. 본 연구 결과는 다양한 MCT isoform(MCT1, 2, 3, 4와 8), Bsg과 embigin의 mRNA 발현이 부정소의 부위별로 연령에 따라 다르게 나타나며, 부정소에서 MCT1 단백질 발현은 corpus와 caudal 부위에서 apical 지역에 한정되어 나타나는 것을 보여 주었다. 또한 부정소에서 MCT1 단백질 발현은 에스트로젠 수용체 α의 존재 여부와 상관 없음이 보여졌다. 따라서, 본 연구는 MCT가 남성 생식기관인 부정소에서 정자 성숙과 저장을 위한 적절한 환경을 형성함으로써 남성 생식력의 유지에 관여 할 수 있음을 시사한다. (색인어 : Epididymis, Monocarboxylate transporter, Basigin, Embigin)

사용자 시선 예측을 통한 360 영상 타일 기반 스트리밍 시스템 (Tile-Based 360 Degree Video Streaming System with User's gaze Prediction)

  • 이순빈;장동민;정종범;이상순;류은석
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1053-1063
    • /
    • 2019
  • 최근 360 영상에 대한 관심이 증대됨에 따라, 이러한 360 영상을 보다 효율적으로 전송하기 위해 하나의 360 영상을 여러 개의 타일로 나누어 전송하는 타일 기반 스트리밍이 활발히 연구되고 있다. 본 논문에서는 타일 기반 스트리밍 시나리오에서 사용자 시점에 대응하는 고화질 360 영상 전송을 위해, 기존 네트워크 모델로 생성된 중요도 맵(Saliency map)을 타일 기반 스트리밍에 적용하여 각 위치의 타일의 품질을 할당하는 시스템을 제안한다. 각 타일들을 독립적으로 부호화하기 위해 motion constrained tile set (MCTS) 기법을 적용함과 동시에 Salient360! 데이터셋으로 사용자 시선 시나리오를 토대로 사용자 시점 영상으로 복원하여 검증한 결과, 제안된 시스템을 기반으로 360 비디오 영상을 전송하면 기존 high-efficiency video coding (HEVC)을 사용하여 전송했을 때보다 사용자 시점의 영상은 큰 손실 없이 최대 23%의 BD-rate 효율을 보임을 확인하였다.

사용자 시점 기반 360 영상을 위한 렌더러 구현 (Implementing Renderer for Viewport Dependent 360 Video)

  • 장동민;손장우;정종범;류은석
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.747-759
    • /
    • 2018
  • 본 논문에서는 실시간 고화질 360 영상 전송을 위해 사용자 시점에 기반한 타일 분할 기법을 적용하고 화질 평가를 위해 360 영상을 가상현실 기기 화면에 표현하는 구현을 설명한다. 사용자 시점에 기반한 고화질 360 영상 전송을 위한 방안으로, 움직임 참조 문제를 해결하기 위한 MCTS (Motion Constrained Tile Sets) 기술과 미리 구성된 타일 정보들을 포함하는 EIS (Extraction Information Sets) SEI (Supplemental Enhancement Information), 타일 정보를 추출해내고 영상을 분할 및 추출해주는 추출기(extractor)를 구현한다. 또한 사용자 시점에 기반한 타일 추출 방법과 추출된 영상을 이용해 가상현실 기기 화면에 표현하는 방법에 대한 구현 내용을 설명한다. 따라서, 제안된 구현물을 기반으로 영상 전송을 수행하면, 사용자 시점 영역의 영상만 전송하여 불필요한 영상 전송을 하지않게 되어 화질 대비 낮은 대역폭의 향상된 영상을 표현할 수 있다.

기계학습 알고리즘 기반의 인공지능 장기 게임 개발 (Development of Artificial Intelligence Janggi Game based on Machine Learning Algorithm)

  • 장명규;김영호;민동엽;박기현;이승수;우종우
    • 한국IT서비스학회지
    • /
    • 제16권4호
    • /
    • pp.137-148
    • /
    • 2017
  • Researches on the Artificial Intelligence has been explosively activated in various fields since the advent of AlphaGo. Particularly, researchers on the application of multi-layer neural network such as deep learning, and various machine learning algorithms are being focused actively. In this paper, we described a development of an artificial intelligence Janggi game based on reinforcement learning algorithm and MCTS (Monte Carlo Tree Search) algorithm with accumulated game data. The previous artificial intelligence games are mostly developed based on mini-max algorithm, which depends only on the results of the tree search algorithms. They cannot use of the real data from the games experts, nor cannot enhance the performance by learning. In this paper, we suggest our approach to overcome those limitations as follows. First, we collects Janggi expert's game data, which can reflect abundant real game results. Second, we create a graph structure by using the game data, which can remove redundant movement. And third, we apply the reinforcement learning algorithm and MCTS algorithm to select the best next move. In addition, the learned graph is stored by object serialization method to provide continuity of the game. The experiment of this study is done with two different types as follows. First, our system is confronted with other AI based system that is currently being served on the internet. Second, our system confronted with some Janggi experts who have winning records of more than 50%. Experimental results show that the rate of our system is significantly higher.