OpenAI Gym 환경의 Mountain-Car에 대한 DQN 강화학습 (DQN Reinforcement Learning for Mountain-Car in OpenAI Gym Environment)

  • 강명주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.375-377
    • /
    • 2024
  • 본 논문에서는 OpenAI Gym 환경에서 프로그램으로 간단한 제어가 가능한 Mountain-Car-v0 게임에 대해 DQN(Deep Q-Networks) 강화학습을 진행하였다. 본 논문에서 적용한 DQN 네트워크는 입력층 1개, 은닉층 3개, 출력층 1개로 구성하였고, 입력층과 은닉층에서의 활성화함수는 ReLU를, 출력층에서는 Linear함수를 활성화함수로 적용하였다. 실험은 Mountain-Car-v0에 대해 DQN 강화학습을 진행했을 때 각 에피소드별로 획득한 보상 결과를 살펴보고, 보상구간에 포함된 횟수를 분석하였다. 실험결과 전체 100회의 에피소드 중 보상을 50 이상 획득한 에피소드가 85개로 나타났다.

19세기 청화백자에 표현된 문양을 활용한 자동차 시트 직물 패턴디자인 개발 (The Development of Textile Pattern Designs for Car Seats Using Patterns Expressed on Nineteenth-century Blue and White Porcelain)

  • 정진순
    • 한국의류산업학회지
    • /
    • 제24권4호
    • /
    • pp.372-385
    • /
    • 2022
  • In this study, the patterns expressed on nineteenth-century blue and white porcelain among Joseon white porcelain were selected as the material for the development of the car seat fabric design. It was intended to be applied to car seat design by incorporating Korea's own traditional patterns to fit modern sensibility. First, seven pieces of nineteenth-century blue and white porcelain were selected through the literature, and motifs were produced using adobe illustrator, a computer graphic program. Seven car seat fabric designs were developed according to the construction method and development method of the produced motif. Work 1 was designed to elicit a soft and feminine atmosphere using the peony pattern shown in Table 1-1. Work 2 aimed to express a luxurious atmosphere using the image of the mountain expressed in Table 1-2 as a design material. Works 3 was designed by freely arranging the letters of luck expressed in Table 1-3 to form a free and dynamic image. Work 4 was intended to express a stable and rhythmic atmosphere by horizontally arranging the images of the gently curved wings, tail, and rhythmical tail feathers of the phoenix expressed in Table 1-4. Work 5 was designed in a vertical arrangement using the patterns and silhouettes of the tiger's back expressed in Table 1-5. Work 6 was designed using the wave pattern expressed in Table 1-6 to replicate the rhythmic atmosphere. Work 7 was designed using the images of rocks, waves, and the sun in Table 1-7 to express a calm and antique atmosphere.

강화학습의 Q-learning을 위한 함수근사 방법 (A Function Approximation Method for Q-learning of Reinforcement Learning)

  • 이영아;정태충
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1431-1438
    • /
    • 2004
  • 강화학습(reinforcement learning)은 온라인으로 환경(environment)과 상호작용 하는 과정을 통하여 목표를 이루기 위한 전략을 학습한다. 강화학습의 기본적인 알고리즘인 Q-learning의 학습 속도를 가속하기 위해서, 거대한 상태공간 문제(curse of dimensionality)를 해결할 수 있고 강화학습의 특성에 적합한 함수 근사 방법이 필요하다. 본 논문에서는 이러한 문제점들을 개선하기 위해서, 온라인 퍼지 클러스터링(online fuzzy clustering)을 기반으로 한 Fuzzy Q-Map을 제안한다. Fuzzy Q-Map은 온라인 학습이 가능하고 환경의 불확실성을 표현할 수 있는 강화학습에 적합한 함수근사방법이다. Fuzzy Q-Map을 마운틴 카 문제에 적용하여 보았고, 학습 초기에 학습 속도가 가속됨을 보였다.

주유소 기반의 전기자동차 충전인프라 구축에 대한 취약지역 분석 (Analysis of Vulnerable Districts for Electronic Vehicle Charging Infrastructure based on Gas Stations)

  • 김태곤;김솔희;서교
    • 농촌계획
    • /
    • 제20권4호
    • /
    • pp.137-143
    • /
    • 2014
  • Car exhaust emissions are recognized as one of the key sources for climate change and electric vehicles have no emissions from tailpipe. However, the limited charging infrastructures could restrict the propagation of electric vehicles. The purpose of this study is to find the vulnerable districts limited to the charging station services after meeting the goal of Ministry of Knowledge Economy(12%). We assumed that the charging service can be provided by current gas stations. The range of the vulnerable grades was determined by the accessibility to current gas stations and the vulnerable regions were classified considering the optimal number of charging stations estimated by the efficiency function. We used 4,827 sub-municipal divisions and 11,677 gas station locations for this analysis. The results show that most of mountain areas are vulnerable and the fringe areas of large cities generally get a good grade for the charging infrastructure. The gangwon-do, jeollanam-do, gyeongsangbuk-do, and chungcheongnam-do include more than 40% vulnerable districts.

북한산 국립공원의 이용행태특성 및 등산패턴 (Vistors′ Activities and Hiking Patterns in Bukhan Moun-tain and National Park, Korea)

  • 이명우;김용식;권영선
    • 한국환경생태학회지
    • /
    • 제1권1호
    • /
    • pp.66-82
    • /
    • 1987
  • 북한산 국립공원의 이용자특성은 남자가 65.5%, 20대가 62.7%, 학생이 37.4%이었다. 방문특성으로 보면 자연지향적 동기가 67.1%를 보이지만 한편, 사계절 이용의 근린적 성격의 피크닉행태와 유원지적 위락행태가 동시에 나타나고 있다. 활동특성에서는 잘 알려진 산장, 야영장, 정상을 선호하고 있다. 경관 만족도는 최대를 10이라할 때 7.8로서 꽤 높은 편이나 등산로에서의 편익시설부족으로 전체 만족도는 6.32에 이르고 있다. 케이블카 설치에 대해서는 63.6%가 반대하여 자연경관훼손에 관한 문제의식이 심각한 것을 알 수 있다. 이용객은 정릉계곡이 가장 높아 최대일 통행객은 2만여명에 달하며, 등산객보다는 하산객 수가 많은 특성을 보이고 있다. 각 계곡의 피크는 봄과 가을에 나타나며 시간대로 보면 휴일 오전 10시-11와 오후 3시-5시사이었다. 따라서 북한산 국립공원은 자연공원적 성격으로의 하이킹형태와 근린적 성격의 피크닉, 도시적 성격의 유원지적 행태를 고려하여 기능적 상충성 해소를 위한 공간 분할관리가 필요하다.

Saudi Arabia 북서부의 지하수조사 (Groundwater Investigation in Northwestern Part of Saudi Arabia)

  • 한정상;정수웅
    • 물과 미래
    • /
    • 제8권2호
    • /
    • pp.30-40
    • /
    • 1975
  • Hydrogeological survey and geophysical prospecting have been carried out in Saudi Arabia for the purpose of finding groundwater in the soil and rock at the request of General trading company in Jeddah, Saudi Arabia. The surveyed area is located on $38^{\circ}-39^{\circ}$ 30' in longitude and $26^{\circ}-26^{\circ}$ 30' in latitude. The topography of this area is dominated by northwest southeast mountain range composed mostly of precambrian rocks and basalt of tertiary period. Geology is mainly composed of greenstone, granite, andesite, diorite rhyolite of pre-cambrian era and sandstone of cambrian period which are underlained by basalt and andesite of tertiary period and alluvium of quaternary unconformably. The instruments used in this investigation are TR-18B2 radioactivity unit which isjapanese patented and A.C. Terrameter, a resistivity meter manufactured by ABEM of Stockholm, Sweden. Radioactivity method has been conducted along the Alula-Khaybar road, totally 164Km by the car-borne. As a result of the above survey 16 places have been selected and these anomalies show 1.2N-1.6N compared to background of each area in intensity with width of 10-50m. Resistivity vertical profiling which made use of Schlumberger configuration method has been made over selected areas by radioactivity method to provide hydrogeological information for a water resources survey. The result of resistivity shows that good aquifers are located in the western part of surveyed area where sedimentary rock is distributed. The strata showing 10-50, ${\Omega}-m$ in resistivity are thought to be waterbearing layer. The variations in aquifer resistivity found, are thought to be due to verying clay content, which could be related to aquifer yield. It has proved impossible to detect small salinity variation in the buried aquifer by geophysics. As a result of resistivity prospecting 10 places are recommended to be drilled at the anomalies as shown attached map. yields from the proposed holes have been estimated approximately from $20m^3$ to $200m^3$ per day. Prior to drilling for groundwater, test boring using ${\c}4"$ should be drilled in order to obtain more reliable hydrogeological information for the construction of perfect wells.ells.

제주 '오름'의 지형경관 특성과 활용방안 (A Study on Characteristics of Geomorphic Landscape and Its Usage of 'Oreurn' on Jeju-Island)

  • 서주환;노재현;김상범
    • 한국조경학회지
    • /
    • 제35권4호
    • /
    • pp.57-70
    • /
    • 2007
  • As a basic element of Jeju landscape, Oreum offers a beautiful and aesthetic view. Considering topographical and geological research achievements, however, an effort to discover implicit value in terms of landscape characteristics and value has been ignored. This paper has investigated the characteristics and value of landscape by Oreum focusing on Jeju landscape characteristics and eco-touristic value and discussed a scheme to maximize the values. Under a theme of 'Sustainable Development' of the RIO Declaration, tour industry has recently changed its focus from eco-tourism to gee-tourism. Fortunately, Jeju Oreum has very distinctive and unique landscape with depressed crater at a crest. Nevertheless, it's very difficult to see a true aspect of Oreum from the street or over the car window. Therefore, it's urgent to begin a research on how to make advantage of and preserve Oreum landscape in order to maximize its landscape values and improve its potential as a tourist attraction. Through diverse programs such as sky leisure sports(ex: light airplane and helicopter riding, paragliding), sky watching, and mountain hiking, in particular, a possibility that Oreum can succeed as LBD(Learning by Doing)-based tour program with volcanic features needs to be examined. Besides, it's also a good idea to develop Oreum tour program or Oreum Museum as an alternative plan. Above all, however, it's most urgent to protect the existing Oreum and restore ecological and landscape beauty of Oreum through proper land use.

퍼지 클러스터링을 이용한 강화학습의 함수근사 (Function Approximation for Reinforcement Learning using Fuzzy Clustering)

  • 이영아;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.587-592
    • /
    • 2003
  • 강화학습을 적용하기에 적합한 많은 실세계의 제어 문제들은 연속적인 상태 또는 행동(continuous states or actions)을 갖는다. 연속 값을 갖는 문제인 경우, 상태공간의 크기가 거대해져서 모든 상태-행동 쌍을 학습하는데 메모리와 시간상의 문제가 있다. 이를 해결하기 위하여 학습된 유사한 상태로부터 새로운 상태에 대한 추측을 하는 함수 근사 방법이 필요하다. 본 논문에서는 1-step Q-learning의 함수 근사를 위하여 퍼지 클러스터링을 기초로 한 Fuzzy Q-Map을 제안한다. Fuzzy Q-Map은 데이터에 대한 각 클러스터의 소속도(membership degree)를 이용하여 유사한 상태들을 군집하고 행동을 선택하고 Q값을 참조했다. 또한 승자(winner)가 되는 퍼지 클러스터의 중심과 Q값은 소속도와 TD(Temporal Difference) 에러를 이용하여 갱신하였다. 본 논문에서 제안한 방법은 마운틴 카 문제에 적용한 결과, 빠른 수렴 결과를 보였다.

한국형 지역 위성 통신항법시스템의 위성 궤도설계에 관한 연구 (Orbit Design of a Korean Regional Communication & Navigation Satellite System)

  • 이상현;박병운;김도윤;기창돈;백복수;이기훈
    • 한국항공우주학회지
    • /
    • 제33권7호
    • /
    • pp.51-58
    • /
    • 2005
  • 군사용 목적으로 만들어진 GPS가 1990년대에 민간에 개방됨에 따라 차량 항법, 항공기, 통신, 과학, 농업, 탐사 등에 이르는 산업에 폭넓게 이용되고 있다. 하지만, GPS는 미국이 독점적으로 운영하고 있기 때문에 세계 각국은 안보문제에 우려를 나타내고 있는 실정이다. 또한 우리나라와 같이 산악 지형 및 도심이 발달한 지역은 GPS 단독 사용 시에 여러 가지 제약점을 가진다. 이러한 점들을 해결하기 위해 주위의 여러 나라들은 새로운 항법 체계를 구상 중에 있다. 이러한 국제적 추세에 대비하여 우리나라도 지역 항법 시스템 구축에 대해서 검토가 필요하다고 판단된다.본 논문에서는 우리나라 지역 특성을 고려하여 고앙각의 통신서비스를 제공하며, 독자적 항법 능력을 가진 지역 위성 항법시스템의 위성 궤도를 여러 가지 고려사항을 구속조건으로 하여 설계하였다. 최종 설계된 위성항법시스템의 독자 항법 성능뿐만 아니라 부가적으로 GPS를 보강하는 성능도 우수함을 확인하였다.

강화학습의 학습 가속을 위한 함수 근사 방법 (Function Approximation for accelerating learning speed in Reinforcement Learning)

  • 이영아;정태충
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.635-642
    • /
    • 2003
  • 강화학습은 제어, 스케쥴링 등 많은 응용분야에서 성공적인 학습 결과를 얻었다. 기본적인 강화학습 알고리즘인 Q-Learning, TD(λ), SARSA 등의 학습 속도의 개선과 기억장소 등의 문제를 해결하기 위해서 여러 함수 근사방법(function approximation methods)이 연구되었다. 대부분의 함수 근사 방법들은 가정을 통하여 강화학습의 일부 특성을 제거하고 사전지식과 사전처리가 필요하다. 예로 Fuzzy Q-Learning은 퍼지 변수를 정의하기 위한 사전 처리가 필요하고, 국소 최소 자승법은 훈련 예제집합을 이용한다. 본 논문에서는 온-라인 퍼지 클러스터링을 이용한 함수 근사 방법인 Fuzzy Q-Map을 제안하다. Fuzzy Q-Map은 사전 지식이 최소한으로 주어진 환경에서, 온라인으로 주어지는 상태를 거리에 따른 소속도(membership degree)를 이용하여 분류하고 행동을 예측한다. Fuzzy Q-Map과 다른 함수 근사 방법인 CMAC와 LWR을 마운틴 카 문제에 적용하여 실험 한 결과 Fuzzy Q-Map은 훈련예제를 사용하지 않는 CMAC보다는 빠르게 최고 예측율에 도달하였고, 훈련 예제를 사용한 LWR보다는 낮은 예측율을 보였다.