• Title/Summary/Keyword: 보상함수

검색결과 297건 처리시간 0.035초

하이브리드 레벨 셋을 이용한 이미지 분할 (Image segmentation Using Hybrid Level Set)

  • 주기세;김은석
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1453-1463
    • /
    • 2004
  • 기존의 레벨셋을 이용한 이미지 분할 방법은 화소값의 기울기를 이용하기 때문에 지역적 형태에 좌우되는 문제점을 지니고 있다. 본 논문에서는 평활한 구동력을 위하여 레벨 셋 함수와 새로운 보상 평활화 함수를 결합시키는 하이브리드 방법을 이용한 방법이 소개된다. 대부분의 경우에 3 교점을 가지고 있지 않다는 가정하에 보상함수를 얻는 방법을 대안으로 고려하였다. 보상함수의 주요 역할은 원보상 함수와 평균 보상함수의 차가 새로운 레벨셋 함수의 합리적인 구동력으로 소개될 수 있다. 본 논문에서 제안한 하이브리드 방법은 기존 레벨셋을 이용한 방법의 단점을 최소화시키는 방법이다.

종방향 주행성능향상을 위한 Latent SAC 강화학습 보상함수 설계 (On the Reward Function of Latent SAC Reinforcement Learning to Improve Longitudinal Driving Performance)

  • 조성빈;정한유
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.728-734
    • /
    • 2021
  • 최근 심층강화학습을 활용한 종단간 자율주행에 대한 관심이 크게 증가하고 있다. 본 논문에서는 차량의 종방향 주행 성능을 개선하는 잠재 SAC 기반 심층강화학습의 보상함수를 제시한다. 기존 강화학습 보상함수는 주행 안전성과 효율성이 크게 저하되는 반면 제시하는 보상함수는 전방 차량과의 충돌위험을 회피하면서 적절한 차간거리를 유지할 수 있음을 보인다.

Triple-state 보상 함수를 기반으로 한 개선된 DSA 기법 (An Improved DSA Strategy based on Triple-States Reward Function)

  • 타사미아;구준롱;장성진;김재명
    • 대한전자공학회논문지TC
    • /
    • 제47권11호
    • /
    • pp.59-68
    • /
    • 2010
  • 본 논문은 보상함수 수정을 통해 보다 완벽한 DSA(Dynamic Spectrum Access)를 수행하는 새로운 방법을 제시하였다. POMDP(Partially Observable Markov Decision Process)는 미래의 스펙트럼 상태를 예측하는데 사용되는 알고리즘으로서, 그 중 보상함수는 스펙트럼을 예측하는데 있어 가장 중요한 부분이다. 그러나 보상함수는 Busy 및 Idle의 두 가지 상태만 갖고 있기 때문에 채널에서 충돌이 발생하게 되면 보상함수는 Busy를 반환함으로써 2차 사용자의 성능을 감소시키게 된다. 따라서 본 논문에서는 기존의 Busy를 Busy 및 Collision 의 두 상태로 구분하였고, 이렇게 추가된 Collision 상태를 통해 2차 사용자의 채널 접근 기회를 보다 향상시킴으로서 데이터 전송율을 증대시킬 수 있도록 하였다. 또한 본 논문은 새로운 알고리즘의 신뢰도 벡터를 수학적으로 분석하였다. 마지막으로 시뮬레이션 결과를 통해 개선된 보상함수의 성능을 검증하고, 이를 통해 새로운 알고리즘이 CR 네트워크에서 2차 사용자의 성능을 향상시킬 수 있음을 보인다.

귀의 특성을 고려한 스피커의 선형 왜곡보상 시스템의 설계 및 구현에 관한 연구 (Speaker Linear Distortion Canceller Considering Properties of Human Ear)

  • 이원우;허정권;김진영;성굉모
    • 한국음향학회지
    • /
    • 제12권5호
    • /
    • pp.38-46
    • /
    • 1993
  • 스피커는 입력이 전기신호이고 출력이 소리인 전기 음향 장치로서, 고유의 전달함수를 갖는 하나의 시스템으로 생각할 수 있다. 일한 스피커 시스템의 전달함수는 여러 가지 원인으로 인해 주파수 영역에서 평탄한 특성을 가지지 못하며 선형위상의 조건을 만족시키기가 힘들다. 음색을 변화시키는 스피커의 전달함수를 선형이라고 가정할 때 스피커의 앞단에서 스피커의 선형 전달함수의 역에 해당하는 선형 필터를 추가함으로쏘, 음색의 왜곡은 보정할 수 있다. 본 연구에서는 이러한 스피커의 선형왜곡을 보상하기 위한 선형필터로서 FIR 필터를 사용하였으나, 2장에 제시되어 있는 기존의 알고리듬과는달리 귀의 청감특성을 이용하여 가청주파수 대역에 대해 몇 개의 대역으로 나눈 후, 각 대역마다 보상 할 주파수 해상도를 달리하는 새로운 알고리듬에 대해 기술하였다. 이러한 다해상도 선형왜곡 보상시스템은 각 대역마다 다른 해상도로 보상한다는점에서는 필터뱅크 보상 시스템과 유사하지만, 대역통과필터가 아닌 저역통과필터만을 이용하여 설계의 복잡서응ㄹ 줄였으며 각 대역마다 독립적으로 보상하는 필터뱅크 보상시스템과는 달리 1차 대역에서 보상하지 ath한 오차를 2차, 3차에서 보상하는 새로운 기법을 이용하였다. 본 알고리듬을 적용한 모의실험을 통하여 성능을 평가한 결과 가청음대역에서 ±6dB의 왜곡을 보인 스피커가 실효 tap수를 272로 했을 때 ±0.5dB의 리플을 보이는 양호한 결과를 얻었다.

  • PDF

직-병렬 능동전력필터 시스템에 의한 전력품질 개선과 제어 개념 (Unified Active Power Filter System and control Concept for Improving Power Quality)

  • 김성호;김영석;김성환
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 추계학술대회 논문집 전기기기 및 에너지변환시스템부문
    • /
    • pp.239-243
    • /
    • 2003
  • 본 논문에서는 고조파 보상과 역율 보상을 실시하고, 사고 둥에 의한 전원 전압강하 시 전압 보상을 실시하여 전력 품질을 향상 시린 수 있는 성능함수이론에 근거한 알고리즘을 제안하였다. 고조파와 역율에 대해 각각 보상 작용하도록 직렬형 전력능동 필터에서는 고조파에 대한 보상 전압만을 발생, 제어하고, 병렬형 전력능동 필터에서는 역율에 대한 보상 전류만을 발생, 제어한다. 또한, 전압 강하에 대한 보상은 직렬형 전력능동필터에서 실시하며, 각 능동필터의 보상치는 성능함수이론을 근거로 하여 추출해낸다. 제안된 성능함수 알고리즘을 정의하고 알고리즘을 적용시키기 위한 직렬형 능동필터와 병렬형 능동필터가 통합된 3상3선식 시스템을 제안하고, 3kVA의 시스템을 제작하여 실험을 실시하였다. 제시된 실험 결과들은 알고리즘의 타당성과 유효성을 검증한다.

  • PDF

OpenAI Gym 환경에서 강화학습의 활성화함수 비교 분석 (Comparison of Activation Functions of Reinforcement Learning in OpenAI Gym Environments)

  • 강명주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.25-26
    • /
    • 2023
  • 본 논문에서는 OpenAI Gym 환경에서 제공하는 CartPole-v1에 대해 강화학습을 통해 에이전트를 학습시키고, 학습에 적용되는 활성화함수의 성능을 비교분석하였다. 본 논문에서 적용한 활성화함수는 Sigmoid, ReLU, ReakyReLU 그리고 softplus 함수이며, 각 활성화함수를 DQN(Deep Q-Networks) 강화학습에 적용했을 때 보상 값을 비교하였다. 실험결과 ReLU 활성화함수를 적용하였을 때의 보상이 가장 높은 것을 알 수 있었다.

  • PDF

전력품질 개선을 위한 직-병렬 능등전력필터 시스템과 제어개념 (Unified Active Power Filter and control Concept for Improving Power Quality)

  • 김성호;김영석;신재화
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 춘계학술대회 논문집 전기기기 및 에너지변환시스템부문
    • /
    • pp.285-288
    • /
    • 2003
  • 본 논문에서는 고조파 보상과 역율 보상을 실시하여 전력품질을 개선하기 위해 성능함수를 이용한 알고리즘을 제안하였다. 고조파와 역율에 대해 각각 보상 작용하도록 직렬형 전력능동 필터에서는 고조파에 대한 보상 전압만을 발생, 제어하고, 병렬형 전력능동 필터에서는 역율에 대한 보상 전류만을 발생, 제어한다. 각 능동필터의 보상치는 성능함수 이론을 근거로 하여 추출해낸다. 제안된 성능함수 알고리즘을 정의하고 알고리즘을 적용시키기 위한 직렬형 능동필터와 병렬형 능동필터가 통합된 3상3선식 시스템을 제안하여 시뮬레이션을 실시하였다. 시뮬레이션 결과는 제안된 알고리즘의 타당성과 유효성을 검증한다.

  • PDF

고속도로 자율주행 시 보상을 최대화하기 위한 강화 학습 활성화 함수 비교 (Comparison of Reinforcement Learning Activation Functions to Maximize Rewards in Autonomous Highway Driving)

  • 이동철
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.63-68
    • /
    • 2022
  • 자율주행 기술은 최근 심층 강화학습의 도입으로 큰 발전을 이루고 있다. 심층 강화 학습을 효과적으로 사용하기 위해서는 적절한 활성화 함수를 선택하는 것이 중요하다. 그 동안 많은 활성화 함수가 제시되었으나 적용할 환경에 따라 다른 성능을 보여주었다. 본 논문은 고속도로에서 자율주행을 학습하기 위해 강화 학습을 사용할 때 어떤 활성화 함수를 사용하는 것이 효과적인지 12개의 활성화 함수 성능을 비교 평가한다. 이를 위한 성능 평가 방법을 제시하였고 각 활성화 함수의 평균 보상 값을 비교하였다. 그 결과 GELU를 사용할 경우 가장 높은 평균 보상을 얻을 수 있었으며 SiLU는 가장 낮은 성능을 보여주었다. 두 활성화 함수의 평균 보상 차이는 20%였다.

OpenAI Gym 환경의 Acrobot에 대한 DQN 강화학습 (DQN Reinforcement Learning for Acrobot in OpenAI Gym Environment)

  • 강명주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.35-36
    • /
    • 2023
  • 본 논문에서는 OpenAI Gym 환경에서 제공하는 Acrobot-v1에 대해 DQN(Deep Q-Networks) 강화학습으로 학습시키고, 이 때 적용되는 활성화함수의 성능을 비교분석하였다. DQN 강화학습에 적용한 활성화함수는 ReLU, ReakyReLU, ELU, SELU 그리고 softplus 함수이다. 실험 결과 평균적으로 Leaky_ReLU 활성화함수를 적용했을 때의 보상 값이 높았고, 최대 보상 값은 SELU 활성화 함수를 적용할 때로 나타났다.

  • PDF

임베디드 시스템에서의 양자화 기계학습을 위한 양자화 오차보상에 관한 연구 (Study on Quantized Learning for Machine Learning Equation in an Embedded System)

  • 석진욱;김정시
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.110-113
    • /
    • 2019
  • 본 논문에서는 임베디드 시스템에서의 양자화 기계학습을 수행할 경우 발생하는 양자화 오차를 효과적으로 보상하기 위한 방법론을 제안한다. 경사 도함수(Gradient)를 사용하는 기계학습이나 비선형 신호처리 알고리즘에서 양자화 오차는 경사 도함수의 조기 소산(Early Vanishing Gradient)을 야기하여 전체적인 알고리즘의 성능 하락을 가져온다. 이를 보상하기 위하여 경사 도함수의 최대 성분에 대하여 직교하는 방향의 보상 탐색 벡터를 유도하여 양자화 오차로 인한 성능 하락을 보상하도록 한다. 또한, 기존의 고정 학습률 대신, 내부 순환(Inner Loop) 없는 비선형 최적화 알고리즘에 기반한 적응형 학습률 결정 알고리즘을 제안한다. 실험결과 제안한 방식의 알고리즘을 비선형 최적화 문제에 적용할 시 양자화 오차로 인한 성능 하락을 최소화시킬 수 있음을 확인하였다.

  • PDF