• 제목/요약/키워드: Gan 알고리즘

검색결과 62건 처리시간 0.026초

Generative optical flow based abnormal object detection method using a spatio-temporal translation network

  • Lim, Hyunseok;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.11-19
    • /
    • 2021
  • 이상 객체란 일반적이고 평범한 행동을 취하는 객체가 아닌 비정상적이고 흔하지 않은 행동을 하여 관찰이나 감시·감독을 필요로 하는 사람, 물체, 기계 장치 등을 뜻한다. 이를 사람의 지속적인 개입 없이 인공지능 알고리즘을 통해 탐지하기 위해서 광학 흐름 기법을 활용한 시간적 특징의 특이도를 관찰하는 방법이 많이 활용되고 있으며, 이 기법은 정해진 표현 범위가 없는 수많은 이상 행동을 식별하기에 적합하다. 본 연구에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)으로 입력 영상 프레임을 광학 흐름 영상으로 변환하는 알고리즘을 학습시켜 비정상적인 상황을 식별한다. 특히 생성적 적대 신경망 모델이 입력 영상에 대한 중요한 특징 정보를 학습하고, 그 외 불필요한 이상치를 제외시키기 위한 전처리 과정과 학습 후 테스트 데이터셋에서 식별 정확도를 높이기 위한 후처리 과정을 고도화하여 전체적인 모델의 이상 행동 식별 성능을 향상시키는 기법을 제안한다. 이상 행동을 탐지하기 위한 학습 데이터셋으로 UCSD Pedestrian, UMN Unusual Crowd Activity를 활용하였으며, UCSD Ped2 데이터셋에서 프레임 레벨 AUC 0.9450, EER 0.1317의 수치를 보이며 이전 연구에서 도출된 성능 지표 대비 성능 향상이 확인되었다.

AI 영화영상콘텐츠를 위한 AI 예술창작 사례연구 (AI Art Creation Case Study for AI Film & Video Content)

  • 전병원
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.85-95
    • /
    • 2021
  • 현재 우리는 창작도구로서 컴퓨터와 창작자로서 컴퓨터 사이에 서 있다. 또한 포스트 시네마적 상황이라 할 수 있는 새로운 장르의 영화들이 등장하고 있다. 본 논문은 AI 시네마의 출현 가능성을 진단하고자 한다. AI 시네마의 가능성을 확인하고자 영화 창작의 필요조건이라 할 수 있는 스토리, 서사의 창작, 이미지의 창작, 사운드의 창작이 인공지능에 의해 가능한지 사례조사를 통해 살펴보았다. 먼저 AI 페인팅 알고리즘인 Obvious, GAN 및 CAN의 시각이미지 생성을 확인했다. 둘째, AI 사운드, 음악은 이미 인간과 협력하여 유통 단계에 들어섰다. 셋째, AI는 이미 드라마 대본을 완성 할 수 있고, 빅 데이터를 활용한 자동 시나리오 제작 프로그램도 인기를 얻고 있다. 즉, 우리는 필수적인 영화 제작 요구 사항이 AI 알고리즘으로 충족될 수 있음을 확인할 수 있다. 마노 비치의 'AI 장르 컨벤션' 관점에서 웹 다큐멘터리와 데스크톱 다큐멘터리는 포스트 시네마로서 AI 시네마의 대표적인 장르라고 할 수 있다. AI, 웹 다큐멘터리, 데스크톱 다큐멘터리가 존재하고 있는 환경이 동일하기 때문이다. 본 논문은 포스트시네마의 창작자로서 AI에 대한 연구를 통해 4차 산업혁명시대 영화라는 매체가 개척해야 할 새로운 길을 제시하고 있다.

데이터 증강을 위한 순환 생성적 적대 신경망 기반의 아스팔트와 콘크리트 균열 영상 간의 변환 기법 (CycleGAN Based Translation Method between Asphalt and Concrete Crack Images for Data Augmentation)

  • 심승보
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.171-182
    • /
    • 2022
  • 구조물을 안전하게 관리하기 위해서는 우선적으로 건전한 유지가 전제되어야 한다. 이 같은 구조물의 건전성을 결정하는 요인 중에서 가장 대표적인 예로는 균열을 들 수 있다. 여러 가지 원인에 의해 발생하는 균열은 다양한 종류와 형태로 구조물에 손상을 입힌다. 무엇보다 이러한 균열이 방치될 경우 위험도가 증가하여 안전사고로 이어질 수 있다. 이러한 문제점을 경감하기 위하여 최근 들어 딥러닝과 컴퓨터 비전 기술을 활용하여 손상을 점검하는 방법들이 소개되고 있다. 이 같은 방법들은 대체로 충분한 양의 학습 데이터가 필요한 것이 사실이다. 하지만, 학습을 위한 영상 데이터의 충분한 확보가 어렵다는 점은 딥러닝 균열 탐지 알고리즘의 성능에 부정적인 영향을 미친다. 따라서 본 논문에서는 이에 대한 문제의식을 바탕으로 영상 변환 기법을 활용하여 균열 영상 데이터를 증강하는 방법을 제시했다. 이는 아스팔트 균열 영상을 콘크리트 균열 영상으로 변환하거나 혹은 이와 반대로 콘크리트 균열 영상을 아스팔트 균열 영상으로 변환하여 딥러닝 신경망 모델을 학습하기 위한 영상 데이터를 확보하는 방법이다. 이를 통해 학습 데이터의 다양성을 향상시켜 강건한 균열 탐지 알고리즘 개발에 기여할 수 있기를 기대한다.

원격탐사 및 머신러닝 기반 초고해상도 총일차생산량 산정 (Advancing gross primary productivity estimation to super high-resolution through remote sensing and machine learning)

  • 성지미;백종진;김현준;전창현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.203-203
    • /
    • 2023
  • 총일차생산량(GPP, Gross Primary Productivity)은 생태계의 유기물 생산량을 나타내는 지표로써 생태계 생산성과 안정성을 파악할 수 있는 중요한 지표로 알려져 있다. GPP를 산출하는 대표적인 방법에는 다중 센서를 탑재한 원격 탐사 자료를 활용하는 방법과 플럭스타워를 통해 관측한 에디공분산을 분석하는 방법이 있다. 본 연구에서는 Landsat과 MODIS와 같이 시공간 해상도가 다른 원격 탐사 자료들을 기반으로 초고해상도 GPP 자료를 산출하기 위한 공간자료 융합 연구를 수행하였다. 이를 위해 GAN(Generative Adversarial Networks)과 같은 머신러닝 알고리즘을 활용하였으며 최종적으로 산정된 GPP 정보는 설마천과 청미천 등에 설치된 플럭스타워로부터 획득한 자료와의 비교·검증을 통해 평가되었다. 본 연구의 성과는 향후 증발산 자료, 생태계 호흡량 자료 등과의 조합을 통해 얻을 수 있는 물이용효율(WUE, Water Use Efficiency), 탄소이용효율(CUE, Carbon Uptake Efficiency)과 같은 지표 산정 시 적극 활용될 수 있을 것으로 기대된다.

  • PDF

딥러닝 기반 가창 음성합성(Singing Voice Synthesis) 모델링 (Deep Learning based Singing Voice Synthesis Modeling)

  • 김민애;김소민;박지현;허가빈;최윤정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.127-130
    • /
    • 2022
  • 본 논문은 생성자 손실함수를 이용한 가창 음성합성 모델링에 대한 연구로서 기존 이미지 생성에 최적화된 딥러닝 알고리즘 중 BEGAN모델을 오디오 생성모델(SVS모델)에 적용시킬 때 발생할 수 있는 여러 요인에 대해 분석하고 최적의 품질을 도출하기 위한 실험을 수행하였다. 특히 BEGAN 기반 모델에서 제안된 L1 loss가 어느 시점에서 감마(𝛾)파라미터의 역할을 상실하게 한다는 점을 개선하고자 알파(𝛼)파라미터를 추가한 후 각 파라미터 값들의 구간별 실험을 통해 최적의 값을 찾아냄으로써 가창합성 생성물의 품질향상에 기여할 수 있음을 확인하였다.

  • PDF

단일 영상에서 눈송이 제거를 위한 지각적 GAN (Perceptual Generative Adversarial Network for Single Image De-Snowing)

  • ;이효종
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.403-410
    • /
    • 2019
  • 눈이 내리는 영상에서 눈송이들에 의하여 영상의 질이 저하되고 영상 내에 존재하는 객체들을 명확히 탐지하기 위해서는 눈송이를 제거해야할 필요성이 있다. 이 연구에서는 지각 Generative Adversarial Network에 기반하여 단일 영상으로부터 눈송이를 제거하는 방법을 제시한다. 잔류 U-Net을 눈송이가 제거된 영상을 생성하는 생성기로 설계하였다. 다양한 크기의 눈송이를 처리하기 위하여 다양한 필터 커널의 인셉션 모듈을 설계하고 입력한 눈이 내리는 영상의 다양한 해상도 특징을 추출하기 위하여 적용되었다. 눈송이 제거 영상의 품질을 높이기 위해서 대립손실을 제외하고는, 지각적 손실과 총 변동 손실 함수를 적용하여 제설 이미지와의 유사도를 찾아갈 수 있도록 하였다. 합성 강설 이미지와 실제 강설 이미지를 대상으로 제안 네크워크의 제설 기능을 실험하였다. 실험 결과 제안 알고리즘은 합성 이미지와 강설 이미지 모든 분야에서 육안으로 관찰해본 결과 화질이 우수함을 보여주었고, 객관적 평가를 위하여 신호강도를 나타내는 PSNR과 구조변화를 측정하는 SSIM 인덱스를 비교하였으며, 제안 알고리즘이 지수 상으로도 가장 우수한 성능을 보여주었다.

머신러닝을 사용한 탄성파 자료 보간법 기술 연구 동향 분석 (Research Trend analysis for Seismic Data Interpolation Methods using Machine Learning)

  • 배우람;권예지;하완수
    • 지구물리와물리탐사
    • /
    • 제23권3호
    • /
    • pp.192-207
    • /
    • 2020
  • 탄성파 탐사를 수행할 때 경제적, 환경적 제약 또는 탐사 장비의 문제 등에 의해 탄성파 자료의 일부가 규칙적 또는 불규칙적으로 손실되는 경우가 발생하게 된다. 이러한 자료 손실은 탄성파 자료 처리와 해석 결과에 부정적인 영향을 주기 때문에 사라진 탄성파 자료를 복원할 필요가 있다. 탄성파 자료 복원을 위해 재탐사 또는 추가적인 탐사를 진행하는 경우 시간적, 경제적 비용이 발생하기 때문에, 많은 연구자들이 사라진 탄성파 자료를 정확히 복원하기 위한 보간 기법 연구를 진행해왔다. 최근에는 머신러닝 기술 발달에 따라 머신러닝 기법을 활용한 연구들이 진행되고 있고, 다양한 머신러닝 기술들 중에서도 서포트 벡터 회귀, 오토인코더, 유넷, 잔차넷, 생성적 적대 신경망 등의 알고리즘을 활용한 탄성파 자료의 보간 연구가 활발하게 진행되고 있다. 이 논문에서는 이러한 연구들을 조사하고 분석하여 복잡한 신경망 모델뿐 아니라 상대적으로 구조가 간단한 서포트 벡터 회귀 모델을 통해서도 뛰어난 보간 결과를 얻을 수 있다는 것을 확인했다. 추후 머신러닝 기법들을 사용하는 탄성파 자료 보간 연구들에서 오픈소스로 공개된 실제 자료를 이용하며 데이터 증식, 전이학습, 기존 기법을 이용한 규제 등의 기술을 활용하면 탄성파 자료 보간 성능을 향상시킬 수 있을 것으로 기대된다.

이미지를 사용한 가상의상착용 알고리즘들의 성능 분석 (Performance Evaluation of VTON (Virtual-Try-On) Algorithms using a Pair of Cloth and Human Image)

  • 따이 트안 투안;미나르 마드올 라흐만;안희준
    • 한국산업정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.25-34
    • /
    • 2019
  • 가상착용기술(VTON: Virtual try-on)은 의상의 온라인 유통을 활성화를 위하여 중요한 기술이다. 그러나 3차원 그래픽스기반 방식은 의상과 인체의 3차원 정보의 확보가 필요하여 범용화에 어려움이 있고, 이러한 제약을 해소하기 위해 개발되는 이미지 기반 방식들의 연구들은 그 기술적 한계가 불명확하다. 구체적으로 VITON (Virtual image try-on) 과 CP-VTON (Content preserving VTON)등은 가능성 위주의 매우 단편적인 결과만을 제시하고 있다. 본 논문은 이미지기반 기술의 상용화의 한계를 파악하기 위해, 세 가지 대표적 방식(SCMM 기반의 비-딥러닝 방식, 딥러닝기반 VITON 과 CP-VTON에 대하여 인물의 자세 및 체형, 의상의 가려짐 정도, 의상의 특성 등에 따라 분석을 하였다. 객관적인 평가를 위하여 변형단계와 합성단계의 성능을 각각 IoU와 SSIM로 평가하였고, 상대적인 비교 분석을 하였다. 그 결과, CP-VTON이 가장 좋은 성능을 보이지만, 자세와 의상의 복잡도에 따라 성능의 한계가 크게 차이가 남을 보였다. 그 주 원인은 2차 기하변형의 한계와 GAN을 통한 합성 기술의 한계로 파악되었다.

향상된 음향 신호 기반의 음향 이벤트 분류 (Enhanced Sound Signal Based Sound-Event Classification)

  • 최용주;이종욱;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권5호
    • /
    • pp.193-204
    • /
    • 2019
  • 센서 기술과 컴퓨팅 성능의 향상으로 인한 데이터의 폭증은 산업 현장의 상황을 분석하기 위한 토대가 되었으며, 이와 같은 데이터를 기반으로 현장에서 발생하는 다양한 이벤트를 탐지 및 분류하려는 시도들이 최근 증가하고 있다. 특히 음향 센서는 상대적으로 저가의 가격으로 현장 정보를 왜곡 없이 음향 신호를 수집할 수 있다는 큰 장점을 기반으로 다양한 분야에 설치되고 있다. 그러나 소리 취득 시 발생하는 잡음을 효과적으로 제어하지 못한다면 산업 현장의 이벤트를 안정적으로 분류할 수 없으며, 분류하지 못한 이벤트가 이상 상황이라면 이로 인한 피해는 막대해질 수 있다. 본 연구에서는 잡음 상황에서도 강인한 시스템을 보장하기 위하여, 딥러닝 알고리즘을 기반으로 잡음의 영향을 개선 시킨 음향 신호를 생성한 후, 해당 음향 이벤트를 분류할 수 있는 시스템을 제안한다. 특히, GAN을 기반으로 VAE 기술을 적용한 SEGAN을 활용하여 아날로그 음향 신호 자체에서 잡음이 제거된 신호를 생성하였으며, 향상된 음향 신호를 데이터 변환과정 없이 CNN 구조의 입력 데이터로 활용한 후 음향 이벤트에 대한 식별까지도 가능하도록 end-to-end 기반의 음향 이벤트 분류 시스템을 설계하였다. 산업 현장에서 취득한 음향 데이터를 활용하여 제안하는 시스템의 성능을 실험적으로 검증한바, 99.29%(철도산업)와 97.80%(축산업)의 안정적인 분류 성능을 확인하였다.

데이터 증강 기반 효율적인 무선 신호 분류 연구 (An Efficient Wireless Signal Classification Based on Data Augmentation)

  • 임상순
    • Journal of Platform Technology
    • /
    • 제10권4호
    • /
    • pp.47-55
    • /
    • 2022
  • 사물인터넷 환경에서는 다양한 무선 통신 기술을 사용하는 기기들이 점점 증가하고 있다. 특히, 다양한 무선 신호 변조 유형을 정확하게 식별하기 위해 효율적인 특성 추출 기법을 설계하고 무선 신호의 종류를 분류하는 것이 필수적이다. 하지만, 실제 환경에서 레이블이 지정된 무선 신호 데이터를 수집하는 것은 쉬운 문제가 아니다. 최근 무선 신호 분류를 위해 딥러닝 기반의 다양한 학습 기법들이 제안되어졌다. 딥러닝의 경우 훈련 데이터셋이 적을 경우 과대적합에 빠질 가능성이 높으며, 이는 딥러닝 모델을 활용한 무선 신호 분류 기법의 성능 저하를 유발한다. 본 연구에서는 다양한 무선 신호들이 존재할 때 분류 성능을 높이기 위해 생성적 적대 신경망 기반 데이터 증대 기법을 제안한다. 분류해야 하는 무선 신호의 종류가 다양할 때 특정 무선 신호를 나타내는 데이터의 양이 적거나 균형이 맞지 않는 경우 제안한 기법을 활용하여 필요한 무선 신호와 관련된 데이터의 양을 증가시킨다. 제안한 데이터 증강 알고리즘의 유효성을 검증하기 위해 무선 신호의 데이터양을 증가시키고 균형을 맞춘 결과를 바탕으로 CNN 및 LSTM 기반 무선 신호 분류기를 구현하여 실험해본 결과 데이터 균형을 맞추지 않았을 때보다 분류 정확도가 높아지는 것을 확인하였다.