• 제목/요약/키워드: 인공지능 기반 이미지 생성

검색결과 79건 처리시간 0.027초

심층 강화학습을 이용한 모바일 로봇의 맵 기반 장애물 회피 알고리즘 (Map-Based Obstacle Avoidance Algorithm for Mobile Robot Using Deep Reinforcement Learning)

  • 선우영민;이원창
    • 전기전자학회논문지
    • /
    • 제25권2호
    • /
    • pp.337-343
    • /
    • 2021
  • 심층 강화학습은 학습자가 가공되지 않은 고차원의 입력 데이터를 기반으로 최적의 행동을 선택할 수 있게 하는 인공지능 알고리즘이며, 이를 이용하여 장애물들이 존재하는 환경에서 모바일 로봇의 최적 이동 경로를 생성하는 연구가 많이 진행되었다. 본 논문에서는 복잡한 주변 환경의 이미지로부터 모바일 로봇의 이동 경로를 생성하기 위하여 우선 순위 경험 재사용(Prioritized Experience Replay)을 사용하는 Dueling Double DQN(D3QN) 알고리즘을 선택하였다. 가상의 환경은 로봇 시뮬레이터인 Webots를 사용하여 구현하였고, 시뮬레이션을 통해 모바일 로봇이 실시간으로 장애물의 위치를 파악하고 회피하여 목표 지점에 도달하는 것을 확인하였다.

CNN을 이용한 심리 상담 서비스에 관한 연구 (Phychological Counseling Service using CNN (Convolutional Neural Network))

  • 김정욱;강병헌;김민규;유승한
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.834-837
    • /
    • 2020
  • CNN(Convolution Neural Network)은 합성곱(Convolution)을 이용해서 시각적 이미지를 분석하는데 사용되는 인공지능 기술이다. 본 논문에서는 CNN을 이용한 실시간 심리 상담 서비스에 대해 논한다. 상담 서비스에 심리학과 CNN을 접목시킴으로써 내담자의 사진을 심리학적 비언어 행동을 기반으로 분석하여 내담자의 예상 심리를 파악하고, 유의미한 상담 자료를 생성해 상담의 질을 향상시킬 수 있도록 한다.

객체 탐지 성능 향상을 위한 생성형 인공지능 기반 데이터 증강 기법 연구 (A Study on Generative Artificial Intelligence-Based Data Augmentation Techniques for Enhancing Object Detection Performance)

  • 김도희;김명호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.51-54
    • /
    • 2023
  • 최근 딥러닝 기술의 발달로 물체 탐지를 위한 객체 인식 분야가 기계학습을 접목한 연구가 급격히 증가하고 있다. 하지만, 탐지하려는 물체가 다른 객체에 가려진 경우와 같이 특수한 상황에 대한 데이터의 수량이 부족하여 성능 저하를 야기한다는 점과, 객체 탐지 수행 과정에서 작은 객체의 탐지가 어렵다는 한계점이 있다. 본 연구는 전술한 문제점을 보완할 방법을 제안한다. 데이터 증강 기법을 이용하여 클래스가 부족한 데이터의 양을 늘려 학습 데이터를 증강시켰다. 한편, SRGAN을 사용하여 작은 객체를 확대시킨 뒤 이미지를 합성시켜 데이터를 구성하였다. 제안된 방법은 PyTorch 환경에서 YOLOv5를 수행한 결과, 객체 탐지 성능이 향상되는 것을 확인할 수 있었다.

  • PDF

XAI 를 활용한 설명 가능한 요가 자세 이미지 분류 모델 (Yoga Poses Image Classification and Interpretation Using Explainable AI (XAI))

  • 박유림;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.590-591
    • /
    • 2023
  • 최근 사람들의 건강에 대한 관심이 많아지고 다양한 운동 컨텐츠가 확산되면서 실내에서 운동을 할 수 있는 기회가 많아졌다. 하지만, 전문가의 도움없이 정확하지 않은 동작을 수행하다 큰 부상을 입을 위험성이 높다. 본 연구는 CNN 기반 요가 자세 분류 모델을 생성하고 설명가능 인공지능 기술을 적용하여 예측 결과에 대한 해석을 제시한다. 사용자에게 설명성과 신뢰성 있는 모델을 제공하여 자신에게 맞게 올바른 자세를 결정할 수 있고, 무리한 동작으로 부상을 입을 확률 또한 낮출 수 있을 것으로 보인다.

손을 다루는 컴퓨터 비전 작업들을 위한 멀티 모달 합성 데이터 생성 방법 (Generating A Synthetic Multimodal Dataset for Vision Tasks Involving Hands)

  • 이창화;이선경;김동욱;정찬양;백승렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1052-1055
    • /
    • 2020
  • 본 논문에서는 3D 메시 정보, RGB-D 손 자세 및 2D/3D 손/세그먼트 마스크를 포함하여 인간의 손과 관련된 다양한 컴퓨터 비전 작업에 사용할 수 있는 새로운 다중 모달 합성 벤치마크를 제안 하였다. 생성된 데이터셋은 기존의 대규모 데이터셋인 BigHand2.2M 데이터셋과 변형 가능한 3D 손 메시(mesh) MANO 모델을 활용하여 다양한 손 포즈 변형을 다룬다. 첫째, 중복되는 손자세를 줄이기 위해 전략적으로 샘플링하는 방법을 이용하고 3D 메시 모델을 샘플링된 손에 피팅한다. 3D 메시의 모양 및 시점 파라미터를 탐색하여 인간 손 이미지의 자연스러운 가변성을 처리한다. 마지막으로, 다중 모달리티 데이터를 생성한다. 손 관절, 모양 및 관점의 데이터 공간을 기존 벤치마크의 데이터 공간과 비교한다. 이 과정을 통해 제안된 벤치마크가 이전 작업의 차이를 메우고 있음을 보여주고, 또한 네트워크 훈련 과정에서 제안된 데이터를 사용하여 RGB 기반 손 포즈 추정 실험을 하여 생성된 데이터가 양질의 질과 양을 가짐을 보여준다. 제안된 데이터가 RGB 기반 3D 손 포즈 추정 및 시맨틱 손 세그멘테이션과 같은 품질 좋은 큰 데이터셋이 부족하여 방해되었던 작업에 대한 발전을 가속화할 것으로 기대된다.

딥러닝을 활용한 전시 정원 디자인 유사성 인지 모형 연구 (Development of Deep Recognition of Similarity in Show Garden Design Based on Deep Learning)

  • 조우윤;권진욱
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.96-109
    • /
    • 2024
  • 본 연구는 딥러닝 모델 중 VGG-16 및 ResNet50 모델을 활용하여 전시 정원의 유사성 평가 방법을 제시하는 것에 목적이 있다. VGG-16과 ResNet50 모델을 기반으로 전시 정원 유사성 판단을 위한 모형을 개발하였고, 이를 DRG(deep recognition of similarity in show garden design)모형이라 한다. 평가를 위한 방법으로 GAP와 피어슨 상관계수를 활용한 알고리즘을 사용하여 모형을 구축하고 1순위(Top1), 3순위(Top3), 5순위(Top5)에서 원본 이미지와 유사한 이미지를 도출하는 총 개수 비교로 유사성의 정확도를 분석하였다. DRG 모형에 활용된 이미지 데이터는 국외 쇼몽가든페스티벌 전시 정원 총 278개 작품과 국내 정원박람회인 서울정원박람회 27개 작품 및 코리아가든쇼 전시정원 이미지 17개 작품이다. DRG모형을 활용하여 동일 집단과 타 집단간의 이미지 분석을 진행하였고, 이를 기반으로 전시 정원 유사성의 가이드라인을 제시하였다. 첫째, 전체 이미지 유사성 분석은 ResNet50 모델을 기반으로 하여 데이터 증강 기법을 적용하는 것이 유사성 도출에 적합하였다. 둘째, 내부 구조와 외곽형태에 중점을 둔 이미지 분석에서는 형태에 집중하기 위한 일정한 크기의 필터(16cm × 16cm)를 적용하여 이미지를 생성하고 VGG-16 모델을 적용하여 유사성을 비교하는 방법이 효과적임을 알 수 있었다. 이때, 이미지 크기는 448 × 448 픽셀이 효과적이며, 유채색의 원본 이미지를 기본으로 설정함을 제안하였다. 이러한 연구 결과를 토대로 전시 정원 유사성 판단에 대한 정량적 방법을 제안하고, 향후 다양한 분야와의 융합 연구를 통해 정원 문화의 지속적인 발전에 기여할 것으로 기대한다.

효율적인 이미지 검색 시스템을 위한 자기 감독 딥해싱 모델의 비교 분석 (Comparative Analysis of Self-supervised Deephashing Models for Efficient Image Retrieval System)

  • 김수인;전영진;이상범;김원겸
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.519-524
    • /
    • 2023
  • 해싱 기반 이미지 검색에서는 조작된 이미지의 해시코드가 원본 이미지와 달라 동일한 이미지 검색이 어렵다. 본 논문은 이미지의 질감, 모양, 색상 등 특징 정보로부터 지각적 해시코드를 생성하는 자기 감독 기반 딥해싱 모델을 제안하고 평가한다. 비교 모델은 오토인코더 기반 변분 추론 모델들이며, 인코더는 완전 연결 계층, 합성곱 신경망과 트랜스포머 모듈 등으로 설계된다. 제안된 모델은 기하학적 패턴을 추출하고 이미지 내 위치 관계를 활용하는 SimAM 모듈을 포함하는 변형 추론 모델이다. SimAM은 뉴런과 주변 뉴런의 활성화 값을 이용한 에너지 함수를 통해 객체 또는 로컬 영역이 강조된 잠재 벡터를 학습할 수 있다. 제안 방법은 표현 학습 모델로 고차원 입력 이미지의 저차원 잠재 벡터를 생성할 수 있으며, 잠재 벡터는 구분 가능한 해시코드로 이진화 된다. CIFAR-10, ImageNet, NUS-WIDE 등 공개 데이터셋의 실험 결과로부터 제안 모델은 비교 모델보다 우수하며, 지도학습 기반 딥해싱 모델과 동등한 성능이 분석되었다.

인간자세 추정방법에 의한 2차원 웹툰 캐릭터 포즈 생성 (Pose Creation of Character in Two-Dimensional Cartoon through Human Pose Estimation)

  • 정희용;신춘성
    • 방송공학회논문지
    • /
    • 제27권5호
    • /
    • pp.718-727
    • /
    • 2022
  • 국내 웹툰 산업 매출액이 전년도 대비 약 65% 폭발적 성장을 하였고 향후 매출 규모가 1조원을 돌파할 것이라 예상을 하고 있다. 웹툰 제작 과정을 살펴보면 스토리와 콘티와 같이 창작을 필요로 하는 작업도 있지만, 스케치와 펜터치와 같은 단순 반복 작업도 있기 때문에 최근 주목받고 있는 딥러닝 기반 인간자세 추정방법을 사용하여 간소화 할 수 있다면, 웹툰 제작 과정을 효과적으로 개선할 수 있다. 따라서 본 연구는 인간자세 추정방법을 사용하여 인간의 동작을 스케치한 2차원 웹툰 캐릭터와 관절을 매칭 시켜서, 인간의 동작에 따라서 캐릭터의 동작을 생성시키는 방법을 제안한다. 이를 위해 생성한 2차원 캐릭터를 SVG 파일 형식인 벡터화된 그래픽 이미지로 생성시켜 인간자세의 관절을 나타내는 스켈레톤과 매칭을 시켰다. 실험결과를 통해 2차원 웹툰 캐릭터의 포즈가 웹 카메라의 사용자 자세와 동일한 동작을 생성시킬 수 있는 것을 확인할 수 있었다. 또한 저장한 정지 이미지에서 하나의 포즈를 선별하여 필요한 장면에 삽입할 수도 있고, 연속 동작에 대하여 비디오로 녹화하여 포즈 선별을 할 수 있다는 점도 확인하였다. 제안한 포즈 생성 방법은 기존의 포즈 투 포즈 방식 애니메이션 포즈 생성에 큰 기여를 할 수 있을 것으로 기대된다.

딥러닝 기반 스타일 변환 기법을 활용한 인공 달 지형 영상 데이터 생성 방안에 관한 연구 (A Study for Generation of Artificial Lunar Topography Image Dataset Using a Deep Learning Based Style Transfer Technique)

  • 나종호;이수득;신휴성
    • 터널과지하공간
    • /
    • 제32권2호
    • /
    • pp.131-143
    • /
    • 2022
  • 달 현지 탐사를 위해 무인 이동체가 활용되고 있으며, 달 지상 관심 지역의 지형 특성을 정확하게 파악하여 실시간으로 정보화 하는 작업이 요구된다. 하지만, 정확도 높은 지형/지물 객체 인식 및 영역 분할을 위해서는 다양한 배경조건의 영상 학습데이터가 필요하며 이러한 학습데이터를 구축하는 과정은 많은 인력과 시간이 요구된다. 특히 대상이 쉽게 접근하기 힘든 달이기에 실제 현지 영상의 확보 또한 한계가 있어, 사실에 기반하지만 유사도 높은 영상 데이터를 인위적으로 생성시킬 필요성이 대두된다. 본 연구에서는 가용한 중국의 달 탐사 Yutu 무인 이동체 및 미국의 Apollo 유인 착륙선에서 촬영한 영상을 통해 위치정보 기반 스타일 변환 기법(Style Transfer) 모델을 적용하여 실제 달 표면과 유사한 합성 영상을 인위적으로 생성하였다. 여기서, 유사 목적으로 활용될 수 있는 두 개의 공개 알고리즘(DPST, WCT2)를 구현하여 적용해 보았으며, 적용 결과를 시간적, 시각적 측면으로 비교하여 성능을 평가하였다. 평가 결과, 실험 이미지의 형태 정보를 보존하면서 시각적으로도 매우 사실적인 영상을 생성할 수 있음을 확인하였다. 향후 본 실험의 결과를 바탕으로 생성된 영상 데이터를 지형객체 자동 분류 및 인식을 위한 인공지능 학습용 영상 데이터로 추가 학습된다면 실제 달 표면 영상에서도 강인한 객체 인식 모델 구현이 가능할 것이라 판단된다.

재난정보 표준화를 통한 환경 재난정보 수집 및 활용 (Collection and Utilization of Unstructured Environmental Disaster by Using Disaster Information Standardization)

  • 이동섭;김병식
    • Ecology and Resilient Infrastructure
    • /
    • 제6권4호
    • /
    • pp.236-242
    • /
    • 2019
  • 본 연구는 재난정보 표준화를 목표로 다양한 재난 및 사고에서 생성되는 정형, 비정형 문서를 전자화된 문서로 변환하여 환경재난 정보를 생성함으로써 데이터베이스에 저장하고 환경재난 관리에 활용할 수 있는 체계를 개발하였다. 최근 4차 산업 시대를 통해 다양한 지능화 기술들이 발전하고 있다. 이러한 기술들은 환경재난, 재난관리 등의 분야에 다양한 형태로 적용되며, 환경재난 관리 업무와 융합되어 활용되고 있다. 재난정보관리는 단순히 재난업무를 지원하는 것이 아니라 과거의 환경재난 이력정보를 활용하여 인공지능 기술을 적용한 스마트 재난관리를 지원할 수 있도록 한다. 환경재난을 관리하는 중요한 요소는 재난정보이다. 재난정보는 재난의 발생에서 진행, 대응 및 계획까지의 재난 전주기에 대한 정보를 전자화된 정보로 관리하고 처리하는 행위를 의미한다. 그러나, 자연, 사회, 환경재난에 대한 상황, 대응, 대비, 복구의 정보는 주로 보고서의 형태인 핸드아웃이나 비정형 정보로 존재하고 있다. 이러한 비정형 재난안전정보는 관리 부실에 의해 사라지거나 폐기되는 경우가 많다. 이에 따라 비정형 재난안전정보는 재난정보로서의 관리를 위해 인식기술이 필요하다. 본 연구에서는 지능화된 기술을 활용하여 인쇄되거나 스캐너에 의해 이미지 또는 문서로 생성된 재난 보고서를 전자화된 문서로 변환하는 것에 중점을 두었으며, 그 후 변환된 재난정보는 재난정보관리 코드체계에 맞추어 정리하여 재난정보관리 데이터베이스에 저장한다. 정형, 비정형 재난정보를 생성하는 것은 스마트 재난관리의 시작으로 가장 중요한 요소이며, 이렇게 생성된 환경재난 정보는 재난정보 코드체계와 연계하여 표준화된 형식으로 관리한다. 재난코드체계는 재난 별 발생 진행 상황, 피해 규모, 대처사항 등의 정보를 저장할 수 있는 표준을 구축하였으며, 향후 이러한 많은 재난 데이터와 이력정보를 기반으로 한 인공지능 기술을 접목하여 스마트 재난관리 및 의사결정에 활용될 수 있을 것으로 판단된다.