• 제목/요약/키워드: 학습영상

검색결과 2,574건 처리시간 0.033초

골프 동영상으로부터 추출된 스윙 정보를 활용한 3D 모델과 골프 동영상의 동기화 재생 (A Synchronized Playback Method of 3D Model and Video by Extracting Golf Swing Information from Golf Video)

  • 오황석
    • 한국컴퓨터게임학회논문지
    • /
    • 제31권4호
    • /
    • pp.61-70
    • /
    • 2018
  • 본 논문은 골프 스윙 자세 학습자를 위하여 골프 스윙의 참조 모델인 3D 모델과 학습자의 골프 스윙을 촬영한 동영상을 대상으로 스윙 동작 시 각각의 위치 및 시간에서 각 동작을 정밀하게 비교 분석하기 위해 3D 모델의 골프 스윙 동작과 학습자의 스윙 동작을 동기화 시키는 방법을 제안하고 구현한 결과를 제시한다. 3D 모델과 학습자의 스윙 동영상을 동기화시켜 재생하기 위해서 먼저 학습자의 골프 스윙 동영상을 촬영하고, 촬영한 동영상으로부터 어드레스 자세부터 피니쉬 자세까지 골프 클럽의 위치에 따라 상대적 시간 정보를 추출한다. 고품질 모션 캡쳐 장비를 통해 초당 120프레임으로 캡처된 골프 전문가의 움직임 정보를 3D 모델에 리깅한 3D 참조 모델에 학습자 스윙 동영상으로부터 추출한 골프 클럽의 위치별 시간 정보를 적용하여 3D 참조 모델과 학습자의 스윙 동영상을 동기화시켜 재생함으로 학습자는 골프 스윙의 각 위치에서 참조 모델과 자신의 자세를 정밀하게 비교함으로 자세를 교정하거나 학습할 수 있다. 동기화된 재생을 통하여 기존의 수동적으로 위치를 조정하며 참조 모델과 학습자의 스윙을 비교 분석하는 시스템의 기능을 편리하게 사용할 수 있도록 개선할 수 있으며, 골프 자세의 각 위치를 검출하는 영상 처리 기술을 적용한 부분을 제외하고, 동기화시키기 위해 동영상에서 자동적으로 각 위치의 시간 정보를 추출하여 동기화시켜 재생하는 방법은 일반적인 생활 스포츠 분야로 확대하여 활용할 수 있을 것으로 기대한다.

일차원 패치 학습을 이용한 고속 내용 기반 보간 기법 (Fast Content Adaptive Interpolation Algorithm Using One-Dimensional Patch-Based Learning)

  • 강영욱;정신철;송병철
    • 대한전자공학회논문지SP
    • /
    • 제48권1호
    • /
    • pp.54-63
    • /
    • 2011
  • 본 논문은 저해상도 입력 영상을 고해상도 영상으로 복원하는 고속 학습기반 보간 기법을 제안한다. 일반적인 학습기반 초고해상도 기법은 여러 종류의 저해상도 영상과 고해상도 영상의 상관성을 통해 고주파 정보를 사전에 학습하고, 합성 단계에서 학습한 정보를 이용해 임의의 저해상도 영상을 고해상도 영상으로 복원한다. 이런 기존 학습기반 초 고해상도 기법은 방대한 양의 학습된 정보를 메모리에 저장해야만 하는 단점이 있을 뿐만 아니라 이차원 블록 단위 정합 과정을 거쳐야 하기 때문에 상당한 연산량이 요구된다. 이러한 문제점을 보완하기 위해 본 논문은 일차원 패치 단위 학습을 통해 학습 정보 저장용 메모리 크기 및 연산량을 크게 줄이는 기법을 제안한다. 실험 결과에 따르면, 제안한 기법은 전통적인 bicubic 보간 기법보다 평균 0.7dB 정도 높은 PSNR을 보이며, SSIM도 평균 0.01이상 향상되는 결과를 보인다.

CycleGAN을 활용한 항공영상 학습 데이터 셋 보완 기법에 관한 연구 (A Study on the Complementary Method of Aerial Image Learning Dataset Using Cycle Generative Adversarial Network)

  • 최형욱;이승현;김형훈;서용철
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.499-509
    • /
    • 2020
  • 본 연구에서는 최근 영상판독 분야에서 활발히 연구되고, 활용성이 발전하고 있는 인공지능 기반 객체분류 학습 데이터 구축에 관한 내용을 다룬다. 영상판독분야에서 인공지능을 활용하여 정확도 높은 객체를 인식, 추출하기 위해서는 알고리즘에 적용할 많은 양의 학습데이터가 필수적으로 요구된다. 하지만, 현재 공동활용 가능한 데이터 셋이 부족할 뿐만 아니라 데이터 생성을 위해서는 많은 시간과 인력 및 고비용을 필요로 하는 것이 현실이다. 따라서 본 연구에서는 소량의 초기 항공영상 학습데이터를 GAN (Generative Adversarial Network) 기반의 생성기 신경망을 활용하여 오버샘플 영상 학습데이터를 구축하고, 품질을 평가함으로써 추가적 학습 데이터 셋으로 활용하기 위한 실험을 진행하였다. GAN을 이용하여 오버샘플 학습데이터를 생성하는 기법은 딥러닝 성능에 매우 중요한 영향을 미치는 학습데이터의 양을 획기적으로 보완할 수 있으므로 초기 데이터가 부족한 경우에 효과적으로 활용될 수 있을 것으로 기대한다.

심층 신경망을 이용한 영상 내 파프리카 인식 알고리즘 연구 (A Study on the Recognition Algorithm of Paprika in the Images using the Deep Neural Networks)

  • 화지호;이봉기;이대원
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.142-142
    • /
    • 2017
  • 본 연구에서는 파프리카를 자동 수확하기 위한 시스템 개발의 일환으로 파프리카 재배환경에서 획득한 영상 내에 존재하는 파프리카 영역과 비 파프리카 영역의 RGB 정보를 입력으로 하는 인공신경망을 설계하고 학습을 수행하고자 하였다. 학습된 신경망을 이용하여 영상 내 파프리카 영역과 비 파프리카 영역의 구분이 가능 할 것으로 사료된다. 심층 신경망을 설계하기 위하여 MS Visual studio 2015의 C++, MFC와 Python 및 TensorFlow를 사용하였다. 먼저, 심층 신경망은 입력층과 출력층, 그리고 은닉층 8개를 가지는 형태로 입력 뉴런 3개, 출력 뉴런 4개, 각 은닉층의 뉴런은 5개로 설계하였다. 일반적으로 심층 신경망에서는 은닉층이 깊을수록 적은 입력으로 좋은 학습 결과를 기대 할 수 있지만 소요되는 시간이 길고 오버 피팅이 일어날 가능성이 높아진다. 따라서 본 연구에서는 소요시간을 줄이기 위하여 Xavier 초기화를 사용하였으며, 오버 피팅을 줄이기 위하여 ReLU 함수를 활성화 함수로 사용하였다. 파프리카 재배환경에서 획득한 영상에서 파프리카 영역과 비 파프리카 영역의 RGB 정보를 추출하여 학습의 입력으로 하고 기대 출력으로 붉은색 파프리카의 경우 [0 0 1], 노란색 파프리카의 경우 [0 1 0], 비 파프리카 영역의 경우 [1 0 0]으로 하는 형태로 3538개의 학습 셋을 만들었다. 학습 후 학습 결과를 평가하기 위하여 30개의 테스트 셋을 사용하였다. 학습 셋을 이용하여 학습을 수행하기 위해 학습률을 변경하면서 학습 결과를 확인하였다. 학습률을 0.01 이상으로 설정한 경우 학습이 이루어지지 않았다. 이는 학습률에 의해 결정되는 가중치의 변화량이 너무 커서 비용 함수의 결과가 0에 수렴하지 않고 발산하는 경향에 의한 것으로 사료된다. 학습률을 0.005, 0.001로 설정 한 경우 학습에 성공하였다. 학습률 0.005의 경우 학습 횟수 3146회, 소요시간 20.48초, 학습 정확도 99.77%, 테스트 정확도 100%였으며, 학습률 0.001의 경우 학습 횟수 38931회, 소요시간 181.39초, 학습 정확도 99.95%, 테스트 정확도 100%였다. 학습률이 작을수록 더욱 정확한 학습이 가능하지만 소요되는 시간이 크고 국부 최소점에 빠질 확률이 높았다. 학습률이 큰 경우 학습 소요 시간이 줄어드는 반면 학습 과정에서 비용이 발산하여 학습이 이루어지지 않는 경우가 많음을 확인 하였다.

  • PDF

영상인식을 위한 화질의 데이터 분류성 (Data Classification of Visual Quality for Image Recognition)

  • 조재현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.279-280
    • /
    • 2021
  • 패턴 또는 영상을 인식하기 위하여 먼저 기계 학습 모델을 선택하고, 선택된 모델은 여러 단계의 처리 단계 과정으로써, 학습 데이터 구성과 특징 추출 그리고 분류기 등으로 크게 나눌 수 있다. 기존의 학습 모델의 처리 단계 중 학습 데이터 구성은 첫 번째 중요한 단계이다. 본 논문에서는 학습 데이터들의 특징을 분석하여 데이터 분류성의 척도로 사용될 수 있는지를 검토하여 차후 기계 학습 및 딥 러닝의 인식을 높이고자 한다.

  • PDF

웨이브렛 변환영역의 정보를 신경망 학습 통한 영상검색에 관한 연구 (A Study on Image Search for Neural Network learning to Information of Wavelet Transform region)

  • 최병도;조영;박장한;남궁재찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.550-552
    • /
    • 2002
  • 본 논문에서는 웨이브렛 변환 영역의 정보를 신경망 학습을 통하여 영상검색에 관한 연구를 제안하였다. 영상검색은 연구가 이루어지고 있지만, 영상의 특징을 정확하게 표현한다는 것은 현실적으로 어렵기 때문에 영상의 저장 및 검색에 많은 어려움이 있다. 따라서 영상데이터의 효율적인 저장 및 검색을 위해서는 공간 영역보다는 변환 영역에서의 특징추출 방법이 고려되어야 한다. 본 논문에서는 웨이브렛 변환 후 생성되는 저주파 대역의 영상을 일정한 크기로 ( 2$^n$$\times$2$^n$) 분할한 다음 각 블록의 표준편차를 구하고, 주어진 경계 값을 기준으로 작성된 블록 맵을 유사성의 척도로 이용하여 유사한 영상을 함께 모아 카테고리 분류에 의한 저장을 한다. 또한 질의영상에 대한 블록 맵을 신경망 학습을 통해 해당 카테고리를 찾아 1:1매칭을 통한 검색을 함으로써 검색 시간을 줄이고, 제안된 시스템 효율을 증대 시킬 수 있었다.

  • PDF

3차원 특징볼륨을 이용한 깊이영상 생성 모델 (Depth Map Estimation Model Using 3D Feature Volume)

  • 신수연;김동명;서재원
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.447-454
    • /
    • 2018
  • 본 논문은 컨볼루션 신경망으로 이루어진 학습 모델을 통해 스테레오 영상의 깊이영상 생성 알고리즘을 제안한다. 제안하는 알고리즘은 좌, 우 시차 영상을 입력으로 받아 각 시차영상의 주요 특징을 추출하는 특징 추출부와 추출된 특징을 이용하여 시차 정보를 학습하는 깊이 학습부로 구성된다. 우선 특징 추출부는 2D CNN 계층들로 이루어진 익셉션 모듈(xception module) 및 ASPP 모듈(atrous spatial pyramid pooling) module을 통해 각각의 시차영상에 대한 특징맵을 추출한다. 그 후 각 시차에 대한 특징 맵을 시차에 따라 3차원 형태로 쌓아 3D CNN을 통해 깊이 추정 가중치를 학습하는 깊이 학습부를 거친 후 깊이 영상을 추정한다. 제안하는 알고리즘은 객체 영역에 대해 기존의 다른 학습 알고리즘들 보다 정확한 깊이를 추정하였다.

적대적 학습을 이용한 도로 노면 파손 탐지 알고리즘 (Detection Algorithm of Road Surface Damage Using Adversarial Learning)

  • 심승보
    • 한국ITS학회 논문지
    • /
    • 제20권4호
    • /
    • pp.95-105
    • /
    • 2021
  • 도로 노면 파손 탐지는 쾌적한 주행 환경과 안전사고의 예방을 위해 필요하다. 도로 관리 기관은 자동화 기술 기반의 검사 장비와 시스템을 활용하고 있다. 이러한 자동화 기술 중에서도 도로 노면의 파손을 탐지하는 기술은 중요한 역할을 수행한다. 최근 들어 딥러닝을 이용한 기술에 대한 연구가 활발하게 진행 중이다. 이러한 딥러닝 기술 개발을 위해서는 도로 영상과 라벨 영상이 필요하다. 하지만 라벨 영상을 확보하기 위해서는 많은 시간과 노동력이 요구된다. 본 논문에서는 이러한 문제를 해결하기 위하여 준지도 학습 기법 중 하나인 적대적 학습 방법을 제안했다. 이를 구현하기 위해서 5,327장의 도로 영상과 1,327장의 라벨 영상을 사용하여 경량화 심층 신경망 모델을 학습했다. 그리고 이를 400장의 도로 영상으로 실험한 결과 80.54%의 mean intersection over union과 77.85%의 F1 score를 갖는 모델을 개발하였다. 결과적으로 라벨 영상 없이 도로 영상만을 학습에 추가하여 인식 성능을 향상시킬 수 있는 기술을 개발하였고, 향후 도로 노면 관리를 위한 기술로 활용되길 기대한다.

캡슐내시경 영상 딥러닝을 위한 색상 유사도 기반의 클래스 레이블링 기법 (Color Similarity-based Class Labeling Method for Deep Learning of Capsule Endoscopic Images)

  • 박예슬;황규본;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.749-752
    • /
    • 2017
  • 캡슐내시경 검사는 일반내시경으로는 관찰하기 힘든 소장 기관을 관찰할 수 있어 최근 환자들 사이에서 수요가 늘고 있는 검사 방법 중 하나이다. 이와 같은 캡슐내시경으로부터 병변에 대한 의료 정보가 획득될 수 있는데, 최근에는 캡슐내시경 영상의 학습을 통해 이를 자동으로 획득하려는 시도들이 이루어지고 있다. 예를 들면, 캡슐의 위치를 추적하기 위해 위장관의 개략적인 위치(위, 소장 등)를 파악하거나, 캡슐내시경 영상으로부터 관찰될 수 있는 병변(폴립 등)을 검출하기 위해 영상의 학습이 수행되고 있는 상황이다. 그러나 캡슐내시경의 방대한 영상 프레임 중에서 병변에 대한 영상은 극히 일부분이기 때문에, 기존 학습 영상의 클래스(레이블)는 다양한 병변에 대한 정의나 영상에서 확인될 수 있는 구체적인 속성이 고려되지 않는다. 따라서 본 논문에서는 캡슐내시경 관련 표준(MST, CEST)에서 정의하고 있는 주요 병변 정보에 대한 색상 유사도 분석을 통해, 출력층에서 활용될 수 있는 클래스 레이블링 기법을 제안한다. 제안하는 기법은 유사한 특성을 보이는 영상의 구분을 통해 세부적인 클래스 레이블링을 수행하여 체계적인 학습 모델의 설계를 가능케한다.

모바일 웹 캡처 메모 시스템의 학습 완성도에 대한 연구 (Mobile Web Capture notes system Research on learning maturity)

  • 이연란;임영환
    • 만화애니메이션 연구
    • /
    • 통권32호
    • /
    • pp.363-381
    • /
    • 2013
  • 본 논문은 모바일 웹 상에서 오프라인의 학습 내용을 복습 할 때 학습 동영상에 필요한 재학습 영역을 프레임 단위로 중요 영역만 캡처한다. 캡처된 프레임은 영상 중에서 진행된 학습 시간과 이미지의 형태로 저장하고 또한 설명에 대한 메모 기능을 함께 저장한다. 캡처 영역은 학습자에 필요한 영역만 재학습하는 학습자 중심의 맞춤형 시스템을 적용할 수 있다. 캡처 프로그램의 구성은 학습 순서에 상관없이 선택한 순서에 따라 프레임 단위 캡처로 사용자 중심의 스토리텔링형 학습을 적용할 수 있다. 캡처 시스템 효과는 전체 학습에 비해 학습 시간을 절약하고 학습자 중심의 프레임 재구성으로 맞춤형 학습에 따른 학습 효용성 향상에 긍정적인 역할을 한다.