• 제목/요약/키워드: image feature extraction

검색결과 1,017건 처리시간 0.028초

다중영상을 이용한 딥러닝 기반 온디바이스 증강현실 시스템 (Deep Learning Based On-Device Augmented Reality System using Multiple Images)

  • 정태현;박인규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.341-350
    • /
    • 2022
  • 본 논문은 온디바이스 환경에서 다중 시점 영상을 입력 받아 객체를 증강하고, 현실 공간에 의한 가려짐을 구현하는 딥러닝 기반의 증강현실 시스템을 제안한다. 이는 세부적으로 카메라 자세 추정, 깊이 추정, 객체 증강 구현의 세 기술적 단계로 나눠지며 각 기법은 온디바이스 환경에서의 최적화를 위해 다양한 모바일 프레임워크를 사용한다. 카메라 자세 추정 단계에서는 많은 계산량을 필요로 하는 특징 추출 알고리즘을 GPU 병렬처리 프레임워크인 OpenCL을 통해 가속하여 사용하며, 깊이 영상 추론 단계에서는 모바일 심층신경망 프레임워크 TensorFlow Lite를 사용하여 가속화된 단안, 다중 영상 기반의 깊이 영상 추론을 수행한다. 마지막으로 모바일 그래픽스 프레임워크 OpenGL ES를 활용해 객체 증강 및 가려짐을 구현한다. 제시하는 증강현실 시스템은 안드로이드 환경에서 GUI를 갖춘 애플리케이션으로 구현되며 모바일과 PC 환경에서의 동작 정확도 및 처리 시간을 평가한다.

단일 카메라 영상으로부터 골프 스윙의 자동 분석 (Automatic analysis of golf swing from single-camera video sequences)

  • 김병기
    • 한국산업정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.139-148
    • /
    • 2009
  • 본 논문에서는 단일 카메라로부터 입력된 2차원 측면 골프 스윙 비디오 영상으로부터 사람의 개입 없이 스윙을 자동으로 분석하는 방법을 제안하였다. 2차원 환경에서 스윙 자동분석에 필요한 특징들을 정의 및 추출하고, 에지 검출과 직선 추출을 비롯한 다양한 영상처리 기법을 이용하여 자동 스윙 분석 방법을 제시 하였다. 기존 스윙분석 시스템이나 관련 연구들과 비교하여 제안한 방법은 다음과 같은 두 가지 특징을 갖는다. 첫째, 기존의 스윙 자동분석이 상대적으로 복잡하고 고가인 3차원 환경에서만 가능하였지만 제안한 방법은 2차원 환경에 서도 가능하다. 둘째, 기존의 2차원 스윙분석 시스템들은 골프 전문가에 의한 분석이 필요하지만 제안한 방법은 사람의 개입 없이 자동적으로 이루어지므로 사용이 편리하다. 제안한 스윙특징 추출 및 분석 방법을 20장의 스윙영상에 대하여 실험한 결과, 제안한 방법이 스윙 특징 추출 및 분석에 유용함을 확인하였다.

한국어 8모음 자동 독화에 관한 연구 (A Study on Speechreading about the Korean 8 Vowels)

  • 이경호;양룡;김선옥
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.173-182
    • /
    • 2009
  • 본 논문은 한국어 8단모음을 인식하기 위한 효율적인 파라미터의 추출과 자동 독화 시스템의 구축에 관하여 연구한 것이다. 얼굴의 특징들은 다양한 칼라 공간에서 다양한 값으로 표현되는 것을 이용하여 각 표현 값들을 증폭하거나 또는 축소, 대비시켜 얼굴 요소들이 추출되도록 하였다. 눈과 코의 위치, 안쪽 입의 외곽선, 윗입술의 상단, 이의 외곽선을 특징 점으로 찾았으며, 이를 분석하여 안쪽 입의 면적, 안쪽 입의 높이와 폭, 이의 보임 비율 코와 윗입술 상단과의 거리를 파라미터로 사용하였다. 2400개의 영상으로 분석하였고 이 분석을 바탕으로 신경망 시스템을 구축한 후 인식 실험을 하였다. 정상인 5명이 동원되었고, 사람들 사이에 있는 관찰 오차를 정규화를 통하여 수정하였으며 실험하여 파라미터의 유용성 관점에서 좋은 결과를 얻었다.

데이터 증강을 통한 기계학습 능력 개선 방법 연구 (Study on the Improvement of Machine Learning Ability through Data Augmentation)

  • 김태우;신광성
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.346-347
    • /
    • 2021
  • 기계학습을 위한 패턴인식을 위해서는 학습데이터의 양이 많을수록 그 성능이 향상된다. 하지만 일상에서 검출해내야하는 패턴의 종류 및 정보가 항상 많은 양의 학습데이터를 확보할 수는 없다. 따라서 일반적인 기계학습을 위해 적은데이터셋을 의미있게 부풀릴 필요가 있다. 본 연구에서는 기계학습을 수행할 수 있도록 데이터를 증강시키는 기법에 관해 연구한다. 적은데이터셋을 이용하여 기계학습을 수행하는 대표적인 방법이 전이학습(transfer learning) 기법이다. 전이학습은 범용데이터셋으로 기본적인 학습을 수행한 후 목표데이터셋을 최종 단계에 대입함으로써 결과를 얻어내는 방법이다. 본 연구에서는 ImageNet과 같은 범용데이터셋으로 학습시킨 학습모델을 증강된 데이터를 이용하여 특징추출셋으로 사용하여 원하는 패턴에 대한 검출을 수행한다.

  • PDF

Mask R-CNN과 Dense-Net을 이용한 제조 현장에서의 작업자 행동 추출 (Extraction of Worker Behavior at Manufacturing Site using Mask R-CNN and Dense-Net)

  • 리타 리자얀티;황민태;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.150-153
    • /
    • 2022
  • 본 논문은 작업자와 객체들이 서로 혼재되어 있는 제조 현장에서 Mask R-CNN을 이용해 객체들을 탐지한 후 이를 Dense-Net을 통해 객체 형상을 자동으로 추출하는 기술을 담고 있다. 이는 맞춤형 공장 데이터 세트를 기반으로 하며, 대상이 되는 객체는 작업자, 기계, 도구, 컨트롤 박스 및 제품들이다. Mask R-CNN은 이미 잘 알려진 객체 인식 방식으로서 다중 객체 인식을 지원하며, Dense-Net은 중첩된 객체들로 부터 개별 객체를 추출하는 데 탁월한 효과를 보여준다. 이러한 두 가지 기술을 이용한 기초구현 결과 제조 현장 모습에서 객체들을 정상적으로 추출해 이미지를 설명할 수 있으며, 향후 객체에 대한 레이블링과 객체 간의 상호 관계를 추가해 작업자의 이상 행동을 감지하는 용도로 활용할 계획이다.

  • PDF

저전력 장치를 위한 자원 효율적 객체 검출기 (Resource-Efficient Object Detector for Low-Power Devices)

  • 악세이 쿠마 샤마;김경기
    • 반도체공학회 논문지
    • /
    • 제2권1호
    • /
    • pp.17-20
    • /
    • 2024
  • 본 논문은 전통적인 자원 집약적인 컴퓨터 비전 모델의 한계를 해결하기 위해 저전력 엣지 장치에 최적화된 새로운 경량 객체 검출 모델을 제안합니다. 제안된 검출기는 Single Shot Detector (SSD)에 기반하여 소형이면서도 견고한 네트워크를 설계하였고, 작은 객체를 효율적으로 감지하는 데 있어 효율성을 크게 향상시키도록 모델을 구성하였다. 이 모델은 주로 두 가지 구성요소로 구성되어 있습니다: Depthwise 와 Pointwise Convolution 레이어를 사용하여 효율적인 특징 추출을 위한 Light_Block, 그리고 작은 객체의 향상된 감지를 위한 Enhancer_Block 으로 나누었다. 우리의 모델은 300x480 의 이미지 크기를 가진 Udacity 주석이 달린 데이터셋에서 처음부터 훈련되었으며, 사전 훈련된 분류 가중치의 필요성을 제거하였다. 약 0.43M 의 파라미터로 5.5MB 만의 무게를 가진 우리의 검출기는 평균 정밀도 (mAP) 27.7%와 140 FPS 의 처리 속도를 달성하여, 정밀도와 효율성 모두에서 기존 모델을 능가하였다. 따라서, 본 논문은 추론의 정확성을 손상시키지 않으면서 엣지 장치를 위한 객체 검출에서의 효과적인 경량화를 보여주고 있다.

ASM기반 (2D)2 하이브리드 전처리 알고리즘을 이용한 얼굴인식 시스템 설계 (Design of ASM-based Face Recognition System Using (2D)2 Hybird Preprocessing Algorithm)

  • 김현기;진용탁;오성권
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.173-178
    • /
    • 2014
  • 본 연구에서는 ASM기반 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용한 얼굴인식 분류기와 그것의 설계방법론을 소개한다. 얼굴인식을 위한 이미지는 외부 환경에 쉽게 영향을 받기 때문에, 전처리 단계로 이러한 문제를 해결하기 위해서 ASM을 사용하였다. 특히 사람 얼굴의 특징 추출을 목적으로 널리 이용되고 있다. ASM을 이용해 얼굴영역을 추출 한 뒤 PCA와 LDA를 이용한 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용하여 차원을 축소한다. 전처리 알고리즘을 통한 얼굴데이터는 제안된 다항식 기반 방사형 기저함수 신경회로망의 입력으로 사용된다. 기존의 신경회로망과는 달리 제안된 지능형 패턴 분류기는 강인한 네트워크 특성을 가지며, 예측능력이 우수할 뿐만 아니라 다차원 입출력에 대한 문제도 해결했다. 분류기의 중요한 필수 설계 파라미터(행의 고유벡터의 수, 열의 고유벡터의 수, 클러스터의 수, 퍼지화 계수)는 ABC알고리즘에 의해 최적화 되어진다. 얼굴인식에 많이 사용되는 Yale과 AT&T를 사용하여 인식률을 평가하였다.

Disparity 보정을 위한 컬러와 윤곽선 기반 루피 신뢰도 전파 기법 (Improvement of Disparity Map using Loopy Belief Propagation based on Color and Edge)

  • 김은경;조현학;이한수;수료 아드히 위보워;김성신
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.502-508
    • /
    • 2015
  • 스테레오 영상은 2-D 영상으로 분석할 수 없는 깊이(거리) 정보를 포함하고 있다. 하지만 연산을 통해서 거리정보를 얻을 수 있기 때문에 계산 값의 신뢰도가 낮고, 폐색된 공간 등의 영향으로 오차가 발생한다. 또한 Stereo Matching 시 Global Method를 사용할 경우, 많은 연산량에 따라 계산 시간이 오래 걸린다. 따라서 본 논문에서는 연산 시간이 짧고 더 높은 정확도를 갖는 Disparity Map을 구하는 방법을 제안한다. 특징 기반 영상분할 기법인 윤곽선 추출을 통해 정확도는 높이고 연산 시간은 줄였다. 컬러 기반 영상 분할 기법인 Color K-Means를 통해 관심 영역을 추출하고, 이를 기반으로 Loopy Belief Propagation(LBP)을 접목하였다. 제안하는 방법을 적용함으로 영상 내 물체들의 연관성을 고려한 보정이 가능하였고, 관심 영역 추출에 따라 연산 시간을 줄일 수 있었다. 실험 결과, 기존의 방법들보다 연산 시간이 짧고 정확도가 높은 Disparity Map을 얻을 수 있었다.

피사계 심도가 낮은 이미지에서 웨이블릿 기반의 자동 ROI 추출 및 마스크 생성 (An Automatic ROI Extraction and Its Mask Generation based on Wavelet of Low DOF Image)

  • 박순화;서영건;이부권;강기준;김호용;김형준;김상복
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.93-101
    • /
    • 2009
  • 본 논문에서는 웨이블릿 변환 된 고주파 서브밴드들의 에지 정보를 이용하여 관심 객체 영역을 고속으로 자동 검출해주는 새로운 알고리즘을 제안하였다. 제안된 방법에서는 에지정보를 이용하여 블록단위의 4-방향 객체 윤곽탐색 알고리즘(4-DOBS)을 수행하여 관심객체를 검출한다. 전체 이미지는 $64{\times}64$또는 $32{\times}32$ 크기의 코드 블록으로 먼저 나누어지고, 각 코드 블록 내에 에지들이 있는지 없는지에 따라 관심 코드블록 또는 배경이 된다. 4-방향은 바깥쪽에서 이미지의 중앙으로 탐색하고, 피사계 심도가 낮은 이미지는 중앙으로 갈수록 에지가 발견된다는 특징을 이용한다. 에지를 모두 발견하면 내부의 이미지 블록은 모두 관심영역으로 간주하고, 이 블록들은 빠르게 마스킹되어 서버로 전송되어 동적 ROI를 제공한다. 이는 기존 방법들의 문제점이였던 복잡한 필터링 과정과 영역병합 문제로 인한 높은 계산 복잡도를 상당히 개선시킬 수 있었고, 블록 단위의 처리로 인하여 실시간 처리를 요하는 응용에서도 적용 가능하였다.

사전검수영역기반정합법과 't-분포 과대오차검출법'을 이용한 위성영상의 '자동 영상좌표 상호등록' (Automated Satellite Image Co-Registration using Pre-Qualified Area Matching and Studentized Outlier Detection)

  • 김종홍;허준;손홍규
    • 대한토목학회논문집
    • /
    • 제26권4D호
    • /
    • pp.687-693
    • /
    • 2006
  • 최근 전 지구적, 혹은 대규모 지역의 분석 및 모니터링을 위한 위성영상의 사용이 늘어나고 있으며 이를 처리하기 위해 빠르고 편리한 '영상좌표 상호등록'방법이 요구되고 있다. 이러한 '영상좌표 상호등록'은 위성의 센서모델 및 천체력 자료를 이용하는 엄밀 모델식을 이용하는 방법과 기 존재하는 기준 영상(Reference image)을 사용하거나 혹은 수치지도를 사용하는 경험적 방법의 두 가지로 분류할 수 있다. '영상좌표 상호등록'의 효율성을 높이기 위해서 저자는 '사전검수 영역기반정합법'(Pre-qualified area matching)을 사용하였다. 이는 Canny 연산자를 이용한 경계추출법, 교차상관계수를 사용한 영역기반정합법(Area based matching), t-분포를 이용하여 95%의 신뢰구간 내에서 과대오차 소거법을 적용한 방법이다. 이러한 사전검수(Pre-qualification) 과정을 통해 연산시간을 현저히 단축시켰고, '영상좌표 상호등록'의 정확도 역시 향상됨을 알 수 있었다. 제안한 알고리즘을 사용하여 프로그램을 작성하고, 한반도 Landsat ETM+ 영상 3장을 이용하여 테스트하였다. 정합점 간의 평균제곱오차는 0.435 영상소, 정합점은 평균 25,573개로 나타났다. 연산 시간은 3.0GHz 1Gb RAM 사양의 컴퓨터에서 평균 약 4.2분으로 나타났다.