• 제목/요약/키워드: object-image recognition

검색결과 793건 처리시간 0.026초

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

전자주사위 및 손동작 인식을 활용한 아동용 에듀테인먼트 게임 콘텐츠 개발에 관한 연구 (A Study on Children Edutainment Contents Development with Hand Gesture Recognition and Electronic Dice)

  • 옥수열
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1348-1364
    • /
    • 2011
  • 기존의 아동용 에듀테인먼트 콘텐츠는 교육에 사용되는 학습 교구 및 콘텐츠가 교육 대상자에 대하여 반응을 일방적으로 유도하는 수동적인 교육이 이루어져 능동적이고 자발적인 학 습이 가능하도록 하는 콘텐츠 개발 방법이 절실히 요구되고 있다. 이에 본 논문에서는 행위기반 에듀테인먼트 콘텐츠의 상호작용 교구로서 주사위 형태의 체감형 인터페이스 개발과 깊이 영상 정보 기반의 손동작 인식 기술을 활용한 아동용 에듀테인먼트 콘텐츠 개발 방법을 제안하였다. 또한 교수자가 전체적인 학습 코스웨어를 설정하고 관리 할 수 있는 학습 퀴즈 문제 저작 관리 도구 및 교육발달에 대한 실시간 모니터링용 학습 결과 로그 분석 시스템을 제안하였다. 본 연구에서 제안한 행위 기반 체감형 인터페이스 및 에듀테인먼트 콘텐츠는 조작이 간편하고 실체적 인터랙션을 제공하므로 서 흥미를 더해 능동적이고 자발적인 학습이 가능하다. 또한 학습퀴즈 콘텐츠 저작 관리 도구와 학습 결과 로그 분석 시스템은 아동에 대한 수준별 학습프로그램 구성이 가능하고 또한 아동들이 학습을 스스로 문제를 풀어가는 과정과 얻어진 결과를 바탕으로 이용자의 학습 발달 상황 및 행태를 파악하고 학습계획에 대한 평가 자료로 활용하므로 서 아동의 학습발달에 대한 실시간 모니터링이 가능할 것으로 예상된다.

빛의 반사량 측정을 통한 가면 착용 위변조 얼굴 검출 (Albedo Based Fake Face Detection)

  • 김영신;나재근;윤성백;이준호
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.139-146
    • /
    • 2008
  • 특수 분장을 이용하여 매우 정교하게 제작된 가면을 쓴 얼굴 위변조의 경우 일반적인 밝기 영상으로는 검출이 용이하지 않다. 최근의 획기적인 특수 분장 기술 발전을 고려할 때 성공적인 얼굴 인식시스템 개발을 위해 가면을 쓴 얼굴 위변조 검출 연구는 매우 중요하다. 본 연구에서는 물질의 재질 및 표면 색상에 따른 반사율의 차이를 기반으로 가면을 착용하는 얼굴 위변조 검출 방법을 제안한다. 우선 실제 얼굴 인식 시스템의 적용 환경을 고려할 때 알비도(albedo)를 단순히 빛의 반사량, 즉, 영상에서의 그레이 값으로 간략화 할 수 있음을 보였다. 이를 기반으로 850nm 적외선 조명이 얼굴 피부와 가면재질의 구분에 가장 적합하고, 인종 간 다른 피부색에 대해서는 685nm 조명에서 뚜렷한 차이를 보임을 알 수 있었다. 이 두 파장대의 조명하에서 측정한 영상의 그레이 값으로 2D 특징 벡터를 만들어 사용하면 특징 공간 상에서의 얼굴 피부와 가면 재료의 분포는 선형적으로 분리가 가능한 분포를 갖게 되는 것을 알 수 있었다. Fisher Linear Discriminant(FLD)를 적용하여 97.8%의 가면 얼굴 검출율을 얻을 수 있었다. 제안하는 방법은 기존의 상용 얼굴 인식 시스템에 매우 적은 비용과 간단한 방법으로 추가 적용하여 모든 인종에 대한 얼굴 위변조 검출이 가능하다.

컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구 (Implementation of Intelligent Image Surveillance System based Context)

  • 문성룡;신성
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.11-22
    • /
    • 2010
  • 본 논문은 컨텍스트 기반의 지능형 영상 감시 시스템 구현에 관한 연구로써 기존 연구의 시공간적 제약성 및 실시간 처리가 어려운 단점을 보완하여 초당 30 프레임으로 이루어져 있는 저해상도 동영상(320*240)을 대상으로 다양한 환경에서 실시간 처리가 가능한 움직임 검출 및 장면 분석 알고리즘을 제안하고 이를 이용해 동영상 감시 시스템을 구축한다. 먼저 장면 분석을 수행하기 위한 전처리 과정인 움직임 검출 알고리즘에서는 연속된 프레임 중 의미 없는 유사 프레임과 배경을 제거하고 움직임 영역만을 검출하기 위해 웨이브렛 변환과 에지 히스토그램을 이용하여 샷의 경계를 검출한다. 다음으로 키프레임 선정 파라미터에 의해 샷 경계 내 대표 키프레임을 선정하며, 에지 히스토그램 및 수학적 형태론을 이용하여 움직임 영역만을 검출한다. 장면 분석 알고리즘에서는 검출된 객체의 수직 수평 비율과 질량 중심을 통해 재구성된 허프 변환 후의 각도를 이용해 독립 객체 분석을 수행하며, '서다, 걷다, 눕다, 앉다'의 4가지 기본 상황 정보를 정의한다. 또한 각 상황의 연결 상태 추정을 통해 일반 상황 및 위급 상황으로 구성되는 단순 상황 모델을 정의함으로써 장면 분석을 수행하며, 제안된 알고리즘의 실시간 처리 가능성을 확인하기 위해 시스템을 구성한다. 제안된 시스템은 저해상도 영상을 대상으로 인식률 면에서 평균 92.5%의 성능을 보였으며, 처리속도는 프레임 당 평균 0.74초로 실시간 처리가 가능함을 확인하였다.

실내 공간에서 이동 로봇의 납치 문제 해결을 위한 외부 영상 정보 및 절대 공간 좌표 활용 연구 (Research for robot kidnap problem in the indoor of utilizing external image information and the absolute spatial coordinates)

  • 전영필;박종호;임신택;정길도
    • 한국산학기술학회논문지
    • /
    • 제16권3호
    • /
    • pp.2123-2130
    • /
    • 2015
  • 본 실내에서 활용되고 있는 자동 감시 로봇이나 로봇 청소기 등의 경우 누군가에 의해 옮겨지거나 혹은 예상치 못한 물체와의 충돌 등으로 이동 로봇의 방향이나 계획됐던 경로에서 이탈하였을 경우 원래 계획했던 경로로 다시 진입해야 하며 이에 대한 이동 로봇의 강인한 자기 위치 추정 능력이 필요하며, 이는 기존 이동 로봇의 납치 문제 해결과도 연관된다. 본 연구에서는 이동 로봇의 경우 실내에서만 동작하며, 저가의 로봇을 활용하고자 한다. 따라서 본 논문에서는 실내에 설치되어 있는 CCTV 등 외부 영상 정보 획득 장치를 활용하여 환경 영상을 획득하고 이를 절대 공간 좌표로 변환한 동시에 이동 로봇의 마커 인식을 활용함으로써 실내에서 이동 로봇의 자기 위치 추정과 납치 문제 해결하고자 하였으며, 실제 로봇 시스템을 활용하고자 포텐셜 필드 방법을 구현하였다. 이와 같이 실제 이동 로봇 시스템에 본 연구에서 제안한 방법을 구현하여 관련 실험을 진행하였고 결과를 검증하였다.

열처리 장비의 Safety를 위한 딥러닝 기반 영상처리 시스템 (Image Processing System based on Deep Learning for Safety of Heat Treatment Equipment)

  • 이정훈;이로운;홍승택;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.77-83
    • /
    • 2020
  • 열처리 시설은 뿌리산업 중에서 고열에 의한 열악한 환경과 긴 근로시간 등으로 원격 IOT 시스템의 적용 범위가 확대되는 상황이다. 이러한 열처리 공정 환경에서 IOT 미들웨어는 사물인터넷 기기(센서 등)의 데이터 정보를 해석하고 관리하며 제어할 수 있는 중추적 역할이 요구된다. 그간 열처리 원격에서 제어하는 시스템은 현장 상황에 대한 전반적 감시 없이 작업자의 일괄 시스템 명령으로 운영되었다. 하지만 열처리 시설의 안전성과 정밀한 제어를 위해서는 다양한 센서 컨트롤과 주변 작업환경 인지가 필요하다. 본 논문에서 제시한 열처리 안전지원 시스템은 그에 대한 해결책으로 열화상 감지를 통해 열처리로의 작업인력 접근을 파악하고 원격에서 작업 가동 시 열처리 장비의 Safety를 위한 지원시스템을 제안하였다. 또한 일반적인 고정된 열점 감시 기반 열화상 분석보다 더욱 빠르고 정확한 인식을 위해 DNN 딥러닝 네트워크를 활용한 OPEN CV 기반 열화상 분석 시스템을 구성하였다. 이를 통해 열처리 산업에 특성화된 안전관리 지원과 향후 열처리 환경에서 범용적으로 활용 할 수 있는 시스템을 제안하고자 한다.

다중 공간정보 데이터의 점진적 조합에 의한 의미적 분류 딥러닝 모델 학습 성능 분석 (Training Performance Analysis of Semantic Segmentation Deep Learning Model by Progressive Combining Multi-modal Spatial Information Datasets)

  • 이대건;신영하;이동천
    • 한국측량학회지
    • /
    • 제40권2호
    • /
    • pp.91-108
    • /
    • 2022
  • 대부분의 경우 광학 RGB 영상을 딥러닝(DL: Deep learning)의 학습 데이터로 사용하여 객체탐지, 인식, 식별, 분류, 의미적 분할 및 객체 분할 등을 수행하지만, 실세계의 3차원 객체들을 2차원 영상으로 완전하게 파악하는 것은 한계가 있다. 그러므로 대표적인 3차원 지형 공간정보인 수치표면모델(DSM: Digital Surface Model)과 더불어 DSM에 내재된 특성정보를 이용하여 3차원 지형지물을 분석하는 것이 효과적이다. 건물과 같이 기하학적으로 정형화된 형태의 인공구조물은 3차원 공간데이터로부터 얻을 수 있는 기하학적 요소와 특성을 이용하여 객체의 분류와 형상 묘사가 가능하다. 이 연구는 고차원 시각정보(high-level visual information) 시스템에서 중요한 역할을 하는 내재된 고유의 특성정보(intrinsic information)를 기반으로 하며, 이를 위하여 객체의 기하학적 요소인 경사와 주향을 DSM으로부터 도출하고, 다방향에서 생성한 음영기복영상(SRI: Shaded Relief Image)과 함께 DL 모델의 학습 수행에 사용하였다. 실험은 ISPRS (International Society for Photogrammetry and Remote Sensing)에서 제공하는 데이터 셋 중에서 DSM과 레이블 데이터를 객체의 의미적 분류를 위해 개발된 합성곱 기반의 SegNet 학습에 사용하였다. 지형지물을 분류하고 분류 결과를 이용하여 건물을 추출하였다. 특히 DL 모델의 학습 성능 향상을 위해 학습 데이터의 여러 조합에 따른 시너지 효과를 분석하는 것에 핵심이다. 제안한 방법은 건물 분류와 추출에 효과적임을 보여주고 있다.

증강현실 캐릭터 구현을 위한 AI기반 객체인식 연구 (AI-Based Object Recognition Research for Augmented Reality Character Implementation)

  • 이석환;이정금;심현
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1321-1330
    • /
    • 2023
  • 본 연구는 증강현실에서 적용할 캐릭터 생성에서 단일 이미지를 통해 여러 객체에 대한 3D 자세 추정 문제를 연구한다. 기존 top-down 방식에서는 이미지 내의 모든 객체를 먼저 감지하고, 그 후에 각각의 객체를 독립적으로 재구성한다. 문제는 이렇게 재구성된 객체들 사이의 중첩이나 깊이 순서가 불일치 하는 일관성 없는 결과가 발생할 수 있다. 본 연구의 목적은 이러한 문제점을 해결하고, 장면 내의 모든 객체에 대한 일관된 3D 재구성을 제공하는 단일 네트워크를 개발하는 것이다. SMPL 매개변수체를 기반으로 한 인체 모델을 top-down 프레임워크에 통합이 중요한 선택이 되었으며, 이를 통해 거리 필드 기반의 충돌 손실과 깊이 순서를 고려하는 손실 두 가지를 도입하였다. 첫 번째 손실은 재구성된 사람들 사이의 중첩을 방지하며, 두 번째 손실은 가림막 추론과 주석이 달린 인스턴스 분할을 일관되게 렌더링하기 위해 객체들의 깊이 순서를 조정한다. 이러한 방법은 네트워크에 이미지의 명시적인 3D 주석 없이도 깊이 정보를 제공하게 한다. 실험 결과, 기존의 Interpenetration loss 방법은 MuPoTS-3D가 114, PoseTrack이 654에 비해서 본 연구의 방법론인 Lp 손실로 네트워크를 훈련시킬 때 MuPoTS-3D가 34, PoseTrack이 202로 충돌수가 크게 감소하는 것으로 나타났다. 본 연구 방법은 표준 3D 자세벤치마크에서 기존 방법보다 더 나은 성능을 보여주었고, 제안된 손실들은 자연 이미지에서 더욱 일관된 재구성을 실현하게 하였다.

일반화된 허프변환의 임계값 선택을 위한 확률적 접근방식 (A Selection of Threshold for the Generalized Hough Transform: A Probabilistic Approach)

  • 장지영
    • 전자공학회논문지
    • /
    • 제51권1호
    • /
    • pp.161-171
    • /
    • 2014
  • 허프변환은 이미지 영역에서 패러미터 영역으로의 변환을 통해 주어진 이미지에서 모델 인스턴스를 추출해내는 방식으로 허프변환된 결과는 패러미터 영역 좌표에 해당하는 Cell 카운터들의 히스토그램 형태가 된다. 다음 단계로 임계값을 정한 후 이를 상회하는 카운터 값에 해당하는 패러미터 값을 통해 모델 인스턴스를 추출하게 되는데 일반적으로 그 임계값은 최고 Cell 카운터 값의 일정 부분에 해당하는 값을 주로 선택하게 된다. 임계점이 너무 낮을 경우 잘못된 모델 인스턴스를 추출할 가능성이 있으며(false positives) 반대로 너무 높은 임계점을 선택할 경우 존재하는 모델 인스턴스를 추출해내지 못하는 오류(false negatives)를 초래하게 된다. 본 논문에서는 일반화된 허프변환(Generalized Hough Transform) 적용 시 패러미터 영역에서의 Cell 카운터 값의 임계점 선택을 위한 방법으로 확률적인 접근방식을 제시하며 이를 위해 Cell 카운터 분포에 해당하는 조건부 확률을 도출하여 과학적인 임계점 선택이 가능함을 입증한다.

MOSFET의 부정합에 의한 출력옵셋 제거기능을 가진 윤곽검출용 시각칩의 설계 (Design of a Vision Chip for Edge Detection with an Elimination Function of Output Offset due to MOSFET Mismatch)

  • 박종호;김정환;이민호;신장규
    • 센서학회지
    • /
    • 제11권5호
    • /
    • pp.255-262
    • /
    • 2002
  • 인간의 망막은 효율적으로 주어진 물체의 윤곽을 검출할 수 있다. 본 연구에서는 윤곽검출에 관여하는 망막 세포의 기능을 전자회로로 모델링하여 윤곽검출기능을 가지는 CMOS 시각칩을 설계하였다. CMOS 제조공정 중에는 여러 가지 요인에 의해 MOSFET의 특성이 변화할 수 있으며, 특히 어레이로 구성되어 각 픽셀의 신호를 출력하는 readout 회로에서의 특성변화는 출력옵셋으로 나타난다. 하드웨어로 입력영상의 윤곽을 검출하는 시각칩은 다른 응용시스템의 입력단에 사용되므로 이러한 옵셋은 전체 시스템의 성능을 결정하는 중요한 요소이다. 본 연구에서는 이와 같은 출력단의 옵셋을 제거하기 위해 CDS(Correlated Double Sampling) 회로를 이용한 윤곽 검출용 시각칩을 설계하였다. 설계된 시각칩은 CMOS 표준공정을 이용하여 다른 회로와 집적화가 가능하며, 기존의 시각칩보다 신뢰성 있는 출력특성을 나타냄으로써, 물체의 윤곽을 이용하는 물체추적, 지문인식, 인간 친화적 로봇시스템등의 다양한 응용 시스템의 입력단으로 적용될 수 있을 것이다.