• 제목/요약/키워드: 직접 객체 인식

검색결과 59건 처리시간 0.027초

손그림을 통한 의류검색 시스템 (Development of Hand-drawn Clothing Matching System)

  • 임호균;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.553-554
    • /
    • 2021
  • 온라인 쇼핑 시장의 규모나 나날이 증가하고 있는 추세이다. 이러한 시장 경제 속에서 사용자들을 유지하기 위해 저마다 다른 독자적이 서비스를 제공하고 있으며 서비스 경쟁의 노력 중 하나로 이미지 검색을 사용하는 사이트가 늘어나고 있다. 하지만 기존의 이미지 검색을 의류 쇼핑몰에 그대로 적용할 경우 사용자가 검색하고자 하는 의류가 해당 사이트에 존재하지 않거나 검색을 위한 이미지를 소유하고 있지 않은 경우 기존 텍스트 형식의 검색 시스템을 그대로 이용해야 하는 등의 문제들이 존재한다. 이에 본 논문에서는 사용자가 직접 그린 그림을 이용한 '손그림 의류 검색 시스템'을 제안하였다. 본 시스템을 기존의 텍스트와 이미지에 국한되어 있던 검색 경험과 별개로 그림으로 검색을 시도함으로써 사용자에게 폭넓은 검색 경험을 제공할 수 있을 것으로 기대한다.

  • PDF

모바일 로봇을 위한 엣지 컴퓨팅에서의 실시간 2D/3D 객체인식 (Real time 2D/3D Object Detection on Edge Computing for Mobile Robot)

  • 김재영 ;문형필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1161-1162
    • /
    • 2023
  • 모바일 로봇의 자율주행을 위하여 인터넷이 제약된 환경에서도 가능한 Edge computing 에서의 Object Detection 이 필수적이다. 본 논문에서는 이를 위해 Orin 보드에서 YOLOv7 과 Complex_YOLOv4 를 구현하였다. 직접 취득한 데이터를 통해 YOLOv7 을 구현한 결과 0.56 의 mAP 로 프레임당 133ms 가 소요되었다. Kitti Dataset 을 통해 Complex_YOLOv4 를 구현한 결과 0.88 의 mAP 로 프레임당 236ms 가 소요되었다. Comple_YOLOv4 가 YOLOv7 보다 더 많은 데이터를 예측하기에 시간은 더 소요되지만 높은 정확성을 가지는 것을 확인할 수 있었다.

A Study on the Gesture Based Virtual Object Manipulation Method in Multi-Mixed Reality

  • Park, Sung-Jun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권2호
    • /
    • pp.125-132
    • /
    • 2021
  • 본 논문에서 혼합현실에서 공동 작업을 위한 환경 구축에 대한 연구와 웨어러블 IOT 디바이스와 연동하기 위한 방법을 제안한다. 혼합현실은 가상현실과 증강현실의 혼합되어진 형태로서 실세계와 가상세계의 물체가 동시에 보이고, 가상현실과 달리 멀미 현상이 일어나지 않고 무선 방식이라 산업현장에서 적용될 기술로 주목 받고 있다. 마이오 웨어러블 디바이스는 삼축 센서, 근전도 센서, 가속도 센서를 이용하여 팔의 회전 트래킹과 손 제스처 인식을 가능하게 하는 디바이스이다. 혼합현실 관련 다양한 연구가 진행되고 있지만 여러 사람이 함께 혼합 현실 참여할 수 있는 환경 구축, 가상 객체를 직접 손으로 조작하는 것에 대한 논의는 미비한 상황이다. 본 논문에서는 실제 산업 현장에서 혼합 현실을 적용하기 위해 공동 작업이 가능한 환경 구축 방법에 대해 연구하였고, 상호작용이 원활하게 이루어지기 위한 인터랙션 방법에 대해 논의하였다. 그 결과 2인이 동시에 혼합현실 환경에 참여하여 객체에 대한 일원화된 객체를 공유할 수 있었고, 마이오 웨어러블 인터페이스 장비를 가지고 각자 인터랙션 할 수 있는 환경을 조성하였다.

몰입형 가상현실에서 손 기반 인터페이스의 비교 실험에 관한 연구 (A Study on Comparative Experiment of Hand-based Interface in Immersive Virtua Reality)

  • 김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권2호
    • /
    • pp.1-9
    • /
    • 2019
  • 본 연구는 몰입형 가상현실에서의 상호작용 과정에서 사용자의 몰입을 높여 향상된 현존감을 제공하는 손 기반 인터페이스에 대한 비교 실험을 진행한다. 몰입형 가상현실에서 사용자에게 장비의 부담을 최소화하면서 동시에 손을 보다 직접적으로 사용하여 가상 환경과 객체를 제어할 수 있는 몰입형 체험 환경을 제공하기 위하여 손 동작 인식 센서 기반 상호작용과 컨트롤러 기반 상호작용의 두 가지 실험 인터페이스를 설계한다. 손 동작 인식 센서 기반 상호작용은 VR (virtual reality) HMD (head mounted display) 외에 추가적인 장비를 사용하는 대신 정확한 손의 움직임과 직접적인 제스쳐 및 동작 표현을 가상 환경에 반영한다. 컨트롤러 기반 상호작용은 VR HMD와 함께 제공되는 컨트롤러를 쉽게 활용할 수 있도록 손의 제스쳐와 컨트롤러의 키를 매핑시킨 일반화된 인터페이스를 설계한다. 이러한 과정을 통해 본 연구는 손을 활용한 가상현실에서의 상호작용이 사용자의 편리함과 직관성에 측면에서 현존감에 미치는 영향을 비교 실험을 통해 확인한다.

미소 픽셀을 갖는 비행 객체 인식을 위한 데이터베이스 구축 및 관리시스템 연구 (Database Generation and Management System for Small-pixelized Airborne Target Recognition)

  • 이호섭;신희민;심현철;조성욱
    • 항공우주시스템공학회지
    • /
    • 제16권5호
    • /
    • pp.70-77
    • /
    • 2022
  • 본 논문에서, 데이터베이스 생성 및 관리 시스템은 미소 픽셀 공중 표적 인식을 위해 제안된다. 제안된 시스템은 1)비행 테스트 비디오 프레임에 의한 직접 이미지 추출, 2) 자동 이미지 보관, 3) 이미지 데이터 레이블링 및 메타 데이터 주석, 4) 컬러 채널 변환, 5) HOG/LBP 기반 소화소 대상 증강 이미지 데이터 생성의 다섯가지 주요 기능으로 구성된다. 제안하는 프로그램은 파이썬 기반의 PyQt5와 OpenCV를 이용하여 구성하였고 공중 표적 인식을 위한 이미지 데이터셋은 제안한 시스템을 이용해 생성했으며 비행 실험으로 부터 수집된 영상을 입력영상으로 사용하였다.

최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 알고리즘 설계 (Design of Optimized pRBFNNs-based Face Recognition Algorithm Using Two-dimensional Image and ASM Algorithm)

  • 오성권;마창민;유성훈
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.749-754
    • /
    • 2011
  • 본 연구에서는 최적 pRBFNNs 패턴분류기 기반 2차원 영상과 ASM 알고리즘을 이용한 얼굴인식 시스템을 설계하고자 한다. 기존의 2차원 영상 기반 얼굴 인식 기법들은 인식하고자 하는 객체의 영상내의 위치, 크기 및 배경의 존재 유무에 따라 인식률이 영향을 받는 단점이 있으며, 본 연구에서는 이를 보완하기 위하여 관심 영역 내에서의 얼굴 영역 추출 및 특징 추출기법을 이용한 얼굴인식 방법을 소개한다. 본 연구에서는 CCD 카메라를 이용하여 영상을 획득하고 히스토그램 평활화를 이용하여 조명으로 왜곡된 영상정보를 개선한다. AdaBoost 알고리즘을 이용하여 얼굴영역을 검출하고 ASM을 통하여 얼굴 윤곽선 및 형상을 추출하여 개인 프로필을 구성한 후 PCA 알고리즘을 사용하여 고차원 얼굴데이터의 차원을 축소한다. 그리고 인식 모듈로서 pRBFNNs 패턴분류기를 제안한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 구성되어 있고 조건부는 퍼지 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 또한 차분진화 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉, 학습률, 모멘텀 계수, 퍼지 클러스터링의 퍼지화 계수를 최적화한다. 제안된 다항식 기반 RBFNNs는 얼굴 인식을 위한 패턴분류기로서 직접 CCD 카메라로부터 입력받은 데이터를 영상 보정, 얼굴 검출 및 특징 추출 등과 같은 데이터 전 처리 과정을 포함하여 고차원 데이터로 이루어진 얼굴 영상에 대한 인식 성능을 확인한다.

순천만 갯벌 영상에서 게 영역 추출 방법 (Crab Region Extraction Method from Suncheon Bay Tidal Flat Images)

  • 박상현
    • 한국전자통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1197-1206
    • /
    • 2019
  • 순천만은 매우 중요한 자연자원으로 환경오염으로부터 이를 보호하기 위한 노력들이 이루어지고 있다. 순천만 갯벌에 서식하는 생물들을 주기적으로 관찰하여 환경의 변화를 모니터링하는 사업이 진행되고 있으나 사람이 직접 관찰하는 비효율적인 방법으로 이루어지고 있다. 본 논문에서는 갯벌에 서식하는 생물들을 자동으로 모니터링하기 위한 방법에 적용될 수 있는 객체 분할 방법을 제안한다. 제안하는 방법에서는 차 영상을 이용하여 객체의 위치 정보를 나타내는 전경 맵을 구하고, 영상의 세밀한 경계 검출을 위해 슈퍼픽셀 방법을 적용한다. 전경 맵과 슈퍼픽셀 정보를 이용하여 최종적으로 갯벌 영상에서 게의 영역을 추출한다. 실험 결과는 제안하는 방법이 간단하면서도 정확하게 갯벌 영상에서 게 영역을 분리하는 것을 보여준다.

행동기반 사물 감지를 통한 위급상황 확인 시스템 개발 (Development of Checking System for Emergency using Behavior-based Object Detection)

  • 김민제;고규한;조재춘
    • 융합정보논문지
    • /
    • 제10권6호
    • /
    • pp.140-146
    • /
    • 2020
  • 기존의 방범 시스템은 피해자가 직접 구조를 요청하거나 인근 제 3자에 의해 도움을 받아야 하는 구조이기 때문에 신속하게 대응이 불가능한 상황에서는 경우에 따라 적절한 도움을 받기 힘들다. 본 연구에서는 Deep Learning과 OpenCV를 활용한 자동 구조 요청 모델을 제안하고 시스템을 개발하였다. 본 연구는 사용자의 안전을 보장할 수 있어야 하기 때문에 신속히 정확한 결과를 도출할 수 있어야 한다는 전제 조건이 밑바탕 되어 객체의 정확성은 약 99% 이상을 확인할 수 있었으며 모든 알고리즘이 종료되는 데까지의 소요 시간을 약 3초까지 단축시킬 수 있었다. 다양한 위협 요소와 예측 불가능한 특수한 경우 등 모든 위험 상황을 인식하기 위해 다양한 종류의 위협 요소와 많은 양의 데이터를 수집하여 예기치 못한 상황에도 대처할 수 있도록 강화하여야 할 것이다.

Segmentation 기반 전동킥보드 주차/비주차 구역 분류 기술의 개발 (Development of segmentation-based electric scooter parking/non-parking zone classification technology)

  • 조용현;최진영
    • 융합보안논문지
    • /
    • 제23권5호
    • /
    • pp.125-133
    • /
    • 2023
  • 본 논문은 공유형 전동킥보드 시스템 운영 시, 관리 상 발생할 수 있는 주차 문제를 해결하기 위해 반납 인증사진으로 주차, 비주차 구역을 판단하는 AI모델을 제시한다. 본 연구에서는 주차/비주차 구역 배경 관련 객체를 판별하기 위해 ADE20K에 Pre_trained된 Segfomer_b0 모델과 점자블록, 전동킥보드에 Fine_tuning한 Segfomer_b0 모델을 통해 주차/비주차에 관련된 객체의 Segmentation map을 추출하고, Swin 모델을 통해 주차/비주차 구역을 이진 분류하는 방법을 제시하였다. 최종적으로 총 1,689장을 직접 라벨링한 후 진행한 Fine_tuning SegFomer 모델은 mAP가 81.26% 수준으로 전동킥보드와 점자블록을 인식하였으며, 총 2,817장을 훈련한 Classification 모델은 92.11%의 정확도와 91.50%의 F1-Score로 주차구역과 비주차 구역을 분류하는 것이 가능하였다.

손과 얼굴의 피부색을 이용한 웹캠 게임 개발 (Development of Web-cam Game using Hand and Face Skin Color)

  • 오치민;;;김형관;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.60-63
    • /
    • 2008
  • 소니 아이토이는 Playstation 2에서 개발되었으며 웹캠을 이용하여 사람을 찾고 TV를 통해 게임속의 객체를 직접 터치하여 진행하는 게임이다. 기존의 비디오 게임 방식과 다르게 사용자가 게임 속에 실제적인 주인공으로 등장한다. 거울에 비친 모습처럼 자신의 모습이 게임 안에 나타나게 된다. 비록 이미 상용화되었고 잘 알려진 게임이지만 이러한 게임인터페이스는 사용자에게 흥미를 유도할 수 있는 장점이 있기 때문에 새롭게 개발 응용될 가능성이 많이 있다. 본 논문에서는 이러한 게임을 개발할 수 있는 환경을 개발하기 위해 피부색을 이용해 사람을 찾는 영상처리 과정, 게임 개발을 위한 그래픽, 게임인터페이스 설계과정을 연구하였다. 설계된 개발환경은 간단한 풍선 터뜨리는 게임을 통해 테스트되었다. 이 개발환경은 영상처리 기능 개선, 제스처인식 추가 등 앞으로 많은 발전 가능성이 있으며 곧 오픈되어 많은 개발자들이 시험적으로 사용할 수 있을 것이다.

  • PDF