• 제목/요약/키워드: 물체 검출

검색결과 678건 처리시간 0.023초

물체 파지점 검출 향상을 위한 분할 기반 깊이 지도 조정 (Segmentation-Based Depth Map Adjustment for Improved Grasping Pose Detection)

  • 신현수;무하마드 라힐 아파잘;이성온
    • 로봇학회논문지
    • /
    • 제19권1호
    • /
    • pp.16-22
    • /
    • 2024
  • Robotic grasping in unstructured environments poses a significant challenge, demanding precise estimation of gripping positions for diverse and unknown objects. Generative Grasping Convolution Neural Network (GG-CNN) can estimate the position and direction that can be gripped by a robot gripper for an unknown object based on a three-dimensional depth map. Since GG-CNN uses only a depth map as an input, the precision of the depth map is the most critical factor affecting the result. To address the challenge of depth map precision, we integrate the Segment Anything Model renowned for its robust zero-shot performance across various segmentation tasks. We adjust the components corresponding to the segmented areas in the depth map aligned through external calibration. The proposed method was validated on the Cornell dataset and SurgicalKit dataset. Quantitative analysis compared to existing methods showed a 49.8% improvement with the dataset including surgical instruments. The results highlight the practical importance of our approach, especially in scenarios involving thin and metallic objects.

이차원 영상의 라인 드로잉 (Line Drawings from 2D Images)

  • 손민정;이승용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권12호
    • /
    • pp.665-682
    • /
    • 2007
  • 라인 드로잉은 적은 표현으로 물체에 대찬 많은 정보를 줄 수 있다는 점 때문에 비사실적 렌더링 분야에서 중요시되고 있다. 하지만 라인 드로잉에 대한 연구는 이차원 영상에 비해 물체에 대한 정보가 충분한 삼차원 모델을 대상으로 주로 이루어졌다. 본 논문에서는 이차원 영상을 라인 드로잉 형태로 표현하는 효과적인 방법을 제시한다. 이를 위한 알고리즘은 크게 필터링, 선 연결, 스타일화 세 단계로 나뉜다. 필터링 단계에서는 영상의 어느 부분에 선이 그려질지를 우도 함수를 이용하여 예상한다. 선 연결 단계에서 필터링 결과를 클러스터링 및 그래프 검색을 이용하여 연결, 라인 스트로크들을 찾아낸다. 마지막 스타일화 단계에서는 찾아낸 라인 스트로크들을 곡선 근사, 텍스쳐 매핑 등을 이용하여 여러 비사실적 렌더링 형태로 표현한다. 이러한 방법을 이용하여 실제 이차원 영상에서 라인 스트로크를 얻고, 디테일 제어를 적용하여 여러 가지 원하는 스타일의 라인 드로잉을 만들 수 있다.

초음파 및 가속도 센서를 이용한 시각장애인용 보행보조 장치의 성능 개선 (Improvement of An Electronic Aid for the Blind using Ultrasonic and Acceleration Sensors)

  • 김래현;박세형;이수용;조현철;하성도
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.291-297
    • /
    • 2009
  • 본 논문은 시각장애인들의 실외 보행 시 위험한 장애물을 탐지하여 진동으로 경고해주고, 필요에 따라 물체의 색상과 주변의 자기를 음성으로 알려주는 SmartWand 개발에 관한 것이다. 이 기기는 시각장애인들이 널리 사용하는 횐 지팡이에 쉽게 탈 부착할 수 있는 형태로 횐 지팡이로 감지할 수 없는 사각지대의 장애물을 초음파로 탐지하여 경고해주며, 컬러센서와 조도센서를 이용하여 물체의 색상과 주변의 밝기를 음성으로 알려주는 기능을 가지고 있다 SmartWand는 1, 2차 버전으로 개발되었는데, 2차 버전에서는 1차 버전의 사용성 평가 결과를 토대로 무게 및 크기를 줄여 실용성을 개선시켰으며, 가속도 센서를 통해 초음파 센서의 탐지 범위를 조정하여 시각장애인이 횐 지팡이의 타법을 행할 때 진행방향에 놓인 장애물만을 탐지할 수 있도록 하였다. 또한 지팡이로 땅을 칠 때의 충격으로 인한 초음파센서의 오동작을 제거하기 위한 필터를 사용하였다 이러한 기능들은 다양한 환경에서 실험을 통해 적절한 인자들을 결정하였다.

물체의 윤곽선 검출을 위한 Adaptive Window적용에 관한 연구 (A Study on Applying the Adaptive Window to Detect Objects Contour)

  • 양환석;서요한;강창원;박찬란;이웅기
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.57-67
    • /
    • 1998
  • 영상에서 관심 있는 물체의 윤곽선을 추출하기 위해서 Kass등은 Snakes라고 불리우는 능동적 윤곽선 모델(active contour model)을 제안하였다. 이 모델은 속도가 느리며 초기화에 민감하다. 이 문제를 개선하기 위해 Gunn은 두 개의 초기화를 이용하여 정확한 윤곽선을 추출하고 초기화에 덜 민감하도록 하였다. 이 방법은 기존의 다른 방법에 비해 정확한 윤곽선을 추출할 수 있었으나, 속도면에서는 상당히 효율적이지 못하고 잡음에 민감하였다. 본 논문에서는 이 문제를 해결하기 위하여 snakes을 이루는 각 윤곽점에 $8{\times}8$크기의 윈도우를 적용하여 윈도우내의 화소에 대해서만 에너지 최소화 알고리즘을 적용하였다. 그리고 영상내에 존재하는 잡음에 덜 민감하도록 하기 위해 윈도우를 각 윤곽점에서의 기울기에 대해 수직 방향으로 이동시키는 방법을 제안한다.

  • PDF

3차원체의 MT응답에 미치는 층상대지의 효과 (An Effect of Layered Earth on Magnetotelluric Responses of Three-Dimensional Bodies)

  • 김희준;홍철훈
    • 자원환경지질
    • /
    • 제27권5호
    • /
    • pp.491-498
    • /
    • 1994
  • 2층구조 대지속에 존재하는 유한 크기의 불균질체로 인한 지자기 지전류 (MT) 응답을 적분방정식법으로 계산하였다. 적분방정식은 입사전자장과 3차원물체 내부의 산란전류를 층상대지에 적합한 전기적 텐서 그린함수를 통하여 연결시킨다. 본 논문에서는 3차원체의 MT응답에 미치는 표층과 기반층의 영향에 대하여 검토하였다. 표층은 탐사대상물의 검출을 방해하는 효과를 가지며 그 효과는 표층의 전기비저항이 높을 때보다 낮을 때가 더 뚜렷하다. 한편 기반은 상층의 3차원체에 인한 MT이상을 높이는 효과를 가져올 수도 있다. 전기비저항이 높은 기반이 존재하면 물체에 의한 전류의 미소변동은 보다 전기비저항이 낮은 상층에 한정되는 경향이 있다.

  • PDF

집적 영상을 이용한 가려진 표적의 복원과 인식 (Occluded Object Reconstruction and Recognition with Computational Integral Imaging)

  • 이동수;염석원;김신환;손정영
    • 한국광학회지
    • /
    • 제19권4호
    • /
    • pp.270-275
    • /
    • 2008
  • 본 논문에서는 집적 영상의 획득과 복원을 통하여 장애물에 가려진 물체를 인식하는 기술은 제안하고 구현하였다. 집적 영상의 복원은 해당되는 화소 세기의1차 확률적 특성인 평균으로 구한다. 복원평면까지의 거리는 2차 확률적 특성인 표준 편차를 이용하여 구하고3차원 물체의 경계(edge)를 검출한다. 표준 편차의 합을 최소로 하는 거리에서 복원된 영상을 표적인식에 이용한다. 표적인식은 주성분 분석(principle component analysis, PCA) 분류기를 복원된 영상에 적용하였다. 표적 분류에 대한 판정은 분류기에 의해서 투영된 클래스의 평균 특징 벡터와 테스트 특징 벡터간의 유클리드 거리(Euclidean distance)를 이용한다. 실험 및 시뮬레이션을 통하여 가려진 표적을 본 논문에서 제안한 방법을 통하여 오차 없이 분류하였다.

시맨틱 갭을 줄이기 위한 딥러닝과 행위 온톨로지의 결합 기반 이미지 검색 (Image retrieval based on a combination of deep learning and behavior ontology for reducing semantic gap)

  • 이승;정혜욱
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권11호
    • /
    • pp.1133-1144
    • /
    • 2019
  • 최근 스마트 기기의 발전으로 인터넷상에 존재하는 이미지 데이터의 양이 급속하게 증가하는 상황에서 효과적인 이미지 검색을 위한 다양한 방법들이 연구되고 있다. 기존의 이미지 검색 방법들은 이미지에 존재하는 물체들을 단순하게 검출하여 각 물체들의 라벨 정보에 근거한 검색을 수행하기 때문에 사용자가 원하는 이미지와 검색 결과로 얻은 이미지 간에 의미적 차이인 시맨틱 갭(Semantic Gap)이 발생된다. 이미지 검색에서 발생하는 시맨틱 갭을 줄이기 위해, 본 논문에서는 딥러닝 기반의 다중 객체 분류 모듈과 사람의 행위를 분류하는 모듈을 연결하고, 이 모듈들에 행위 온톨로지를 결합하였다. 즉, 딥러닝과 행위 온톨로지의 결합을 기반으로 객체들 간의 연관성을 고려한 이미지 검색 시스템을 제안한다. 이미지에 포함된 동적인 행위를 고려하기 위해 Walking과 Running 데이터를 이용하여 실험한 결과를 분석하였다. 제안한 방법은 향후 이미지 검색 결과의 정확도를 높일 수 있는 영상의 자동 주석 생성 연구에 확장하여 적용할 수 있다.

경량화된 임베디드 시스템에서 의미론적인 픽셀 분할 마스킹을 이용한 효율적인 영상 객체 인식 기법 (Efficient Object Recognition by Masking Semantic Pixel Difference Region of Vision Snapshot for Lightweight Embedded Systems)

  • 윤희지;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.813-826
    • /
    • 2022
  • 카메라를 이용한 영상 처리와 그에 따른 인공지능 기술의 발달로 다양한 분야의 기술이 발전하기 시작했다. 하지만 보드가 가벼울수록 연산이 많이 필요한 영상 처리 알고리즘을 구현하기 힘들다. 본 논문에서는 경량 임베디드 보드에서 물체 인식 알고리즘을 위한 딥러닝을 사용하는 방법을 제안한다. 비교적 적은 양의 계산으로 segmentation을 처리하는 딥러닝 알고리즘을 사용하여 ROI(Region of Interest)를 결정할 수 있다. 영역을 마스킹한 후, 더 정확한 딥러닝 알고리즘을 사용해 물체 감지를 할 수 있다. Python에서 입력 이미지를 처리하기 위해 OpenCV를 사용했고 ENet과 YOLO(You Only Look Once)를 사용하여 이미지를 처리했다. 이 알고리즘을 실행함으로써 평균 오차가 절반으로 감소해 정확한 객체 검출을 처리할 수 있고 경량 임베디드 보드에서 실시간으로 객체 인식을 실행할 수 있다. 이 연구는 자율주행과 IoT에서 저가격 경량화된 응용에 활용될 수 있을 것으로 기대된다.

생활패턴 인지가 가능한 스마트 레이더 시스템 (Smart Radar System for Life Pattern Recognition)

  • 정상중
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.91-96
    • /
    • 2022
  • 현재 카메라 기반 기술 수준으로는 센서 기반 기본 생활패턴 인지 기술은 정확한 데이터를 얻기 위해서는 불편함을 감수해야 하고, 상용화 밴드 제품은 정확한 데이터 수집이 어려우며, 행동의 동기와 원인 및 심리적 영향 등을 고려하지 못하는 실정이다. 본 논문에서는 생활패턴 인지를 위한 레이더 기술은 일상생활에서 주변의 사람이나 물체를 탐지하기 위해 고안된 파형을 전송하여 반사되어 오는 수신 신호를 신호 처리함으로써 물체와의 거리, 속도, 각도를 측정하는 기술을 적용하여 기존 영상 기반의 서비스에서의 사생활 보호와 같은 이슈를 보완할 수 있도록 고안하였다. 제안 시스템의 구현을 위해 TIIWR1642 칩을 기반으로 60GHz 대역 밀리미터파 FMCW 송신/수신을 위한 RF 칩셋제어, 거리/속도/각도 검출을 위한 모듈의 개발 및 신호처리 소프트웨어를 포함한 기술을 구현하였다. 생활 정보에 대한 메타 분석으로 생활패턴의 정량적 분석을 통해 개인별 맞춤형 생활패턴 추출을 통해 자기 관리 및 행동 시퀀스를 산출하여 개인별 생활패턴의 분석이 보안 및 안전 응용서비스로 가능할 것으로 기대된다.

Computer Vision-Based Measurement Method for Wire Harness Defect Classification

  • Yun Jung Hong;Geon Lee;Jiyoung Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.77-84
    • /
    • 2024
  • 본 논문에서는 컴퓨터 비전을 사용하여 6가지 측정값(눌린 단자의 길이, 단자 끝의 치수(폭), 눌린부분(와이어 부분, 코어 부분)의 폭)을 계산하여 와이어 하네스의 결함을 정확하고 빠르게 탐지할 것을 제안한다. 두 가지 유형의 데이터에서 Harris 코너 검출을 활용하여 물체의 위치를 탐지하고 측정 영역별 특징과 배경과 물체 사이의 음영 차이를 활용하여 각 샘플의 기울기를 반영하는 측정값을 추출하기 위한 기준점을 생성한다. 이후 유클리드 거리 방법과 보정 계수를 사용하여 예측값을 계산하는 방법을 통해 와이어의 위치 변화에 관계 없이 측정값을 예측할 수 있다. 각 측정 유형별로 99.1%, 98.7%, 92.6%, 92.5%, 99.9%, 99.7% 정확도를 달성하였으며, 모든 측정값에서 평균 97%의 정확도로 우수한 결과를 얻었다. 해당 검사 방법은 기존 검사 방법인 육안 검사의 문제점을 보완하고, 작은 양의 데이터만을 이용하여 우수한 결과를 도출 가능하다. 또한 이미지 처리만 이용하기 때문에 딥러닝 방법보다 더 적은 데이터와 비용으로 적용 가능할 것으로 기대된다.