• 제목/요약/키워드: Color computer vision

검색결과 214건 처리시간 0.021초

실내 환경에서 RGB-D 센서를 통한 객체 추적 알고리즘 제안 (Object tracking algorithm through RGB-D sensor in indoor environment)

  • 박정탁;이솔;박병서;서영호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.248-249
    • /
    • 2022
  • 본 논문에서는 RGB-D 카메라를 이용하여 획득한 다중 사용자의 정보를 기반으로 대상을 구분 및 추적하는 기법을 제안한다. RGB-D 카메라를 통해 획득한 3차원 정보와 색상 정보를 획득하여 각 사용자에 대한 정보를 저장한다. 전체 영상에서 획득한 각 사용자의 위치와 외형에 대한 정보를 통해 현재 프레임과 이전 프레임에서의 사용자간 유사도를 계산하여 전체 영상에서의 사용자 구분 및 위치 추적 알고리즘을 제안한다.

  • PDF

위성 영상의 효과적인 분석을 위한 밝기와 크로스 엔트로피 기반의 그림자 검출 (Shadow Detection Based Intensity and Cross Entropy for Effective Analysis of Satellite Image)

  • 박기홍
    • 한국항행학회논문지
    • /
    • 제20권4호
    • /
    • pp.380-385
    • /
    • 2016
  • 그림자는 자연 영상에서 관찰되는 물리적인 현상이지만 위성 영상 분석에 부정적인 영향을 미치는 요소로 컴퓨터 비전의 전처리 과정에서 그림자 검출 과정은 매우 중요하다. 본 논문에서는 싱글 영상 기반의 위성 영상에서 효과적인 영상 분석을 위해 그림자를 검출하는 방법으로 크로스 엔트로피와 밝기 영상을 이용해 그림자를 검출하는 방법을 제안하였다. 칼라 영상을 그레이 레벨 영상으로 변환한 후 크로스 엔트로피를 기반으로 최적의 임계값을 추정하여 첫 번째 그림자 후보 영역으로 판별하였고, 칼라 영상의 밝기 영상을 이용해 최종 그림자 영역을 검출하였다. 제안하는 방법의 타당성을 위해 위성 영상들을 대상으로 실험하였고, 실험 결과 제안하는 그림자를 검출 방법이 효과적으로 수행됨을 확인하였다.

Design of a Recognizing System for Vehicle's License Plates with English Characters

  • Xing, Xiong;Choi, Byung-Jae;Chae, Seog;Lee, Mun-Hee
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제9권3호
    • /
    • pp.166-171
    • /
    • 2009
  • In recent years, video detection systems have been implemented in various infrastructures such as airport, public transportation, power generation system, water dam and so on. Recognizing moving objects in video sequence is an important problem in computer vision, with applications in several fields, such as video surveillance and target tracking. Segmentation and tracking of multiple vehicles in crowded situations is made difficult by inter-object occlusion. In the system described in this paper, the mean shift algorithm is firstly used to filter and segment a color vehicle image in order to get candidate regions. These candidate regions are then analyzed and classified in order to decide whether a candidate region contains a license plate or not. And then some characters in the license plate is recognized by using the fuzzy ARTMAP neural network, which is a relatively new architecture of the neural network family and has the capability to learn incrementally unlike the conventional BP network. We finally design a license plate recognition system using the mean shift algorithm and fuzzy ARTMAP neural network and show its performance via some computer simulations.

영상의 색상 분포 정합을 이용한 얼굴 검출 알고리즘 (Face Detection Algorithm Using Color Distribution Matching)

  • 권성근
    • 한국멀티미디어학회논문지
    • /
    • 제16권8호
    • /
    • pp.927-933
    • /
    • 2013
  • OpenCV (Open Computer Vision)에서 제공하는 얼굴 인식 알고리즘에서는 Haar 특징(Haar feature)들과 대상 영상의 정합 과정인 Haar 매칭 (Haar Matching)을 통하여 얼굴을 검출하는데, 이때 Haar 특징들은 정면 얼굴로 구성된 훈련 영상을 통해 학습된다. 따라서 OpenCV의 얼굴 검출 방법은 정면 얼굴에 대해서는 높은 얼굴 검출율을 보이지만, 정면을 응시하지 않거나 얼굴의 형태가 변형된 경우에는 얼굴을 정확하게 검출하지 못하는 경우가 빈번히 발생한다. 본 논문에서는 측면 얼굴 혹은 형태가 변형된 얼굴에서도 컬러 히스토그램의 분포 특성은 유사하다고 가정하고, 히스토그램 패턴 매칭(histogram pattern matching)을 이용한 얼굴 검출 방법을 제안한다. 제안한 방법에서는 Haar 매칭 오류가 발생한 프레임에 대하여, 정확하게 검출된 이전 프레임의 얼굴 영역에 대한 히스토그램 패턴 매칭을 통하여 가장 유사한 히스토그램 분포를 갖는 영역을 얼굴로 인식한다. 제안한 방법의 얼굴 검출 알고리즘의 성능을 평가하기 위한 모의실험에서 제안한 얼굴 검출 방법이 OpenCV보다 얼굴 검출율이 8% 정도 향상됨을 확인하였다.

다중의 특징 분석을 통한 비 유사 영역의 자동적인 검출 (Automatic Detection of Dissimilar Regions through Multiple Feature Analysis)

  • 장석우;정명희
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.160-166
    • /
    • 2020
  • 모바일 기반의 하드웨어 기술이 발전함에 따라 많은 종류의 응용 프로그램들이 개발되고 있다. 그리고 이런 응용프로그램들의 인터페이스가 올바르게 동작하는지를 자동으로 검사하려는 수요가 증가하고 있다. 본 논문에서는 입력되는 여러 가지 유형의 영상으로부터 주요한 특징의 비교 분석을 통해서 응용 프로그램의 실행 오류 화면을 강인하게 검출하는 접근 방법을 제시한다. 본 논문에서 제시된 방법에서는 먼저 입력되는 영상으로부터 영상을 대표하는 주요한 다중의 특징을 추출한다. 그런 다음, 추출된 다중의 특징의 차이를 비교함으로써 입력된 영상이 목표 영상과 동일한 정상적인 영상인지, 아니면 목표 영상과 유사하지만 서로 다른 오류 영상인지를 효과적으로 판단한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 종류의 영상으로부터 주요한 다중의 특징 비교를 통해서 정상적인 영상과 오류가 발생한 영상을 정확하게 검출한다는 것을 보여준다. 본 논문에서 제안된 접근 방법은 비디오 색인, 객체 검출 및 추적, 영상 감시 등과 같은 컴퓨터 비전과 관련된 많은 실제 응용 분야에서 유용하게 사용될 것으로 기대된다.

Real-time Human Pose Estimation using RGB-D images and Deep Learning

  • 림빈보니카;성낙준;마준;최유주;홍민
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.113-121
    • /
    • 2020
  • Human Pose Estimation (HPE) which localizes the human body joints becomes a high potential for high-level applications in the field of computer vision. The main challenges of HPE in real-time are occlusion, illumination change and diversity of pose appearance. The single RGB image is fed into HPE framework in order to reduce the computation cost by using depth-independent device such as a common camera, webcam, or phone cam. However, HPE based on the single RGB is not able to solve the above challenges due to inherent characteristics of color or texture. On the other hand, depth information which is fed into HPE framework and detects the human body parts in 3D coordinates can be usefully used to solve the above challenges. However, the depth information-based HPE requires the depth-dependent device which has space constraint and is cost consuming. Especially, the result of depth information-based HPE is less reliable due to the requirement of pose initialization and less stabilization of frame tracking. Therefore, this paper proposes a new method of HPE which is robust in estimating self-occlusion. There are many human parts which can be occluded by other body parts. However, this paper focuses only on head self-occlusion. The new method is a combination of the RGB image-based HPE framework and the depth information-based HPE framework. We evaluated the performance of the proposed method by COCO Object Keypoint Similarity library. By taking an advantage of RGB image-based HPE method and depth information-based HPE method, our HPE method based on RGB-D achieved the mAP of 0.903 and mAR of 0.938. It proved that our method outperforms the RGB-based HPE and the depth-based HPE.

PROTOTYPE AUTOMATIC SYSTEM FOR CONSTRUCTING 3D INTERIOR AND EXTERIOR IMAGE OF BIOLOGICAL OBJECTS

  • Park, T. H.;H. Hwang;Kim, C. S.
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2000년도 THE THIRD INTERNATIONAL CONFERENCE ON AGRICULTURAL MACHINERY ENGINEERING. V.II
    • /
    • pp.318-324
    • /
    • 2000
  • Ultrasonic and magnetic resonance imaging systems are used to visualize the interior states of biological objects. These nondestructive methods have many advantages but too much expensive. And they do not give exact color information and may miss some details. If it is allowed to destruct some biological objects to get the interior and exterior information, constructing 3D image from the series of the sliced sectional images gives more useful information with relatively low cost. In this paper, PC based automatic 3D model generator was developed. The system was composed of three modules. One is the object handling and image acquisition module, which feeds and slices objects sequentially and maintains the paraffin cool to be in solid state and captures the sectional image consecutively. The second is the system control and interface module, which controls actuators for feeding, slicing, and image capturing. And the last is the image processing and visualization module, which processes a series of acquired sectional images and generates 3D graphic model. The handling module was composed of the gripper, which grasps and feeds the object and the cutting device, which cuts the object by moving cutting edge forward and backward. Sliced sectional images were acquired and saved in the form of bitmap file. The 3D model was generated to obtain the volumetric information using these 2D sectional image files after being segmented from the background paraffin. Once 3-D model was constructed on the computer, user could manipulate it with various transformation methods such as translation, rotation, scaling including arbitrary sectional view.

  • PDF

비젼 카메라를 이용한 멀티 터치 입력 장치 (Visual Multi-touch Input Device Using Vision Camera)

  • 서효동;주영훈
    • 한국지능시스템학회논문지
    • /
    • 제21권6호
    • /
    • pp.718-723
    • /
    • 2011
  • 본 논문에서는 비젼 카메라를 이용한 비주얼 멀티 터치 입력 장치를 제안한다. 제안된 입력 장치는 비젼 카메라를 이용하므로 기존 스마트 폰에서 사용하는 터치 스크린 입력 장치에 비해 non-touch로 명령을 입력할 수 있다는 장점이 있다. 또한, 제안된 장치는 컴퓨터 계산 시간이 짧아 실시간 구현이 가능하고, 카메라외에 다른 장치가 필요 없으므로 존재하는 입력장치보다 싸다는 장점이 있다. 이를 위해, 먼저, HSV 컬러 모델과 라벨링 방법을 이용한 영상 처리 알고리즘을 제안한다. 그 다음, 손이 움직이는 영역의 정확성을 개선하기위해, 기하학적인 특징점, 동심원, 칼만 필터에 기본한 움직임 인식 알고리즘을 제안한다. 마지막으로, 제안된 장치는 비디오 게임, 스마트 TV, 컴퓨터등을 원격으로 제어할 수 있음을 실험을 통해 보인다.

인체의 구조적 특성과 역운동학을 이용한 모션 캡처 (Motion Capture using both Human Structural Characteristic and Inverse Kinematics)

  • 서융호;두경수;최종수;이칠우
    • 대한전자공학회논문지SP
    • /
    • 제47권2호
    • /
    • pp.20-32
    • /
    • 2010
  • 기존 모션 캡쳐의 경우, 고가의 장비나 사용의 복잡도, 동작자의 움직임 제한 등 모션 캡쳐의 어려움이 있었다. 최근 실시간으로 모션 캡쳐가 가능한 컴퓨터 비젼 기반 시스템에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 다시점 영상으로부터 쉽고, 빠르게 추출할 수 있는 피부색과 정확한 3차원 복원을 위한 2차원 영상 좌표 보정을 사용하여 효율적인 다시점 영상 분석 알고리즘을 제안한다. 동작자의 피부색을 검출하고, 카메라 보정 및 에피폴라 기하학 정보를 이용하여 보다 정확한 영상 분석, 그라고 칼만 필터(Kalman filter)를 사용한 추적 등을 통해 보다 안정적인 모션 캡쳐가 가능하게 된다. 실험결과를 통하여, 제안된 방법은 보다 정확한 위치 추정 및 살시간 모션 캡쳐를 위한 알고리즘임을 보여주고 있다.

칼라 상관관계 역투영법을 적용한 효율적인 객체 지역화 기법 (Efficient Object Localization using Color Correlation Back-projection)

  • 이용환;조한진;이준환
    • 디지털융복합연구
    • /
    • 제14권5호
    • /
    • pp.263-271
    • /
    • 2016
  • 이미지 내에서 객체를 검출하고 해당 위치를 추출하는 지역화 기법은 컴퓨터 비전에서 많이 활용되는 기술이다. 기존 연구들은 하나의 객체를 대상으로 위치 검출을 수행하지만, 실제 사진에서는 다수의 유사 객체를 포함하는 경우가 많기 때문에, 활용에 한계가 있다. 이러한 문제를 해결하기 위해, 본 논문에서는 이미지 인식을 위해 객체 지역화의 새로운 알고리즘을 제안한다. 제안 알고리즘은 YCbCr 색채 성분에서 코렐로그램 역투영 기법을 활용하여 객체 지역화 문제를 해결한다. 제안 알고리즘에서는 질의 이미지의 객체가 포함되는 이미지의 위치를 검출할 수 있으며, 다수의 유사 객체가 존재할 경우 포함되는 객체 개수 정보 없이도 유사 후보 객체의 영역과 위치를 검출할 수 있다. 제안 알고리즘의 성능을 평가할 실험 결과, 기존에 연구된 방법에 비해, 21%의 성능 향상을 보였다. 이러한 결과를 통해, 색상 코렐로그램이 히스토그램 기법보다 성능적 우위를 보였다. 본 논문의 주요 공헌은 색 공간과 공간-색상 정보를 통해 객체 지역화 문제를 해결할 수 있는 또다른 기술을 제시한 것으로 학문적 기여를 검증하였다.