• 제목/요약/키워드: Hand Image Segmentation

검색결과 59건 처리시간 0.026초

Skin Segmentation Using YUV and RGB Color Spaces

  • Al-Tairi, Zaher Hamid;Rahmat, Rahmita Wirza;Saripan, M. Iqbal;Sulaiman, Puteri Suhaiza
    • Journal of Information Processing Systems
    • /
    • 제10권2호
    • /
    • pp.283-299
    • /
    • 2014
  • Skin detection is used in many applications, such as face recognition, hand tracking, and human-computer interaction. There are many skin color detection algorithms that are used to extract human skin color regions that are based on the thresholding technique since it is simple and fast for computation. The efficiency of each color space depends on its robustness to the change in lighting and the ability to distinguish skin color pixels in images that have a complex background. For more accurate skin detection, we are proposing a new threshold based on RGB and YUV color spaces. The proposed approach starts by converting the RGB color space to the YUV color model. Then it separates the Y channel, which represents the intensity of the color model from the U and V channels to eliminate the effects of luminance. After that the threshold values are selected based on the testing of the boundary of skin colors with the help of the color histogram. Finally, the threshold was applied to the input image to extract skin parts. The detected skin regions were quantitatively compared to the actual skin parts in the input images to measure the accuracy and to compare the results of our threshold to the results of other's thresholds to prove the efficiency of our approach. The results of the experiment show that the proposed threshold is more robust in terms of dealing with the complex background and light conditions than others.

HCI 시스템의 손 추적을 위한 수정 블록 정합 알고리즘 (The Modified Block Matching Algorithm for a Hand Tracking of an HCI system)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.9-14
    • /
    • 2003
  • GUI(Grophic User Interface) 기반의 상호작용은 컴퓨터를 더 사용하기 간단하고 쉽게 만들었다. 그러나 GUI 기반의 상호작용은 자연스럽고 직관적이며 적응적인 사용자의 요구사항을 만족시키기 위해 필요한 상호 작용 기능을 쉽게 지원하지는 못한다. 본 연구에서는 이미지 시퀀스에서 손을 추적하고 가상 현실에서 포인팅 장치로 마우스를 대체하기 위해 각 비디오 프레임에서 손을 인식하는데 유용한 방법인 수정 BMA를 제안했으며 이를 이용해 초당 30 프레임의 HCI 시스템을 구현했다. HCI 시스템을 구현하는데 가장 중요한 기준은 정확한 움직임 벡터 포착과 그의 실시한 처리이다. 수정 BMA는 실시간 처리를 위해 손의 위치, 움직임 방향을 고려한 손 영역을 분할, 손 영역의 색상 분포를 예측하는데 적용했다. 실험 결과는 YCbCr 좌표를 이용한 수정 BMA가 실시간 처리와 인식율을 보장함을 보여 준다. YCbCr 색상 좌표는 각 픽셀 색상의 휘도를 제거한 RGB 색상 좌표보다 더 적은 비트로 코딩 가능하며 주변 상황에 덜 민감하다. 수정 BMA를 이용한 손 추적은 가상현실, 게임과 장애인을 위한 HCI시스템 적용가능하다.

  • PDF

손과 얼굴의 피부색을 이용한 웹캠 게임 개발 (Development of Web-cam Game using Hand and Face Skin Color)

  • 오치민;;;김형관;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.60-63
    • /
    • 2008
  • 소니 아이토이는 Playstation 2에서 개발되었으며 웹캠을 이용하여 사람을 찾고 TV를 통해 게임속의 객체를 직접 터치하여 진행하는 게임이다. 기존의 비디오 게임 방식과 다르게 사용자가 게임 속에 실제적인 주인공으로 등장한다. 거울에 비친 모습처럼 자신의 모습이 게임 안에 나타나게 된다. 비록 이미 상용화되었고 잘 알려진 게임이지만 이러한 게임인터페이스는 사용자에게 흥미를 유도할 수 있는 장점이 있기 때문에 새롭게 개발 응용될 가능성이 많이 있다. 본 논문에서는 이러한 게임을 개발할 수 있는 환경을 개발하기 위해 피부색을 이용해 사람을 찾는 영상처리 과정, 게임 개발을 위한 그래픽, 게임인터페이스 설계과정을 연구하였다. 설계된 개발환경은 간단한 풍선 터뜨리는 게임을 통해 테스트되었다. 이 개발환경은 영상처리 기능 개선, 제스처인식 추가 등 앞으로 많은 발전 가능성이 있으며 곧 오픈되어 많은 개발자들이 시험적으로 사용할 수 있을 것이다.

  • PDF

Unsupervised feature learning for classification

  • Abdullaev, Mamur;Alikhanov, Jumabek;Ko, Seunghyun;Jo, Geun Sik
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.51-54
    • /
    • 2016
  • In computer vision especially in image processing, it has become popular to apply deep convolutional networks for supervised learning. Convolutional networks have shown a state of the art results in classification, object recognition, detection as well as semantic segmentation. However, supervised learning has two major disadvantages. One is it requires huge amount of labeled data to get high accuracy, the second one is to train so much data takes quite a bit long time. On the other hand, unsupervised learning can handle these problems more cheaper way. In this paper we show efficient way to learn features for classification in an unsupervised way. The network trained layer-wise, used backpropagation and our network learns features from unlabeled data. Our approach shows better results on Caltech-256 and STL-10 dataset.

  • PDF

Building DSMs Generation Integrating Three Line Scanner (TLS) and LiDAR

  • Suh, Yong-Cheol;Nakagawa , Masafumi
    • 대한원격탐사학회지
    • /
    • 제21권3호
    • /
    • pp.229-242
    • /
    • 2005
  • Photogrammetry is a current method of GIS data acquisition. However, as a matter of fact, a large manpower and expenditure for making detailed 3D spatial information is required especially in urban areas where various buildings exist. There are no photogrammetric systems which can automate a process of spatial information acquisition completely. On the other hand, LiDAR has high potential of automating 3D spatial data acquisition because it can directly measure 3D coordinates of objects, but it is rather difficult to recognize the object with only LiDAR data, for its low resolution at this moment. With this background, we believe that it is very advantageous to integrate LiDAR data and stereo CCD images for more efficient and automated acquisition of the 3D spatial data with higher resolution. In this research, the automatic urban object recognition methodology was proposed by integrating ultra highresolution stereo images and LiDAR data. Moreover, a method to enable more reliable and detailed stereo matching method for CCD images was examined by using LiDAR data as an initial 3D data to determine the search range and to detect possibility of occlusions. Finally, intellectual DSMs, which were identified urban features with high resolution, were generated with high speed processing.

LIDAR 데이터와 수치항공사진을 이용한 건물 자동추출 (Automatic Building Extraction Using LIDAR and Aerial Image)

  • 정재욱;장휘정;김유석;조우석
    • 대한공간정보학회지
    • /
    • 제13권3호
    • /
    • pp.59-67
    • /
    • 2005
  • 도시지역의 대부분을 차지하는 건물에 대한 3차원 공간정보는 지도제작뿐 아니라 무선 통신망 설계, 카 내비게이션, 가상도시 구축 등에 근간이 되는 주요 정보이다. 대표적인 수동센서(passive sensor)로부터 얻어진 수치항공사진은 높은 수평 위치정확도를 가지는 반면 중심투영과 폐색지역에 의한 원천적인 문제로 인하여 자동화 과정이 어렵다. 반면 능동센서인 LIDAR 시스템은 지표면에 대한 비정규 점군 형태의 3차원 정보를 빠르고 정확하게 제공한다. 하지만 데이터 취득 특성상 건물의 외곽선과 같은 정보의 획득에는 어려움이 있다. 본 연구에서는 수치항공사진과 LIDAR 데이터를 용합하여 건물의 외곽선을 자동으로 추출하는 방법을 제안하였다. 실험 결과 본 연구에서 제안한 방법은 복잡한 형태의 건물의 외곽선 추출에 우수한 결과를 보여주었으며, LIDAR 데이터와 수치항공사진을 이용해 건물을 자동으로 추출할 수 있는 가능성을 제시하였다.

  • PDF

흉부 엑스레이 영상에서 배경 제거 및 관심영역 분할 기법 (Background Removal and ROI Segmentation Algorithms for Chest X-ray Images)

  • 박진우;송병철
    • 전자공학회논문지
    • /
    • 제52권11호
    • /
    • pp.105-114
    • /
    • 2015
  • 본 논문은 흉부 엑스레이 영상에서 배경 제거 및 관심 영역을 분할하는 기법을 제안한다. 일반적으로 화질 개선 기법을 적용할 때 영상의 밝기 정보나 주파수 정보를 이용하여 영상 선명도와 대비를 개선하는 방법을 사용한다. 이러한 기법을 엑스레이 영상 전체에 적용하는 경우 배경과 같은 영상의 불필요한 정보 때문에 좋은 성능을 얻기 어렵다. 그래서 본 논문은 사용자가 원하는 영역에만 화질 개선 기법을 적용할 수 있도록 배경 제거 및 관심 영역 (ROI)을 분할하는 방법을 제안한다. 배경 제거를 위해 먼저 원본 영상의 히스토그램 분포를 분석하고 문턱치 처리로 몸체와 배경을 일차적으로 분리한다. 다음으로 유도 필터 (guided filter)를 이용하여 몸체 경계 혹은 배경 경계를 보정한다. 관심 영역 분할을 위해서는 먼저 폐의 위치 정보를 이용하여 폐의 주 밝기 값을 찾는다. 이를 이용하여 문턱치 처리를 한 후 번호 매김과 상기 배경 정보를 이용하여 분류 이외의 것을 제거한다. 마지막으로 폐만 검출된 이진영상을 통해 경계 상자 영역을 생성한다. 모의실험을 통해 제안하는 기법의 우수성을 검증하였다.

KOMPSAT 정사모자이크 영상으로부터 U-Net 모델을 활용한 농촌위해시설 분류 (Semantic Segmentation of Hazardous Facilities in Rural Area Using U-Net from KOMPSAT Ortho Mosaic Imagery)

  • 공성현;정형섭;이명진;이광재;오관영;장재영
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1693-1705
    • /
    • 2023
  • 국토 면적의 약 90%를 차지하는 농촌은 여러가지 공익적 기능을 수행하는 공간으로서 중요성과 가치가 증가하고 있지만 주거지 인근에 축사, 공장, 태양광패널 등 주민생활에 불편을 미치는 시설들이 무분별하게 들어서면서 농촌 환경과 경관이 훼손되고 주민 삶의 질이 낮아지고 있다. 농촌지역의 무질서한 개발을 방지하고 농촌 공간을 계획적으로 관리하기 위해서는 농촌지역 내 위해시설에 대한 탐지 및 모니터링이 필요하다. 주기적으로 취득 가능하고 전체 지역에 대한 정보를 얻을 수 있는 위성영상을 통해 데이터의 취득이 가능하고, 합성곱 신경망 기법을 통한 영상 기반 딥러닝 기술을 활용하여 효과적인 탐지가 가능하다. 따라서 본 연구에서는 의미적 분할(Semantic segmentation)에서 높은 성능을 보이는 U-Net 모델을 이용하여 농촌 지역에서 잠재적으로 위해시설이 될 수 있는 농촌시설을 분류하는 연구를 수행하였다. 본 연구에서는 2020년에 제작된 공간해상도 0.7 m의 KOMPSAT 정사모자이크 광학영상을 한국항공우주연구원으로부터 제공받아 사용하였으며 축사, 공장, 태양광 패널에 대한 AI 학습용 데이터를 직접 제작하여 학습 및 추론을 진행하였다. U-Net을 통해 학습시킨 결과 픽셀 정확도(pixel accuracy)는 0.9739, mean Intersection over Union (mIOU)은 0.7025의 값을 도출하였다. 본 연구 결과는 농촌 지역의 위험 시설물 모니터링에 활용될 수 있으며, 농촌계획 수립에 있어 기초 자료로 활용될 수 있을 것으로 기대된다.

영상처리 시스템을 이용한 닭 도체 부위 분할 알고리즘 개발 (Development of Chicken Carcass Segmentation Algorithm using Image Processing System)

  • 조성호;이효재;황정호;최선;이호영
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.446-452
    • /
    • 2021
  • 우리나라 생활수준의 향상과 더불어 식품소비의 양적인 요구가 충족되면서, 세분화된 식품의 기호 성향을 충족시킬 수 있는 닭고기 소비가 증가하고 있다. 2003년 3월 축산물 품질평가원에서 고시(농림부 고시 제2003-14호)한 닭 도체 품질판정세부기준은 닭 도체 부위별 이물질 부착, 피·멍의 크기 및 중량에 따라 품질 등급을 기준을 제시하였다. 그러나 현실적으로 검사관 개개인의 주관적인 평가 기준으로 적용된 고시로 수천 마리의 닭 도체 등급판정을 유지하기가 어려운 문제점을 가지고 있다. 본 논문에서는 닭 도체 품질 세부기준에 따라 닭 도체 부위 분할하기 위해 비접촉/비파괴방식인 컴퓨터 시각 기술 알고리즘을 제안한다. 제안된 알고리즘은 실시간으로 빠르게 움직이는 닭 도체를 부위 분할하기 위하여 조명 외란에 강인하도록 보정하는 과정과 닭 도체와 배경을 구분하기 위한 EM(Expectation maximization), Erosion 및 Labeling 알고리즘, 그리고 닭 도체의 기하학적 형태를 분석하여 부위별 특징점을 찾고 점들의 위치를 계산하여 부위를 분할 할 수 있는 알고리즘을 사용하였다. 총 78마리의 닭 도체 샘플에 대하여 제안한 영상처리 알고리즘을 적용한 결과 닭 도체 부위 분할 알고리즘이 효과적임을 알 수 있었다.

인터랙티브 미디어 플랫폼 콕스에 제공될 4가지 얼굴 변형 기술의 비교분석 (Comparison Analysis of Four Face Swapping Models for Interactive Media Platform COX)

  • 전호범;고현관;이선경;송복득;김채규;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제22권5호
    • /
    • pp.535-546
    • /
    • 2019
  • Recently, there have been a lot of researches on the whole face replacement system, but it is not easy to obtain stable results due to various attitudes, angles and facial diversity. To produce a natural synthesis result when replacing the face shown in the video image, technologies such as face area detection, feature extraction, face alignment, face area segmentation, 3D attitude adjustment and facial transposition should all operate at a precise level. And each technology must be able to be interdependently combined. The results of our analysis show that the difficulty of implementing the technology and contribution to the system in facial replacement technology has increased in facial feature point extraction and facial alignment technology. On the other hand, the difficulty of the facial transposition technique and the three-dimensional posture adjustment technique were low, but showed the need for development. In this paper, we propose four facial replacement models such as 2-D Faceswap, OpenPose, Deekfake, and Cycle GAN, which are suitable for the Cox platform. These models have the following features; i.e. these models include a suitable model for front face pose image conversion, face pose image with active body movement, and face movement with right and left side by 15 degrees, Generative Adversarial Network.