• Title/Summary/Keyword: image feature extraction

검색결과 1,017건 처리시간 0.037초

경사도 맵과 채도 특징을 이용한 적응적 피부영역 검출에 관한 연구 (A Study on Adaptive Skin Extraction using a Gradient Map and Saturation Features)

  • 황대동;이근수
    • 한국산학기술학회논문지
    • /
    • 제15권7호
    • /
    • pp.4508-4515
    • /
    • 2014
  • 실시간 인체 검출에 대한 관심이 높아짐에 따라 피부색을 통한 인체 검출에 대한 연구가 활발히 진행되고 있다. 하지만 대다수 기존 피부 탐지 방법은 정적인 피부색 모델을 이용하기 때문에 색왜곡이 발생한 영상에서 낮은 탐지율을 보인다. 이에 본 논문에서는 경사도 맵과 채도의 특징, K-평균 클러스터링 알고리즘을 이용하여 피부영역을 탐지하는 기법을 제시한다. 제안하는 방법의 기본적인 절차는 경사도 맵 생성, 피부영역에서 발견되는 경사도 특징의 추출, 피부의 채도 특징을 이용한 잡음 제거, 추출된 영역의 색상정보 군집화 수행, 클러스터 정보를 이용한 피부영역 탐지, 결과 검증 순이다. 이방법은 색상 이외의 특징을 이용하여 조명, 인종, 나이, 개인차 등에 상관없이 강건하게 피부를 탐지하는 것에 중점을 두고 있다. 실험을 통하여 기존의 주요 방법들 보다 탐지 결과가 10% 이상 높게 나타남을 확인할 수 있다.

멀티 레이저 라인 조사를 이용한 비등속 이동물체의 3차원 형상 복원 (3D surface Reconstruction of Moving Object Using Multi-Laser Stripes Irradiation)

  • 이영열;예수영;남기곤
    • 대한전자공학회논문지SP
    • /
    • 제44권2호
    • /
    • pp.144-152
    • /
    • 2007
  • 본 논문에서는 멀티 레이저 라인 조사 방법을 이용한 능동적 비젼(Active Vision)의 방법으로 비등속 이동물체의 표면을 효율적으로 모델링 하는 방법을 제안한다. 레이저 라인을 물체에 조사하고 레이저가 조사된 방향과 각도를 달리한 방향에서 이를 관찰하면 레이저 라인이 표면의 굴곡에 따라 휘어지는 현상을 관찰할 수 있다. 이를 삼각기법(triangulation method)을 이용하여 분석하면 물체의 표면 3차원 정보 획득이 가능하다. 기존에 대표적 구조화 조명기법인 단일 라인(single stripe) 기법과 단일 프레임(single frame) 기법의 장단점과 제안하는 멀티 라인 기법의 장점을 설명하고 정밀도를 높이기 위한 레이저 라인의 효율적 배치에 대하여 설명한다. 강인한 레이저 라인의 추출을 위하여, 레이저 라인 피크 검출기법과 색 분석을 통해 얻은 레이저 반응도를 함께 이용하는 방법을 소개하였고, 효과적인 레이저 라인의 라벨링 기법을 새로 제안하였다. 개별 3차원 복원 표면을 전체영상으로 표현하기 위하여 동기화 정보 획득에 영상 간 특징점 매칭을 활용한 영상 정합 기법을 접목하였다. 3차원 표면 모델링 기술을 최종적으로 컨테이너 표면 데미지 검사에 활용하여 제안 3D 모델링 기술의 우수성을 확인하였다.

동적 베이스망 기반의 양손 제스처 인식 (Dynamic Bayesian Network based Two-Hand Gesture Recognition)

  • 석흥일;신봉기
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.265-279
    • /
    • 2008
  • 손 제스처를 이용한 사람과 컴퓨터간의 상호 작용은 오랜 기간 많은 사람들이 연구해 오고 있으며 커다란 발전을 보이고 있지만, 여전히 만족스러운 결과를 보이지는 못하고 있다. 본 논문에서는 동적 베이스망 프레임워크를 이용한 손 제스처 인식 방법을 제안한다. 유선 글러브를 이용하는 방법들과는 달리, 카메라 기반의 방법에서는 영상 처리와 특징 추출 단계의 결과들이 인식 성능에 큰 영향을 미친다. 제안하는 제스처 모델에서의 추론에 앞서 피부 색상 모델링 및 검출과 움직임 추적을 수행한다. 특징들간의 관계와 새로운 정보들을 쉽게 모델에 반영할 수 있는 동적 베이스망을 이용하여 두 손 제스처와 한 손 제스처 모두를 인식할 수 있는 새로운 모델을 제안한다. 10가지 독립 제스처에 대한 실험에서 최대 99.59%의 높은 인식 성능을 보였다. 제안하는 모델과 관련 방법들은 수화 인식과 같은 다른 문제들에도 적용 가능할 것으로 판단된다.

MPEG-7 기반 DCT영역에서의 에지히스토그램 고속 추출 기법 (Fast Extraction of Edge Histogram in DCT Domain based on MPEG-7)

  • 엄민영;최윤식;원치선;남재열
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.19-26
    • /
    • 2006
  • 오늘날 대부분의 멀티미디어 데이터는 압축된 형태로 저장되고 전송된다. MPEG-7 에지 히스토그램 기술자는 공간영역에서 특정정보를 추출하기 때문에 특정정보추출을 위해 필요로 되는 복호화과정과 공간영역에서의 필터링 과정은 특정추출시간 과 연산량을 증가시키는 원인이 된다. 영상 검색 효율을 높이기 위하여 본 논문에서는 DCT 영역에서 직접적으로 에지 히스토그램을 추출하는 기법을 제안한다. OCT 계수들 중 AC 계수로부터 얻을 수 있는 에지에 대한 정보를 이용하여 DCT 영역에서 직접적으로 에지의 방향과 강도를 구한다. 실험결과는 제안하는 기법을 통해 검색 효율과 연산량에서 모두 만족할만한 결과를 얻을 수 있음을 보여준다.

깊이 정보를 활용한 사람의 피부영역 검출 (Human Skin Region Detection Utilizing Depth Information)

  • 장석우;박영재;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.29-36
    • /
    • 2012
  • 본 논문에서는 입력되는 3차원의 정지 또는 동적인 입체영상으로부터 색상과 깊이 특징을 결합하여 인간의 피부색상 영역을 강건하게 추출하는 새로운 방법을 제안한다. 제안된 방법에서는 먼저 스테레오 정합 기법을 이용하여 입력된 좌우 영상으로부터 카메라와 물체 사이의 거리를 나타내는 깊이 특징을 강건하게 추출한다. 그런 다음, 유사한 깊이 특징을 가지는 화소들을 레이블링하고, 레이블링한 영역 중에서 인간의 피부색상 분포를 가지는 영역들을 실제적인 피부색상 영역이라고 판단한다. 실험에서는 2차원 위주의 기존의 피부영역 추출 방법과 제안된 3차원의 특징을 활용한 방법의 성능을 정확도 측면에서 비교 및 평가하였다. 그 결과 제안된 방법은 색상 특징과 깊이 특징을 효과적으로 결합함으로써 기존의 배경 영역에서 부정확하게 검출되는 피부색상 영역의 오류를 상당수 제거하는 효과를 가지며, 이로 인해 전반적으로 보다 정확하게 피부영역을 추출하였다.

ASM의 성능향상을 위한 형태 정렬 방식 제안 (Proposing Shape Alignment for an Improved Active Shape Model)

  • 한희일
    • 한국멀티미디어학회논문지
    • /
    • 제15권1호
    • /
    • pp.63-70
    • /
    • 2012
  • 본 논문에서는 ASM(active shape model)의 성능을 향상시키기 위하여 형태(shape) 정렬 방법과 이차원 특징벡터 추출 방법을 제안한다. 기존 알고리즘은 입력 이미지의 중간 검출 랜드마크와 기준 모델 간의 정렬을 위하여 스케일, 회전, 이동 정보 만을 이용한다. 하지만 위의 평면적인 정보 만으로는 얼굴과 같이 입체적인 물체의 포즈 변화나 삼차원적인 움직임 등을 제대로 반영할 수 없다. 이를 개선하기 위하여 자유도를 증가시킴으로써 형태의 복잡한 변화에 보다 강인한 형태정렬 방식을 제안한다. 또한, 멀티스케일로 이차원 프로파일을 구하고 이들의 공분산 행렬을 trimming하여 검출속도를 향상시키는 방법을 제안한다. 비교적 다양한 포즈로 촬영한 얼굴 이미지 데이터베이스를 이용하여 제안 알고리즘의 형태 검출 성능을 확인한다.

Classification of Leukemia Disease in Peripheral Blood Cell Images Using Convolutional Neural Network

  • Tran, Thanh;Park, Jin-Hyuk;Kwon, Oh-Heum;Moon, Kwang-Seok;Lee, Suk-Hwan;Kwon, Ki-Ryong
    • 한국멀티미디어학회논문지
    • /
    • 제21권10호
    • /
    • pp.1150-1161
    • /
    • 2018
  • Classification is widely used in medical images to categorize patients and non-patients. However, conventional classification requires a complex procedure, including some rigid steps such as pre-processing, segmentation, feature extraction, detection, and classification. In this paper, we propose a novel convolutional neural network (CNN), called LeukemiaNet, to specifically classify two different types of leukemia, including acute lymphoblastic leukemia (ALL) and acute myeloid leukemia (AML), and non-cancerous patients. To extend the limited dataset, a PCA color augmentation process is utilized before images are input into the LeukemiaNet. This augmentation method enhances the accuracy of our proposed CNN architecture from 96.9% to 97.2% for distinguishing ALL, AML, and normal cell images.

지상사진 도해법을 이용한 도로시설물 정보추출 (Extraction of Road Facility Information Using Graphic Solution)

  • 손덕재;이혜진;이승환
    • 대한공간정보학회지
    • /
    • 제10권2호
    • /
    • pp.77-85
    • /
    • 2002
  • 본 연구는 도해법을 이용하여 지형공간정보체계(GIS)에 사용되는 도로시설물의 공간정보와 속성정보를 획득하는 방법에 관한 연구이다. 지상사진은 사진기의 정확한 위치선정과 대상물에 대한 방향의 전환 및 반복적인 촬영이 용이하여 도로시설물 정보취득에 많은 활용가능성을 가지고 있다. 본 연구에서는 도로시설물에 대한 신속한 정보취득을 요하는 경우나, 비교적 높은 정확도를 요하지 않는 경우를 상정하여 단사진 영상을 위주로 해석하였으며, 엄밀한 사진측량에 의한 공간정보의 취득이 불가능한 경우에 활용할 수 있는 기법을 개발하고자 하였다. 본 연구의 결과 도로시설물의 평면도 작성과 제원 등 공간정보와 속성정보를 효과적으로 추출할 수 있었다.

  • PDF

3D Rendering of Magnetic Resonance Images using Visualization Toolkit and Microsoft.NET Framework

  • Madusanka, Nuwan;Zaben, Naim Al;Shidaifat, Alaaddin Al;Choi, Heung-Kook
    • Journal of Multimedia Information System
    • /
    • 제2권2호
    • /
    • pp.207-214
    • /
    • 2015
  • In this paper, we proposed new software for 3D rendering of MR images in the medical domain using C# wrapper of Visualization Toolkit (VTK) and Microsoft .NET framework. Our objective in developing this software was to provide medical image segmentation, 3D rendering and visualization of hippocampus for diagnosis of Alzheimer disease patients using DICOM Images. Such three dimensional visualization can play an important role in the diagnosis of Alzheimer disease. Segmented images can be used to reconstruct the 3D volume of the hippocampus, and it can be used for the feature extraction, measure the surface area and volume of hippocampus to assist the diagnosis process. This software has been designed with interactive user interfaces and graphic kernels based on Microsoft.NET framework to get benefited from C# programming techniques, in particular to design pattern and rapid application development nature, a preliminary interactive window is functioning by invoking C#, and the kernel of VTK is simultaneously embedded in to the window, where the graphics resources are then allocated. Representation of visualization is through an interactive window so that the data could be rendered according to user's preference.

웹 응용을 위한 MPEC-4 얼굴 애니메이션 파라미터 추출 및 구현 (Extraction and Implementation of MPEG-4 Facial Animation Parameter for Web Application)

  • 박경숙;허영남;김응곤
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1310-1318
    • /
    • 2002
  • 본 연구에서는 기존의 방법에 비하여 값비싼 3차원 스캐너나 카메라를 이용하지 않고 정면과 측면 영상을 이용하여 3차원 모델을 생성하는 3차원 얼굴 모델러와 애니메이터를 개발하였다. 이 시스템은 특정한 플랫폼과 소프트웨어에 독립적으로 웹상에서 애니메이션 서버에 접속함으로써 3차원 얼굴 모델을 애니메이션 할 수 있으며 자바 3D API를 이용하여 구현하였다. 얼굴모델러는 입력 영상으로부터 MPEG-4 FDP(Facial Definition Parameter) 특징점을 추출하여 일반 얼굴모델을 특징점에 따라 변형시켜 3차원 얼굴 모델을 생성한다 애니메이터는 FAP(Facial Animation Parameter)에 따라 얼굴모델을 애니메이션하고 렌더링한다. 본 시스템은 웹 상에서 아바타를 제작하는 데 사용될 수 있다.