• 제목/요약/키워드: image feature extraction

검색결과 1,017건 처리시간 0.025초

에이다부스트 알고리즘을 이용한 인체 영역의 강인한 검출 (Robust Detection of Body Areas Using an Adaboost Algorithm)

  • 장석우;변시우
    • 한국산학기술학회논문지
    • /
    • 제17권11호
    • /
    • pp.403-409
    • /
    • 2016
  • 최근 들어, 나체 사진이나 그림과 같은 유해한 영상 콘텐츠가 쉽게 유통 및 보급되고 있는 실정이어서 이런 유해 영상 콘텐츠를 효과적으로 검출하고 필터링하기 위한 연구 방법들이 지속적으로 소개되고 있다. 따라서 본 논문에서는 입력되는 칼라 영상으로부터 영상의 유해성을 나타내는 요소인 사람의 배꼽 영역을 하르-라이크(Haar-like) 특징과 에이다부스트(Adaboost) 알고리즘을 이용하여 강인하게 검출하는 새로운 접근 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 입력 영상으로부터 색상 정보를 이용하여 사람의 유두 영역을 검출하고, 검출된 유두 영역과의 위치 정보를 사용하여 배꼽의 후보 영역을 검출한다. 그런 다음, 하르-라이크 특징과 에이다부스트 알고리즘을 이용한 필터링을 통해 실제 배꼽 영역들만을 검출한다. 실험 결과에서는 제안된 방법이 입력되는 칼라 영상으로부터 배꼽 영역을 기존의 방법보다 1.6% 더 정확하게 추출한다는 것을 보여준다. 본 논문에서 제안된 배꼽 영역 검출 알고리즘은 2 차원이나 3 차원의 유해 콘텐츠 검출 및 필터링과 관련된 여러 가지 응용 분야에서 매우 효과적으로 이용될 것으로 기대된다.

손 제스처 기반의 애완용 로봇 제어 (Hand gesture based a pet robot control)

  • 박세현;김태의;권경수
    • 한국산업정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.145-154
    • /
    • 2008
  • 본 논문에서는 애완용 로봇에 장착된 카메라로부터 획득된 연속 영상에서 사용자의 손 제스처를 인식하여 로봇을 제어하는 시스템을 제안한다. 제안된 시스템은 손 검출, 특징 추출, 제스처 인식 로봇 제어의 4단계로 구성된다. 먼저 카메라로부터 입력된 영상에서 HSI 색상공간에 정의된 피부색 모델과 연결성분 분석을 이용하여 손 영역을 검출한다. 다음은 연속 영상에서 손 영역의 모양과 움직임에 따른 특징을 추출한다. 이때 의미 있는 제스처의 구분을 위해 손의 모양을 고려한다. 그 후에 손의 움직임에 의해 양자화된 심볼들을 입력으로 하는 은닉 마르코프 모델을 이용하여 손 제스처는 인식된다. 마지막으로 인식된 제스처에 대응하는 명령에 따라 애완용 로봇이 동작하게 된다. 애완용 로봇을 제어하기 위한 명령으로 앉아, 일어서, 엎드려, 악수 등의 제스처를 정의하였다. 실험결과로 제안한 시스템을 이용하여 사용자가 제스처로 애완용 로봇을 제어 할 수 있음을 보였다.

  • PDF

Fast and Accurate Rigid Registration of 3D CT Images by Combining Feature and Intensity

  • June, Naw Chit Too;Cui, Xuenan;Li, Shengzhe;Kim, Hak-Il;Kwack, Kyu-Sung
    • Journal of Computing Science and Engineering
    • /
    • 제6권1호
    • /
    • pp.1-11
    • /
    • 2012
  • Computed tomography (CT) images are widely used for the analysis of the temporal evaluation or monitoring of the progression of a disease. The follow-up examinations of CT scan images of the same patient require a 3D registration technique. In this paper, an automatic and robust registration is proposed for the rigid registration of 3D CT images. The proposed method involves two steps. Firstly, the two CT volumes are aligned based on their principal axes, and then, the alignment from the previous step is refined by the optimization of the similarity score of the image's voxel. Normalized cross correlation (NCC) is used as a similarity metric and a downhill simplex method is employed to find out the optimal score. The performance of the algorithm is evaluated on phantom images and knee synthetic CT images. By the extraction of the initial transformation parameters with principal axis of the binary volumes, the searching space to find out the parameters is reduced in the optimization step. Thus, the overall registration time is algorithmically decreased without the deterioration of the accuracy. The preliminary experimental results of the study demonstrate that the proposed method can be applied to rigid registration problems of real patient images.

Land Use Feature Extraction and Sprawl Development Prediction from Quickbird Satellite Imagery Using Dempster-Shafer and Land Transformation Model

  • Saharkhiz, Maryam Adel;Pradhan, Biswajeet;Rizeei, Hossein Mojaddadi;Jung, Hyung-Sup
    • 대한원격탐사학회지
    • /
    • 제36권1호
    • /
    • pp.15-27
    • /
    • 2020
  • Accurate knowledge of land use/land cover (LULC) features and their relative changes over upon the time are essential for sustainable urban management. Urban sprawl growth has been always also a worldwide concern that needs to carefully monitor particularly in a developing country where unplanned building constriction has been expanding at a high rate. Recently, remotely sensed imageries with a very high spatial/spectral resolution and state of the art machine learning approaches sent the urban classification and growth monitoring to a higher level. In this research, we classified the Quickbird satellite imagery by object-based image analysis of Dempster-Shafer (OBIA-DS) for the years of 2002 and 2015 at Karbala-Iraq. The real LULC changes including, residential sprawl expansion, amongst these years, were identified via change detection procedure. In accordance with extracted features of LULC and detected trend of urban pattern, the future LULC dynamic was simulated by using land transformation model (LTM) in geospatial information system (GIS) platform. Both classification and prediction stages were successfully validated using ground control points (GCPs) through accuracy assessment metric of Kappa coefficient that indicated 0.87 and 0.91 for 2002 and 2015 classification as well as 0.79 for prediction part. Detail results revealed a substantial growth in building over fifteen years that mostly replaced by agriculture and orchard field. The prediction scenario of LULC sprawl development for 2030 revealed a substantial decline in green and agriculture land as well as an extensive increment in build-up area especially at the countryside of the city without following the residential pattern standard. The proposed method helps urban decision-makers to identify the detail temporal-spatial growth pattern of highly populated cities like Karbala. Additionally, the results of this study can be considered as a probable future map in order to design enough future social services and amenities for the local inhabitants.

에지 및 컬러 양자화를 이용한 모바일 폰 카메라 기반장면 텍스트 검출 (Mobile Phone Camera Based Scene Text Detection Using Edge and Color Quantization)

  • 박종천;이근왕
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.847-852
    • /
    • 2010
  • 자연 영상 내에 포함된 텍스트는 영상의 다양하고 중요한 특징을 갖는다. 그러므로 텍스트를 검출하고 추출하여 인식하는 것이 중요한 연구대상으로 연구되고 있다. 최근 모바일 폰 카메라를 기반으로 다양한 분야에서 많은 응용 기술이 연구 개발되고 있다. 본 논문은 에지 및 연결요소를 이용한 장면 텍스트 검출 방법을 제안한다. 그레이스케일 영상으로부터 에지 성분 검출과 지역적 표준편차를 이용하여 텍스트 영역의 경계선을 검출하고, RGB 컬러공간의 유클리디안 거리를 기준으로 연결요소를 검출한다. 검출된 에지 및 연결요소를 레이블링하고 각각 영역의 외곽사각형을 구한다. 텍스트의 휴리스틱 이용하여 후보 텍스트를 추출한다. 후보 텍스트 영역을 병합하여 하나의 후보 텍스트 영역을 생성하고, 후보 텍스트의 지역적 인접성과 구조적 유사성으로 후보 텍스트를 검증함으로서 최종적인 텍스트 영역을 검출하였다. 실험결과 에지 및 컬러 연결요소 특징을 상호 보완함으로서 텍스트 영역의 검출률을 향상시켰다.

Haar-like 특징을 이용한 고성능 보행자 및 차량 인식 회로 설계 (Design of High-performance Pedestrian and Vehicle Detection Circuit using Haar-like Features)

  • 김수진;박상균;이선영;조경순
    • 정보처리학회논문지A
    • /
    • 제19A권4호
    • /
    • pp.175-180
    • /
    • 2012
  • 본 논문은 Haar-like 특징을 이용한 고성능 보행자 및 차량 인식 회로를 제안한다. 제안하는 회로는 영상의 매 프레임 마다 슬라이딩 윈도우를 적용하여 Haar-like 특징을 추출하고 보행자 및 차량을 인식한다. Haar-like 특징 추출 회로는 슬라이딩 윈도우 당 200개의 Haar-like 특징을 추출하며, 추출된 특징들은 AdaBoost 인식 회로에서 사용된다. 제안하는 회로는 속도 향상을 위해 병렬 회로 구조를 적용하였으며 두 개의 슬라이딩 윈도우가 동시에 보행자 또는 차량을 인식한다. 제안하는 고성능 보행자 및 차량 인식 회로는 Verilog HDL로 설계하였으며 130nm 표준 셀 라이브러리를 이용하여 게이트 수준의 회로로 합성하였다. 합성된 회로는 1,388,260개의 게이트로 구성되며 최대 동작 주파수는 203MHz이다. 제안하는 회로는 $640{\times}480$ 영상을 초당 약 47.8장 처리할 수 있기 때문에 보행자와 차량을 실시간으로 인식하기 위해 사용될 수 있다.

Modified Local Directional Pattern 영상을 이용한 얼굴인식 (Face Recognition using Modified Local Directional Pattern Image)

  • 김동주;이상헌;손명규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권3호
    • /
    • pp.205-208
    • /
    • 2013
  • 일반적으로 이진패턴 변환은 조명 변화에 강인한 특성을 가지므로, 얼굴인식 및 표정인식 분야에 널리 사용되고 있다. 이에, 본 논문에서는 기존의 LDP(Local Directional Pattern)의 텍스처 성분을 개선한 MLDP(Modified LDP) 변환 영상에 2D-PCA(Two-Dimensional Principal Component Analysis) 알고리즘을 결합한 조명변화에 강인한 얼굴인식 방법에 대하여 제안한다. 기존의 LBP(Local Binary Pattern)나 LDP와 같은 이진패턴 변환들이 히스토그램 특징 추출을 위해 주로 사용되는 것과는 다르게, 본 논문에서 제안하는 방법은 MLDP 영상을 2D-PCA 특징추출을 위해 직접 사용한다는 특성을 갖는다. 제안 방법의 성능평가는 PCA(Principal Component Analysis), 2D-PCA 및 가버변환 영상과 LBP를 결합한 알고리즘을 사용하여, 다양한 조명변화 환경에서 구축된 Yale B 및 CMU-PIE 데이터베이스를 이용하여 수행되었다. 실험 결과, MLDP 영상과 2D-PCA를 사용한 제안 방법이 가장 우수한 인식 성능을 보임을 확인하였다.

컨테이너 플래카드 자동 인식 시스템 (Automatic Container Placard Recognition System)

  • 허경용;이임건
    • 한국정보통신학회논문지
    • /
    • 제23권6호
    • /
    • pp.659-665
    • /
    • 2019
  • 컨테이너 표면에는 적재된 화물의 위험 여부에 따라 다양한 플래카드가 부착된다. 위험물이 적재된 컨테이너는 일반 컨테이너 별도로 관리되어야 하므로 항만 자동화 시스템의 일부로 플래카드 자동 인식에 대한 수요가 생겨나고 있다. 이 논문에서는 컨테이너의 후면을 촬영한 영상에서 플래카드의 형태적인 특징을 이용하여 자동으로 플래카드 영역을 추출하고 이를 인식하는 시스템을 제안한다. 플래카드 인식에서는 특히 컨테이너의 표면 굴곡에 의해 다양한 왜곡이 발생할 수 있으므로 영역 추출 및 인식 과정에서 주의가 필요하다. 제안하는 시스템은 플래카드가 다이아몬드 형태를 가지며, 클래스 번호가 아래 꼭지점 바로 위에 기입된다는 특징을 사용하여 관심 영역을 자동으로 추출하고, 플래카드를 자동으로 인식할 수 있다. 제안하는 시스템을 실제 이미지에 적용하였을 때 오류 없이 플래카드를 인식할 수 있었으며, 사용한 영상 분석 기법은 다양한 영상 분석 시스템에 적용될 수 있다.

골격을 이용한 문자 인식을 위한 지역경계 연산 (Regional Boundary Operation for Character Recognition Using Skeleton)

  • 유석원
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.361-366
    • /
    • 2018
  • 학습 데이터를 구성하는 각각의 문자들에 대해 서로 다른 글자체들을 픽셀 단위로 더해서 MASK를 만들고, 해당 MASK에 속하는 픽셀값들을 세 영역으로 나눈다. 실험 데이터를 골격 형태로 수정하고, 지역 경계 연산을 사용하여 수정된 실험 데이터의 배경 중에서 문자의 골격에 인접한 배경 영역을 구분하는 경계를 만든다. 수정된 실험 데이터와 MASK들 간의 불일치 정도를 계산해서 최소값을 가지는 MASK를 찾는다. 이 MASK가 해당 실험 데이터에 대해 최종적으로 인식된 학습 데이터 문자로 선택된다. 문자의 골격과 지역 경계 연산을 사용하는 인식법은 주어진 학습 데이터에 새로운 글자체를 추가해서 학습 데이터를 쉽게 확장할 수 있으며, 구현하기가 간단하면서도 높은 문자 인식률을 얻을 수 있다.

임의 차원 데이터 대응 Dynamic RNN-CNN 멀웨어 분류기 (Dynamic RNN-CNN malware classifier correspond with Random Dimension Input Data)

  • 임근영;조영복
    • 한국정보통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.533-539
    • /
    • 2019
  • 본 연구는 본 연구는 Microsoft Malware Classification Challenge 데이터 셋을 사용해 임의의 길이 입력 데이터에 대응할 수 있는 멀웨어 분류 모델을 제안한다. 우리는 기존 연구의 멜웨어 데이터를 이미지화 시키는 것을 기반으로 한다. 제안 모델은 멀웨어 데이터가 큰 경우는 많은 이미지를 생성하고, 작은 데이터는 적은 이미지를 생성한다. 생성된 이미지를 시계열 데이터로 Dynamic RNN으로 학습시킨다. RNN의 출력 값은 Attention 기법을 응용해 가장 가중치가 높은 출력만 사용하고, RNN 출력값을 다시 Residual CNN으로 학습시켜 최종적으로 멀웨어를 분류한다. 제안모델을 실험한 결과 검증 데이터 셋에서 Micro-average F1 score 92%를 기록하였다. 실험 결과 특별한 특징 추출 및 차원 축소 없이 임의 길이의 데이터를 학습 및 분류할 수 있는 모델의 성능을 검증할 수 있었다.