• 제목/요약/키워드: RGB Vector

검색결과 63건 처리시간 0.027초

랜덤포레스트와 서포트벡터머신 기법을 적용한 포인트 클라우드와 실감정사영상을 이용한 객체분류 (Object Classification Using Point Cloud and True Ortho-image by Applying Random Forest and Support Vector Machine Techniques)

  • 서홍덕;김의명
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.405-416
    • /
    • 2019
  • 정보통신기술의 발달로 인하여 데이터의 생산과 처리 속도가 빨라지고 있다. 인공지능의 한 분야인 머신러닝을 이용하여 객체를 분류하기 위해, 학습에 필요한 데이터는 인터넷과 공간정보기술의 발달로 인하여 손쉽게 수집할 수 있게 되었다. 공간정보 분야에서도 머신러닝은 영상, 포인트 클라우드 등을 이용하여 객체를 분류 또는 인식하는 것에 적용되고 있다. 본 연구에서는 기 구축된 수치지도 버전 1.0을 활용하여 학습 데이터를 수동으로 구축하는 문제점을 개선하고 영상과 포인트 클라우드를 이용하여 도로, 건물, 식생을 분류하는 기법을 제안하였다. 실험을 통해서 RGB 밴드만을 갖고 있는 실감정사영상을 사용하였을 경우 색상을 뚜렷하게 구분할 수 있는 도로, 건물, 식생의 분류가 가능하였지만 색상이 유사한 경우에는 분류가 잘 되지 않는 한계를 확인할 수 있었다. 이를 개선하기 위해 실감정사영상과 정규수치표면모델을 밴드 퓨전한 후 랜덤포레스트와 서포트벡터머신 기법을 적용하였으며 이를 통해 85%이상의 정확도로 도로, 건물, 식생을 분류하였다.

조명 변화에 안정적인 손 형태 인지 기술 (A Robust Hand Recognition Method to Variations in Lighting)

  • 최유주;이제성;유효선;이정원;조위덕
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.25-36
    • /
    • 2008
  • 본 논문은 조명의 변화가 심한 영상에서 손 형태를 안정적으로 인지하는 기법에 관한 것이다. 제안한 방법은 HSI 색상공간에서 색상(Hue) 및 색상 기울기(Hue-Gradient)를 기반으로 정의된 배경모델을 구축하고, 실시간으로 입력되는 영상과의 배경차분(background subtraction)기법을 이용하여 배경과 손을 구분한다. 추출된 손의 영역으로부터 18가지의 특징요소를 추출하고 이를 기반으로 다중클래스 SVM(Support Vector Machine) 학습 기법을 사용하여 손의 형태를 인지한다. 제안 기법은 색상 기울기를 배경 차분에 적용함으로써, 조명 환경이 배경 모델의 조명과 다르게 급격한 변화가 이루어졌을 때도 안정적으로 손의 윤곽정보를 추출할 수 있도록 하였다. 또한, 실시간 처리를 저해하는 복잡한 손의 특성정보 대신, OBB의 크기에 대하여 정규화된 두 개의 고유값과 객체 기반 바운딩 박스(OBB)를 구성하는 16개 세부 영역에서의 손 윤곽픽셀의 개수를 손의 특성정보로 사용하였다. 본 논문에서는 급격한 조명 변화 상황에서 기존 RGB 색상요소를 기반으로 하는 배경차분법과 색상을 기반으로 하는 배경차분법, 본 논문에서 제안하는 색상 기울기 기반 배경 차분법의 결과를 비교함으로써 제안 기법의 안정성을 입증하였다. 6명의 실험대상자의 1부터 9까지의 수지화 2700개의 영상으로부터 손 특성 정보를 추출하고 이에 대하여 훈련을 통한 학습 모델을 생성하였다. 학습모델을 기반으로 실험자 6인의 손 형태 1620개의 데이터에 대하여 인지 실험을 실시하여 92.6%에 이르는 손 형태 인식 성공률을 얻었다.

Improving Field Crop Classification Accuracy Using GLCM and SVM with UAV-Acquired Images

  • Seung-Hwan Go;Jong-Hwa Park
    • 대한원격탐사학회지
    • /
    • 제40권1호
    • /
    • pp.93-101
    • /
    • 2024
  • Accurate field crop classification is essential for various agricultural applications, yet existing methods face challenges due to diverse crop types and complex field conditions. This study aimed to address these issues by combining support vector machine (SVM) models with multi-seasonal unmanned aerial vehicle (UAV) images, texture information extracted from Gray Level Co-occurrence Matrix (GLCM), and RGB spectral data. Twelve high-resolution UAV image captures spanned March-October 2021, while field surveys on three dates provided ground truth data. We focused on data from August (-A), September (-S), and October (-O) images and trained four support vector classifier (SVC) models (SVC-A, SVC-S, SVC-O, SVC-AS) using visual bands and eight GLCM features. Farm maps provided by the Ministry of Agriculture, Food and Rural Affairs proved efficient for open-field crop identification and served as a reference for accuracy comparison. Our analysis showcased the significant impact of hyperparameter tuning (C and gamma) on SVM model performance, requiring careful optimization for each scenario. Importantly, we identified models exhibiting distinct high-accuracy zones, with SVC-O trained on October data achieving the highest overall and individual crop classification accuracy. This success likely stems from its ability to capture distinct texture information from mature crops.Incorporating GLCM features proved highly effective for all models,significantly boosting classification accuracy.Among these features, homogeneity, entropy, and correlation consistently demonstrated the most impactful contribution. However, balancing accuracy with computational efficiency and feature selection remains crucial for practical application. Performance analysis revealed that SVC-O achieved exceptional results in overall and individual crop classification, while soybeans and rice were consistently classified well by all models. Challenges were encountered with cabbage due to its early growth stage and low field cover density. The study demonstrates the potential of utilizing farm maps and GLCM features in conjunction with SVM models for accurate field crop classification. Careful parameter tuning and model selection based on specific scenarios are key for optimizing performance in real-world applications.

Gabor Filter Bank를 이용한 보행자 검출 알고리즘 (Pedestrian Detection Algorithm using a Gabor Filter Bank)

  • 이세원;장진원;백광렬
    • 제어로봇시스템학회논문지
    • /
    • 제20권9호
    • /
    • pp.930-935
    • /
    • 2014
  • A Gabor filter is a linear filter used for edge detectionas frequency and orientation representations of Gabor filters are similar to those of the human visual system. In this thesis, we propose a pedestrian detection algorithm using a Gabor filter bank. In order to extract the features of the pedestrian, we use various image processing algorithms and data structure algorithms. First, color image segmentation is performed to consider the information of the RGB color space. Second, histogram equalization is performed to enhance the brightness of the input images. Third, convolution is performed between a Gabor filter bank and the enhanced images. Fourth, statistical values are calculated by using the integral image (summed area table) method. The calculated statistical values are used for the feature matrix of the pedestrian area. To evaluate the proposed algorithm, the INRIA pedestrian database and SVM (Support Vector Machine) are used, and we compare the proposed algorithm and the HOG (Histogram of Oriented Gradient) pedestrian detector, presentlyreferred to as the methodology of pedestrian detection algorithm. The experimental results show that the proposed algorithm is more accurate compared to the HOG pedestrian detector.

웨이블렛과 퍼지 C-Means 클러스터링을 이용한 얼굴 인식 (Face recognition using Wavelets and Fuzzy C-Means clustering)

  • 윤창용;박정호;박민용
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.583-586
    • /
    • 1999
  • In this paper, the wavelet transform is performed in the input 256$\times$256 color image and decomposes a image into low-pass and high-pass components. Since the high-pass band contains the components of three directions, edges are detected by combining three parts. After finding the position of face using the histogram of the edge component, a face region in low-pass band is cut off. Since RGB color image is sensitively affected by luminances, the image of low pass component is normalized, and a facial region is detected using face color informations. As the wavelet transform decomposes the detected face region into three layer, the dimension of input image is reduced. In this paper, we use the 3000 images of 10 persons, and KL transform is applied in order to classify face vectors effectively. FCM(Fuzzy C-Means) algorithm classifies face vectors with similar features into the same cluster. In this case, the number of cluster is equal to that of person, and the mean vector of each cluster is used as a codebook. We verify the system performance of the proposed algorithm by the experiments. The recognition rates of learning images and testing image is computed using correlation coefficient and Euclidean distance.

  • PDF

지역 색차 기반의 히스토그램 정교화에 의한 영상 검색 (Image Retrieval Using Histogram Refinement Based on Local Color Difference)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제18권12호
    • /
    • pp.1453-1461
    • /
    • 2015
  • Since digital images and videos are rapidly increasing in the internet with the spread of mobile computers and smartphones, research on image retrieval has gained tremendous momentum. Color, shape, and texture are major features used in image retrieval. Especially, color information has been widely used in image retrieval, because it is robust in translation, rotation, and a small change of camera view. This paper proposes a new method for histogram refinement based on local color difference. Firstly, the proposed method converts a RGB color image into a HSV color image. Secondly, it reduces the size of color space from 2563 to 32. It classifies pixels in the 32-color image into three groups according to the color difference between a central pixel and its neighbors in a 3x3 local region. Finally, it makes a color difference vector(CDV) representing three refined color histograms, then image retrieval is performed by the CDV matching. The experimental results using public image database show that the proposed method has higher retrieval accuracy than other conventional ones. They also show that the proposed method can be effectively applied to search low resolution images such as thumbnail images.

머신러닝 기법을 이용한 산림의 층위구조 분류 (Classification of Forest Vertical Structure Using Machine Learning Analysis)

  • 권수경;이용석;김대성;정형섭
    • 대한원격탐사학회지
    • /
    • 제35권2호
    • /
    • pp.229-239
    • /
    • 2019
  • 모든 식생 군락은 각자 층위구조를 가지고 있다. 이를 '식생층위구조'라 부른다. 요즈음은 이 층위구조가 산림의 활력도, 다양성, 그리고 환경영향을 평가하는데 중요한 식별자로 작용하기 때문에 산림조사에 있어서 식생층위구조는 필수적으로 조사되어야한다. 그런데, 식생층위구조는 일종의 내부구조이므로 일반적으로 산림조사는 현장조사를 통해 이루어지는데, 이는 전통적인 방식으로 시간과 예산이 많이 든다. 따라서 본 연구에서는 산림의 층위구조를 조사하는데 드는 시간과 예산을 줄이기 위해 넓은 지역 탐사에 효과적인 원격탐사기법 중 항공촬영 사진과 대량의 데이터 마이닝(Data Mining)이 가능한 머신러닝(Machine Learning)기법 이용한 층위구조의 분류 방법을 제시한다. 칼라 항공사진, LiDAR(Light Detection and Ranging) DSM(Digital Surface Model)과 DTM(Digital Terrain Model)을 이용하여 Support Vector Machine(SVM) 머신러닝 기법을 이용하여 층위분류 연구를 진행하였다. 현장조사 자료를 참조하여 SVM기법 분류 결과와 비교했을 때 픽셀수에 기반한 정확도는 66.22%로 확인 되었다. 층위 분류 정확도는 단층과 다층의 구분은 비교적 높게 나타났으나, 다층끼리의 분류는 어렵다는 결론이 나타났다. 이러한 연구결과는 향후 다양한 식생데이터와 영상자료를 수집한다면 식생구조에 대한 머신러닝 연구분야에 더욱 발전이 가능할 것으로 기대된다.

가상 현실 게임 환경에서의 가상 손 제어를 위한 사용자 손 인식 방법 (A Method of Hand Recognition for Virtual Hand Control of Virtual Reality Game Environment)

  • 김부년;김종호;김태영
    • 한국게임학회 논문지
    • /
    • 제10권2호
    • /
    • pp.49-56
    • /
    • 2010
  • 본 논문에서는 사용자의 손을 인식하여 가상현실 게임 환경에서 가상의 손을 제어할 수 있는 방법을 제안한다. 카메라를 통해 획득한 영상을 통하여 사용자의 손 이동과 가리키는 방향에 대한 정보를 획득하고 이를 이용하여 가상의 손을 게임 화면에 나타낸다. 사용자의 손의 움직임은 가상의 손이 물건을 선택하고 옮기도록 하는 입력 인터페이스로 활용할 수 있다. 제안하는 방법은 비전 기반 손 인식 기법으로 먼저 RGB 컬러영역에서 HSV 컬러영역으로 입력영상을 변환하고 H, S 값에 대한 이중 임계값과 연결 요소 분석을 이용하여 손 영역을 분할한다. 다음으로 분할된 영역에 대하여 0, 1차 모멘트를 적용하고 이를 이용하여 손 영역에 대한 무게 중심점을 구한다. 구해진 무게중심점은 손의 중심에 위치하게 되며, 분할된 손 영역의 픽셀 집합 중 무게중심점으로부터 멀리 떨어진 픽셀들을 손가락의 끝점으로 인식한다. 마지막으로 무게중심점과 손 끝점에 대한 벡터를 통하여 손의 축을 구한다. 인식 안정성과 성능을 높이기 위하여 누적 버퍼를 이용한 떨림 보정과 경계상자를 이용한 처리 영역을 설정하였다. 본 논문의 방법은 기존의 비전 기술을 통한 손 인식 방법들에 비하여 별도의 착용 마커를 두지 않고 실시간으로 처리가 가능하다. 다양한 입력 영상들에 대한 실험 결과는 제안 기법으로 정확하게 손을 분할하고, 안정된 인식 결과를 고속으로 처리할 수 있음을 보여주었다.

터널 막장 3차원 지형모델 상에서의 불연속면 자동 매핑을 위한 딥러닝 기법 적용 방안 (Deep Learning Approach for Automatic Discontinuity Mapping on 3D Model of Tunnel Face)

  • 추엔 팜;신휴성
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.508-518
    • /
    • 2023
  • 이 논문은 LiDAR 스캔 또는 사진측량 기술에 의해 재구성된 3D 디지털 모델을 기반으로 터널 벽면의 불연속면을 자동으로 매핑하는 새로운 접근 방식을 제안한다. 본 제안에서는 U-Net이라 불리는 딥러닝 시맨틱 영역분할 모델을 사용하며, 터널 막장면의 3D 지형 모델에서 불연속면 영역을 식별해 낸다. 제안된 딥러닝 모델은 투영된 RGB 이미지, 면의 깊이 이미지 및 국부적인 면의 표면 속성 이미지(즉, 법선 벡터 및 곡률 이미지)를 포함한 다양한 정보를 종합 학습하여 기본 3차원 이미지에서 불연속면 영역을 효과적으로 분할한다. 이후 영역분할 결과는 면의 깊이 맵과 투영 행렬을 사용하여 3D 모델로 다시 투영시키고, 3D 공간 내에서 불연속면의 위치 및 범위를 정확하게 표현한다. 영역분할 모델의 성능은 영역 분할된 결과를 해당 지면 실측 값과 비교함으로써 평가하였으며, IoU(intersection-over-union) 값이 약 0.8 정도로 나타나 영역분할 결과의 높은 정확성을 확인하였다. 여전히 학습데이터가 제한적 이었음에도 불구하고, 제안 기법은 3D 모델의 점군 데이터를 불연속면의 유사군으로 그룹화하기 위해 전 막장면의 법선 벡터와 클러스터링과 같은 비지도 학습기반 알고리즘에만 의존하던 기존 접근 방식의 한계의 극복 가능성을 보여주었다.

초분광 영상정보를 활용한 하천환경 분류 및 평가 (Classification and evaluation of river environment using Hyperspectral images)

  • 한형준;이창훈;강준구;김종태
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.423-423
    • /
    • 2019
  • RGB나 다중분광영상은 높은 공간 해상도로 인해 크기가 작은 물질의 클래스를 부여하는데 있어서는 효과적이지만 분광해상도가 낮아 다양한 종류의 지표물 분류 및 분광적으로 미세한 차이를 보이는 대상 체간의 분류에는 한계를 가지고 있다. 그러나 초분광 영상(Hyperspectral Image)은 대상 객체의 분광 반사곡선을 수백개의 연속적인 분광 파장대 영역으로 상세하게 해당 물체의 정보를 취득할 수 있는 기능을 가지고 있다. 최근 국내에서도 초분광 영상을 이용한 토지피복도 작성 및 환경 모니터링 등 다양한 분야에 적용하기 위한 연구가 시도되고 있다. 최근에는 드론과 같은 소형 UAV를 활용하여 경제적인 비용으로 시공간해상도가 높은 영상을 획득하는 것이 가능하게 되었으며 분광정보를 수집하는 영상 장비의 발전으로 드론에 탑재가 가능한 경량의 소형 초분광센서가 개발됨으로써 보다 높은 분광해상도의 영상을 취득할 수 있게 되었다. 본 연구에서는 효율적인 하천환경조사를 위해 UAV를 활용하여 고해상도 초분광 영상을 취득하였으며, 차원축소법과 분류기 적용에 따른 공간 분류 정확도 분석을 통해 하천환경에 대한 분류 및 평가를 실시하였다. 연구지역에서 획득한 초분광 영상은 노이즈로 인한 영향을 줄이고자 MNF와 PCA 기법으로 차원축소를 수행하였으며, MLC(Maximum Likelihood Classification)와 SVM(Support Vector Machine), SAM(Spectral Angle Mapping) 감독분류기법을 적용하여 하천환경특성에 따른 공간분류를 수행하였다. 연구 결과 MNF기법으로 차원 축소한 영상을 적용하여 MLC 감독분류를 수행하였을 때 가장 높은 분류정확도를 얻을 수 있었으나, 일부 클래스 및 수역의 경계와 그림자 공간에서 주로 오분류가 나타나는 것을 확인할 수 있었다.

  • PDF