• 제목/요약/키워드: image pre-processing

검색결과 483건 처리시간 0.024초

PCA와 LDA를 결합한 데이터 전 처리와 다항식 기반 RBFNNs을 이용한 얼굴 인식 알고리즘 설계 (Design of Face Recognition algorithm Using PCA&LDA combined for Data Pre-Processing and Polynomial-based RBF Neural Networks)

  • 오성권;유성훈
    • 전기학회논문지
    • /
    • 제61권5호
    • /
    • pp.744-752
    • /
    • 2012
  • In this study, the Polynomial-based Radial Basis Function Neural Networks is proposed as an one of the recognition part of overall face recognition system that consists of two parts such as the preprocessing part and recognition part. The design methodology and procedure of the proposed pRBFNNs are presented to obtain the solution to high-dimensional pattern recognition problems. In data preprocessing part, Principal Component Analysis(PCA) which is generally used in face recognition, which is useful to express some classes using reduction, since it is effective to maintain the rate of recognition and to reduce the amount of data at the same time. However, because of there of the whole face image, it can not guarantee the detection rate about the change of viewpoint and whole image. Thus, to compensate for the defects, Linear Discriminant Analysis(LDA) is used to enhance the separation of different classes. In this paper, we combine the PCA&LDA algorithm and design the optimized pRBFNNs for recognition module. The proposed pRBFNNs architecture consists of three functional modules such as the condition part, the conclusion part, and the inference part as fuzzy rules formed in 'If-then' format. In the condition part of fuzzy rules, input space is partitioned with Fuzzy C-Means clustering. In the conclusion part of rules, the connection weight of pRBFNNs is represented as two kinds of polynomials such as constant, and linear. The coefficients of connection weight identified with back-propagation using gradient descent method. The output of the pRBFNNs model is obtained by fuzzy inference method in the inference part of fuzzy rules. The essential design parameters (including learning rate, momentum coefficient and fuzzification coefficient) of the networks are optimized by means of Differential Evolution. The proposed pRBFNNs are applied to face image(ex Yale, AT&T) datasets and then demonstrated from the viewpoint of the output performance and recognition rate.

마우스 포인터 제어를 위해 지능형 인식을 이용한 핸드 인터페이스 (Hand Interface using Intelligent Recognition for Control of Mouse Pointer)

  • 박일철;김경훈;권구락
    • 한국정보통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.1060-1065
    • /
    • 2011
  • 본 논문에서 제안 방법은 카메라로 들어오는 입력 영상에서 색상정보를 이용해 손을 인식한다. 이는 인식된 손을 이용해 마우스 포인터를 제어한다. 또한 마우스 포인터를 통해 특정 명령을 수행할 수 있도록 설계한다. 기존의 상호 작용 멀티미디어 시스템은 펜이나 마우스등과 같은 특정 외부 입력 장치들에 의존하였기 때문에 사용자가 불편함을 많이 느꼈다. 하지만 본 논문에서 제안하는 방법은 외부 입력 장치가 필요 없이 손을 이용하여 이러한 단점을 보완한다. 실험 방법으로는 카메라로부터 획득된 영상에서 색 정보를 이용하여 손 영역과 배경을 분리하고, 분리된 손 영역의 중심 좌표를 이용하여 모니터 상의 마우스 포인터 좌표를 결정한다. 이 좌표를 이용해 미리 입력된 영역에 마우스 포인터를 위치시키면 로봇에게 이동 명령을 실행하게 된다. 실험 결과로 제안한 알고리듬은 손 인식 률은 더 정확해졌지만, 여전히 조명에 따른 컬러 값의 변화에 민감하다.

Quadtree 구조 및 프랙탈 특성을 이용한 Hyperion 영상의 노이즈 밴드 추출 (Noise Band Extraction of Hyperion Image using Quadtree Structure and Fractal Characteristic)

  • 장안진;김용일
    • 대한원격탐사학회지
    • /
    • 제26권5호
    • /
    • pp.489-495
    • /
    • 2010
  • 초분광 영상은 넓은 범위의 파장 영역의 유용한 정보를 많은 수의 밴드를 통해 취득한다. 하지만, 인접 밴드 간의 상관관계, 계산량, 노이즈로 인해 전처리없이 활용할 경우 부정확한 결과를 도출한다. 따라서 영상에서 노이즈 밴드 추출하여 제거하는 작업이 반드시 필요하다. 기존의 연구들은 영상 전체에 대한 특성치 만을 이용하였기 때문에 영상의 국지적 특성을 고려해야 한다. 본 연구에서는 Hyperion 영상을 대상으로 하였으며, 자료구조 기법 중 하나인 Quadtree와 이용하여 노이즈 밴드를 추출하였다. Quadtree 구조로 분할된 영역의 프랙탈 차원을 계산하고 프랙탈 차원의 분산을 이용하였다. Hyperion 영상에 존재하는 노이즈 종류 중 무작위 노이즈를 포함하고 있는 밴드 추출에 초점을 맞추었으며, 시각적으로 판단하여 작성한 참조자료와 비교하였다. 제안된 알고리즘 적용 결과 무작위 노이즈가 포함된 밴드 대부분이 추출되었으며, 영상에 관계없이 30개 이상의 노이즈 밴드를 제거할 수 있음을 확인하였다.

이미지 인식 기반의 지도학습을 활용한 생산관리 효율화 방법에 관한 연구 (A study on Production Management Efficiency Method using Supervised Learning based Image Cognition)

  • 장우식;이건우;이상덕;김영곤
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.47-52
    • /
    • 2021
  • 최근 제조 산업에서 생산공정 관리에 대한 인공지능 솔루션 수요가 증가하고 있다. 그러나, 제조산업의 AI 솔루션 적용을 통하여 POP, MES와 같은 레거시 스마트공장 솔루션의 한계가 존재한다. 따라서, 본 논문에서는 이를 극복하기 위하여 이미지 인식 시스템에 인공지능 개념인 지도학습을 적용하여, 생산관리 효율을 향상시키고자 하였다. 시스템 흐름에서는 As_is To be를 구분하여 실제 업무 흐름을 적용하였으며, 전체 생산성 효율을 위하여 프로세스 개선을 하였다. AI 지도학습을 위한 사전 전처리 계획을 수립하고 관련 AI 모델 설계, 개발, 시뮬레이션을 수행하여, 그 결과로는 97%의 인식률을 확인하였다.

Automatic Detection System of Underground Pipe Using 3D GPR Exploration Data and Deep Convolutional Neural Networks

  • Son, Jeong-Woo;Moon, Gwi-Seong;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권2호
    • /
    • pp.27-37
    • /
    • 2021
  • 본 논문에서는 관로를 자동으로 검출하는 지하 관로 자동 탐색 시스템을 제안한다. 시간에 따른 지반변화, 관로 시공 불일치 등 여러 가지 요인으로 실제 관로의 위치가 지하 관로 도면과 일치하지 않는다. 이로 인하여 굴착공사나 관로 노후화에 의한 여러 사고가 발생한다. 사고를 방지하기 위해 GPR(지표 투과 레이더, Ground Penetrating Radar) 탐사를 통해 지하시설물을 찾아내는 작업이 이루어지고 있지만, 분석을 담당할 수 있는 전문가의 수가 부족하다. GPR 데이터는 매우 방대하며 분석과정에도 오랜 시간이 걸리기 때문이다. 이에 본 논문에서는 3D GPR 데이터를 자동으로 분석하기 위해 딥 러닝 기술인 3D 이미지 분할을 사용하고, 이에 적합한 데이터 생성 알고리즘을 제안한다. 또한 GPR 데이터 특성에 맞는 데이터 증강 기법, 데이터 전처리 모듈을 제안한다. 실험 결과를 통해 제안한 시스템은 F1 Score 40.4%의 성능을 보였으며 이를 통해 이미지 분할을 이용한 관로 분석의 가능성을 확인하였다.

AWGN 환경에서 국부영역의 화소분할을 사용한 변형된 중심 가중치 필터 알고리즘 (Modified Center Weight Filter Algorithm using Pixel Segmentation of Local Area in AWGN Environments)

  • 천봉원;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.250-252
    • /
    • 2022
  • 최근 IoT 기술과 AI의 발전에 따라 다양한 분야에서 무인화와 자동화가 진행되고 있으며, 물체감지 및 인식, 추적 등의 알고리즘을 사용하는 시스템에서 다양한 응용기술들이 연구되고 있다. 영상을 기반으로 동작하는 시스템의 경우, 전처리 과정으로 잡음제거를 진행하고 있으며, 시스템의 환경에 따라 정밀한 잡음제거가 요구되는 경우가 있다. 본 논문에서는 필터링 과정에서 발생하기 쉬운 블러링 현상을 최소화하며 결과 영상의 디테일을 강조하기 위해 국부영역의 화소분할을 사용한 변형된 중심 가중치 필터 알고리즘을 제안한다. 제안한 알고리즘은 국부 영역의 화소를 두 영역으로 분할하였을 때, 분할된 영역 중 우세한 영역의 중심을 가중치 필터 알고리즘의 기준으로 정하였다. 결과영상은 필터링 마스크 내부의 화소값에 변형된 중심 가중치를 컨벌루션하여 계산한다.

  • PDF

드론과 이미지 분석기법을 활용한 구조물 외관점검 기술 연구 (Study on Structure Visual Inspection Technology using Drones and Image Analysis Techniques)

  • 김종우;정영우;임홍철
    • 한국건축시공학회지
    • /
    • 제17권6호
    • /
    • pp.545-557
    • /
    • 2017
  • 이 연구는 사회 기반 구조물의 노후화에 대한 안전점검 기술분야에서 구조물 외관점검 기술의 효율적 대안에 관한 연구이다. 기존 육안점검 및 조사를 대신하여 산업용 드론과 딥 러닝기반의 이미지 분석 기법을 접목함으로써 막대한 인력과 시간소요 및 비용을 절감하고 높은 구역 및 돔 구조물의 접근 한계를 극복하고자 하였다. 구조물의 0.3mm 이상의 균열 손상을 검지할 수 있는 고 해상도 카메라와 라이다 센서, 임베디드 이미지 프로세서 모듈로 구성된 탑재체를 제작하여 산업용 드론에 탑재하였다. 이를 현장 시험에 적용하여 자동비행항법을 통해 시편의 손상 이미지를 촬영하였다. 또한 균열경을 이용하여 기존 육안 점검 방법으로 백태, 박리박락과 같은 면적형 손상과 선형 손상인 균열의 폭과 길이를 측정하여 최종 이미지 분석 검출 결과와 비교하고자 하였다. 촬영된 이미지 중 80장의 샘플을 골라 이미지 분석 기법을 적용하여 사전처리작업(pre-processing)-분리작업(segmentation)-특징점 추출작업(feature extraction)-분류 작업(Classification)-지도학습작업(supervised learning) 등의 과정을 거쳐 손상을 분리하고, 이를 딥러닝 기반 플랫폼으로 지도학습하여 분석 파라미터를 추출하였다. 지도학습을 수행하지 않은 임의의 이미지 샘플 60장을 신규로 추가하여 추출된 파라미터를 기반으로 이미지 분석을 수행한 결과, 손상 검출율의 90.5%로 나타났다.

이미지 분할 여부에 따른 VQ-VAE 모델의 적대적 예제 복원 성능 비교 (Comparison of Adversarial Example Restoration Performance of VQ-VAE Model with or without Image Segmentation)

  • 김태욱;현승민;홍정희
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.194-199
    • /
    • 2022
  • 다양하고 복잡한 영상 데이터 기반의 산업에서 높은 정확도와 활용성을 위해 고품질의 데이터를 위한 전처리가 요구된다. 하지만 기존 이미지 또는 영상 데이터와 노이즈를 결합해 기업에 큰 위험을 초래할 수 있는 오염된 적대적 예제가 유입될 시 기업의 신뢰도 및 보안성, 완전한 결과물 확보를 위해 손상되기 이전으로의 복원이 필요하다. 이를 위한 대비책으로 기존에는 Defense-GAN을 사용하여 복원을 진행하였지만, 긴 학습 시간과 복원물의 낮은 품질 등의 단점이 존재하였다. 이를 개선하기 위해 본 논문에서는 VQ-VAE 모델을 사용함과 더불어 이미지 분할 여부에 따라 FGSM을 통해 만든 적대적 예제를 이용하는 방법을 제안한다. 먼저, 생성된 예제를 일반 분류기로 분류한다. 다음으로 분할 전의 데이터를 사전 학습된 VQ-VAE 모델에 전달하여 복원한 후 분류기로 분류한다. 마지막으로 4등분으로 분할된 데이터를 4-split-VQ-VAE 모델에 전달하여 복원한 조각을 합친 뒤 분류기에 넣는다. 최종적으로 복원된 결과와 정확도를 비교한 후 분할 여부에 따른 2가지 모델의 결합 순서에 따라 성능을 분석한다.

산불 발생 후 VHR 위성영상과 GIS 데이터를 이용한 산불 피해 지역 변화 탐지 (Wildfire-induced Change Detection Using Post-fire VHR Satellite Images and GIS Data)

  • 정민경;김용일
    • 대한원격탐사학회지
    • /
    • 제37권5_3호
    • /
    • pp.1389-1403
    • /
    • 2021
  • 고해상도(Very High Resolution; VHR) 위성영상을 이용한 재난 피해 평가는 신속한 피해 정보 추출과 함께 세부적인 피해 정보 획득이 가능하다. 하지만 일반적으로 VHR 위성의 낮은 영상 취득 주기로 인해 재난 발생 전 VHR 영상의 수급은 제한적이며, 재난 발생 후 영상만으로는 피해 지역과 미피해 지역의 정확한 식별에 한계가 존재한다. 이에 본 연구에서는 산불 발생 후 VHR 위성영상과 GIS (Geographic Information System) 데이터를 이용하여 국내 산불 피해 지역에 대한 변화 탐지를 수행하였다. 산불 발생 전 VHR 영상을 대체하기 위한 GIS 데이터로는 토지피복도가 사용되었으며, 산불 발생 전 토지피복 현황에 대한 공간정보를 이용하여 산불발생 전 NIR (near-infrared) 영상을 시뮬레이션하였다. 변화 탐지 과정에서는 NDVI (Normalized Difference Vegetation Index) 상관도 기반의 변화 탐지 기법을 적용하였으며, superpixel 기반의 영상 분석을 통해 영상 분석의 복잡도를 감소시키는 동시에 VHR 영상의 디테일을 보존하고자 하였다. 제안 기법은 2019년 발생한 강원도 산불 지역에 대해 검증되었으며, 두 연구 지역에 대해 모두 98% 이상의 높은 전체 정확도와 0.97 이상의 높은 F1-score 값을 제시하였다.

Optical Character Recognition for Hindi Language Using a Neural-network Approach

  • Yadav, Divakar;Sanchez-Cuadrado, Sonia;Morato, Jorge
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.117-140
    • /
    • 2013
  • Hindi is the most widely spoken language in India, with more than 300 million speakers. As there is no separation between the characters of texts written in Hindi as there is in English, the Optical Character Recognition (OCR) systems developed for the Hindi language carry a very poor recognition rate. In this paper we propose an OCR for printed Hindi text in Devanagari script, using Artificial Neural Network (ANN), which improves its efficiency. One of the major reasons for the poor recognition rate is error in character segmentation. The presence of touching characters in the scanned documents further complicates the segmentation process, creating a major problem when designing an effective character segmentation technique. Preprocessing, character segmentation, feature extraction, and finally, classification and recognition are the major steps which are followed by a general OCR. The preprocessing tasks considered in the paper are conversion of gray scaled images to binary images, image rectification, and segmentation of the document's textual contents into paragraphs, lines, words, and then at the level of basic symbols. The basic symbols, obtained as the fundamental unit from the segmentation process, are recognized by the neural classifier. In this work, three feature extraction techniques-: histogram of projection based on mean distance, histogram of projection based on pixel value, and vertical zero crossing, have been used to improve the rate of recognition. These feature extraction techniques are powerful enough to extract features of even distorted characters/symbols. For development of the neural classifier, a back-propagation neural network with two hidden layers is used. The classifier is trained and tested for printed Hindi texts. A performance of approximately 90% correct recognition rate is achieved.