• 제목/요약/키워드: preprocessing filter

검색결과 173건 처리시간 0.03초

딥러닝을 이용한 돼지 얼굴 인식 (Pig Face Recognition Using Deep Learning)

  • 마리한;김상철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.493-494
    • /
    • 2022
  • The development of livestock faces intensive farming results in a rising need for recognition of individual animals such as cows and pigs is related to high traceability. In this paper, we present a non-invasive biometrics systematic approach based on the deep-learning classification model to pig face identification. Firstly, in our systematic method, we build a ROS data collection system block to collect 10 pig face data images. Secondly, we proposed a preprocessing block in that we utilize the SSIM method to filter some images of collected images that have high similarity. Thirdly, we employ the improved image classification model of CNN (ViT), which uses the finetuning and pretraining technique to recognize the individual pig face. Finally, our proposed method achieves the accuracy about 98.66%.

Savitzky-Golay 필터와 미분을 활용한 LSTM 기반 지하수 수위 예측 모델의 성능 비교 (Performance Comparison of LSTM-Based Groundwater Level Prediction Model Using Savitzky-Golay Filter and Differential Method )

  • 송근산;송영진
    • 반도체디스플레이기술학회지
    • /
    • 제22권3호
    • /
    • pp.84-89
    • /
    • 2023
  • In water resource management, data prediction is performed using artificial intelligence, and companies, governments, and institutions continue to attempt to efficiently manage resources through this. LSTM is a model specialized for processing time series data, which can identify data patterns that change over time and has been attempted to predict groundwater level data. However, groundwater level data can cause sen-sor errors, missing values, or outliers, and these problems can degrade the performance of the LSTM model, and there is a need to improve data quality by processing them in the pretreatment stage. Therefore, in pre-dicting groundwater data, we will compare the LSTM model with the MSE and the model after normaliza-tion through distribution, and discuss the important process of analysis and data preprocessing according to the comparison results and changes in the results.

  • PDF

필터링 기반의 잡음 제거를 통한 피부 영역의 추출 (Extraction of Skin Regions through Filtering-based Noise Removal)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.672-678
    • /
    • 2020
  • 최근 들어 초고속의 영상 촬영이 가능한 저가이며 성능이 우수한 카메라가 등장함에 따라서 물체의 미세한 움직임까지 정확하게 묘사한 초고속의 영상들이 보편화되고 있는 실정이다. 본 논문에서는 빠른 속도로 입력되는 초고속의 영상으로부터 예기치 않게 포함된 잡음을 제거한 다음, 잡음이 제거된 영상으로부터 피부 영역과 같이 개인 정보를 대표할 수 있는 관심 영역을 추출하는 방법을 제안한다. 본 논문에서는 먼저 입력받은 초고속의 영상으로부터 비정상적인 전기 신호로 인해 발생한 잡음을 양방향의 필터를 적용하여 제거한다. 그런 다음, 사전 학습을 통해 생성한 색상 분포 모델을 사용하여 영상 내에 포함된 개인 정보를 대표하는 관심 영역인 피부 영역을 정확하게 추출한다. 실험 결과에서는 본 연구에서 소개된 알고리즘이 여러 가지의 초고속 영상으로부터 잡음을 제거한 다음 관심 영역을 강인하게 추출한다는 것을 보여준다. 본 논문에서 제시된 접근 방법은 영상 전처리, 잡음 제거, 목표 영역의 추적 및 감시 등과 같은 컴퓨터 비전 및 패턴인식과 관련된 여러 가지의 응용 분야에서 유용하게 사용될 것으로 예상된다.

무인수상선의 디지털 트윈 공간 재구성을 위한 이미지 보정 및 점군데이터 간의 매핑 프레임워크 설계 (Design of a Mapping Framework on Image Correction and Point Cloud Data for Spatial Reconstruction of Digital Twin with an Autonomous Surface Vehicle)

  • 허수현;강민주;최진우;박정홍
    • 대한조선학회논문집
    • /
    • 제61권3호
    • /
    • pp.143-151
    • /
    • 2024
  • In this study, we present a mapping framework for 3D spatial reconstruction of digital twin model using navigation and perception sensors mounted on an Autonomous Surface Vehicle (ASV). For improving the level of realism of digital twin models, 3D spatial information should be reconstructed as a digitalized spatial model and integrated with the components and system models of the ASV. In particular, for the 3D spatial reconstruction, color and 3D point cloud data which acquired from a camera and a LiDAR sensors corresponding to the navigation information at the specific time are required to map without minimizing the noise. To ensure clear and accurate reconstruction of the acquired data in the proposed mapping framework, a image preprocessing was designed to enhance the brightness of low-light images, and a preprocessing for 3D point cloud data was included to filter out unnecessary data. Subsequently, a point matching process between consecutive 3D point cloud data was conducted using the Generalized Iterative Closest Point (G-ICP) approach, and the color information was mapped with the matched 3D point cloud data. The feasibility of the proposed mapping framework was validated through a field data set acquired from field experiments in a inland water environment, and its results were described.

분수계 기반 영상 분할의 속도 개선을 위한 새로운 전처리 방법 (A New Preprocessing Method for the Seedup of the Watershed-based Image Segmentation)

  • 조상현;최흥문
    • 대한전자공학회논문지SP
    • /
    • 제37권2호
    • /
    • pp.50-59
    • /
    • 2000
  • 본 논문에서는 분수계 기반 영상 분할의 속도 개선을 위한 새로운 전처리 방법을 제안하였다 영상 분할을 위한 분수계 변환에 있어서, 단순히 단일척도 또는 다중척도의 형태학적 기울기 연산자를 사용하여 만드는 기존의 기준 영상과는 달리, 제안한 방법에서는 원 영상에 라플라시안 연산을 수행해 램프 에지의 위치와 에지 폭을 구한후 이로부터 램프 에지 기울기 보정값을 구하였다 그런후, 단일척도 기울기 연산자를 사용한 영상에 이들 램프 에지의 위치에만 보정값을 더하여 기준 영상을 만들었다 여기에 마커 영상을 만들어 부식에 의해 재구성하여 얻은 영상을 분수계 변환함으로써, 단일 또는 다중 척도 기울기 연산에 의한 기준 영상을 사용한 경우보다 과분할을 방지할 수 있어서, 분수계 기반 영상 분할 처리 시간의 대부분을 차지하는 영역 병합을 대폭 줄여 총 영상 분할 시간을 단축하였다 기존의 방법들과의 비교 실험을 통하여 제안한 방법은 램프 에지나 에지 밀집 지역의 주요 에지들의 소실 없이 과분할을 줄여 전체 영상 분할 속도를 약 2배 가까이 향상시킬 수 있음을 확인하였다

  • PDF

전화선 채널이 화자확인 시스템의 성능에 미치는 영향 (The Effect of the Telephone Channel to the Performance of the Speaker Verification System)

  • 조태현;김유진;이재영;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.12-20
    • /
    • 1999
  • 본 논문에서는 깨끗한 환경에서 녹음된 음성데이터와 채널환경에서 수집된 음성데이터의 화자확인 성능을 비교하였다. 채널데이터의 화자확인 성능을 향상시키기 위하여 채널환경에 강인한 특징 파라메타 및 전처리에 대해 연구하였다. 실험을 위한 음성 DB는 어구지시(text-prompted) 시스템을 고려하여 두 자리의 한국어 숫자음으로 구성하였다. 적용한 음성 특징은 LPCC(Linear Predictive Cepstral Coefficient), MFCC(Mel Frequency Cepstral Coefficient), PLP(Perceptually Linear Prediction), LSP(Line Spectrum Pair)이며, 채널 잡음을 제거하기 위한 전처리 과정으로는 음성신호에 대한 필터링을 적용하였다. 추출된 특징으로부터 채널의 영향을 제거 또는 보상하기 위해 cepstral weighting, CMS(Cepstral Mean Subtraction), RASTA(RelAtive SpecTrAl)를 적용하였다. 또한 각각의 특징 및 처리 방법에 대한 음성인식 성능을 제시함으로써 화자확인에서의 성능과 음성인식에서의 성능을 비교하였다. 적용한 음성 특징 및 처리 방법들에 대한 성능 평가를 위해 HTK(HMM Tool Kit) 2.0을 이용하였다. 남자, 여자 화자별로 임계값을 다르게 주는 방법으로 깨끗한 음성데이터와 채널 데이터에 대한 EER(Equal Error Rate)을 구하여 비교하였다. 실험결과 전처리 과정에서 대역통과 필터(150~3800Hz)를 적용하여 저대역 및 고대역의 채널 잡음을 제거하고, 이 신호로부터 MFCC를 추출하였을 때 EER 측면에서의 화자확인 성능이 가장 좋게 나타났다.

  • PDF

A Comparative study on smoothing techniques for performance improvement of LSTM learning model

  • Tae-Jin, Park;Gab-Sig, Sim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.17-26
    • /
    • 2023
  • 본 연구논문에서는 LSTM 기반의 학습 모델 적용과 그 효용성을 높일 수 있도록 몇 가지 평활 기법을 비교, 적용하고자 한다. 적용된 평활 기법은 Savitky-Golay, 지수 평활법, 가중치 이동 평균 등이다. 본 연구를 통해 비트코인 데이터에 LSTM모델 적용 시 보여준 결과 값보다 전처리 과정에서 적용된 Savitky-Golay 필터가 적용된 LSTM 알고리즘이 예측 성능에 유의미한 좋은 결과를 보였다. 예측 성능 결과를 확인하기 위해 비트코인 가격 예측에 따른 복잡 요인을 제거하는데 사용된 LSTM의 경우와 Savitzky-Golay LSTM 모델에 따른 학습 손실율과 검증 손실율을 비교하고 그 신뢰성을 높일 수 있도록 20회 평균값으로 실험하였다. 그 결과 (3.0556, 0.00005), (1.4659, 0.00002)의 값을 얻을 수 있었다. 결과적으로는 비트코인과 같은 암호화폐가 주식보다 더한 변동성을 가지는 만큼 데이터 전처리 과정에서 평활 기법(Savitzky-Golay)을 적용하여 잡음(Noise)을 제거하였으며, 전처리 후의 데이터는 LSTM 신경망 학습을 통해서 비트코인 예측률을 높이는데 가장 유의미한 결과를 얻을 수 있었다.

불법 주정차 차량 단속을 위한 차량 검지 및 추적 기법 (A vehicle detection and tracking algorithm for supervision of illegal parking)

  • 김승균;김효각;장동니;박상희;고성제
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.232-240
    • /
    • 2009
  • 본 논문은 불법 주정차 단속을 위한 정지 차량 검지 및 추적 기법을 제안한다. 제안하는 알고리즘은 크게 네 부분으로 구성되어 있다. 먼저, 입력 영상으로부터 움직이는 차량을 구분하기 위하여 향상된 코드북 물체 검지 알고리즘을 이용한 차량 검지 알고리즘을 제안한다. 두 번째로 차량의 기하학적 특징을 이용하여 차량이 아닌 물체는 제외시키는 전처리 기법을 사용한다. 그런 다음, 검지된 결과 차량들을 히스토그램 추적 기법과 칼만 필터를 결합한 추적 알고리즘을 이용하여 추적한다. 추적 결과를 더 정확하게 하기 위하여, 히스토그램 추적 결과를 칼만 필터의 측정 데이터로 사용한다. 마지막으로, 정지 차량 검지 알고리즘의 신뢰성 있고 정확한 성능을 위하여 실제 정지 카운터 (RSC)를 제안한다. 실험결과로부터 제안한 시스템은 복잡한 실제 도로 환경에서도 여러 차량을 동시에 추적할 수 있고, 정지 차량을 성공적으로 검지해냄을 확인한다.

  • PDF

스마트폰 환경의 인증 성능 최적화를 위한 다중 생체인식 융합 기법 연구 (Authentication Performance Optimization for Smart-phone based Multimodal Biometrics)

  • 문현준;이민형;정강훈
    • 디지털융복합연구
    • /
    • 제13권6호
    • /
    • pp.151-156
    • /
    • 2015
  • 본 논문에서는 스마트폰 환경의 얼굴 검출, 인식 및 화자 인증 기반 다중생체인식 개인인증 시스템을 제안한다. 제안된 시스템은 Modified Census Transform과 gabor filter 및 k-means 클러스터 분석 알고리즘을 통해 얼굴의 주요 특징을 추출하여 얼굴인식을 위한 데이터 전처리를 수행한다. 이후 Linear Discriminant Analysis기반 본인 인증을 수행하고(얼굴인식), Mel Frequency Cepstral Coefficient기반 실시간성 검증(화자인증)을 수행한다. 화자인증에 사용하는 음성 정보는 실시간으로 변화하므로 본 논문에서는 Dynamic Time Warping을 통해 이를 해결한다. 제안된 다중생체인식 시스템은 얼굴 및 음성 특징 정보를 융합 및 스마트폰 환경에 최적화하여 실시간 얼굴검출, 인식과 화자인증 과정을 수행하며 단일 생체인식에 비해 약간 낮은 95.1%의 인식률을 보이지만 1.8%의 False Acceptance Ratio를 통해 객관적인 실시간 생체인식 성능을 입증하여 보다 신뢰할 수 있는 시스템을 완성한다.

색상 단순화와 윤곽선 패턴 분석을 통한 이미지에서의 글자추출 (Text extraction in images using simplify color and edges pattern analysis)

  • 양재호;박영수;이상훈
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.33-40
    • /
    • 2017
  • 본 논문은 이미지에서 효과적인 문자검출을 위해 색상단순화 및 윤곽선에서의 패턴 분석을 통한 문자 검출방법을 제안한다. 윤곽선 기반방법을 사용하는 문자검출 알고리즘은 단순한 배경의 이미지에서는 우수한 성능을 보이지만, 복잡한 배경의 이미지에서는 성능이 떨어지는 단점이 있다. 따라서 제안하는 방법은 복잡한 배경에서의 비문자영역을 최소화하기 위해 이미지 단순화 및 패턴분석을 통한 문자 검출 알고리즘을 제안한다. 먼저 이미지에서의 문자영역 부분을 검출하기 위하여 전처리 과정으로 K-means 군집화를 사용하여 이미지의 색상을 단순화하고, 색상 단순화 과정에서의 물체의 경계의 흐릿해짐을 개선하기 위해 고주파통과필터를 통해 물체의 경계를 강화한다. 그 후 모폴로지 기법의 팽창과 침식의 차이를 이용하여 물체의 윤곽선을 검출하고, 획득한 영역의 윤곽선 부분의 정보(높이, 너비 면적)를 구한 후 패턴분석을 통해 조건을 줌으로써 문자 후보영역을 판별하여 문자가 아닌 불필요한 영역(그림, 배경)을 제거한다. 최종 결과로 라벨링을 통해 불필요한 영역이 제거된 결과를 보여준다.