• 제목/요약/키워드: Images, processing

검색결과 4,224건 처리시간 0.031초

Artificial Neural Network Method Based on Convolution to Efficiently Extract the DoF Embodied in Images

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권3호
    • /
    • pp.51-57
    • /
    • 2021
  • 본 논문에서는 카메라의 포커싱과 아웃포커싱에 의해 이미지에서 뿌옇게 표현되는 피사계 심도(Depth of field, DoF) 영역을 효율적인 합성곱 신경망을 통해 찾는 방법을 제안한다. 우리의 접근 방식은 RGB채널기반의 상호-상관 필터를 이용하여 DoF영역을 이미지로부터 효율적으로 분류하고, 합성곱 신경망 네트워크에 학습하기 위한 데이터를 구축하며, 이렇게 얻어진 데이터를 이용하여 이미지-DoF가중치 맵 데이터 쌍을 설정한다. 학습할 때 사용되는 데이터는 이미지와 상호-상관 필터 기반으로 추출된 DoF 가중치 맵을 이용하며, 네트워크 학습 단계에서 수렴률을 높이기 위해 스무딩을 과정을 한번 더 적용한 결과를 사용한다. 테스트 결과로 얻은 DoF 가중치 이미지는 입력 이미지에서 DoF영역을 안정적으로 찾아내며, 제안하는 방법은 DoF영역을 사용자의 ROI(Region of interest)로 활용하여 NPR렌더링, 객체 검출 등 다양한 곳에 활용이 가능하다.

동영상 데이터에서 조명 보정을 사용한 관심 영역의 획득 (Acquisition of Region of Interest through Illumination Correction in Dynamic Image Data)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제22권3호
    • /
    • pp.439-445
    • /
    • 2021
  • 영상 센서 및 소형 디스플레이의 발달로 가능해진 저가의 고속 카메라는 영상처리 및 패턴인식 분야에서 유용하게 활용될 수 있다. 본 논문에서는 약간의 시차를 두고 연속적으로 입력되는 고속의 영상으로부터 불규칙적인 조명을 보정한 다음, 조명이 보정된 영상으로부터 사람의 관심 영역인 노출된 피부 색상 영역을 획득하는 알고리즘을 소개한다. 본 연구에서는 먼저 받아들인 고속의 영상으로부터 비 균일하게 발생된 조명적인 효과를 프레임 블렌딩 기법을 사용하여 보정한다. 그런 다음, 사전에 반복적인 학습으로 생성된 타원형의 피부 색상 분포 모델을 적용하여 입력된 고속의 컬러 영상으로부터 관심 영역을 강인하게 획득한다. 실험 결과에서는 본 논문에서 제시된 접근 방법이 입력되는 컬러 영상으로부터 조명을 보정한 다음 관심 영역을 정확하게 획득한다는 것을 보여준다. 본 연구에서 제안된 알고리즘은 얼굴 인식 및 추적, 조명 보정 및 제거, 동영상 색인 및 검색 등과 같은 영상 인식과 연관된 다양한 종류의 실제적인 응용 프로그램에서 매우 유용하게 이용될 것으로 추측된다.

영상 품질 개선을 위한 FPGA 기반 고속 히스토그램 평활화 회로 구현 (FPGA-based Implementation of Fast Histogram Equalization for Image Enhancement)

  • 류상문
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1377-1383
    • /
    • 2019
  • 영상 품질 개선을 위해 사용되는 히스토그램 평활화 알고리즘은 하드웨어 회로로 구현되면 소프트웨어로 구현된 경우보다 작업 속도 면에서 성능이 훨씬 뛰어나다. FPGA를 이용한 히스토그램 평활화 회로 구현에 대부분의 최신 FPGA에 포함된 곱셈기 회로와 상당량의 SRAM을 이용하고, 파이프라인을 적용하면 히스토그램 평활화 회로의 전체적인 동작 성능을 높일 수 있다. 본 논문은 이와 같은 방법을 적용하여 8비트 심도를 갖는 흑백 영상에 대해 히스토그램 평활화 작업을 고속으로 수행 가능한 FPGA 구현 방법을 제안한다. 제안된 회로는 FIFO를 이용하여 한 개의 영상에 대한 평활화가 진행되는 동안 다음 영상에 대한 히스토그램 계산을 수행할 수 있다. FIFO를 이용한 일부 작업의 시간적 중첩과 내장된 곱셈기 회로 그리고 파이프라인 적용 효과로 회로의 전체적인 성능은 대략 매 클럭마다 한 개의 화소에 대해 히스토그램 평활화를 수행할 수 있다. 그리고 영상을 분할하여 히스토그램 평활화 작업의 일부를 병렬 처리하면 그 성능을 속도 면에서 거의 두 배로 향상할 수 있다.

S&P 잡음 환경에서 표준편차를 이용한 변형된 가중치 필터 (Modified Weighted Filter by Standard Deviation in S&P Noise Environments)

  • 백지현;김남호
    • 한국정보통신학회논문지
    • /
    • 제24권4호
    • /
    • pp.474-480
    • /
    • 2020
  • 최근 4차산업 혁명의 시대가 도래하면서 새로운 기술들이 많이 구현되고 있는 추세이다. 그 중 영상신호는 다양한 분야에서 활용되어 지고 있다. 하지만 영상신호를 송,수신할 때 다양한 이유로 잡음이 발생하게 되며 Salt and Pepper 잡음과 AWGN이 대표적이다. 영상처리를 수행 할 때 잡음을 제거하지 않고 처리하게 되면 오류의 전파라는 문제점을 야기할 수 있다. 일반적으로 잡음을 제거하는 방법으로 CWMF, MF, AMF 등이 있지만 이러한 필터들의 경우 고밀도 잡음 영역에서 다소 미흡한 성능을 보이며, 스무딩 현상으로 인해 에지 성분의 보존률도 다소 떨어진다. 본 연구에서는 표준편차를 이용한 변형된 가중치 필터를 이용하여 Salt and Pepper잡음을 효과적으로 제거하는 알고리즘을 제안한다. 제안한 알고리즘의 잡음 제거 성능을 입증하기 위해 PSNR과 확대영상을 사용하여 기존의 알고리즘과 비교하였다.

고밀도 잡음 환경에서 엔트로피를 이용한 잡음 제거 방법 (Noise Removal Method using Entropy in High-Density Noise Environments)

  • 백지현;김남호
    • 한국정보통신학회논문지
    • /
    • 제24권10호
    • /
    • pp.1255-1261
    • /
    • 2020
  • 현재 모바일 기기의 보급이 점차 확대되어 지고 있다. 그에 따라 영상이나 사진을 활용한 다양한 기술들이 활발히 연구되어지고 있다. 하지만 영상 데이터는 복합적인 이유로 잡음이 발생하게 되며, 잡음의 제거 성능에 따라 영상처리의 정확도가 높아진다. 따라서 전 처리 과정으로 잡음의 제거는 필수불가결한 단계중 하나이다. 영상의 대표적인 임펄스 잡음으로 Salt and Pepper 잡음이 있으며, 이러한 잡음을 제거하기 위해 다양한 연구가 진행되고 있다. 하지만 기존의 알고리즘의 경우 고주파 영역에서 잡음제거 성능이 떨어지고, 평균 필터의 경우 블러 현상이 나타난다. 따라서 본 논문에서는 엔트로피를 이용하여 저주파영역 뿐만 아니라 고주파 영역에서도 효과적으로 Salt and Pepper 잡음을 제거하는 알고리즘을 제안한다. 제안한 알고리즘의 객관적이고 정확한 판단을 위해 MSE 및 PSNR을 이용하여 기존의 알고리즘들과 비교, 분석하였다.

AWGN 환경에서 영상복원을 위한 마스크매칭 기반의 디지털 필터 알고리즘 (Digital Filter Algorithm based on Mask Matching for Image Restoration in AWGN Environment)

  • 천봉원;김남호
    • 한국정보통신학회논문지
    • /
    • 제25권2호
    • /
    • pp.214-220
    • /
    • 2021
  • 현대 사회는 4차 산업혁명의 영향에 의해 다양한 디지털 통신 장비가 사용되고 있으며, 이에 따라 데이터 전송 과정에서 발생하는 잡음 제거에 관심이 높아지고 있다. 본 논문에서는 디지털 이미지 전송 과정에서 발생하는 AWGN을 제거하기 필터링 알고리즘을 제안한다. 제안한 알고리즘은 영상의 경계선과 같은 정보를 보존하기 위해 마스크매칭에 기반하여 잡음을 제거하며, 입력 화소값과 주변 화소의 패턴에 따라 서로 유사한 패턴을 지닌 화소값들을 출력계산에 사용한다. 제안한 알고리즘을 평가하기 위해 기존 AWGN 제거 알고리즘들과 시뮬레이션하였으며, 확대영상과 PSNR 비교를 사용하여 분석하였다. 제안한 알고리즘은 기존 방법에 비해 AWGN 제거 성능이 우수하였으며, 특히 AWGN의 잡음 세기가 강한 영상에서 효과적인 모습을 보였다.

차량탑승인원 탐지를 위한 딥러닝 영상처리 기술 연구 (Deep Learning Image Processing Technology for Vehicle Occupancy Detection)

  • 장성진;장종욱
    • 한국정보통신학회논문지
    • /
    • 제25권8호
    • /
    • pp.1026-1031
    • /
    • 2021
  • 세계 자동차 기술의 발전과 시장 규모의 확대로 차량 수요가 증가하고 있으며 이로 인해 차량탑승 인원은 감소하고 도로의 차량 수는 증가하는 추세이다. 이는 교통체증의 원인이 되며 이러한 문제를 해결하기 위해 다인승 전용차로 제도를 시행하고 있으나 불법 이용 차량은 계속 증가하고 있다. 이러한 불법 행위를 단속하기 위한 다양한 기술이 연구되고 있다. 기존에 개발된 시스템은 트리거 장비를 이용하여 차량을 인식하고 적외선 카메라를 통해 차량을 촬영하여 차량 탑승 인원을 감지한다. 본 논문에서는 기존 시스템 적용된 트리거 장비를 이용하지 않고 딥러닝 모델 기술을 적용한 차량탑승 인원탐지 시스템을 제안한다. 제안된 기술은 영상 내에 트리거를 설정하여 차량을 탐지하고 딥러닝 객체 인식모델을 적용하여 실시간 탑승 인원을 감지하는 시스템을 제안한다.

Defect Diagnosis and Classification of Machine Parts Based on Deep Learning

  • Kim, Hyun-Tae;Lee, Sang-Hyeop;Wesonga, Sheilla;Park, Jang-Sik
    • 한국산업융합학회 논문집
    • /
    • 제25권2_1호
    • /
    • pp.177-184
    • /
    • 2022
  • The automatic defect sorting function of machinery parts is being introduced to the automation of the manufacturing process. In the final stage of automation of the manufacturing process, it is necessary to apply computer vision rather than human visual judgment to determine whether there is a defect. In this paper, we introduce a deep learning method to improve the classification performance of typical mechanical parts, such as welding parts, galvanized round plugs, and electro galvanized nuts, based on the results of experiments. In the case of poor welding, the method to further increase the depth of layer of the basic deep learning model was effective, and in the case of a circular plug, the surrounding data outside the defective target area affected it, so it could be solved through an appropriate pre-processing technique. Finally, in the case of a nut plated with zinc, since it receives data from multiple cameras due to its three-dimensional structure, it is greatly affected by lighting and has a problem in that it also affects the background image. To solve this problem, methods such as two-dimensional connectivity were applied in the object segmentation preprocessing process. Although the experiments suggested that the proposed methods are effective, most of the provided good/defective images data sets are relatively small, which may cause a learning balance problem of the deep learning model, so we plan to secure more data in the future.

계층 간 특징 복원-예측 네트워크를 통한 피라미드 특징 압축 (Pyramid Feature Compression with Inter-Level Feature Restoration-Prediction Network)

  • 김민섭;심동규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.283-294
    • /
    • 2022
  • 딥 러닝 네트워크에서 사용되는 특징 맵은 일반적으로 영상보다 데이터가 크며 특징 맵을 전송하기 위해서는 영상의 압축률보다 더 높은 압축률이 요구된다. 본 논문은 딥러닝 기반의 영상처리에서 객체의 크기에 대한 강인성을 가지는 FPN 구조의 네트워크에서 사용되는 피라미드 특징 맵을 높은 압축률로 전송하기 위해 제안한 복원-예측 네트워크를 통해 전송된 일부 계층의 피라미드 특징 맵으로 전송하지 않은 계층의 피라미드 특징 맵을 예측하며, 압축으로 인한 손상을 복원하는 구조를 제안한다. 제안한 방법의 COCO 데이터셋 2017 Train images에 대한 객체 탐지의 성능은 rate-precision 그래프에서 VTM12.0을 통해 특징 맵을 압축한 결과 대비 BD-rate 31.25%의 성능향상을 보였고, PCA와 DeepCABAC을 통한 압축을 수행한 방법 대비 BD-rate 57.79%의 성능향상을 보였다.

딥러닝 기반의 핵의학 폐검사 분류 모델 적용 (Application of Deep Learning-Based Nuclear Medicine Lung Study Classification Model)

  • 정의환;오주영;이주영;박훈희
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제45권1호
    • /
    • pp.41-47
    • /
    • 2022
  • The purpose of this study is to apply a deep learning model that can distinguish lung perfusion and lung ventilation images in nuclear medicine, and to evaluate the image classification ability. Image data pre-processing was performed in the following order: image matrix size adjustment, min-max normalization, image center position adjustment, train/validation/test data set classification, and data augmentation. The convolutional neural network(CNN) structures of VGG-16, ResNet-18, Inception-ResNet-v2, and SE-ResNeXt-101 were used. For classification model evaluation, performance evaluation index of classification model, class activation map(CAM), and statistical image evaluation method were applied. As for the performance evaluation index of the classification model, SE-ResNeXt-101 and Inception-ResNet-v2 showed the highest performance with the same results. As a result of CAM, cardiac and right lung regions were highly activated in lung perfusion, and upper lung and neck regions were highly activated in lung ventilation. Statistical image evaluation showed a meaningful difference between SE-ResNeXt-101 and Inception-ResNet-v2. As a result of the study, the applicability of the CNN model for lung scintigraphy classification was confirmed. In the future, it is expected that it will be used as basic data for research on new artificial intelligence models and will help stable image management in clinical practice.