• 제목/요약/키워드: learning through the image

검색결과 931건 처리시간 0.027초

딥러닝을 위한 모폴로지를 이용한 수중 영상의 세그먼테이션 (Segmentation of underwater images using morphology for deep learning)

  • 이지은;이철원;박석준;신재범;정현기
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.370-376
    • /
    • 2023
  • 수중영상은 수중 잡음과 낮은 해상도로 표적의 형상과 구분이 명확하지 않다. 그리고 딥러닝의 입력으로 수중영상은 전처리가 필요하며 Segmentation이 선행되어야 한다. 전처리를 하여도 표적은 명확하지 않으며 딥러닝에 의한 탐지, 식별의 성능도 높지 않을 수 있다. 따라서 표적을 구분하며 명확하게 하는 작업이 필요하다. 본 연구에서는 수중영상에서 표적 그림자의 중요성을 확인하고 그림자에 의한 물체 탐지 및 표적 영역 획득, 그리고 수중배경이 없는 표적과 그림자만의 형상이 담긴 데이터를 생성하며 더 나아가 픽셀값이 일정하지 않은 표적과 그림자 영상을 표적은 흰색, 그림자는 흑색, 그리고 배경은 회색의 3-모드의 영상으로 변환하는 과정을 제시한다. 이를 통해 딥러닝의 입력으로 명확히 전처리된 판별이 용이한 영상을 제공할 수 있다. 또한 처리는 Open Source Computer Vision(OpenCV)라이브러리의 영상처리 코드를 사용했으면 처리 속도도 역시 실시간 처리에 적합한 결과를 얻었다.

교통 영상 빅데이터 처리를 위한 Yolo 기반 광원 객체 탐지 (Yolo based Light Source Object Detection for Traffic Image Big Data Processing)

  • 강지수;심세은;조선문;정경용
    • 융합정보논문지
    • /
    • 제10권8호
    • /
    • pp.40-46
    • /
    • 2020
  • 교통안전에 대한 관심이 높아짐에 따라 교통사고의 발생률을 줄이는 자율 주행에 대한 연구가 지속적으로 진행되고 있다. 객체의 인식과 탐지는 자율 주행을 위한 필수적인 요소이다. 때문에 도로 상황을 판단하기 위하여 교통 영상 빅데이터에서 객체 인식 및 탐지에 대한 연구가 활발히 진행 중이다. 하지만 기존 연구들은 대부분 주간 데이터만 사용하기 때문에 야간 도로에서 객체 인식이 어렵다. 특히 광원 객체의 경우 빛 번짐과 백화 현상으로 인해 주간의 특징을 그대로 사용하기 어렵다. 따라서 본 연구에서는 교통 영상 빅데이터 처리를 위한 Yolo 기반 광원 객체 탐지를 제안한다. 제안하는 방법은 야간 교통 영상을 대상으로 색상 모델 변화를 적용하여 이미지 처리를 수행한다. 이미지 처리를 통해서 객체의 특징을 추출하여 객체의 후보군을 결정한다. 후보군 데이터를 활용하여 딥러닝 모델을 통해 야간 도로에서 광원 객체 탐지의 인식률을 높이는 것이 가능하다.

웹 이미지 마이닝과 랜덤 레이블을 이용한 딥러닝 기반 개 품종 인식 (Recognition of Dog Breeds based on Deep Learning using a Random-Label and Web Image Mining)

  • 강민석;홍광석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.201-202
    • /
    • 2018
  • 본 논문에서는 기존 ImageNet과 Oxford-IIIT Pet Image의 Dataset에서 제공하는 개 품종 이미지와 인터넷 상에서 개 품종 이미지를 데이터 마이닝을 통해 획득된 개 품종 이미지를 결합하고 Random-Label을 추가 하여 개 품종 122개의 클래스와 개 품종이 아닌 1개의 클래스를 인식하는 방법에 대해 소개 한다. 기존 DB만을 사용하였을 때 개 품종 인식률 대비 기존 DB와 수집 DB를 모두 사용한 개 품종 인식률이 Top-1에 대해서 1.5% 개선되었다. 개가 아닌 이미지 인식은 랜덤 DB를 10000장의 경우 93% 인식률을 확인했다.

  • PDF

Character Classification with Triangular Distribution

  • Yoo, Suk Won
    • International Journal of Advanced Culture Technology
    • /
    • 제7권2호
    • /
    • pp.209-217
    • /
    • 2019
  • Due to the development of artificial intelligence and image recognition technology that play important roles in the field of 4th industry, office automation systems and unmanned automation systems are rapidly spreading in human society. The proposed algorithm first finds the variances of the differences between the tile values constituting the learning characters and the experimental character and then recognizes the experimental character according to the distribution of the three learning characters with the smallest variances. In more detail, for 100 learning data characters and 10 experimental data characters, each character is defined as the number of black pixels belonging to 15 tile areas. For each character constituting the experimental data, the variance of the differences of the tile values of 100 learning data characters is obtained and then arranged in the ascending order. After that, three learning data characters with the minimum variance values are selected, and the final recognition result for the given experimental character is selected according to the distribution of these character types. Moreover, we compare the recognition result with the result made by a neural network of basic structure. It is confirmed that satisfactory recognition results are obtained through the processes that subdivide the learning characters and experiment characters into tile sizes and then select the recognition result using variances.

빅데이터 기반 미세먼지 이상 탐지 머신러닝 시스템 설계 및 구현 (Design and Implementation of Machine Learning System for Fine Dust Anomaly Detection based on Big Data)

  • 이재원;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.55-58
    • /
    • 2024
  • 본 논문은 빅데이터 기반 미세먼지 이상 탐지 머신러닝 시스템 설계 및 구현을 제안한다. 제안하는 시스템은 빅데이터로 구성된 미세먼지 및 기상 정보를 통해 미세먼지 대기환경지수를 분류하는 시스템이다. 이 시스템은 머신러닝 기반의 대기환경지수 분류 카테고리별 이상치에 따른 이상치 탐지 알고리즘 설계를 통해 미세먼지를 분류한다. 카메라에서 수집된 영상의 심도 데이터는 미세먼지 농도에 따른 영상을 수집한 후 미세먼지 가시마스크를 생성합니다. 그리고 모노 심도 추정 알고리즘을 통한 학습 기반 핑거프린팅 기법으로 모노스코프 카메라에서 수집된 미세먼지의 가시거리를 추론하여 미세먼지 농도를 도출합니다. 본 방법의 실험 및 분석을 위해 미세먼지 농도 데이터와 지역별, 시간별 CCTV 영상 데이터를 매칭하여 학습 데이터를 생성한 후 모델을 생성하여 실제 환경에서 테스트한다.

Medical Image Analysis Using Artificial Intelligence

  • Yoon, Hyun Jin;Jeong, Young Jin;Kang, Hyun;Jeong, Ji Eun;Kang, Do-Young
    • 한국의학물리학회지:의학물리
    • /
    • 제30권2호
    • /
    • pp.49-58
    • /
    • 2019
  • Purpose: Automated analytical systems have begun to emerge as a database system that enables the scanning of medical images to be performed on computers and the construction of big data. Deep-learning artificial intelligence (AI) architectures have been developed and applied to medical images, making high-precision diagnosis possible. Materials and Methods: For diagnosis, the medical images need to be labeled and standardized. After pre-processing the data and entering them into the deep-learning architecture, the final diagnosis results can be obtained quickly and accurately. To solve the problem of overfitting because of an insufficient amount of labeled data, data augmentation is performed through rotation, using left and right flips to artificially increase the amount of data. Because various deep-learning architectures have been developed and publicized over the past few years, the results of the diagnosis can be obtained by entering a medical image. Results: Classification and regression are performed by a supervised machine-learning method and clustering and generation are performed by an unsupervised machine-learning method. When the convolutional neural network (CNN) method is applied to the deep-learning layer, feature extraction can be used to classify diseases very efficiently and thus to diagnose various diseases. Conclusions: AI, using a deep-learning architecture, has expertise in medical image analysis of the nerves, retina, lungs, digital pathology, breast, heart, abdomen, and musculo-skeletal system.

에지와 컬러 정보를 결합한 안면 분할 기반의 손실 함수를 적용한 메이크업 변환 (Makeup transfer by applying a loss function based on facial segmentation combining edge with color information)

  • 임소현;전준철
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.35-43
    • /
    • 2022
  • 메이크업은 사람의 외모를 개선하는 가장 보편적인 방법이다. 하지만 메이크업의 스타일이 매우 다양하기 때문에 한 개인이 본인에게 직접 메이크업을 하는 것에는 많은 시간적, 비용적 문제점이 존재한다. 이에 따라 메이크업 자동화에 대한 필요성이 증가하고 있다. 메이크업의 자동화를 위해 메이크업 변환(Makeup Transfer)가 연구되고 있다. 메이크업 변환은 메이크업이 없는 얼굴 영상에 메이크업 스타일을 적용시키는 분야이다. 메이크업 변환은 전통적인 영상 처리 기반의 방법과 딥러닝 기반의 방법으로 나눌 수 있다. 특히 딥러닝 기반의 방법에서는 적대적 생성 신경망을 기반으로 한 연구가 많이 수행되었다. 하지만 두 가지 방법 모두 결과 영상이 부자연스럽거나 메이크업 변환의 결과가 뚜렷하지 않고 번지거나 메이크업 스타일 얼굴 영상의 영향을 많이 받는다는 단점이 있다. 메이크업의 뚜렷한 경계를 표현하고 메이크업 스타일 얼굴 영상에서 받는 영향을 완화시키기 위해 본 연구에서는 메이크업 영역을 분할하고 HoG(Histogram of Gradient)를 사용해 손실 함수를 계산한다. HoG는 영상 내에 존재하는 에지의 크기와 방향성을 통해 영상의 특징을 추출하는 방법이다. 이를 통해 에지에 대해 강건한 학습을 수행하는 메이크업 변환에 대해 제안한다. 제안한 모델을 통해 생성된 영상과 베이스 모델로 사용하는 BeautyGAN을 통해 생성된 영상을 비교해 본 연구에서 제안한 모델의 성능이 더 뛰어남을 확인하고 추가로 제시할 수 있는 얼굴 정보에 대한 사용 방법을 향후 연구로 제시한다.

Research on Local and Global Infrared Image Pre-Processing Methods for Deep Learning Based Guided Weapon Target Detection

  • Jae-Yong Baek;Dae-Hyeon Park;Hyuk-Jin Shin;Yong-Sang Yoo;Deok-Woong Kim;Du-Hwan Hur;SeungHwan Bae;Jun-Ho Cheon;Seung-Hwan Bae
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.41-51
    • /
    • 2024
  • 본 논문에서는 적외선 이미지에서 딥러닝 물체 탐지를 사용하여 유도무기의 표적 탐지 정확도 향상 방법을 연구한다. 적외선 이미지의 특성은 시간, 온도 등의 요인에 의해 영향을 받기 때문에 모델을 학습할 때 다양한 환경에서 표적 객체의 특징을 일관되게 표현하는 것이 중요하다. 이러한 문제를 해결하는 간단한 방법은 적절한 전처리 기술을 통해 적외선 이미지 내 표적 객체의 특징을 강조하고 노이즈를 줄이는 것이다. 그러나, 기존 연구에서는 적외선 영상 기반 딥러닝 모델 학습에서 전처리기법에 관한 충분한 논의가 이루어지지 못했다. 이에, 본 논문에서는 표적 객체 검출을 위한 적외선 이미지 기반 훈련에 대한 이미지 전처리 기술의 영향을 조사하는 것을 목표로 한다. 이를 위해 영상과 이미지의 전역(global) 또는 지역(local) 정보를 활용한 적외선 영상에 대한 전처리인 Min-max normalization, Z-score normalization, Histogram equalization, CLAHE (Contrast Limited Adaptive Histogram Equalization)에 대한 결과를 분석한다. 또한, 각 전처리 기법으로 변환된 이미지들이 객체 검출기 훈련에 미치는 영향을 확인하기 위해 다양한 전처리 방법으로 처리된 이미지에 대해 YOLOX 표적 검출기를 학습하고, 이에 대한 분석을 진행한다. 실험과 분석을 통해 전처리 기법들이 객체 검출기 정확도에 영향을 미친다는 사실을 알게 되었다. 특히, 전처리 기법 중에서도 CLAHE 기법을 사용해 실험을 진행한 결과가 81.9%의 mAP (mean average precision)을 기록하며 가장 높은 검출 정확도를 보임을 확인하였다.

딥러닝을 이용한 병징에 최적화된 딸기 병충해 검출 기법 (Strawberry Pests and Diseases Detection Technique Optimized for Symptoms Using Deep Learning Algorithm)

  • 최영우;김나은;볼라파우델;김현태
    • 생물환경조절학회지
    • /
    • 제31권3호
    • /
    • pp.255-260
    • /
    • 2022
  • 본 논문은 딥러닝 알고리즘을 이용하여 딸기 영상 데이터의 병충해 존재 여부를 자동으로 검출할 수 있는 서비스 모델을 제안한다. 또한 병징에 특화된 분할 이미지 데이터 세트를 제안하여 딥러닝 모델의 병충해 검출 성능을 향상한다. 딥러닝 모델은 CNN 기반 YOLO를 선정하여 기존의 R-CNN 기반 모델의 느린 학습속도와 추론속도를 개선하였다. 병충해 검출 모델을 학습하기 위해 일반적인 데이터 세트와 제안하는 분할 이미지 데이터 세트를 구축하였다. 딥러닝 모델이 일반적인 학습 데이터 세트를 학습했을 때 병충해 검출률은 81.35%이며 병충해 검출 신뢰도는 73.35%이다. 반면 딥러닝 모델이 분할 이미지 학습 데이터 세트를 학습했을 때 병충해 검출률은 91.93%이며 병충해 검출 신뢰도는 83.41%이다. 따라서 분할 이미지 데이터를 학습한 딥러닝 모델의 성능이 우수하다는 것을 증명할 수 있었다.

자율주행 상황에서의 날씨 조건에 집중한 날씨 분류 및 영상 화질 개선 알고리듬 (Weather Classification and Image Restoration Algorithm Attentive to Weather Conditions in Autonomous Vehicles)

  • 김재훈;이정환;김상민;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.60-63
    • /
    • 2020
  • With the advent of deep learning, a lot of attempts have been made in computer vision to substitute deep learning models for conventional algorithms. Among them, image classification, object detection, and image restoration have received a lot of attention from researchers. However, most of the contributions were refined in one of the fields only. We propose a new paradigm of model structure. End-to-end model which we will introduce classifies noise of an image and restores accordingly. Through this, the model enhances universality and efficiency. Our proposed model is an 'One-For-All' model which classifies weather condition in an image and returns clean image accordingly. By separating weather conditions, restoration model became more compact as well as effective in reducing raindrops, snowflakes, or haze in an image which degrade the quality of the image.

  • PDF