• 제목/요약/키워드: 다중색상 모델

검색결과 22건 처리시간 0.025초

딥러닝기반 YOLO를 활용한 후숙과일 분류 및 숙성 예측 시스템 (Deep Learning-based Mango Classification and Prediction System of Fruit Ripening using YOLO)

  • 김영민;박승민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.187-188
    • /
    • 2021
  • 본 논문에서는 실시간으로 web-cam을 이용해, 후숙과일의 불량 여부를 판단, 분류하고 불량이 없는 후숙과일의 이미지 분석을 통하여 숙성도 예측하는 시스템을 소개한다. 실시간 다중 객체인식에 탁월한 yolo모델을 활용해, 과일의 불량여부 판단 후 분류하고, 이미지를 획득한 뒤, k-mean clustering 알고리즘을 이용해, 이미지를 segmentation 한다. segmentation된 이미지에 grabcut 알고리즘의 foreground-extraction을 사용해 배경 제거를 한 뒤, cluster의 중심색상값 색상값의 면적%, 전체 면적을 이용해 현재 숙성도를 계산하고 이를 이용해 과일의 후숙 시간 데이터와 비교, 숙성이 완료될 시간을 예측한다. 기존 수작업으로 이루어지고 있는 과일의 분류작업의 인력 감소 및 정확성을 높일 수 있는 알고리즘을 제안한다.

  • PDF

다양한 크기의 식별자를 적용한 Cycle GAN을 이용한 다목적실용위성 5호 SAR 영상 색상 구현 방법 (The Method for Colorizing SAR Images of Kompsat-5 Using Cycle GAN with Multi-scale Discriminators)

  • 구원회;정대원
    • 대한원격탐사학회지
    • /
    • 제34권6_3호
    • /
    • pp.1415-1425
    • /
    • 2018
  • 다목적실용위성 5호는 국내 최초로 영상레이더(SAR)가 탑재된 지구관측위성이다. SAR 영상은 위성에 부착된 안테나로부터 방사된 마이크로파가 물체로부터 반사된 신호를 수신하여 생성된다. SAR는 대기 중의 입자의 크기에 비해 파장이 긴 마이크로파를 사용하기 때문에 구름이나 안개 등을 투과할 수 있으며, 주야간 구분 없이 고해상도의 영상을 얻을 수 있다. 하지만, SAR 영상에는 색상 정보가 부재하는 제한점이 존재한다. 이러한 SAR 영상의 제한점을 극복하기 위해, 도메인 변환을 위해 개발된 딥러닝 모델인 Cycle GAN을 활용하여 SAR 영상에 색상을 대입하는 연구를 수행하였다. Cycle GAN은 unpaired 데이터셋 기반의 무감독 학습으로 인해 학습이 불안정하다. 따라서 Cycle GAN의 학습 불안정성을 해소하고, 색상 구현의 성능을 향상하기 위해 다중 크기 식별자를 적용한 MS Cycle GAN을 제안하였다. MS Cycle GAN과 Cycle GAN의 색상 구현 성능을 비교하기 위하여 두 모델이 Florida 데이터셋을 학습하여 생성한 영상을 정성적 및 정량적으로 비교하였다. 다양한 크기의 식별자가 도입된 MS Cycle GAN은 기존의 Cycle GAN과 비교하여 학습 결과에서 생성자 및 식별자 손실이 대폭 감소되었고, 나뭇잎, 강, 토지 등의 영역 특성에 부합하는 색상이 구현되는 것을 확인하였다.

확률적 표본화와 배경 차분을 이용한 비디오 객체 추적 (Visual Tracking Using Monte Carlo Sampling and Background Subtraction)

  • 김현철;백준기
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.16-22
    • /
    • 2011
  • 본 논문에서는 배경 차분에 의해 객체를 검출하고 확률적으로 표본화된 입자 필터링(particle filtering)기법을 사용한 다중객체 추적 기법을 제안한다. 확률적으로 표본화된 입자들을 사용하여 다중 객체에 독립적으로 적용할 때 발생하는 계산 복잡도(computational complexity)를 감소시키는 동시에 안정적인 추적을 가능하게 하였다. 객체의 색상정보를 사용한 히스토그램 분포에 의한 관측 모델(observation model)을 구성하고 객체의 움직임 정보를 위해 동적 모델을 공식화하여 영상을 해석하였다. 전체적인 추적 시스템은 베이시언 최대 우도 기법(Bayesian maximum likelihood method)을 근간으로 하되, 입자 필터링을 객체 추적에 적용하여 실용적인 현실 객체 추적 상황에도 강건하게 대처할 수 있음을 실험을 통해서 증명하였다.

광학적 다중 법선 벡터 기반 훈색(暈色)현상 BRDF 압축 기법 (Optical Multi-Normal Vector Based Iridescence BRDF Compression Method)

  • 유세운;이상화;박종일
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권3호
    • /
    • pp.184-193
    • /
    • 2010
  • 본 논문은 생물체 표면에서 번쩍이고 다채로운 색깔의 반사특성을 보이는 훈색(暈色)현상의 양방향 반사율 분포 함수(BRDF: Bidirectional Reflectance Distribution Function)의 압축방법을 제안한다. 그래픽스 기술에서 훈색 현상의 용어를 보통 이리데센스(Iridescence) 또는 구조적 색상(structural colors)라고 부른다. 이러한 현상의 주요한 특징은 시점에 따라 다채로운 색상과 밝기를 갖는 것이다. 이것을 구현하기 위해 기존의 그래픽스 기술들은 BRDF를 이용한 방법을 사용한다. BRDF 방법은 많은 시점의 영상을 직접 활용하여 사실적인 표현이 가능한 장점이 있지만, 데이터양이 커서 연산량이 많은 단점이 있다. 본 논문에서는 훈색(暈色: Iridescence)현상의 BRDF로부터 반사맵을 작성하고, 반사맵을 여러 개의 색상 기반의 동심원으로 반사맵을 표현할 수 있는 방법을 제안한다. 이때 동심원 1개는 1개의 법선벡터에 의한 반사광의 빔폭을 의미한다. 본 논문에서는 여러 개의 가상의 광학적 법선벡터를 사용하여 울퉁불퉁한 동심원을 합성한다. 그리고 동심원의 중심을 통과하는 한 선분으로부터 1차원 스펙트럼 정보를 취득한다. 제안하는 방법은 BRDF의 막대한 데이터양을 효과적으로 줄여서 단지 1장의 텍스처를 사용하여 사실적인 밝기 차이와 스펙트럼 표현이 가능한 영상기반 렌더링 기법(IBR: image based rendering)으로 사용할 수 있다.

결합된 파티클 필터에 기반한 강인한 3차원 손 추적 (Robust 3D Hand Tracking based on a Coupled Particle Filter)

  • 안우석;석흥일;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.80-84
    • /
    • 2010
  • 손 추적 기술은 인간과 기계와의 효율적인 의사소통을 위한 손동작 인식 기술의 핵심 기반 기술이다. 최근의 손 추적 연구는 3차원 손 모델을 이용한 연구 방향에 초점을 맞추고 있고, 기존의 2차원 손 모델을 이용한 방법보다 강인한 추적 성능을 보이고 있다. 본 논문에서는 결합된 파티클 필터에 기반한 새로운 3차원 손 추적 방법을 제안한다. 이는 전역적 손 형상과 지역적 손가락 움직임을 분리하여 추정하고, 각각의 추정 결과를 서로의 사전 정보로 이용하여 기존의 방법보다 빠르고 강인한 추적을 가능하게 한다. 또한, 추적 성능 향상을 위해 색상과 에지를 함께 고려한 다중 증거 결합 방법을 적용한다. 실험결과, 제안하는 방법은 복잡한 배경이나 동작에서도 강인한 추적 결과를 보였다.

스크린 이미지 부호화를 위한 에지 정보 기반의 효과적인 형태학적 레이어 분할 (Effective Morphological Layer Segmentation Based on Edge Information for Screen Image Coding)

  • 박상효;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.38-47
    • /
    • 2013
  • 다중 레이어 영상 모델인 Mixed Raster Content 모델 (MRC) 기반의 영상 부호화는 스크린 이미지와 같은 혼합 영상을 전경 레이어, 이진 마스크 레이어, 배경 레이어로 재구성한 뒤, 각 레이어마다 그 레이어의 신호 특성에 적합한 부호화기를 이용하여 영상을 압축하는 기법이다. 문자와 같은 계단 형태의 강한 에지를 갖는 영역의 위치 정보를 마스크 레이어에 저장하고, 그 위치의 색상 신호는 전경 레이어에 저장한다. 그리고 나머지 영역인 배경 영역의 색상 신호는 배경 레이어에 저장한다. 따라서 마스크 레이어가 전경과 배경의 분할 정보를 담게 되며, 이 분할 정보의 정확도에 따라 전체 부호화기의 압축 효율이 직접적인 영향을 받는다. 본 논문은 MRC 기반의 영상 부호화를 위한 새로운 레이어 분할 알고리즘을 제안한다. 제안 방법은 형태학적 필터인 top hat 변환을 이용하여 문자를 배경신호로부터 분할한다. 이때 문자의 경계를 에지 맵으로부터 추정하여 문자 색상과 배경과의 상대적 밝기를 결정하고 이를 통해 형태학적 필터링에 필요한 top hat 변환의 종류를 정확히 선택하도록 하였다. 실험을 통해 제안 방법이 비교 대상 알고리즘에 비해 우수한 분할 성능을 가짐을 보인다.

딥러닝을 이용한 화재 발생 예측 이미지 분할 (Image Segmentation for Fire Prediction using Deep Learning)

  • 김태훈;박종진
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.65-70
    • /
    • 2023
  • 본 논문에서는 화재로부터 실시간으로 화염과 연기를 감지하고 분할하기 위해 딥러닝 모델을 사용하였다. 이를 위해 의미론적 분할에서 우수한 성능을 보이는 U-NET을 사용하고 다중 클래스를 이용하여 화재의 불꽃과 연기를 구분 하였다. 제안된 기법을 이용하여 학습한 결과, 손실 오차와 정확도 값이 각각 0.0486과 0.97996으로 매우 양호하였다. 객체 감지에 사용되는 IOU 값도 0.849로 매우 좋았다. 학습된 모델을 이용하여 학습에 사용하지 않은 화재 이미지를 예측한 결과, 화재의 불꽃과 연기가 잘 감지되고 분할되었으며, 연기의 색상도 잘 구분되었다. 제안된 기법을 이용하여 화재 예측 및 감지 시스템 구축 등에 사용될 수 있다.

피부색과 변형된 다중 CAMShift 알고리즘을 이용한 실시간 휴먼 트래킹 (Real-Time Human Tracking Using Skin Area and Modified Multi-CAMShift Algorithm)

  • 민재홍;김인규;백중환
    • 한국항행학회논문지
    • /
    • 제15권6호
    • /
    • pp.1132-1137
    • /
    • 2011
  • 본 논문에서는 사람의 신체 일부분을 추적하는 시스템을 위해서 피부영역을 추출하고 여러 개의 영역을 추적하는 다중 CAMShift 알고리즘(Multi Continuously Adaptive Mean Shift Algorithm)을 제안하였다. 입력 영상에서 피부영역을 추출하기 위해 영상의 RGB의 특정값을 기준으로 피부색에 적응적인 임계값을 적용하였다. 이때 적용된 피부영역을 양손, 얼굴 등에 초기 윈도우를 설정하였다. 이 영역들을 추적함에 있어 영역들 사이에 폐색 영역을 회피하기 위해 가우시안 배경 모델(Gaussian Background Model)을 사용하여 각 추적 영역들을 제한하였다. 또한 폐색영역에 가중치를 부가하여 확률분포영상에서 중심값을 이동시켜 폐색 영역을 회피하였다. 실험 결과 다중 물체들에 강인한 추적을 보이고 유사한 색상을 갖는 물체의 폐색 시에도 우수한 결과를 보임을 확인하였다.

오프라인 응용을 위한 컬러 QR코드의 삽입 정보 추출 방법 (An Embedded Information Extraction of Color QR Code for Offline Applications)

  • 김진수
    • 한국정보통신학회논문지
    • /
    • 제24권9호
    • /
    • pp.1123-1131
    • /
    • 2020
  • 현재 QR 코드는 가장 흔히 사용되고 있는 2차원 바코드이다. QR코드는 작은 크기, 높은 부호화 및 에러 보정 능력, 손쉬운 생성 및 읽기 과정 등의 장점으로 인해 많은 응용에 활용되고 있다. 최근에는 인쇄된 컬러 QR코드 응용을 통하여 제한된 정보 저장 능력을 개선하려는 연구가 진행되고 있다. 그러나 컬러 정보를 QR코드에 다중화함으로써, 정보 추출을 위한 색상 간의 간섭 왜곡뿐만 아니라 기하왜곡 등으로 인하여 삽입 정보를 제대로 추출하는데 어려움을 갖게 된다. 본 논문에서는 색상차 왜곡과 기하 왜곡을 극복하기 위한 강인하고 효과적인 정보 추출 방법을 제안한다. 제안한 방법은 CMYK 컬러 모델에 기반하여 컬러 QR코드를 생성함과 더불어 정보 읽기 과정에서 전역 공간 정합과 국부 공간 탐색을 적응적으로 사용함으로써 삽입 정보 인식률을 개선하는 것이다. 인쇄된 QR코드에 대한 다양한 실험을 통해 제안한 방법은 실제 삽입된 정보를 추출함에 있어서 3% ~ 5% 정도의 비트 인식률 개선효과를 보인다.

HDR 영상 압축을 위한 시각 밝기 함수를 이용한 다중 스케일 톤 맵핑 모델 (Multi Scale Tone Mapping Model Using Visual Brightness Functions for HDR Image Compression)

  • 권혁주;이성학;채석민;송규익
    • 한국통신학회논문지
    • /
    • 제37A권12호
    • /
    • pp.1054-1064
    • /
    • 2012
  • HDR (high dynamic range) 톤 맵핑 (tone mapping) 알고리듬은 높은 다이내믹 레인지 영상을 압축하여 LDR (low dynamic range) 영상 장치에 구현하기 위해 사용된다. 대표적인 톤 맵핑 알고리듬의 한 방법인 레티넥스 (retinex)는 효과적인 다이내믹 레인지 압축과 색 항상성을 보존할 수 있는 특성을 가지고 있으며, 다중 스케일 및 휘도 성분 기반 알고리듬 등으로 발달되어왔다. 그러나 레티넥스 기반 알고리듬들은 어두운 영역에서 노이즈가 강하게 나타나고 밝은 영역에서는 채도 저하 현상이 나타나는 단점이 있다. 본 논문에서는 명암대비 성능의 개선과 채도 저하 및 노이즈 개선을 위해 시각 밝기 함수를 기반으로 하는 다중 스케일 톤 맵핑 알고리듬을 제안하였다. 제안된 알고리듬은 원영상의 채도 및 색상의 보존을 위해 HSV 색 공간에서 처리가 이루어지며 인간 시각 특성을 반영하기 위해 조명의 변화에 따른 최소 및 최대 휘도 레벨 예측 함수와 시각 감마 모델링 함수를 이용하였다. 그리고 주관적 및 객관적 성능 비교로부터 제안된 알고리듬의 우수성을 확인하였다. 제안된 알고리듬은 시청환경의 변화로 인해 다이내믹 레인지의 개선이 필요한 분야에서 영상화질의 효과적인 개선을 기대할 수 있을 것이다.