• 제목/요약/키워드: 이미지 합성

검색결과 554건 처리시간 0.024초

글자 수 정보를 이용한 이미지 내 글자 영역 검출 방법 (Scene Text Detection with Length of Text)

  • 김영우;김원준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.177-179
    • /
    • 2022
  • 딥러닝의 발전과 함께 합성곱 신경망 기반의 이미지 내 글자 영역 검출(Scene Text Detection) 방법들이 제안됐다. 그러나 이러한 방법들은 대부분 데이터셋이 제공하는 단어의 위치 정보만을 이용할 뿐 글자 영역이 갖는 고유한 정보인 글자 수는 활용하지 않는다. 따라서 본 논문에서는 글자 수 정보를 학습하여 효과적으로 이미지 내의 글자 영역을 검출하는 모듈을 제안한다. 제안하는 방법은 간단한 합성곱 신경망으로 구성된 이미지 내 글자 영역 검출 모델에 글자 수를 예측하는 모듈을 추가하여 학습을 진행하였다. 글자 영역 검출 성능 평가에 널리 사용되는 ICDAR 2015 데이터셋을 통해 기존 방법 대비 성능이 향상됨을 보였고, 글자 수 정보가 글자 영역을 감지하는 데 유효한 정보임을 확인했다.

  • PDF

ADMM과 깊은 합성곱 신경망 잡음 제거기 이미지 Prior에 기반한 이미지 디블러링 (Image Deblurring Based on ADMM and Deep CNN Denoiser Image Prior)

  • 권준형;소재웅;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.680-683
    • /
    • 2020
  • 오래 전부터 모델 기반 최적화 방법이 이미지 디블러링을 위해 널리 사용되어 왔고, 최근에는 학습 기반 기술이 영상 디블러링에서 좋은 성과를 보이고 있다. 본 논문은 ADMM과 깊은 합성곱 신경망 잡음 제거기 이미지 prior를 이용하여 모델 기반 최적화 방법의 장점과 학습 기반 방법의 장점을 모두 활용할 수 있는 방법을 제안한다. 본 방법을 이용하여 기존 방법보다 더 좋은 디블러링 성능을 얻을 수 있었다.

  • PDF

노이즈 추가와 디노이징 처리에 따른 회전 기계설비의 결함 분류 모델 성능 변화 (Performance change of defect classification model of rotating machinery according to noise addition and denoising process)

  • 이세훈;김성수;조비건
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.1-2
    • /
    • 2023
  • 본 연구는 환경 요인이 통제되어 있는 실험실 데이터에 산업 현장에서 발생하는 유사 잡음을 노이즈로 추가하였을 때, SNR비에 따른 노이즈별 STFT Log Spectrogram, Mel-Spectrogram, CWT Spectrogram 총 3가지의 이미지를 생성하고, 각 이미지를 입력으로 한 CNN 결함 분류 모델의 성능 결과를 확인하였다. 원본 데이터의 영향력이 큰 0db 이상의 SNR비로 합성할 경우 원본 데이터와 분류 결과상 큰 차이가 존재하지 않았으며, 노이즈 데이터의 영향이 큰 0db 이하의 SNR비로 합성할 경우, -20db의 STFT 이미지 기준 약 26%의 성능 저하가 발생하였다. 또한, Wiener Filtering을 통한 디노이징 처리 이후, 노이즈를 효과적으로 제거하여 분류 성능의 결과가 높아지는 점을 확인하였다.

  • PDF

SinGAN 딥러닝 모델을 이용한 넙치 질병 이미지 증강 (Image Augmentation of Paralichthys Olivaceus Disease Using SinGAN Deep Learning Model)

  • 손현승;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.322-330
    • /
    • 2021
  • 수산 양식장에서 어류 질병을 초기에 발견하지 못하는 경우 밀폐된 공간 안에서 확산하기 때문에 집단 폐사로 이어질 확률이 매우 높다. 이런 이유로 질병의 조기 발견은 양식업에서 매우 중요하다. 양식장에서 질병의 확산을 막기 위해서는 초기에 병이 든 어류를 자동식별이 가능한 방법이 필요하다. 최근 딥러닝 기반의 어류 질병 자동식별 방법이 많이 사용되고 있는데, 어류의 질병 이미지가 충분하지 않아 객체 식별에 많은 어려움이 있다. 본 논문은 질병 자동식별 예측을 위한 질병 이미지의 부족 문제를 해결하기 위해서 SinGAN 딥러닝 모델을 이용하여 정상 이미지와 질병 이미지를 합성해 다양한 어류 질병 이미지를 자동 생성하는 방법을 제안한다. 넙치에서 가장 빈번히 발생하는 3가지 질병 스쿠티카병, 비브리오증, 림포시스티스에 대해서 SinGAN 기반으로 질병 이미지를 증강한다. 본 연구에서는 넙치 정상 이미지 11장에 각 질병 패턴 10가지를 합성하여서 스쿠티카병 110장, 비브리오증 110장, 림포시스티스 110장으로 총 330장을 만들었고 이를 통해 생성된 이미지는 4배수 하여 1,320장의 이미지를 생성할 수 있었다.

가상 휴먼 학습 기반 영상 객체 검출 기법 (Object Detection Based on Virtual Humans Learning)

  • 이종민;조동식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.376-378
    • /
    • 2022
  • 최근, 인공지능 기술을 인공지능 스피커, 인공지능 챗봇, 자율주행 자동차 등 다양한 분야에서 널리 활용하고 있다. 이러한 인공지능 활용 분야 중 영상처리 분야에서는 인공지능을 활용하여 객체를 검출하거나 사물을 인식하는 등 다양한 활용성을 보이고 있다. 예를 들면, CCTV 영상 속 범죄자의 모습을 분석하거나 드론으로 촬영한 영상 속에서 자동차의 개수를 파악하는 등 영상처리 분야에서 인공지능을 활용하는 사례는 점차 늘어가고 있다. 또한, 이러한 영상처리 분야에서 촬영된 이미지를 가지고 카메라의 위치를 파악하고자 하는 시도가 늘고 있다. 이미지 속의 특정한 객체를 기반으로 카메라의 촬영 위치를 분석하려는 것이다. 이를 활용하면 특정 공간 속 사람을 사각지역 없이 촬영할 수 있는 최적의 카메라 개수를 구하거나 CCTV를 설치하기 위한 최적의 위치를 구하는 등 다양한 현실 문제를 해결할 수 있을 것으로 예상이 된다. 본 논문에서는 특정 공간에서 촬영된 이미지를 분석하기 위한 방법으로 가상 휴먼이 합성된 데이터를 활용하는 것을 제시한다. 이를 위해 실제 공간과 가상 휴먼을 합성하여 실제 공간에 사람이 있는 것과 같은 이미지를 획득하도록 하였다. 본 논문에 따르면 공간 분석을 위해 실제 이미지 데이터를 얻는 시간과 비용을 절약할 수 있을 것이며 인공지능 학습을 위한 실제 이미지 데이터를 획득하기 어려운 상황에 대한 해결책을 제시할 수 있다.

  • PDF

게임 배경과 캐릭터 효과 설정에 관한 연구 (A Study on Game Background and Character Effect Setting)

  • 주헌식
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.227-228
    • /
    • 2016
  • 본 연구에서는 게임 배경과 게임 캐릭터의 효과에 대해서 나타낸다. 먼저 3개의 캐릭터 이미지를 주 캐릭터 로 만들 이미지에 합성기법을 적용하여 캐릭터들을 합성한다. 합성하여 만든 캐릭터와 다른 캐릭터의 모양과 형태에 맞게 알맞은 배경 색상으로 만들고, 각 캐릭터의 크기, 원근, 모양, 색상에 따라 효과를 적용한다. 따라서 게임 콘텐츠를 제작하는데 정지 영상으로 표현하여 캐릭터 애니메이션과 장면에 맞는 사운드를 삽입하여 게임 콘텐츠로서 시각과 청각과 움직임이 있는 게임 캐릭터를 제작한다. 특히 배경색, 캐릭터의 번개 및 라이팅 효과색상 같은 것에 관심을 갖고 제작하여 앞으로 게임 콘텐츠의 배경과 캐릭터 효과를 제작하는데 모션그래픽을 이용하여 간단하게 제작 할 수 있음을 나타내었다.

  • PDF

합성 데이터셋과 딥러닝 모델을 이용한 식물 엽면적 추정 (Plant leaf area estimation using synthetic dataset and deep learning model)

  • 서현권;안주연;박현지
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.90-92
    • /
    • 2022
  • 이 논문에서는 합성된 애기장대 데이터셋을 활용하여 딸기의 엽면적을 추정할 수 있는 딥러닝 모델을 제안한다. 제안된 모델에서는 개별 잎 검출을 위하여 합성 데이터셋으로 학습된 Mask R-CNN 의 객체 검출 모델을 사용하였고, 이어 이미지 후처리 작업에 해당되는 모폴로지 연산의 침식 및 팽창, 픽셀 카운터를 통해 엽면적을 추정하였다. 각기 다른 역할을 수행하는 신경망 계층에 어텐션 메커니즘 적용하여 검출 성능의 향상과 검출 시간을 단축하였다. 제안된 모델은 딸기 데이터셋을 사용하지 않는 합성된 데이터셋만으로도 실제 온실에서 획득한 다양한 이미지에서의 딸기 엽면적을 추정하는 데에 우수한 성능을 보여준다.

  • PDF

UV 형광과 X-선 Lang 표면이미지를 이용한 천연유색다이아몬드의 감별 연구 (Identification of natural colored diamonds using UV fluorescent and X-ray Lang images)

  • 김준환;하준석;김기훈;송오성
    • 한국산학기술학회논문지
    • /
    • 제10권12호
    • /
    • pp.3540-3545
    • /
    • 2009
  • 보석용 다이아몬드의 합성, 처리기술의 발달로 천연 유색다이아몬드를 신속하고, 경제적이고, 재현성있게 감별할 필요가 커지고 있다. 천연다이아몬드의 감별을 위해 UV광원에 의한 다이아몬드의 형광 이미지 분석과 X-ray Lang 분석을 통하여 4개의 천연 유색다이아몬드와 1개의 합성 유색다이아몬드를 분석하여 보았다. 천연다이아몬드가 UV 형광이미지와 X-선 Lang분석에 대해 상대적으로 균일한 이미지를 보임에 비해 합성석은 국부적으로 균일한 이미지를 보여 효과적인 감별이 가능하였다. 특히 X-선 Lang 이미지 분석이 천연 유색다이아몬드의 감별에 더 높은 분해능으로 효과적인 감별이 가능하였다.

회전한 상표 이미지의 진위 결정을 위한 기계 학습 데이터 확장 방법 (Machine Learning Data Extension Way for Confirming Genuine of Trademark Image which is Rotated)

  • 구본근
    • Journal of Platform Technology
    • /
    • 제8권1호
    • /
    • pp.16-23
    • /
    • 2020
  • 상표권 보호를 위한 상표 이미지의 진위 결정에 심층 신경망인 합성곱 신경망을 이용할 수 있다. 이를 위해, 상표로 등록되어 있는 한 장의 상표 이미지를 반복적으로 학습하는 것은 기계학습의 성능을 감소시키는 원인이 된다. 따라서, 이러한 응용에서 학습 데이터는 다양한 방법으로 생성된다. 하지만 대상 이미지가 회전되어 있으면 원본이라 하더라도 인식하지 못하거나 위조 상표로 분류되기도 한다. 본 논문에서는 회전한 상표 이미지의 진위 결정을 위한 기계학습 데이터의 확장 방법을 제안한다. 본 논문에서 제안하는 학습 데이터 확장 방법은 기울어진 이미지를 생성하고 이를 학습 데이터로 사용하는 것이다. 본 논문에서 제안하는 학습 데이터 확장 방법의 유효성 검증을 위해 대학의 로고를 대상으로 학습 데이터를 생성하였으며, 이를 활용하여 합성곱 신경망을 학습시킨 후 검증용 데이터를 이용하여 정확도를 평가하였다. 정확도 평가 결과에 따르면 본 논문에서 제안한 방법으로 생성한 학습 데이터를 활용하면 회전한 상표를 대상으로 한 진위 여부 결정에 합성곱 신경망을 활용할 수 있다.

  • PDF

Text Augmentation Using Hierarchy-based Word Replacement

  • Kim, Museong;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.57-67
    • /
    • 2021
  • 최근 딥 러닝(Deep Learning) 분석에 이질적인 데이터를 함께 사용하는 멀티모달(Multi-modal) 딥러닝 기술이 많이 활용되고 있으며, 특히 텍스트로부터 자동으로 이미지를 생성해내는 Text to Image 합성에 관한 연구가 활발하게 수행되고 있다. 이미지 합성을 위한 딥러닝 학습은 방대한 양의 이미지와 이미지를 설명하는 텍스트의 쌍으로 구성된 데이터를 필요로 하므로, 소량의 데이터로부터 다량의 데이터를 생성하기 위한 데이터 증강 기법이 고안되어 왔다. 텍스트 데이터 증강의 경우 유의어 대체에 기반을 둔 기법들이 다수 사용되고 있지만, 이들 기법은 명사 단어의 유의어 대체 시 이미지의 내용과 상이한 텍스트를 생성할 가능성이 있다는 한계를 갖는다. 따라서 본 연구에서는 단어가 갖는 품사별 특징을 활용하는 텍스트 데이터 증강 방안, 즉 일부 품사에 대해 단어 계층 정보를 활용하여 단어를 대체하는 방안을 제시하였다. 또한 제안 방법론의 성능을 평가하기 위해 MSCOCO 데이터를 사용하여 실험을 수행하여 결과를 제시하였다.