• 제목/요약/키워드: 이미지 학습

검색결과 1,378건 처리시간 0.029초

2 단계 결정 트리 학습을 이용한 뇌 MR 영상 분류 (Classification of Brain MR Images using 2 Level Decision Tree Learning)

  • 김용욱;김준태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.341-344
    • /
    • 2001
  • 본 논문에서는 학습을 수행하여 뇌 MR 이미지를 자동으로 분류하고 검색하는 시스템을 설계하였다. 이미지로부터 얻을 수 있는 정보는 크게 두 가지 부류로 나눌 수 있다. 이미지 자체로부터 얻을수 있는 크기, 색상, 질감, 윤곽선 등의 하위레벨(low-level) 정보가 있고, 이미지 의미 해석에서 오는 전이, 포함, 방향, 등의 상위레벨(high-level) 정보가 있다. 이 논문은 의료 이미지에 대하여 상위 및 하위 레벨 정보의 각 특징을 살리고 효과적으로 검색하기 위해, 두 부류의 이미지 정보에 대한 결정 트리(Decision Tree) 학습을 2 단계로 적용하여 이미지를 분류하도록 시스템을 설계하였다.

  • PDF

멀티모달 딥 러닝 기반 이상 상황 탐지 방법론 (Anomaly Detection Methodology Based on Multimodal Deep Learning)

  • 이동훈;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.101-125
    • /
    • 2022
  • 최근 컴퓨팅 기술의 발전과 클라우드 환경의 개선에 따라 딥 러닝 기술이 발전하게 되었으며, 다양한 분야에 딥 러닝을 적용하려는 시도가 많아지고 있다. 대표적인 예로 정상적인 데이터에서 벗어나는 값이나 패턴을 식별하는 기법인 이상 탐지가 있으며, 이상 탐지의 대표적 유형인 점 이상, 집단적 이상, 맥락적 이중 특히 전반적인 상황을 파악해야 하는 맥락적 이상을 탐지하는 것은 매우 어려운 것으로 알려져 있다. 일반적으로 이미지 데이터의 이상 상황 탐지는 대용량 데이터로 학습된 사전학습 모델을 사용하여 이루어진다. 하지만 이러한 사전학습 모델은 이미지의 객체 클래스 분류에 초점을 두어 생성되었기 때문에, 다양한 객체들이 만들어내는 복잡한 상황을 탐지해야 하는 이상 상황 탐지에 그대로 적용되기에는 한계가 있다. 이에 본 연구에서는 객체 클래스 분류를 학습한 사전학습 모델을 기반으로 이미지 캡셔닝 학습을 추가적으로 수행하여, 객체 파악뿐만 아니라 객체들이 만들어내는 상황까지 이해해야 하는 이상 상황 탐지에 적절한 2 단계 사전학습 모델 구축 방법론을 제안한다. 구체적으로 제안 방법론은 ImageNet 데이터로 클래스 분류를 학습한 사전학습 모델을 이미지 캡셔닝 모델에 전이하고, 이미지가 나타내는 상황을 설명한 캡션을 입력 데이터로 사용하여 학습을 진행한다. 이후 이미지와 캡션을 통해 상황 특질을 학습한 가중치를 추출하고 이에 대한 미세 조정을 수행하여 이상 상황 탐지 모델을 생성한다. 제안 방법론의 성능을 평가하기 위해 직접 구축한 데이터 셋인 상황 이미지 400장에 대해 이상 탐지 실험을 수행하였으며, 실험 결과 제안 방법론이 기존의 단순 사전학습 모델에 비해 이상 상황 탐지 정확도와 F1-score 측면에서 우수한 성능을 나타냄을 확인하였다.

신경망 이미지 부호화 모델과 초해상화 모델의 합동훈련 (Joint Training of Neural Image Compression and Super Resolution Model)

  • 조현동;김영웅;차준영;김동현;임성창;김휘용
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1191-1194
    • /
    • 2022
  • 인터넷의 발전으로 수많은 이미지와 비디오를 손쉽게 이용할 수 있게 되었다. 이미지와 비디오 데이터의 양이 기하급수적으로 증가함에 따라, JPEG, HEVC, VVC 등 이미지와 비디오를 효율적으로 저장하기 위한 부호화 기술들이 등장했다. 최근에는 인공신경망을 활용한 학습 기반 모델이 발전함에 따라, 이를 활용한 이미지 및 비디오 압축 기술에 관한 연구가 빠르게 진행되고 있다. NNIC (Neural Network based Image Coding)는 이러한 학습 가능한 인공신경망 기반 이미지 부호화 기술을 의미한다. 본 논문에서는 NNIC 모델과 인공신경망 기반의 초해상화(Super Resolution) 모델을 합동훈련하여 기존 NNIC 모델보다 더 높은 성능을 보일 수 있는 방법을 제시한다. 먼저 NNIC 인코더(Encoder)에 이미지를 입력하기 전 다운 스케일링(Down Scaling)으로 쌍삼차보간법을 사용하여 이미지의 화소를 줄인 후 부호화(Encoding)한다. NNIC 디코더(Decoder)를 통해 부호화된 이미지를 복호화(Decoding)하고 업 스케일링으로 초해상화를 통해 복호화된 이미지를 원본 이미지로 복원한다. 이때 NNIC 모델과 초해상화 모델을 합동훈련한다. 결과적으로 낮은 비트량에서 더 높은 성능을 볼 수 있는 가능성을 보았다. 또한 합동훈련을 함으로써 전체 성능의 향상을 보아 학습 시간을 늘리고, 압축 잡음을 위한 초해상화 모델을 사용한다면 기존의 NNIC 보다 나은 성능을 보일 수 있는 가능성을 시사한다.

  • PDF

데이터별 딥러닝 학습 모델의 정확도 향상을 위한 외곽선 특징 적용방안 연구 (A Study on Application Method of Contour Image Learning to improve the Accuracy of CNN by Data)

  • 권용수;황승연;신동진;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.171-176
    • /
    • 2022
  • CNN은 딥러닝의 한 종류로 이미지나 영상 데이터를 처리할 때 사용하는 신경망이다. 필터가 이미지를 순회하며 이미지의 특징을 추출하여 이미지를 구분한다. 딥러닝은 데이터가 많을수록 좋은 모델을 만들 수 있는 특징이 있고, CNN에서는 적은 데이터의 약점을 보완하기 위해 회전, 확대, 이동, 뒤집기 같은 방법의 데이터 증강이라는 기법으로 데이터의 양을 인위적으로 늘리는 방법을 사용한다. 외곽선 이미지 학습은 이미지 데이터에서 외곽선에 해당하는 영역을 추출하는 것이다. CNN 학습 시, 외곽선 이미지 학습이 기존의 데이터 증강기법과 비교하여 성능 향상의 도움이 되는지 확인하고자 한다.

ICT 활용 지리수업을 위한 DB형 교수-학습 자료 개발 (The Development of DB-type Teaching and Learning Material for Geography Instruction Using a Method of ICT)

  • 최원회;조남강;장길수;박종승;최규학;신기진;백종렬;현경숙;신홍철
    • 대한지리학회지
    • /
    • 제38권2호
    • /
    • pp.275-291
    • /
    • 2003
  • ICT(Information & Communication Technology) 활용 지리수업을 위해서는 데이터베이스(database, 이하, ‘DB' 라 칭함)형 교수-학습 자료를 개발하는 것이 필수적이다. 이러한 DB형 교수-학습자료는 WBI(Web Based Instruction. 웹기반수업)에서의 지리이미지자료 사용상의 문제점을 극복해 줄 대안으로 간주된다. 이를 위하여 본 구에서는 우선 지리이미지 데이터베이스 프로그램(이하. '지리이미지 DB 프로그램' 이라 칭함)을 기반으로 CD-ROM 형태의 지리이미지 전자사전(이하, 'GEO-DB' 라 칭함)을 제작했다. GEO-DB에는 3,060개의 지리이미지가 원자료로 수록되어 있는데, 이러한 자료들은 온라인과 오프라인 상에서 교사와 학습자가 공동으로 수집한 것이다. GEO-DB에는 교사와 학습자 모두 지리이미지 자료를 단순하게 활용함은 물론. 임의적으로 자료의 가공이 가능하도록 포트폴리오 기능을 첨부했는데, 이러한 포트폴리오 기능은, 특히 학습자의 자기주도적 학습능력의 신장에 기여하고자 한 것이다 GEO-DB는 사용의 수월성, 검색의 신속성 및 확장의 무한성을 갖고 있어서, 지리 교수-학습에서 ICT의 활용 가능성을 극대화시켜 줄 수 있고. 학습자의 지리학습능력의 신장과 지리학습태도의 변화에 크게 기여할 수 있는 것으로 교사와 학습자에 의해 평가되었다.

언어장애인의 언어학습을 위한 이미지 전자사전의 구축 (Implementation of Image electronic Dictionary to Study Language for Speech Disorders)

  • 조진경;류제;한광록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.669-672
    • /
    • 2005
  • 단어가 지니는 의미를 이미지로 처리하면 그 단어의 이미지가 단순화되면서 높은 인식률을 가질 수 있다는 장점을 지닌다. 이러한 장점을 이용하여 언어장애인들을 위한 유용한 보완대체 의사소통 학습도구에 하나로 이미지 전자 사전을 구축하고자 한다. 우선 동사와 조합되는 용어들의 패턴들을 면밀히 조사하여 그 패턴들을 영역과 자질의 카테고리로 분류하고, 그 카테고리에 속하는 기본 데이터들을 정리하여 분류된 데이터를 하위범주화 방식을 통해 검색을 보다 용이하게 하였다. 더욱이 언어장애인들이 많이 쓰이는 단어를 조사하고, 그 단어를 중심으로 한 모듈을 이용하여, 각각에게 해당되는 이미지를 수집함으로 단어들의 의미를 표현하고 인식할 수 있도록 하는 인터페이스를 구축하는데 중점을 두었다. 또한 언어장애인이 직접 명사와 동사를 조합하여 그 완성여부를 검토할 수 있는 학습기능을 추가함으로 인해 보다 실생활에 유용하고 교육적인 이미지 전자 사전을 구축하였다.

  • PDF

작물의 병충해 분류를 위한 이미지 활용 방법 연구 (Study on Image Use for Plant Disease Classification)

  • 정성호;한정은;정성균;봉재환
    • 한국전자통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.343-350
    • /
    • 2022
  • 서로 다른 특징을 가지는 이미지를 통합하여 작물의 병충해 분류를 위한 심층신경망을 훈련하는 것이 학습 결과에 어떤 영향을 미치는지 확인하고, 심층신경망의 학습 결과를 개선할 수 있는 이미지 통합방법에 대해 실험하였다. 실험을 위해 두 종류의 작물 이미지 공개 데이터가 사용되었다. 하나는 인도의 실제 농장 환경에서 촬영된 작물 이미지이고 다른 하나는 한국의 실험실 환경에서 촬영한 작물 이미지였다. 작물 잎 이미지는 정상인 경우와 4종류의 병충해를 포함하여 5개의 하위 범주로 구성되었다. 심층신경망은 전이학습을 통해 사전 훈련된 VGG16이 특징 추출부에 사용되었고 분류기에는 다층퍼셉트론 구조를 사용하였다. 두 공개 데이터는 세 가지 방법으로 통합되어 심층신경망의 지도학습에 사용되었다. 훈련된 심층신경망은 평가 데이터를 이용해 평가되었다. 실험 결과에 따르면 심층신경망을 실험실 환경에서 촬영한 작물 이미지로 학습한 이후에 실제 농장 환경에서 촬영한 작물 이미지로 재학습하는 경우에 가장 좋은 성능을 보였다. 서로 다른 배경의 두 공공데이터를 혼용하여 사용하면 심층신경망의 학습 결과가 좋지 않았다. 심층신경망의 학습 과정에서 여러 종류의 데이터를 사용하는 방법에 따라 심층신경망의 성능이 달라질 수 있음을 확인하였다.

CNN 기반의 준지도학습을 활용한 GPR 이미지 분류 (A Study on GPR Image Classification by Semi-supervised Learning with CNN)

  • 김혜미;배혜림
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.197-206
    • /
    • 2021
  • GPR(Ground Penetrating Radar)에서 수집된 데이터는 지하 탐사를 위해 사용된다. 이 때, 지반 아래의 시설물들이 GPR을 반사하는 경우가 종종 발생하여 수집된 데이터는 전문가에 경험에 의존하여 해석된다. 또한, GPR 데이터는 수집 장비, 환경 등에 따라 데이터의 노이즈, 특성 등이 다르게 나타난다. 이로 인해 정확한 레이블을 가지는 데이터가 충분히 확보되지 못하는 경우가 많다. 일반적으로 이미지 분류 문제에서 높은 성능을 보이는 인공신경망 모델을 적용하기 위해서는 많은 양의 학습 데이터가 확보되어야 한다. 그러나 GPR 데이터의 특성 상 데이터에 정확한 레이블을 붙이는 것은 많은 비용을 필요로 하여 충분한 데이터를 확보하기가 어렵다. 이는 결국 일반적으로 활용되는 지도학습 방법을 기반으로 인공신경망을 적절히 학습시킬 수 없게 한다. 본 논문에서는 각 레이블의 정확도가 유사한 수준을 갖도록 하는 것을 목표로 데이터 특성을 바탕으로 하는 이미지 분류 방법을 제안한다. 제안 방법은 준지도학습을 기반으로 하고 있으며, 인공신경망으로부터 이미지의 특징값을 추출한 후 클러스터링 기법을 활용하여 이미지를 분류한다. 이 방법은 라벨링 된 데이터가 충분하지 않은 경우 라벨링할 때 뿐 만 아니라 데이터에 달린 레이블의 신뢰도가 높지 않은 경우에도 활용할 수 있다.

합성곱 신경망을 이용한 손상된 볼트의 이미지 분류 (Image Classification of Damaged Bolts using Convolution Neural Networks)

  • Lee, Soo-Byoung;Lee, Seok-Soon
    • 항공우주시스템공학회지
    • /
    • 제16권4호
    • /
    • pp.109-115
    • /
    • 2022
  • 딥러닝 기법과 컴퓨터 비전 기술을 융합한 합성곱 신경망 알고리즘은 고성능 컴퓨팅 시스템을 기반으로 이미지 데이터의 분류를 가용하게 한다. 본 논문에서는 합성곱 신경망 알고리즘을 대표적인 딥러닝 프레임워크인 텐서플로와 학습 기법을 이용하여 구현하고 이미지 분류 문제에 적용한다. 모델의 지도학습에 필요한 데이터는 동일 종류의 볼트를 이용하여 나사산이 정상인 볼트와 나사산이 손상된 볼트로 구분하여 이미지를 생성하였다. 소량의 이미지 데이터를 이용한 학습 모델은 좋은 성능으로 볼트의 손상을 탐지하였다. 그리고 모델의 내부 구성에 따른 학습 성능을 비교하기 위해 합성곱 신경망 내 컨볼루션 레이어의 개수를 변경하고 과적합 회피기법을 선택 적용하여 이미지 분류 성능을 확인하였다.

대안적 통째학습 기반 저품질 레거시 콘텐츠에서의 문자 인식 알고리즘 (Character Recognition Algorithm in Low-Quality Legacy Contents Based on Alternative End-to-End Learning)

  • 이성진;윤준석;박선후;유석봉
    • 한국정보통신학회논문지
    • /
    • 제25권11호
    • /
    • pp.1486-1494
    • /
    • 2021
  • 문자 인식은 스마트 주차, text to speech 등 최근 다양한 플랫폼에서 필요로 하는 기술로써, 기존의 방법과 달리 새로운 시도를 통하여 그 성능을 향상시키려는 연구들이 진행되고 있다. 그러나 문자 인식에 사용되는 이미지의 품질이 낮을 경우, 문자 인식기 학습용 이미지와 테스트 이미지간에 해상도 차이가 발생하여 정확도가 떨어지는 문제가 발생된다. 이를 해결하기 위해 본 논문은 문자 인식 모델 성능이 다양한 품질 데이터에 대하여 강인하도록 이미지 초해상도 및 문자 인식을 결합한 통째학습 신경망을 설계하고, 대안적 통째학습 알고리즘을 구현하여 통째 신경망 학습을 수행하였다. 다양한 문자 이미지 중 차량 번호판 이미지를 이용하여 대안적 통째학습 및 인식 성능 테스트를 진행하였고, 이를 통해 제안하는 알고리즘의 효과를 검증하였다.