• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.027초

A Comparative Study of Deep Learning Techniques for Alzheimer's disease Detection in Medical Radiography

  • Amal Alshahrani;Jenan Mustafa;Manar Almatrafi;Layan Albaqami;Raneem Aljabri;Shahad Almuntashri
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.53-63
    • /
    • 2024
  • Alzheimer's disease is a brain disorder that worsens over time and affects millions of people around the world. It leads to a gradual deterioration in memory, thinking ability, and behavioral and social skills until the person loses his ability to adapt to society. Technological progress in medical imaging and the use of artificial intelligence, has provided the possibility of detecting Alzheimer's disease through medical images such as magnetic resonance imaging (MRI). However, Deep learning algorithms, especially convolutional neural networks (CNNs), have shown great success in analyzing medical images for disease diagnosis and classification. Where CNNs can recognize patterns and objects from images, which makes them ideally suited for this study. In this paper, we proposed to compare the performances of Alzheimer's disease detection by using two deep learning methods: You Only Look Once (YOLO), a CNN-enabled object recognition algorithm, and Visual Geometry Group (VGG16) which is a type of deep convolutional neural network primarily used for image classification. We will compare our results using these modern models Instead of using CNN only like the previous research. In addition, the results showed different levels of accuracy for the various versions of YOLO and the VGG16 model. YOLO v5 reached 56.4% accuracy at 50 epochs and 61.5% accuracy at 100 epochs. YOLO v8, which is for classification, reached 84% accuracy overall at 100 epochs. YOLO v9, which is for object detection overall accuracy of 84.6%. The VGG16 model reached 99% accuracy for training after 25 epochs but only 78% accuracy for testing. Hence, the best model overall is YOLO v9, with the highest overall accuracy of 86.1%.

오토인코더를 이용한 파랑 비디오 영상에서의 수리동역학적 장면 분리 연구 (Hydrodynamic scene separation from video imagery of ocean wave using autoencoder)

  • 김태경;김재일;김진아
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제25권4호
    • /
    • pp.9-16
    • /
    • 2019
  • 본 논문에서는 대용량 비디오 영상에서 오토인코더를 이용하여 파랑 전파시 수리동역학적 장면만을 분리하는 방법에 대해 소개한다. 연안에서 센서를 이용한 파랑의 직접적 관측의 어려움으로 인해 비디오 영상을 이용한 입자 추적, 옵티컬 플로우 등의 이미지 분석 방법이 주로 활용되고 있다. 하지만 이미지 분석 방법은 주변광 및 기상상태 등 외부 요인에 의한 영향으로 파랑에 대한 정확한 분석에 어려움이 있다. 제안하는 방법은 비디오 영상으로부터 주변광의 영항을 최소화하고, 순수 파랑 전파시 파랑의 움직임 만을 분리하여 수리동역학적 장면을 추출한다. 실제 해역 및 수리 모형 실험에서 촬영된 비디오 영상에 제안하는 방법을 적용하여 원본 영상으로부터 주변광에 의한 영향과 배경을 잘 분리하여 파랑 전파에 따른 수리동역학적 파랑 이동 장면이 잘 추출되었음을 시각적으로 확인하였다. 또한 변분 오토인코더의 잠재표현 학습을 통해 얻은 원본 비디오 영상에 대한 잠재 표현은 주변광과 배경 요인에 의해 지배적으로 결정되는 반면, 파랑 이동 장면은 해당 요인에 관계없이 독립적으로 잘 표현되는 것을 알 수 있었다.

Design of weighted federated learning framework based on local model validation

  • Kim, Jung-Jun;Kang, Jeon Seong;Chung, Hyun-Joon;Park, Byung-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.13-18
    • /
    • 2022
  • 본 논문에서는 학습에 참여하는 각 디바이스의 모델들로부터 성능검증에 따라 가중치를 두어 글로벌 모델을 업데이트하는 VW-FedAVG(Validation based Weighted FedAVG)를 두 가지 방식으로 제안 한다. 첫 번째 방식은 서버 검증(Server side Validation) 구조로 글로벌 모델을 업데이트 하기 전에 각 로컬 클라이언트 모델을 하나의 전체 검증 데이터셋을 통해 검증하도록 설계 했다. 두 번째는 클라이언트 검증(Client side Validation) 구조로 검증 데이터셋을 각 클라이언트에 고르게 분배하여 검증을 한 후 글로벌 모델을 업데이트 하는 방식으로 설계 했다. 전체 실험에 적용한 데이터셋은 MNIST, CIFAR-10으로 이미지 분류에 대해 IID, Non-IID 분포에서 기존 연구 대비 더 높은 정확도를 얻을 수 있었다.

AdaBoost 학습 알고리즘과 칼만 필터를 이용한 손 영역 탐지 및 추적 (An Application of AdaBoost Learning Algorithm and Kalman Filter to Hand Detection and Tracking)

  • 김병만;김준우;이광호
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.47-56
    • /
    • 2005
  • 웨어러블 컴퓨터의 개발로 인해 인간과 컴퓨터간의 전통적인 인터페이스는 점차 사용하기 불편하게 되었고 이는 새로운 형태의 인터페이스에 대한 요구로 이어지게 되었다. 본 논문에서는 이러한 추세에 맞추어 디지털 카메라를 통해 인간의 제스처를 인식하는 새로운 인터페이스를 연구하였다. 카메라를 통해 손 제스처를 인식하는 방법은 빛과 같은 주변 환경에 영향을 받기 때문에 탐지기는 덜 민감해야 한다. 최근에 Viola 탐지기는 얼굴 탐지에 좋은 결과를 보여 주었으며, 이는 적분 이미지로부터 추출한 하얼 특징을 이용한 Adaboost 학습 알고리즘을 사용하였다. 본 논문에서는 이 방법을 손 영역 탐지에 적용하였으며 피부색을 이용한 고전적인 방법들과 비교 실험을 수행하였다. 실험 결과는 빛과 같은 방해 요소가 있는 환경에서 Viola 탐지기가 피부색을 이용한 탐지 방법보다 더 견고함을 보여 주었다.

  • PDF

AlphaPose를 활용한 LSTM(Long Short-Term Memory) 기반 이상행동인식 (LSTM(Long Short-Term Memory)-Based Abnormal Behavior Recognition Using AlphaPose)

  • 배현재;장규진;김영훈;김진평
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.187-194
    • /
    • 2021
  • 사람의 행동인식(Action Recognition)은 사람의 관절 움직임에 따라 어떤 행동을 하는지 인식하는 것이다. 이를 위해서 영상처리에 활용되는 컴퓨터 비전 태스크를 활용하였다. 사람의 행동인식은 딥러닝과 CCTV를 결합한 안전사고 대응서비스로서 안전관리 현장 내에서도 적용될 수 있다. 기존연구는 딥러닝을 활용하여 사람의 관절 키포인트 추출을 통한 행동인식 연구가 상대적으로 부족한 상태이다. 또한 안전관리 현장에서 작업자를 지속적이고 체계적으로 관리하기 어려운 문제점도 있었다. 본 논문에서는 이러한 문제점들을 해결하기 위해 관절 키포인트와 관절 움직임 정보만을 이용하여 위험 행동을 인식하는 방법을 제안하고자 한다. 자세추정방법(Pose Estimation)의 하나인 AlphaPose를 활용하여 신체 부위의 관절 키포인트를 추출하였다. 추출된 관절 키포인트를 LSTM(Long Short-Term Memory) 모델에 순차적으로 입력하여 연속적인 데이터로 학습을 하였다. 행동인식 정확률을 확인한 결과 "누워있기(Lying Down)" 행동인식 결과의 정확도가 높음을 확인할 수 있었다.

한글 인식을 위한 CNN 기반의 간소화된 GoogLeNet 알고리즘 연구 (Streamlined GoogLeNet Algorithm Based on CNN for Korean Character Recognition)

  • 김연규;차의영
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1657-1665
    • /
    • 2016
  • CNN(Convolutional Neural Network)을 사용한 심화 학습이 다양한 분야에서 진행되고 있으며 관련 연구들은 이미지 인식의 많은 분야에서 높은 성능을 보이고 있다. 본 논문에서는 한글 인식을 위해 대규모 한글 데이터베이스를 학습할 수 있는 CNN 구조의 간소화된 GoogLeNet을 사용한다. 본 논문에 사용된 데이터베이스는 대규모 한글 데이터베이스인 PHD08로 총 2,350개의 한글 문자에 대해 각 2,187개의 샘플을 가져 총 5,139,450개의 데이터로 구성되어 있다. 간소화된 GoogLeNet은 학습의 결과로 학습 종료 시점에서 PHD08에 대해 99% 이상의 Top-1 테스트 정확도를 보였으며 실험의 객관성을 높이기 위해 PHD08에 존재하지 않는 한글 폰트로 이루어진 한글 데이터를 제작하여 상용 OCR 프로그램들과 분류 성능을 비교하였다. 상용 OCR 프로그램들은 66.95%에서 83.17%의 분류 성공률을 보인 반면, 제안하는 간소화된 GoogLeNet은 평균 89.14%의 분류 성공률을 보여 상용 OCR 프로그램들보다 높은 분류 성공률을 보였다.

딥러닝 스타일 전이 기반의 무대 탐방 콘텐츠 생성 기법 (Generation of Stage Tour Contents with Deep Learning Style Transfer)

  • 김동민;김현식;봉대현;최종윤;정진우
    • 한국정보통신학회논문지
    • /
    • 제24권11호
    • /
    • pp.1403-1410
    • /
    • 2020
  • 최근, 비대면 경험 및 서비스에 관한 관심이 증가하면서 스마트폰이나 태블릿과 같은 모바일 기기를 이용하여 손쉽게 이용할 수 있는 웹 동영상 콘텐츠에 대한 수요가 급격히 증가하고 있다. 이와 같은 요구사항에 대응하기 위하여, 본 논문에서는 애니메이션이나 영화에 등장하는 명소를 방문하는 무대 탐방 경험을 제공할 수 있는 영상 콘텐츠를 보다 효율적으로 제작하기 위한 기법을 제안한다. 이를 위하여, Google Maps와 Google Street View API를 이용하여 무대탐방 지역에 해당하는 이미지를 수집하여 이미지 데이터셋을 구축하였다. 그 후, 딥러닝 기반의 style transfer 기술을 접목시켜 애니메이션의 독특한 화풍을 실사 이미지에 적용한 후 동영상화하기 위한 방법을 제시하였다. 마지막으로, 다양한 실험을 통해 제안하는 기법을 이용하여 보다 재미있고 흥미로운 형태의 무대탐방 영상 콘텐츠를 생성할 수 있음을 보였다.

인공지능 학습용 데이터 기반의 산림변화탐지 서비스 (Forest Change Detection Service Based on Artificial Intelligence Learning Data)

  • 정한균;김종인;고선영;채승기;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권8호
    • /
    • pp.347-354
    • /
    • 2022
  • 4차 산업혁명 시대가 무르익으면서 방대한 데이터를 기반으로 한 인공지능(AI, Artificial Intelligence)의 활용이 전 산업 분야로 확대 중이다. 그러나 산림 수종을 분석하는 분야는 지금까지 인공지능의 활용이 미진하여 여전히 수작업으로 분석하고 있고 다수의 오류가 발생하고 있다. 본 연구에서는 수도권의 항공사진과 모사 이미지 등을 이용하여 소나무, 낙엽송, 침엽수, 활엽수 등 산림 수종을 분석하기 위한 인공지능 학습용 데이터 약 60,000장을 구축하였고 수종 구분 AI 모델도 함께 개발하였다. 이러한 연구는 우리나라의 산림 변화를 사전에 예측하여 변화에 신속한 대응이 가능하고 산림 주제도 제작 시 필요한 수종 분할 이미지를 기초자료로 활용함으로써 업무 생산성을 높일 것으로 기대한다.

2D to 3D 창의적 생성을 위한 탐색적 실험 분석 (Exploratory Experimental Analysis for 2D to 3D Generation)

  • 조형래;장일식;강현석;고영찬;박구만
    • 방송공학회논문지
    • /
    • 제28권1호
    • /
    • pp.109-123
    • /
    • 2023
  • 딥러닝은 최근 몇 년 동안 비약적인 발전을 하였고 다양한 분야 및 산업에 영향을 주고 있다. 예술영역도 예외일 수는 없는데 본 논문에서는 시각예술·공학적 관점에서 2D 이미지를 3D로 창의적으로 생성하는 방법을 실험하고자 한다. 이를 위해 국내 아티스트 원본 이미지를 GAN 또는 Diffusion Models로 학습시킨 후 3D 변환 소프트웨어와 딥러닝을 활용하여 3D로 변환하고 그 결과를 선행연구 알고리즘과 비교 실험함으로써 2D to 3D 창의적 생성의 문제점과 개선점을 분석하고자 한다.

Comprehensive review on Clustering Techniques and its application on High Dimensional Data

  • Alam, Afroj;Muqeem, Mohd;Ahmad, Sultan
    • International Journal of Computer Science & Network Security
    • /
    • 제21권6호
    • /
    • pp.237-244
    • /
    • 2021
  • Clustering is a most powerful un-supervised machine learning techniques for division of instances into homogenous group, which is called cluster. This Clustering is mainly used for generating a good quality of cluster through which we can discover hidden patterns and knowledge from the large datasets. It has huge application in different field like in medicine field, healthcare, gene-expression, image processing, agriculture, fraud detection, profitability analysis etc. The goal of this paper is to explore both hierarchical as well as partitioning clustering and understanding their problem with various approaches for their solution. Among different clustering K-means is better than other clustering due to its linear time complexity. Further this paper also focused on data mining that dealing with high-dimensional datasets with their problems and their existing approaches for their relevancy