• 제목/요약/키워드: Image machine learning

검색결과 587건 처리시간 0.026초

영상처리 및 머신러닝 기술을 이용하는 운동 및 식단 보조 애플리케이션 (Application for Workout and Diet Assistant using Image Processing and Machine Learning Skills)

  • 이치호;김동현;최승호;황인웅;한경숙
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.83-88
    • /
    • 2023
  • 본 논문에서는 홈 트레이닝 인구가 늘어나면서 증가한 운동과 식단 보조 서비스에 대한 수요를 충족시키기 위해 운동 및 식단 보조 애플리케이션을 개발하였다. 애플리케이션은 카메라를 통해 실시간으로 촬영되는 사용자의 운동 자세를 분석하여, 안내선과 음성을 이용해 올바른 자세를 유도하는 기능을 가진다. 또한, 사용자가 사진을 촬영하면 사진에 포함된 음식들을 분류하고 각 음식의 양을 추정하여, 칼로리 등의 영양 정보를 계산하여 제공하는 기능을 가진다. 영양 정보 계산은 외부의 서버에서 수행되도록 구성했다. 서버는 계산된 결과를 애플리케이션으로 전송하고, 애플리케이션은 결과를 받아 시각적으로 출력한다. 추가로, 운동 결과와 영양 정보는 날짜별로 저장하고 확인할 수 있도록 하였다.

POST-TAVR ECG 기반의 PPI 예측 모델 연구 (Research of PPI prediction model based on POST-TAVR ECG)

  • 송인서;양세모;이강윤
    • 인터넷정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.29-38
    • /
    • 2024
  • 경피적 대동맥 판막 치환술(TAVR) 후에는 인공 심박동기 삽입술(PPI)을 비롯한 TAVR 이후 합병증에 대한 철저한 관리가 필요하며 그에 따라 정확한 예측 모델에 대한 필요성이 점점 증가하고 있다. 본 연구는 기존의 이미지 의존적 방법론에서 벗어나 ECG 정보를 중심으로 예측하는 XGBoost 기반의 최적의 PPI 예측 모델을 개발했다. 이 모델은 심전도상의 특정 신호들인 DeltaPR, DeltaQRS 등을 주요 지표로 삼아, 환자의 전도 장애 및 PPI와의 연관성을 파악하며, 기존의 이미지와 ECG 데이터를 결합한 모델과 ECG 기반의 모델 보다 뛰어난 AUC 0.91 성능을 달성하였다. 본 연구에서 제안하는 모델은 두 병원의 데이터를 기반으로 최적의 PPI 예측 모델을 구현 및 검증하였으며, 검증 결과 ECG 데이터의 특성이 PPI 예측에 큰 영향을 미치며 95.28%의 높은 유사도를 보였다. 이로써 본 연구의 예측 모델이 다양한 병원 데이터에도 효과적으로 적용될 수 있음을 확인하였다. 최적의 머신러닝 알고리즘을 사용하여 PPI와 각 특성 간의 상관관계를 명확히 했으며, 고비용의 의료 이미지에 의존하지 않고 ECG 데이터를 사용하여 높은 정확도로 PPI를 예측할 수 있음을 입증하였다. 이는 의료 결정 과정에서 인간 개입의 의존도를 줄이며, 신뢰할 수 있고 실용적인 PPI 예측 모델 개발로의 중요한 진전을 의미한다.

A review of ground camera-based computer vision techniques for flood management

  • Sanghoon Jun;Hyewoon Jang;Seungjun Kim;Jong-Sub Lee;Donghwi Jung
    • Computers and Concrete
    • /
    • 제33권4호
    • /
    • pp.425-443
    • /
    • 2024
  • Floods are among the most common natural hazards in urban areas. To mitigate the problems caused by flooding, unstructured data such as images and videos collected from closed circuit televisions (CCTVs) or unmanned aerial vehicles (UAVs) have been examined for flood management (FM). Many computer vision (CV) techniques have been widely adopted to analyze imagery data. Although some papers have reviewed recent CV approaches that utilize UAV images or remote sensing data, less effort has been devoted to studies that have focused on CCTV data. In addition, few studies have distinguished between the main research objectives of CV techniques (e.g., flood depth and flooded area) for a comprehensive understanding of the current status and trends of CV applications for each FM research topic. Thus, this paper provides a comprehensive review of the literature that proposes CV techniques for aspects of FM using ground camera (e.g., CCTV) data. Research topics are classified into four categories: flood depth, flood detection, flooded area, and surface water velocity. These application areas are subdivided into three types: urban, river and stream, and experimental. The adopted CV techniques are summarized for each research topic and application area. The primary goal of this review is to provide guidance for researchers who plan to design a CV model for specific purposes such as flood-depth estimation. Researchers should be able to draw on this review to construct an appropriate CV model for any FM purpose.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

Development of Agricultural Products Screening System through X-ray Density Analysis

  • Eunhyeok Baek;Young-Tae Kwak
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.105-112
    • /
    • 2023
  • 농산물 선별 시스템은 작물의 형태를 보전하기 위하여 비파괴적인 선별이 주로 사용된다. 이러한 비파괴 선별 기술로는 가시광선, 근적외선, 엑스선, 감마선 등의 광학적 특성을 이용하고 있으며 본 논문에서는 엑스선을 이용한 선별을 이용한다. 엑스선 영상은 엑스선의 밀도에 따라 그레이 영상으로 생성되어 육안으로 시료의 결함을 감지하기가 어렵다. 미세한 결함을 발견하기 위해서는 영상을 확대하거나 픽셀의 범위를 수정하여 적정한 픽셀의 영역만을 표시하여 결함을 탐지해야 한다. 이런 작업은 비효율적이다. 따라서 본 논문은 엑스선의 광역적인 밀도와 지역적인 밀도에 대한 상대적인 밀도를 측정하여 색상화된 결함을 표시하는 새로운 방법을 제안한다. 하나의 픽셀에 대한 상대적인 밀도는 주위 픽셀과의 상대적인 차이를 나타내며, 이런 픽셀을 정상과 결함으로 나타내는 엑스선 영상의 색상화 방법도 제안한다. 실험에서는 육안으로 볼 수 없는 농작물의 병해충 또는 새싹 부분을 특정 색으로 색상화 하여 농산물 선별 시스템에 활용할 수 있게 하였다. 제안된 방법은 엑스선을 이용한 선별 시스템에 적용되어 농산물 선별 시스템뿐만 아니라 가공식품, 부품 제조와 같은 제조 공정에서 사용되어 불량품을 선별하는 방법에 적극적으로 이용될 수 있을 것이다.

컬러 프린터 영상의 모폴로지 특징과 지도 학습 모델 분류기를 활용한 위변조 지폐 판별 알고리즘 (Counterfeit Money Detection Algorithm based on Morphological Features of Color Printed Images and Supervised Learning Model Classifier)

  • 우귀희;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권12호
    • /
    • pp.889-898
    • /
    • 2013
  • 고성능 영상 장비의 대중화와 강력한 이미지 편집 소프트웨어의 출현으로 인해 지폐 및 유가 증권 등을 고품질로 위변조가 가능해졌다. 특히 컬러 레이저 프린터의 범용화로 인하여 화폐 위변조 범죄는 급격히 증가하고 있지만, 일반인이 이를 판별하는 비율은 낮은 수준이며 판별 기기도 고가이다. 본 연구에서는 범용 스캐너와 컴퓨터 시스템을 활용하여 화폐의 위변조를 탐지하기 위한 알고리즘을 제안하였다. 먼저 지폐의 인쇄방식과 다른 컬러 프린터의 인쇄 특징을 계산하기 위하여 모폴로지 기술과 명암도 동시 발생 행렬을 활용하였다. 그 후 계산된 특징들을 지도학습 모델 분류기에 적용하여 훈련을 시켰다. 이렇게 훈련된 분류기에 판별을 위한 지폐를 입력하고 위변조 여부에 대한 분석을 수행한다. 제안한 알고리즘의 성능을 분석하기 위하여 위변조 지폐의 판별률과 인쇄에 사용한 프린터의 판별률로 나누어 평가를 하였다. 또한 기존의 컬러 프린터 판별에 사용되었던 위너필터를 사용한 기술과 비교를 수행하였다. 그 결과 제안한 알고리즘이 위변조 지폐 식별에 있어서 91.92%, 위변조기기의 식별에 있어서 94.5% 이상 정확도를 보여 기존 컬러 프린터의 특징 추출 방법을 활용한 것보다 우수한 것으로 나타났다.

텍스트 및 영상의 멀티모달분석을 이용한 트위터 사용자의 감성 흐름 모니터링 기술 (Monitoring Mood Trends of Twitter Users using Multi-modal Analysis method of Texts and Images)

  • 김은이;고은정
    • 한국융합학회논문지
    • /
    • 제9권1호
    • /
    • pp.419-431
    • /
    • 2018
  • 본 논문은 개인 사용자의 트윗을 분석하여 사용자의 감정 흐름을 모니터링할 수 있는 새로운 방법을 제안한다. 본 논문에서는 사용자의 감성 흐름을 정확하게 예측하기 위해서 기존의 텍스트 위주의 시스템과 달리 본 연구에서는 사용자가 쓴 텍스트와 영상 등으로부터 감성을 인식하는 멀티 모달 분석 기법이 개발된다. 제안된 방법에서는 먼저 어휘분석 및 문맥을 이용한 텍스트분석기와 학습기반의 영상감성인식기를 이용하여 텍스트 및 영상 트윗에 숨겨진 개별 감성을 추출한다. 이후 이들은 규칙기반 통합 방법에 의해 날짜별로 통합되고, 마지막으로 개인의 감성흐름을 보다 직관적으로 관측할 수 있도록 감성흐름그래프로 시각화한다. 제안된 방법의 효용성을 평가하기 위해 두 단계의 실험이 수행되었다. 먼저 4만여 개의 트윗으로부터 제안된 방법의 정확도 평가 실험이 수행되고, 최신 트윗 분석 기술과 비교 분석되었다. 두 번째 실험에서는 40명의 우울증을 가진 사용자와 일반사용자를 구분할 수 있는지에 대한 실험이 수행된 결과, 제안된 기술이 실제 사용자의 감성흐름을 모니터하는데 효율적임을 증명하였다.

SVM 교차검증을 활용한 토지피복 ROI 선정 (Region of Interest (ROI) Selection of Land Cover Using SVM Cross Validation)

  • 정종철;윤형진
    • 지적과 국토정보
    • /
    • 제50권1호
    • /
    • pp.75-85
    • /
    • 2020
  • 본 연구는 토지피복 분류에 사용 가능한 ROI 생성 과정에서 기계학습 기반 교차검증을 활용하였다. 연구지역은 세종시를 포함한 2019년 10월 28일 단시기 KOMPSAT-3A 영상을 활용하였다. 연구 과정에서 4개의 밴드(Red, Green, Blue, Near Infra-red)를 독립변수로 교차검증 과정에서 학습시켰다. 또한 SVM의 4가지 기법(Linear, Polynomial, RBF, Sigmoid)을 활용하여 추출된 ROI를 기반으로 토지피복 분류를 실시하였다. 교차검증 과정에서 훈련된 3,500개의 데이터 중 1,813개의 데이터가 추출되었으며 건물, 도로, 그리고 초지에서 약 60%의 데이터가 제거되었다. 추출된 ROI를 기반으로 다른 SVM기법에 비해 SVM Linear 기법이 91.77%로 가장 높은 분류 정확도를 나타냈다. 분류 클래스 중 초지의 경우 산림과의 오분류가 가장 많이 발생하며 79.43%의 생산자 정확도로 가장 낮은 분류 정확도를 보여주었다. 연구 결과에 따라 교차검증에서 추출된 ROI는 산림, 수역, 그리고 농업지역에 대해서는 90%이상의 분류정확도를 보여주며 효과적인 분류결과를 도출할 수 있었으나, 80%의 분류정확도를 보여주는 건물, 도로, 나대지, 그리고 초지 지역을 분류하는 방법에 대해서는 추가적인 연구가 진행되어야 할 필요성이 존재한다.

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

인공신경망을 이용한 KOMPSAT-3/3A/5 영상으로부터 자연림과 인공림의 분류 (Classification of Natural and Artificial Forests from KOMPSAT-3/3A/5 Images Using Artificial Neural Network)

  • 이용석;박숭환;정형섭;백원경
    • 대한원격탐사학회지
    • /
    • 제34권6_3호
    • /
    • pp.1399-1414
    • /
    • 2018
  • 자연림은 산림의 조성 과 보육 등에 인공적인 사람의 힘이 가해지지 않은 자연 상태의 산림이다. 반면 인공림은 사람이 조성 및 보육관리 하는 숲으로 목재생산, 자연재해 예방, 방풍 등의 목적을 가지는 산림이다. 인공림은 목재생산 등 인간이 목적을 가지고 관리하여 단위 면적당 더 많은 목재를 생산할 수 있는 경제적 장점도 가지고 있다. 자연림과 인공림의 구분은 산림 형태의 관리 방법과 목정이 상이하여 산림조사에서 기본적으로 조사하는 요소이며, 자연림과 인공림의 구분은 항공사진 판독과 현지조사 등의 절차를 통해 이루어진다. 본 연구에서는 자연림과 인공림의 분류에 KOMPSAT-3, 3A, 5 위성 영상데이터에 인공신경망(Artificial Neural Network: ANN)을 적용하여 자연림과 인공림의 분류도를 만들고, 산림청의 1/5,000임상도의 자연림과 인공림 분류도와 비교하여 평가하였다. 인공신경망을 이용한 산림의 자연림과 인공림 구분의 연구를 진행한 결과, 1/5,000 임상도와 비교했을 때, 학습결과 분류 전체 정확도는 77.03%이다. 영상의 획득 시기와 산림의 침엽수와 활엽수 등 기타요인이 인공신경망을 이용한 산림의 인공림과 자연림의 구분에 많은 영향을 미치는 것을 확인하였다.