• 제목/요약/키워드: machine learning techniques

검색결과 1,088건 처리시간 0.025초

기계학습법을 이용한 동해 남서부해역의 표층 이산화탄소분압(fCO2) 추정 (Estimation of Surface fCO2 in the Southwest East Sea using Machine Learning Techniques)

  • 함도식;박소예나;최상화;강동진;노태근;이동섭
    • 한국해양학회지:바다
    • /
    • 제24권3호
    • /
    • pp.375-388
    • /
    • 2019
  • 지구의 탄소순환을 이해하고 미래 대기 $CO_2$의 농도와 기후 변화를 예측하기 위해서는 해양과 대기 사이 $CO_2$ 교환율(sea-to-air $CO_2$ flux)의 시공간 변화를 정확하게 추정하는 것이 필요하다. 연구선을 이용한 현장 관측이 갖고 있는 시공간 제약으로 인해 동해에는 매우 제한적인 표층 이산화탄소분압($fCO_2$) 자료만 존재한다. 이 연구에서는 위성 및 수치모형에서 얻은 수온, 염분, 엽록소, 혼합층 자료를 세 종류의 기계학습 모형에 입력하여 동해 남서부해역의 고해상도 표층 $fCO_2$ 시계열 자료를 산출하였다. 세 모형 중 현장 관측 자료를 가장 잘 재현하는 Random Forest (RF) 모형의 평균제곱근오차는 $7.1{\mu}atm$이었다. RF 모형을 이용한 $fCO_2$ 예측에 중요한 역할을 하는 변수는 수온, 염분과 시간 정보였으며, 엽록소와 혼합층 깊이는 $fCO_2$ 예측에 미미한 역할을 하였다. RF 모형에서 예측한 표층 $fCO_2$를 이용하여 계산한 동해 남서부해역의 $CO_2$ 교환율은 $-0.76{\pm}1.15mol\;m^{-2}yr^{-1}$로 이전 현장 관측 연구에서 제시한 교환율( $-0.66{\sim}-2.47mol\;m^{-2}yr^{-1}$) 범위 중 작은 값에 해당한다. RF 모형의 표층 $fCO_2$ 시계열 자료는 1주일 내외의 짧은 시간 사이에도 $CO_2$ 교환율이 상당히 변할 수 있음을 보여주었다. 앞으로 보다 정확한 $CO_2$ 교환율 산출을 위해서는 $fCO_2$가 급격하게 변화하는 봄철에 높은 해상도의 현장 관측을 수행할 필요가 있다.

기계학습을 통한 주간 반투명 구름탐지 연구: GK-2A/AMI를 이용하여 (A Study on Daytime Transparent Cloud Detection through Machine Learning: Using GK-2A/AMI)

  • 변유경;진동현;성노훈;우종호;전우진;한경수
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1181-1189
    • /
    • 2022
  • 구름은 대기 중에 떠 있는 작은 물방울이나 얼음 알갱이들 또는 혼합물 등으로 구성되며 지구 표면의 약 2/3를 덮고 있다. 위성영상내에서의 구름은 일부 다른 지상 물체 또는 지표면과 유사한 반사도 특성으로 인해 구름과 구름이 아닌 영역을 분리하는 구름탐지는 매우 어려운 작업이다. 특히 뚜렷한 특징을 가지는 두꺼운 구름과 달리 얇은 반투명 구름은 위성영상내에서 구름과 배경의 대비가 약하고 지표면과 혼합되어져 나타나기 때문에 대부분 구름탐지에서 쉽게 놓쳐지고 많은 어려움을 주는 대상으로 작용한다. 이러한 구름탐지의 반투명 구름의 한계점을 극복하기 위해, 본 연구에서는 머신러닝 기법(Random Forest [RF], Convolutional Neural Networks [CNN])을 활용하여 반투명 구름을 중점으로 한 구름탐지 연구를 수행하였다. Reference자료로는 MOderate Resolution Imaging Spectroradiometer (MODIS)에서 제공하는 MOD35자료에서 Cloud Mask와 Cirrus Mask를 활용하였으며 반투명 구름 픽셀을 고려한 모델 훈련을 위해 훈련 데이터의 픽셀 비율을 구름, 반투명 구름, 청천이 약 1:1:1이 되도록 구성하였다. 연구의 정성적 비교 결과, RF와 CNN 모두 반투명 구름을 포함한 다양한 형태의 구름 등을 잘 탐지하였고, RF 모델 결과와 CNN 모델 결과를 혼합한 RF+CNN경우에는 개별 모델의 한계점을 개선시키며 구름탐지가 잘 수행되어진 것을 확인하였다. 연구의 정량적 결과 RF의 전체 정확도(OA) 값은 92%, CNN은 94.11%를 보였고, RF+CNN은 94.29%의 정확도를 보였다.

기계학습을 이용한 광학 위성 영상 기반의 도시 내 수목 피복률 추정 (Estimation of Fractional Urban Tree Canopy Cover through Machine Learning Using Optical Satellite Images)

  • 배세정;손보경;성태준;이연수;임정호;강유진
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.1009-1029
    • /
    • 2023
  • 도시 수목은 탄소를 저장하고 불투수면적을 감소시키는 도시 생태계의 중요 요소이며, 탄소 저장량 및 순환량 산정 시 주요 정보로 활용될 수 있다. 많은 선행 연구에서 항공 라이다 자료 및 인공지능 기법을 활용하여 고해상도 수목 정보를 산출하고 있으나, 항공 라이다 영상은 제공하는 플랫폼이 제한되어 있으며 비용적인 면에서도 한계가 다수 존재한다. 따라서 본 연구에서는 수원시를 대상으로 자료 취득이 용이한 고해상도 위성 영상인 Sentinel-2를 활용하여 기계학습 기반의 도시 내 수목 피복률(fractional tree canopy cover, FTC)을 추정하고자 하였다. Sentinel-2 시계열 영상으로부터 중앙값 합성을 수행하여 수원시 전역에 대한 단일 영상을 제작하여 활용하였다. 도시 내 토지 피복의 이질성을 반영하기 위하여, 30 m 격자내 10 m 해상도의 광학 지수의 평균 및 표준편차 값과 환경부 세분류 토지 피복 지도 기반 항목별 피복률을 계산하여 기계학습 모델의 입력 변수로 활용하였다. 총 4가지의 입력 변수 조합을 설정하여, 입력 변수 구성에 따른 FTC 추정 정확도를 비교 및 평가하였다. 광학 영상의 평균 정보만을 활용(Scheme 1)했을 때 보다 도시 내 이질적인 특성을 반영할 수 있는 표준 편차 및 피복률 정보를 모두 함께 고려(Scheme 4, S4)했을 때 향상된 성능을 나타낼 수 있었다. 검증용 자료에 대해 S4의 Random Forest (RF) 모델이 0.8196의 R2, 0.0749의 mean absolute error (MAE), 및 0.1022의 root mean squared error (RMSE)로 전체 기계학습 모델 중에서 성능이 가장 높게 나타났다. 변수 기여도 분석 결과 광학 지수의 표준 편차 정보는 도시 내 복잡한 토지 피복 지역에 대해 높은 기여도를 나타내었다. 훈련된 S4 구성의 RF 모델을 수원시 전역에 대해 확장 적용하였을 때, 참조 FTC 자료에 대해 0.8702의 R2, 0.0873의 MAE, 및 0.1335의 RMSE의 우수한 성능을 나타냈다. 본 연구의 FTC 추정 기법은 향후 다른 지역에 대한 적용성이 우수할 것으로 판단되며, 도시 생태계 탄소순환 파악의 기초자료로 활용될 수 있을 것으로 기대된다.

감정 분석 기반의 사용자 피드백을 이용한 클라우드 서비스 평가 기법 (Cloud Service Evaluation Techniques Using User Feedback based on Sentiment Analysis)

  • 윤동규;김웅수;박준석;염근혁
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제27권1호
    • /
    • pp.8-14
    • /
    • 2018
  • 클라우드 컴퓨팅이 IT 업계의 화두로 부상하면서 다양한 유형의 클라우드 서비스들이 나타났고, 다수의 클라우드 서비스들 중 사용자가 원하는 서비스를 선택하는 과정의 복잡성을 해소하기 위해 클라우드 서비스 브로커 기술이 (Cloud Service Broker, CSB)등장하였다. CSB의 핵심적인 기능 중 하나는 사용자에게 최적의 클라우드 서비스를 추천해주는 것이다. 일반적으로 CSB에서 클라우드 서비스 추천을 위해 서비스 사용자들로부터 서비스에 대한 평점을 피드백으로 받아 서비스를 평가하는 방법을 사용할 수 있다. 그러나 사용자마다 평점을 매기는 기준이 다양하므로 평점만으로 서비스를 평가하기에는 신뢰도가 떨어진다는 문제점이 존재한다. 본 논문에서는 클라우드 서비스 사용자의 리뷰에 기계 학습 기반의 감정 분석(Sentiment Analysis) 기법을 적용하여 평점 기반 서비스 평가를 보완하는 방법과 이를 적용하여 구현한 CSB의 프로토타입을 제시한다. 또한 실제 클라우드 서비스 리뷰를 학습 데이터로 사용한 실험을 통해 감정분석에 사용될 수 있는 여러 학습 알고리즘의 성능을 비교한 결과를 제시한다. 본 논문에서 제안하는 서비스 평가 기법은 기존의 평점 기반 서비스 평가의 단점을 보완하며 사용자 경험 측면의 서비스 품질을 반영할 수 있다.

  • PDF

딥러닝을 활용한 모바일 어플리케이션 리뷰 분류에 관한 연구 (A Study on Classification of Mobile Application Reviews Using Deep Learning)

  • 손재익;노미진;타지주르 라만;표규진;한무명초;김양석
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.76-83
    • /
    • 2021
  • 스마트폰과 태블릿과 같은 스마트 기기의 발달과 사용이 증가함에 따라, 모바일 기기를 기반으로 한 모바일 어플리케이션 시장이 급속도로 커지고 있다. 모바일 어플리케이션 사용자는 어플리케이션을 사용 경험을 공유하고자 리뷰를 남기는데, 이를 분석하면 소비자들의 다양한 니즈를 파악할 수 있고 어플리케이션 개발자들은 소비자들이 작성한 리뷰를 통해 애플리케이션의 개선을 위한 유용한 피드백을 받을 수 있다. 그러나 소비자들의 남기는 많은 양의 리뷰를 수작업으로 분석하기 위해서는 많은 시간과 비용을 지불해야하기 때문에 이를 최소화 할 방안을 마련할 필요성이 존재한다. 이에 본 연구에서는 구글 플레이스토어(Google PlayStore)의 배달 어플리케이션 사용자 리뷰를 수집한 후 머신러닝과 딥러닝 기법을 활용하여 어플리케이션 기능 장점, 단점, 기능 개선 요청, 버그 보고의 4가지 범주로 분류하는 방법을 제안한다. 연구 결과, Hugging Face의 pretrain된 BERT기반 Transformer모델의 성능의 경우 위의 4개의 범주에 대한 f1 score값은 차례대로 0.93, 0.51, 0.76, 0.83으로 LSTM, GRU보다 뛰어난 성능을 보인 것을 확인할 수 있었다.

클라우드기반 의료영상 라벨링 시스템 개발 및 근감소증 정량 분석 (Development of Cloud-Based Medical Image Labeling System and It's Quantitative Analysis of Sarcopenia)

  • 이충섭;임동욱;김지언;노시형;유영주;김태훈;윤권하;정창원
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권7호
    • /
    • pp.233-240
    • /
    • 2022
  • 최근 대부분의 인공지능 연구는 AI 모델 개발에 중점을 두고 있다. 하지만 최근 인공지능 연구가 모델 중심에서 데이터 중심으로 점차 변경되고 이런 추세를 바탕으로 학습데이터의 중요성이 크게 주목 받고 있다. 그러나 학습데이터의 준비과정이 전체 과정의 상당 부분을 차지하고 라벨링 데이터 생성 또한 개발 목적에 따라 다르기 때문에 많은 시간과 노력이 필요하다. 따라서 기존의 미충족을 해결하기 위한 다양한 라벨링 기능을 갖는 도구 개발이 필요하다. 본 논문에서는 의료영상의 라벨링 데이터를 정교하고 빠르게 생성하기 위한 라벨링 시스템에 대해서 기술한다. 이를 구현하기 위해서 Back Projection, GrabCut 기법을 이용한 반자동 방식과 기계학습 모델을 통해서 예측한 자동 방식의 라벨링 기능을 구현하였다. 우리는 제안한 시스템의 라벨링 데이터 생성에 대한 수행시간의 장점을 보였을뿐만 아니라 정확성에 대한 비교평가를 통해 우수성을 보였다. 또한 1,000여명의 환자 영상 데이터셋을 분석하여 근감소증 진단에 남성과 여성에 의미있는 진단지표를 제시하였다.

Parallel Network Model of Abnormal Respiratory Sound Classification with Stacking Ensemble

  • Nam, Myung-woo;Choi, Young-Jin;Choi, Hoe-Ryeon;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.21-31
    • /
    • 2021
  • 최근 코로나(Covid-19)의 영향으로 스마트 헬스케어 관련 산업과 비대면 방식의 원격 진단을 통한 질환 분류 예측 연구의 필요성이 증가하고 있다. 일반적으로 호흡기 질환의 진단은 비용이 많이 들고 숙련된 의료 전문가를 필요로 하여 현실적으로 조기 진단 및 모니터링에 한계가 있다. 따라서, 간단하고 편리한 청진기로부터 수집된 호흡음을 딥러닝 기반 모델을 활용하여 높은 정확도로 분류하고 조기 진단이 필요하다. 본 연구에서는 청진을 통해 수집된 폐음 데이터를 이용하여 이상 호흡음 분류모델을 제안한다. 데이터 전처리로는 대역통과필터(BandPassFilter)방법론을 적용하고 로그 멜 스펙트로그램(Log-Mel Spectrogram)과 Mel Frequency Cepstral Coefficient(MFCC)을 이용하여 폐음의 특징적인 정보를 추출하였다. 추출된 폐음의 특징에 대해서 효과적으로 분류할 수 있는 병렬 합성곱 신경망 네트워크(Parallel CNN network)모델을 제안하고 다양한 머신러닝 분류기(Classifiers)와 결합한 스태킹 앙상블(Stacking Ensemble) 방법론을 이용하여 이상 호흡음을 높은 정확도로 분류하였다. 본 논문에서 제안한 방법은 96.9%의 정확도로 이상 호흡음을 분류하였으며, 기본모델의 결과 대비 정확도가 약 6.1% 향상되었다.

실내환경에서의 자율주행차 무선 전력 전송을 위한 딥러닝 기반 UWB 거리 측정 (Deep Learning-based UWB Distance Measurement for Wireless Power Transfer of Autonomous Vehicles in Indoor Environment)

  • 김혜정;박용주;한승재
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제13권1호
    • /
    • pp.21-30
    • /
    • 2024
  • 최근 자율주행차 시장이 지속해 성장함에 따라 충전 인프라에 대한 필요성이 커지고 있다. 그러나 무선 충전 시스템의 경우 기존 유선 충전에 비해 대출력이 요구되어 안정성 문제가 제기되고 있다. 자율주행차 무선 충전 인프라를 구축하기 위한 표준으로는 SAE J2954가 존재하며 해당 표준에서는 차량과 전력 전송 시스템 간의 통신 방법에 대해 정의한다. SAE J2954에서는 자율주행차량의 무선 충전 통신 방법으로 Wi-Fi, Bluetooth 및 UWB와 같은 물리적 미디어를 사용해 차량과 충전 패드 간의 통신을 활성화할 것을 권장한다. 특히 UWB는 실내 환경에서 견고한 통신 능력을 보이고 간섭에 민감하지 않기 때문에 실내외 충전 환경에서 적합한 솔루션이다. 해당 표준에서는 무선전력전송 시스템을 구축하기 위한 프로세스로 충전 시작부터 충전 완료까지를 여러 단계로 구분하였다. 본 연구에서는 UWB 기술을 사용하여 무선전력전송 시스템의 한 가지 프로세스인 Fine alignment의 수단으로 사용한다. 실제 자율주행차 무선전력전송 시스템에 적용 가능성을 판단하기 위해 거리에 따라 실험을 수행하였으며 UWB로부터 거리 정보를 수집하였다. UWB로부터 얻어진 거리 데이터의 정확도를 향상시키기 위해 수집한 데이터를 세 단계의 전처리 과정을 거쳐 머신러닝과 딥러닝 기법을 적용한 Single Model과 Multi Model을 제안한다.

텍스트 마이닝을 활용한 OTT 서비스 플랫폼별 사용자 반응 비교 연구 (Comparative Study of User Reactions in OTT Service Platforms Using Text Mining)

  • 권순찬;김지은;장백철
    • 인터넷정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.43-54
    • /
    • 2024
  • 본 연구는 텍스트 마이닝 기법을 활용하여 다양한 OTT(Over-The-Top) 서비스 플랫폼에 대한 사용자 반응을 비교한다. 연구의 주요 목표는 OTT 서비스 플랫폼의 사용자 만족도를 파악하여 보다 효과적인 리뷰 전략을 수립하는 데 기여하는 것이다. 본 연구에서 다루는 주요 질문에는 다양한 OTT 서비스에 대한 사용자 리뷰에서 두드러진 토픽과 키워드를 식별하고 플랫폼별 사용자 반응을 이해하는 것이 포함된다. 이를 위해 긍정, 부정 리뷰에서 중요 단어를 추출하기 위해 Tf-idf를, 복잡한 사용자 리뷰를 보다 정교하고 포괄적으로 분석하기 위해 고급 토픽 모델링 기법인 BERTopic을 사용한다. Tf-idf 분석한 결과, 앱에 대한 긍정 리뷰는 콘텐츠와 관련된 단어들의 수치가 높았으며 부정 리뷰에서는 앱 사용 과정에서 발생할 수 있는 문제점에 관한 단어 수치가 높게 기록되었다. BERTopic을 활용한 토픽 모델링에서는 콘텐츠의 속성과 연관 지어 콘텐츠의 다양성, 앱 성능 요소, 결제, 호환성에 관한 키워드를 도출하였으며, 플랫폼 별로 두각을 보이는 속성이 다르다는 점도 확인하였다. 본 연구 결과는 사용자 행동과 선호도에 대한 중요한 인사이트를 제공하며, 이를 통해 OTT 서비스 제공업체는 사용자 경험과 만족도를 개선하는 데 활용할 수 있다. 또한, 연구자들은 사용자 리뷰 텍스트 분석에서 딥러닝 모델을 활용한 연구의 아이디어를 얻을 수 있을 것이라 기대한다.

Support Vector Regression에서 분리학습을 이용한 고객의 구매액 예측모형 (The Prediction of Purchase Amount of Customers Using Support Vector Regression with Separated Learning Method)

  • 홍태호;김은미
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.213-225
    • /
    • 2010
  • 본 연구에서는 기업의 마케팅 프로모션에 따른 반응고객의 구매액 예측을 위한 방법을 제시하고 SVR의 효과적인 학습방법을 제시하였다. 프로모션에 의한 고객의 구매액을 기반으로 고객을 5등급으로 등급화하고 각 등급 내에서 SVR을 적용하여 고객의 구매액을 예측하였다. 본 연구에서 제안하는 예측된 고객의 등급 내에서 고객 구매액을 예측하는 분리데이터 학습법이 프로모션에 반응한 모든 고객을 대상으로 구매액을 예측하는 전체데이터 학습법보다 높은 예측성과를 보여주었다. 일반적으로 세분화된 고객집단을 하나의 집단으로 보고 동일한 마케팅 전략을 제시하나 본 연구를 통해 구매액에 따라 등급화 된 고객의 등급 내에서 다시 고객의 거래 구매액을 예측하여 동일한 집단 내에서도 차별화된 마케팅 전략을 제시할 수 있는 기반을 제시하였다. 즉 동일한 등급에서도 고객 구매액에 따라 고객의 우선순위를 정할 수 있으며, 이는 마케팅 담당자가 프로모션을 제시할 고객을 선정할 때 유용한 정보로 활용될 수 있다.