• 제목/요약/키워드: Machine Learning

검색결과 5,326건 처리시간 0.075초

기상모델자료와 기계학습을 이용한 GK-2A/AMI Hourly AOD 산출물의 결측화소 복원 (Spatial Gap-filling of GK-2A/AMI Hourly AOD Products Using Meteorological Data and Machine Learning)

  • 윤유정;강종구;김근아;박강현;최소연;이양원
    • 대한원격탐사학회지
    • /
    • 제38권5_3호
    • /
    • pp.953-966
    • /
    • 2022
  • 에어로솔(aerosol)은 대기 질을 악화시키는 등 인체 건강에 악영향을 끼치므로 에어로솔의 분포 및 특성에 대한 정량적인 관측이 필수적이다. 최근 전 지구 규모에서의 주기적이고 정량적인 정보 획득 수단으로 위성관측 Aerosol Optical Depth (AOD) 영상이 다양한 연구에 활용되지만 광학센서 기반의 위성 AOD 영상은 구름 등의 조건을 가진 일부 지역에서 결측을 가진다. 이에 본 연구는 위성자료의 결측복원을 위하여 격자형 기상자료와 지리적 요소를 입력변수로 하여 Random Forest (RF) 기반 gap-filling 모델을 생성한 이후, gap-free GK-2A/AMI AOD hourly 영상을 산출하였다. 모델의 정확도는 -0.002의 Mean Bias Error (MBE), 0.145의 Root Mean Square Error (RMSE)로, 원자료의 목표 정확도보다 높으며 상관계수 0.714로 복원 대상이 대기변수인 점을 감안하면 상관계수 측면에서도 충분한 설명력을 갖춘 모델이다. 정지궤도 위성의 높은 시간 해상도는 일변화 관측에 적합하며 대기보정을 위한 입력, 지상 미세먼지 농도 추정, 소규모 화재 또는 오염원 분석 등 타 연구를 위한 자료 활용 측면에서 중요하다.

유튜브 데이터를 활용한 20대 대선 여론분석 (Analysis of public opinion in the 20th presidential election using YouTube data)

  • 강은경;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.161-183
    • /
    • 2022
  • 여론조사는 유권자들의 투표행위를 예측하고, 그 행위에 영향을 준다는 점에서 선거운동의 강력한 수단이자, 언론의 가장 중요한 기사거리로 자리잡고 있다. 하지만, 여론조사가 활발할수록 후보자들의 공약과 정책을 검증하기 보다 당선 가능성이나 지지도에 관한 조사만 반복적으로 실시하는 등 선거 캠페인에 관한 효과 측정에서 유권자들의 마음을 제대로 반영하지 못하는 경우가 많다. 여론조사의 선거 결과에 대한 부실한 예측이 언론사의 권위를 실추시켰다 하더라도, 어느 후보가 최종 승리할지에 대해 인간의 본능적인 궁금증을 풀어줄 명백한 대안이 없기 때문에 사람들은 여론조사에 대한 관심을 쉽게 놓지 못한다. 이에, 온라인 빅데이터를 통해 인사이트를 발굴하는 환경을 제공하는 썸트렌드의 '유튜브 분석' 기능을 활용하여 20대 대선에 대한 여론을 회고적으로 파악해 보고자 한다. 본 연구를 통해 간단한 유튜브 데이터 분석 결과만으로도 실제 여론(혹은 여론조사 결과)에 근접한 결과를 쉽게 도출하고, 성능이 좋은 여론 예측모형을 구축할 수 있음을 확인하였다.

연관규칙 분석을 통한 건설공사 분쟁유형과 분쟁원인의 연관성 분석에 관한 연구 (Association Rules Analysis Between the Types and Causes of Disputes in Construction Projects)

  • 장세림;김한수
    • 한국건설관리학회논문집
    • /
    • 제23권5호
    • /
    • pp.3-14
    • /
    • 2022
  • 건설공사는 이해관계자들 간에 클레임(claim)이 발생할 가능성이 높은 특징을 지니고 있다. 클레임 그 자체가 분쟁은 아니지만, 당사간에 이견이나 갈등으로 인해 상호간 합의가 이루어지지 않으면 이는 분쟁으로 발전하게 될 가능성이 높다. 발주자와 건설사 간에 분쟁이 발생하게 되면 양측 모두에게 부정적인 영향을 끼치며, 건설분쟁을 최소화 하거나 선제적으로 대응하기 위해서는 발주자의 역할이 더욱 중요하다. 본 연구의 목적은 연관규칙 분석(Association Rules Analysis)을 바탕으로 분쟁유형과 분쟁원인의 연관성을 도출하고 주요 특징 및 발주자 관점의 시사점을 제시하는데 있다. 본 연구를 통해 분쟁유형과 분쟁원인간의 연관성을 파악할 수 있었으며 연관성이 높은 규칙을 도출할 수 있었다. 또한 연관규칙 분석을 통해 분쟁유형과 분쟁원인의 연관성을 도출함으로서 단순한 기술통계(빈도수)에 의존하는 것과 비교하여 보다 체계적인 분석을 실시하였다. 사례 분석을 통해 발주자 관점의 시사점으로 분쟁원인을 해소하기 위한 방향도 제시하였다. 본 연구의 결과를 통해 분쟁유형과 분쟁원인의 연관성에 대한 이해를 높일 수 있으며 건설공사의 분쟁을 선제적으로 대응하는데 유용하게 활용될 수 있다.

A Ship-Wake Joint Detection Using Sentinel-2 Imagery

  • Woojin, Jeon;Donghyun, Jin;Noh-hun, Seong;Daeseong, Jung;Suyoung, Sim;Jongho, Woo;Yugyeong, Byeon;Nayeon, Kim;Kyung-Soo, Han
    • 대한원격탐사학회지
    • /
    • 제39권1호
    • /
    • pp.77-86
    • /
    • 2023
  • Ship detection is widely used in areas such as maritime security, maritime traffic, fisheries management, illegal fishing, and border control, and ship detection is important for rapid response and damage minimization as ship accident rates increase due to recent increases in international maritime traffic. Currently, according to a number of global and national regulations, ships must be equipped with automatic identification system (AIS), which provide information such as the location and speed of the ship periodically at regular intervals. However, most small vessels (less than 300 tons) are not obligated to install the transponder and may not be transmitted intentionally or accidentally. There is even a case of misuse of the ship'slocation information. Therefore, in this study, ship detection was performed using high-resolution optical satellite images that can periodically remotely detect a wide range and detectsmallships. However, optical images can cause false-alarm due to noise on the surface of the sea, such as waves, or factors indicating ship-like brightness, such as clouds and wakes. So, it is important to remove these factors to improve the accuracy of ship detection. In this study, false alarm wasreduced, and the accuracy ofship detection wasimproved by removing wake.As a ship detection method, ship detection was performed using machine learning-based random forest (RF), and convolutional neural network (CNN) techniquesthat have been widely used in object detection fieldsrecently, and ship detection results by the model were compared and analyzed. In addition, in this study, the results of RF and CNN were combined to improve the phenomenon of ship disconnection and the phenomenon of small detection. The ship detection results of thisstudy are significant in that they improved the limitations of each model while maintaining accuracy. In addition, if satellite images with improved spatial resolution are utilized in the future, it is expected that ship and wake simultaneous detection with higher accuracy will be performed.

기후변화에 따른 도시침수가 도시교통네트워크에 미치는 영향 예측 기술 개발 (Development of technology to predict the impact of urban inundation due to climate change on urban transportation networks)

  • 정세진;허다솜;김병식
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1091-1104
    • /
    • 2022
  • 기후변화는 전 세계적으로 강우의 빈도와 강도를 증가 시킬 것으로 예측되며 급격한 도시화와 산업화로 인해 도시 지역의 내수 침수 피해로 양상이 바뀌고 있다. 이에 기후변화에 따른 영향평가는 도시계획에 매우 중요한 요소로 언급되고 있으며, 세계기상기구(WMO)는 기상 현상으로부터 발생할 수 있는 사회, 경제적 영향을 고려하는 영향예보의 필요성을 강조하고 있다. 특히 교통에 있어서 도시침수로 인한 교통 시스템의 성능 저하는 사회에 가장 해로운 요소이며 영향을 받는 주요 도로마다 시간당 £ 100k 정도인 것으로 추정하고 있다. 그러나 국내의 경우 현재 기상재해의 발생에 대한 정확한 예보 및 특보를 제공해도 그 영향을 제대로 전달하지 못하고 있다. 따라서 본 연구에서는 도시홍수의 침수심을 제시하고 차량에 영향을 미칠 수 있는 피해에 대처하기 위해 각 지역의 고해상도 분석 및 수문학적 요인을 반영하고, 강우로 인한 홍수 정도와 차량 운행에 미치는 영향 정도를 조사할 필요가 있다고 판단하였다. 이에 강우-침수심-차량속도의 산정식을 간단한 선형회귀식이 아닌 다양한 머신러닝 기법을 이용하여 제시하고자 한다. 또한 또한 기후변화 시나리오를 강우-침수심-차량속도 산정식에 적용하여 집중호우 시 도시하천의 침수를 예측하고 미래 기후변화의 영향을 고려한 도로 침수로 인해 발생할 수 있는 교통 네트워크의 장애를 평가하며, 도시 교통흐름 계획에 이용하는 기술을 개발하고자 한다.

다변수 Bidirectional RNN을 이용한 표층수온 결측 데이터 보간 (Imputation of Missing SST Observation Data Using Multivariate Bidirectional RNN)

  • 신용탁;김동훈;김현재;임채욱;우승범
    • 한국해안·해양공학회논문집
    • /
    • 제34권4호
    • /
    • pp.109-118
    • /
    • 2022
  • 정점 표층 수온 관측 데이터 중 결측 구간의 데이터를 양방향 순환신경망(Bidirectional Recurrent Neural Network, BiRNN) 기법을 이용하여 보간하였다. 인공지능 기법 중 시계열 데이터에 일반적으로 활용되는 Recurrent Neural Networks(RNNs)은 결측 추정 위치까지의 시간 흐름 방향 또는 역방향으로만 추정하기 때문에 장기 결측 구간에는 추정 성능이 떨어진다. 반면, 본 연구에서는 결측 구간 전후의 양방향으로 추정을 하여 장기 결측 데이터에 대해서도 추정 성능을 높일 수 있다. 또한 관측점 주위의 가용한 모든 데이터(수온, 기온, 바람장, 기압, 습도)를 사용함으로써, 이들 상관관계로부터 보간 데이터를 함께 추정하도록 하여 보간 성능을 더욱 높이고자 하였다. 성능 검증을 위하여 통계 기반 모델인 Multivariate Imputation by Chained Equations(MICE)와 기계학습 기반의 Random Forest 모델, 그리고 Long Short-Term Memory(LSTM)을 이용한 RNN 모델과 비교하였다. 7일간의 장기 결측에 대한 보간에 대해서 BiRNN/통계 모델들의 평균 정확도가 각각 70.8%/61.2%이며 평균 오차가 각각 0.28도/0.44도로 BiRNN 모델이 다른 모델보다 좋은 성능을 보인다. 결측 패턴을 나타내는 temporal decay factor를 적용함으로써 BiRNN 기법이 결측 구간이 길어질수록 보간 성능이 기존 방법보다 우수한 것으로 판단된다.

자연어 처리 모델을 활용한 블록 코드 생성 및 추천 모델 개발 (Development of Block-based Code Generation and Recommendation Model Using Natural Language Processing Model)

  • 전인성;송기상
    • 정보교육학회논문지
    • /
    • 제26권3호
    • /
    • pp.197-207
    • /
    • 2022
  • 본 논문에서는 코딩 학습 중 학습자의 인지 부하 감소를 목적으로 자연어 처리 모델을 이용하여 전이학습 및 미세조정을 통해 블록 프로그래밍 환경에서 이미 이루어진 학습자의 블록을 학습하여 학습자에게 다음 단계에서 선택 가능한 블록을 생성하고 추천해 주는 머신러닝 기반 블록 코드 생성 및 추천 모델을 개발하였다. 모델 개발을 위해 훈련용 데이터셋은 블록 프로그래밍 언어인 '엔트리' 사이트의 인기 프로젝트 50개의 블록 코드를 전처리하여 제작하였으며, 훈련 데이터셋과 검증 데이터셋 및 테스트 데이터셋으로 나누어 LSTM, Seq2Seq, GPT-2 모델을 기반으로 블록 코드를 생성하는 모델을 개발하였다. 개발된 모델의 성능 평가 결과, GPT-2가 LSTM과 Seq2Seq 모델보다 문장의 유사도를 측정하는 BLEU와 ROUGE 지표에서 더 높은 성능을 보였다. GPT-2 모델을 통해 실제 생성된 데이터를 확인한 결과 블록의 개수가 1개 또는 17개인 경우를 제외하면 BLEU와 ROUGE 점수에서 비교적 유사한 성능을 내는 것을 알 수 있었다.

계층적 군집분석을 이용한 반도체 웨이퍼의 불량 및 불량 패턴 탐지 (Wafer bin map failure pattern recognition using hierarchical clustering)

  • 정주원;정윤서
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.407-419
    • /
    • 2022
  • 반도체는 제조 공정이 복잡하고 길어 결함이 발생될 때 빠른 탐지와 조치가 이뤄져야 결함으로 인한 손실을 최소화할 수 있다. 테스트 공정을 거쳐 구성된 웨이퍼 빈 맵(WBM)의 체계적인 패턴을 탐지하고 분류함으로써 문제의 원인을 유추할 수 있다. 이 작업은 수작업으로 이뤄지기 때문에 대량의 웨이퍼를 단 시간에 처리하는 데 한계가 있다. 본 논문은 웨이퍼 빈 맵의 정상 여부를 구분하기 위해 계층적 군집 분석을 활용한 새로운 결함 패턴 탐지 방법을 제시한다. 제시하는 방법은 여러 장점이 있다. 군집의 수를 알 필요가 없으며 군집분석의 조율 모수가 적고 직관적이다. 동일한 크기의 웨이퍼와 다이(die)에서는 동일한 조율 모수를 가지므로 대량의 웨이퍼도 빠르게 결함을 탐지할 수 있다. 소량의 결함 데이터만 있어도 그리고 데이터의 결함비율을 가정하지 않더라도 기계학습 모형을 훈련할 수 있다. 제조 특성상 결함 데이터는 구하기 어렵고 결함의 비율이 수시로 바뀔 수 있기 때문에 필요하다. 또한 신규 패턴 발생시에도 안정적으로 탐지한다. 대만 반도체 기업에서 공개한 실제 웨이퍼 빈 맵 데이터(WM-811K)로 실험하였다. 계층적 군집 분석을 이용한 결함 패턴탐지는 불량의 재현율이 96.31%로 기존의 공간 필터(spatial filter)보다 우수함을 보여준다. 결함 분류는 혼합 유형에 장점이 있는 계층적 군집 분석을 그대로 사용한다. 직선형과 곡선형의 긁힘(scratch) 결함의 특징에 각각 주성분 분석의 고유값과 2차 다항식의 결정계수를 이용하고 랜덤 포레스트 분류기를 이용한다.

랜덤포레스트 회귀모형을 적용한 도시지역에서의 실시간 침수 예측 (Real-time flood prediction applying random forest regression model in urban areas)

  • 김현일;이연수;김병현
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1119-1130
    • /
    • 2021
  • 불안정한 기후와 함께 나타나는 국지적 집중호우로 인한 도시 침수는 끊임없이 발생하고 있으나, 강우량을 포함한 기상정보 현황 또는 예보정보를 활용하여 공간적인 도시홍수 예측정보를 제공할 수 있는 체계는 아직 마련되지 못한 상황이다. 공간적인 홍수정보는 하천의 제방, 도시 하수관거의 통수능, 저류지, 펌프시설과 같은 구조물적 대책에 어려움이 있을 시 발생할 수 있는 최악의 홍수상황을 미리 파악함으로써 피해를 최소화하는데 직접적인 영향을 미칠 수 있다. 이에 본 연구에서는 기상청에서 제공되는 강수량, 도시 유역에 대한 2차원 침수해석 결과, 그리고 기계학습 모형 중 하나인 랜덤포레스트 회귀모형을 활용하여 실시간으로 도시유역에 대한 침수지도를 예측할 수 있는 방법론을 제시하고자 한다. 연구유역은 내수침수가 빈번하게 발생하는 울산시 우정태화지구로 선정하였다. 지속시간 6시간의 총강우량 50 mm, 80 mm 그리고 110 mm 대한 랜덤포레스트 회귀분석 예측 침수면적과 검보정된 2차원 물리모형의 침수해석 결과 비교시 각각 63%, 80%, 그리고 67%의 적합도를 보여주어, 빠른 시간안에 발생하는 도시 침수에 대한 대응, 대피를 위한 기초자료로 활용될 수 있을 것으로 판단된다.

IBN 기반: AI 기반 멀티 도메인 네트워크 슬라이싱 접근법 (IBN-based: AI-driven Multi-Domain e2e Network Orchestration Approach)

  • 칸 탈하 애흐마드;아팍 모하메드;기자르 아바쓰;송왕철
    • KNOM Review
    • /
    • 제23권2호
    • /
    • pp.29-41
    • /
    • 2020
  • 네트워크는 빠르게 성장하여 다중 도메인 복잡성을 유발하고 있다. 네트워크 트래픽 및 서비스의 다양성, 다양성 및 동적 특성은 향상된 오케스트레이션 및 관리 접근 방식을 필요로한다. 많은 표준 오케스트레이터와 네트워크 운영자가 E2E 슬라이스 오케스트레이션을 처리하기 위한 복잡성이 증가하고 있다. 또한 액세스, 에지, 전송 및 코어 네트워크를 포함하여 E2E 슬라이스 오케스트레이션과 관련된 여러 도메인이 각각 특정 문제를 가지고 있다. 따라서 멀티 도메인, 멀티 플랫폼 및 멀티 오퍼레이터 기반 네트워킹 환경을 수동으로 처리하려면 특정 전문가가 필요하며 이 접근 방식을 사용하면 런타임에 네트워크의 동적 변경을 처리할 수 없다 또한 이러한 복잡성을 처리하기위한 수동 접근 방식은 항상 오류가 발생하기 쉽고 지루한 일이다. 따라서 본 연구에서는 의도 기반 접근법을 사용하여 E2E 슬라이스 오케스트레이션을 처리하기 위한 자동화되고 추상화된 솔루션을 제안한다. 운영자로부터 도메인을 추상화하고 높은 수준의 의도 형태로 오케스트레이션 의도를 제공 할 수 있다. 또한 조정 된 리소스를 적극적으로 모니터링하고 머신 러닝을 사용하여 현재 모니터링 통계를 기반으로 시스템 상태 업데이트를 위한 향후 리소스 활용도를 예측한다. Closed-loop 자동화 E2E 네트워크 오케스트레이션 및 관리 시스템이 생성된다.