• 제목/요약/키워드: 기계학습(머신러닝)

검색결과 150건 처리시간 0.028초

도시 빅데이터를 활용한 스마트시티의 교통 예측 모델 - 환경 데이터와의 상관관계 기계 학습을 통한 예측 모델의 구축 및 검증 - (Big Data Based Urban Transportation Analysis for Smart Cities - Machine Learning Based Traffic Prediction by Using Urban Environment Data -)

  • 장선영;신동윤
    • 한국BIM학회 논문집
    • /
    • 제8권3호
    • /
    • pp.12-19
    • /
    • 2018
  • The research aims to find implications of machine learning and urban big data as a way to construct the flexible transportation network system of smart city by responding the urban context changes. This research deals with a problem that existing a bus headway model is difficult to respond urban situations in real-time. Therefore, utilizing the urban big data and machine learning prototyping tool in weathers, traffics, and bus statues, this research presents a flexible headway model to predict bus delay and analyze the result. The prototyping model is composed by real-time data of buses. The data is gathered through public data portals and real time Application Program Interface (API) by the government. These data are fundamental resources to organize interval pattern models of bus operations as traffic environment factors (road speeds, station conditions, weathers, and bus information of operating in real-time). The prototyping model is implemented by the machine learning tool (RapidMiner Studio) and conducted several tests for bus delays prediction according to specific circumstances. As a result, possibilities of transportation system are discussed for promoting the urban efficiency and the citizens' convenience by responding to urban conditions.

데이터 전처리를 통한 사용자 제스처 인식률 증가 방안 (A study on the increase of user gesture recognition rate using data preprocessing)

  • 김준헌;송병후;신동렬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.13-16
    • /
    • 2017
  • 제스처 인식은 HCI(Human-Computer Interaction) 및 HRI(Human-Robot Interaction) 분야에서 활발히 연구되고 있는 기술이며, 제스처 데이터의 특징을 추출해내고 그에 따른 분류를 통하여 사용자의 제스처를 정확히 판별하는 것이 중요한 과제로 자리 잡았다. 본 논문에서는 EMG(Electromyography) 센서로 측정한 사용자의 손 제스처 데이터를 분석하는 방안에 대하여 서술한다. 수집된 데이터의 노이즈를 제거하고 데이터의 특징을 극대화시키기 위하여 연속적인 데이터로 변환하는 전처리 과정을 거쳐 이를 머신 러닝 알고리즘을 사용하여 분류하였다. 이 때, 기존의 raw 데이터와 전처리 과정을 거친 데이터의 성능을 decision-tree 알고리즘을 통하여 비교하였다.

  • PDF

머신 러닝 알고리즘을 이용한 역방향 깃발의 에너지 하베스팅 효율 예측 (Prediction of Energy Harvesting Efficiency of an Inverted Flag Using Machine Learning Algorithms)

  • 임세환;박성군
    • 한국가시화정보학회지
    • /
    • 제19권3호
    • /
    • pp.31-38
    • /
    • 2021
  • The energy harvesting system using an inverted flag is analyzed by using an immersed boundary method to consider the fluid and solid interaction. The inverted flag flutters at a lower critical velocity than a conventional flag. A fluttering motion is classified into straight, symmetric, asymmetric, biased, and over flapping modes. The optimal energy harvesting efficiency is observed at the biased flapping mode. Using the three different machine learning algorithms, i.e., artificial neural network, random forest, support vector regression, the energy harvesting efficiency is predicted by taking bending rigidity, inclination angle, and flapping frequency as input variables. The R2 value of the artificial neural network and random forest algorithms is observed to be more than 0.9.

통사문법적 지식이 '독서기계'의 음성출력에 미치는 영향과 중요성 (The Influence and Impact of syntactic-grammatical knowledge on the Phonetic Outputs of a 'Reading Machine')

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.225-230
    • /
    • 2020
  • 인공지능, 딥러닝, 머신러닝 등이 괄목할만한 발전을 이루면서 2016년경부터 100여개의 언어를 비롯하여 가장 보편적으로 사용되어 온 Google Translate (구글기계번역기)는 자연언어처리(NLP) 분야와 외국어 학습 등 언어활용 분야에 독보적인 역할을 하고 있다. 본 논문은 구글기계번역기, Google Translate에 있어서, 영어모국어화자가 가진 통사문법적-범주적 지식의 중요성과 그 영향력에 대해 살펴보고자 한다. Jackendoff (1999)는 맹인을 위한 독서기계(Reading Machine)등을 구축하려면 통사구조적 지식과 문법적 분해력(parsing)이 매우 중요하고, 적어도 현재의 컴퓨터는 엄청난 발전을 이루기는 하였으나, 인간의 두뇌를 따라갈 수 없다는 결론을 내렸다. Jackendoff가 논의했던 몇 가지 어휘항목과 통사구조적 중의성을 활용하여, Google Translate 기계발음번역기를 통해 그의 주장을 확인하는 실험을 실시하고, 그 결과를 분석하는 것이 이 논문의 목표이다. 이 연구는 Jackendoff의 주장처럼 L1 화자가 내재화한 통사문법적, 범주-구조적 지식은 NLP, 혹은 "독서기계"등의 구축에서 중요하며, 이는 Chomsky (1986, 2005)등에서 논의된 내재적언어 (I-language)의 핵심이라는 점을 시사한다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

소셜 빅데이터 분석과 기계학습을 이용한 영화흥행예측 기법의 실험적 평가 (An Experimental Evaluation of Box office Revenue Prediction through Social Bigdata Analysis and Machine Learning)

  • 장재영
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.167-173
    • /
    • 2017
  • 인공지능으로 대표되는 4차 산업혁명에 대한 관심이 증가함에 따라 사회 전반에 빅데이터 및 머신러닝 활용하려는 움직임이 활발해지고 있다. 이러한 움직임은 다양한 분야에서의 예측 시스템 개발로 현실화되고 있다. 특히 영화 산업에서는 투자, 마케팅 등에 활용을 위해 흥행 여부를 사전에 예측하고자하는 여러 가지 시도가 있어왔다. 예전에는 영화에 대한 정적 데이터만을 고려한 예측이 주류를 이뤘으나, 최근에는 실시간으로 생성되는 소셜 데이터를 활용하여 예측하고자하는 노력이 진행되고 있다. 본 논문에서는 영화의 정적 데이터와 더불어 기사, 블로그, 영화평 등 다양한 피드백 정보를 활용한 예측 기법을 제안한다. 또한 제안한 기법을 활용하여 상대적으로 흥행에 성공한 영화만을 대상으로 이들의 흥행정도를 정량적으로 추정할 수 있는지의 여부를 실험적으로 평가하였다.

VIMS와 DTG 데이터를 이용한 창원시 시내버스 머신러닝 분석 연구 (A Study on the Analysis of Bus Machine Learning in Changwon City Using VIMS and DTG Data)

  • 박지양;정재환;윤진수;김성철;김지연;이호상;류익희;권영문
    • 자동차안전학회지
    • /
    • 제14권1호
    • /
    • pp.26-31
    • /
    • 2022
  • Changwon City has the second highest accident rate with 79.6 according to the city bus accident rate. In fact, 250,000 people use the city bus a day in Changwon, The number of accidents is increasing gradually. In addition, a recent fire accident occurred in the engine room of a city bus (CNG) in Changwon, which has gradually expanded the public's anxiety. In the case of business vehicles, the government conducts inspections with a short inspection cycle for the purpose of periodic safety inspections, etc., but it is not in the monitoring stage. In the case of city buses, the operation records are monitored using Digital Tacho Graph (DTG). As such, driving records, methods, etc. are continuously monitored, but inspections are conducted every six months to ascertain the safety and performance of automobiles. It is difficult to identify real-time information on automobile safety. Therefore, in this study, individual automobile management solutions are presented through machine learning techniques of inspection results based on driving records or habits by linking DTG data and Vehicle Inspection Management System (VIMS) data for city buses in Changwon from 2019 to 2020.

디지털헬스케어에서의 인공지능 적용 사례 및 고찰 (Artificial Intelligence Application Cases and Considerations in Digital Healthcare)

  • 박민서
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.141-147
    • /
    • 2022
  • 디지털 헬스케어의 정의는 광의로는 헬스케어 산업과 ICT가 융합되어 개인건강과 질환을 관리하는 산업영역을 의미하고, 협의로는 환자의 건강을 향상시키기 위해 의료 서비스를 관리하는데 다양한 의료 기술을 사용하는 것을 포함한다. 본 논문은 디지털 헬스케어 분야에 적용되고 있는 인공지능과 기계학습 기법들의 활용사례 소개를 통해 다양한 디지털 헬스케어 분야에 인공지능 기술이 안정적이고 효율적으로 적용할 수 있도록 설계 지침을 제공하는 데 목적이 있다. 이를 위해 본 논문에서는 의료분야와 일상생활 분야로 나누어서 살펴보았다. 두 영역은 다른 데이터 특성을 갖는다. 두 개의 영역을 보다 세분화하여 데이터 특성 및 문제 정의 및 특징에 따른 인공지능 알고리즘 활용사례를 살펴보았다. 이를 통해 디지털 헬스케어 분야에서 활용되는 인공지능 기술들에 대한 이해도를 높이고 다양한 인공지능 기술의 활용에 대한 가능성을 검토하여 인공지능 기술이 헬스케어 산업과 개인의 건강한 삶에 기여할 수 있는 근본적인 가치에 대해 고찰한다.

백제보 상류하천구간의 Oversampling technique과 Machine Learning을 활용한 CDOM 흡수계수 예측 (Prediction of CDOM absorption coefficient using Oversampling technique and Machine Learning in upstream reach of Baekje weir)

  • 김진욱;장원진;김진휘;박용은;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.46-46
    • /
    • 2022
  • 유기물의 복잡한 혼합물인 CDOM(Colored or Chromophoric Dissolved Organic Matter)은 하천 내 BOD(Biological Oxygen Demand), COD(Chemical Oxygen Demand) 및 유기 오염물질과 상당한 관련이 있다. CDOM은 가시광선 영역에서 빛을 흡수하는 성질을 가지고 있으며, 최근 원격감지 기술로 CDOM을 모니터링하기 위한 연구가 진행되고 있다. 본 연구에서는 백제보 상류 23km 구간에서 3년(2016~2018) 중 13일의 초분광영상을 활용하여 머신러닝 기반 CDOM을 추정 알고리즘을 개발하고자 한다. 초분광영상은 400~970 nm의 범위의 4 nm 간격 127개 대역의 분광해상도와 2 m의 공간해상도를 가진 항공기 탑재 AsiaFENIX 초분광 센서를 통해 수집하였으며 CDOM은 Millipore polycarbonate filter (𝚽47, 0.2 ㎛)에서 여과된 CDOM 샘플 자료를 200~800 nm의 흡수계수 스펙트럼으로 추출하여 사용하였다. CDOM 값은 전체기간 동안 2.0~11.0 m-1의 값 분포를 보였으며 5 m-1이상의 고농도 구간 자료개수가 전체 153개 샘플자료 중 21개로 불균형하다. 따라서 ADASYN(Adaptive Synthesis Sampling Approach)의 oversampling 방법으로 생성된 합성 데이터를 사용하여 원본 데이터의 소수계층 데이터 불균형을 해결하고 모델 예측 성능을 개선하고자 하였다. 생성된 합성 데이터를 입력변수로 하여 ANN(Artificial Neural Netowk)을 활용한 CDOM 예측 알고리즘을 구축하였다. ADASYN 기법을 통한 합성 데이터는 관측된 데이터의 불균형을 해결하여 기계학습 모델의 CDOM 탐지 성능을 향상시킬 수 있으며, 저수지 내 유기 오염물질 관리를 위한 설계를 지원하는데 사용할 수 있을 것으로 판단된다.

  • PDF

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.