• 제목/요약/키워드: machine learning

검색결과 5,177건 처리시간 0.026초

기계학습을 이용한 동영상 서비스의 검색 편의성 향상 (Machine Learning Assisted Information Search in Streaming Video)

  • 임연섭
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.361-367
    • /
    • 2021
  • 유튜브와 같은 동영상 스트리밍 서비스에서의 정보 검색은 전통적인 정보 검색 서비스를 대체하고 있다. 이러한 동영상 안에서 원하는 세부적인 정보를 찾기 위해서는 사용자가 여러 부분을 반복해서 탐색하며 시간과 네트워크 대역폭을 낭비해야 하는 문제점이 있다. 본 논문에서는 클러스터링과 LSTM을 이용하여 이러한 사용자의 동영상 내 정보 검색을 보조하는 방법을 제안한다. 제안하는 방법은 사용자의 정보 검색을 위한 탐색 지점 순서와 DBSCAN이 범주화한 최종 목적 지점 범주를 이용하여 LSTM 모델을 학습하고, 이 모델을 이용하여 사용자가 검색을 시작할 때 선택한 탐색 지점 순서에 기반을 둔 사용자의 예상 목적 지점 범주를 제시한다. 실험 결과, 제안하는 방법이 사용자가 원하는 목적 지점을 평균적으로 98%의 정확도와 7초의 시간 오차로 찾아내는 것을 보였다.

기계학습을 활용한 게임승패 예측 및 변수중요도 산출을 통한 전략방향 도출 (Predicting Game Results using Machine Learning and Deriving Strategic Direction from Variable Importance)

  • 김용우;김영민
    • 한국게임학회 논문지
    • /
    • 제21권4호
    • /
    • pp.3-12
    • /
    • 2021
  • 본 연구에서는 게임 초반 10분의 데이터를 이용하여 리그오브레전드 게임의 최종승패를 랭크별로 예측하고, 구축된 승패예측 모형으로부터 변수중요도를 추출하여 승리를 위한 초반 게임운영의 방향성을 알아보았다. 그 결과 모든 랭크에서 70% 이상의 정확도로 승패를 예측할 수 있었다. 이는 경기 양상이 대부분 뒤집히지 않고 최종승패로 이어지는 것을 의미하며, 이러한 경향성은 상위 랭크로 갈수록 더욱 강하게 나타났다. 랭크와 무관하게 킬(데스)가 초반 게임에서 최종승패에 가장 큰 영향을 미치는 요소로 나타났으나, 일부 변수는 랭크에 따라 중요도 순위가 변화하였고 이는 유저가 속한 랭크에 따라 승리에 효과적인 초반 전략방향에 차이가 있음을 시사한다.

공공기술 사업화를 위한 CTGAN 기반 데이터 불균형 해소 (Resolving CTGAN-based data imbalance for commercialization of public technology)

  • 황철현
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.64-69
    • /
    • 2022
  • 공공기술 사업화는 정부가 주도하는 과학기술의 혁신과 R&D 성과를 민간에 이전하는 것으로 경제 성장을 주도하는 핵심 성과로 인식되고 있다. 따라서 기술 이전을 활성화시키기 위해 성공 요인을 식별하거나 사업화 가능성이 높은 공공기술과 수요기업을 매칭하는 다양한 기계학습의 방법들이 연구되고 있다. 하지만 공공기술 사업화 데이터는 표 형태로 구성되어 있고, 성공-실패 비율이 큰 차이를 보이는 불균형 상태이기 때문에 기계학습 성능이 높지 않는 문제점을 가지고 있다. 이 논문에서는 표 형태로 구성된 공공기술 데이터에서 불균형을 해소하기 위해 CTGAN을 활용하는 방법을 제시한다. 또한 제시된 방법의 효과를 검증하기 위해 실제 공공기술 사업화 데이터를 활용하여 통계적 접근방법인 SMOTE와 비교 실험을 수행하였다. 다수의 실험 사례에서 CTGAN은 공공기술 사업화 성공사례를 안정적으로 예측하는 것을 확인하였다.

XGboost 기반의 WiFi 신호를 이용한 실내 측위 기법 (Indoor positioning method using WiFi signal based on XGboost)

  • 황치곤;윤창표;김대진
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.70-75
    • /
    • 2022
  • 위치를 정확하게 측정하는 것은 다양한 서비스를 제공하는 데 필요하다. 실내 측위를 위한 데이터는 스마트 폰의 앱을 통해 WiFi 장치로부터 RSSI 값을 측정한다. 이렇게 측정된 데이터는 기계학습의 원시 데이터가 된다. 특징 데이터는 측정된 RSSI 값이고, 레이블은 측정한 위치에 대한 공간의 이름으로 한다. 이를 위한 기계학습 기법은 분류에 효율적인 기법을 적용하여 WiFi 신호만으로 정확한 위치를 예측하는 기법을 연구하고자 한다. 앙상블은 하나의 모델보다 다양한 모델을 통하여 더 정확한 예측값을 구하는 기법으로, bagging과 boosting이 있다. 이 중 Boosting은 샘플링한 데이터를 바탕으로 모델링한 결과를 통해 모델의 가중치를 조정하는 기법으로, 다양한 알고리즘이 있다. 본 연구는 위 기법 중 XGboost를 이용하고, 다른 앙상블 기법과 이용한 수행결과를 바탕으로 성능을 평가한다.

Machine Learning-based Classification of Hyperspectral Imagery

  • Haq, Mohd Anul;Rehman, Ziaur;Ahmed, Ahsan;Khan, Mohd Abdul Rahim
    • International Journal of Computer Science & Network Security
    • /
    • 제22권4호
    • /
    • pp.193-202
    • /
    • 2022
  • The classification of hyperspectral imagery (HSI) is essential in the surface of earth observation. Due to the continuous large number of bands, HSI data provide rich information about the object of study; however, it suffers from the curse of dimensionality. Dimensionality reduction is an essential aspect of Machine learning classification. The algorithms based on feature extraction can overcome the data dimensionality issue, thereby allowing the classifiers to utilize comprehensive models to reduce computational costs. This paper assesses and compares two HSI classification techniques. The first is based on the Joint Spatial-Spectral Stacked Autoencoder (JSSSA) method, the second is based on a shallow Artificial Neural Network (SNN), and the third is used the SVM model. The performance of the JSSSA technique is better than the SNN classification technique based on the overall accuracy and Kappa coefficient values. We observed that the JSSSA based method surpasses the SNN technique with an overall accuracy of 96.13% and Kappa coefficient value of 0.95. SNN also achieved a good accuracy of 92.40% and a Kappa coefficient value of 0.90, and SVM achieved an accuracy of 82.87%. The current study suggests that both JSSSA and SNN based techniques prove to be efficient methods for hyperspectral classification of snow features. This work classified the labeled/ground-truth datasets of snow in multiple classes. The labeled/ground-truth data can be valuable for applying deep neural networks such as CNN, hybrid CNN, RNN for glaciology, and snow-related hazard applications.

크라우드 소싱 기반의 지역 교통 이벤트 검출 기법 (Crowdsourcing based Local Traffic Event Detection Scheme)

  • 김윤아;최도진;임종태;김상혁;김종훈;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권4호
    • /
    • pp.83-93
    • /
    • 2022
  • 운전자가 모바일기기를 사용하여 직접 교통 정보를 제공하는 크라우드 소싱을 활용하여 교통 문제를 해결하려는 연구들이 진행 중이다. 크라우드 소싱을 통해 수집된 데이터를 교통 이벤트 검출에 사용한다면 관련된 데이터를 수집하는 작업이 줄어들어 시간 비용이 낮아지고 정확도는 높아지는 장점이 있다. 본 논문에서는 크라우드 소싱을 활용하여 교통과 관련된 데이터를 수집하고, 이를 통해 교통에 영향을 미치는 이벤트를 검출하는 기법을 제안한다. 제안하는 기법은 대용량 데이터 처리를 위해 기계 학습 알고리즘을 사용하여 수집된 데이터의 이벤트 유형을 판별한다. 또한, 이벤트가 발생된 위치를 추출하기 위하여 수집된 데이터에서 위치를 나타내는 키워드를 추출하고 키워드의 행정구역을 반환한다. 이를 통해 기존 제공되는 위치 정보에서 광범위하게 정의된 위치나 잘못된 위치 정보를 해결할 수 있다. 제안하는 기법의 타당성을 입증하기 위해 다양한 성능 평가를 수행한다.

앱 이용실적과 앱 리뷰 감성분석의 통합적 모델 구축에 관한 연구 (A Study on Building an Integrated Model of App Performance Analysis and App Review Sentiment Analysis)

  • 김동욱;김성범
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.58-73
    • /
    • 2022
  • 이 연구의 목적은 모바일 앱 실적 변수 간의 관계를 파악하여 예측 가능한 앱 실적 변수의 추정 모델을 구성하고 앱 리뷰가 앱 실적 지표에 미치는 영향을 검증하는 것이다. 연구1과 2에서는 상관분석과 기계학습의 랜덤 포레스트 회귀 추정을 사용하여 앱 실적 간의 관계를 도출하고 앱 실적 추정 모델링을 수행하였다. 연구3에서는 앱 리뷰를 텍스트 마이닝의 감성분석을 사용하여 일별 감성 점수를 도출한 후 다변량 시계열분석을 사용하여 앱 리뷰의 감성점수가 앱의 일일 설치 횟수에 선행하여 영향을 주는 것을 발견하였다. 앱을 개발하고 서비스하는 기업은 앱 실적 지표와 앱 리뷰에서 제기되는 불만족과 고객 니즈를 검토하여 적기에 앱을 개선하고 마케팅 판매촉진활동의 시점과 방향성을 도출할 수 있다.

Application of POD reduced-order algorithm on data-driven modeling of rod bundle

  • Kang, Huilun;Tian, Zhaofei;Chen, Guangliang;Li, Lei;Wang, Tianyu
    • Nuclear Engineering and Technology
    • /
    • 제54권1호
    • /
    • pp.36-48
    • /
    • 2022
  • As a valid numerical method to obtain a high-resolution result of a flow field, computational fluid dynamics (CFD) have been widely used to study coolant flow and heat transfer characteristics in fuel rod bundles. However, the time-consuming, iterative calculation of Navier-Stokes equations makes CFD unsuitable for the scenarios that require efficient simulation such as sensitivity analysis and uncertainty quantification. To solve this problem, a reduced-order model (ROM) based on proper orthogonal decomposition (POD) and machine learning (ML) is proposed to simulate the flow field efficiently. Firstly, a validated CFD model to output the flow field data set of the rod bundle is established. Secondly, based on the POD method, the modes and corresponding coefficients of the flow field were extracted. Then, an deep feed-forward neural network, due to its efficiency in approximating arbitrary functions and its ability to handle high-dimensional and strong nonlinear problems, is selected to build a model that maps the non-linear relationship between the mode coefficients and the boundary conditions. A trained surrogate model for modes coefficients prediction is obtained after a certain number of training iterations. Finally, the flow field is reconstructed by combining the product of the POD basis and coefficients. Based on the test dataset, an evaluation of the ROM is carried out. The evaluation results show that the proposed POD-ROM accurately describe the flow status of the fluid field in rod bundles with high resolution in only a few milliseconds.

An Intelligent Game Theoretic Model With Machine Learning For Online Cybersecurity Risk Management

  • Alharbi, Talal
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.390-399
    • /
    • 2022
  • Cyber security and resilience are phrases that describe safeguards of ICTs (information and communication technologies) from cyber-attacks or mitigations of cyber event impacts. The sole purpose of Risk models are detections, analyses, and handling by considering all relevant perceptions of risks. The current research effort has resulted in the development of a new paradigm for safeguarding services offered online which can be utilized by both service providers and users. customers. However, rather of relying on detailed studies, this approach emphasizes task selection and execution that leads to successful risk treatment outcomes. Modelling intelligent CSGs (Cyber Security Games) using MLTs (machine learning techniques) was the focus of this research. By limiting mission risk, CSGs maximize ability of systems to operate unhindered in cyber environments. The suggested framework's main components are the Threat and Risk models. These models are tailored to meet the special characteristics of online services as well as the cyberspace environment. A risk management procedure is included in the framework. Risk scores are computed by combining probabilities of successful attacks with findings of impact models that predict cyber catastrophe consequences. To assess successful attacks, models emulating defense against threats can be used in topologies. CSGs consider widespread interconnectivity of cyber systems which forces defending all multi-step attack paths. In contrast, attackers just need one of the paths to succeed. CSGs are game-theoretic methods for identifying defense measures and reducing risks for systems and probe for maximum cyber risks using game formulations (MiniMax). To detect the impacts, the attacker player creates an attack tree for each state of the game using a modified Extreme Gradient Boosting Decision Tree (that sees numerous compromises ahead). Based on the findings, the proposed model has a high level of security for the web sources used in the experiment.

스마트폰 센서와 기계학습을 이용한 실내외 운동 활동의 인식 (Recognition of Indoor and Outdoor Exercising Activities using Smartphone Sensors and Machine Learning)

  • 김재경;주연호
    • 창의정보문화연구
    • /
    • 제7권4호
    • /
    • pp.235-242
    • /
    • 2021
  • 스마트폰은 다양한 고성능의 센서가 포함되어 있으며 센서에서 발생하는 데이터를 이용하여 인간의 활동을 분석하는 연구가 진행되어왔다. 이러한 인간 활동 인식은 생활 패턴 분석, 운동량 측정, 위험 상황 감지 등 다양한 분야에서 활용될 수 있다. 그러나 기존 연구의 경우 인간의 기본 행동의 인식에 초점을 두거나 효율적인 배터리 사용을 위해 최적의 인식 결과를 내는 방법을 연구하는 경우가 많았다. 본 논문에서는 기본 행동에 건강 관리 목적으로 실내 및 실외에서 행해지는 운동 동작을 총 10가지로 정의하여 인식하도록 하였다. 이를 위해 가속도, 자이로 및 위치 센서의 값을 수집하고 데이터 전처리 과정을 거치고, 활동을 인식하기 위해서 SVM 모델 외에 안정적인 성능을 가진 앙상블 기반의 랜덤 포레스트, 그라디언트 부스팅 모델을 결합하여 투표 기반으로 인식 결과를 결정하였다. 그 결과 높은 정확도로 정의된 활동의 인식이 가능하였으며 특히 유사한 종류의 실내 및 실외 운동 활동의 분류가 가능하였다.