• 제목/요약/키워드: nearest-neighbor analysis

검색결과 256건 처리시간 0.027초

Intelligent Traffic Prediction by Multi-sensor Fusion using Multi-threaded Machine Learning

  • Aung, Swe Sw;Nagayama, Itaru;Tamaki, Shiro
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권6호
    • /
    • pp.430-439
    • /
    • 2016
  • Estimation and analysis of traffic jams plays a vital role in an intelligent transportation system and advances safety in the transportation system as well as mobility and optimization of environmental impact. For these reasons, many researchers currently mainly focus on the brilliant machine learning-based prediction approaches for traffic prediction systems. This paper primarily addresses the analysis and comparison of prediction accuracy between two machine learning algorithms: Naïve Bayes and K-Nearest Neighbor (K-NN). Based on the fact that optimized estimation accuracy of these methods mainly depends on a large amount of recounted data and that they require much time to compute the same function heuristically for each action, we propose an approach that applies multi-threading to these heuristic methods. It is obvious that the greater the amount of historical data, the more processing time is necessary. For a real-time system, operational response time is vital, and the proposed system also focuses on the time complexity cost as well as computational complexity. It is experimentally confirmed that K-NN does much better than Naïve Bayes, not only in prediction accuracy but also in processing time. Multi-threading-based K-NN could compute four times faster than classical K-NN, whereas multi-threading-based Naïve Bayes could process only twice as fast as classical Bayes.

지적 구조 분석을 위한 새로운 클러스터링 기법에 관한 연구 (A novel clustering method for examining and analyzing the intellectual structure of a scholarly field)

  • 이재윤
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.215-231
    • /
    • 2006
  • 패스파인더 네트워크를 사용하여 지적 구조의 분석과 규명을 시도한 여러 연구가 발표되었다. 패스파인더 네트워크는 다차원척도법에 비해서 여러 장점을 가지고 있지만 구축 알고리즘의 복잡도가 매우 높아서 실행 시간이 오래 걸리며, 전통적인 지적 구조 분석에 유용하게 사용되어온 군집분석을 함께 적용하기가 어려운 것이 단점이다. 이 연구에서는 이와 같은 패스파인더 네트워크의 약점을 보완할 수 있는 새로운 기법으로 병렬최근접이웃클러스터링(PNNC) 기법을 제안하였다. PNNC 기법의 클러스터링 성능을 전통적인 계층적 병합식 클러스터링 기법들과 비교해본 결과 효과성과 효율성 양면에서 기존 기법보다 우세한 것으로 확인되었다.

분산 그리드 기법을 위한 연속 k-최근접 질의처리 알고리즘 (Countinuous k-Nearest Neighbor Query Processing Algorithm for Distributed Grid Scheme)

  • 김영창;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권3호
    • /
    • pp.9-18
    • /
    • 2009
  • 최근 GPS 및 무선 이동 컴퓨팅 기술의 발달로 인해, 텔레매틱스(telematics) 및 위치기반 서비스(LBS) 응용이 활발하게 연구되고 있다. 이러한 위치 기반 서비스 응용에서는 이동객체의 위치 정보가 시간의 흐름에 따라 계속적으로 변하기 때문에, 이를 위한 빈번한 업데이트 연산은 시스템에 많은 부하를 가중시키며 이로 인해 검색 성능의 저하를 초래한다. 이를 해결하기 위해 공간 네트워크에서 대용량 이동객체의 위치정보를 분산 처리하기 위한 DS-GRID(distributed S-GRID) 및 이를 위한 k-최근접 질의처리 알 고리즘이 제안되었다[1]. 그러나 k-최근접 질의처리 기법은 질의점 및 이동객체의 위치가 변경되면 그 결과 가 유효하지 않기 때문에, 연속 k-최근접(CKNN:continuous k-nearest neighbor) 질의처리 알고리즘의 연구가 필요하다. 본 연구에서는 DS-GRID를 위한 MCE-CKNN 알고리즘 및 MBP-CKNN 알고리즘을 제안한다. MCE-CKNN 알고리즘은 주어진 경로를 셀 단위로 분할하여 각 셀에서 질의 처리를 병렬적으로 수행하여 검색 성능을 향상시킨다. 아울러 MBP-CKNN 알고리즘은 그리드 셀의 각 경계점에서 가까운 POI를 미리 저장하여 인접셀 탐색 횟수를 줄임으로써 검색 성능을 향상시킨다. 마지막으로, 제안하는 알고리즘의 성능 분석을 통해, 기존 알고리즘보다 15-53% 검색 성능이 우수함을 나타내었다.

  • PDF

세포독성 자료를 이용한 분류 알고리즘 성능 비교 (Comparison of the performance of classification algorithms using cytotoxicity data)

  • 윤여창;정의배;조나래;주수인;이성덕
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.417-426
    • /
    • 2018
  • 최근 동물실험의 대체방법 중 하나로 쥐의 줄기세포 유래 배상체를 이용하여 독성을 시험하는 방법이 개발되었다. 이는 동물에 직접 약물을 주입하는 것이 아닌 배상체 세포에 약물을 투입하여 세포의 변화에 따른 측정값들을 얻는 방법이다. 본 연구에서는 다범주 세포독성 자료를 이용해 통계적 기법인 판별분석(discriminant analysis)과 머신러닝 기법인 서포트 벡터 머신(support vector machine), 인공신경망(artificial neural network), k-인접이웃분류(k-nearest neighbor)의 성능을 비교하였다. 알고리즘의 성능은 분류 정확도(accuracy)와 가중카파계수(weighted Cohen's kappa coefficient)로 비교하였다.

k-NN을 활용한 터보팬 엔진의 잔여 유효 수명 예측 모델 제안 (A Proposal of Remaining Useful Life Prediction Model for Turbofan Engine based on k-Nearest Neighbor)

  • 김정태;서양우;이승상;김소정;김용근
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.611-620
    • /
    • 2021
  • 정비 산업은 사후정비, 예방정비를 거쳐, 상태기반 정비를 중심으로 진행되고 있다. 상태기반 정비는 장비의 상태를 파악하여, 최적 시점에서의 정비를 수행한다. 최적의 정비 시점을 찾기 위해서는 장비의 상태, 즉 잔여 유효 수명을 정확하게 파악하는 것이 중요하다. 이에, 본 논문은 시뮬레이션 데이터(C-MAPSS)를 사용한 터보팬 엔진의 잔여 유효수명(RUL, Remaining Useful Life) 예측 모델을 제시한다. 모델링을 위해 C-MAPSS(Commercial Modular Aero-Propulsion System Simulation) 데이터를 전처리, 변환, 예측하는 과정을 거쳤다. RUL 임계값 설정, 이동평균필터 및 표준화를 통해 데이터 전처리를 수행하였고, 주성분 분석(Principal Component Analysis)과 k-NN(k-Nearest Neighbor)을 활용하여 잔여 유효 수명을 예측하였다. 최적의 성능을 도출하기 위해, 5겹 교차검증기법을 통해 최적의 주성분 개수 및 k-NN의 근접 데이터 개수를 결정하였다. 또한, 사전 예측의 유용성, 사후 예측의 부적합성을 고려한 스코어링 함수(Scoring Function)를 통해 예측 결과를 분석하였다. 마지막으로, 현재까지 제시되어온 뉴럴 네트워크 기반의 알고리즘과 예측 성능 비교 및 분석을 통해 k-NN 활용 모델의 유용성을 검증하였다.

Statistical Analysis of Interacting Dark Matter Halos: On two physically distinct interaction types

  • An, Sung-Ho;Kim, Juhan;Moon, Jun-Sung;Yoon, Suk-Jin
    • 천문학회보
    • /
    • 제46권1호
    • /
    • pp.28.1-28.1
    • /
    • 2021
  • We present a statistical analysis of dark matter halos with interacting neighbors using a set of cosmological simulations. We classify the neighbors into two groups based on the total energy (E12) of the target-neighbor system; flybying neighbors (E12 ≥ 0) and merging ones (E12 < 0). First, we find a different trend between the flyby and merger fractions in terms of the halo mass and large-scale density. The flyby fraction highly depends on the halo mass and environment, while the merger fraction show little dependence. Second, we measure the spin-orbit alignment, which is the angular alignment between the spin of a target halo (${\vec{S}}$ ) and the orbital angular momentum of its neighbor (${\vec{L}}$). In the spin-orbit angle distribution, the flybying neighbors show a weaker prograde alignment with their target halos than the merging neighbors do. With respect to the nearest filament, the flybying neighbor has a behavior different from that of the merging neighbor. Finally, we discuss the physical origin of two interaction types.

  • PDF

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

도로망에서 움직이는 k-최원접 이웃 질의를 위한 일괄 처리 알고리즘 (Batch Processing Algorithm for Moving k-Farthest Neighbor Queries in Road Networks)

  • 조형주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.223-224
    • /
    • 2021
  • Recently, k-farthest neighbor (kFN) queries have not as much attention as k-nearest neighbor (kNN) queries. Therefore, this study considers moving k-farthest neighbor (MkFN) queries for spatial network databases. Given a positive integer k, a moving query point q, and a set of data points P, MkFN queries can constantly retrieve k data points that are farthest from the query point q. The challenge with processing MkFN queries in spatial networks is to avoid unnecessary or superfluous distance calculations between the query and associated data points. This study proposes a batch processing algorithm, called MOFA, to enable efficient processing of MkFN queries in spatial networks. MOFA aims to avoid dispensable distance computations based on the clustering of both query and data points. Moreover, a time complexity analysis is presented to clarify the effect of the clustering method on the query processing time. Extensive experiments using real-world roadmaps demonstrated the efficiency and scalability of the MOFA when compared with a conventional solution.

  • PDF

CPTED기법을 통한 모니터링 시스템 설치위치 시각화 결정법 (Visualized Determination for Installation Location of Monitoring Devices using CPTED)

  • 김주환;남두희
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.145-150
    • /
    • 2015
  • 주안전과 밀접한 CCTV의 요구 및 설치는 날로 증가하고 있다. 그러나 현재 방범 CCTV에 대한 체계적인 계획과 위치타당성 검증에 대한 분석은 전무한 상태에서 단순히 주민들의 요구에 대응하는 수준에 머물고 있다. 단순히 CCTV 밀집도를 늘리면서 시민들의 안전을 강구하는 방법은 한계가 있다. 범죄의 특징 중 하나가 과거 발생지역중심으로 군집하는 현상을 보이며 또한 이런 범죄들은 상호연관성이 강하다. 약 2년간 범죄자료를 Geo-coding하고, 18개의 변수를 사회경제, 도시공간, 범죄방어기재시설물, 범죄발생지표로 대별하여 군집분석과 공간통계분석을 실행하여 5대 범죄와 절도범죄, 폭력범죄, 성폭력범죄가 최근린 분석과 Ripley's K함수에 의해 군집성을 확인하였다. 범죄들의 군집성 검토 후 본 연구에서는 위험지점(Hotspot)에 대한 개념을 정립하고, 위험지점선정에 대한 기법을 고찰한 후 본 연구에 타당한 Nearest Neighbor Hierarchical Spatial Clustering 기법을 활용하여 5대 범죄, 절도범죄, 폭력범죄, 성폭력 범죄의 위험지점을 선정하고 중첩분석을 하여 연구지역내 총 105개 지점의 군집수를 얻을 수 있었다.

맵리듀스를 이용한 그리드 기반 인덱스 생성 및 k-NN 조인 질의 처리 알고리즘 (Grid-based Index Generation and k-nearest-neighbor Join Query-processing Algorithm using MapReduce)

  • 장미영;장재우
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1303-1313
    • /
    • 2015
  • 맵리듀스는 대용량 데이터 처리를 위한 시스템 안정성과 유용성을 제공한다. 맵리듀스 기반 k-최근접점 조인 질의처리 알고리즘은 두 데이터 집합 R과 S를 기반으로 R의 모든 레코드에 대해 S의 데이터 중 가장 인접한 k개의 레코드를 탐색하는 알고리즘으로써, 대용량 데이터 분석을 위한 중요한 질의 처리 알고리즘이다. 그러나 기존 k-최근접점 조인 질의처리 알고리즘은 높은 인덱스 구축비용 문제로 인해 대용량 데이터 처리에 적합하지 않은 문제점을 지닌다. 따라서, 본 논문에서는 그리드 기반 인덱스 생성 및 k-최근접점 질의 처리 알고리즘을 제안한다. 제안하는 기법은 질의 셀로부터 인접한 데이터만을 찾아 맵리듀스 테스크에 전송함으로써 데이터 전송 및 k-최근접점 연산 오버헤드를 줄인다. 성능평가를 통해, 제안하는 기법이 정확 매칭 질의를 제공하는 동시에 기존 기법에 비해 질의 처리 시간 측면에서 최대 7배의 성능을 개선함을 보인다.