• 제목/요약/키워드: nearest neighbors

검색결과 222건 처리시간 0.032초

k-Nearest Neighbors 분류기를 이용한 복합 지표 산불피해 영역 탐지 (Mapping Burned Forests Using a k-Nearest Neighbors Classifier in Complex Land Cover)

  • 이한나;윤공현;김기홍
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.883-896
    • /
    • 2023
  • 인간 활동 영역이 산지 곳곳에 퍼져 있는 한국에서는 산불이 주거지역이나 각종 시설물을 위협하는 경우가 잦다. 따라서 산불 이후 대책 마련과 피해 복구를 위해 피해 범위를 빠르게 파악할 필요가 있으며, 이러한 경우 원격탐사가 유용한 도구가 될 수 있다. 본 연구에서는 2019년 4월에 발생한 고성·속초 산불 피해지역에 k-nearest neighbor (kNN) 알고리즘을 적용하여 피해 범위를 탐지하는 실험을 수행하였다. 다양한 인공지물을 포함하는 지표와 숲이 혼재된 지역 특성을 고려하여 적절한 공간 해상도와 시간 해상도를 제공하는 Sentinel-2 multispectral instrument (MSI) 자료를 사용하였다. Sentinel-2 MSI의 여섯 밴드와 정규식생지수(NDVI), 정규탄화지수(NBR)를 분류 특성으로 사용하였다. 산불 피해지역과 비피해 지역에서 무작위로 추출된 2,000개 지점 정보를 이용하여 kNN 분류기를 훈련시켰다. 분류 성능을 높이기 위해 데이터에서 특이값을 제거하고 임상도를 병용하였다. 다양한 이웃(neighbor) 수와 분류 특성 조합을 적용하여 산불 후 데이터를 이용한 실험과 산불 전후 데이터 차이를 이용한 실험을 수행하였다. 산불 전후 데이터 차이를 이용하였을 때 더 우수한 분류 성과를 얻을 수 있었지만, 산불 후 데이터만을 이용한 경우에도 피해지역의 범위를 파악할 수 있었다.

이동 객체 환경에서 거리 관계 패턴 기반 k-최근접 질의 처리 기법 (A k-NN Query Processing Method based on Distance Relation Patterns in Moving Object Environments)

  • 박용훈;서동민;복경수;이병엽;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.215-225
    • /
    • 2009
  • 최근 유클리드 공간 상에서 효율적인 k-최근접(k-Nearest Neighbors) 질의 처리를 위해 그리드 구조 기반의 많은 색인 기법들이 연구되었다. 하지만 기존 기법들은 k-최근접 객체들을 연산하기 위해 불필요한 셀을 접근하여 연산 자원을 낭비하거나 근접한 셀을 알아내는데 매우 큰 연산 비용을 초래한다. 그래서 본 논문에서는 한 셀과 주변 셀과의 거리 관계를 나타내는 거리 관계 패턴을 이용하여 k-최근접 질의 처리시 적은 연산 비용과 적은 저장 공간을 사용하는 새로운 k-최근접 질의 처리 기법을 제안한다. 본 논문에서는 k-최근접 질의 처리의 대표적인 기법인 CPM과 성능을 비교하여 제안하는 기법의 우수성을 입증한다.

Statistical Analysis of Interacting Dark Matter Halos: On two physically distinct interaction types

  • An, Sung-Ho;Kim, Juhan;Moon, Jun-Sung;Yoon, Suk-Jin
    • 천문학회보
    • /
    • 제46권1호
    • /
    • pp.28.1-28.1
    • /
    • 2021
  • We present a statistical analysis of dark matter halos with interacting neighbors using a set of cosmological simulations. We classify the neighbors into two groups based on the total energy (E12) of the target-neighbor system; flybying neighbors (E12 ≥ 0) and merging ones (E12 < 0). First, we find a different trend between the flyby and merger fractions in terms of the halo mass and large-scale density. The flyby fraction highly depends on the halo mass and environment, while the merger fraction show little dependence. Second, we measure the spin-orbit alignment, which is the angular alignment between the spin of a target halo (${\vec{S}}$ ) and the orbital angular momentum of its neighbor (${\vec{L}}$). In the spin-orbit angle distribution, the flybying neighbors show a weaker prograde alignment with their target halos than the merging neighbors do. With respect to the nearest filament, the flybying neighbor has a behavior different from that of the merging neighbor. Finally, we discuss the physical origin of two interaction types.

  • PDF

공간 데이터베이스 시스템에서 근사 k-최대근접질의의 처리방법 (The Method to Process Approximate k-Nearest Neighbor Queries in Spatial Database Systems)

  • 선휘준;김홍기
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권4호
    • /
    • pp.443-448
    • /
    • 2003
  • 공간 데이터베이스 시스템에서는 주어진 위치에서 가장 근접한 k개의 객체를 찾는 근사 k-최대 근접질의가 자주 발생한다. 근사 k-최대 근접 질의의 성능을 높이기 위해서는 색인에서 검색되는 노드의 수를 최소화할 수 있어야 한다. 본 논문에서는 기존의 알고리즘을 확장하여 동적인 공간 데이터베이스 환경에서 R-트리 유형의 색인 구조를 이용한 근사 k-최대 근접 질의 처리방법을 제안하고 그 성능을 평가 한다. 실험결과에 의하면, 제안된 방법은 객체의 분포 형태, 질의 크기 그리고 근사율에 관계없이 항상 낮은 디스크 접근 횟수를 보였다.

  • PDF

기계학습 알고리즘을 이용한 소프트웨어 취약 여부 예측 시스템 (Software Vulnerability Prediction System Using Machine Learning Algorithm)

  • 최민준;김주환;윤주범
    • 정보보호학회논문지
    • /
    • 제28권3호
    • /
    • pp.635-642
    • /
    • 2018
  • 4차 산업혁명 시대에 우리는 소프트웨어 홍수 속에 살고 있다. 그러나, 소프트웨어의 증가는 필연적으로 소프트웨어 취약점 증가로 이어지고 있어 소프트웨어 취약점을 탐지 및 제거하는 작업이 중요하게 되었다. 현재까지 소프트웨어 취약 여부를 예측하는 연구가 진행되었지만, 탐지 시간이 오래 걸리거나, 예측 정확도가 높지 않았다. 따라서 본 논문에서는 기계학습 알고리즘을 이용하여 소프트웨어의 취약 여부를 효율적으로 예측하는 방법을 설명하며, 다양한 기계학습 알고리즘을 이용한 실험 결과를 비교한다. 실험 결과 k-Nearest Neighbors 예측 모델이 가장 높은 예측률을 보였다.

A Study of Environmental Effects on Galaxy Spin Using MaNGA Data

  • Lee, Jong Chul;Hwang, Ho Seong;Chung, Haeun
    • 천문학회보
    • /
    • 제42권2호
    • /
    • pp.47.2-47.2
    • /
    • 2017
  • We investigate the environmental effects on galaxy spin using the sample of ~1100 galaxies from the first public data of MaNGA integral field unit survey. We determine the spin parameter ${\lambda}_{Re}$ of galaxies by analyzing the two-dimensional stellar kinematic measurements within the effective radius, and study its dependence on the large-scale (background mass density determined with 20 nearby galaxies) and small-scale (distance to and morphology of the nearest neighbor galaxy) environments. We first examine the mass dependence of galaxy spin, and find that the spin parameter decreases with stellar mass at log ($M_{\ast}/M_{\odot}$) > 10, consistent with previous studies. We then divide the galaxies into three subsamples using their stellar masses to minimize the mass effects on galaxy spin. The spin parameter of galaxies in each subsample does not change with the background density, but do change with the distance to and morphology of the nearest neighbor. The spin parameter increases when late-type neighbors are within the virial radius, and decreases when early-type neighbors are within the virial radius. These results suggest that the large-scale environments hardly affect the galaxy spin, but the effects of small-scale environments such as hydrodynamic galaxy-galaxy interactions are substantial.

  • PDF

유전자 알고리즘을 이용한 사례기반추론 시스템의 최적화: 주식시장에의 응용 (Optimization of Case-based Reasoning Systems using Genetic Algorithms: Application to Korean Stock Market)

  • 김경재;안현철;한인구
    • Asia pacific journal of information systems
    • /
    • 제16권1호
    • /
    • pp.71-84
    • /
    • 2006
  • Case-based reasoning (CBR) is a reasoning technique that reuses past cases to find a solution to the new problem. It often shows significant promise for improving effectiveness of complex and unstructured decision making. It has been applied to various problem-solving areas including manufacturing, finance and marketing for the reason. However, the design of appropriate case indexing and retrieval mechanisms to improve the performance of CBR is still a challenging issue. Most of the previous studies on CBR have focused on the similarity function or optimization of case features and their weights. According to some of the prior research, however, finding the optimal k parameter for the k-nearest neighbor (k-NN) is also crucial for improving the performance of the CBR system. In spite of the fact, there have been few attempts to optimize the number of neighbors, especially using artificial intelligence (AI) techniques. In this study, we introduce a genetic algorithm (GA) to optimize the number of neighbors to combine. This study applies the novel approach to Korean stock market. Experimental results show that the GA-optimized k-NN approach outperforms other AI techniques for stock market prediction.

재귀 분할 평균 법을 이용한 새로운 메모리기반 추론 알고리즘 (A New Memory-Based Reasoning Algorithm using the Recursive Partition Averaging)

  • 이형일;정태선;윤충화;강경식
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1849-1857
    • /
    • 1999
  • 메모리 기반 추론에서 기억공간의 효율적인 사용과 분류성능의 향상을 위하여, 재귀 분할 평균 기법을 제안하였다. 이 알고리즘은 패턴공간을 구성하는 각 초월 평면이 동일한 클래스소속으로 패턴으로 구성될 때까지 재귀적으로 분할한 후, 초월 평면별로 소속된 패턴들의 평균값을 계산하여 대표패턴을 추출한다. 또한 각 특징과 클래스간의 상호정보를 특징의 가중치로 사용하여 분류 성능의 향상을 시도하였다. 제안된 알고리즘은 k-NN(k-Nearest Neighbors) 분류기에서 필요로 하는 메모리 공간의 30~90%만을 사용하며, 분류에 있어서도 k-NN과 유사한 인식 성능을 보이고 있다. 또한 저장된 패턴 개수의 감소로 인하여, 실제 분류에 소요되는 시간에 있어서도 k-NN보다 월등히 우수한 성능을 보이고 있다.

  • PDF

Deterministic and probabilistic analysis of tunnel face stability using support vector machine

  • Li, Bin;Fu, Yong;Hong, Yi;Cao, Zijun
    • Geomechanics and Engineering
    • /
    • 제25권1호
    • /
    • pp.17-30
    • /
    • 2021
  • This paper develops a convenient approach for deterministic and probabilistic evaluations of tunnel face stability using support vector machine classifiers. The proposed method is comprised of two major steps, i.e., construction of the training dataset and determination of instance-based classifiers. In step one, the orthogonal design is utilized to produce representative samples after the ranges and levels of the factors that influence tunnel face stability are specified. The training dataset is then labeled by two-dimensional strength reduction analyses embedded within OptumG2. For any unknown instance, the second step applies the training dataset for classification, which is achieved by an ad hoc Python program. The classification of unknown samples starts with selection of instance-based training samples using the k-nearest neighbors algorithm, followed by the construction of an instance-based SVM-KNN classifier. It eventually provides labels of the unknown instances, avoiding calculate its corresponding performance function. Probabilistic evaluations are performed by Monte Carlo simulation based on the SVM-KNN classifier. The ratio of the number of unstable samples to the total number of simulated samples is computed and is taken as the failure probability, which is validated and compared with the response surface method.

The Role of Data Technologies with Machine Learning Approaches in Makkah Religious Seasons

  • Waleed Al Shehri
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.26-32
    • /
    • 2023
  • Hajj is a fundamental pillar of Islam that all Muslims must perform at least once in their lives. However, Umrah can be performed several times yearly, depending on people's abilities. Every year, Muslims from all over the world travel to Saudi Arabia to perform Hajj. Hajj and Umrah pilgrims face multiple issues due to the large volume of people at the same time and place during the event. Therefore, a system is needed to facilitate the people's smooth execution of Hajj and Umrah procedures. Multiple devices are already installed in Makkah, but it would be better to suggest the data architectures with the help of machine learning approaches. The proposed system analyzes the services provided to the pilgrims regarding gender, location, and foreign pilgrims. The proposed system addressed the research problem of analyzing the Hajj pilgrim dataset most effectively. In addition, Visualizations of the proposed method showed the system's performance using data architectures. Machine learning algorithms classify whether male pilgrims are more significant than female pilgrims. Several algorithms were proposed to classify the data, including logistic regression, Naive Bayes, K-nearest neighbors, decision trees, random forests, and XGBoost. The decision tree accuracy value was 62.83%, whereas K-nearest Neighbors had 62.86%; other classifiers have lower accuracy than these. The open-source dataset was analyzed using different data architectures to store the data, and then machine learning approaches were used to classify the dataset.