• 제목/요약/키워드: nearest-neighbor analysis

검색결과 254건 처리시간 0.021초

기계학습기법을 이용한 땅밀림 위험등급 분류 (Classification of Soil Creep Hazard Class Using Machine Learning)

  • 이기하;레수안히엔;연민호;서준표;이창우
    • 한국방재안전학회논문집
    • /
    • 제14권3호
    • /
    • pp.17-27
    • /
    • 2021
  • 본 연구에서는 6개의 기계학습 기법들을 활용하여 2019년과 2020년 전국 땅밀림 현장조사 결과를 기반으로 땅밀림 위험지역을 A부터 C까지 3개 등급(A등급: 위험, B등급: 보통, C등급: 양호)으로 구분할 수 있는 분류모형을 구축하고, 분류 정확도를 비교·분석한다. 기계학습 기법으로는 K-Nearest Neighbor, Support Vector Machine, Logistic Regression, Decision Tree, Random Forest, Extreme Gradient Boosting 총 6개를 적용하였다. 분류 정확도 분석결과, 6개의 기법 모두 0.9 이상의 우수한 정확도를 보여주었다. 수치형 자료를 학습에 적용한 경우가, 문자형 자료를 학습한 모형보다 우수한 성능을 나타냈으며, 현장조사 평가점수 자료군(C1~C4) 보다는 전문가의견이 반영된 평가점수 자료군(R1~R4)으로 학습한 모형이 정확도가 높은 것으로 분석되었다. 특히, 직접징후와 간접징후 정보를 학습에 반영한 경우가 예측정확도가 높게 나타났다. 향후 땅밀림 현장조사 자료가 지속적으로 확보될 경우, 본 연구에서 활용한 기계학습기법은 땅밀림 분류를 위한 도구로 활용이 가능할 것으로 판단된다.

땅밀림 위험지 평가를 위한 기계학습 분류모델 비교 (A Performance Comparison of Machine Learning Classification Methods for Soil Creep Susceptibility Assessment)

  • 이제만;서정일;이진호;임상준
    • 한국산림과학회지
    • /
    • 제110권4호
    • /
    • pp.610-621
    • /
    • 2021
  • 지진 발생과 집중호우에 의해 땅밀림형 산사태 유형으로 분류되는 땅밀림 현상이 전국적으로 광범위하게 나타나고 있다. 산림청은 땅밀림으로 인한 인명 및 재산 피해를 예방하기 위해 땅밀림 우려지 현장조사 판정표를 통해 땅밀림 발생 위험지를 사전에 파악하고 있다. 한편 최근에는 컴퓨터 기술의 발달로 인공지능의 한 분야인 기계학습 분류기법을 이용하여 산지재해 취약성을 평가하거나 자연재해를 예측하고 있다. 따라서 이 연구에서는 기계학습 분류기법인 k-Nearest Neighbor(k-NN), Naive Bayes(NB), Random Forest(RF), 그리고 Support Vector Machine(SVM) 분류모델을 이용하여 땅밀림 발생 위험등급을 분류하였다. 한국치산기술협회의 2018~2020년 조사 자료 4,618개 중에서 땅밀림 현상의 발생 여부를 고려하여 발생지 총 146개소, 그리고 미발생지 146개소를 임의추출하여 292개 자료를 선정하였으며, 이 중 70%에 해당하는 204개소 자료를 훈련자료로 하여 모델을 구축하였다. 전체 자료의 30%에 해당하는 88개 검증자료에 대해 모델을 평가한 결과, k-NN은 0.727, NB는 0.750, RF는 0.807, 그리고 SVM은 0.750의 분류정확도를 보였다. 또한, Kappa 상관계수는 각각 0.534, 0.580, 0.673 및 0.585, 그리고 AUC는 각각 0.872, 0.912, 0.943 및 0.834로 계산되었다. 따라서 땅밀림 위험지역 판정을 위한 기계학습 분류모델은 RF, NB, SVM, 그리고 k-NN 순으로 높은 성능을 보였다. 기계학습 분류모델은 향후 산지토사재해의 예방 및 대응을 위한 기초자료로 활용 가능하며, 땅밀림 재해 관리 및 피해 경감에 위한 정책 개발에 필요한 정보를 제공할 것이다.

공공 다중CCTV 기반에서 재식별 기술을 활용한 특정대상 탐지 및 추적기법 구현 (Implementation of Specific Target Detection and Tracking Technique using Re-identification Technology based on public Multi-CCTV)

  • 황주성;뉴엔탄하이;강수경;김영규;김주용;정명석;이주연
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.49-57
    • /
    • 2022
  • 정부에서는 전국에 설치된 공공 CCTV를 이용하여 실종아동 등 범죄 예방을 위하여 많은 노력을 하고 있다. 하지만, 운용인력의 부족과 장시간 집중에 따른 집중력 약화 그리고 추적의 어려움 등이 나타나고 있다. 또한, 딥러닝 알고리즘을 통하여 실시간 객체 탐색 및 재인식 그리고 추적을 적용하는 것은 복잡한 신경망 분석의 사유로 파라미터가 증가하고 속도감소 메모리 부족이라는 현상을 나타냈다. 본 논문에서는 실시간 객체 인식이 가능한 Yolo의 적용과 Batch 및 TensorRT 기술 적용을 통하여 신경망을 경량화를 통하여 속도 개선 및 메모리 절약이 가능하도록 설계하였다. 이 논문에서는 이러한 발전된 알고리즘의 연구를 바탕으로 K-reciprocal nearest neighbor 알고리즘, Jaccard distance 비유사도 측정 알고리즘, 산출물 알고리즘 등을 개발하여 공공 CCTV 식별추적시스템 구축을 제시하였다. 그 결과, 비교분석을 통한 알고리즘 조합을 통해 공공 다중CCTV환경에서 실시간으로 객체를 인식하고 재식별하여 객체를 추적할 수 있는 한국형 공공 추적시스템을 제안하였다.

Measurements and Analysis of Fingerprinting Structures for WLAN Localization Systems

  • Al KhanbashI, Nuha;Al Sindi, Nayef;Ali, Nazar;Al-Araji, Saleh
    • ETRI Journal
    • /
    • 제38권4호
    • /
    • pp.634-644
    • /
    • 2016
  • Channel-based radio-frequency fingerprinting such as a channel impulse response (CIR), channel transfer function (CTF), and frequency coherence function (FCF) have been recently proposed to improve the accuracy at the physical layer; however, their empirical performance, advantages, and limitations have not been well reported. This paper provides a comprehensive empirical performance evaluation of RF location fingerprinting, focusing on a comparison of received-signal strength, CIR-, CTF-, and FCF-based fingerprinting using the weighted k-nearest neighbor pattern recognition technique. Frequency domain channel measurements in the IEEE 802.11 band taken on a university campus were used to evaluate the accuracy of the fingerprinting types and their robustness to human-induced motion perturbations of the channel. The localization performance was analyzed, and the results are described using the spatial and temporal radio propagation characteristics. In particular, we introduce the coherence region to explain the spatial properties and investigate the impact of the Doppler spread in time-varying channels on the time coherence of RF fingerprint structures.

스마트 기기 환경에서 전력 신호 분석을 통한 프라이버시 침해 위협 (Threatening privacy by identifying appliances and the pattern of the usage from electric signal data)

  • 조재연;윤지원
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1001-1009
    • /
    • 2015
  • 스마트 그리드 안에서 고안된 스마트 미터는 우리가 사용하는 전력 신호를 실시간으로 데이터화해서 전력 공급단의 메인 서버로 전송한다. 이를 통해 전력 관리의 효율성은 증가한 반면, 사용자의 정보를 담은 데이터의 보안 문제가 새로운 위협으로 부상하였다. 본 논문은 스마트 미터에서 추출한 전력 데이터를 통해 가정 내 기기의 식별 및 기기별 사용패턴에 대한 추론을 보안 관점에서 해석함으로써 스마트 기기 환경에서 데이터 노출의 위협을 지적한다. 주성분분석(Principal Component Analysis)으로 데이터의 특징을 추출하였고 k-근접 이웃(k- Nearest Neighbor)분류기로 기기를 식별하고 기기상태를 추론하였으며, 검증방법으로는 10차 교차검증(10-fold Cross Validation)을 활용하였다.

Variations in Sweetpotato Regenerates from Gamma-ray Irradiated Embryogenic Callus

  • Lee, Young-Ill;Lee, In-Sok;Lim, Yong-Pyo
    • Journal of Plant Biotechnology
    • /
    • 제4권4호
    • /
    • pp.163-170
    • /
    • 2002
  • Radiation induced and somaclonal variations were investigated in the regenerates from gamma irradiated and controlled embryogenic callus (EC) of sweetpotato cvs., Yulmi and White Star by morphological, RAPD and AFLP analysis. Most (approx. 90%) of the EC produced somatic embryos developed into plantlets after being transferred to the auxin-free medium. The frequency of morphological variants derived from the irradiated callus ranged from 3 to 7.8% compared to 0.1-1.1% of that derived from the non-irradiated. Morphological variants were selected from the regenerates and analyzed by RAPD and AFLP procedures. RAPD polymorphisms of Yulmi and White Star regenerates from irradiated calli were 8.8% and 6.1%, respectively. However, the polymerphisms among regenerates from the non-irradiation treatment in these two cultivars were non-detectable and 3%, respectively. AFLP polymorphisms of Yulmi and White Star regenerates from irradiated calli were 29.9% and 28.6%, respectively. while the frequencies for those form non-irradiated calli were 8.5% and 5.6%, respectively. Both the control plants and variants from the nonirradiated were clustered together, while variants from irradiated were separated from the group by Nearest-Neighbor-Interchange Branch Swapping Abbreviation: EC (Embryogenic callus), AFLP (Amplified Fragment Length Polymorphism), RAPD (Random amplified polymorphic DNA)

거리 기반 유사도 측정을 통한 유방 초음파 영상의 내용 기반 검색 컴퓨터 보조 진단 시스템에 관한 연구 (A Study of CBIR(Content-based Image Retrieval) Computer-aided Diagnosis System of Breast Ultrasound Images using Similarity Measures of Distance)

  • 김민정;조현종
    • 전기학회논문지
    • /
    • 제66권8호
    • /
    • pp.1272-1277
    • /
    • 2017
  • To assist radiologists for the characterization of breast masses, Computer-aided Diagnosis(CADx) system has been studied. The CADx system can improve the diagnostic accuracy of radiologists by providing objective information about breast masses. Morphological and texture features were extracted from the breast ultrasound images. Based on extracted features, the CADx system retrieves masses that are similar to a query mass from a reference library using a k-nearest neighbor (k-NN) approach. Eight similarity measures of distance, Euclidean, Chebyshev(Minkowski family), Canberra, Lorentzian($F_2$ family), Wave Hedges, Motyka(Intersection family), and Cosine, Dice(Inner Product family) are evaluated by ROC(Receiver Operating Characteristic) analysis. The Inner Product family measure used with the k-NN classifier provided slightly higher performance for classification of malignant and benign masses than those with the Minkowski, $F_2$, and Intersection family measures.

공간 네트워크에서 이동객체의 위치정보 관리를 위한 동적 분산 그리드 기법 (Dynamic Distributed Grid Scheme to Manage the Location-Information of Moving Objects in Spatial Networks)

  • 김영창;홍승태;조경진;장재우
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.948-952
    • /
    • 2009
  • 최근 공간 네트워크에서 대용량 이동객체의 위치정보를 관리하기 위한 DS-GRID(distributed S-GRID)가 제안되었다[1]. 그러나 DS-GRID는 균일 크기의 그리드 셀을 이용하기 때문에, 실제 응용에서 빈번히 발생하는 이동 객체의 쏠림 현상을 효율적으로 관리하지 못하는 단점을 지닌다. 이를 해결하기 위해, 본 논문에서는 이동객체의 밀도에 따라 그리드 셀을 동적으로 분할하는 동적 분산 그리드 기법을 제안한다. 아울러 이를 위한 k-최근접 질의처리 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 이동객체의 쏠림 현상이 발생하였을 경우, 제안하는 동적 분산 그리드 기법이 검색 및 업데이트 성능 측면에서 DS-GRID 보다 우수함을 입증한다.

메모리 기반의 기계 학습을 이용한 한국어 문장 경계 인식 (Korean Sentence Boundary Detection Using Memory-based Machine Learning)

  • 한군희;임희석
    • 한국콘텐츠학회논문지
    • /
    • 제4권4호
    • /
    • pp.133-139
    • /
    • 2004
  • 본 논문은 기계 학습 기법 중에서 메모리 기반 학습을 사용하여 범용의 학습 가능한 한국어 문장 경계 인식기를 제안한다. 제안한 방법은 메모리 기반 학습 알고리즘 중 최근린 이웃(kNN) 알고리즘을 사용하였으며, 이웃들을 이용한 문장 경계 결정을 위한 스코어 값 계산을 위한 다양한 가중치 방법을 적용하여 이들을 비교 분석하였다 문장 경계 구분을 위한 자질로는 특정 언어나 장르에 제한적이지 않고 범용으로 적용될 수 있는 자질만을 사용하였다. 성능 실험을 위하여 ETRI 코퍼스와 KAIST 코퍼스를 사용하였으며, 성능 척도로는 정확도와 재현율이 사용되었다. 실험 결과 제안한 방법은 적은 학습 코퍼스만으로도 $98.82\%$의 문장 정확률과 $99.09\%$의 문장 재현율을 보였다.

  • PDF

microRNA 발현 데이터의 상관관계 분석을 통한 microRNA Functional Family 탐색 (Defining microRNA functional families through correlation analysis of microRNA microarray data)

  • 남진우;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.13-15
    • /
    • 2006
  • microRNA는 유전자의 전사 후 과정에서 negative regulation을 담당하는 small noncoding RNA의 한 증류이다. 최근까지 330여개의 인간 microRNA가 발견되었지만 그들의 기능이 밝혀진 것은 소수에 불과하다. microRNA의 기능은 3'UTR에 불완전 상보결합을 통해 negative regulation을 받게 되는 유전자의 기능으로부터 유추되는 것이 일반적이다. 특별히 유전체상에 군집화 된 microRNA들은 하나의 전사체로부터 발현되는 것으로 판단되며, 같은 또는 관련된 기능을 하거나 같은 목표 유전자를 조절하기 위한 functional family일 가능성이 높다. 또한 이러한 functional family는 하나의 전사체로부터 발현되기 때문에, 조직별로 조건별로 같은 발현 패턴을 보여야 한다. 본 연구에서는 발현데이터로부터 microRNA functional family를 탐색하기 위해, 5개의 연구 그룹에서 공개한 조직별 microRNA 발현데이터를 표준화 작업을 거친 후 통합하고 k-nearest neighbor 알고리즘을 이용해 결측치를 보정한 후 microRNA 발현사이의 correlation을 계산한다. 이때 데이터 통합에서 생기는 문제에 robust한 결과를 얻기 위해 실제 발현데이터가 아닌 rank 데이터부터 correlation을 측정한다. 계산된 spearman ranked correlation 결과와 microRNA의 genomic coordination 정보로부터 34개의 functional family를 정의할 수 있었다.

  • PDF