• 제목/요약/키워드: K-nearest neighbor technique

검색결과 77건 처리시간 0.025초

Supervised learning and frequency domain averaging-based adaptive channel estimation scheme for filterbank multicarrier with offset quadrature amplitude modulation

  • Singh, Vibhutesh Kumar;Upadhyay, Nidhi;Flanagan, Mark;Cardiff, Barry
    • ETRI Journal
    • /
    • 제43권6호
    • /
    • pp.966-977
    • /
    • 2021
  • Filterbank multicarrier with offset quadrature amplitude modulation (FBMC-OQAM) is an attractive alternative to the orthogonal frequency division multiplexing (OFDM) modulation technique. In comparison with OFDM, the FBMC-OQAM signal has better spectral confinement and higher spectral efficiency and tolerance to synchronization errors, primarily due to per-subcarrier filtering using a frequency-time localized prototype filter. However, the filtering process introduces intrinsic interference among the symbols and complicates channel estimation (CE). An efficient way to improve the CE in FBMC-OQAM is using a technique known as windowed frequency domain averaging (FDA); however, it requires a priori knowledge of the window length parameter which is set based on the channel's frequency selectivity (FS). As the channel's FS is not fixed and not a priori known, we propose a k-nearest neighbor-based machine learning algorithm to classify the FS and decide on the FDA's window length. A comparative theoretical analysis of the mean-squared error (MSE) is performed to prove the proposed CE scheme's effectiveness, validated through extensive simulations. The adaptive CE scheme is shown to yield a reduction in CE-MSE and improved bit error rates compared with the popular preamble-based CE schemes for FBMC-OQAM, without a priori knowledge of channel's frequency selectivity.

MapReduce 환경에서 재그룹핑을 이용한 Locality Sensitive Hashing 기반의 K-Nearest Neighbor 그래프 생성 알고리즘의 개선 (An Improvement in K-NN Graph Construction using re-grouping with Locality Sensitive Hashing on MapReduce)

  • 이인희;오혜성;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.681-688
    • /
    • 2015
  • k-Nearest Neighbor(k-NN)그래프는 모든 노드에 대한 k-NN 정보를 나타내는 데이터 구조로써, 협업 필터링, 유사도 탐색과 여러 정보검색 및 추천 시스템에서 k-NN그래프를 활용하고 있다. 이러한 장점에도 불구하고 brute-force방법의 k-NN그래프 생성 방법은 $O(n^2)$의 시간복잡도를 갖기 때문에 빅데이터 셋에 대해서는 처리가 곤란하다. 따라서, 고차원, 희소 데이터에 효율적인 Locality Sensitive Hashing 기법을 (key, value)기반의 분산환경인 MapReduce환경에서 사용하여 k-NN그래프를 생성하는 알고리즘이 연구되고 있다. Locality Sensitive Hashing 기법을 사용하여 사용자를 이웃후보 그룹으로 만들고 후보내의 쌍에 대해서만 brute-force하게 유사도를 계산하는 two-stage 방법을 MapReduce환경에서 사용하였다. 특히, 그래프 생성과정 중 유사도 계산하는 부분이 가장 많은 시간이 소요되므로 후보 그룹을 어떻게 만드는 것인지가 중요하다. 기존의 방법은 사이즈가 큰 후보그룹을 방지하는데 한계점이 있다. 본 논문에서는 효율적인 k-NN 그래프 생성을 위하여 사이즈가 큰 후보그룹을 재구성하는 알고리즘을 제시하였다. 실험을 통해 본 논문에서 제안한 알고리즘이 그래프의 정확성, Scan Rate측면에서 좋은 성능을 보임을 확인하였다.

사례기반 추론을 이용한 한글 문서분류 시스템 (A Hangul Document Classification System using Case-based Reasoning)

  • 이재식;이종운
    • Asia pacific journal of information systems
    • /
    • 제12권2호
    • /
    • pp.179-195
    • /
    • 2002
  • In this research, we developed an efficient Hangul document classification system for text mining. We mean 'efficient' by maintaining an acceptable classification performance while taking shorter computing time. In our system, given a query document, k documents are first retrieved from the document case base using the k-nearest neighbor technique, which is the main algorithm of case-based reasoning. Then, TFIDF method, which is the traditional vector model in information retrieval technique, is applied to the query document and the k retrieved documents to classify the query document. We call this procedure 'CB_TFIDF' method. The result of our research showed that the classification accuracy of CB_TFIDF was similar to that of traditional TFIDF method. However, the average time for classifying one document decreased remarkably.

Landsat TM 위성영상과 비율영상을 적용한 지상부 탄소 저장량 추정 - $k$NN 알고리즘 및 회귀 모델을 중점적으로 (Estimation of Aboveground Biomass Carbon Stock Using Landsat TM and Ratio Images - $k$NN algorithm and Regression Model Priority)

  • 유수홍;허준;정재훈;한수희;김경민
    • 대한공간정보학회지
    • /
    • 제19권2호
    • /
    • pp.39-48
    • /
    • 2011
  • 대기 중 온실가스 증가로 인한 지구온난화의 영향으로 각종 자연 재해가 증가하면서, 온실가스에서 가장 큰 비율을 차지하는 이산화탄소의 자연 포집지인 산림이 저장하고 있는 탄소량을 추정하기 위한 많은 연구가 진행 중에 있다. 하지만 국내 지역의 환경에 적합한 탄소저장량 추정 기법 및 자료 선정에 대한 연구는 아직 부족한 상황으로, 이에 대한 연구가 요구되고 있다. 본 논문에서는 전 세계적으로 탄소저장량 추정에 보편적으로 이용되고 있는 회귀 모델과 $k$NN($k$-Nearest Neighbor) 알고리즘을 이용하여 충청북도 단양군을 대상으로 산림이 저장하고 있는 탄소 저장량을 추정하고 결과를 비교 분석하였다. 연구 자료로써 Landsat TM 영상과 제5차 NFI(National Forest Inventory) 자료를 이용하였으며, 지형효과 보정 및 식생 구분에 특화된 다양한 비율영상을 사용하였다. 분석 결과, 단양군의 탄소저장량 추정에는 회귀 모델보다 $k$NN 알고리즘을 이용하는 것이 더 유리하며, 비율영상의 경우 정확도 향상에 큰 영향을 미치지 않는 것으로 나타났다.

WLAN 실내 측위 결정을 위한 KNN/PFCM Hybrid 알고리즘 (KNN/PFCM Hybrid Algorithm for Indoor Location Determination in WLAN)

  • 이장재;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.146-153
    • /
    • 2010
  • 무선 네트워크 기반 실내 측위는 측위를 위한 특수 장비를 필요로 하지 않고, Fingerprinting 방식은 무선 네트워크 기반 측위를 위한 기술 중에서 가장 정확도가 높기 때문에 무선 네트워크 Fingerprinting 방식이 가장 적당한 실내 측위 방법이다. Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은k개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 PFCM 군집화를 적용한 KNN과 PFCM을 혼합한 알고리즘을 제안하였다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 PFCM에 적용하여k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/PFCM 알고리즘이 KNN과 KNN/FCM 알고리즘보다 성능이 우수하다.

데이터 보강을 위한 데이터 통합기법에 관한 연구 (A Study on the Data Fusion for Data Enrichment)

  • 정성석;김순영;김현진
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.605-617
    • /
    • 2004
  • 데이터마이닝에서 가장 중요한 요소 중 하나는 마이닝에 사용될 데이터의 질이다. 질 높은 데이터를 바탕으로 마이닝이 수행될 때, 데이터마이닝의 잠재적 가치는 증대될 것이다. 본 논문에서는 지식발견 과정 중 데이터의 질을 향상시키기 위한 한 단계인 데이터 보강을 위해 데이터 통합 기법을 제안하고, 모의실험을 통해 제안된 알고리즘의 효율성을 비교하였다. 실험결과 제안된 알고리즘이 데이터 통합의 성능을 향상시킴을 알 수 있었다.

Genetic Algorithm과 다중부스팅 Classifier를 이용한 암진단 시스템 (Cancer Diagnosis System using Genetic Algorithm and Multi-boosting Classifier)

  • 온승엽;지승도
    • 한국시뮬레이션학회논문지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2011
  • 생물 및 의학계에서는 생물정보학(bioinformatics)의 데이터 중 혈청 단백질(proteome)에서 추출한 데이터가 질병의 진단에 관련된 정보를 가지고 있고, 이 데이터를 분류 분석함으로 질병을 조기에 진단 할 수 있다고 믿고 있다. 본 논문에서는 혈청 단백질(2-D PAGE: Two-dimensional polyacrylamide gel electrophoresis)로부터 암과 정상을 판별하는 새로운 복합분류기를 제안한다. 새로운 복합 분류기에서는 support vector machine(SVM)와 다층 퍼셉트론(multi-layer perceptron: MLP)와 k-최근 접 이웃(k-nearest neighbor: k-NN)분류기를 앙상블(ensemble) 방법으로 통합하는 동시에 다중 부스팅(boosting) 방법으로 각 분류기를 확장하여 부분류기(subclassifier)의 배열(array)으로서 복합분류기를 구성하였다. 각 부분류기에서는 최적 특성 집합 (feature set)을 탐색하기 위하여 유전 알고리즘(genetic algorithm: GA)를 적용하였다. 복합분류기의 성능을 측정하기 위하여 암연구에서 얻어진 임상 데이터를 복합분류기에 적용하였고 결과로서 단일 분류기 보다 높은 분류 정확도와 안정성을 보여 주었다.

빅데이터 환경에서 기계학습 알고리즘 응용을 통한 보안 성향 분석 기법 (Security tendency analysis techniques through machine learning algorithms applications in big data environments)

  • 최도현;박중오
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.269-276
    • /
    • 2015
  • 최근 빅데이터 관련 산업 활성화에 따라 글로벌 보안 업체들은 지능적인 보안 위협 모니터링과 예방을 위해 분석 데이터의 범위를 정형/비정형 데이터로 확대하고, 보안 예방을 목적으로 사용자의 성향 분석 기법을 활용하려는 추세이다. 이는 기존 정형 데이터(기존 수치화 가능한 자료)의 분석 결과에서 추론할 수 있는 정보의 범위가 한정적이기 때문이다. 본 논문은 빅데이터 환경에서 기계학습 알고리즘($Na{\ddot{i}}ve$ Bayes, Decision Tree, K-nearest neighbor, Apriori)을 효율적으로 응용하여 보안 성향(목적 별 항목 분류, 긍정 부정 판단, 핵심 키워드 연관성 분석)을 분석하는데 활용한다. 성능 분석 결과 보안 성향 판단을 위한 보안항목 및 특정 지표를 정형/비정형 데이터에서 추출할 수 있음을 확인하였다.

CPTED기법을 통한 모니터링 시스템 설치위치 시각화 결정법 (Visualized Determination for Installation Location of Monitoring Devices using CPTED)

  • 김주환;남두희
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.145-150
    • /
    • 2015
  • 주안전과 밀접한 CCTV의 요구 및 설치는 날로 증가하고 있다. 그러나 현재 방범 CCTV에 대한 체계적인 계획과 위치타당성 검증에 대한 분석은 전무한 상태에서 단순히 주민들의 요구에 대응하는 수준에 머물고 있다. 단순히 CCTV 밀집도를 늘리면서 시민들의 안전을 강구하는 방법은 한계가 있다. 범죄의 특징 중 하나가 과거 발생지역중심으로 군집하는 현상을 보이며 또한 이런 범죄들은 상호연관성이 강하다. 약 2년간 범죄자료를 Geo-coding하고, 18개의 변수를 사회경제, 도시공간, 범죄방어기재시설물, 범죄발생지표로 대별하여 군집분석과 공간통계분석을 실행하여 5대 범죄와 절도범죄, 폭력범죄, 성폭력범죄가 최근린 분석과 Ripley's K함수에 의해 군집성을 확인하였다. 범죄들의 군집성 검토 후 본 연구에서는 위험지점(Hotspot)에 대한 개념을 정립하고, 위험지점선정에 대한 기법을 고찰한 후 본 연구에 타당한 Nearest Neighbor Hierarchical Spatial Clustering 기법을 활용하여 5대 범죄, 절도범죄, 폭력범죄, 성폭력 범죄의 위험지점을 선정하고 중첩분석을 하여 연구지역내 총 105개 지점의 군집수를 얻을 수 있었다.

최적화 기법을 통한 강우관측소의 고도별 분포특성 검토 (Evaluation of Rain Gauge Distribution Characteristics by Altitude using Optimization Technique)

  • 이지호;김종근;주홍준;전환돈
    • 한국습지학회지
    • /
    • 제19권1호
    • /
    • pp.103-111
    • /
    • 2017
  • 본 연구에서는 강우관측소의 고도별 공간분포의 적정성을 평가하기 위한 방안으로 고도별 강우관측소의 최근린지수를 산정하고, 현재 강우관측소 공간분포의 적정성을 평가하였다. 등면적비를 이용하여 고도를 구분하고, 고도마다 다른 지형적인 조건을 고려하기 위하여 주어진 지형조건내에서 가능한 최대 NNI을 최적화 기법의 하나인 화음탐색법을 이용하여 산정하였다. 이와 같이 고도별로 현재 상태 및 최대 NNI를 산정한 후 이 두 값의 차이를 바탕으로 고도별로 강우관측소 분포를 평가하였다. 그 결과 고도가 높아질수록 공간분포가 상대적으로 취약함을 확인하였다. 추후 강우관측망을 신설할 경우 고도별 특성을 반영한다면 보다 효율적인 강우관측망의 구축이 가능할 것으로 판단된다.