• 제목/요약/키워드: nearest-neighbor analysis

검색결과 254건 처리시간 0.026초

가상현실 기반 업무공간 융복합 분야 연구 동향 분석 : 패스파인더 네트워크와 병렬 최근접 이웃 클러스터링 방법론 활용 (Investigation of Trend in Virtual Reality-based Workplace Convergence Research: Using Pathfinder Network and Parallel Neighbor Clustering Methodology)

  • 하재빈;강주영
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권2호
    • /
    • pp.19-43
    • /
    • 2022
  • Purpose Due to the COVID-19 pandemic, many companies are building virtual workplaces based on virtual reality technology. Through this study, we intend to identify the trend of convergence and convergence research between virtual reality technology and work space, and suggest future promising fields based on this. Design/methodology/approach For this purpose, 12,250 bibliographic data of research papers related to Virtual Reality (VR) and Workplace were collected from Scopus from 1982 to 2021. The bibliographic data of the collected papers were analyzed using Text Mining and Pathfinder Network, Parallel Neighbor Clustering, Nearest Neighbor Centrality, and Triangle Betweenness Centrality. Through this, the relationship between keywords by period was identified, and network analysis and visualization work were performed for virtual reality-based workplace research. Findings Through this study, it is expected that the main keyword knowledge structure flow of virtual reality-based workplace convergence research can be identified, and the relationship between keywords can be identified to provide a major measure for designing directions in subsequent studies.

텍스트 분류 기법의 발전 (Enhancement of Text Classification Method)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.155-156
    • /
    • 2019
  • Classification and Regression Tree (CART), SVM (Support Vector Machine) 및 k-nearest neighbor classification (kNN)과 같은 기존 기계 학습 기반 감정 분석 방법은 정확성이 떨어졌습니다. 본 논문에서는 개선 된 kNN 분류 방법을 제안한다. 개선 된 방법 및 데이터 정규화를 통해 정확성 향상의 목적이 달성됩니다. 그 후, 3 가지 분류 알고리즘과 개선 된 알고리즘을 실험 데이터에 기초하여 비교 하였다.

  • PDF

기어의 이상검지 및 진단에 관한 연구 -Wavelet Transform해석과 KDI의 비교- (A Study on Fault Detection and Diagnosis of Gear Damages - A Comparison between Wavelet Transform Analysis and Kullback Discrimination Information -)

  • 김태구;김광일
    • 한국안전학회지
    • /
    • 제15권2호
    • /
    • pp.1-7
    • /
    • 2000
  • This paper presents the approach involving fault detection and diagnosis of gears using pattern recognition and Wavelet transform. It describes result of the comparison between KDI (Kullback Discrimination Information) with the nearest neighbor classification rule as one of pattern recognition methods and Wavelet transform to know a way to detect and diagnosis of gear damages experimentally. To model the damages 1) Normal (no defect), 2) one tooth is worn out, 3) All teeth faces are worn out 4) One tooth is broken. The vibration sensor was attached on the bearing housing. This produced the total time history data that is 20 pieces of each condition. We chose the standard data and measure distance between standard and tested data. In Wavelet transform analysis method, the time series data of magnitude in specified frequency (rotary and mesh frequency) were earned. As a result, the monitoring system using Wavelet transform method and KDI with nearest neighbor classification rule successfully detected and classified the damages from the experimental data.

  • PDF

위성영상을 활용한 지상부 산림바이오매스 탄소량 추정 - k-Nearest Neighbor 및 Regression Tree Analysis 방법의 비교 분석 - (Estimation of Aboveground Forest Biomass Carbon Stock by Satellite Remote Sensing - A Comparison between k-Nearest Neighbor and Regression Tree Analysis -)

  • 정재훈;우엔 콩 효;허준;김경민;임정호
    • 대한원격탐사학회지
    • /
    • 제30권5호
    • /
    • pp.651-664
    • /
    • 2014
  • 최근 주기적이고 정확한 산림바이오매스 탄소저장량 추정에 대한 필요성이 한국에서도 점차 증가하고 있다. 본 연구에서는 k-Nearest Neighbor (kNN) 및 Regression Tree Analysis (RTA) 알고리즘을 대상으로 공주 및 세종시를 대상으로 한 탄소량 변화 탐지를 통해 그 효용성을 비교 분석 하고자 하였다. 현장 자료로는 제 3차 및 제 5, 6차 국가산림자원조사 자료를 이용하였으며, 위성영상자료는 1992년, 2010년에 취득된 Landsat TM과 2009년에 취득된 Aster 영상을 이용하였다. 또한, 추정정확도를 향상시키기 위해 각 영상으로부터 다양한 식생지수를 생성하였다. 두 방법론의 비교를 위해 RMSE 및 평균편의(mean bias)를 포함한 각종 탄소통계량을 계산하였으며, 대상지역에 대한 탄소분포지도를 생성하고 비교를 수행하였다. 그 결과, kNN 알고리즘은 영상에 상관없이 보다 안정적인 추정결과를 나타낸 반면, 스무딩 효과로 인해 탄소의 공간분포가 뚜렷하지 않은 단점이 발견되었다. RTA의 경우 평균편의 결과 및 탄소의 공간분포가 명확히 나타나는 장점이 있으나, 위성영상에 따라 탄소추정량에서 큰 차이를 나타내었다. 최종적으로 2009년 및 2010년 탄소지도에서 1992년 탄소지도를 차분한 탄소차분지도를 생성을 통해 공주시 및 세종시 지역의 산림 탄소저장량이 급격히 증가했음을 확인하였다.

Analysis of Urban Distribution Pattern with Satellite Imagery

  • Roh, Young-Hee;Jeong, Jae-Joon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.616-619
    • /
    • 2007
  • Nowadays, urbanized area expands its boundary, and distribution of urbanized area is gradually transformed into more complicated pattern. In Korea, SMA(Seoul Metropolitan Area) has outstanding urbanized area since 1950s. But it is ambiguous whether urban distribution is clustered or dispersed. This study aims to show the way in which expansion of urbanized area impacts on spatial distribution pattern of urbanized area. We use quadrat analysis, nearest-neighbor analysis and fractal analysis to know distribution pattern of urbanized area in time-series urban growth. The quadrat analysis indicates that distribution pattern of urbanized area is clustered but the cohesion is gradually weakened. And the nearest-neighbor analysis shows that point patterns are changed that urbanized area distribution pattern is progressively changed from clustered pattern into dispersed pattern. The fractal dimension analysis shows that 1972's distribution dimension is 1.428 and 2000's dimension is 1.777. Therefore, as time goes by, the complexity of urbanized area is more increased through the years. As a result, we can show that the cohesion of the urbanized area is weakened and complicated.

  • PDF

Locality-Sensitive Hashing for Data with Categorical and Numerical Attributes Using Dual Hashing

  • Lee, Keon Myung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제14권2호
    • /
    • pp.98-104
    • /
    • 2014
  • Locality-sensitive hashing techniques have been developed to efficiently handle nearest neighbor searches and similar pair identification problems for large volumes of high-dimensional data. This study proposes a locality-sensitive hashing method that can be applied to nearest neighbor search problems for data sets containing both numerical and categorical attributes. The proposed method makes use of dual hashing functions, where one function is dedicated to numerical attributes and the other to categorical attributes. The method consists of creating indexing structures for each of the dual hashing functions, gathering and combining the candidates sets, and thoroughly examining them to determine the nearest ones. The proposed method is examined for a few synthetic data sets, and results show that it improves performance in cases of large amounts of data with both numerical and categorical attributes.

최근접 이웃 규칙 기반 프로토타입 선택과 편의-분산을 이용한 성능 평가 (Nearest-neighbor Rule based Prototype Selection Method and Performance Evaluation using Bias-Variance Analysis)

  • 심세용;황두성
    • 전자공학회논문지
    • /
    • 제52권10호
    • /
    • pp.73-81
    • /
    • 2015
  • 이 논문은 프로토타입 선택 방법을 제안하고, 편의-분산 분해를 이용하여 최근접 이웃 알고리즘과 프로토타입 기반 분류 학습의 일반화 성능 비교 평가에 있다. 제안하는 프로토타입 분류기는 클래스 영역 내에서 가변 반지름을 이용한 다차원 구를 정의하고, 적은 수의 프로토타입으로 구성된 새로운 훈련 데이터 집합을 생성한다. 최근접 이웃 분류기는 새 훈련 집합을 이용하여 테스트 데이터의 클래스를 예측한다. 평균 기대 오류의 편의와 분산 요소를 분해하여 최근접 이웃 규칙, 베이지안 분류기, 고정 반지름을 이용한 프로토타입 선택 방법, 제안하는 프로토타입 선택 방법의 일반화 성능을 비교한다. 실험에서 제안하는 프로토타입 분류기의 편의-분산 변화 추세는 모든 훈련 데이터를 사용하는 최근접 이웃 알고리즘과 비슷한 편의-분산 추세를 보였으며, 프로토타입 선택 비율은 전체 데이터의 평균 약 27.0% 이하로 나타났다.

Discriminant Metric Learning Approach for Face Verification

  • Chen, Ju-Chin;Wu, Pei-Hsun;Lien, Jenn-Jier James
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권2호
    • /
    • pp.742-762
    • /
    • 2015
  • In this study, we propose a distance metric learning approach called discriminant metric learning (DML) for face verification, which addresses a binary-class problem for classifying whether or not two input images are of the same subject. The critical issue for solving this problem is determining the method to be used for measuring the distance between two images. Among various methods, the large margin nearest neighbor (LMNN) method is a state-of-the-art algorithm. However, to compensate the LMNN's entangled data distribution due to high levels of appearance variations in unconstrained environments, DML's goal is to penalize violations of the negative pair distance relationship, i.e., the images with different labels, while being integrated with LMNN to model the distance relation between positive pairs, i.e., the images with the same label. The likelihoods of the input images, estimated using DML and LMNN metrics, are then weighted and combined for further analysis. Additionally, rather than using the k-nearest neighbor (k-NN) classification mechanism, we propose a verification mechanism that measures the correlation of the class label distribution of neighbors to reduce the false negative rate of positive pairs. From the experimental results, we see that DML can modify the relation of negative pairs in the original LMNN space and compensate for LMNN's performance on faces with large variances, such as pose and expression.

An Improved Text Classification Method for Sentiment Classification

  • Wang, Guangxing;Shin, Seong Yoon
    • Journal of information and communication convergence engineering
    • /
    • 제17권1호
    • /
    • pp.41-48
    • /
    • 2019
  • In recent years, sentiment analysis research has become popular. The research results of sentiment analysis have achieved remarkable results in practical applications, such as in Amazon's book recommendation system and the North American movie box office evaluation system. Analyzing big data based on user preferences and evaluations and recommending hot-selling books and hot-rated movies to users in a targeted manner greatly improve book sales and attendance rate in movies [1, 2]. However, traditional machine learning-based sentiment analysis methods such as the Classification and Regression Tree (CART), Support Vector Machine (SVM), and k-nearest neighbor classification (kNN) had performed poorly in accuracy. In this paper, an improved kNN classification method is proposed. Through the improved method and normalizing of data, the purpose of improving accuracy is achieved. Subsequently, the three classification algorithms and the improved algorithm were compared based on experimental data. Experiments show that the improved method performs best in the kNN classification method, with an accuracy rate of 11.5% and a precision rate of 20.3%.

GIS분석기법을 이용한 도시화 지역의 공간적 분포패턴에 관한 연구: 수도권의 도시성장을 중심으로 (A study on Spatial Distribution Pattern of Urbanized Area using GIS Analysis: Focused on Urban Growth of Seoul Metropolitan Area)

  • 정재준;노영희
    • 한국경제지리학회지
    • /
    • 제10권3호
    • /
    • pp.319-331
    • /
    • 2007
  • 도시화 지역은 지역발전과 더불어 공간적 범위가 확대되고 있다. 수도권 역시 예외는 아니어서 1960년대 이후 우리나라의 경제개발을 주도하며 도시화 지역의 공간적 범위가 확대일로에 있다. 그러나 도시화 지역의 공간적 분포를 평가함에 있어 그 분포 양상이 집적형태인지 임의적 형태인지 아니면 분산된 형태인지는 정확히 판단하기 어렵다. 즉, 시기가 지남에 따라 도시화 지역이 확대되기는 하지만 정량적으로 그 분포를 판단하기란 쉽지 않다. 본 연구는 GIS의 통계적 분석 기법을 이용하여 도시화 지역의 확대와 성장이 도시화 지역의 분포 패턴에 어떠한 영향을 주었는지를 살펴보고자 하는 것이다. 시계열적 도시성장 과정에서 수도권 내 도시화 지역의 분포패턴을 파악하고자 래스터 기반의 GIS 분석방법, 방격 분석(quadrat analysis), 그리고 최근린 분석(nearest neighbor analysis)을 사용하였다. 실험 결과 수도권의 도시화 지역의 집적정도는 1980년대 초반까지는 증가하다가 그 후로는 약화되는 것으로 분석되었다. 또한 1980년대 중반 이후 수도권 내에서는 외연적 성장이 약화되고 비지적 도시성장 또는 도로망과 연계한 소규모 개발이 증가함을 알 수 있었다.

  • PDF