• 제목/요약/키워드: t-Nearest Neighbor

검색결과 46건 처리시간 0.026초

회전기계 고장 진단을 위한 최근접 이웃 분류기의 기각 전략 (Rejection Study of Mearest Meighbor Classifier for Diagnosis of Rotating Machine Fault)

  • 최영일;박광호;기창두
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2000년도 추계학술대회 논문집
    • /
    • pp.81-84
    • /
    • 2000
  • Rotating machine is used extensively and plays important roles in the industrial field. Therefore when rotating machine get out of order, it is necessary to know reasons then deal with the troubles immediately. So many studies far diagnosis of rotating machine are being done. However by this time most of study has an interest in gaining a high recognition But without considering error $rate^{(1)(2)(3)}$ , it is not desirable enough to apply h the actual application system. If the manager of system receives the result misjudging the condition of rotating machine and takes measures, we would lose heavily. So in order to play the creditable diagnosis, we must consider error rate. T h ~ t is. it must be able to reject the result of misjudgment. This study uses nearest neighbor classifier for diagnosis of rotating $machine^{(4)(8)}$ And the Smith's rejection $method^{(1)}$ used to recognize handwritten charter is done. Consequently creditable diagnosis of rotating machine is proposed.

  • PDF

열역학법을 이용한 DNA hybridization 특성 검출 및 해석 (Detection and Analysis of DNA Hybridization Characteristics by using Thermodynamic Method)

  • 김도균;권영수
    • 대한전기학회논문지:전기물성ㆍ응용부문C
    • /
    • 제51권6호
    • /
    • pp.265-270
    • /
    • 2002
  • The determination of DNA hybridization reaction can apply the molecular biology research, clinic diagnostics, bioengineering, environment monitoring, food science and application area. So, the improvement of DNA hybridization detection method is very important for the determination of this hybridization reaction. Several molecular biological techniques require accurate predictions of matched versus mismatched hybridization thermodynamics, such as PCR, sequencing by hybridization, gene diagnostics and antisense oligonucleotide probes. In addition, recent developments of oligonucleotide chip arrays as means for biochemical assays and DNA sequencing requires accurate knowledge of hybridization thermodynamics and population ratios at matched and mismatched target sites. In this study, we report the characteristics of the probe and matched, mismatched target oligonucleotide hybridization reaction using thermodynamic method. Thermodynamic of 5 oligonucleotides with central and terminal mismatch sequences were obtained by measured UV-absorbance as a function of temperature. The data show that the nearest-neighbor base-pair model is adequate for predicting thermodynamics of oligonucleotides with average deviations for $\Delta$H$^{0}$ , $\Delta$S$^{0}$ , $\Delta$G$_{37}$ $^{0}$ and T$_{m}$, respectively.>$^{0}$ and T$_{m}$, respectively.

IoT 네트워크에서 악성 트래픽을 탐지하기 위한 머신러닝 알고리즘의 성능 비교연구 (A comparative study of the performance of machine learning algorithms to detect malicious traffic in IoT networks)

  • 현미진
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.463-468
    • /
    • 2021
  • IoT는 기술의 발전과 IoT 기기의 보급 및 서비스의 활성화로 폭발적인 증가세를 보이고 있지만, 최근 다양한 봇넷의 활동에 의해 심각한 보안 위험과 재정적 피해가 발생하고 있다. 따라서 이러한 봇넷의 활동을 정확하고 빠르게 탐지하는 것이 중요하다고 할 수 있다. IoT 환경에서의 보안은 최소한의 프로세싱 성능과 메모리로 운영을 해야 하는 특성이 있는 만큼, 본 논문에서는 탐지를 위한 최소한의 특성을 선택하고, KNN(K-Nearest Neighbor), Naïve Bayes, Decision Tree, Random Forest와 같은 머신러닝 알고리즘이 봇넷의 활동을 탐지하는 성능을 비교연구 하였다. Bot-IoT 데이터셋을 사용한 실험 결과는 적용한 머신러닝 알고리즘 중 KNN이 DDoS, DoS, Reconnaissance 공격을 가장 효과적이고 효율적으로 탐지할 수 있음을 보여주었다.

k-NN기법을 이용한 산림바이오매스 자원량 평가 - 강원대학교 학술림을 대상으로 - (Assessment of Forest Biomass using k-Neighbor Techniques - A Case Study in the Research Forest at Kangwon National University -)

  • 서환석;박동환;임종수;이정수
    • 한국산림과학회지
    • /
    • 제101권4호
    • /
    • pp.547-557
    • /
    • 2012
  • 본 연구는 강원대학교 학술림을 대상으로 현장조사자료와 Landsat TM-5 위성영상 정보를 이용하여 k-NN기법을 통해 산림바이오매스를 추정하는 것을 목적으로 하였다. 임상 층화 및 최소수평 참조거리(HRA)와 공간필터링의 조건변화에 따른 최적의 참조표본점 개수(k)를 검토하였으며, 이에 따른 산림바이오매스량 추정과 정확도를 비교 분석하였다. 침엽수는 $5{\times}5$ 필터링을 적용한 HRA 4 km와 k=8를 적용하였을 때 최소의 RMSE를 나타냈으며, 편차는 1.8 t/ha으로 과대추정되었다. 한편, 잣나무와 활엽수는 필터링을 적용하지 않은 HRA 4km의 k=8과 HRA 10 km의 k=6을 적용하였을 때 최소의 RMSE가 나타났으며, 편차는 각각 -1.6 t/ha, -5.2 t/ha로 과소추정되었다. k-NN기법에 의하여 추정된 총 바이오매스량은 799천t이며, ha당 평균 산림바이오매스량은 237 t/ha로서 표본점자료를 이용한 추정치보다 약 1 t/ha 높게 나타났다.

고차 국소 자동 상관 특징 정보를 이용한 외관 기반 객체 인식 (Appearance-based Object Recognition Using Higher Order Local Auto Correlation Feature Information)

  • 강명아
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1439-1446
    • /
    • 2011
  • 본 논문에서는 고차 상관 특정 정보와 주성분 분석을 결합하여 차원을 낮추면서도 객체 인식을 유지하고, 고유 공간 구성 시간을 현저하게 줄이는 알고리즘에 대해 기술한다. 제안된 방법은 기존의 기하학적 정보를 이용하거나 스테레오 영상을 이용하는 방법에 비해 많은 계산량이 요구되지 않기 때문에 실시간 시스템 구축에 매우 적합하다는 것이 실험을 통하여 증명되었다. 또한 인식률을 향상시키기 위해 단순히 기존의 방법인 point to point 방식인 단순 거리 계산은 오차가 많기 때문에 본 논문에서는 개선된 Class to Class방식인 K-Nearest Neighbor을 이용하여 몇 개의 연속적인 입력영상을 인식의 단위로 이용하여 인식 오차를 줄일 수 있었다.

고객 감성 분석을 위한 학습 기반 토크나이저 비교 연구 (Comparative Study of Tokenizer Based on Learning for Sentiment Analysis)

  • 김원준
    • 품질경영학회지
    • /
    • 제48권3호
    • /
    • pp.421-431
    • /
    • 2020
  • Purpose: The purpose of this study is to compare and analyze the tokenizer in natural language processing for customer satisfaction in sentiment analysis. Methods: In this study, a supervised learning-based tokenizer Mecab-Ko and an unsupervised learning-based tokenizer SentencePiece were used for comparison. Three algorithms: Naïve Bayes, k-Nearest Neighbor, and Decision Tree were selected to compare the performance of each tokenizer. For performance comparison, three metrics: accuracy, precision, and recall were used in the study. Results: The results of this study are as follows; Through performance evaluation and verification, it was confirmed that SentencePiece shows better classification performance than Mecab-Ko. In order to confirm the robustness of the derived results, independent t-tests were conducted on the evaluation results for the two types of the tokenizer. As a result of the study, it was confirmed that the classification performance of the SentencePiece tokenizer was high in the k-Nearest Neighbor and Decision Tree algorithms. In addition, the Decision Tree showed slightly higher accuracy among the three classification algorithms. Conclusion: The SentencePiece tokenizer can be used to classify and interpret customer sentiment based on online reviews in Korean more accurately. In addition, it seems that it is possible to give a specific meaning to a short word or a jargon, which is often used by users when evaluating products but is not defined in advance.

Centroid and Nearest Neighbor based Class Imbalance Reduction with Relevant Feature Selection using Ant Colony Optimization for Software Defect Prediction

  • B., Kiran Kumar;Gyani, Jayadev;Y., Bhavani;P., Ganesh Reddy;T, Nagasai Anjani Kumar
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.1-10
    • /
    • 2022
  • Nowadays software defect prediction (SDP) is most active research going on in software engineering. Early detection of defects lowers the cost of the software and also improves reliability. Machine learning techniques are widely used to create SDP models based on programming measures. The majority of defect prediction models in the literature have problems with class imbalance and high dimensionality. In this paper, we proposed Centroid and Nearest Neighbor based Class Imbalance Reduction (CNNCIR) technique that considers dataset distribution characteristics to generate symmetry between defective and non-defective records in imbalanced datasets. The proposed approach is compared with SMOTE (Synthetic Minority Oversampling Technique). The high-dimensionality problem is addressed using Ant Colony Optimization (ACO) technique by choosing relevant features. We used nine different classifiers to analyze six open-source software defect datasets from the PROMISE repository and seven performance measures are used to evaluate them. The results of the proposed CNNCIR method with ACO based feature selection reveals that it outperforms SMOTE in the majority of cases.

위성영상자료 및 국가 산림자원조사 자료를 이용한 산림 바이오매스 추정 (Estimation of Forest Biomass based upon Satellite Data and National Forest Inventory Data)

  • 임종수;한원성;황주호;정상영;조현국;신만용
    • 대한원격탐사학회지
    • /
    • 제25권4호
    • /
    • pp.311-320
    • /
    • 2009
  • 본 연구는 전라북도 무주군을 대상으로 제5차 국가산림자원조사 자료와 위성영상(Landsat TM-5)자료를 이용하여 산림 바이오매스를 추정하고 이를 토대로 바이오매스 주제도를 작성하고자 하였다. 먼저 국가산림자원조사의 야외 표본점 자료를 이용하여 조사표본점의 단위면적 당 축적을 산출하고, 바이오매스 변환계수를 적용하여 산림 바이오매스를 추정하였다. 본 연구에서는 위성영상 자료를 이용한 산림 바이오매스 추정을 위해 회귀모형을 이용하는 방법과 최근린 기법(k-Nearest Neighbor)을 이용하는 두 가지 방법을 사용하였는데, 이 두 가지 방법에 의해 추정된 산림 바이오매스를 국가산림자원조사 자료에 의한 추정치와 비교하여 최적의 방법을 선정하였다. 추정된 바이오매스 통계량의 비교를 위해 교차대조법을 이용하여 RMSE(Root Mean Square Error)와 평균편의(Mean Bias)를 산출하였는데, 그 결과 두 방법 모두 유사한 추정오차(RMSE: 63.75$\sim$67.26ton/ha)와 편차($\pm$1 ton/ha)를 보여 정확성 면에서는 큰 차이가 없는 것으로 나타났다. 하지만 최근린 기법을 이용하여 산림 바이오매스를 추정하는 것이 효율성 측면에서 보다 유리할 것으로 평가되었다. 최근린 기법에 의해 추정된 무주군의 산림 바이오매스는 약 839만 톤으로 나타났으며 단위면적당 평균은 149톤/ha인 것으로 분석되었다.

SOM기반 특징 신호 추출 기법을 이용한 불균형 주기 신호의 이상 탐지 (Fault Detection of Unbalanced Cycle Signal Data Using SOM-based Feature Signal Extraction Method)

  • 김송이;강지훈;박종혁;김성식;백준걸
    • 한국시뮬레이션학회논문지
    • /
    • 제21권2호
    • /
    • pp.79-90
    • /
    • 2012
  • 본 연구는 공정신호가 불균형 데이터인 경우 이상 탐지 알고리즘의 성능 개선을 위한 특징 신호 추출 기법을 제안한다. 불균형 데이터란 범주 구분 문제에서 하나의 범주의 속하는 데이터의 비율이 다른 범주의 데이터에 비해 크게 차이나 이상 탐지성능이 크게 저하되는 경우를 의미한다. 공정이 운영되는 경우 얻을 수 있는 이상 신호의 수는 정상 신호에 비해 매우 적기에 이러한 문제를 해결하여 이상 탐지 기법을 적용하는 것은 매우 중요하다. 불균형 문제 해결을 위해 SOM(Self-Organizing Map) 알고리즘을 이용하여 각 노드에 대응되는 가중치를 특징 신호로 간주하여 정상 데이터와 이상 데이터의 비율을 맞춘다. 특징 신호 데이터 집단의 이상 탐지를 위해 클래스 분류 기법인 kNN(k-Nearest Neighbor)과 SVM(Support Vector Machine)을 적용하여 이를 공정 신호 이상탐지를 위해 주로 사용하는 Hotelling's $T^2$ 관리도와 성능을 비교한다. 반도체 공정에서 발생한다고 알려진 공정 신호를 모사하여 신호 알고리즘 성능의 우수성을 검증한다.

m-유형 공간객체를 위한 $R^m$-tree기반의 mk-최근접질의 처리기법 (mkNN Query Processing Method based on $R^m$-tree for Spatial Objects with m-types)

  • 장동주;안수연;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.45-48
    • /
    • 2011
  • 본 논문에서는 다양한 타입의 위치기반 데이터들을 하나의 R-tree로 통합합 $R^m$-tree의 구조와 이 $R^m$-tree를 이용하여 질의 포인트로부터 각 타입에서 k개의 가까운 위치기반 데이터를 찾는 mkNN(multi-type k nearest neighbor) 질의 처리기법을 제안하였다. 특히, 다양한 타입의 위치기반 데이터들을 각 타입별로 독립된 R-tree로 유지하지 않고, 하나의 $R^m$-tree로 통합하여 관리함으로써 mkNN 질의 처리시 같은 레벨의 공간의 반복탐색을 줄일 수 있도록 고안하였다. 그리고 각 타입 t에 대한 위치데이터를 관리하는 부가적인 타입정보 자료구조로서 위치정보를 담은 TMBR, 데이터 개수정보를 담은 $I_t$-entry를 새로이 고안하여 mkNN질의 처리시 효율적인 휠터링(filtering)과 검색과정이 이루어지도록 하였다.