• 제목/요약/키워드: K-Nearest Neighbor 알고리즘

검색결과 204건 처리시간 0.026초

완전 자율주행을 위한 도로 상태 기반 제동 강도 계산 시스템 (The Road condition-based Braking Strength Calculation System for a fully autonomous driving vehicle)

  • 손수락;정이나
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.53-59
    • /
    • 2022
  • 3단계 자율주행 차량 이후, 4, 5단계의 자율주행 기술은 차량의 완벽한 주행뿐만 아니라 탑승객의 상태를 최적으로 유지하기 위해 노력하고 있다. 그러나 현재 자율주행 기술은 LiDAR, 전방 카메라 등 시각적 정보에 과하게 의존하기 때문에 지정된 도로 이외의 도로에서 완벽하게 자율주행을 실행하기 힘들다. 따라서 본 논문은 차량이 시각 정보 외의 데이터를 사용하여 도로의 상태를 분류하고, 도로 상태와 주행 상태에 따라 최적의 제동 강도를 계산하는 BSCS (Braking Strength Calculation System)를 제안한다. 본 논문에서 제안하는 BSCS는 KNN 알고리즘을 기반으로 도로의 상태를 분류하는 RCDM (Road Condition Definition Module)과 RCDM의 결과와 현재 주행 상태를 통해 주행 중 최적의 제동 강도를 계산하는 BSCM (Braking Strength Calculation Module)로 구성된다. 본 논문의 실험 결과, KNN 알고리즘에 가장 적합한 K의 수를 찾을 수 있었고, 비지도 학습인 K-means 알고리즘보다 본 논문에서 제안한 RCDM이 더 정확한 것이 증명되었다. 해당 논문의 BSCS는 시각 정보뿐만 아니라 서스펜션에 가해지는 진동 데이터를 사용함으로써, 시각 정보가 제한되는 여러 환경에서 자율주행 차량의 제동을 더 원활하게 만들 수 있다.

CS-트리 : 고차원 데이터의 유사성 검색을 위한 셀-기반 시그니쳐 색인 구조 (CS-Tree : Cell-based Signature Index Structure for Similarity Search in High-Dimensional Data)

  • 송광택;장재우
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.305-312
    • /
    • 2001
  • 최근 고차원 색인 구조들이 멀티미디어 데이터베이스, 데이터 웨어하우징과 같은 데이터베이스 응용에서 유사성 검색을 위해 요구된다. 본 논문에서는 고차원 특징벡터에 대한 효율적인 저장과 검색을 지원하는 셀-기반 시그니쳐 트리(CS-트리)를 제안한다. 제안하는 CS-트리는 고차원 특징 벡터 공간을 셀로써 분할하여 하나의 특징 벡터를 그에 해당되는 셀의 시그니쳐로 표현한다. 특징 벡터 대신 셀의 시그니쳐를 사용함으로써 트리의 깊이를 줄이고, 그 결과 효율적인 검색 성능을 달성한다. 또한 셀에 기반하여 탐색 공간을 효율적으로 줄이는 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 삽입시간, k-최근접 질의에 대한 검색 시간 그리고 부가저장 공간 측면에서 성능 비교를 수행한다. 성능비교 결과 CS-트리가 검색 성능에서 우수함을 보인다.

  • PDF

공간 네트워크상의 이동객체를 위한 궤적기반 색인구조의 설계 및 구현 (Design and Implementation of a Trajectory-based Index Structure for Moving Objects on a Spatial Network)

  • 엄정호;장재우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.169-181
    • /
    • 2008
  • 대부분의 이동객체들은 공간 네트워크상을 움직이기 때문에, 그들의 궤적을 효과적으로 색인 검색할 수 있는 궤적 기반 색인 구조가 필요하다. 하지만 도로와 같은 공간 네트워크상의 궤적 기반 색인 구조에 대한 연구는 FNR-트리나 MON-트리와 같은 연구가 진행되었을 뿐 연구가 많이 진행되어 있지 않다. 하지만, FNR-트리나 MON-트리 또한 이동객체의 세그먼트만을 저장할 뿐 전체 궤적을 유지하지 못하여, 궤적 질의에 대해 비효율적이다. 따라서 본 논문에서는 공간 네트워크상의 이동객체를 위한 궤적기반 색인 구조인 TMN -Tree(Trajectory of Moving objects on Network-Tree)를 제안한다. 이를 위해, 이동객체를 공간과 시간 특성으로 분류하고, 궤적을 유지함으로써 영역질의와 궤적질의를 동시에 처리할 수 있는 색인 구조를 설계한다. 아울러, 사용자 질의를 시공간영역 내 궤적 질의, 시간영역 내 유사궤적 질의, k-최근접 질의로 분류하고, 이들을 처리하기 위한 질의 처리 알고리즘을 제안한다. 마지막으로 본 논문에서 제안한 궤적 기반 색인 구조가 기존의 색인구조인 FNR-Tree, MON-Tree보다 성능이 향상되었음을 보여준다.

저니키 모멘트 기반 지역 서술자를 이용한 실시간 특징점 정합 (Real-Time Feature Point Matching Using Local Descriptor Derived by Zernike Moments)

  • 황선규;김회율
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.116-123
    • /
    • 2009
  • 서로 다른 시점의 두 영상에서 동일한 점들을 정합하는 특징점 정합은 다양한 영상 처리 분야에서 널리 사용되고 있으며, 최근에는 실시간으로 동작하는 특징점 정합에 대한 요구가 높아지고 있다. 본 논문은 저니키 모멘트 기반의 지역 서술자를 이용하여 특징점을 실시간으로 정합하는 방법을 제안한다. 빠른 모서리 점 검출 방법을 이용하여 입력 영상으로부터 특징점을 추출하고, 각 특징점에서 저니키 모멘트를 이용한 지역 서술자를 생성한다. 저니키 모멘트 기반의 지역 서술자는 특징점 주변의 부분 영상을 적은 차수의 특징 벡터로써 효율적으로 표현하며, 영상의 회전과 밝기 변화에 강인하다. 본 논문에서는 저니키 모멘트 계산을 실시간으로 수행하기 위하여 고정된 크기의 저니키 기저 함수를 미리 계산하여 이를 룩업 테이블에 저장하여 사용한다. 특징점 정합 단계에서는 근사 최근방 이웃(ANN) 방법을 사용하여 초기 정합 결과를 얻고, 이 중 잘못된 정합은 RANSAC 알고리즘을 이용하여 제거함으로써 최종 정합 결과를 얻는다. 실험 결과 제안하는 방법은 다양한 변환이 존재하는 영상에 대하여 실시 간으로 특징점 정합을 수행함을 확인하였다.

머신러닝 기반의 수도권 지역 고령운전자 차대사람 사고심각도 분류 연구 (Classifying Severity of Senior Driver Accidents In Capital Regions Based on Machine Learning Algorithms)

  • 김승훈;임영빈;김기정
    • 디지털융복합연구
    • /
    • 제19권4호
    • /
    • pp.25-31
    • /
    • 2021
  • 고령화 시대에 따라 고령운전자 역시 증가하고 있으며, 이들에 의한 교통사고 심각성에 대한 관심이 높아지고 있다. 이에 고령운전자에 의한 사고심각도 예측 모형의 필요성이 점차 요구됨에 따라, 본 연구에서는 기계학습 기법을 활용하여 고령운전자에 의한 차대사람 사고심각도 예측을 위한 모형 정립 및 분석을 수행하고자 한다. 이를 위해 4개의 기계학습 알고리즘 (Logistic Model, KNN, RF, SVM)을 활용, 예측 모형을 개발하고 각 결과를 비교하였다. 연구 결과에 따르면 Logistic과 SVM 모형이 상대적으로 높은 예측력을 보였으며, 정확도 측면에서는 RF가 높은 것으로 나타났다. 추가적으로 각 중요 변수들을 이용하여 교차분석을 수행한 후 그 결과를 제시하였다. 본 연구의 결과들은 고령화시대에 고령운전자에 의한 사고심각성을 예방하기 위한 안전정책 및 인프라 개발에 활용될 것으로 판단된다.

잡음과 스펙트럼 이동에 강인한 CNN 기반 라만 분광 알고리즘 (CNN based Raman Spectroscopy Algorithm That is Robust to Noise and Spectral Shift)

  • 박재현;유형근;이창식;장동의;박동조;남현우;박병황
    • 한국군사과학기술학회지
    • /
    • 제24권3호
    • /
    • pp.264-271
    • /
    • 2021
  • Raman spectroscopy is an equipment that is widely used for classifying chemicals in chemical defense operations. However, the classification performance of Raman spectrum may deteriorate due to dark current noise, background noise, spectral shift by vibration of equipment, spectral shift by pressure change, etc. In this paper, we compare the classification accuracy of various machine learning algorithms including k-nearest neighbor, decision tree, linear discriminant analysis, linear support vector machine, nonlinear support vector machine, and convolutional neural network under noisy and spectral shifted conditions. Experimental results show that convolutional neural network maintains a high classification accuracy of over 95 % despite noise and spectral shift. This implies that convolutional neural network can be an ideal classification algorithm in a real combat situation where there is a lot of noise and spectral shift.

머신러닝 알고리즘 기반 반도체 자동화를 위한 이송로봇 고장진단에 대한 연구 (A Study on the Failure Diagnosis of Transfer Robot for Semiconductor Automation Based on Machine Learning Algorithm)

  • 김미진;고광인;구교문;심재홍;김기현
    • 반도체디스플레이기술학회지
    • /
    • 제21권4호
    • /
    • pp.65-70
    • /
    • 2022
  • In manufacturing and semiconductor industries, transfer robots increase productivity through accurate and continuous work. Due to the nature of the semiconductor process, there are environments where humans cannot intervene to maintain internal temperature and humidity in a clean room. So, transport robots take responsibility over humans. In such an environment where the manpower of the process is cutting down, the lack of maintenance and management technology of the machine may adversely affect the production, and that's why it is necessary to develop a technology for the machine failure diagnosis system. Therefore, this paper tries to identify various causes of failure of transport robots that are widely used in semiconductor automation, and the Prognostics and Health Management (PHM) method is considered for determining and predicting the process of failures. The robot mainly fails in the driving unit due to long-term repetitive motion, and the core components of the driving unit are motors and gear reducer. A simulation drive unit was manufactured and tested around this component and then applied to 6-axis vertical multi-joint robots used in actual industrial sites. Vibration data was collected for each cause of failure of the robot, and then the collected data was processed through signal processing and frequency analysis. The processed data can determine the fault of the robot by utilizing machine learning algorithms such as SVM (Support Vector Machine) and KNN (K-Nearest Neighbor). As a result, the PHM environment was built based on machine learning algorithms using SVM and KNN, confirming that failure prediction was partially possible.

원격탐사와 GIS 기반의 산림탄소저장량 추정에 관한 주요국 연구동향 개관 (Overview of Research Trends in Estimation of Forest Carbon Stocks Based on Remote Sensing and GIS)

  • 김경민;이정빈;김은숙;박현주;노영희;이승호;박기호;신휴석
    • 한국지리정보학회지
    • /
    • 제14권3호
    • /
    • pp.236-256
    • /
    • 2011
  • 토지이용변화에 따른 산림탄소저장량 변화는 기후변화협약에서 요구하는 주요 자료 중 하나이다. IPCC 우수실행지침(intergovernmental panel on climate change good practice guidance, IPCC GPG) 수준 3에 근거하여 공간적으로 명확한 산림탄소저장량을 추정하게 되면 높은 신뢰도를 확보할 수 있다. 그러나 기존의 추정 방법은 표본점(sample plot) 단위의 국가산림자원조사 (national forest inventory, NFI) 자료만을 이용하여 행정구역별 평균을 집계하는 것으로 폴리곤 혹은 셀 단위의 상세한 탄소저장량을 파악할 수 없었다. 이를 보완하기 위해 유럽, 북미 등에서는 NFI 자료, 원격탐사 및 GIS 기술을 결합하여 산림탄소저장량을 추정하기 위한 노력이 활발히 이루어져왔다. 주요국의 연구 동향을 활용 기법에 따라 분류해보면 원격탐사, GIS, 지구통계 및 환경변수 모델링 등 크게 4가지 범주로 나눌 수 있다. 이 중 가장 손쉽게 국내 적용을 고려해 볼 수 있는 방법은 NFI 자료와 임상도를 결합하는 GIS 기반의 방법이다. 특히, 복잡한 수종 구성을 가지고 있는 국내 산림 환경 특성을 고려할 때 국지적 변이 추정에 유용한 지구통계 기법의 활용성이 기대된다. 아울러, 고해상도 영상의 활용은 산림탄소저장량 추정의 검증 및 탄소배출권 확보를 위한 CDM(clean development mechanism, 청정개발체제) 사업 적지 선정 등에 유용할 것으로 판단된다. 국내 관련 연구는 아직 초기 단계로 최근린 기법(k-nearest neighbor, k-NN)의 적용성을 검토하는 연구가 주를 이루고 있으나 국내 산림 환경에 적합한 방법론의 선정을 위해서는 보다 다양한 공간 자료와 알고리즘의 적용성이 검토되고 방법론 간의 비교 연구가 필요하다.

머신 러닝을 활용한 과학 논변 구성 요소 코딩 자동화 가능성 탐색 연구 (Exploratory Research on Automating the Analysis of Scientific Argumentation Using Machine Learning)

  • 이경건;하희수;홍훈기;김희백
    • 한국과학교육학회지
    • /
    • 제38권2호
    • /
    • pp.219-234
    • /
    • 2018
  • 본 연구에서는 국내 교육학 연구에서 거의 사용되지 않던 머신 러닝 기술을 과학 교육 연구에 접목하여, 학생들의 과학 논변 활동에서 나타나는 논변의 구성 요소를 분석하는 과정을 자동화할 수 있는 가능성을 탐색해보았다. 학습 데이터로는 Toulmin이 제안하였던 틀에 따라 학생들의 과학 논변 구성 요소를 코딩한 국내 선행 문헌 18건을 수합하고 정리하여 990개의 문장을 추출하였으며, 테스트 데이터로는 실제 교실 환경에서 발화된 과학 논변 전사 데이터를 사용하여 483개의 문장을 추출하고 연구자들이 사전 코딩을 수행하였다. Python의 'KoNLPy' 패키지와 '꼬꼬마(Kkma)' 모듈을 사용한 한국어 자연어 처리(Natural Language Processing, NLP)를 통해 개별 논변을 구성하는 단어와 형태소를 분석하였으며, 연구자 2인과 국어교육 석사학위 소지자 1인의 검토 과정을 거쳤다. 총 1,473개의 문장에 대한 논변-형태소:품사 행렬을 만든 후에 다섯 가지 방법으로 머신 러닝을 수행하고 생성된 예측 모델과 연구자의 사전 코딩을 비교한 결과, 개별 문장의 형태소만을 고려하였을 때에는 k-최근접 이웃 알고리즘(KNN)이 약 54%의 일치도(${\kappa}=0.22$)를 보임으로써 가장 우수하였다. 직전 문장이 어떻게 코딩되어 있는지에 관한 정보가 주어졌을 때, k-최근접 이웃 알고리즘(KNN)이 약 55%의 일치도(${\kappa}=0.24$)를 보였으며 다른 머신 러닝 기법에서도 전반적으로 일치도가 상승하였다. 더 나아가, 본 연구의 결과는 과학 논변 활동의 분석에서 개별문장을 고려하는 단순한 방법이 어느 정도 유용함과 동시에, 담화의 맥락을 고려하는 것 또한 필요함을 데이터에 기반하여 보여주었다. 또한 머신 러닝을 통해 교실에서 한국어로 이루어진 과학 논변 활동을 분석하여 연구자와 교사들에게 유용하게 사용될 수 있는 가능성을 보여준다.

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.