• 제목/요약/키워드: K-Nearest Neighbor 알고리즘

검색결과 204건 처리시간 0.029초

k-NN을 활용한 터보팬 엔진의 잔여 유효 수명 예측 모델 제안 (A Proposal of Remaining Useful Life Prediction Model for Turbofan Engine based on k-Nearest Neighbor)

  • 김정태;서양우;이승상;김소정;김용근
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.611-620
    • /
    • 2021
  • 정비 산업은 사후정비, 예방정비를 거쳐, 상태기반 정비를 중심으로 진행되고 있다. 상태기반 정비는 장비의 상태를 파악하여, 최적 시점에서의 정비를 수행한다. 최적의 정비 시점을 찾기 위해서는 장비의 상태, 즉 잔여 유효 수명을 정확하게 파악하는 것이 중요하다. 이에, 본 논문은 시뮬레이션 데이터(C-MAPSS)를 사용한 터보팬 엔진의 잔여 유효수명(RUL, Remaining Useful Life) 예측 모델을 제시한다. 모델링을 위해 C-MAPSS(Commercial Modular Aero-Propulsion System Simulation) 데이터를 전처리, 변환, 예측하는 과정을 거쳤다. RUL 임계값 설정, 이동평균필터 및 표준화를 통해 데이터 전처리를 수행하였고, 주성분 분석(Principal Component Analysis)과 k-NN(k-Nearest Neighbor)을 활용하여 잔여 유효 수명을 예측하였다. 최적의 성능을 도출하기 위해, 5겹 교차검증기법을 통해 최적의 주성분 개수 및 k-NN의 근접 데이터 개수를 결정하였다. 또한, 사전 예측의 유용성, 사후 예측의 부적합성을 고려한 스코어링 함수(Scoring Function)를 통해 예측 결과를 분석하였다. 마지막으로, 현재까지 제시되어온 뉴럴 네트워크 기반의 알고리즘과 예측 성능 비교 및 분석을 통해 k-NN 활용 모델의 유용성을 검증하였다.

결정계수 기반의 데이터 마이닝을 이용한 특수일 최대 전력 수요 예측 (Load Forecasting for the Holidays Using a Data mining with the Coefficient of Determination)

  • 위영민;송경빈;주성관
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.552-553
    • /
    • 2008
  • 본 논문에서는 특수일 전력 수요 예측을 위한 알고리즘을 제시하였다. 논문에서 제안하는 전력 수요 예측 알고리즘은 데이터 마이닝을 이용한 데이터 전처리 부분과 전처리된 데이터를 사용하여 특수일 수요를 예측하는 다항 회귀분석 부분으로 나누어진다. 데이터 전처리에서는 전력 수요 예측을 위한 과거 데이터 중에 과거 특수일 수요의 패턴을 잘 보여주는 데이터를 찾기 위해 온도와 수요의 관계를 이용한다. 데이터 마이닝의 기준으로 결정계수를 사용하였으며, 알고리즘은 k-nearest neighbor 절차를 사용하였다. 또한 제안된 기법은 2006년 특수일 전력 수요 예측을 통하여 기존 논문의 결과와 비교 분석하여 기존 방식 대비 특수일 전력 수요예측 관련 우수성을 검증하였다.

  • PDF

학습 기반의 동적 쓰레드 풀 기법을 적용한 웹 서버의 설계 및 구현 (Design and Implementation of a Web Server Using a Learning-based Dynamic Thread Pool Scheme)

  • 유서희;강동현;이권용;박성용
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.23-34
    • /
    • 2010
  • 네트워크의 발전에 따라 사용자들이 늘어나게 되면서 웹 서버들은 동시에 접속하는 다수 사용자의 서비스 요청을 처리할 수 있는 다중 쓰레드 기법을 활용하고 있다. 고정된 쓰레드 풀 기법은 고정적인 시스템 자원을 점유해야 하는 문제점이 있다. 반면에 동적으로 쓰레드 풀 기법인 워터마크 쓰레드 풀기법은 사용자의 요청량에 따라 쓰레드 수를 적절하게 조절하지만, 지정한 최대값을 넘는 요청량에 대해서는 응답이 제때에 이루이지지 않는 단점이 있다. 따라서 본 논문에서는 다양한 요청량이 존재하는 다중 쓰레드 환경의 서버 프로그래밍을 위한 학습 기반의 동적 쓰레드 풀 기법을 적용한 웹 서버를 제안한다. 제안하는 기법은 쓰레드 풀을 사용하는 웹 서버 중 아파치(Apache) worker 다중 처리 모듈(Multi processing Module)에 AR(Auto Regressive) 기법을 통해 다음 주기의 작업 요청량을 예측하고 사전에 쓰레드를 생성한다. 기존 기법과 달리, 일정주기의 증감 추세가 없는 작업 요청량에도 필요한 쓰레드의 수를 정확하게 설정하기 위해 최근접 이웃(K-Nearest Neighbor) 알고리즘을 사용하여 작업 요청량에 따른 쓰레드의 수를 사전에 학습한다. 필요한 쓰레드의 수를 설정하기 위해 사전에 학습 되어진 개체들과 비교하여 유사한 개체를 선택하여 예측된 작업 요청량에 따른 쓰레드의 수를 결정하고 쓰레드를 생성한다. 본 논문에서는 필요한 쓰레드의 수를 동적으로 변경함으로써 사용자 응답 시간을 빠르게 하고, 사용자의 요청량에 맞게 쓰레드 수를 관리함으로써 시스템 자원의 활용도를 높일 수 있다.

필터 및 특징 선택 기반의 적응형 얼굴 인식 방법 (An Adaptive Method For Face Recognition Based Filters and Selection of Features)

  • 조병모;김기한;이필규
    • 한국콘텐츠학회논문지
    • /
    • 제9권6호
    • /
    • pp.1-8
    • /
    • 2009
  • 2D 영상 이미지를 인식하는데 있어서, 테스트 이미지를 입력 받는 카메라의 설치 공간 및 설정 상황에 따라 밝기, 명암, 빛의 방향 등과 같은 인식의 성능에 영향을 끼칠 수 있는 요소들이 매우 많이 존재한다. 본 논문은 카메라가 위치한 환경 상의 최소의 샘플 이미지를 가지고, 그 환경에서 입력되는 영상의 인식 성공률을 높일 수 있는 적응형 얼굴 인식 방법을 제안하고 있다. 제안한 적응형 얼굴 인식은 두 개의 부분으로 구성되어 있는데, 하나는 환경 적응을 하기 위한 부분이고, 다른 하나는 얼굴 인식을 수행하는 부분이다. 전자인 환경 적응 모듈에서는 안정 상태 유전 알고리즘을 사용하여 인식기가 최적의 성능을 낼 수 있는 필터 조합과 필터 파라메터와 특징 벡터 집합 차원을 결정하고, 후자인 얼굴 인식 모듈에서는 그 결과를 사용하여 얼굴 인식 결과를 확인한다. 얼굴 인식 과정에서 이미지 사이의 유사도를 측정하기 위해서 가보 웨이블릿을 사용하였고, 인식의 결과를 도출하는 과정에서는 k-Nearest Neighbor을 사용하였다. 적응형 얼굴 인식 방법을 테스트 하기위해, 사인 함수의 가중치를 사용한 명암 노이즈, 임펄스 노이즈, 복합 노이즈에 관하여 각각 실험을 하였고, 진화 후에는 일반적으로 발생할 수 있는 노이즈에 대한 급격한 인식률 저하를 방지할 수 있음을 확인하였다.

외판원 문제를 위한 효율적인 분산 최근접 휴리스틱 알고리즘 (An Efficient Distributed Nearest Neighbor Heuristic for the Traveling Salesman Problem)

  • 김정숙;이희영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.1373-1376
    • /
    • 2000
  • 외판원 문제(Traveling Salesman Problem)는 주어진 n개의 도시들과 그 도시들간의 거리 비용이 주어졌을 매, 처음 출발도시에서부터 정확히 한 도시는 한 번씩만 방문하여 다시 출발도시로 돌아오면서 방문한 도시들을 연결하는 최소의 비용이 드는 경로를 찾는 문제로 최적해(optimal value)를 구하는 것은 전형적인 NP-완전 문제중의 하나이다[2,4,5, 8]. 따라서 이들의 수행시간을 줄이고자 하는 연구가 많이 진행된다. 본 논문에서는 외판원 문제의 최적의 해를 구하는데. 휴리스틱 알고리즘인 최근접 휴리스틱을 이용한다. 물론 수행 시간을 줄이고자 최적화 문제에서 좋은 성능을 보이는 유전 알고리즘 (Genetic Algorithm)으로 얻은 근사해(near optimal)를 초기 분기 함수로 사용하고, 근거리 통신망(Local Area Network)에 기반한 분산 처리 환경에서 여러 프로세서에 분산시켜 병렬성을 살린다.

  • PDF

문서분류 기법을 이용한 웹 문서 분류의 실험적 비교 (Empirical Analysis & Comparisons of Web Document Classification Methods)

  • 이상순;최정민;장근;이병수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.154-156
    • /
    • 2002
  • 인터넷의 발전으로 우리는 많은 정보와 지식을 인터넷에서 제공받을 수 있으며 HTML, 뉴스그룹 문서, 전자메일 등의 웹 문서로 존재한다. 이러한 웹 문서들은 여러가지 목적으로 분류해야 할 필요가 있으며 이를 적용한 시스템으로는 Personal WebWatcher, InfoFinder, Webby, NewT 등이 있다. 웹 문서 분류 시스템에서는 문서분류 기법을 사용하여 웹 문서의 소속 클래스를 결정하는데 문서분류를 위한 기법 중 대표적인 알고리즘으로 나이브 베이지안(Naive Baysian), k-NN(k-Nearest Neighbor), TFIDF(Term Frequency Inverse Document Frequency)방법을 이용한다. 본 논문에서는 웹 문서를 대상으로 이러한 문서분류 알고리즘 각각의 성능을 비교 및 평가하고자 한다.

  • PDF

도로 네트워크에서 사용자 정보 보호를 지원하는 질의영역에 대한 k최근접점 질의 처리 알고리즘 (A K-nearest Neighbor Query Processing Algorithm for a Query Region toward User Privacy Protection in Road Network)

  • 김형일;유혜경;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.65-68
    • /
    • 2011
  • 최근 무선 통신 기술의 발달 및 모바일 기기의 발달로 인하여 위치 기반 서비스가 주목을 받고 있다. 그러나 사용자의 정확한 위치정보를 통해 LBS 서버에 질의를 요청하는 것은 심각한 개인 정보 누출의 위협이 될 수 있기 때문에, 사용자 정보 보호를 위해 도로 네트워크를 고려하여 질의영역을 생성하는 연구가 활발히 진행되어 왔다. 따라서 질의영역에 대한 효율적인 질의 처리 방법이 요구된다. 이를 위해, 본 논문에서는 도로 네트워크에서 사용자 정보 보호를 지원하는 질의영역에 대한 k최근접점 질의 처리 알고리즘을 제안한다. 제안하는 기법은 POI를 효율적으로 검색하기 위하여 Island 인덱스를 사용한다. 또한, 본 논문은 질의 처리 성능을 향상시키기 위해 적응적 Island 인덱스를 생성하는 방법을 제안한다. 마지막으로, 성능평가를 통해 제안하는 기법이 기존 기법들에 비해 네트워크 확장 비용 및 서비스 시간 측면에서 우수함을 보인다.

순서 유지 암호화 기반의 k-최근접 질의처리 알고리즘 설계 (Design of k-Nearest Neighbor Query Processing Algorithm Based on Order-Preserving Encryption)

  • 김용기;최기석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1410-1411
    • /
    • 2012
  • 최근 모바일 사용자의 안전한 위치기반 서비스의 사용을 위한 아웃소싱 데이터베이스에서 객체 및 사용자의 위치 정보를 보호하는 연구가 위치 데이터를 보호하기 위한 연구가 활발히 진행되고 있다. 그러나 기존 연구는 불필요한 객체 정보를 요구하기 때문에, 높은 질의 처리 시간을 지니는 단점을 지닌다. 이러한 문제점을 해결하기 위해, 본 논문에서는 기준 POI를 중심으로 객체의 방향성 정보와 변환된 거리를 이용하여, 사용자와 객체의 정보를 보호하는 k-최근접 질의처리 알고리즘을 제안한다.

맵리듀스를 이용한 효율적인 k-NN 조인 질의처리 알고리즘 (Efficient k-Nearest Neighbor Join Query Processing Algorithm using MapReduce)

  • 윤들녁;장미영;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.767-770
    • /
    • 2014
  • 대용량 데이터를 분석하기 위한 맵리듀스 기반 k-NN 조인 질의처리 알고리즘은 최근 데이터 마이닝 및 분석을 기반으로 하는 응용 분야에서 매우 중요하게 활용되고 있다. 그러나, 대표적인 연구인 보로노이 기반 k-NN 조인 질의처리 알고리즘은 보로노이 인덱스 구축 비용이 매우 크기 때문에 대용량 데이터에 적합하지 못하다. 아울러 보로노이 셀 정보를 저장하기 위해 사용하는 R-트리는 맵리듀스 환경의 분산 병렬 처리에 적합하지 않다. 따라서 본 논문에서는 새로운 그리드 인덱스 기반의 k-NN 조인 질의 처리 알고리즘을 제안한다. 첫째, 높은 인덱스 구축 비용 문제를 해결하기 위해, 데이터 분포를 고려한 동적 그리드 인덱스 생성 기법을 제안한다. 둘째, 맵리듀스 환경에서 효율적으로 k-NN 조인 질의를 수행하기 위해, 인접셀 정보를 시그니처로 활용하는 후보영역 탐색 및 필터링 알고리즘을 제안한다. 마지막으로 성능 평가를 통해 제안하는 기법이 질의 처리 시간 측면에서 기존 기법에 비해 최대 3배 높은 질의 처리 성능을 나타냄을 보인다.

고차원 벡터 공간에서 k-최근접 검색에 관한 분석 (Analysis of k-Nearest Neighbor Search in High-Demensional Vector Spaces)

  • 최승락;곽태영;신봉근;이윤준;김명호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.191-193
    • /
    • 1998
  • 지금까지 제시된 최근접 질의 알고리즘은다소간의 cklms 있으나 기본적으로 질의 점과 MBR간의 최소거리에 기반한 분기와 한정 기법을 이용하고 있다. 그러나 차원이 증가함에 따라 질의 구와 겹치는 노드가 급속히 증가하기 때문에 최근접 질의 알고리즘의 성능은 매우 비효율적이다. 이러한 문제를 해결하기 위해서 MBR 간의 중첩을 줄이고 MBR 내에 가급적 많은 점을 포함할 수 있는 다양한 다차원 색인 구조가 제시도 되었다. 그러나 우리의 실험에 의하면 이러한 방법이 근본적인 해결책이 되지 못함을 알 수 있다. 고차원 백터 공간 모델이 가지는 문제로써 임의의 질의 점으로부터 모든 데이터 점들까지의 거리가 차원이 올라감에 따라 유사해지는 현상 때문에 비효율적인 성능이 나옴을 본 논문에서 지적한다.