• 제목/요약/키워드: k-최대근접이웃

검색결과 6건 처리시간 0.027초

K 최대근접이웃 방법을 이용한 통행시간 예측에 대한 연구 (A Study of Travel Time Prediction using K-Nearest Neighborhood Method)

  • 임성한;이향미;박성룡;허태영
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.835-845
    • /
    • 2013
  • 통행시간은 교통정보 중에서 가장 대표적이고 이용자 선호도가 높은 정보이다. 본 연구에서는 일반국도를 대상으로 실시간 시스템에 적용 가능한 통행시간 예측 방법을 개발하고자 하였다. 통행시간 예측방법으로 비모수적 접근 방법인 K 최대근접이웃 방법을 적용하였다. K 최대근접이웃 방법은 데이터에 대한 특별한 가정이 필요 없고, 모수 추정 과정이 필요 없어 실시간 교통관리시스템에 적합하다. K 최대근접이웃 방법의 우수성을 평가하기 위해 교통 분야에서 많이 적용되고 있는 이력자료 평균방법과 칼만 필터방법을 선정하여 평균절대백분율오차와 변동계수를 통해 평가하였다. 평가 결과 K 최대근접이웃 방법이 이력자료 평균방법과 칼만 필터방법에 비해 우수한 것으로 분석되었다. 통행시간 정보 제공 시 본 연구에서 개발된 방법을 통해 도출된 통행시간과 구간검지기로부터 관측된 통행시간을 탄력적으로 적용함으로써 통행시간 정보의 신뢰도를 향상시킬 수 있을 것으로 기대된다.

k-NN 알고리즘을 활용한 단기 교통상황 예측: 서울시 도시고속도로 사례 (Short-term Traffic States Prediction Using k-Nearest Neighbor Algorithm: Focused on Urban Expressway in Seoul)

  • 김형주;박신형;장기태
    • 대한교통학회지
    • /
    • 제34권2호
    • /
    • pp.158-167
    • /
    • 2016
  • 본 연구는 실시간 자료를 기반으로 k-NN을 활용한 단기 교통상황 예측 시 각 단계별 세부절차 및 변수결정, 입력자료 구축 등의 각 단계별 잠재적 예측오차에 대한 원인분석 및 시사점 도출을 목적으로 한다. 다양한 단기 예측모형에 대한 선행연구 검토를 통하여 k-NN 모형의 유용성을 검토하였고 이에 대한 적용가능성을 분석하였다. 본 연구의 k-NN 모형은 이력자료 평활화 및 패턴DB 구축의 입력자료 부분, 실시간 자료와 과거 이력자료와의 유사성 측정 및 k 근접이웃 결정 등의 k-NN 알고리즘 부분, 그리고 예측 시간간격에 따른 출력결과 부분 등으로 구성되며 올림픽대로 김포방향 한강대교 남단~여의상류IC 구간을 대상으로 분석을 실시하였다. 교통자료의 불규칙 잡음으로 인하여 정확한 패턴매칭을 위해서 이력자료의 평활화를 실시하였으며, 이력자료 패턴 DB는 일반 및 이벤트 상황으로 구분하여 활용하였다. 최적의 시계열 자료 및 k 근접이웃 결정을 위해서 시행착오 방법을 적용하였으며, 단기 교통상황 예측 시 예측 시간간격이 증가할수록 예측오차가 증가하는 패턴, 그리고 교통상태가 급변하는 시점에서도 예측오차가 증가함을 알 수 있었다. 본 연구의 k-NN 모형에 대한 각 단계별 예측오차에 대한 원인을 분석하여 개선방향을 제시함으로써 향후 신뢰성 있는 단기 교통상황예측 정보제공 및 시스템에 활용이 가능할 것으로 판단된다.

Efficient Processing of k-Farthest Neighbor Queries for Road Networks

  • Kim, Taelee;Cho, Hyung-Ju;Hong, Hee Ju;Nam, Hyogeun;Cho, Hyejun;Do, Gyung Yoon;Jeon, Pilkyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.79-89
    • /
    • 2019
  • 본 연구에서는 도로 네트워크에서 k-최원접 이웃 검색을 위한 효율적인 FANS(k-FArthest Neighbor Search) 알고리즘을 제안한다. 양의 정수 k, 질의 객체 q, 일련의 데이터 객체 집합 P가 주어지면, k-최원접 이웃 질의는 질의 객체 q에서 가장 멀리 있는 k개의 데이터 객체를 찾는다. 데이터베이스 분야에서 대부분의 연구는 k-최근접 이웃 질의에 중점을 두고 있어서, k-최원접 이웃 질의라는 중요한 근접 질의유형은 별다른 관심을 받지 못했다. 이 논문에서는 도로 네트워크에서 가장 멀리 있는 이웃을 찾는 문제를 다룬다. 도로 네트워크에서 k-최원접 이웃 질의를 처리하는 연구는 거의 없었다. 도로 네트워크에서 k-최원접 이웃 질의를 처리해야 하는 문제는 최단 경로 거리를 계산하는 횟수를 줄이는 것인데, 이는 도로 네트워크와 유클리드 공간의 질의 처리에서 가장 중요한 차이다. 질의 객체와 데이터 객체 사이의 최단 경로 거리에 대한 중복 계산을 줄이기 위하여 공유 계산 전략을 사용한다. 질의 객체에서 데이터 세그먼트까지 최대 거리를 기반으로 효과적으로 후보군을 제거하는 방법은 제시한다. 마지막으로 실제 도로 지도를 사용한 광범위한 실험을 통해 제시된 방법의 효율성과 확장성을 보여준다.

방향성을 고려한 공간적 조건부 자기회귀 모형 (Directional conditionally autoregressive models)

  • 경민정
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.835-847
    • /
    • 2016
  • 공간통계 방법 중 지역에 대한 어떤 집합체 자료나 평균자료들을 분석하는데 일반적으로 공간적 자기회귀(conditionally autoregressive) 모형을 사용한다. 공간적 자기회귀 모형에 정의되는 공간적 이웃 소지역들은 중점의 거리나 근접성으로 정의된다. Kyung과 Ghosh (2010)는 방향에 따라서 이웃간 자기상관성의 크기가 다른 공간적 확장 모형을 제시하였다. 제안된 방향적 조건부 자기회귀(directional conditionally autoregressive) 모형은 고유 이방성을 모형화하여 기존의 CAR과정을 일반화한다. 제시한 방향적 조건부 자기회귀모형의 최대우도 추정량의 특성에 대해 설명하였고, 스코틀랜드 그레이터 글래스고우의 로그변환된 부동산 가격에 적용하여 조건부 자기회귀모형과 비교하였다.

KNN 알고리즘을 활용한 고속도로 통행시간 예측 (Expressway Travel Time Prediction Using K-Nearest Neighborhood)

  • 신강원;심상우;최기주;김수희
    • 대한토목학회논문집
    • /
    • 제34권6호
    • /
    • pp.1873-1879
    • /
    • 2014
  • 실시간 자료를 반영한 통행시간 예측 기법은 다양하지만 관련 연구 검토 결과 과거이력데이터가 충분하다면 타 모형에 비해 K 최대근접이웃(K-Nearest Neighbors)의 정확도가 우수하므로 본 연구에서는 이에 대한 적용 방법 도출 및 가능성 평가를 목적으로 한다. 본 연구에서는 KNN의 입력 자료로 TCS 교통량 및 DSRC 구간통행시간의 실시간 및 과거 이력자료, 경로통행시간 이력자료를 활용하였다. 통행시간 예측치는 TCS 교통량 및 DSRC 구간통행시간의 실시간 자료와 유사한 경로통행시간을 탐색한 후 이를 가중평균하여 산출하였다. 예측 기법을 적용한 결과 DSRC 구간통행시간의 가중치가 증가할수록 정확도는 증가하였으며, 이는 실시간 교통상황 변화를 DSRC 구간통행시간이 잘 반영하기 때문이다. 그러나 TCS 교통량을 기반으로 한 경우 역시 정확도의 차이가 크지 않으며, 변화 추이도 유사하게 나타났다. 이러한 결과를 볼 때 향후 대용량의 과거이력자료가 축적될 경우 예측오차는 더욱 감소될 것으로 기대된다.

평면 색인 구조에서 효율적인 k-근접 이웃 찾기 (Efficient k-nn search on directory-based index structure)

  • 김태완;강혜영;이기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.779-781
    • /
    • 2003
  • 최근에 제안된 VA-File[6]은 k-NN 질의 처리에서 아주 효율적이라고 알려져 있다. 제시된 방법은 분할된 데이터의 저장 효율성을 보장하지 못하기 때문에 각 차원에 할당된 비트의 수가 증가하면(비트수=3~5) 할수륵 거의 모든 데이터에 대하여 MBH를 생성하는 단점이 있다. k-NN 질의는 거의 모든 데이터를 순차 검색을 통한 일차적 가지제거작업을 한 후. 질의를 수행하기 위한 디스크 접근을 한다. 따라서, 질의를 수행하기 위한 디스크 접근 횟수는 다른 방법들에 비하여 거의 최적에 가까운 접근 횟수를 가지나 주 기억 장치에서 최소-힘을 이용하여 수행하는 일차적 가지 제거 작업의 오버 로더는 간과되었다. 우리는 기존에 알려진 재귀적으로 공간을 두개의 부 공간으로 분할하는 방법을 사용하여 VA-File 과 같은 디렉토리 자료구조를 구축하여 k-NN 실험을 하였다. 이러한 분할된 MBH의 정방형성을 선호하는 방법은 저장 효율성을 보장한다. 실제 데이터에 대한 실험에서 우리가 실험한 간단한 방법은 디스크 접근 시간 및 CPU 시간을 합한 전체 수행시간에서 VA-File에 비하여 최대 93% 정도의 성능 향상이 있다.

  • PDF