• 제목/요약/키워드: k-nearest neighborhood

검색결과 39건 처리시간 0.028초

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

A Spatial Analysis of the Causal Factors Influencing China's Air Pollution

  • Kim, Yoomi;Tanaka, Katsuya;Zhang, Xinxin
    • Asian Journal of Atmospheric Environment
    • /
    • 제11권3호
    • /
    • pp.194-201
    • /
    • 2017
  • This study investigates the factors that affect China's air pollution using city-level panel data and spatial econometric models. We address three air pollutants ($PM_{10}$, $SO_2$, and $NO_2$) present in 30 cities in China between 2004-2012 using global OLS and spatial models. To develop the spatial econometric analysis, we create a spatial weights matrix to define spatial patterns based on two neighborhood criteria - the queen contiguity and k nearest neighbors. The results show that the estimated coefficients are relatively consistent across different spatial weight criteria. The OLS models indicate that the effect of green spaces is statistically significant in decreasing the concentrations of all air pollutants. In the $PM_{10}$ and $SO_2$ analyses, the OLS models find that the number of buses and population density are also positively related to a reduction in the concentration of air pollutants. In addition, an increase in the temperature and the presence of secondary industries increase $SO_2$ and $NO_2$ concentrations, respectively. All spatial models capture a positive and significant effect of green spaces on reducing the concentration of each air pollutant. Our results suggest that green spaces in cities should receive priority consideration in local planning aimed at sustainable development. Furthermore, policymakers need to be able to discern the differences among pollutants when establishing environmental policies.

경계 보존 보간법을 이용한 깊이 영상의 해상도 및 품질 개선 (Depth map Resolution and Quality Enhancement based on Edge preserving interpolation)

  • 김지현;최진욱;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.39-41
    • /
    • 2011
  • 본 논문에서는 깊이 영상의 해상도와 품질을 향상시키는 방법을 제안한다. 일반적으로 2D-plus-Depth 구조의 3D 콘텐츠에서는 깊이 영상의 품질이 매우 중요하다. 최근 들어 Time-of-Flight (TOF) 방식의 깊이 센서가 깊이 영상 획득에 많이 사용되고 있는데 TOF 깊이 센서가 제공하는 깊이 영상은 저해상도이기 때문에 고해상도 3D 콘텐츠를 제작하기 위해서는 깊이 영상의 해상도를 상향 변환하는 것이 필수적이다. 또한 고품질의 깊이 영상을 얻기 위해서는 물체 간의 경계를 정교하게 보존하는 것이 중요하다. 최근에는 깊이 영상의 해상도 상향 변환을 위해서 Joint Bilateral Upsampling(JBU) 방식이 많이 사용되고 있다. 본 논문은 깊이 영상의 해상도를 높임에 있어서 우선 보간법을 수행하여 영상의 상향 변환 시에 생긴 빈 홀들의 값을 채워준 후 Bilateral Filtering을 수행함으로써 성능을 높인다. 일반적으로 영상을 상향 변환을 할 때 다양한 방법들이 있는데 본 논문에서는 Nearest Neighborhood(NN), Gaussian과 경계 보존 보간법, 경계 보존 보간법과 Fast Curvature Based Interpolation(FCBI)를 결합한 보간법을 사용하였다. 실험 결과 제안 방법이 기존 방법보다 우수한 성능을 가짐을 보여준다. 또한 경계 보존 보간법과 FCBI를 결합한 보간법을 이용해서 상향 변환을 수행한 결과가 다른 보간법들에 의한 결과보다 우수하다는 점을 알 수 있다.

  • PDF

디지털영상 국부정규화처리의 영역분할 구도 (Region-Segmental Scheme in Local Normalization Process of Digital Image)

  • 황중원;황재호
    • 대한전자공학회논문지SP
    • /
    • 제44권4호통권316호
    • /
    • pp.78-85
    • /
    • 2007
  • 영역들로 구성된 영상의 국부정규화처리 알고리즘에 내재된 분할 구도를 소개한다. 이동창에서 산출되는 국부통계치에 근거한 정규화적 접근은 선형 또는 비선형함수를 발생시켜 잡음 오염된 영역들의 화소분포와 근접유사 유형을 변형한다. 현재와 정규화된 영상신호 사이의 최근접 화소 이격거리에 대하여 평균과 표준편차를 조정하고 국부통계치와 파리미터 변동을 연계하여 영역간 분할 상태를 변화시킨다. 이러한 특성에 대하여 기존의 정규화 기법들과 본 연구에서 새로 고안한 국부정규화 기법이 비교 고찰된다. 그리고 실험결과는 국부정규화처리 실현에 의한 영역분할 성능을 보였다.

시각 기술자들의 앙상블 결합을 이용한 의료 영상 분류와 검색 (Medical Image Classification and Retrieval Using Ensemble Combination of Visual Descriptors )

  • 박기희;심정희;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.96-99
    • /
    • 2008
  • 본 논문은 의료 영상을 효과적으로 분류하고 검색 하기 위한 새로운 알고리즘을 제안한다. 의료 영상 중 X-Ray 영상은 어두운 배경에 반해 밝은 전경을 갖고 있기 때문에, 전경의 두드러진 부분에서만 시각 기술자로 추출한다. 우선, 색 구조 기술자(H-CSD)에서 해리스 코너 검출기로 검출한 관심 포인트들에서 색상 특징을 추출하고, 경계선 히스토그램 기술자에서 영상의 전역 및 지역적 질감 특징을 추출한다. 추출된 특징 벡터는 멀티클래스 SVM 에 적용되어 각 영상을 위한 멤버십 스코어를 얻는다. 이후, H-CSD와 EHD 에 대한 SVM 의 멤버십 스코어를 앙상블 결합하여 하나의 특징 벡터로 생성하고, K-nearest Neighborhood 방법을 이용하여 상위-K 개의 영상을 검색을 하도록 하였다. imageCLEFmed2007 을 이용한 실험 결과에서 다른 전역적 속성 또는 분류 기반 검색 방법에 비교하여 보다 개선된 검색 성능을 나타냄을 확인하였다.

협력 필터링 기반의 추천 시스템을 위한 이웃 선정 전략 (A Strategy for Neighborhood Selection in Collaborative Filtering-based Recommender Systems)

  • 이수정
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1380-1385
    • /
    • 2015
  • 협력 필터링은 가장 성공적으로 사용되는 추천 시스템의 방법으로서, 서적, 음악 등 다방면의 상업 시스템에서 활용되어왔다. 이러한 방법의 핵심은 사용자에게 가장 적합한 추천인들을 선정하는 것인데, 이를 위하여 다양한 유사도 측정 방법이 연구되었다. 본 연구에서는 추천 성능의 향상을 위하여 기존의 유사도 값에 근거한 추천인 선정의 문제점을 파악하고 이의 개선책으로서 유사도 값과 공통평가항목수의 비율을 기준으로 하여 가변적으로 추천인을 결정하는 방법을 제시한다. 실험을 통하여 다양한 기준값에 대해 성능 변화를 관찰한 결과, 예측 성능과 추천 성능의 두 측면 모두에서 제안 방법이 매우 향상된 결과를 가져왔으며, 특히 주어진 기준값을 만족하는 추천인 수가 적을 때에도 향상된 성능 결과를 보였다.

Study on the Take-over Performance of Level 3 Autonomous Vehicles Based on Subjective Driving Tendency Questionnaires and Machine Learning Methods

  • Hyunsuk Kim;Woojin Kim;Jungsook Kim;Seung-Jun Lee;Daesub Yoon;Oh-Cheon Kwon;Cheong Hee Park
    • ETRI Journal
    • /
    • 제45권1호
    • /
    • pp.75-92
    • /
    • 2023
  • Level 3 autonomous vehicles require conditional autonomous driving in which autonomous and manual driving are alternately performed; whether the driver can resume manual driving within a limited time should be examined. This study investigates whether the demographics and subjective driving tendencies of drivers affect the take-over performance. We measured and analyzed the reengagement and stabilization time after a take-over request from the autonomous driving system to manual driving using a vehicle simulator that supports the driver's take-over mechanism. We discovered that the driver's reengagement and stabilization time correlated with the speeding and wild driving tendency as well as driving workload questionnaires. To verify the efficiency of subjective questionnaire information, we tested whether the driver with slow or fast reengagement and stabilization time can be detected based on machine learning techniques and obtained results. We expect to apply these results to training programs for autonomous vehicles' users and personalized human-vehicle interfaces for future autonomous vehicles.

도시공원의 유형 및 입지적 특성이 공동주택가격에 미치는 영향 (Effects of Types and Locational Characteristics of Urban Parks on the Apartment Price)

  • 이고은;최열
    • 대한토목학회논문집
    • /
    • 제36권5호
    • /
    • pp.927-936
    • /
    • 2016
  • 본 연구는 도시공원의 유형 및 입지적 특성이 공동주택 가격에 미치는 영향을 분석하기 위한 논문으로 부산광역시 전체를 연구대상지로 설정하였다. 공원은 환경재로서 주변으로의 영향력이 크게 작용함에도 불구하고 기존 논문들의 경우 공원 자체만을 대상으로 가치를 평가한 연구가 대부분이다. 이에 본 연구에서는 공원과 인근 공동주택과의 관계를 분석함으로서 그 경제적 가치를 판단하고자 한다. 특히 공원과 공동주택 그 자체의 물리적 객관적 특성을 반영하였다는 점에서 의의를 가진다. 또한 공원의 유형을 세부적으로 나누어 분석함으로서 유형별 특징을 분석함에 주안점을 두었다. 분석결과 공동주택의 층수, 해당 단지의 총 세대수, 건설사 도급순위, 공원지정 경과년수, 부도심 입지여부 등이 주택가격에 양(+)의 영향을 미치는 것으로 나타났다. 반대로 공동주택의 면적, 건축연한, 공원 조성계획 수립여부, 공원과 공동주택과의 거리, 도심입지여부, 지역생활권 입지여부 등은 음(-)의 관계로 분석되었다. 특히 공원별 유형에서 근린공원, 소공원, 체육공원은 공동주택 가격에 양(+)의 관계를 보였으나 어린이 공원의 경우 음(-)의 관계로 나타났다. 공원과 공동주택의 거리가 가까울수록 공동주택의 가격이 오르는 것은 공원이 주는 다양한 이점을 많은 사람들이 선호하게 되는 것을 의미한다. 이에 공원의 가치를 높이고 조성으로 인한 효과를 최대화하기 위하여 좀 더 다양한 방안으로의 노력이 필요할 것으로 사료된다.

개미 군락 시스템을 이용한 계층적 클러스터 분석 (Ant Colony Hierarchical Cluster Analysis)

  • 강문수;최영식
    • 인터넷정보학회논문지
    • /
    • 제15권5호
    • /
    • pp.95-105
    • /
    • 2014
  • 본 논문에서는 방향그래프에서 개미가 한 노드에서 다른 노드들로 이동하는 새로운 개미 기반계층적 클러스터링 알고리즘을 제안한다. 노드페로몬은 로컬영역에서 상대 밀도값으로 간주될 수 있는 값으로 노드로 들어오는 에지들의 페로몬 양을 합한 것이다. 일정한 횟수만큼 개미들을 이동시킨 후 방향 그래프로부터 소량의 노드페로몬 값을 가진 노드들을 제거하고, 강하게 연결되어 있는 요소들을 하나의 클러스터로 구성한다. 반복적으로 낮은 값부터 높은 값까지 제거작업을 하여 계층적 클러스터들을 구축한다. 다양한 실험을 통해 제안하는 알고리즘과 기존 클러스터링 알고리즘을 비교하고 제안하는 알고리즘의 우수성을 실험을 통해 입증한다.

개인화 추천 시스템에서 FP-Tree를 이용한 연관 군집 방법 (Method of Associative Group Using FP-Tree in Personalized Recommendation System)

  • 조동주;임기욱;이정현;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권10호
    • /
    • pp.19-26
    • /
    • 2007
  • 협력적 필터링은 아이템에 대한 선호도를 기반으로 이웃 선정 방법을 사용하므로 내용을 반영하지 못할뿐만 아니라 희박성 및 확장성 문제를 가지고 있다. 이러한 문제를 개선하기 위하여 아이템 기반 협력적 필터링이 실용화되었으나 아이템의 속성을 반영하지는 못한다. 본 논문에서는 기존의 개인화 추천 시스템의 문제점을 해결하기 위하여 FP-Tree를 이용한 연관 군집 방법을 제안하였다. 제안된 방법으로는 FP-Tree를 이용하여 후보집합의 발생없이 빈발항목을 구성하고 연관규칙을 생성한다. 생성된 연관 규칙의 신뢰도에 따라서 $\alpha-cut$을 사용하여 효율적인 연관 군집을 한다. 성능평가를 위해 MovieLens 데이터 집합에서 Gibbs Sampling, EM, K-means와 비교 평가하였다.