• 제목/요약/키워드: K-최근이웃

검색결과 213건 처리시간 0.027초

스마트폰에서 사용자 감성정보를 이용한 개인화된 협업필터링 기반 애플리케이션 추천 시스템 (Application recommender system based on personalized collaborative-filtering using user's emotion information from smartphone)

  • 이창현;이승룡;정태충;윤석환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.224-226
    • /
    • 2012
  • 최근 스마트폰의 대중화와 더불어 스마트폰 애플리케이션의 공급과 수요 또한 활성화 되고 있다. 이에 스마트폰의 애플리케이션 시장 또한 활성화 되었다. 하지만 기하급수적으로 증가한 애플리케이션에 사용자가 자신에게 적합한 애플리케이션을 선택하기가 용이하지 않다. 이에 본 논문에서는 사용자 개인 정보와 감정을 이용한 애플리케이션 추천 시스템을 제안한다. 사용자 정보와 감정을 k-means 알고리즘을 이용하여 군집화를 시켜주었으며 사용자가 평가한 애플리케이션에 대한 만족도를 이용하여 유사도를 검출 및 추천하기 위하여 피어슨 상관계수와 교차추천을 이용하였다. 또한 협업 필터링의 신규 사용자에 대한 초기 평가치 부재에 의한 콜드 스타트(cold-start) 문제를 해결하기 위해 신규 사용자의 개인정보와 감성정보를 활용하여 기존 사용자와의 유사도를 비교한다. 이웃사용자를 추출하고 이웃사용자로부터 추천을 받는다. 즉, 추천시스템 데이터베이스 내의 정보가 충분한 사용자에게는 협업필터링을 그렇지 않은 신규 사용자에게는 협업필터링 대신 제시한 방법을 적용하는 하이브리드 추천 방법을 제안하였다.

병렬 Shifted Sort 알고리즘의 Warp 단위 CUDA 구현 최적화 (Optimization of Warp-wide CUDA Implementation for Parallel Shifted Sort Algorithm)

  • 박태정
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권4호
    • /
    • pp.739-745
    • /
    • 2017
  • 본 논문에서는 GPU 병렬 처리 하드웨어 아키텍처 내 최소 물리적 스레드 실행 단위(warp) 내에서 shifted sort 기반 k개 최근접 이웃 검색 기법을 구현하는 방법을 논의하고 일반적으로 동일한 목적으로 널리 사용되는 GPU 기반 kd-tree 및 CPU 기반 ANN 라이브러리와 비교한 결과를 제시한다. 또한 많은 애플리케이션에서 k가 비교적 작은 값이 필요한 경우가 많다는 사실을 고려해서 k가 warp 내부에서 직접 처리 가능한 2, 4, 8, 16개일 때 최적화에 집중한다. 구현 세부에서는 사용한 CUB 공개 라이브러리의 루프 내 메모리 관리 방법, GPU 하드웨어 직접 명령 적용 방법 등의 최적화 방법을 논의한다. 실험 결과, 제안하는 방법은 기존의 GPU 기반 유사 방법에 비해 데이터 지점과 질의 지점의 개수가 각각 $2^{23}$개 일 때 16배 이상의 빠른 처리 속도를 보였으며 이러한 경향은 처리해야 할 데이터의 크기가 커지면 더욱 더 커지는 것으로 판단된다.

DSRC와 TCS 정보를 이용한 고속도로 경로통행시간 예측 (Forecasting of Motorway Path Travel Time by Using DSRC and TCS Information)

  • 장현호;윤병조
    • 대한토목학회논문집
    • /
    • 제37권6호
    • /
    • pp.1033-1041
    • /
    • 2017
  • 출발지 기준 고속도로 경로 통행시간(PTTDP)은 첨단여행자정보시스템(ATIS)의 핵심 정보이다. 이러한 필요성에도 불구하고, 지능형교통체계(ITS)의 예측분야에서 PTTDP에 대한 연구는 성공적으로 극복해야할 핵심 도전과제중 하나로 남아있는 상태이다. 이러한 문제점을 효과적으로 극복하기 위하여, 본 연구에서는 고속도로 IC간 경로통행시간을 동적으로 예측하는 방법론을 제시하고자 한다. 제안된 모형은 고속도로망에서 TG의 교통수요와 TG간 출발지기준 경로통행시간간의 관계를 기반으로 개발되었다. 모형의 입력 자료로(TCS로 수집되는) 통행수요와(DSRC로 수집되는) 경로통행시간 자료가 이용되었다. 개발 모형은 고속도로 정보시스템에 탑재/운영하기 위하여 Data Ming 기법중 연산속도가 빠른 k-최근린 이웃을 이용하였다. 실제 자료를 이용한 적용 실험에서, 제안된 모형은 예측의 신뢰성과 연산수행속도 측면에서 ATIS에 적용이 가능한 수준의 성능을 보였다.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

기상 및 교통 자료를 이용한 교통류 안전성 판단 지표 개발 (Development of an Evaluation Index for Identifying Freeway Traffic Safety Based on Integrating RWIS and VDS Data)

  • 박현진;주신혜;오철
    • 대한교통학회지
    • /
    • 제32권5호
    • /
    • pp.441-451
    • /
    • 2014
  • 본 연구는 도로 기상정보 시스템(RWIS : Road Weather Information System)에서 수집되는 시정거리와 차량검지기(VDS : Vehicle Detection System)에서 수집되는 속도 자료를 이용하여 교통류 안전성을 판단하였다. 교통류의 안전성 측면에서 시정거리(VD : Visibility Distance)가 정지시거(SSD : Stopping Sight Distance)보다 길어야 이벤트 발생 시 안전하게 정지하거나 위험한 상황을 회피할 수 있다. 운전자에게 사고예방을 위한 능동적 대응이 가능하도록 하는 가치있는 정보를 제공하기 위해 최근접이웃 예측기법(KNN : K-Nearest Neighbors Method)을 활용하였다. 또한, 교통류 안전성에 대한 운전자의 이해도 증진 및 객관성을 위하여 안전성 지표(LOHSI : Level of Hazardous Spacing Index)를 제시하였다. 본 연구결과는 교통류의 안전성 향상을 위한 효율적인 교통운영을 지원 할 수 있을 것이다.

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

텍스트 마이닝 기법을 이용한 컴퓨터 네트워크의 침입 탐지 (Using Text Mining Techniques for Intrusion Detection Problem in Computer Network)

  • 오승준;원민관
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.27-32
    • /
    • 2005
  • 최근 들어 데이터 마이닝 기법을 컴퓨터 네트워크의 침입 탐지에 적용하려는 많은 연구가 진행되고 있다. 본 논문에서는 침입 탐지 분야에서 프로그램 행위가 정상적인지 비정상적인지를 분류하기 위한 방법을 연구한다. 이를 위해, 택스트 마이닝 기법중의 하나인 k 최근접 이웃 (kNN) 분류기를 이용한 새로운 방법을 제안한다. 본 논문에서는 택스트 분류 기법을 적용하기 위해 각각의 시스템 호출을 단어로 간주하고, 시스템 호출의 집합들을 문서로 간주한다. 이러한 문서들은 kNN 분류기를 이용하여 분류된다. 간단한 예제를 통하여 제안하는 절차를 소개한다.

  • PDF

녹색기술 분야의 융합 동향 분석 (Analyzing technological convergence trends in green technology)

  • 권영일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.337-338
    • /
    • 2016
  • 녹색기술정보포털 기사 정보와 회원정보를 이용하여 전체 녹색기술 분야에 대한 패스파인더 네트워크와 최근접 이웃 중심성을 도출하고 분야별 융합 동향을 분석하였다. 분석결과, 전체 녹색기술 분야 중에서 실리콘 태양전지 및 고효율 2차전지 등의 에너지 고효율화 분야에 대해 회원들의 관심이 높은 것으로 나타났으며, 실리콘 태양전지 분야에서 다른 녹색기술과의 융합이 가장 활발하게 이루어지는 것으로 분석되었다.

  • PDF

BEAUTY OF INTERLAYER EXCHANGE COUPLING IN SPINTRONICS DEVICES

  • You, Chun-Yeol
    • 한국자기학회:학술대회 개요집
    • /
    • 한국자기학회 2002년도 동계연구발표회 논문개요집
    • /
    • pp.20-21
    • /
    • 2002
  • 최근 자성 박막의 연구에 있어서 이웃한 두 자성체 층 간의 교환 상호 결합 작용(interlayer exchange coupling)은 매우 중요한 연구 분야중 하나이다. 80년대 말 처음 강한 층간 교환 상호 결합 작용이 발견된 이래로, 비자성 사이 층의 두께에 따라서 층간 교환 상호 작용이 요동하는 현상과 더불어서 소위 거대 자기 저항(giant magnetoresistance)이라고 불리는 현상의 발견은 자성 박막의 나노 시대를 열었다고 해도 과언이 아니었다. (중략)

  • PDF

Machine Learning Methods to Predict Vehicle Fuel Consumption

  • Ko, Kwangho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구에서는 주행 차량의 실시간 연료소모량을 예측할 수 있는 머신러닝 기법을 제안하고 그 특성을 분석하였다. 머신러닝 학습을 위해 실도로 주행을 실시하여 주행 속도, 가속도, 도로 구배와 함께 연료소모량을 측정하였다. 특성 데이터로 속도, 가속도, 도로구배를, 타깃으로 연료소모량을 지정하여 다양한 머신러닝 모델을 학습시켰다. 회귀법에 해당하는 K-최근접이웃회귀 및 선형회귀와 함께, 분류법에 해당하는 K-최근접이웃분류, 로지스틱회귀, 결정트리, 랜덤포레스트, 그래디언부스팅을 사용하였다. 실시간 연료소모량에 대한 예측 정확도는 0.5 ~ 0.6 수준으로 전반적으로 낮았고, 회귀법의 경우 분류법보다 정확도가 떨어졌다. 총연료소모량에 대한 예측 오차는 0.2 ~ 2.0% 수준으로 상당히 정확했고, 분류법보다 회귀법의 오차가 더 낮았다. 이는 예측 정확도의 기준으로 결정계수(R2)를 사용했기 때문인데, 이 값이 작을수록 타깃의 평균 부근에 예측치가 좁게 분포하기 때문이다. 따라서 실시간 연료소모량 예측에는 분류법이, 총연료소모량 예측에는 회귀법이 적합하다고 할 수 있다.