• 제목/요약/키워드: nearest neighbors

검색결과 222건 처리시간 0.033초

지식발견 기반의 고속도로 영업소 분할 교통수요 예측 (Prediction of Divided Traffic Demands Based on Knowledge Discovery at Expressway Toll Plaza)

  • 안병탁;윤병조
    • 대한토목학회논문집
    • /
    • 제36권3호
    • /
    • pp.521-528
    • /
    • 2016
  • 고속도로의 주요 영업소 톨부스는 일반적으로 2개 차종(경차포함 승용차, 승용차 이외의 중차량)의 교통수요 변동에 따른 사전 대응방식으로 각 차종에 대하여 운영된다. 이러한 의미에서 2개 차종에 대한 정확한 교통량 예측은 영업소의 첨단 운영에 있어 주요 요소 중 하나이다. 유감스럽게도, 기존 연구로 보고된 현행의 일변량 단기 예측 기법들을 이용하여 2개 차종의 교통량을 동시에 예측하기는 용이하지 않다. 이러한 실용적 학술적 배경으로 인해 수용 가능한 정확도의 수준에서 2개 차종의 장래 교통량 예측은 ITS 예측 분야의 매력적인 연구 주제 중 하나이다. 따라서 본 연구에서는 기존의 일변량 단기 예측기법의 단점을 극복함과 더불어 2개 차종의 교통량을 동시에 예측하기 위한 다중 입출력(Multiple In-and-Out, MIO) 모형을 제시하도록 한다. 제안된 MIO 모형은 대용량 이력자료의 실시간 이용이 가능한 자료 환경에서 비모수 접근법을 기반으로 개발되었다. 실제 자료를 이용한 적용가능 실험에서, 개발모형은 다변량 예측 수준에도 불구하고 폭 넓게 이용되는 일변량 예측모형 중 하나인 Kalman filtering에 비하여 예측 정확도 측면에서 우수하게 나타났다.

고추 세균성 점무늬병원균(Xanthomonas axonopodis pv. vesicatoria)의 항균활성 Streptomyces sp. JR-24 균주의 분리 및 분류학적 특성 (Isolation and Taxonomical Characterization of Streptomyces sp. JR-24 with Antibacterial Activity of Bacterial Leaf Spot of Pepper (Xanthomonas axonopodis pv. vesicatoria))

  • 한송이;이효진;황경숙
    • 미생물학회지
    • /
    • 제46권4호
    • /
    • pp.359-365
    • /
    • 2010
  • 조릿대 근권토양으로부터 분리한 방선균 50균주를 대상으로 고추 세균성 점무늬병원균(Xanthomonas axonopodis pv. vesicatoria)의 항균활성 12균주를 선발하였다. 이들 항균활성 12균주의 계통학적 위치를 검토한 결과, 모두 Streptomyces 속의 Cluster II에 속하는 특징을 나타내었다. JR-24 균주는 최소저해 농도(MIC) 10 ${\mu}l$/disc를 나타내었으며, 배양액 5 ${\mu}l$/ml를 처리 하여 12시간 배양한 결과 Xanthomonas axonopodis pv. vesicatoria에 강한 생육저해효과를 나타내어 최우수 균주로 선발되었다. 항균활성 균주 JR-24의 16S rRNA 유전자 염기서열을 검토한 결과, Streptomyces galbus $DSM40089^T$ (X79852)와 98.1%, Streptomyces longwoodensis $LMG20096^T$ (AJ781356)와 98% 그리고 Streptomyces capoamus $JCM4734^T$ (AB045877)와 97.8%의 상동성을 나타내었다. API 20NE와 API 50CHE를 이용하여 JR-24 균주의 생리 생화학적 특성을 확인한 결과, L-arabinose, D-fructose, D-glucose, D-galactose을 이용하며 gelatin, protein, starch에 대하여 분해능이 있는 것으로 확인되었다. 주요지방산으로는 iso-$C_{14:0}$ (25.93%), iso-$C_{15:0}$ (10.13%), anteiso-$C_{15:0}$ (19.29%) 그리고 iso-$C_{16:0}$ (20.35%) 등을 함유하였으며, 퀴논종은 MK-9 ($H_4$) 4.37%, MK-9 ($H_6$) 51.22% 그리고 MK-9 ($H_8$) 49.47%로 동정되었다. Streptomyces sp. JR-24 균주의 계통학적 특성을 근연종인 Streptomyces galbus $DSM40089^T$와 비교한 결과, 다수의 표현형적 및 계통학적 차이를 나타내었다. 본 연구에서 분리된 Streptomyces sp. JR-24는 친환경 미생물제제 개발을 위한 유전자원 확보에 있어서 매우 큰의의가 있을 것으로 사료 된다.

협업필터링 기법을 이용한 모바일 광고 추천 시스템 (Using collaborative filtering techniques Mobile ad recommendation system)

  • 김은숙;윤성대
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.3-6
    • /
    • 2012
  • 최근 모바일 시장이 급속도로 성장함에 따라, 현대인들은 컴퓨터가 가지는 여러가지 제약들을 극복하여 원하는 정보를 빠르게 얻을 수 있는 수단으로 모바일 컨텐츠 사용이 늘고 있다. 그러나 광범위한 콘텐츠의 추천으로 콘텐츠의 선택에 있어 많은 시간이 소요된다. 이러한 문제점을 해결하기 위해 사용자가 원하는 콘텐츠를 예측하여 정확하게 추천해 줄 수 있는 시스템이 필요하다. 본 논문에서는 이러한 사용자들의 요구에 맞추어 원하는 컨텐츠를 제공하기 위하여 협업필터링을 이용하여 추천의 선택 횟수를 높일 수 있는 방법을 제시한다. 첫번째 단계에서 대분류로 카테고리를 구분하여 목표고객과 사용자간의 유사도를 구하고, 최근접 이웃을 구성하여 대분류 카테고리간 선호도 예측값을 구하여 가장 높은 대분류 카테고리를 목표고객에게 추천한다. 두 번째 단계에서 소분류 카테고리 간 선호도 예측값을 구하여 가장 높은 소분류 카테고리를 목표고객에게 추천한다. 실험에서 대분류 카테고리 기반 협업필터링으로 모바일 컨텐츠를 추천하고, 소분류 카테고리 기반 협업필터링으로 모바일 컨텐츠를 추천해 두 가지 방법의 결과를 비교하여 소분류 카테고리 기반 협업필터링의 방법이 선택 횟수가 높다는 것을 검증하였다.

  • PDF

주파수 공간상의 특징 데이터를 활용한 손목에 부착된 가속도 센서 기반의 낙상 감지 (Fall detection based on acceleration sensor attached to wrist using feature data in frequency space)

  • 노정현;김진헌
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.31-38
    • /
    • 2021
  • 낙상사고는 언제, 어디에서 일어날지 예측하기 어렵다. 또한 신속한 후속 조치가 수행되지 않으면 생명의 위협으로 이어지므로 낙상사고를 자동으로 감지할 수 있는 연구가 필요하게 되었다. 자동적인 낙상사고 감지기법 중 손목에 부착된 IMU 센서를 활용한 기법은 움직임이 많아 낙상사고 검출이 어렵지만, 착용의 간편함과 접근성이 뛰어난 기법으로 인식되고 있다. 낙상 데이터 확보의 어려움을 극복하기 위해 본 연구는 KNN과 SVM과 같은 머신러닝으로 적은 데이터를 효율적으로 학습하는 알고리즘을 제안한다. 또한, 이들 수학적 분류기의 성능을 높이기 위해 본 연구에서는 주파수 공간에서 취득한 특징 데이터를 활용하였다. 제안된 알고리즘은 표준 데이터세트를 활용한 실험을 통해 모델의 파라미터와 주파수 특징 추출기의 파라미터를 다각화하여 그 영향을 분석하였다. 제안된 알고리즘은 학습 데이터를 확보하기 어려운 현실적인 문제에 적절히 대처할 수 있었다. 또한 본 알고리즘이 다른 분류기보다 경량화되어 있기 때문에 SIMD(Single Instruction Multiple Data) 처리장치 탑재가 어려운 소형 임베디드시스템에도 구현이 용이했다.

기계학습을 활용한 오리사 바닥재 수분 발생량 분석 (Estimation of Duck House Litter Evaporation Rate Using Machine Learning)

  • 김다인;이인복;여욱현;이상연;박세준;크리스티나;김준규;최영배;조정화;정효혁;강솔뫼
    • 한국농공학회논문집
    • /
    • 제63권6호
    • /
    • pp.77-88
    • /
    • 2021
  • Duck industry had a rapid growth in recent years. Nevertheless, researches to improve duck house environment are still not sufficient enough. Moisture generation of duck house litter is an important factor because it may cause severe illness and low productivity. However, the measuring process is difficult because it could be disturbed with animal excrements and other factors. Therefore, it has to be calculated according to the environmental data around the duck house litter. To cut through all these procedures, we built several machine learning regression model forecasting moisture generation of litter by measured environment data (air temperature, relative humidity, wind velocity and water contents). 5 models (Multi Linear Regression, k-Nearest Neighbors, Support Vector Regression, Random Forest and Deep Neural Network). have been selected for regression. By using R-Square, RMSE and MAE as evaluation metrics, the best accurate model was estimated according to the variables for each machine learning model. In addition, to address the small amount of data acquired through lab experiments, bootstrapping method, a technique utilized in statistics, was used. As a result, the most accurate model selected was Random Forest, with parameters of n-estimator 200 by bootstrapping the original data nine times.

DTW-kNN 기반의 유망 기술 식별을 위한 의사결정 지원 시스템 구현 방안 (Implementation of DTW-kNN-based Decision Support System for Discriminating Emerging Technologies)

  • 정도헌;박주연
    • 산업융합연구
    • /
    • 제20권8호
    • /
    • pp.77-84
    • /
    • 2022
  • 본 연구는 기계 학습 기반의 자동 분류 기법을 적용함으로써 유망 기술의 선정 과정에 활용할 수 있는 의사결정 지원 시스템의 구현 방안을 제시하는 것을 목표로 한다. 연구 수행을 위해 전체 시스템의 아키텍처를 구축하고 세부 연구 단계를 진행하였다. 우선, 유망 기술 후보 아이템을 선정하고 빅데이터 시스템을 활용하여 추세 데이터를 자동 생성하였다. 기술 발전의 개념 모델과 패턴 분류 체계를 정의한 후 자동 분류 실험을 통해 효율적인 기계 학습 방안을 제시하였다. 마지막으로 시스템의 분석 결과를 해석하고 활용 방안을 도출하고자 하였다. 본 연구에서 제안한 동적 시간 와핑(DTW) 기법과 k-최근접 이웃(kNN) 분류 모델을 결합한 DTW-kNN 기반의 분류 실험에서 최대 87.7%의 식별 성능을 보여주었으며, 특히 추세의 변동이 심한 'eventual' 정의 구간에서는 유클리디언 거리(ED) 알고리즘 대비 39.4% 포인트의 최대 성능 차이를 보여주어 제안 모델의 우수함을 확인할 수 있었다. 또한, 시스템이 제시하는 분석 결과를 통해, 대량의 추세 데이터를 입력받아 유형별로 자동 분류하고 필터링하는 과정에 본 의사결정 지원 시스템을 효과적으로 활용할 수 있음을 확인하였다.

단행본 서명의 단어 임베딩에 따른 자동분류의 성능 비교 (Performance Comparison of Automatic Classification Using Word Embeddings of Book Titles)

  • 이용구
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.307-327
    • /
    • 2023
  • 이 연구는 짧은 텍스트인 서명에 단어 임베딩이 미치는 영향을 분석하기 위해 Word2vec, GloVe, fastText 모형을 이용하여 단행본 서명을 임베딩 벡터로 생성하고, 이를 분류자질로 활용하여 자동분류에 적용하였다. 분류기는 k-최근접 이웃(kNN) 알고리즘을 사용하였고 자동분류의 범주는 도서관에서 도서에 부여한 DDC 300대 강목을 기준으로 하였다. 서명에 대한 단어 임베딩을 적용한 자동분류 실험 결과, Word2vec와 fastText의 Skip-gram 모형이 TF-IDF 자질보다 kNN 분류기의 자동분류 성능에서 더 우수한 결과를 보였다. 세 모형의 다양한 하이퍼파라미터 최적화 실험에서는 fastText의 Skip-gram 모형이 전반적으로 우수한 성능을 나타냈다. 특히, 이 모형의 하이퍼파라미터로는 계층적 소프트맥스와 더 큰 임베딩 차원을 사용할수록 성능이 향상되었다. 성능 측면에서 fastText는 n-gram 방식을 사용하여 하부문자열 또는 하위단어에 대한 임베딩을 생성할 수 있어 재현율을 높이는 것으로 나타났다. 반면에 Word2vec의 Skip-gram 모형은 주로 낮은 차원(크기 300)과 작은 네거티브 샘플링 크기(3이나 5)에서 우수한 성능을 보였다.

Low-GloSea6 기상 예측 모델 기반의 비선형 회귀 기법 적용 연구 (A Study on Applying the Nonlinear Regression Schemes to the Low-GloSea6 Weather Prediction Model)

  • 박혜성;조예린;신대영;윤은옥;정성욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.489-498
    • /
    • 2023
  • 하드웨어의 성능 및 컴퓨팅 기술의 발전 덕분에 기후환경 변화를 대비하기 위해 기후예측 모델 또한 발전하고 있다. 한국 기상청은 GloSea6를 도입하여 슈퍼컴퓨터를 이용하여 기상 예측을 하고있으며, 각 대학 및 연구 기관에서는 중소규모 서버에서 사용하기 위해 저해상도 결합모델인 Low-GloSea6를 사용하여 기상 연구에 활용하고 있다. 본 논문에서는 중소규모 서버에서의 기상 연구의 원활한 연구를 위해 Low-GloSea6의 Intel VTune Profiler를 사용한 분석을 진행하였으며 1125.987초의 CPU Time을 수행하는 대기모델의 tri_sor_dp_dp 함수를 Hotspot으로 검출하였다. 수치적 연산을 진행하는 기존 함수에 머신러닝 기법의 하나인 비선형 회귀모델을 적용 및 비교하여 머신러닝 적용 가능성을 확인하였다. 기존 tri_sor_dp_dp 함수의 실제 연산되는 값인 1e-3 ~ 1e-20의 범위를 가지는 Output Data인 변수 "Px"를 기준으로 평가하였을때 K-최근접 이웃 회귀 모델은 MAE가 1.3637e-08, SMAPE가 123.2707%로 가장 우수하게 나타났으며 RMSE의 경우 Light Gradient Boosting Machine 회귀 모델이 2.8453e-08로 가장 우수한 성능을 보이는 것으로 측정되었다. 따라서 Low-GloSea6 수행 과정 중 tri_sor_dp_dp 함수의 데이터를 추출 후 비선형 회귀 모델을 적용한 결과로 기존의 tri_sor_dp_dp 함수의 수치적 연산 값과 K-최근접 이웃 회귀 모델을 비교하였을 때 SMAPE가 123.2707%의 오차가 발생하는 것으로 측정되어 기존 모듈의 대체 가능성이 있다는 것을 확인하였다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.