• 제목/요약/키워드: k-Nearest neighbors

검색결과 201건 처리시간 0.025초

개념 및 관계 분류를 통한 분야 온톨로지 구축 (Building Domain Ontology through Concept and Relation Classification)

  • 황금하;신지애;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.562-571
    • /
    • 2008
  • 본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 iso와 기타 관계(non-isa관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다.

지식발견 기반의 고속도로 영업소 분할 교통수요 예측 (Prediction of Divided Traffic Demands Based on Knowledge Discovery at Expressway Toll Plaza)

  • 안병탁;윤병조
    • 대한토목학회논문집
    • /
    • 제36권3호
    • /
    • pp.521-528
    • /
    • 2016
  • 고속도로의 주요 영업소 톨부스는 일반적으로 2개 차종(경차포함 승용차, 승용차 이외의 중차량)의 교통수요 변동에 따른 사전 대응방식으로 각 차종에 대하여 운영된다. 이러한 의미에서 2개 차종에 대한 정확한 교통량 예측은 영업소의 첨단 운영에 있어 주요 요소 중 하나이다. 유감스럽게도, 기존 연구로 보고된 현행의 일변량 단기 예측 기법들을 이용하여 2개 차종의 교통량을 동시에 예측하기는 용이하지 않다. 이러한 실용적 학술적 배경으로 인해 수용 가능한 정확도의 수준에서 2개 차종의 장래 교통량 예측은 ITS 예측 분야의 매력적인 연구 주제 중 하나이다. 따라서 본 연구에서는 기존의 일변량 단기 예측기법의 단점을 극복함과 더불어 2개 차종의 교통량을 동시에 예측하기 위한 다중 입출력(Multiple In-and-Out, MIO) 모형을 제시하도록 한다. 제안된 MIO 모형은 대용량 이력자료의 실시간 이용이 가능한 자료 환경에서 비모수 접근법을 기반으로 개발되었다. 실제 자료를 이용한 적용가능 실험에서, 개발모형은 다변량 예측 수준에도 불구하고 폭 넓게 이용되는 일변량 예측모형 중 하나인 Kalman filtering에 비하여 예측 정확도 측면에서 우수하게 나타났다.

고추 세균성 점무늬병원균(Xanthomonas axonopodis pv. vesicatoria)의 항균활성 Streptomyces sp. JR-24 균주의 분리 및 분류학적 특성 (Isolation and Taxonomical Characterization of Streptomyces sp. JR-24 with Antibacterial Activity of Bacterial Leaf Spot of Pepper (Xanthomonas axonopodis pv. vesicatoria))

  • 한송이;이효진;황경숙
    • 미생물학회지
    • /
    • 제46권4호
    • /
    • pp.359-365
    • /
    • 2010
  • 조릿대 근권토양으로부터 분리한 방선균 50균주를 대상으로 고추 세균성 점무늬병원균(Xanthomonas axonopodis pv. vesicatoria)의 항균활성 12균주를 선발하였다. 이들 항균활성 12균주의 계통학적 위치를 검토한 결과, 모두 Streptomyces 속의 Cluster II에 속하는 특징을 나타내었다. JR-24 균주는 최소저해 농도(MIC) 10 ${\mu}l$/disc를 나타내었으며, 배양액 5 ${\mu}l$/ml를 처리 하여 12시간 배양한 결과 Xanthomonas axonopodis pv. vesicatoria에 강한 생육저해효과를 나타내어 최우수 균주로 선발되었다. 항균활성 균주 JR-24의 16S rRNA 유전자 염기서열을 검토한 결과, Streptomyces galbus $DSM40089^T$ (X79852)와 98.1%, Streptomyces longwoodensis $LMG20096^T$ (AJ781356)와 98% 그리고 Streptomyces capoamus $JCM4734^T$ (AB045877)와 97.8%의 상동성을 나타내었다. API 20NE와 API 50CHE를 이용하여 JR-24 균주의 생리 생화학적 특성을 확인한 결과, L-arabinose, D-fructose, D-glucose, D-galactose을 이용하며 gelatin, protein, starch에 대하여 분해능이 있는 것으로 확인되었다. 주요지방산으로는 iso-$C_{14:0}$ (25.93%), iso-$C_{15:0}$ (10.13%), anteiso-$C_{15:0}$ (19.29%) 그리고 iso-$C_{16:0}$ (20.35%) 등을 함유하였으며, 퀴논종은 MK-9 ($H_4$) 4.37%, MK-9 ($H_6$) 51.22% 그리고 MK-9 ($H_8$) 49.47%로 동정되었다. Streptomyces sp. JR-24 균주의 계통학적 특성을 근연종인 Streptomyces galbus $DSM40089^T$와 비교한 결과, 다수의 표현형적 및 계통학적 차이를 나타내었다. 본 연구에서 분리된 Streptomyces sp. JR-24는 친환경 미생물제제 개발을 위한 유전자원 확보에 있어서 매우 큰의의가 있을 것으로 사료 된다.

Low-GloSea6 기상 예측 모델 기반의 비선형 회귀 기법 적용 연구 (A Study on Applying the Nonlinear Regression Schemes to the Low-GloSea6 Weather Prediction Model)

  • 박혜성;조예린;신대영;윤은옥;정성욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.489-498
    • /
    • 2023
  • 하드웨어의 성능 및 컴퓨팅 기술의 발전 덕분에 기후환경 변화를 대비하기 위해 기후예측 모델 또한 발전하고 있다. 한국 기상청은 GloSea6를 도입하여 슈퍼컴퓨터를 이용하여 기상 예측을 하고있으며, 각 대학 및 연구 기관에서는 중소규모 서버에서 사용하기 위해 저해상도 결합모델인 Low-GloSea6를 사용하여 기상 연구에 활용하고 있다. 본 논문에서는 중소규모 서버에서의 기상 연구의 원활한 연구를 위해 Low-GloSea6의 Intel VTune Profiler를 사용한 분석을 진행하였으며 1125.987초의 CPU Time을 수행하는 대기모델의 tri_sor_dp_dp 함수를 Hotspot으로 검출하였다. 수치적 연산을 진행하는 기존 함수에 머신러닝 기법의 하나인 비선형 회귀모델을 적용 및 비교하여 머신러닝 적용 가능성을 확인하였다. 기존 tri_sor_dp_dp 함수의 실제 연산되는 값인 1e-3 ~ 1e-20의 범위를 가지는 Output Data인 변수 "Px"를 기준으로 평가하였을때 K-최근접 이웃 회귀 모델은 MAE가 1.3637e-08, SMAPE가 123.2707%로 가장 우수하게 나타났으며 RMSE의 경우 Light Gradient Boosting Machine 회귀 모델이 2.8453e-08로 가장 우수한 성능을 보이는 것으로 측정되었다. 따라서 Low-GloSea6 수행 과정 중 tri_sor_dp_dp 함수의 데이터를 추출 후 비선형 회귀 모델을 적용한 결과로 기존의 tri_sor_dp_dp 함수의 수치적 연산 값과 K-최근접 이웃 회귀 모델을 비교하였을 때 SMAPE가 123.2707%의 오차가 발생하는 것으로 측정되어 기존 모듈의 대체 가능성이 있다는 것을 확인하였다.

협업필터링 기법을 이용한 모바일 광고 추천 시스템 (Using collaborative filtering techniques Mobile ad recommendation system)

  • 김은숙;윤성대
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.3-6
    • /
    • 2012
  • 최근 모바일 시장이 급속도로 성장함에 따라, 현대인들은 컴퓨터가 가지는 여러가지 제약들을 극복하여 원하는 정보를 빠르게 얻을 수 있는 수단으로 모바일 컨텐츠 사용이 늘고 있다. 그러나 광범위한 콘텐츠의 추천으로 콘텐츠의 선택에 있어 많은 시간이 소요된다. 이러한 문제점을 해결하기 위해 사용자가 원하는 콘텐츠를 예측하여 정확하게 추천해 줄 수 있는 시스템이 필요하다. 본 논문에서는 이러한 사용자들의 요구에 맞추어 원하는 컨텐츠를 제공하기 위하여 협업필터링을 이용하여 추천의 선택 횟수를 높일 수 있는 방법을 제시한다. 첫번째 단계에서 대분류로 카테고리를 구분하여 목표고객과 사용자간의 유사도를 구하고, 최근접 이웃을 구성하여 대분류 카테고리간 선호도 예측값을 구하여 가장 높은 대분류 카테고리를 목표고객에게 추천한다. 두 번째 단계에서 소분류 카테고리 간 선호도 예측값을 구하여 가장 높은 소분류 카테고리를 목표고객에게 추천한다. 실험에서 대분류 카테고리 기반 협업필터링으로 모바일 컨텐츠를 추천하고, 소분류 카테고리 기반 협업필터링으로 모바일 컨텐츠를 추천해 두 가지 방법의 결과를 비교하여 소분류 카테고리 기반 협업필터링의 방법이 선택 횟수가 높다는 것을 검증하였다.

  • PDF

이동객체를 위한 질의처리 컴포넌트의 설계 및 구현 (Design and Implementation of Query Processor for Moving Objects)

  • 김경숙;권오제;변희영;조대수;김태완;이기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.31-50
    • /
    • 2004
  • 무선통신망과 GPS(Global Positioning System)를 탑재한 모바일 단말기의 발달로 사람이나 사물의 위치정보를 파악하고 이용하는 위치기반 서비스의 영역이 확대되고 있다. 위치기반서비스와 같은 응용분야에서는 시간에 따라 연속적으로 움직이는 이동객체를 효율적으로 저장하고 처리할 수 있는 데이터베이스가 주요한 기술이다. 본 논문에서는 이동객체 데이터베이스를 개발하기 위한 하나의 서브시스템으로서, 이동객체에 대한 질의를 처리하기 위한 컴포넌트를 설계 및 개발한다. 이동객체에 대한 질의를 처리하기 위해서 대표적인 질의표현 및 처리방법을 조사하고, 기존에 개발된 이동객체에 대한 데이터모델과 연산자를 기반으로 SQL형태의 이동객체 질의어를 새로이 정의한다. 사용자는 본 연구에서 제공하는 이동객체 질의어를 이용하여 이동객체의 위치정보에 대한 영역질의, 위상질의, 궤적질의, 최근접질의 등을 표현할 수 있다. 이동객체 질의처리 컴포넌트는 각 질의 들을 분석한 후 이를 효율적으로 처리하기 위한 모듈들을 설계하고 구현한다. 또한, 다른 이동객체 응용시스템을 개발할 때 본 시스템의 활용을 높일 수 있도록 ADO.NET 인터페이스를 제공하고 XML을 이용하여 질의의 결과를 표현할 수 있는 기능을 제공한다.

  • PDF

주파수 공간상의 특징 데이터를 활용한 손목에 부착된 가속도 센서 기반의 낙상 감지 (Fall detection based on acceleration sensor attached to wrist using feature data in frequency space)

  • 노정현;김진헌
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.31-38
    • /
    • 2021
  • 낙상사고는 언제, 어디에서 일어날지 예측하기 어렵다. 또한 신속한 후속 조치가 수행되지 않으면 생명의 위협으로 이어지므로 낙상사고를 자동으로 감지할 수 있는 연구가 필요하게 되었다. 자동적인 낙상사고 감지기법 중 손목에 부착된 IMU 센서를 활용한 기법은 움직임이 많아 낙상사고 검출이 어렵지만, 착용의 간편함과 접근성이 뛰어난 기법으로 인식되고 있다. 낙상 데이터 확보의 어려움을 극복하기 위해 본 연구는 KNN과 SVM과 같은 머신러닝으로 적은 데이터를 효율적으로 학습하는 알고리즘을 제안한다. 또한, 이들 수학적 분류기의 성능을 높이기 위해 본 연구에서는 주파수 공간에서 취득한 특징 데이터를 활용하였다. 제안된 알고리즘은 표준 데이터세트를 활용한 실험을 통해 모델의 파라미터와 주파수 특징 추출기의 파라미터를 다각화하여 그 영향을 분석하였다. 제안된 알고리즘은 학습 데이터를 확보하기 어려운 현실적인 문제에 적절히 대처할 수 있었다. 또한 본 알고리즘이 다른 분류기보다 경량화되어 있기 때문에 SIMD(Single Instruction Multiple Data) 처리장치 탑재가 어려운 소형 임베디드시스템에도 구현이 용이했다.

기계학습을 활용한 오리사 바닥재 수분 발생량 분석 (Estimation of Duck House Litter Evaporation Rate Using Machine Learning)

  • 김다인;이인복;여욱현;이상연;박세준;크리스티나;김준규;최영배;조정화;정효혁;강솔뫼
    • 한국농공학회논문집
    • /
    • 제63권6호
    • /
    • pp.77-88
    • /
    • 2021
  • Duck industry had a rapid growth in recent years. Nevertheless, researches to improve duck house environment are still not sufficient enough. Moisture generation of duck house litter is an important factor because it may cause severe illness and low productivity. However, the measuring process is difficult because it could be disturbed with animal excrements and other factors. Therefore, it has to be calculated according to the environmental data around the duck house litter. To cut through all these procedures, we built several machine learning regression model forecasting moisture generation of litter by measured environment data (air temperature, relative humidity, wind velocity and water contents). 5 models (Multi Linear Regression, k-Nearest Neighbors, Support Vector Regression, Random Forest and Deep Neural Network). have been selected for regression. By using R-Square, RMSE and MAE as evaluation metrics, the best accurate model was estimated according to the variables for each machine learning model. In addition, to address the small amount of data acquired through lab experiments, bootstrapping method, a technique utilized in statistics, was used. As a result, the most accurate model selected was Random Forest, with parameters of n-estimator 200 by bootstrapping the original data nine times.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.