• 제목/요약/키워드: $k$NN

검색결과 791건 처리시간 0.031초

분류와 사용자 질의어 정보에 기반한 개인화 검색 시스템 (A Personalized Retrieval System Based on Classification and User Query)

  • 김광영;심강섭;곽승진
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.163-180
    • /
    • 2009
  • 본 논문은 사용자가 검색에 사용한 질의어를 기반으로 개인의 성향정보를 분석하고자 한다. 이를 위하여 사용자가 검색을 하기 위해서 입력한 질의어를 문서분류기를 이용하여 범주를 부여한다. 본 연구에서는 각 레코드에 미리 부여된 DDC 분류코드를 분류정보로 활용하였다. 이러한 방식을 사용하여 사용자의 질의어를 기반으로 개인의 특징을 분석한다. 분석된 개인의 성향정보를 검색 결과에 반영하고 개인의 의도에 맞는 문서를 재순위화시키는 개인화 검색시스템을 개발하였다. 또한 개인의 성향정보를 이용하여 단어의 중의성 문제를 해결할 수 있었다. 본 논문에서는 한국과학기술정보연구원이 운영 중인 과학기술학회마을 데이터베이스를 이용하여 개인화와 단어중의성 해소에 관한 실험을 수행하였다. 실험과 사용자 평가를 통해서 개인화 검색 및 단어중의성 해소 성능을 제시하였다.

잠재 의미 색인 기법을 이용한 국제 특허 분류 (International Patent Classificaton Using Latent Semantic Indexing)

  • 진훈태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1294-1297
    • /
    • 2013
  • 본 논문은 기계학습을 통하여 특허문서를 국제 특허 분류(IPC) 기준에 따라 자동으로 분류하는 시스템에 관한 연구로 잠재 의미 색인 기법을 이용하여 분류의 성능을 높일 수 있는 방법을 제안하기 위한 연구이다. 종래 특허문서에 관한 IPC 자동 분류에 관한 연구가 단어 매칭 방식의 색인 기법에 의존해서 이루어진바가 있으나, 현대 기술용어의 발생 속도와 다양성 등을 고려할 때 특허문서들 간의 관련성을 분석하는데 있어서는 단어 자체의 빈도 보다는 용어의 개념에 의한 접근이 보다 효과적일 것이라 판단하여 잠재 의미 색인(LSI) 기법에 의한 분류에 관한 연구를 하게 된 것이다. 실험은 단어 매칭 방식의 색인 기법의 대표적인 자질선택 방법인 정보획득량(IG)과 카이제곱 통계량(CHI)을 이용했을 때의 성능과 잠재 의미 색인 방법을 이용했을 때의 성능을 SVM, kNN 및 Naive Bayes 분류기를 사용하여 분석하고, 그중 가장 성능이 우수하게 나오는 SVM을 사용하여 잠재 의미 색인에서 명사가 해당 용어의 개념적 의미 구조를 구축하는데 기여하는 정도가 어느 정도인지 평가함과 아울러, LSI 기법 이용시 최적의 성능을 나타내는 특이값의 범위를 실험을 통해 비교 분석 하였다. 분석결과 LSI 기법이 단어 매칭 기법(IG, CHI)에 비해 우수한 성능을 보였으며, SVM, Naive Bayes 분류기는 단어 매칭 기법에서는 비슷한 수준을 보였으나, LSI 기법에서는 SVM의 성능이 월등이 우수한 것으로 나왔다. 또한, SVM은 LSI 기법에서 약 3%의 성능 향상을 보였지만 Naive Bayes는 오히려 20%의 성능 저하를 보였다. LSI 기법에서 명사가 잠재적 의미 구조에 미치는 영향은 모든 단어들을 내용어로 한 경우 보다 약 10% 더 향상된 결과를 보여주었고, 특이값의 범위에 따른 성능 분석에 있어서는 30% 수준에 Rank 되는 범위에서 가장 높은 성능의 결과가 나왔다.

GPS 재밍탐지를 위한 기계학습 적용 및 성능 분석 (Application and Performance Analysis of Machine Learning for GPS Jamming Detection)

  • 정인환
    • 한국정보기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.47-55
    • /
    • 2019
  • 최근 GPS 재밍으로 인한 피해가 증가되면서 GPS 재밍을 탐지하고 대비하기 위한 연구가 활발히 진행되고 있다. 본 논문은 다중 GPS 수신채널과 3가지 기계학습을 이용한 GPS 재밍 탐지 방법을 다루고 있다. 제안된 다중 GPS 채널은 항재밍 기능이 없는 상용 GPS 수신기와 항잡음 재밍능력만 있는 수신기, 항잡음/항기만 재밍능력이 있는 수신기로 구성되고 운용자는 각각의 수신기에 수신된 좌표를 비교하여 재밍신호의 특성을 식별할 수 있다. 본 논문에서는 신호특성이 다른 각각의 5개 재밍신호를 입력하고, 3가지 기계학습방법(AB: Adaptive Boosting, SVM: Support Vector Machine, DT: Decision Tree)을 이용하여 재밍탐지 시험을 수행하였다. 시험 결과 머신러닝 기법을 단독으로 사용하였을 때 DT 기법이 96.9% 탐지율로 가장 우수한 성능을 보였으며 이진분류기 기법에 비해 모호성 낮고 하드웨어가 단순하여 GPS 재밍탐지에 효과적임을 확인하였다. 또한, 모호성을 해결해주는 추가기법을 적용할 경우 SVM 기법을 활용할 수 있음을 확인하였다.

스마트폰 과의존 판별을 위한 기계 학습 기법의 응용 (Application of Machine Learning Techniques for Problematic Smartphone Use)

  • 김우성;한준희
    • 아태비즈니스연구
    • /
    • 제13권3호
    • /
    • pp.293-309
    • /
    • 2022
  • Purpose - The purpose of this study is to explore the possibility of predicting the degree of smartphone overdependence based on mobile phone usage patterns. Design/methodology/approach - In this study, a survey conducted by Korea Internet and Security Agency(KISA) called "problematic smartphone use survey" was analyzed. The survey consists of 180 questions, and data were collected from 29,712 participants. Based on the data on the smartphone usage pattern obtained through the questionnaire, the smartphone addiction level was predicted using machine learning techniques. k-NN, gradient boosting, XGBoost, CatBoost, AdaBoost and random forest algorithms were employed. Findings - First, while various factors together influence the smartphone overdependence level, the results show that all machine learning techniques perform well to predict the smartphone overdependence level. Especially, we focus on the features which can be obtained from the smartphone log data (without psychological factors). It means that our results can be a basis for diagnostic programs to detect problematic smartphone use. Second, the results show that information on users' age, marriage and smartphone usage patterns can be used as predictors to determine whether users are addicted to smartphones. Other demographic characteristics such as sex or region did not appear to significantly affect smartphone overdependence levels. Research implications or Originality - While there are some studies that predict smartphone overdependence level using machine learning techniques, but the studies only present algorithm performance based on survey data. In this study, based on the information gain measure, questions that have more influence on the smartphone overdependence level are presented, and the performance of algorithms according to the questions is compared. Through the results of this study, it is shown that smartphone overdependence level can be predicted with less information if questions about smartphone use are given appropriately.

Multi-dimensional Analysis and Prediction Model for Tourist Satisfaction

  • Shrestha, Deepanjal;Wenan, Tan;Gaudel, Bijay;Rajkarnikar, Neesha;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.480-502
    • /
    • 2022
  • This work assesses the degree of satisfaction tourists receive as final recipients in a tourism destination based on the fact that satisfied tourists can make a significant contribution to the growth and continuous improvement of a tourism business. The work considers Pokhara, the tourism capital of Nepal as a prefecture of study. A stratified sampling methodology with open-ended survey questions is used as a primary source of data for a sample size of 1019 for both international and domestic tourists. The data collected through a survey is processed using a data mining tool to perform multi-dimensional analysis to discover information patterns and visualize clusters. Further, supervised machine learning algorithms, kNN, Decision tree, Support vector machine, Random forest, Neural network, Naive Bayes, and Gradient boost are used to develop models for training and prediction purposes for the survey data. To find the best model for prediction purposes, different performance matrices are used to evaluate a model for performance, accuracy, and robustness. The best model is used in constructing a learning-enabled model for predicting tourists as satisfied, neutral, and unsatisfied visitors. This work is very important for tourism business personnel, government agencies, and tourism stakeholders to find information on tourist satisfaction and factors that influence it. Though this work was carried out for Pokhara city of Nepal, the study is equally relevant to any other tourism destination of similar nature.

Efficient Processing of k-Farthest Neighbor Queries for Road Networks

  • Kim, Taelee;Cho, Hyung-Ju;Hong, Hee Ju;Nam, Hyogeun;Cho, Hyejun;Do, Gyung Yoon;Jeon, Pilkyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.79-89
    • /
    • 2019
  • 본 연구에서는 도로 네트워크에서 k-최원접 이웃 검색을 위한 효율적인 FANS(k-FArthest Neighbor Search) 알고리즘을 제안한다. 양의 정수 k, 질의 객체 q, 일련의 데이터 객체 집합 P가 주어지면, k-최원접 이웃 질의는 질의 객체 q에서 가장 멀리 있는 k개의 데이터 객체를 찾는다. 데이터베이스 분야에서 대부분의 연구는 k-최근접 이웃 질의에 중점을 두고 있어서, k-최원접 이웃 질의라는 중요한 근접 질의유형은 별다른 관심을 받지 못했다. 이 논문에서는 도로 네트워크에서 가장 멀리 있는 이웃을 찾는 문제를 다룬다. 도로 네트워크에서 k-최원접 이웃 질의를 처리하는 연구는 거의 없었다. 도로 네트워크에서 k-최원접 이웃 질의를 처리해야 하는 문제는 최단 경로 거리를 계산하는 횟수를 줄이는 것인데, 이는 도로 네트워크와 유클리드 공간의 질의 처리에서 가장 중요한 차이다. 질의 객체와 데이터 객체 사이의 최단 경로 거리에 대한 중복 계산을 줄이기 위하여 공유 계산 전략을 사용한다. 질의 객체에서 데이터 세그먼트까지 최대 거리를 기반으로 효과적으로 후보군을 제거하는 방법은 제시한다. 마지막으로 실제 도로 지도를 사용한 광범위한 실험을 통해 제시된 방법의 효율성과 확장성을 보여준다.

돼지 melanocortin-4 receptor (MC4R) 유전자의 경제형질과의 연관성에 관한 연구 (Investigation of Porcine Melanocortin-4 Receptor (MC4R) Polymorphism on Economic Traits)

  • 김관석;신희영;이중재;홍성광;최봉환;김태헌;이학교;조병욱
    • 생명과학회지
    • /
    • 제15권6호
    • /
    • pp.968-971
    • /
    • 2005
  • 본 연구는 Duroc, Landrace, Berkshire, Yorkshire를 기초 축으로 이용한 1003두에 대해 MC4R유전자의 PCR-RFLP를 이용하여 그 다형성을 조사하고 돼지의 일당증체량, 등지방 두께, 사료 요구율, 정육율과 그 유전자형 간의 연관성을 규명하고자 실시하였다. MC4R유전자에 대해 PCR-RFLP를 이용하여 226bp산물을 증폭한후 Taq I 체한효소로 사용하였다. 얻어진 MC4R gene의 유전자 빈도는 품종별로 다르게 나타났다. 통계적 분석을 통하여 각 유전자형에 대한 경제형질과 관련성을 분석한 결과 일당 증체량과 사료요구량은 NN 유전자형을 가진 개체들이 DN이나 DD유전자형을 가진 개체들에 비해 유의적으로 우수한 능력을 보였다(P < 0.05). 하지만 D 대립유전자는 높은 정육율과 낮은 등지방두께에 연관성이 있음을 관찰하였다. 따라서 돼지의 성장과 정육율과 관련된 선발력을 높이기 위해서 MC4R유전자의 다형성분석에서 검증된 PCR marker를 우량돼지육종 계획에 있어 분자생물학적 선발 marker로 사용할 수 있을 것으로 사료된다.

감자 '추백' 에 발생한 Tobacco mosaic virus 의 특성 (Characterization of Tobacco mosaic virus Isolated fromSolanum tuberosum ‘Chubak’ in Korea)

  • 김정수;김재현;최국선;채수영;김현란;정봉남;최용문
    • 식물병연구
    • /
    • 제9권2호
    • /
    • pp.89-93
    • /
    • 2003
  • 남해지역의 원원종 종서 생산 포장에서 '추백' 품종에 나타난 엽맥투명 및 매우 약한 모자이크 증상을 나타내는 감자 잎에서 담배 모자이크 바이러스(TMV)를 분리하였다. 이 바이러스((TMV-St))는 생물학적, 혈청학적 유연관계 및 외피단백질의 염기서열 등을 통해 기존에 보고된 다른 tobamovires와 비교하였다. TMV-St는 5개의 지표식물 반응에서 토마토, 고추, 가지 등과 같은 가지과 작물에 경제적 피해를 주고 있는 TMV-U1, Pepper mild mottle virus(PMMoV) 및 Tomato mosaic virus(ToMV)와는 다른 기주 반응을 보였다. 특히 즙액접종에 의한 기주의 반응은 C.murale 접종엽과 상엽 모두에서 퇴록반점을 보였으며, C. murale, G. globosa, N.rustica 그리고 N. tabacum ce. Samsun nn 등 4가지 지표식물로 이들 바이러스 계통을 구분할 수 있었다. 혈청학적 검정에서 TMV-St는 TMV-U1, PMMoV 그리고 ToMV와의 반응에서 도두 뚜렷한 침강선을 형성하였다. TMV-St의 외피단백질은 477개의 염기서열로 되어 있으며, 이는 TMV-U1의 염기서열과 매우 유사하였다.

K번째 최근접 표본 재추출 방법에 의한 일 강우량의 추계학적 분해에 대한 연구 (Stochastic disaggregation of daily rainfall based on K-Nearest neighbor resampling method)

  • 박희성;정건희
    • 한국수자원학회논문집
    • /
    • 제49권4호
    • /
    • pp.283-291
    • /
    • 2016
  • 산업의 발전에 따라 기반시설 및 인구 등이 대도시에 밀집되어, 도시홍수방어는 인명피해 뿐만 아니라 재산피해 저감 차원에서도 매우 중요한 문제가 되었다. 요즘은 이러한 도시유역의 유출해석을 보다 정확하게 하기 위해 시강우나 분단위의 강우자료를 활용하고 있다. 하지만 기후변화 시나리오와 같은 미래 강우시나리오는 현재 일단위 수준으로 제공되므로 미래 강우에 대한 확률빈도 해석에 제한이 있다. 이에 본 연구에서는 추계학적 기법을 이용해 일강우 자료를 시강우 자료로 분해하고자 하였다. 일자료를 시자료로 분해하기 위해 과거 시강우 자료를 기반으로 Gram Schmidt 변환과 K개의 최근접 표본 중 하나를 재추출하는 비모수적인 기법(KNNR)을 적용하였다. 이 방법은 연유출량을 월유출량으로 분해하기 위해 개발된 것이다. 하지만 강우자료는 유출량 자료와 달리 확률밀도가 작아 일강우를 시강우로 분해하는 데 직접 적용하는 경우 결과가 실제와 유사한 통계 패턴을 갖는다고 보기 어려웠다. 이를 보완하기 위해 본 연구에서는 분해하고자 하는 일자의 전일과 후일을 포함한 3일 강우패턴을 7개로 구분하고 동일 패턴을 가진 자료들만 분해에 이용하도록 하여 강우자료에 대한 적용성을 높였다. 과거 52년간의 서울기상관측소 시강우 자료를 이용하여 강우자료의 분해에 대한 결과를 분석한 결과, 분해된 시강우 자료가 관측된 시강우자료와 통계적으로 매우 유사한 것을 확인하였다. 향후 기후변화자료의 시강우 분해 등에 활용하여 보다 정확한 도시유출에 대한 빈도해석 등에 적용할 수 있을 것으로 판단된다.

Influence of Ketamine on Catecholamine Secretion in the Perfused Rat Adrenal Medulla

  • Ko, Young-Yeob;Jeong, Yong-Hoon;Lim, Dong-Yoon
    • The Korean Journal of Physiology and Pharmacology
    • /
    • 제12권3호
    • /
    • pp.101-109
    • /
    • 2008
  • The aim of the present study was to examine the effects of ketamine, a dissociative anesthetics, on secretion of catecholamines (CA) secretion evoked by cholinergic stimulation from the perfused model of the isolated rat adrenal gland, and to establish its mechanism of action, and to compare ketamine effect with that of thiopental sodium, which is one of intravenous barbiturate anesthetics. Ketamine ($30{\sim}300{\mu}M$), perfused into an adrenal vein for 60 min, dose- and time-dependently inhibited the CA secretory responses evoked by ACh (5.32 mM), high $K^+$ (a direct membrane-depolarizer, 56 mM), DMPP (a selective neuronal nicotinic NN receptor agonist, $100{\mu}M$) and McN-A-343 (a selective muscarinic M1 receptor agonist, $100{\mu}M$). Also, in the presence of ketamine ($100{\mu}M$), the CA secretory responses evoked by veratridine (a voltage-dependent $Na^+$ channel activator, $100{\mu}M$), Bay-K-8644 (an L-type dihydropyridine $Ca^{2+}$ channel activator, $10{\mu}M$), and cyclopiazonic acid (a cytoplasmic $Ca^{2+}$-ATPase inhibitor, $10{\mu}M$) were significantly reduced, respectively. Interestingly, thiopental sodium ($100{\mu}M$) also caused the inhibitory effects on the CA secretory responses evoked by ACh, high $K^+$, DMPP, McN-A-343, veratridine, Bay-K-8644, and cyclopiazonic acid. Collectively, these experimental results demonstrate that ketamine inhibits the CA secretion evoked by stimulation of cholinergic (both nicotinic and muscarinic) receptors and the membrane depolarization from the isolated perfused rat adrenal gland. It seems likely that the inhibitory effect of ketamine is mediated by blocking the influx of both $Ca^{2+}$ and $Na^+$ through voltage-dependent $Ca^{2+}$ and $Na^+$ channels into the rat adrenal medullary chromaffin cells as well as by inhibiting $Ca^{2+}$ release from the cytoplasmic calcium store, which are relevant to the blockade of cholinergic receptors. It is also thought that, on the basis of concentrations, ketamine causes similar inhibitory effect with thiopental in the CA secretion from the perfused rat adrenal medulla.