• 제목/요약/키워드: k-NN algorithm

검색결과 270건 처리시간 0.027초

스마트폰 과의존 판별을 위한 기계 학습 기법의 응용 (Application of Machine Learning Techniques for Problematic Smartphone Use)

  • 김우성;한준희
    • 아태비즈니스연구
    • /
    • 제13권3호
    • /
    • pp.293-309
    • /
    • 2022
  • Purpose - The purpose of this study is to explore the possibility of predicting the degree of smartphone overdependence based on mobile phone usage patterns. Design/methodology/approach - In this study, a survey conducted by Korea Internet and Security Agency(KISA) called "problematic smartphone use survey" was analyzed. The survey consists of 180 questions, and data were collected from 29,712 participants. Based on the data on the smartphone usage pattern obtained through the questionnaire, the smartphone addiction level was predicted using machine learning techniques. k-NN, gradient boosting, XGBoost, CatBoost, AdaBoost and random forest algorithms were employed. Findings - First, while various factors together influence the smartphone overdependence level, the results show that all machine learning techniques perform well to predict the smartphone overdependence level. Especially, we focus on the features which can be obtained from the smartphone log data (without psychological factors). It means that our results can be a basis for diagnostic programs to detect problematic smartphone use. Second, the results show that information on users' age, marriage and smartphone usage patterns can be used as predictors to determine whether users are addicted to smartphones. Other demographic characteristics such as sex or region did not appear to significantly affect smartphone overdependence levels. Research implications or Originality - While there are some studies that predict smartphone overdependence level using machine learning techniques, but the studies only present algorithm performance based on survey data. In this study, based on the information gain measure, questions that have more influence on the smartphone overdependence level are presented, and the performance of algorithms according to the questions is compared. Through the results of this study, it is shown that smartphone overdependence level can be predicted with less information if questions about smartphone use are given appropriately.

신경망을 이용한 다중 심리-생체 정보 기반의 부정 감성 분류 (Classification of Negative Emotions based on Arousal Score and Physiological Signals using Neural Network)

  • 김아영;장은혜;손진훈
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.177-186
    • /
    • 2018
  • 감성은 복잡하고 다양한 요인들에 의해 영향을 받기 때문에 다각적인 측면에서 고려되어야 한다. 본 연구에서는 심리 평가 척도의 하나인 각성(arousal) 지표와 다중 생체신호에서 추출된 생체지표 반응을 이용하여 중립 및 부정 감성(슬픔, 공포, 놀람)의 분류하였다. 이를 위하여 감성에 따른 생체지표 반응의 차이를 확인하였고, 다중 신경망 알고리즘 기반의 감성 인식기를 적용하여 이들 감성이 얼마나 정확하게 분류되는가를 확인하였다. 총 146명의 실험 참가자(평균 연령 $20.1{\pm}4.0$, 남성 41%)를 대상으로 감성 유발 자극을 제시하고 동시에 생체신호(심전도, 혈류맥파, 피부전기활동)를 측정하였다. 또한 감성 유발 자극에 대한 심리 반응을 감성 평가 척도로 평가하였다. 측정된 생체신호에서 심박률(HR), NN 간격의 표준편차(SDNN), 혈류량(BVP), 맥파전달시간(PTT), 피부전도수준(SCL), 피부전도반응(SCR)을 추출하였다. 결과 분석을 위하여 감성 자극에 대한 각성도와 안정 상태와 감성 상태의 생체지표 반응을 활용하였다. 또한 감성 분류를 위하여 다중 신경망 기반의 감성 인식기를 활용하였다. 그 결과, 감성에 따른 생체지표 반응의 차이를 확인하였고, 이들 감성의 분류 성능은 각성도와 모든 생체지표 특징들을 조합하였을 때 정확도가 가장 높음(86.9%)을 확인하였다. 본 연구는 심리 및 생체지표 추출과 기계학습 기술의 적용을 통하여 부정 감성을 분류할 수 있음을 제안하며, 이는 인간의 감성을 탐지하는 감성 인식 기술을 확립하는데 기여할 것으로 예상한다.

원격탐사와 GIS 기반의 산림탄소저장량 추정에 관한 주요국 연구동향 개관 (Overview of Research Trends in Estimation of Forest Carbon Stocks Based on Remote Sensing and GIS)

  • 김경민;이정빈;김은숙;박현주;노영희;이승호;박기호;신휴석
    • 한국지리정보학회지
    • /
    • 제14권3호
    • /
    • pp.236-256
    • /
    • 2011
  • 토지이용변화에 따른 산림탄소저장량 변화는 기후변화협약에서 요구하는 주요 자료 중 하나이다. IPCC 우수실행지침(intergovernmental panel on climate change good practice guidance, IPCC GPG) 수준 3에 근거하여 공간적으로 명확한 산림탄소저장량을 추정하게 되면 높은 신뢰도를 확보할 수 있다. 그러나 기존의 추정 방법은 표본점(sample plot) 단위의 국가산림자원조사 (national forest inventory, NFI) 자료만을 이용하여 행정구역별 평균을 집계하는 것으로 폴리곤 혹은 셀 단위의 상세한 탄소저장량을 파악할 수 없었다. 이를 보완하기 위해 유럽, 북미 등에서는 NFI 자료, 원격탐사 및 GIS 기술을 결합하여 산림탄소저장량을 추정하기 위한 노력이 활발히 이루어져왔다. 주요국의 연구 동향을 활용 기법에 따라 분류해보면 원격탐사, GIS, 지구통계 및 환경변수 모델링 등 크게 4가지 범주로 나눌 수 있다. 이 중 가장 손쉽게 국내 적용을 고려해 볼 수 있는 방법은 NFI 자료와 임상도를 결합하는 GIS 기반의 방법이다. 특히, 복잡한 수종 구성을 가지고 있는 국내 산림 환경 특성을 고려할 때 국지적 변이 추정에 유용한 지구통계 기법의 활용성이 기대된다. 아울러, 고해상도 영상의 활용은 산림탄소저장량 추정의 검증 및 탄소배출권 확보를 위한 CDM(clean development mechanism, 청정개발체제) 사업 적지 선정 등에 유용할 것으로 판단된다. 국내 관련 연구는 아직 초기 단계로 최근린 기법(k-nearest neighbor, k-NN)의 적용성을 검토하는 연구가 주를 이루고 있으나 국내 산림 환경에 적합한 방법론의 선정을 위해서는 보다 다양한 공간 자료와 알고리즘의 적용성이 검토되고 방법론 간의 비교 연구가 필요하다.

펴지 군집화 알고리즘 기반의 웨이블릿 변환을 이용한 3차원 얼굴 인식 (3D Face Recognition using Wavelet Transform Based on Fuzzy Clustering Algorithm)

  • 이영학
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1501-1514
    • /
    • 2008
  • 깊이 값에 따른 얼굴의 형상은 사람의 특징을 나타내는 중요한 요소 중의 하나로서 각 사람마다 다른 모양을 가지고 있다. 다른 형상을 가진 얼굴 영상으로부터 분리한 주파수 성분은 동일 얼굴에 대한 또 다른 중요 특징 성분의 하나가 될 수 있다. 본 논문은 3차원 얼굴 영상에서 등고선 값을 따라 추출된 영역에 대하여 각 영역별로 주파수 분리를 이용하여 특징을 추출한다. 그리고 이 주파수에 대한 수정된 퍼지 군집화를 적용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾는다. 이를 이용하여 회전된 얼굴에 대해 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 이는 사람마다 서로 다른 형상 특징을 가진다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 이산 웨이블릿 변환을 이용하여 4가지의 주파수 성분을 추출하여 특징정보로 사용한다. 각각의 웨이블릿 주파수 성분을 추출한 등고선 영역에 대해 차원의 감소를 위하여 고유얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형 판별 분석 알고리즘을 이용하여 유사도를 비교하였다. 본 논문에서는 클래스간의 분별 정보를 향상시키고자 각각의 등고선 영역과 각 영역의 주파수별로 수정된 퍼지 군집화 알고리즘을 적용하여 인식률을 향상 시켰으며, 코끝으로부터 깊이 값이 60인 영역의 경우 98.3%의 인식률을 나타내었다.

  • PDF

Efficient Processing of k-Farthest Neighbor Queries for Road Networks

  • Kim, Taelee;Cho, Hyung-Ju;Hong, Hee Ju;Nam, Hyogeun;Cho, Hyejun;Do, Gyung Yoon;Jeon, Pilkyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.79-89
    • /
    • 2019
  • 본 연구에서는 도로 네트워크에서 k-최원접 이웃 검색을 위한 효율적인 FANS(k-FArthest Neighbor Search) 알고리즘을 제안한다. 양의 정수 k, 질의 객체 q, 일련의 데이터 객체 집합 P가 주어지면, k-최원접 이웃 질의는 질의 객체 q에서 가장 멀리 있는 k개의 데이터 객체를 찾는다. 데이터베이스 분야에서 대부분의 연구는 k-최근접 이웃 질의에 중점을 두고 있어서, k-최원접 이웃 질의라는 중요한 근접 질의유형은 별다른 관심을 받지 못했다. 이 논문에서는 도로 네트워크에서 가장 멀리 있는 이웃을 찾는 문제를 다룬다. 도로 네트워크에서 k-최원접 이웃 질의를 처리하는 연구는 거의 없었다. 도로 네트워크에서 k-최원접 이웃 질의를 처리해야 하는 문제는 최단 경로 거리를 계산하는 횟수를 줄이는 것인데, 이는 도로 네트워크와 유클리드 공간의 질의 처리에서 가장 중요한 차이다. 질의 객체와 데이터 객체 사이의 최단 경로 거리에 대한 중복 계산을 줄이기 위하여 공유 계산 전략을 사용한다. 질의 객체에서 데이터 세그먼트까지 최대 거리를 기반으로 효과적으로 후보군을 제거하는 방법은 제시한다. 마지막으로 실제 도로 지도를 사용한 광범위한 실험을 통해 제시된 방법의 효율성과 확장성을 보여준다.

사례기반추론의 유사 임계치 및 커버리지 최적화 (Optimizing Similarity Threshold and Coverage of CBR)

  • 안현철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권8호
    • /
    • pp.535-542
    • /
    • 2013
  • 사례기반추론(CBR)은 많은 장점으로 인해 지금까지 의료진단, 생산계획, 고객분류 등 다양한 분야의 의사결정 지원에 적용되어 왔다. 그러나, 효과적인 CBR 시스템을 설계, 구축하기 위해서는 연구자가 직관적으로 설정해야 할 많은 설계요소들이 존재한다. 본 연구에서는 이러한 CBR의 여러 설계요소들 중 사례 검색 단계에서 결합할 이웃 사례들을 보다 효과적으로 선정할 수 있는 새로운 모형을 제시한다. 기존 연구에서는 결합할 이웃 사례를 선정하는 방법으로 사전에 정해진 이웃사례의 수(k-NN의 k)를 적용하든가, 혹은 최대 유사도의 상대적 비율을 임계치로 사용하는 방식을 적용해 왔다. 하지만, 본 연구에서는 결합할 유사사례를 선택하는 새로운 기준으로 0에서 1사이의 값을 갖는 절대적 유사 임계치를 사용할 것을 제안한다. 이 경우, 임계치 값이 과도하게 작아지게 되면, 예측결과의 생성이 잘 이루어지지 않을 수 있는 문제가 발생할 수 있다. 이에, 전체 학습사례들 중에서 예측결과가 생성된 사례의 비중을 커버리지(coverage)로 정의하고, 이를 유사 임계치 최적화 시 제약조건으로 설정함으로서, 사용자가 원하는 수준의 커버리지는 유지한 상태에서 가장 효과적인 유사 사례를 찾아 추론할 수 있도록 모형을 설계하였다. 제안 모형의 유용성을 검증하기 위해, 본 연구에서는 이 모형을 실존하는 국내 한 온라인 쇼핑몰의 표적 마케팅 사례에 적용하였다. 그 결과, 제안 모형이 CBR의 예측 성과를 유의미하게 개선시킬 수 있음을 확인할 수 있었다.

다중 얼굴 특징 추적을 이용한 복지형 인터페이스 (Welfare Interface using Multiple Facial Features Tracking)

  • 주진선;신윤희;김은이
    • 대한전자공학회논문지SP
    • /
    • 제45권1호
    • /
    • pp.75-83
    • /
    • 2008
  • 본 논문에서는 얼굴의 다중 특징을 이용하여 마우스의 다양한 동작을 효율적으로 구현할 수 있는 복지형 인터페이스를 제안한다. 제안된 시스템은 5개의 모듈로 구성 된다 : 얼굴의 검출(Face detection), 눈의 검출(eye detection), 입의 검출(mouth detection), 얼굴특징 추적(lariat feature tracking), 마우스의 제어(mouse control). 첫 단계에서는 피부색 모델과 연결 성분 분석을 이용하여 얼굴 영역을 검출한다. 그 후 얼굴영역으로부터 정확히 눈을 검출하기 위하여 신경망 기반의 텍스처 분류기를 사용하여 얼굴 영역에서 눈 영역과 비 눈 영역을 구분한다. 일단 눈 영역이 검출되면 눈의 위치에 기반 하여 에지 검출기(edge detector)를 이용하여 입 영역을 찾는다. 눈 영역과 입 영역을 찾으면 각각 mean shift 알고리즘과 template matching을 사용하여 정확하게 추적되고, 그 결과에 기반 하여 마우스의 움직임 또는 클릭의 기능이 수행된다. 제안된 시스템의 효율성을 검증하기 위하여 제안된 인터페이스 시스템을 다양한 응용분야에 적용 하였다. 장애인과 비장애인으로 나누어 제안된 시스템을 실험한 결과 모두에게 실시간으로 보다 편리하고 친숙한 인터페이스로 활용 될 수 있다는 것이 증명 되었다.

무선 센서 네트워크에서 클러스터링 기반 Sleep Deprivation Attack 탐지 모델 (Sleep Deprivation Attack Detection Based on Clustering in Wireless Sensor Network)

  • 김숙영;문종섭
    • 정보보호학회논문지
    • /
    • 제31권1호
    • /
    • pp.83-97
    • /
    • 2021
  • 무선 센서 네트워크를 구성하는 무선 센서는 일반적으로 전력 및 자원이 극히 제한적이다. 무선 센서는 전력을 보존하기 위해 일정 주기마다 sleep 상태로 진입한다. Sleep deprivation attack은 무선 센서의 sleep 상태 진입을 막음으로써 전력을 소진 시키는 치명적인 공격이지만 이에 대한 뚜렷한 대응책이 없다. 이에 본 논문에서는 클러스터링 기반 이진 탐색 트리 구조의 Sleep deprivation attack 탐지 모델을 제안한다. 본 논문에서 제안하는 sleep deprivation attack 탐지 모델은 기계학습을 통해 분류한 공격 센서 노드와 정상 센서 노드의 특징을 사용한다. 이때 탐지 모델에 사용한 특징은 Long Short-Term Memory(LSTM), Decision Tree(DT), Support Vector Machine(SVM), K-Nearest Neighbor(K-NN)을 이용하여 결정하였다. 결정된 특징은 본 논문에서 제안한 알고리즘에 사용하여 공격 탐지를 위한 값들을 계산하였으며, 계산한 값을 판정하기 위한 임계값은 SVM을 적용하여 도출하였다. 본 논문에서 제안하는 탐지 모델은 기계학습으로 도출된 특징과 임계값을 본 논문에서 제안한 탐지 알고리즘에 적용하여 구성하였으며, 실험을 통해 전체 센서 노드 20개 중 공격 센서 노드의 비율이 0.35일 때 94%의 탐지율을 갖고 평균 에너지 잔량은 기존 연구보다 최대 26% 향상된 결과를 보였다.

수평 분할 방식을 이용한 병렬 셀-기반 필터링 기법의 설계 및 성능 평가 (Design and Performance Analysis of a Parallel Cell-Based Filtering Scheme using Horizontally-Partitioned Technique)

  • 장재우;김영창
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.459-470
    • /
    • 2003
  • 데이터웨어하우징의 애트리뷰트 벡터나 멀티미디어 데이터베이스의 특징 벡터는 모두 고차원 데이터를 이루고 있기 때문에, 이러한 고차원 데이터를 효율적으로 검색하기 위해서는 고차원 색인 기법이 요구된다. 이를 위하여 다수의 고차원 색인 기법들이 제안되었는데, 제안된 대부분의 색인 기법들이 차원의 수가 증가할수록 검색 성능이 급격히 저하되는 ‘차원 저주(dimensional curse)’ 문제를 지니고 있다. 셀-기반 필터링(Cell-Based Filtering : CBF) 기법은 이러한 차원 저주 문제를 해결하기 위해 제안되었다. 그러나 CBF 기법은 데이터의 양이 증가할수록 선형적으로 검색 성능이 감소하며, 이를 극복하기 위해 병렬 처리 기법을 사용하는 것이 필요하다. 본 논문에서는 데이터 디클러스터링(declustering) 방법으로 수평 분할 방식을 사용한 병렬 CBF 기법을 제안한다. 아울러 제안한 병렬 CBF 기법의 성능을 최대화하기 위하여, 병렬 CBF 기법을 다수의 서버로 구성된 Shared Nothing(SN) 구조의 클러스터 아키텍쳐 하에서 구축한다. 또한 SN 구조의 클러스터 아키텍쳐에 적합한 데이타 삽입 알고리즘, 범위질의 처리 알고리즘, k-최근접 질의 처리 알고리즘을 제시한다. 마지막으로 제안하는 병렬 CBF 기법이 기존 CBF 기법과 비교하여 서버 개수에 비례하여 우수한 검색 성능을 달성함을 보인다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.