• 제목/요약/키워드: naive Bayesian

검색결과 118건 처리시간 0.019초

SDN 환경에서 효율적 Flow 전송을 위한 전송 지연 평가 기반 부하 분산 기법 연구 (Transmission Delay Estimation-based Forwarding Strategy for Load Distribution in Software-Defined Network)

  • 김도현;홍충선
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.310-315
    • /
    • 2017
  • Software-Defined Network의 등장은 하드웨어적인 네트워크 기능들을 소프트웨어적인 형태의 모듈로 Controller에 보다 유연하게 적용시키도록 함으로써 전통적인 네트워크의 구조를 변화시키고 있다. 이러한 환경 속에서 최근 네트워크 트래픽에 대한 Quality of Service 및 자원관리와 같은 다양한 관점에서의 네트워크 관리정책에 대한 연구개발이 진행되고 있고, 이러한 관리정책을 뒷받침 할 수 있는 네트워크 모니터링에 대한 기법들 또한 제시되어 왔다. 이에 본 논문에서는 기계 학습 기법인 Naive Bayesian Classification을 통하여 Flow를 분류한 후, 전송 지연 측정 모듈을 통하여 효율적인 전송경로를 선정하는 기법을 제안한다. 이는 다양한 대역폭을 갖는 여러 경로들로 이루어진 네트워크상에서 효율적인 경로 분배 역할을 할 수 있고, 부하를 분산시킴으로써 보다 원활한 네트워크 환경 및 서비스 품질을 제공할 수 있다.

사용자의 시공간 컨텍스트를 이용한 모바일 앱 추천 (Mobile App Recommendation using User's Spatio-Temporal Context)

  • 강영길;황세영;박상원;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권9호
    • /
    • pp.615-620
    • /
    • 2013
  • 스마트폰을 통해 사용자에게 제공되는 앱이 증가함에 따라 사용자들은 스마트폰에서 자신이 사용하고자 하는 앱을 매번 찾아야 하는 문제점이 커지고 있다. 이러한 앱 탐색 문제를 해결하기 위해 본 연구에서는 스마트폰에서 시간 및 장소에 따른 사용자별 앱 사용 로그를 수집하고, 이를 학습하여 사용자의 상황 정보에 따라 최적의 앱 추천 리스트를 자동으로 제공하는 방법을 제안한다. 제안 방법에서는 사용자의 앱 로그로부터 요일, 시간대, 주중주말 여부 등의 시간 속성과 주소명, POI 등의 장소 속성을 학습하여 최대사용빈도기반 예측 모델, Naive-Bayesian 예측 모델, SVM 예측 모델 등의 3가지 예측 모델을 생성한다. 최적의 예측 모델을 생성하기 위해 다양하게 조합된 학습 속성들을 학습한 예측모델들의 추천 정확도 비교 실험을 진행하였으며, 단일 예측 모델의 성능 개선을 위한 하이브리드 추천 방법을 제안한다.

유전자 알고리즘과 나이브 베이지언 기법을 이용한 의료 노모그램 생성 방법 (A Clinical Nomogram Construction Method Using Genetic Algorithm and Naive Bayesian Technique)

  • 이건명;김원재;윤석중
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.796-801
    • /
    • 2009
  • 복잡한 진단이나 예측 모델은 계산이 복잡하고 추론 과정을 해석하기 어렵기 때문에 임상현장에서 널리 사용되지 않고 있다. 의료 종사자들은 이러한 복잡한 모델 대신에, 복잡한 함수를 컴퓨터 등을 사용하지 않고도 쉽게 계산할 수 있도록 수치 관계를 그래픽으로 표현한 노모그램을 사용해 왔다. 의료분야에서 질병의 진단과 질병예후의 예측은 매우 주요한 관심사이다. 노모그램은 증상검사결과치료이력질병의 진단 결과 등의 속성을 포함한 임상 데이터들로부터 만들어진다. 노모그램을 만들 때는 가용한 여러 가지 속성 중에서 효과적인 것들을 찾아야 하고, 경우에 따라서는 속성에 대한 파라미터를 함께 결정해야 한다. 이 논문에서는 효과적인 속성과 파라미터를 선택하기 위해 유전자 알고리즘을 사용하고, 노모그램을 생성하기 위해 나이브 베이지언 기법을 사용하는 방법을 제안한다. 또한 제안한 방법을 실제 임상 데이터에 적용한 결과를 보인다.

사용자 평점 기반 게임 추천 시스템 (Game Recommendation System Based on User Ratings)

  • 김종현;조현정;김병만
    • 한국산업정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.9-19
    • /
    • 2018
  • 최근 게임 산업의 발달과 게임 방송에 대한 사람들의 관심이 많아짐에 따라 기존 게이머들이 아닌 사람들도 게임에 관심을 많이 보이고 있고, 게임 구매로 이어지고 있다. 하지만, 일반 사용자가 매일 수십 개씩 발매되는 게임 중에 어떤 게임이 자신이 재밌게 즐길 수 있는 게임인지를 판단하기 어렵다. 따라서 게임 판매 플랫폼에서 게임 추천 기능을 갖추고 있지만 그들의 매출 증가를 위한 수단으로 사용되어 그들의 할인 제품이나 신제품에 초점을 맞춰 추천을 해주기 때문에 추천 시스템의 정확도가 낮다. 이러한 이유 때문에 본 논문에서는 사용자에 대한 추천 만족도를 높이고 사용자 경험을 적절히 반영한, 사용자가 남긴 평점을 기반으로 한 게임 추천 시스템을 구성하였다. 시스템에서는 협력 필터링을 이용한 예상 평가 점수 기능과 나이브 베이지안을 이용한 게임 추천 기능을 구현하여 사용자에게 빠르고 정확한 추천을 할 수 있도록 구현하였다. 결과적으로 예상 평점 알고리즘의 경우 2.4초의 처리 속도와 평균 72.1퍼센트의 정확도를 얻었고, 게임 추천 알고리즘의 경우 75.187퍼센트의 정확도를 얻어 사용자에게 빠르고 정확한 추천 결과를 제시 할 수 있었다.

클라우드 환경에서 보안 가시성 확보를 위한 자동화된 패킷 분류 및 처리기법 (Near Realtime Packet Classification & Handling Mechanism for Visualized Security Management in Cloud Environments)

  • 안명호;류미현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.331-337
    • /
    • 2014
  • 컴퓨팅 패러다임이 클라우드 컴퓨팅으로 변화됨에 따라 보안 이슈가 더욱 더 중요하게 되었다. 컴퓨팅 플랫폼 서비스 제공자들은 Firewall, Identity Management 등을 제공하지만 클라우드 컴퓨팅 인프라는 사용자가 맘대로 제어하거나 새로운 장치들을 부착하여 사용할 수 없기 때문에 비교적 보안에 취약한 것이 사실이다. 이런 환경에서는 사용자 스스로 보안을 대비해야 하기 때문에 직관적인 방법으로 전체 네트워크 트래픽 상황을 가시적으로 조망할 수 있는 기법이 필요하다. 이를 위해서는 네트워크 패킷을 실시간으로 저장하고, 저장된 데이터를 준 실시간으로 분류할 수 있는 기술이 요구된다. 네트워크 패킷 분류에서 중요한 사항은 패킷 분류를 비지도 방식으로 사람의 개입 없이도 판단 기준을 지능적으로 생성하고 이를 통해 패킷을 스스로 판별할 수 있는 기술개발이 필요하다. 또한, 이를 위해서 Naive-Bayesian Classifier, Packet Chunking 등의 방법들을 활용해 사용자 개입없이 분류에 필요한 시그니쳐(Signature)를 탐색하고 이를 학습해 스스로 자동화된 패킷 분류를 실현할 수 있는 방안을 제시한다.

  • PDF

베이지언 문서분류시스템을 위한 능동적 학습 기반의 학습문서집합 구성방법 (An Active Learning-based Method for Composing Training Document Set in Bayesian Text Classification Systems)

  • 김제욱;김한준;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권12호
    • /
    • pp.966-978
    • /
    • 2002
  • 기계학습 기법을 이용한 문서분류시스템의 정확도를 결정하는 요인 중 가장 중요한 것은 학습문서 집합의 선택과 그것의 구성방법이다. 학습문서집합 선택의 문제란 임의의 문서공간에서 보다 정보량이 큰 적은 양의 문서집합을 골라서 학습문서로 채택하는 것을 말한다. 이렇게 선택한 학습문서집합을 재구성하여 보다 정확도가 높은 문서분류함수를 만드는 것이 학습문서집합 구성방법의 문제이다. 전자의 문제를 해결하는 대표적인 알고리즘이 능동적 학습(active learning) 알고리즘이고, 후자의 경우는 부스팅(boosting) 알고리즘이다. 본 논문에서는 이 두 알고리즘을 Naive Bayes 문서분류 알고리즘에 적응해보고, 이때 생기는 여러 가지 특징들을 분석하여 새로운 학습문서집합 구성방법인 AdaBUS 알고리즘을 제안한다. 이 알고리즘은 능동적 학습 알고리즘의 아이디어를 이용하여 최종 문서분류함수룰 만들기 위해 임시로 만든 여러 임시 문서분류함수(weak hypothesis)들 간의 변이(variance)를 높였다. 이를 통해 부스팅 알고리즘이 효과적으로 구동되기 위해 필요한 핵심 개념인 교란(perturbation)의 효과를 실현하여 문서분류의 정확도를 높일 수 있었다. Router-21578 문서집합을 이용한 경험적 실험을 통해, AdaBUS 알고리즘이 기존의 알고리즘에 비해 Naive Bayes 알고리즘에 기반한 문서분류시스템의 정확도를 보다 크게 향상시킨다는 사실을 입증한다.

Forecasting of Various Air Pollutant Parameters in Bangalore Using Naïve Bayesian

  • Shivkumar M;Sudhindra K R;Pranesha T S;Chate D M;Beig G
    • International Journal of Computer Science & Network Security
    • /
    • 제24권3호
    • /
    • pp.196-200
    • /
    • 2024
  • Weather forecasting is considered to be of utmost important among various important sectors such as flood management and hydro-electricity generation. Although there are various numerical methods for weather forecasting but majority of them are reported to be Mechanistic computationally demanding due to their complexities. Therefore, it is necessary to develop and build models for accurately predicting the weather conditions which are faster as well as efficient in comparison to the prevalent meteorological models. The study has been undertaken to forecast various atmospheric parameters in the city of Bangalore using Naïve Bayes algorithms. The individual parameters analyzed in the study consisted of wind speed (WS), wind direction (WD), relative humidity (RH), solar radiation (SR), black carbon (BC), radiative forcing (RF), air temperature (AT), bar pressure (BP), PM10 and PM2.5 of the Bangalore city collected from Air Quality Monitoring Station for a period of 5 years from January 2015 to May 2019. The study concluded that Naive Bayes is an easy and efficient classifier that is centered on Bayes theorem, is quite efficient in forecasting the various air pollution parameters of the city of Bangalore.

제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교 (Nomogram comparison conducted by logistic regression and naïve Bayesian classifier using type 2 diabetes mellitus (T2D))

  • 박재철;김민호;이제영
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.573-585
    • /
    • 2018
  • 본 연구에서는 제 2형 당뇨(type 2 diabetes mellitus)의 발병 확률을 예측하기 위해 11가지 위험요인을 가지고 로지스틱 회귀모형과 순수 베이지안 분류기 모형에 적합시킨다. 그런 다음 이를 시각적으로 쉽게 이해하는데 도움을 주는 노모그램 구축 방법을 소개한다. 분석은 2013-2015년 6기 국민건강영양조사 데이터를 가지고 분석하였다. 또 로지스틱 회귀모형에 세 가지 상호작용 항을 넣어 분석의 질을 높이고자 하였고 베이지안 노모그램에 left-aligned 방법을 사용하여 비교하기 쉽게 만들었다. 최종적으로 두 노모그램을 비교하고 효용성을 알아보았다. 마지막으로 ROC 곡선을 이용하여 노모그램이 적절한지 검증하였다.

순수 베이지안 분류기 모델을 사용하여 이상지질혈증을 예측하는 노모 그램 구축 (Nomogram building to predict dyslipidemia using a naïve Bayesian classifier model)

  • 김민호;서주현;이제영
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.619-630
    • /
    • 2019
  • 이상지질혈증은 한국인의 대표적인 성인병이며 지속적인 관리가 필요한 만성질환이다. 또한 고혈압이나 당뇨병과 함께 심혈관계 질환의 위험 요인으로 잘 알려져 있다. 하지만 혈관 질환은 검사 없이는 질병 판단을 하기 어려운 것이 현실이다. 본 연구에서는 이상지질혈증의 인지와 예방을 위하여 관련된 위험 요인을 확인한다. 이들을 종합하여 시각화하면서 발병률 예측까지 가능한 통계적 도구 노모그램을 구축하였다. 데이터는 국민건강영양조사 6기, 7기 제1차년도 (2013-2016) 데이터를 사용하였다. 분석 순서로는 먼저 이상지질혈증의 총 12가지 위험 요인을 교차분석을 통해 확인하였다. 그리고 순수 베이지안 분류기를 이용하여 이상지질혈증에 대한 모형으로 노모그램을 구축하였다. 구축한 노모그램은 ROC 곡선과 Calibration plot을 사용하여 신뢰성을 검증하였다. 마지막으로 이전에 제시했던 로지스틱 노모그램과 본 연구에서 제안한 베이지안 노모그램을 비교하였다.

Lifelong Machine Learning 기반 스팸 메시지 필터링 방법 (A Method for Spam Message Filtering Based on Lifelong Machine Learning)

  • 안연선;정옥란
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1393-1399
    • /
    • 2019
  • 인터넷의 급속한 성장으로 데이터의 송수신의 편리성과 비용이 들지 않는다는 장점 때문에 매일 수백만 건의 무차별적인 광고성 스팸 문자와 메일이 발송되고 있다. 아직은 스팸 단어나 스팸 번호를 차단하는 방법을 주로 사용하지만, 기계 학습이 떠오름에 따라 스팸을 필터링하는 방법에 대해 다양한 방식으로 활발히 연구되고 있다. 그러나 스팸에서만 등장하는 단어나 패턴은 스팸 필터링 시스템에 의해 걸러지지 않기 위해 지속적으로 변화하고 있기 때문에, 기존 기계 학습 메커니즘으로는 새로운 단어와 패턴을 감지, 적응할 수 없다. 최근 이러한 기존 기계 학습의 한계점을 극복하기 위해 기존의 지식을 활용하여 새로운 지식을 지속적으로 학습하도록 하는 Lifelong Learning(이하 LL)의 개념이 대두되었다. 본 논문에서는 문서 분류에 가장 많이 사용되는 나이브 베이즈와 Lifelong Machine Learning(이하 LLML)의 앙상블 기법을 이용한 스팸 메시지 필터링 방법을 제안한다. 우리는 기존 스팸 필터링 시스템에 가장 많이 사용되는 나이브 베이즈와, LLML 모델 중 ELLA를 적용하여 LL의 성능을 검증한다.