• 제목/요약/키워드: 나이브 베이지안 분류기

검색결과 24건 처리시간 0.021초

다중 레이블 나이브 베이지안 분류기의 정확도 개선 연구 (Improving Accuracy of Multi-label Naive Bayes Classifier)

  • 김해천;이재성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제57차 동계학술대회논문집 26권1호
    • /
    • pp.147-148
    • /
    • 2018
  • 다중 레이블 분류 문제는 다중 레이블 데이터를 입력받았을 때 연관된 다수의 레이블을 추측하는 문제이다. 본 논문에서는 다중 레이블 분류 문제의 기법 중 하나인 나이브 베이지안 분류기에 레이블 의존성을 계산하여 결과에 반영한 결과 다중 레이블 분류 문제의 성능이 개선됨을 확인하였다.

  • PDF

나이브 베이지안 분류기를 이용한 선에코 탐지 방법에 대한 연구 (A Study of Line-shaped Echo Detection Method using Naive Bayesian Classifier)

  • 이한수;김성신
    • 한국지능시스템학회논문지
    • /
    • 제24권4호
    • /
    • pp.360-365
    • /
    • 2014
  • 기상 레이더, 인공위성, 라디오존데 등 날씨 예보를 수행하기 위해 많은 종류의 첨단 장비들이 사용되고 있다. 이들 중에서 지상에 설치된 기상 레이더는 넓은 탐지영역, 높은 시간 및 공간 분해능 등과 같은 많은 장점을 가지고 있기 때문에 기상예보 과정에서 필수적인 장비이다. 이러한 기상 레이더 데이터의 내부에는 기상현상 이외에도 여러 가지 외부 요인에 의해 발생하는 비기상현상이 관측되는데, 이는 기상 예보의 정확도를 감소시키는 원인이 된다. 본 논문에서는 기상 레이더 데이터를 이용한 연구를 통하여 비기상현상이 레이더에 관측되어 에코 형태로 나타난 것들 중에서 선 모양으로 발생하는 비기상에코를 제거하는 방법을 제안한다. 원시 레이더 데이터에서 선에코를 구분하여 그 특성을 추출한 후, 이들을 바탕으로 데이터 페어를 구성하여 나이브 베이지안 분류기를 학습시켰다. 그리고 학습된 나이브 베이지안 분류기를 선에코와 기상에 코가 혼재된 사례에 적용하였다. 실제 사례를 바탕으로 한 실험을 통해서 제안한 나이브 베이지안 분류기가 효과적으로 선에코를 식별할 수 있음을 확인하였다.

나이브 베이지안 분류기를 이용한 게시물 자동 분류를 위한 eCRM 에이전트 시스템 (eCRM Agent System for Articles Automatic Classification System based on Naive Bayesian Classifier)

  • 최정민;이병수
    • 전기전자학회논문지
    • /
    • 제8권2호
    • /
    • pp.216-223
    • /
    • 2004
  • 최근 전자 상거래에서 사용하고 있는 게시판은 고객의 능동적인 참여로 운영되며, 게시물은 고객의 직접적인 의사를 들을 수 있는 인 바운드(Inbound)정보로서 다른 eCRM을 위한 고객 접점 채널 과는 성격이 다른 도구이다. 또한 게시판의 효과적인 운영은 게시판 자체의 신뢰도를 향상 시키고 나아가 전자 상거래 전체의 신뢰도를 높여 줄 수 있는 중요한 eCRM 도구이다. 그러나 현재 대부분의 전자상거래에서 운영하는 게시판은 기 분류된 카테고리를 고객이 직접 수동으로 선정하도록 되어 있고, 이렇게 임의로 분류되는 게시물에 대하여 체계적인 처리 과정 없이 답변이 이루어지기 때문에 답변을 하는데 많은 시간이 소요 되고 있으며, 정확한 답변이 이루어지지 않고 있는 실정이다. 따라서, 본 논문에서는 여러 가지 종류의 게시물에 대하여 나이브 베이지안 분류기를 이용하여 게시판의 기존 문제점의 해결과 효과적인 운영 그리고 게시물의 체계적인 분류 관리를 할 수 있는 게시물 자동 분류기를 설계하고 구현하였다. 아울러 문서 분류 학습 기법 중 대표적인 TFIDF. k-NN, 나이브 베이지안 기법들의 게시물 분류 성능을 측정하여 채택한 나이브 베이지안 분류기의 우수성을 확인 하였다.

  • PDF

나이브 베이지안 분류기 모델 기반의 소용량 파일 그룹화 시스템 설계 (A Design of the Small File Grouping System Based on Naive Bayesian Classifier Model)

  • 김민재;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.221-222
    • /
    • 2014
  • 빠른 웹의 성장으로 대용량 데이터를 효과적으로 처리할 수 있는 플랫폼 기술에 대한 관심이 높아지고 있다. 특히, HDFS는 이상적인 분산 파일 시스템으로 각광받고 있으며 대용량 파일의 처리를 목적으로 개발되었다. 하지만, 실제 파일들의 집합에서 소용량 파일이 차지하는 비중은 높은 편이다. 많은 수의 소용량 파일은 HDFS 성능 감소에 치명적인 원인이 된다. 많은 수의 소용량 파일들이 HDFS에 저장된다면 NameNode의 메모리 소비량이 증가하게 되며 많은 수의 소용량 파일은 많은 수의 DataNode와 NameNode를 요구하므로 상대적으로 처리시간이 많이 소모된다. 따라서 본 논문에서는 HDFS에서 소용량 파일의 저장과 액세스 효율성을 향상시키기 위하여 나이브 베이지안 분류기 알고리즘을 적용한 파일 그룹화 시스템을 설계하였다.

  • PDF

나이브 베이지안 분류기를 이용한 판소리 분류 프로그램 구현 (An Implementation of Pan-So-Ri Classification Program Using Naive Bayesian Classifier)

  • 김원종;이강복;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.153-159
    • /
    • 2011
  • 판소리는 이야기를 노래로 부르는 우리나라의 전통음악 형식 중 하나로 두 가지 유파(동편제, 서편제)로 나누어진다. 판소리에 대한 지식이 없는 사람은 판소리를 듣고서 이 두 가지 유파를 구별해내기 어렵다. 본 논문에서는 PCD(Pitch Class Distribution)와 나이브 베이지안 분류기를 이용한 판소리 분류 프로그램 구현 과정을 기술한다. 분류기에 사용되는 속성값으로는 각 음계의 출현빈도를 이용하였다. 실험은 확률값을 반올림한 위치를 다르게 하여 두 번 실행하였으며, 그 중 보다 뛰어난 결과로 동편제를 80%, 서편제를 97%, 총 88%의 정확도로 올바르게 분류해 내는 것을 알 수 있었다. 구현한 프로그램에는 이 결과를 적용하였다.

전자메일 자동관리 시스템을 위한 전자메일 분류기의 성능 비교 (Comparison of e-Mail Classifiers for e-Mail Response Management Systems)

  • 김국표;권영식;백찬영
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2002년도 추계학술대회
    • /
    • pp.411-416
    • /
    • 2002
  • 인터넷의 발전과 더불어 전자메일 사용자가 증가하게 되고, 기업의 고객접촉채널로서 전자메일에 대한 중요성 또한 증가되고 있다. 고객의 요구에 대해 적시에 적절하게 응답하지 못하면 고객의 불만족이 증가하게 되고, 충성도를 감소시켜 결국 장기적 매출 및 수익성 악화를 초래하게 된다. 따라서 고객의 전자메일에 신속, 정확하게 응답할 수 있는 전자 메일 자동관리 시스템의 필요성이 증가되고 있다. 본 연구에서는 나이브 베이지안 학습과 중심점 기반 분류 방법을 이용하여 전자메일 자동관리 시스템에서 전자메일 분류를 수행하는 분류기를 구현한다. 구현된 분류기를 이용하여 실제 기업의 고객 전자메일을 분류하는 실험을 수행하고 두 분류기의 성능을 비교하였다. 실험결과 두 분류기 모두 전자메일 분류에 비교적 우수한 성능을 보였다. 그러나, 클래스 수가 적은 경우 중심점 기반 분류기가 좋은 성능을 보였으나, 학습집합이 작아지면서 두 분류기의 성능 차이는 없었으며, 클래스의 수가 많아지면서 나이브 베이지안 분류기가 더 우수한 성능을 보였다.

  • PDF

나이브 베이지안 학습법에 기초한 북마크 분류 에이전트 (Bookmark Classification Agent Based on Naive Bayesian Learning Method)

  • 최정민;김인철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.405-408
    • /
    • 2000
  • 최근 인터넷의 발전으로 많은 정보와 지식을 우리는 인터넷에서 제공받을 수 있게되었다. 인터넷에 존재하는 정보는 수많은 웹서버에 산재되어 있으며, 정보의 위치는 주소(URL)를 가지고 존재하게 되는데 사용자는 자신이 관심있는 정보의 주소를 저장하기 위하여 웹브라우저 북마크(Bookmark)기능을 사용한다. 그러나 북마크 기능은 웹문서의 주소 저장에 일차적인 목적을 두고 있으며, 이후 북마크의 개수가 증가하면, 사용자는 북마크관리가 어렵게되므로 사용자 북마크 파일을 자동으로 분류하여 관리할수 있는 에이전트 기술을 사용하고자 한다. 대표적인 분류에이전트 시스템으로는 전자우편 분류 에이전트인 Maxims, 뉴스기사 분류 에이전트인 NewT, 엔터테인먼트(Entertainment) 선별 에이전트인 Ringo 등이 있다. 이러한 시스템들은 분류할 대상에 따라 조금씩 다른 모습의 에이전트 기능을 보이고 있으며, 본 논문은 기계학습 이론중 교사학습 알고리즘인 나이브 베이지안 학습방법(Naive Bayesian Learning method)을 사용하여 사용자가 분류하지 못한 북마크를 자동으로 분류하는 단일 에이전트 기반 북마크 분류기를 설계, 구현하고자한다.

  • PDF

나이브 베이지안 분류기를 이용한 이상전파에코 식별방법에 대한 연구 (A Study on Anomalous Propagation Echo Identification using Naive Bayesian Classifier)

  • 이한수;김성신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.89-90
    • /
    • 2016
  • 이상전파에코는 대기 관측을 위해서 사용되는 레이더 전파가 온도나 습도에 의해서 발생하는 이상굴절 신호로, 지상에 설치된 기상레이더에 자주 발생하는 대표적인 비기상에코 중 하나이다. 기상예보의 정확도를 높이기 위해서는 레이더 데이터의 정확한 분석이 요구되기 때문에 전 세계적으로 이상전파에코의 식별 및 제거에 대한 연구가 수행되어 오고 있다. 본 논문에서는 레이더 관측변수인 반사도와 고도 정보와 나이브 베이지안 분류기를 이용하여 이상전파에코를 식별 및 제거하는 방법에 대한 연구를 수행하였다. 실제 이상전파에코 발생 사례를 통하여 구현한 나이브 베이지안 분류기를 검증한 결과, 우수한 정확도를 가지고 분류가 수행되는 것을 확인할 수 있었다.

  • PDF

이산형 자료 예측을 위한 베이지안 네트워크 분류분석기의 성능 비교 (The performance of Bayesian network classifiers for predicting discrete data)

  • 박현재;황범석
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.309-320
    • /
    • 2020
  • 방향성 비순환 그래프(directed acyclic graph; DAG)라고도 하는 베이지안 네트워크(Bayesian network)는 변수 사이의 관계를 확률과 그래프를 통해 모형화할 수 있다는 점에서 최근 의학, 기상학, 유전학 등 여러 분야에서 다양하게 활용되고 있다. 특히 이산형 자료의 예측에 사용되는 베이지안 네트워크 분류분석기(Bayesian network classifier)가 최근 새로운 데이터 마이닝 기법으로 주목받고 있다. 베이지안 네트워크는 그 구조와 학습 방법에 따라 여러 가지 다양한 모형으로 분류할 수 있다. 본 논문에서는 서로 다른 성질을 가진 이산형 자료를 바탕으로 구조 학습 방법에 차이를 두어 베이지안 네트워크 모형을 학습시킨 후, 가장 간단한 방법인 나이브 베이즈 (naïve Bayes) 모형과 비교해 본다. 학습된 모형들을 여러 가지 실제 데이터에 적용하여 그 예측 정확도를 비교함으로써 최적의 분류 분석 결과를 얻을 수 있는지 살펴본다. 또한 각각의 모형에서 나타나는 그래프를 통해 데이터의 변수 사이의 관계를 비교한다.

주성분 분석과 나이브 베이지안 분류기를 이용한 퍼지 군집화 모형 (Fuzzy Clustering Model using Principal Components Analysis and Naive Bayesian Classifier)

  • 전성해
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.485-490
    • /
    • 2004
  • 자조의 표현에서 군집화는 주어진 데이터를 서로 유사한 개체들끼리 몇 개의 집단으로 묶는 작업을 수행한다. 군집화의 유사도 결정 측도는 맡은 연구들에서 매우 다양한 것들이 사용되었다. 하지만 군집화 결과의 성능 측정에 대한 객관적인 기준 설정이 어렵기 때문에 군집화 결과에 대한 해석은 매우 주관적이고, 애매한 경우가 많다. 퍼지 군집화는 이러한 주관적인 군집화 문제에 있어서 객관성 있는 군집 결정 방안을 제시하여 준다. 각 개체들이 특정 군집에 속하게 될 퍼지 멤버 함수값을 원소로 하는 유사도 행렬을 통하여 군집화를 수행한다. 본 논문에서는 차원 축소기법의 하나인 주성분 분석과 강력한 통계적 학습 이론인 베이지안 학습을 결합한 군집화 모형을 제안하여, 객관적인 퍼지 군집화를 수행하였다. 제안 알고리즘의 성능 평가를 위하여 UCI Machine Loaming Repository의 Iris와 Glass Identification 데이터를 이용한 실험 결과를 제시하였다.