• 제목/요약/키워드: Naive Bayes Algorithm

검색결과 74건 처리시간 0.026초

비디오 감시 응용에서 확장된 기술자를 이용한 물체 검출과 분류 (Object Detection and Classification Using Extended Descriptors for Video Surveillance Applications)

  • 모하마드 카이룰 이슬람;파라 자한;민재홍;백중환
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.12-20
    • /
    • 2011
  • 본 논문은 비디오 감시 장치에 사용되는 효율적인 물체 검출 및 분류 알고리즘을 제안한다. 이전 연구는 주로 Scale Invariant Feature Transform (SIFT)나 Speeded Up Robust Feature (SURF)와 같은 특정 형태의 특징을 이용해 물체를 검출하거나 분류하였다. 본 논문에서는 물체 검출 및 분류에 상호 작용하는 알고리즘을 제안한다. 이는 로컬 패치들로부터 얻어지는 텍스쳐나 컬러 분포 같은 서로 다른 특성을 갖는 특징값을 이용해 물체의 검출 및 분류율을 높인다. 물체 검출에는 특징점들의 공간적인 클러스터링을, 이미지 표현이나 분류에는 Bag of Words 모델과 Naive Bayes 분류기를 사용한다. 실험을 통해 제안한 기법이 로컬 기술자를 사용한 물체 분류기법보다 우수한 성능을 나타냄을 보인다.

협력적 여과와 내용 기반 여과의 병합을 통한 추천 시스템에서의 사용자 선호도 발견 (Discovery of User Preference in Recommendation System through Combining Collaborative Filtering and Content based Filtering)

  • 고수정;김진수;김태용;최준혁;이정현
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.684-695
    • /
    • 2001
  • 최근의 추천 시스템은 협력적 여과 시스템의 희박성과 초기 평가 문제를 해결하기 위하여 내용 기반 여과 시스템과 협력적 여과 시스템을 병합하는 방법을 사용한다. 협력적 여과 시스템은 부가적인 상품을 예측하기 위해 사용자의 선호도에 대한 데이타베이스를 사용한다. 내용 기반 여과 시스템은 상품의 속성과 사용자의 흥미를 대조함에 의해 아이템을 추천한다. 본 논문에서는 두 가지의 기술을 기계 학습 알고리즘에 응용하고 병합함으로써 사용자의 선호도를 발견하는 방법을 기술한다. 제안된 협력적 여과 방법에서는 유전자 알고리즘을 이용하여 Naive Bayes 분류자에 의해 분류된 아이템을 기반으로 사용자 군집을 생성하며 내용 여과 기법에서는 연관 피드백에 의해 사용자의 흥미를 추출함으로써 사용자의 프로파일을 생성한다. 제안된 방법은 웹문서에 대해 사용자가 평가한 데이타베이스에서 평가되며 기존의 방법보다 높은 성능을 나타냄을 보인다.

  • PDF

소셜 미디어 앱 리뷰에서의 감성 분석 연구: 인스타그램 중심으로 (Research on Sentiment Analysis in Social Media App Reviews: Focusing on Instagram)

  • 이문기;우위항
    • 감성과학
    • /
    • 제27권1호
    • /
    • pp.69-80
    • /
    • 2024
  • 본 연구는 Google Play에서 수집된 Instagram 사용자 리뷰에 대한 심층 분석을 통해, 이 연구는 애플리케이션의 성능과 사용자 만족도에 대한 중요한 통찰력을 얻고자 한다. 텍스트 마이닝과 감성 분석 기술을 활용하여 사용자 리뷰에 담긴 감성과 의견을 체계적으로 파악하며, 이를 통해 앱의 개선점과 사용자 경험을 깊이 이해하려고 한다. 인스타그램 리뷰가 사용자들의 다양한 경험을 어떻게 반영하는지, 그리고 앱의 장단점을 어떻게 드러내는지를 분석한다. 이를 위해 나이브 베이즈 알고리즘을 사용한 감성 분석을 수행하며, 이 결과는 인스타그램 서비스 개선에 도움이 될 것으로 기대된다. 연구는 또한 개발자들이 사용자 피드백을 더 잘 이해하고 활용하는 데 도움을 주며, 결국 사용자 만족도를 향상시키는 데 기여할 것으로 예상된다. 이 연구는 소셜 미디어 사용 패턴과 사용자 의견의 복잡한 관계를 탐색하고, 이를 통해 더 나은 사용자 경험을 제공하는 방안을 모색한다.

Urdu News Classification using Application of Machine Learning Algorithms on News Headline

  • Khan, Muhammad Badruddin
    • International Journal of Computer Science & Network Security
    • /
    • 제21권2호
    • /
    • pp.229-237
    • /
    • 2021
  • Our modern 'information-hungry' age demands delivery of information at unprecedented fast rates. Timely delivery of noteworthy information about recent events can help people from different segments of life in number of ways. As world has become global village, the flow of news in terms of volume and speed demands involvement of machines to help humans to handle the enormous data. News are presented to public in forms of video, audio, image and text. News text available on internet is a source of knowledge for billions of internet users. Urdu language is spoken and understood by millions of people from Indian subcontinent. Availability of online Urdu news enable this branch of humanity to improve their understandings of the world and make their decisions. This paper uses available online Urdu news data to train machines to automatically categorize provided news. Various machine learning algorithms were used on news headline for training purpose and the results demonstrate that Bernoulli Naïve Bayes (Bernoulli NB) and Multinomial Naïve Bayes (Multinomial NB) algorithm outperformed other algorithms in terms of all performance parameters. The maximum level of accuracy achieved for the dataset was 94.278% by multinomial NB classifier followed by Bernoulli NB classifier with accuracy of 94.274% when Urdu stop words were removed from dataset. The results suggest that short text of headlines of news can be used as an input for text categorization process.

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

An effective automated ontology construction based on the agriculture domain

  • Deepa, Rajendran;Vigneshwari, Srinivasan
    • ETRI Journal
    • /
    • 제44권4호
    • /
    • pp.573-587
    • /
    • 2022
  • The agricultural sector is completely different from other sectors since it completely relies on various natural and climatic factors. Climate changes have many effects, including lack of annual rainfall and pests, heat waves, changes in sea level, and global ozone/atmospheric CO2 fluctuation, on land and agriculture in similar ways. Climate change also affects the environment. Based on these factors, farmers chose their crops to increase productivity in their fields. Many existing agricultural ontologies are either domain-specific or have been created with minimal vocabulary and no proper evaluation framework has been implemented. A new agricultural ontology focused on subdomains is designed to assist farmers using Jaccard relative extractor (JRE) and Naïve Bayes algorithm. The JRE is used to find the similarity between two sentences and words in the agricultural documents and the relationship between two terms is identified via the Naïve Bayes algorithm. In the proposed method, the preprocessing of data is carried out through natural language processing techniques and the tags whose dimensions are reduced are subjected to rule-based formal concept analysis and mapping. The subdomain ontologies of weather, pest, and soil are built separately, and the overall agricultural ontology are built around them. The gold standard for the lexical layer is used to evaluate the proposed technique, and its performance is analyzed by comparing it with different state-of-the-art systems. Precision, recall, F-measure, Matthews correlation coefficient, receiver operating characteristic curve area, and precision-recall curve area are the performance metrics used to analyze the performance. The proposed methodology gives a precision score of 94.40% when compared with the decision tree(83.94%) and K-nearest neighbor algorithm(86.89%) for agricultural ontology construction.

기계학습을 이용한 시놉시스 기반 영화장르 분류 기법 (Synopsis-Based Classification of Movie Genres Using Machine Learning Techniques)

  • 이재언;홍금원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.82-85
    • /
    • 2008
  • 고객의 기호와 요구에 부응하는 서비스의 제공을 위해 영화 요소 중 정확한 장르의 분류는 고객의 선택에 있어 중요한 문제이다. 기존의 수작업에 의한 장르 분류는 시간과 비용, 신뢰성 등에서 비효율적이다. 이러한 문제의 해결을 위해 영화 시놉시스(Synopsis) 기반의 기계학습 방법은 효율적인 대안이 될 수 있다. 본 논문에서는 대다수 영화서비스 주체가 보유하고 있는 시놉시스 정보를 기반으로 하여 기계학습을 이용한 영화장르 분류에 관한 하나의 정형화된 방법을 제시한다. 기계학습 Algorithm 중 LibSVM, RandomComittee, LMT, NaiveBayes, PART Algorithm 을 이용하여 Algorithm 별, 장르별 분류 정확도를 측정하여 비교한다.

머신러닝 기반 중노년층의 기능성 위장장애 예측 모델 구현 (Prediction model of peptic ulcer diseases in middle-aged and elderly adults based on machine learning)

  • 이범주
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.289-294
    • /
    • 2020
  • 기능성 위장장애는 Helicobacter pylori 감염 및 비 스테로이드성 항염증제의 사용 등의 원인으로 발생하는 소화기 계통 질환이다. 그동안 기능성 위장장애의 위험요인에 대한 많은 연구들이 수행되어졌으나, 한국인에 대한 기능성 위장장애 예측 모델 제시에 대한 연구는 없는 실정이다. 따라서 본 연구의 목적은 중년 및 노년층을 대상으로 인구학적정보, 비만정보, 혈액정보, 영양성분 정보를 바탕으로 머신러닝을 이용하여 기능성위장장애 예측 모델을 구현하고 평가하는 것이다. 모델생성을 위해 wrapper-based variable selection 메소드와 naive Bayes 알고리즘이 사용되었다. 여성 예측 모델의 분류 정확도는 0.712의 the area under the receiver operating characteristics curve(AUC) 값을 나타냈고, 남성에서는 여성보다 낮은 0.674의 AUC값이 나타났다. 이러한 연구결과는 향후 중년 및 노년층의 위장장애 질환의 예측과 예방에 활용될 수 있다.

머신러닝 기반 체지방 측정정보를 이용한 고콜레스테롤혈증 예측모델 (Prediction model of hypercholesterolemia using body fat mass based on machine learning)

  • 이범주
    • 문화기술의 융합
    • /
    • 제5권4호
    • /
    • pp.413-420
    • /
    • 2019
  • 본 연구의 목적은 기존의 body fat mass 변수와 고콜레스테롤혈증의 연관성연구를 벗어나, 머신러닝기법을 기반으로 body fat mass 변수들의 조합을 이용하여 고콜레스테롤혈증 예측 모델을 개발하는 것이다. 이러한 연구를 위하여 국민건강영양조사 데이터를 기반으로 두 가지 variable selection 메소드와 머신러닝 알고리즘을 이용하여 총 6개의 모델을 생성하였고 질병 예측력을 비교분석하였다. 여러 body fat mass 관련 변수들 중에서 몸통지방량 변수가 고콜레스테롤혈증 예측력이 가장 우수한 변수인 것을 밝혀내었고, 머신러닝 기반 예측모델들 중에서 correlation-based feature subset selection 기반 naive Bayes 알고리즘을 이용한 모델이 0.739의 the area under the receiver operating characteristic curve 값과 0.36의 Matthews correlation coefficient 값을 얻었다. 이러한 연구의 결과는 향후 국내외 대규모 스크리닝 및 대중보건 연구에서 질병예측분야의 중요정보로 활용될 것으로 예상한다.

Comparison Thai Word Sense Disambiguation Method

  • Modhiran, Teerapong;Kruatrachue, Boontee;Supnithi, Thepchai
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1307-1312
    • /
    • 2004
  • Word sense disambiguation is one of the most important problems in natural language processing research topics such as information retrieval and machine translation. Many approaches can be employed to resolve word ambiguity with a reasonable degree of accuracy. These strategies are: knowledge-based, corpus-based, and hybrid-based. This paper pays attention to the corpus-based strategy. The purpose of this paper is to compare three famous machine learning techniques, Snow, SVM and Naive Bayes in Word-Sense Disambiguation on Thai language. 10 ambiguous words are selected to test with word and POS features. The results show that SVM algorithm gives the best results in solving of Thai WSD and the accuracy rate is approximately 83-96%.

  • PDF