• Title/Summary/Keyword: 분류화

Search Result 4,805, Processing Time 0.034 seconds

Improving Dialogue Intent Classification Performance with Uncertainty Quantification based OOD Detection (불확실성 정량화 기반 OOD 검출을 통한 대화 의도 분류 모델의 성능 향상)

  • Jong-Hun Shin;Yohan Lee;Oh-Woog Kwon;Young-Kil Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.517-520
    • /
    • 2022
  • 지능형 대화 시스템은 줄곧 서비스의 목표와 무관한 사용자 입력을 전달받아, 그 처리 성능을 의심받는다. 특히 종단간 대화 이해 생성 모델이나, 기계학습 기반 대화 이해 모델은 학습 시간대에 한정된 범위의 도메인 입력에만 노출됨으로, 사용자 발화를 자신이 처리 가능한 도메인으로 과신하는 경향이 있다. 본 연구에서는 대화 생성 모델이 처리할 수 없는 입력과 신뢰도가 낮은 생성 결과를 배제하기 위해 불확실성 정량화 기법을 대화 의도 분류 모델에 적용한다. 여러 번의 추론 샘플링이 필요 없는 실용적인 예측 신뢰도 획득 방법과 함께, 평가 시간대와 또다른 도메인으로 구성된 분포 외 입력 데이터를 학습에 노출시키는 것이 분포 외 입력을 구분하는데 도움이 되는지를 실험으로 확인한다.

  • PDF

Diabetes Predictive Analytics using FCM Clustering based Supervised Learning Algorithm (FCM 클러스터링 기반 지도 학습 알고리즘을 이용한 당뇨병 예측 분석)

  • Park, Tae-eun;Kim, Kwang-baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.580-582
    • /
    • 2022
  • 본 논문에서는 데이터를 정량화하여 특징을 분류하기 위한 방법으로 퍼지 클러스터링 기반 지도 학습 방법을 제안한다. 제안된 방법은 FCM 클러스터링을 기법을 적용하여 군집화를 수행한다. 그리고 군집화 된 데이터들 중에서는 정확히 분류되지 않은 데이터가 존재하므로 분류되지 않은 데이터에 대해 지도 학습 방법을 적용한다. 본 논문에서는 당뇨병의 유무를 타겟 데이터로 설정하고 나머지 8개의 속성의 데이터를 FCM 기반 지도 학습 방법을 적용하여 당뇨병의 유무를 예측한다. 당뇨병 예측에 대한 성능을 30회의 K-겹 교차검증 (K-Fold Corss Validation)을 이용하여 평가하였으며, 다층 퍼셉트론의 경우에는 훈련 데이터가 77.88%, 테스트 데이터가 62.78%로 나타났고 제안된 방법의 경우에는 훈련 데이터가 79.96%, 테스트 데이터 74.16%로 나타났다.

  • PDF

Fingerprint classification using the clustering of the orientation of the ridges (융선의 방향성분 군집화를 통한 효과적인 지문분류기법)

  • Park, Chang-Hee;Yoon, Kyung-Bae;Choi, Jun-Hyeog
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.6
    • /
    • pp.679-685
    • /
    • 2003
  • The cores and deltas of fingerprints designate the parts where the flow of the ridges change radically. Observations on the change of the orientation of the ridges around the cores and deltas enable us to guess the location of the cores and deltas. According]y clustering the orientation flowing to the same direction after doing research on the orientation of the ridges on the whole makes us see that the cores and deltas are shaping around the boundaries of the clustering area. It is also observed that The patterns of clustering of the orientation of the ridges classified as Arch, Tented Arch, Left loop, Right Loop and Whorl have its own characteristics respectively. In this paper the method of classifying the fingerprints effectively is proposed and proved its effectiveness by using the clustering of the orientation of the ridges, finding the cores of the fingerprints which don't secure the deltas.

Propositionalized Attribute Taxonomy Guided Naive Bayes Learning Algorithm (명제화된 어트리뷰트 택소노미를 이용하는 나이브 베이스 학습 알고리즘)

  • Kang, Dae-Ki;Cha, Kyung-Hwan
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.12
    • /
    • pp.2357-2364
    • /
    • 2008
  • In this paper, we consider the problem of exploiting a taxonomy of propositionalized attributes in order to generate compact and robust classifiers. We introduce Propositionalized Attribute Taxonomy guided Naive Bayes Learner (PAT-NBL), an inductive learning algorithm that exploits a taxonomy of propositionalized attributes as prior knowledge to generate compact and accurate classifiers. PAT-NBL uses top-down and bottom-up search to find a locally optimal cut that corresponds to the instance space from propositionalized attribute taxonomy and data. Our experimental results on University of California-Irvine (UCI) repository data set, show that the proposed algorithm can generate a classifier that is sometimes comparably compact and accurate to those produced by standard Naive Bayes learners.

Clustering analysis and classification of cryptocurrency transaction using genetic algorithm (유전알고리즘을 이용한 암호화폐 거래정보의 군집화 분석 및 분류)

  • Park, Junhyung;Jeong, Seokhyeon;Park, Eunsik;Kim, Kyungsup;Won, Yoojae
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.10a
    • /
    • pp.22-26
    • /
    • 2018
  • In this paper, we propose a model that classifies different transaction information by clustering and learning through similarity and transaction pattern of cryptocurrency transaction information. By using characteristics of genetic algorithms, we can get better clustering performance by eliminating unnecessary elements in clustering process. The transaction information including the clustering value is set as the training data, and the transaction information can be predicted through the classification algorithm. This can be used to automatically detect abnormal transactions from various transaction information of the cryptocurrency.

  • PDF

An Experimental Study on Smoothness Regularized LDA in Hyperspectral Data Classification (하이퍼스펙트럴 데이터 분류에서의 평탄도 LDA 규칙화 기법의 실험적 분석)

  • Park, Lae-Jeong
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.20 no.4
    • /
    • pp.534-540
    • /
    • 2010
  • High dimensionality and highly correlated features are the major characteristics of hyperspectral data. Linear projections such as LDA and its variants have been used in extracting low-dimensional features from high-dimensional spectral data. Regularization of LDA has been introduced to alleviate the overfitting that often occurs in a small-sized training data set and leads to poor generalization performance. Among them, a smoothness regularized LDA seems to be effective in the feature extraction for hyperspectral data due to its capability of utilizing the high correlatedness. This paper studies the performance of the regularized LDA in hyperspectral data classification experimentally with varying conditions of the training data. In addition, a new dual smoothness regularized LDA is proposed and evaluated that makes use of both the spectral-domain and spatial-domain correlations between neighboring pixels.

A Study on the Historical Changes and Improvements in Food and Culture in the Korean Decimal Classification (음식 문화 분야에서 KDC의 변천 및 개선 방안에 관한 연구)

  • Lee, Mi-Hwa;Chung, Yeon-Kyoung
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.44 no.2
    • /
    • pp.117-137
    • /
    • 2010
  • The purposes of this study are to review the historical development of food and culture in the KDC (Korean Decimal Classification) and to propose improvements of the KDC to classify materials of food and culture by using the KDC effectively. First of all, changes of classification numbers and headings related to food and culture from the 1st edition to the 5th edition of the KDC were examined. Recent books about food and culture were examined and were classified according to the latest edition of the KDC. Several problems were found including a lack of headings, including notes in food and culture, a lack of headings about Korean foods in particular and reflections about various foods from other countries, a lack of detailed relative headings, and the remaining western oriented headings. Other classification systems about food and culture were analyzed and it was found that there was a need to have new headings for classifying Korean traditional foods and table services, new formats for a relative index, detailed notes, and changes in western oriented headings.

Compression of CNN Using Local Nonlinear Quantization in MPEG-NNR (MPEG-NNR 의 지역 비선형 양자화를 이용한 CNN 압축)

  • Lee, Jeong-Yeon;Moon, Hyeon-Cheol;Kim, Sue-Jeong;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.662-663
    • /
    • 2020
  • 최근 MPEG 에서는 인공신경망 모델을 다양한 딥러닝 프레임워크에서 상호운용 가능한 포맷으로 압축 표현할 수 있는 NNR(Compression of Neural Network for Multimedia Content Description and Analysis) 표준화를 진행하고 있다. 본 논문에서는 MPEG-NNR 에서 CNN 모델을 압축하기 위한 지역 비선형 양자화(Local Non-linear Quantization: LNQ) 기법을 제시한다. 제안하는 LNQ 는 균일 양자화된 CNN 모델의 각 계층의 가중치 행렬 블록 단위로 추가적인 비선형 양자화를 적용한다. 또한, 제안된 LNQ 는 가지치기(pruning)된 모델의 경우 블록내의 영(zero) 값의 가중치들은 그대로 전송하고 영이 아닌 가중치만을 이진 군집화를 적용한다. 제안 기법은 음성 분류를 위한 CNN 모델(DCASE Task)의 압축 실험에서 기존 균일 양자화를 대비 동일한 분류 성능에서 약 1.78 배 압축 성능 향상이 있음을 확인하였다.

  • PDF

Activity Recognition based on Accelerometer using Self Organizing Maps and Hidden Markov Model (자기 구성 지도와 은닉 마르코프 모델을 이용한 가속도 센서 기반 행동 인식)

  • Hwang, Keum-Sung;Cho, Sung-Bae
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02a
    • /
    • pp.245-250
    • /
    • 2008
  • 최근 동작 및 행동 인식에 대한 연구가 활발하다. 특히, 센서가 소형화되고 저렴해지면서 그 활용을 위한 관심이 증가하고 있다. 기존의 많은 행동 인식 연구에서 사용되어 온 정적 분류 기술 기반 동작 인식 방법은 연속적인 데이터 분류 기술에 비해 유연성 및 활용성이 부족할 수 있다. 본 논문에서는 연속적인 데이터의 패턴 분류 및 인식에 효과적인 확률적 추론 기법인 은닉 마르코프 모델(Hidden Markov Model)과 사전 지식 없이도 자동 학습이 가능하며 의미 깊은 궤적 패턴을 클러스터링하고 효과적인 양자화가 가능한 자기구성지도(Self Organizing Map)를 이용한 동작 인식 기술을 소개한다. 또한, 그 유용성을 입증하기 위해 실제 가속도 센서를 이용하여 다양한 동작에 대한 데이터를 수집하고 분류 성능을 분석 및 평가한다. 실험에서는 실제 가속도 센서를 통해 수집된 숫자를 그리는 동작의 성능 평가 결과를 보이고, 행동 인식기 별 성능과 전체 인식기별 성능을 비교한다.

  • PDF

Browsing Technique of Contents for Digital Broadcasting Based on Linux (리눅스 기반 디지털 방송 컨텐츠의 브라우징 기술)

  • 김창원;남재열
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.221-225
    • /
    • 2001
  • 논문은 리눅스를 기반으로 하여 디지털 방송 컨텐츠를 브라우징하는 기술과 서비스에 필요한 기술들을 제시하고 이를 활용한 서비스 모델을 제시한다. 사용자에게 방송 프로그램의 정보의 습득과 검색을 위해 EPG(Electronic Program Guide)를 이용하여 방송 컨텐츠를 장르와 채널 카테고리로 자동 분류한다. 각 프로그램에서 키 프레임을 추출하여 사용자에게 빠르게 탐색하게 하고 줄거리 파악을 쉽게 하였다. 비순차적인 재생 요구를 수용하기 위해 랜덤 엑세스와 컨텐츠와 추출된 키 프레임을 동기화 하여 하이라이트 모드로 재생하고 연속 재생을 할 수 있게 한다. 사용자와의 상호 작용에서 얻어진 채널과 장르 선호도 정보를 이용하여 컨텐츠를 개인의 성향에 맞게 장르와 채널별로 분류하여 개인화된 프로그램 가이드를 제공한다. 컨텐츠의 획득에서 누적된 취향에 따른 분류, 브라우징을 위한 키프레임 추출과 샷 분류를 통한 가공, Payper-View를 위한 사용정보에 이르기까지 리눅스 기반의 로컬 스토리지를 활용한 디지털 방송 브라우징 모델을 제시한다.

  • PDF