• 제목/요약/키워드: 분류화

검색결과 4,781건 처리시간 0.036초

불확실성 정량화 기반 OOD 검출을 통한 대화 의도 분류 모델의 성능 향상 (Improving Dialogue Intent Classification Performance with Uncertainty Quantification based OOD Detection )

  • 신종훈;이요한;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.517-520
    • /
    • 2022
  • 지능형 대화 시스템은 줄곧 서비스의 목표와 무관한 사용자 입력을 전달받아, 그 처리 성능을 의심받는다. 특히 종단간 대화 이해 생성 모델이나, 기계학습 기반 대화 이해 모델은 학습 시간대에 한정된 범위의 도메인 입력에만 노출됨으로, 사용자 발화를 자신이 처리 가능한 도메인으로 과신하는 경향이 있다. 본 연구에서는 대화 생성 모델이 처리할 수 없는 입력과 신뢰도가 낮은 생성 결과를 배제하기 위해 불확실성 정량화 기법을 대화 의도 분류 모델에 적용한다. 여러 번의 추론 샘플링이 필요 없는 실용적인 예측 신뢰도 획득 방법과 함께, 평가 시간대와 또다른 도메인으로 구성된 분포 외 입력 데이터를 학습에 노출시키는 것이 분포 외 입력을 구분하는데 도움이 되는지를 실험으로 확인한다.

  • PDF

FCM 클러스터링 기반 지도 학습 알고리즘을 이용한 당뇨병 예측 분석 (Diabetes Predictive Analytics using FCM Clustering based Supervised Learning Algorithm)

  • 박태언;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.580-582
    • /
    • 2022
  • 본 논문에서는 데이터를 정량화하여 특징을 분류하기 위한 방법으로 퍼지 클러스터링 기반 지도 학습 방법을 제안한다. 제안된 방법은 FCM 클러스터링을 기법을 적용하여 군집화를 수행한다. 그리고 군집화 된 데이터들 중에서는 정확히 분류되지 않은 데이터가 존재하므로 분류되지 않은 데이터에 대해 지도 학습 방법을 적용한다. 본 논문에서는 당뇨병의 유무를 타겟 데이터로 설정하고 나머지 8개의 속성의 데이터를 FCM 기반 지도 학습 방법을 적용하여 당뇨병의 유무를 예측한다. 당뇨병 예측에 대한 성능을 30회의 K-겹 교차검증 (K-Fold Corss Validation)을 이용하여 평가하였으며, 다층 퍼셉트론의 경우에는 훈련 데이터가 77.88%, 테스트 데이터가 62.78%로 나타났고 제안된 방법의 경우에는 훈련 데이터가 79.96%, 테스트 데이터 74.16%로 나타났다.

  • PDF

융선의 방향성분 군집화를 통한 효과적인 지문분류기법 (Fingerprint classification using the clustering of the orientation of the ridges)

  • 박창희;윤경배;최준혁
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.679-685
    • /
    • 2003
  • 지문의 중심점과 삼각점은 융선의 흐름이 급격히 변하는 부분에 생기는 부위를 지칭하는 것으로 중심점과 삼각점 주위의 융선의 변화를 관찰하면 중심점과 삼각점의 존재 여부를 추측할 수 있다. 융선의 전역적인 방향성분을 구한 후 같은 방향 성분끼리 군집화를 수행하면 군집화된 부분의 경계에 중심점과 삼각점이 형성되는 것을 관찰할 수 있으며, 궁상문, 솟은 궁상문, 좌제상문, 우제상문, 와상문등 크게 5종류로 분류되는 지문의 문양별 방향성문 군집화의 특성이 다르다는 것을 관찰할 수 있다. 본 논문에서는 삼각점을 획득하지 못한 지문을 이용하여 지문의 중심점을 구한 후 방향성분 군집화를 통하여 지문분류를 효과적으로 할 수 있는 방법을 제안하고 실험을 통하여 이를 증명한다.

명제화된 어트리뷰트 택소노미를 이용하는 나이브 베이스 학습 알고리즘 (Propositionalized Attribute Taxonomy Guided Naive Bayes Learning Algorithm)

  • 강대기;차경환
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2357-2364
    • /
    • 2008
  • 본 논문에서는 명제화된 어트리뷰트 택소노미를 이용하여 간결하고 강건한 분류기를 생성하는 문제를 고려한다. 이 문제를 해결하기 위해 명제화된 어트리뷰트 택소노미(Propositionalized Attribute Taxonomy)를 이용하는 나이브 베이스 학습 알고리즘(Naive Bayes Learner)인 PAT-NBL을 소개한다. PAT-NBL은 명제화된 어트리뷰트들의 택소노미를 선험 지식으로 이용하여 간결하고 정확한 분류기를 귀납적으로 학습하는 알고리즘이다. PAT-NBL은 주어진 택소노미에서 지역적으로 최적의 컷(cut)을 찾아내기 위해 하향식 탐색과 상향식 탐색을 사용한다. 찾아낸 최적의 컷은 명제화된 어트리뷰트 택소노미와 데이터로부터 그에 상응하는 인스턴스 공간(instance space)을 구성 할 수 있게 해준다. University of California-Irvine (UCI) 저장소의 기계학습 벤치마크 데이터에 대한 실험 결과를 보면, 제안된 알고리즘이 표준적인 나이브 베이스 학습 알고리즘에 의해 만들어진 분류기들과 비교해 볼 때, 가끔은 보다 간결하고 더 정확한 분류기를 생성해 낸다는 사실을 알 수 있었다.

유전알고리즘을 이용한 암호화폐 거래정보의 군집화 분석 및 분류 (Clustering analysis and classification of cryptocurrency transaction using genetic algorithm)

  • 박준형;정석현;박은식;김경섭;원유재
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.22-26
    • /
    • 2018
  • 본 논문은 암호화폐 거래정보의 유사성과 거래패턴을 파악해서 군집화를 하고 학습을 통해서 다른 거래정보를 자동으로 분류해내는 모델을 제시한다. 유전알고리즘의 특성을 이용하여 군집화 과정에서 불필요한 요소를 최대한 제거하여 더 좋은 군집화 성능을 보여준다. 군집화 값이 포함된 거래정보를 훈련 데이터로 정하고 분류 알고리즘을 통해 거래정보의 예측이 가능해진다. 이는 암호화폐의 다양한 거래정보들로부터 자동으로 비정상 거래를 검출하는데 활용될 수 있다.

  • PDF

하이퍼스펙트럴 데이터 분류에서의 평탄도 LDA 규칙화 기법의 실험적 분석 (An Experimental Study on Smoothness Regularized LDA in Hyperspectral Data Classification)

  • 박래정
    • 한국지능시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.534-540
    • /
    • 2010
  • 고차원 특성과 높은 상관성은 하이퍼스펙트럴 데이터의 주요 특징이다. LDA와 그 변형 선형 투사 방법들이 고차원 스펙트럴 정보로부터 저차원의 특징을 추출하는데 사용되었다. LDA는 학습 데이터가 적은 경우 흔히 발생하는 과대적합으로 인해 일반화 성능이 낮아지는 문제가 발생하는데, 이를 완화하기 위하여 LDA 규칙화(regularization) 방법들이 제시되었다. 그 중, 평탄도(smoothness) 제약에 기반한 LDA 규칙화 기법은 높은 상관성을 갖는 하이퍼스펙트럴 데이터의 특성에 적합한 특징 추출 기법이다. 본 논문에서는 하이퍼스펙트럴 데이터 분류에서 평탄도 제약을 갖는 LDA 규칙화 방법을 소개하고 학습 데이터 조건에 따른 성능을 실험적으로 분석한다. 또한, 분류 성능의 향상을 위한 스펙트럴 정보와 공간적 정보의 상관성을 함께 활용하는 이중 평탄도 LDA 규칙화 기법을 제시한다.

음식 문화 분야에서 KDC의 변천 및 개선 방안에 관한 연구 (A Study on the Historical Changes and Improvements in Food and Culture in the Korean Decimal Classification)

  • 이미화;정연경
    • 한국문헌정보학회지
    • /
    • 제44권2호
    • /
    • pp.117-137
    • /
    • 2010
  • 본 연구는 음식 문화 분야에 관한 한국십진분류법(KDC)의 역사적 발전을 고찰하고 음식 문화의 다양한 주제를 보다 더 효과적으로 분류할 수 있도록 KDC를 중심으로 개선 방향을 제시하였다. 이를 위해 KDC 안에 반영된 음식 문화 관련 기호와 항목명의 변천 과정과 더불어 KDC 5판으로 실제 음식 문화 관련 자료를 분류할 때의 문제점을 짚어본 후에 음식 문화 분야를 위한 KDC 5판의 개선 사항을 제시하였다. 음식 문화 분야에 있어서 KDC의 문제점은 분류항목명 및 포함주기의 부족으로 한식 관련 분류항목의 부족과 다양한 국가별 음식 특성이 반영되지 않았고, 색인 대상 및 구조가 검색하기 어려우며, 주기의 내용이 부족하고, 서양식 분류항목명을 번역하였기 때문에 우리나라 음식체계에 부합하지 않았다. 분석 결과를 바탕으로 외국의 대표적인 분류 체계에 나타난 자국의 음식 문화와 외국의 음식 문화에 대해 비교하면서 분류항목명 및 포함주기의 내용 확장, 색인 대상 및 구조 변경, 주기의 상세화, 서양식 분류항목명의 변경을 제안하였다.

MPEG-NNR 의 지역 비선형 양자화를 이용한 CNN 압축 (Compression of CNN Using Local Nonlinear Quantization in MPEG-NNR)

  • 이정연;문현철;김수정;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.662-663
    • /
    • 2020
  • 최근 MPEG 에서는 인공신경망 모델을 다양한 딥러닝 프레임워크에서 상호운용 가능한 포맷으로 압축 표현할 수 있는 NNR(Compression of Neural Network for Multimedia Content Description and Analysis) 표준화를 진행하고 있다. 본 논문에서는 MPEG-NNR 에서 CNN 모델을 압축하기 위한 지역 비선형 양자화(Local Non-linear Quantization: LNQ) 기법을 제시한다. 제안하는 LNQ 는 균일 양자화된 CNN 모델의 각 계층의 가중치 행렬 블록 단위로 추가적인 비선형 양자화를 적용한다. 또한, 제안된 LNQ 는 가지치기(pruning)된 모델의 경우 블록내의 영(zero) 값의 가중치들은 그대로 전송하고 영이 아닌 가중치만을 이진 군집화를 적용한다. 제안 기법은 음성 분류를 위한 CNN 모델(DCASE Task)의 압축 실험에서 기존 균일 양자화를 대비 동일한 분류 성능에서 약 1.78 배 압축 성능 향상이 있음을 확인하였다.

  • PDF

자기 구성 지도와 은닉 마르코프 모델을 이용한 가속도 센서 기반 행동 인식 (Activity Recognition based on Accelerometer using Self Organizing Maps and Hidden Markov Model)

  • 황금성;조성배
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.245-250
    • /
    • 2008
  • 최근 동작 및 행동 인식에 대한 연구가 활발하다. 특히, 센서가 소형화되고 저렴해지면서 그 활용을 위한 관심이 증가하고 있다. 기존의 많은 행동 인식 연구에서 사용되어 온 정적 분류 기술 기반 동작 인식 방법은 연속적인 데이터 분류 기술에 비해 유연성 및 활용성이 부족할 수 있다. 본 논문에서는 연속적인 데이터의 패턴 분류 및 인식에 효과적인 확률적 추론 기법인 은닉 마르코프 모델(Hidden Markov Model)과 사전 지식 없이도 자동 학습이 가능하며 의미 깊은 궤적 패턴을 클러스터링하고 효과적인 양자화가 가능한 자기구성지도(Self Organizing Map)를 이용한 동작 인식 기술을 소개한다. 또한, 그 유용성을 입증하기 위해 실제 가속도 센서를 이용하여 다양한 동작에 대한 데이터를 수집하고 분류 성능을 분석 및 평가한다. 실험에서는 실제 가속도 센서를 통해 수집된 숫자를 그리는 동작의 성능 평가 결과를 보이고, 행동 인식기 별 성능과 전체 인식기별 성능을 비교한다.

  • PDF

리눅스 기반 디지털 방송 컨텐츠의 브라우징 기술 (Browsing Technique of Contents for Digital Broadcasting Based on Linux)

  • 김창원;남재열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.221-225
    • /
    • 2001
  • 논문은 리눅스를 기반으로 하여 디지털 방송 컨텐츠를 브라우징하는 기술과 서비스에 필요한 기술들을 제시하고 이를 활용한 서비스 모델을 제시한다. 사용자에게 방송 프로그램의 정보의 습득과 검색을 위해 EPG(Electronic Program Guide)를 이용하여 방송 컨텐츠를 장르와 채널 카테고리로 자동 분류한다. 각 프로그램에서 키 프레임을 추출하여 사용자에게 빠르게 탐색하게 하고 줄거리 파악을 쉽게 하였다. 비순차적인 재생 요구를 수용하기 위해 랜덤 엑세스와 컨텐츠와 추출된 키 프레임을 동기화 하여 하이라이트 모드로 재생하고 연속 재생을 할 수 있게 한다. 사용자와의 상호 작용에서 얻어진 채널과 장르 선호도 정보를 이용하여 컨텐츠를 개인의 성향에 맞게 장르와 채널별로 분류하여 개인화된 프로그램 가이드를 제공한다. 컨텐츠의 획득에서 누적된 취향에 따른 분류, 브라우징을 위한 키프레임 추출과 샷 분류를 통한 가공, Payper-View를 위한 사용정보에 이르기까지 리눅스 기반의 로컬 스토리지를 활용한 디지털 방송 브라우징 모델을 제시한다.

  • PDF