• 제목/요약/키워드: 베이지안 분류

검색결과 200건 처리시간 0.022초

데이터마이닝 알고리즘의 분류 및 분석 (Classification and Analysis of Data Mining Algorithms)

  • 이정원;김호숙;최지영;김현희;용환승;이상호;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.279-300
    • /
    • 2001
  • 지식탐사 프로세스의 핵심적인 역할을 담당하는 데이터마이닝 단계에서는 여러 가지 목적에 따라 알고리즘을 선택하여 사용한다. 최근 통계, 비즈니스, 전자 상거래, 의학, 생물학 등의 분야에서 데이터마이닝 기술아 적극적으로 활용되고 있으며, 이를 위해 다양한 알고리즘들이 계속해서 연구.개발되고 있다. 그러나 시간이 지나면 이들 중 각 분야 별로 우수한 응용성을 보이는 알고리즘이나 방대한 양의 데이터를 다루는데 있어 좋은 성능을 보이는 몇몇 알고리즘만이 남게 될 것이며 또한 앞으로는 이러한 알고리즘들만을 선별하여 집중 연구할 필요가 있다. 따라서 본 논문에서는 데이터마이닝에 널리 사용되고 활발한 연구가 진행중인 알고리즘들 중에서 연관규칙(association rule), 클러스터링(clustering), 신경망(neural network), 결정트리(decision tree), 유전자 알고리즘(genetic algorithm), 베이지안 네트워크(bayesian network), 메모리 기반 추론(memory-based reasoning)등 7가지 카테고리에 속하는 알고리즘들을 선정하여 분류.분석하였다. 우선 각 알고리즘의 계통과 특성들을 분석하였고 이를 토대로 비교.분석을 위한 14가지의 분류 기준을 제시하였다. 이러한 분류 기준에 근거하여 세부 알고리즘들을 분석해 보고 비교 가능한 일부 알고리즘은 여러 특징과 성능을 중심으로 각각 최상의 알고리즘을 도출해 보았다. 본 연구 결과는 데이터마이닝 분야의 흔재된 알고리즘들을 분류.분석함으로써 마이닝 기술 적용시 사용자에게 알고리즘 선택의 지표를 제시할 수 있을 것이다.

  • PDF

퍼지지식베이스에서의 효율적인 정보검색을 위한 규칙생성 및 근사추론 알고리듬 설계 (Rule Generation and Approximate Inference Algorithms for Efficient Information Retrieval within a Fuzzy Knowledge Base)

  • 김형수
    • 디지털콘텐츠학회 논문지
    • /
    • 제2권2호
    • /
    • pp.103-115
    • /
    • 2001
  • 본 논문은 퍼지지식베이스에서 러프 집합과 요인공간이론을 적용하여 최소 결정규칙 생성과 근사추론 연산을 수행하는 두 개의 알고리듬을 제안한다. 최소 결정규칙의 생성은 속성요인에 관련한 상관분석과 베이지안 정리를 응용한 데이터의 분류기법과 리덕트에 의해 수행된다. 이 결정규칙으로 이루어진 최소지식 베이스의 탐색공간에서 소속함수와 t-norm의 합성 연산을 정의한 근사추론 방식에 의해 특정 객체를 검색한다. 본 연구의 러프와 퍼지연산 모듈을 수행하는 제안 알고리듬 기법을 객체및 속성수를 증가시키는 시뮬레이션을 통해 다른 검색이론 및 합성연산 방식과 비교하였다. 그 결과 다른 제 방법보다 본 연구에서 제안하는 기법이 특정 객체를 추출하기 위한 검색연산 시간에 있어 보다 빠르게 검색됨을 입증하였다.

  • PDF

코바기반 협업지원 의료영상 분석 및 가시화 시스템 (A CORBA-Based Collaborative Work Supported Medical Image Analysis and Visualization System)

  • 전준철;손재기
    • 정보처리학회논문지D
    • /
    • 제10D권1호
    • /
    • pp.109-116
    • /
    • 2003
  • 본 논문에서는 분산환경에서 사용자들에게 효과적인 접근성과 사용성을 제공하는 코바기반 협업 지일 의료영상 분석 덴 가시화 시스템을 소개한다. 개발된 시스템은 분산환경에서 의료영상 분활 및 모델링과 같은 의료영상 분석 및 처리 기능을 제공하며 아울러 의료영상 데이터의 효율적 관리 기능을 제공한다. 영상의 분류 및 특정 세포조직의 추출은 베이지안 방법과 활성 윤곽선 모델등 적용하여 수행되며, 획득된 영상의 특성정보는 의료영상의 실시간 3차원 모델링에 사용된다. 개발된 시스템은 브로드 케스팅과 동기화 메커니즘에 기반하여 시스템을 사용하는 다중 사용자들간의 협동작업을 지원한다. 본 시스템은 분산 프로그램을 지원하는 자바 및 코바에 의해 개발되었으며, 따라서 클라이언트는 분산 객체의 위치나 분산객체가 수행되는 운영체제에 관한 정보가 없이도 메소드 호출방법에 의해 서버 객체에 접근할 수 있다.

ASM-LK Optical Flow 기반 최적 얼굴정서 특징분석 기법 (Optimal Facial Emotion Feature Analysis Method based on ASM-LK Optical Flow)

  • 고광은;박승민;박준형;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.512-517
    • /
    • 2011
  • 얼굴영상에서 나타나는 정서특징을 분석하기 위하여 본 논문에서는 Active Shape Model (ASM)과 Lucas-Kanade (LK) optical flow 기법을 기반으로 하는 특징검출 및 분석방법을 제안한다. Facial Action Coding System에 근거하여 묘사된 정서적 특징을 고려하여, 특징이 분포하는 영역에 위치한 다수의 landmark로 shape 모델을 구성하고 모델에서 각 Landmark를 중심으로 하는 움직임 벡터 윈도우 내부의 픽셀에 대한 LK 기법을 통해 optical flow 벡터를 추출한다. 추출된 움직임 벡터의 방향성 조합에 근거하여 얼굴정서특징을 shape 모델로 표현할 수 있으며, 베이지안 분류기라는 확률 기반 추론기법을 기반으로 정서적 상태에 대한 추정할 수 있다. 또한, 정서특징분석과정의 연산 효율성과 정확성 향상을 도모하기 위하여 common spatial pattern (CSP) 분석기법을 적용하여 정서상태 별로 상관성이 높은 특징만으로 구성된 최적정서특징을 추출한다.

능동 시각을 이용한 이미지-텍스트 다중 모달 체계 학습 (Active Vision from Image-Text Multimodal System Learning)

  • 김진화;장병탁
    • 정보과학회 논문지
    • /
    • 제43권7호
    • /
    • pp.795-800
    • /
    • 2016
  • 이미지 분류 문제는 인간 수준의 성능을 보이지만 일반적인 인식 문제는 어려운 점들이 남아있다. 실내 환경은 다양한 정보를 담고 있어 정보 처리의 양을 효율적으로 줄일 필요성이 있다. 정보의 양을 효율적으로 줄일 수 있도록 대상 객체의 위치 측정을 위한 변분 추론, 변분 베이지안 등의 방법이 소개되었지만, 모든 경우에 대한 주변(marginal) 확률 분포를 구하기 어렵기 때문에 현실적으로 계산하기 어렵다. 본 연구에서는 공간 변형 네트워크(Spatial Transformer Networks)을 응용하여 능동 시각을 이용한 이미지-텍스트 통합 인지 체계를 제안한다. 이 체계는 주어진 텍스트 정보를 바탕으로 이미지의 일부를 효율적으로 샘플링 하도록 학습한다. 이를 통해 전통적인 방법으로 해결하기 어려운 문제를 상당한 격차로 성능을 향상 시킬 수 있다는 것을 보인다. 제안하는 모델을 통해 샘플링 된 이미지를 정성적으로 분석하여 이 모델이 가지는 특성도 함께 살펴본다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

CRM의 기능 분류를 위한 통계적 학습에 관한 연구 (A Study of Statistical Learning as a CRM s Classifier Functions)

  • 장근;이정배;이병수
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.71-76
    • /
    • 2004
  • 현재 ERP와 CRM은 대부분 전통적인 기능적 수행에만 초점이 맞추어져 있다. 그러나 최근의 경영환경은 인터넷(Internet)과 이를 기반으로 하는 전자상거래의 비약적 발전에 기인하여 시장의 변화를 가져왔으며, 이는 대부분 e-비즈니스화 되어 가고 있으며, 이를 추진하면서 제휴기관과의 관계증진, 고객관계의 혁신적 개선은 물론 조직내부의 업무프로세스의 획기적 개선을 통한 경쟁력 강화를 적극적으로 전개하고 있다. CRM(Customer Relationship Management)은 기업이 획득한 고객을 지속적으로 유지하고, 기업에 대한 고객의 가치를 증진시키기 위해 기업과 고객간의 상호 이익적 관계를 형성 유지 강화하려는 기업의 일련의 마케팅과정으로 다양하고도 수많은 고객들의 정보를 기반으로 수행되기 때문에 고객 정보를 파악할 수 있는 시스템 기반을 필요로 하며, 생산과 상품의 전달경로, 마케팅, 그리고 의사결정 등의 경영 카테고리와 연관되어 있다. 한편 ERP는 SCM과 CRM 및 SEM(Strategic Enterprise Management)등으로 기능을 확대해감에 따라 21세기의 ERP는 e-비즈니스의 전략적 도구로 발전해 갈 것이다. 본 논문에서는 이를 위한 중재 도구를 제시함으로써 고객에게 더욱 더 효율적이고 고 부가가치 있는 의미 있는 데이터들의 통계적 기계 학습법을 통해 CRM의 기능들을 효율적으로 분류할 수 있도록 한다. 또한 시스템 특징으로는 기존에 수작업으로 이루어지던 파일의 분류 작업을 기계 학습법을 통한 에이전트가 자동으로 수행함으로써 사용자가 좀 더 효율적으로 작업을 수행 할 수 있도록 한 것이다.

효과적 이모션마이닝을 위한 속성선택 방법에 관한 연구 (Exploring Feature Selection Methods for Effective Emotion Mining)

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권3호
    • /
    • pp.107-117
    • /
    • 2019
  • 블로그, 소셜 미디어 등의 발달로 인해 점점 더 많은 사람들이 본인의 의견이나 감정을 표현하기 위해 온라인상에서 텍스트 문장을 작성한다. 그리고 이같은 온라인 텍스트 문장속에 숨겨져 있는 긍정 또는 부정등의 감성을 찾아내는 연구분야를 감성분석 이라고 한다. 그중에서도 이모션 마이닝은 사람들의 구체적인 이모션을 찾아내는데 초점을 맞춘 연구분야이다. 본 연구에서는 속성선택 방법과 단일 및 앙상블 분류기를 조합하여 효과적인 이모션 마이닝 예측모델을 제시하고자 한다. 이를 위해 두가지 대표적인 오픈 데이터인 Tweet와 SemEval2007 데이터를 이용하여 TF-IDF를 계산하고 백 오브 워즈(BOW: bag-of-words) 형태로 속성 셋을 구성하였다. 그리고 효과적인 이모션 마이닝이 될 수 있는 최적의 속성을 선택하기 위하여 상관관계 기반 속성선택(CFS), 정보획득 속성선택 (IG), 그리고 ReliefF 등 세가지 속성선택 방법을 적용하였다. 선택된 속성을 이용하여 아홉가지 분류기 모델로 이모션 마이닝의 정확도를 비교하였다. 실험 결과, Tweet 데이터는 의사결정나무(DT)가 CFS, IG, ReliefF에 의한 속성을 이용할 경우 정확도가 상승했고, 랜덤서브스페이스(RS)는 CFS, IG에 선택된 속성을 사용할 경우 정확도가 상승했다. SemEval2007 데이터는 ReliefF에 의해 선택된 속성으로 로지스틱 회귀분석(LR)을 적용하였을 때 정확도가 상승했고, 나이브 베이지안 네트워크(NBN)은 CFS, IG에 의한 속성을 사용할 경우 정확도가 상승하였다.

철도 분기기 밀착검지기 Life expectancy의 유지보수 주기 결정에 관한 연구 (Study on the Maintenance Interval Decisions for Life expectancy in Railway Turnout clearance Detector)

  • 장병목;이종우
    • 한국철도학회논문집
    • /
    • 제20권4호
    • /
    • pp.491-499
    • /
    • 2017
  • 철도 분기기는 철도에 가장 중요한 시스템 중 하나이며, 분기기가 이상이 발생하였을 경우에는 사고가 발생할 수 있다. 분기기의 상태를 검지하기 위해서 밀착검지기를 사용한다. 밀착검지기의 고장은 분기기의 고장으로 간주되어 열차운행에 커다란 장애가 될 수 있다. 분기기 밀착검지기의 고장 특성분석은 분기기의 운용에서 매우 중요하다. 밀착검지기의 운용특성 및 고장특성을 분석하기 위해서, 밀착검지기를 본선(A) 및 측선(B), 분기기 동작 횟수가 10회 미만(C) 및 80회 이상(D)로 분류하였다. 선정된 밀착검지기 140대를 기준으로 밀착검지기 고장특성을 분석하였다. 분기기의 고장은 제어부, 케이블 및 검지센서에 발생하였으며, 이 데이터를 운용 환경(A, B, C, D)에 따라 분류하였으며 각각의 고장밀도함수를 선정하고 모수를 추론하여 사전분포 값을 선정하였다. Bayesian추론을 이용하여 기기의 평균수명과 한계수명(Life expectancy)을 예측하여 밀착검지기 제어부에 대한 교체시점을 제시하였다.

순환 아키텍쳐 및 하이퍼파라미터 최적화를 이용한 데이터 기반 군사 동작 판별 알고리즘 (A Data-driven Classifier for Motion Detection of Soldiers on the Battlefield using Recurrent Architectures and Hyperparameter Optimization)

  • 김준호;채건주;박재민;박경원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.107-119
    • /
    • 2023
  • 군인의 동작 및 운동 상태를 인식하는 기술은 웨어러블 테크놀로지와 인공지능의 결합으로 최근 대두되어 병력 관리의 패러다임을 바꿀 기술로 주목받고 있다. 이때 훈련 상황에서의 평가 및 솔루션 제공, 전투 상황에서의 효율적 모니터링 기능을 의도한대로 제공하기 위해서는 상태 판별의 정확도가 매우 높은 수준으로 유지되어야만 한다. 하지만 입력 데이터가 시계열 또는 시퀀스로 주어지는 경우, 기존의 피드포워드 신경망으로는 분류 성능을 극대화하는데 한계가 발생한다. 전장에서의 군사 동작 인식을 위해 다뤄지는 인간의 행동양식 데이터(3축 가속도 및 3축 각속도)는 시의존적 특성의 분석이 요구되기 때문에, 본 논문은 순환 신경망인 LSTM(Long-short Term Memory) 네트워크를 활용하여 취득 데이터의 이동 양상 및 순서 의존성을 파악하고 여덟 가지의 대표적 군사 동작(Sitting, Standing, Walking, Running, Ascending, Descending, Low Crawl, High Crawl)을 분류하는 고성능 인공지능 모델을 제안한다. 이때, 학습 조건 및 모델 변수는 그 정확도에 결정적인 영향을 끼치지만 인간의 수동적 조정이 필요해 비용 비효율적이고 최적의 값을 보장하지 못한다. 본 논문은 기계 스스로 일반화 성능이 극대화된 조건들을 취득할 수 있도록 베이지안 최적화를 활용해 하이퍼파라미터를 최적화한다. 그 결과, 최종 아키텍쳐는 학습 가능한 파라미터의 개수가 유사한 기존의 인공 신경망과 비교해서 오차율이 62.56% 감소할 수 있었으며, 최종적으로 98.39%의 정확도로 군사 동작 인식 기능을 구현할 수 있었다.