• 제목/요약/키워드: 통계적 학습 기법

검색결과 127건 처리시간 0.039초

통계적 모델과 신경회로망 모델의 성능 비교에 관한 연구 (Performance Comparison Between Neural Network Model and Statistical Models)

  • 한승수;김인택
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 D
    • /
    • pp.2401-2403
    • /
    • 2000
  • 시스템의 특성을 이해하고 신뢰성 있는 제어를 위해서는 시스템에 대한 정확한 모델을 필요로 한다. 이러한 목적을 위해서 많은 연구자들에 의한 다양한 방법의 모델링 방법이 계속되어 연구되어지고 있다. 현재 많이 사용하는 모델링 방법 중에는 통계적 기법을 이용하는 것, first principle 방법을 이용하는 것, 지능형 기법을 이용하는 방법 등이 있다. 본 연구에서는 통계적 방법인 fractional factorial 방법을 이용한 모델, Taguchi 방법을 이용한 모델, 그리고 지능형 방법인 신경회로망을 이용한 모델의 3가지 모델을 사용해서 각 모델의 학습오차와 예측오차 등의 특성을 비교하였다. 모델에 사용된 데이터는 비선형 시스템인 플라즈마 화학 증착 장비(Plasma-Enhnaced Chemical Vapor Deposition : PECVD)에 의해 증착된 산화막 실험 데이터이다. 각 모델에 대해서 PECVD 데이터를 사용하여 모델을 만들었을 때 각 모델의 학습오차와 학습오차 변위, 그리고 예측오차와 예측오차변위를 조사하였다. 세가지 모델 모두 학습오차가 예측오차보다 작았으며 변위 또한 학습오차변위가 예측오차변위보다 작았다. 본 연구 결과는 일반적으로 신경회로망에 의한 오차가 다른 통계적인 방법에 의한 오차보다 작음을 보여준다.

  • PDF

통계적 교수 ${\cdot}$ 학습 과정을 통한 그래프 이해력 증진에 관한 탐구

  • 박경연;최창우
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제11권
    • /
    • pp.107-126
    • /
    • 2001
  • 우리는 흔히 21C를 정보화 시대라고 하며 우리에게 주어지는 정보들 또한 일기예보와 같은 일상적인 분야에서 여론 조사와 같은 전문적인 분야에 이르기까지 아주 다양하다. 이런 정보들은 통계영역과 아주 밀접하며 이런 정보들을 통계적으로 바르게 해석하고 추론하여 일반화하는 등 일련의 과정들을 요구한다. 이런 상황아래 본 연구에서는 6차 초등학교 수학 교과서에서 여러 통계학 영역 중 그래프 형태로 가장 먼저 도입되는 막대그래프에 중점을 두어 현행 교과서에서 학습 내용과 학습 과정의 문제점에는 어떤 것이 있으며 아울러 그래프 이해력에 필요한 요소나 인지적 사고 능력, 그래프 이해력의 수준을 알아보고, 이를 바탕으로 여러 문헌을 통해 본 연구자가 나름대로 구안한 통계적 기법을 사용한 교수 ${\cdot}$ 학습 과정을 실험반에 적용한 후 그래프 이해력 사전 ${\cdot}$ 사후 검사를 비교함으로써 통계적 기법을 사용한 교수 ${\cdot}$ 학습 과정이 그래프 이해력에 어떠한 영향을 미치는지 알아보고자 한다.

  • PDF

기계학습 알고리즘의 컴퓨팅시간 단축을 위한 새로운 통계적 샘플링 기법 (A New Statistical Sampling Method for Reducing Computing time of Machine Learning Algorithms)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.171-177
    • /
    • 2011
  • 기계학습에서 모형의 정확도와 컴퓨팅시간은 중요하게 다루어지는 부분이다. 일반적으로 모형을 구축하는 데 사용되는 컴퓨팅시간은 분석에 사용되는 데이터의 크기에 비례하여 커진다. 따라서 컴퓨팅시간 단축을 위하여 분석에 사용되는 데이터의 크기를 줄이는 샘플링전략이 필요하다. 하지만 학습데이터의 크기가 작게 되면 구축된 모형의 정확도도 함께 떨어지게 된다. 본 논문에서는 이와 같은 문제를 해결하기 위하여 전체데이터를 분석하지 않아도 전체를 분석할 때와 비슷한 모형성능을 유지할 수 있는 새로운 통계적 샘플링방법을 제안한다. 주어진 데이터의 구조에 따라 최선의 통계적 샘플링기법을 선택할 수 있는 기준을 제시한다. 군집, 층화, 계통추출에 의한 통계적 샘플링기법을 사용하여 정확도를 최대한 유지하면서 컴퓨팅시간을 단축할 수 있는 방법을 보인다. 제안방법의 성능을 평가하기 위하여 객관적인 기계학습 데이터를 이용하여 전체데이터와 샘플데이터 간의 정확도와 컴퓨팅시간을 비교하였다.

기계학습 기법을 이용한 한국어 구문분석 (Korean Parsing using Machine Learning Techniques)

  • 이용훈;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.285-288
    • /
    • 2008
  • 최근의 구문분석 연구는 컴퓨터 성능 향상과 사용 가능한 대량의 구문분석 말뭉치 증가, 견고한 기계학습 기법 개발 등에 힘입어 통계적인 모델 연구가 꾸준히 증가하고 있다. 본 논문에서는 기존에 개발된 다양한 기계학습 기법 중 ME(Maximum Entropy) 모델과 SVM(Support vector machine) 모델을 이용한 한국어 구문분석 방법을 제안한다. 국어정보베이스(KIBS) 구문분석 말뭉치를 가지고 실험한 결과 SVM 모델을 이용한 한국어 구문분석기가 기존의 확률 기반 통계적 한국어 구문분석기의 성능보다도 최대 1.84% 높은 87.46%의 의존관계 결정 정확률을 보였다. 추후 언어지식을 반영한 다양한 자질들을 이용할 경우 성능 향상이 기대된다.

  • PDF

대화기반 사용자 피드백을 이용한 베이지안 네트워크 파라메터 학습 (Learning Bayesian Network Parameters using Dialogue based User Feedbacks)

  • 임성수;이승현;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.419-422
    • /
    • 2010
  • 사용자와 환경의 변화에 적응하기 위해서 베이지안 네트워크의 다양한 학습 방법들이 연구되고 있다. 기존의 많은 학습방법에서는 학습 데이터로부터 통계적 방법을 통해서 베이지안 네트워크 모델을 학습하는데, 이러한 접근 방법은 학습 데이터를 수집하기 어려운 문제에 적용하기 힘들며, 사용자의 의도를 데이터의 패턴들로만 학습하므로 직접적으로 사용자의 의도를 반영할 수 없다. 본 논문에서는 대화에 기반하여 사용자의 의도를 직접적으로 수집하고, 이로부터 베이지안 네트워크의 파라메터를 학습하는 방법을 연구한다. 제안하는 방법에서는 사용자와의 대화를 통해서 현재의 모델의 잘못된 점 혹은 개선점을 직접적으로 입력 받고, 이를 바탕으로 베이지안 네트워크 모델을 수정하여 데이터의 수집 없이 빠른 시간에 사용자가 원하는 모델을 학습 할 수 있다. 기존의 통계적 기법을 이용한 대표적인 베이지안 네트워크 파라메터 학습 방법인 최대우도 추정(Maximum Likelihood Estimation; MLE) 방법과 제안하는 방법을 비교하여 제안하는 방법의 유용성을 확인한다.

  • PDF

기계학습 기법을 이용한 문장경계인식 (Sentence Boundary Detection Using Machine Learning Techniques)

  • 박수혁;임해창
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.69-72
    • /
    • 2008
  • 본 논문은 언어의 통계적 특징을 이용하여 범용의 문장경계 인식기를 제안한다. 제안하는 방법은 대량의 코퍼스 내에서 사용되고 있는 문장 경계를 기준으로 음절 및 어절 등의 자질을 이용하여 통계적 특징을 추출하고 다양한 기계학습 기법을 사용하여 문장경계를 인식하고자 하였다. 또한 특정 언어나 도메인에 제한적이지 않고 범용적인 자질만을 사용하려고 노력하였다. 언어의 특성상 문장의 구분이 애매한 경우 또는 잘못 사용 된 구두점 등의 경우에도 적용 가능하도록 다양한 자질을 사용하여 실험하였으며, 한국어와 영문 코퍼스에 대해서 동일한 자질을 적용하여 실험하여 본 논문에서 제시한 자질들이 한국어 및 다른 언어권의 언어에도 적용될 수 있는 범용적인 자질임을 확인할 수 있었다. 한국어 문장경계 인식을 위한 기계학습 및 실험을 위해서 세종계획 코퍼스를 사용하였으며, 성능척도로는 정확률과 재현율을 사용하였으며, 실험결과 제안한 방법으로 99%의 정확률과 99.2%의 재현율을 보였다. 영문의 경우는 Wall Street Journal 코퍼스를 사용하였으며, 동일한 자질을 적용하여 실험한 결과 98.9%의 정확률과 94.6%의 재현율을 보였다.

의료영상 분할을 위한 3차원 능동 모양 모델 (Three-Dimensional Active Shape Models for Medical Image Segmentation)

  • 임성재;정용연;호요성
    • 전자공학회논문지SC
    • /
    • 제44권5호
    • /
    • pp.55-61
    • /
    • 2007
  • 본 논문은 관심 객체 분할을 위한 통계적 모양 모델에 기반한 3차원 능동 모양 모델링 기법을 제안한다. 3차원 모양 모델을 만들려면 포인트 분산 모델(PDM)의 생성이 필수적인데, 이를 위해서는 모든 학습(training) 데이터에 대응하는 특징점(landmark)을 잘 선택해야 한다. 현재까지도 3차원 데이터에서 대응하는 특징점을 선택하는 방법은 주로 수동적으로 선택하거나 2차원 기반 기법 또는 제한된 3차원 기법이 사용되고 있다. 본 논문에서는 최근에 제안된 "3차원 통계적 모양 모델의 자동생성 기법"의 거리 변환(distance transform)과 사면체(tetrahedron) 알고리듬을 사용하여 3차원 통계적 모양 모델을 생성하고 2차원 능동 모양 모델의 모양 모델 학습과 그레이레벨(gray-level) 모델 학습을 개선하여 확장하고, 스케일(scale)과 그레이레벨 모델을 결합한 3차원 능동 모양 모델 알고리듬으로 관심 객체를 분할한다. 본 논문에서는 제안한 방법을 영역 기반 윤곽선 기반 기법 및 2차원 능동모양모델 기법과 그 성능을 비교하여 평가했다.

상황정보와 공간 데이터 마이닝 기법을 이용한 추천 시스템 (Recommender System using Context Information and Spatial Data Mining)

  • 이배희;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.667-669
    • /
    • 2005
  • 유비쿼터스 시대를 향하여 나아가는 현대 사회에서 사람들을 위한 추천시스템은 필수 불가결한 요소 중의 하나이다. 추천 시스템 중에서 사용자의 성별, 나이, 직업 등의 인구 통계적 요소를 고려한 시스템이 주를 이루고 있지만 이러한 시스템에는 어느 정도의 한계가 있다. 추천에 있어서 사용자의 기분, 날씨, 온도 등 주변 환경의 상황이 반영되지 않고 있고 학습을 위한 데이터에 대한 신뢰도 또한 문제가 된다. 이러한 문제점을 해결하기 위해 본 논문에서는 상황정보(Context Information)와 공간 데이터 마이닝(Spatial Data Mining) 기법을 이용한 향상된 추천 시스템을 제안한다. 제안하는 시스템에서는 보다 정확한 추천을 위해 첫째, 날씨, 온도, 사용자의 기분 등의 상황정보를 고려하였다. 그리고 사용자의 유사도 측정을 통해 학습 데이터의 신뢰도를 향상시켰으며, 셋째, 의사결정 트리(Decision Tree) 기법을 이용하여 추천의 정확도를 높였다. 실험을 통하여 측정한 결과 제안하는 추천시스템이 기존의 인구 통계적 요소만을 고려한 시스템이나 의사결정 트리만을 이용한 시스템보다 향상된 성능을 보였다.

  • PDF

초음파 영상의 통계적 특징 벡터를 활용한 지방간 분석 알고리즘 (Novel Analysis Algorithm of Fatty Liver using statistical feature vector from Ultrasound image)

  • 하수희;유재천
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.556-558
    • /
    • 2019
  • 기존 초음파 지방간 분석은 Hepatorenal sonographic index(HI)를 사용하여 지방간을 진단하여 왔다. 이러한 HI 기법에서는 Hepato(간)과 Renal(신장), 두 부분의 영상데이터를 비교 활용하였다면, 본 논문에서는 신장의 영상데이터만을 이용하여, 이의 통계적 특징 벡터만을 활용하여 지방간을 진단을 함으로서 기존의 HI기반 분석대비 편리성과 정확도를 개선코자 Kidney Index(KI) 기반의 분석 기법을 제안한다. 본 논문에서 제안된 KI는 정상간과 지방간을 가진 실제 환자의 초음파 사진(정상간, 지방간 각 30명)을 학습 데이터를 구성하고, 이들 데이터군으로부터 특징 벡터들을 선별하여 머신러닝 기법 중 서포트 벡터 머신(Support Vector Machine)을 통해 학습시켜, 제안된 알고리즘의 유효성을 입증하였다.

음성인식기의 변별력있는 학습 알고리즘들 (Discriminative Training Algorithms for Speech Recognizers)

  • 나경민
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.166-171
    • /
    • 1994
  • 기존의 음성인식기들은 일반적으로 간단하면서도 성능이 우수한 계층별 학습에 의해서 설계된다. 계층별 학습은 통계적 패턴인식에서의 ML 추정기법처럼 모델간의 독립성이 보장되고 무한한 양의 학습데이타가 주어진다는 가정에 기초하고 있다. 그러나, 대상어휘집합에 음운학적으로 유사한 어휘가 많이 포함되어 있는 인식문제에 있어서는 모델간의 독립성이 보장되지 못하고, 실제 주어지는 grktmqepdlk의 양도 제한되므로 기존의 합습알고리즘에는 한계가 있다. 따라서 본 논문에서는 그러한 가정상의 문제점으로 생기는 인식기의 성능저하를 개선할 수 있는 변별력 있는 학습알고리즘들을 검토하고 그의 일반적인 접근방법들에 대해서 논의한다.

  • PDF