• 제목/요약/키워드: 분류오류

검색결과 646건 처리시간 0.022초

특징 공간을 사선 분할하는 퍼지 결정 트리 (A Fuzzy Decision Tree to Partition Feature Space with Oblique Planes)

  • 이우항;이건명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.21-23
    • /
    • 1999
  • 결정 트리는 실세계에서 얻어지는 많은 사례들로부터 분류 정보를 얻기 위해 사용되는 유용한 방법중의 하나이다. 분류를 목적으로 사용되는 사례, 즉 데이터들은 실제 현장에서 얻어지기 때문에 관측오류, 불확실성, 주관적인 판단 등의 원인으로 참 값이 아닌 근사 값으로써 기술되는 경우가 많으며, 이러한 잠재적 오류로 인해 잘못된 결정 트리가 생성될 수 있다. 한편, 트리를 생성하는 각각의 과정에서 하나의 특징 값만을 고려하지 않고 두 가지 이상의 특징 값을 동시에 고려하여 결정 트리를 생성할 경우 보다 정확한 분류 정보를 기대할 수 있다. 본 논문에서는 수치 특징 값으로 기술된 데이터로부터 보다 정확한 분류 정보를 얻을 수 있고, 작은 오류에 강건한 사선형 분할 퍼지 결정 트리를 제안한다. 또한 제안된 사선형 분할 퍼지 결정 트리의 생성 절차 및 생성된 결정 트리를 이용하여 새로운 데이터에 분류 정보를 부여하는 추론 과정을 소개한다.

  • PDF

딥러닝 기반 한국어 맞춤법 교정을 위한 오류 유형 분류 및 분석 (Classification and analysis of error types for deep learning-based Korean spelling correction)

  • 구선민;박찬준;소아람;임희석
    • 한국융합학회논문지
    • /
    • 제12권12호
    • /
    • pp.65-74
    • /
    • 2021
  • 최근 기계 번역 기술과 자동 노이즈 생성 방법론을 기반으로 한국어 맞춤법 교정 연구가 활발히 이루어지고 있다. 해당 방법론들은 노이즈를 생성하여 학습 셋과 데이터 셋으로 사용한다. 이는 학습에 사용된 노이즈 외의 노이즈가 테스트 셋에 포함될 가능성이 낮아 정확한 성능 측정이 어렵다는 한계점이 존재한다. 또한 실제적인 오류 유형 분류 기준이 없어 연구마다 사용하는 오류 유형이 다르므로 질적 분석에 어려움을 겪고 있다. 이를 해결하기 위해 본 논문은 딥러닝 기반 한국어 맞춤법 교정 연구를 위한 새로운 '오류 유형 분류 체계'를 제안하며 이를 바탕으로 기존 상용화 한국어 맞춤법 교정기(시스템 A, 시스템 B, 시스템 C)에 대한 오류 분석을 수행하였다. 분석결과, 세 가지 교정 시스템들이 띄어쓰기 오류 외에 본 논문에서 제시한 다른 오류 유형은 교정을 잘 수행하지 못했으며 어순 오류나 시제 오류의 경우 오류 인식을 거의 하지 못함을 알 수 있었다.

온라인 프로그래밍 개념학습 성취수준과 오류유형과의 관계 분석 (The Analysis of Relationship between Academic Achievement Level of Concept Learning and Error Type in Online Programming Course)

  • 김지선;김영식
    • 컴퓨터교육학회논문지
    • /
    • 제17권5호
    • /
    • pp.43-51
    • /
    • 2014
  • 본 연구는 중 고등학생들의 온라인 프로그래밍 과제 수행결과에서 발생한 오류를 파악하여, 오류유형과 오류내용을 분류하고, 프로그래밍 개념학습 성취수준에 따른 오류 빈도의 차이와 성취수준과 오류유형과의 상관관계를 분석하여 향후 프로그래밍 교육에 대한 방향과 인지수준에 따른 교육방법을 제시하였다. 연구를 위해 88명의 학생들의 프로그래밍 과제 수행 결과를 가지고 문법오류, 논리오류, 코딩오류로 오류유형과 오류내용을 분류하고 분석하였다. 분석결과, 세 오류유형 중 논리오류의 발생비율이 69.3%로 가장 높았으며, 성취수준에 따른 오류 빈도의 차이에서는 성취수준 상, 중, 하 세 집단 간에 유의한 차이가 있었다. 성취수준과 오류유형과의 상관관계 분석 결과에서는 논리오류와 코딩오류에서 부적 상관관계를 보여, 성취수준이 높을수록 논리오류와 코딩오류를 적게 범함을 알 수 있었다. 오류유형간의 상관관계에서는 문법오류와 코딩오류간의 정적상관관계를 보였다.

  • PDF

풍수해 피해이력 자료 분석을 통한 통계적 오류유형 분류 (Classification of Statistical Error Types Through Analysis of Wind and Flood Damage History Data)

  • 김구윤;이미란;이준우
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2022년 정기학술대회 논문집
    • /
    • pp.135-136
    • /
    • 2022
  • 최근 기후변화의 영향으로 태풍 및 국지성 집중호우 등 자연재해 발생빈도가 증가함에 따라 풍수해로 인한 인명피해와 재산피해가 증가하고 있다. 국내에서는 재해연보를 통해 자연재난 피해이력 통계정보를 제공하고 있으며, 당해연도 자연재해상황을 기간별, 시도별, 수계별, 월별, 원인별 총괄통계와 인명피해, 시설피해와 관련된 피해면적, 피해액, 복구액 등 세부내용으로 구성하여 정보를 제공하고 있다. 행정안전부는 국가재난정보시스템을 통해 취합된 지자체 피해이력 통계자료를 입력하고 있는데 입력하는 과정에서 누락, 오기 등의 오류가 발생할 가능성이 있다. 경제적 손실이 증가하고 있는 풍수해 재난이 발생하게 될 경우 피해비용 집계, 피해액 산정 등 정확한 자료로서 구축되지 않으면 연구 및 분석을 수행하기 위한 통계자료로서 활용될 수 없다. 이러한 문제점을 개선하기 위해서 본 연구에서는 1985년부터 2018년까지 재해연보에 대해서 기간별-시군구별 자료분석을 통해 피해이력 데이터 오류 유형에 대해 분류하였다.

  • PDF

보로노이 공간분류를 활용한 원격 영상 패턴분류 시스템 (Pattern Classification System for Remote Sensing Data using Voronoi Diagram)

  • 백주현;김홍기
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.335-342
    • /
    • 2001
  • 본 논문은 보로노이 공간분류를 활용하여 원격탐사 영상인식을 위한 다층 신경망 분류기를제안한다. 제안된 다층 신경망 분류기는 보로노이 다각형 영역으로 클래스를 구분하며, 초평면 방정식의 계수를 오류 역전과 학습 초기의 연결 강도, 임계치 그리고 은닉층의 노드 수로 결정한다. 제안된 방법은 오류역전과 학습 알고리즘에서 임의로 정해주던 초기 정보를 사전 분석에 의해 공학적으로 결정함으로써 느린 수렴 속도와 학습실패 등의 단점을 피할 수 있는 장점이 있다. 보로노이 다이어그램에 대한 경계선의 초평면 방정식은 훈련집합의 클래스별 평균값을 구하여 Mathematica 패키지로 계산하였다. 제안된 다층 신경망에 의한 영상분류기의 인식능력을 평가하기 위하여 원격탐사 영상인식에서 자주 활용되는 최소거리 분류 방법과 최대우도 분류 방법으로 처리해서 비교한 결과, 최소거리 분류 방법은 실험화상에 대해 81.4%, 최대우도 부류기에 의한 분류는 87.8%, 제안한 방법은 92.2% 정확성을 가진 분류결과를 나타냈다.

  • PDF

클러스터 내 분별 오류 최소화를 위한 퍼지 클러스터링 (Within-Cluster-Discriminative Fuzzy Clustering)

  • 허경용;이수종
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.269-270
    • /
    • 2013
  • 퍼지 클러스터링은 유사도가 높은 데이터 포인트들이 동일한 클러스터에 포함되도록 하는 대표적인 비교사 학습 방법 중 하나이다. 이 논문에서는 클러스터링을 분류기의 전처리 단계에서 활용할 수 있도록 클러스터 내에서 분류 오류가 최소가 될 수 있도록 클러스터를 생성할 수 있는 새로운 퍼지 클러스터링 방법을 제안한다. 제안하는 클러스터링은 특징 벡터와 함께 클래스 라벨을 활용하므로 분류기와 결합하여 사용할 경우 기존 분류기와 함께 사용할 경우 보다 우수한 성능을 기대할 수 있다.

  • PDF

오류 분류를 이용한 소프트웨어 신뢰도 모델 (A Study Software Reliability Model Using Error-Class)

  • 조영식;이용근;최형진;양해술
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.231-241
    • /
    • 1996
  • 지금까지 많은 소프트웨어 신뢰도 성장 모델들의 제안되어 왔으나 현상을 완전히 고려한 소프트웨어 신뢰도 모델은 아직 개발되어 있지 못한 실정이다. 따라서 다양한 소프트웨어 신뢰도 모델이 계속 개발되어 모든 현상을 고려할 수 있는 모델의 개발이 필요하다고 볼 수 있다. 이와 같은 목적하에 본 논문에서는 발견되는 오류를 오류의 특성에 따라 3종류로 분류하였고, 또한 각 오류의 분류된 오류의 발견 시점 등을 고려 하여 소프트웨어의 신뢰도를 측정할 수 있는 신뢰도 모델을 제안하였다. 그리고모델의 파라메타의 추정 및 신뢰성 평가를 위해실측 데이타를 이용하여 고찰하였으며, 본 논문의 적합성을 검증하기 위해 기존의 모델과 비교 분석 하였다.

  • PDF

오류정정부호를 이용한 스트림 암호시스템에 관한 연구 (A study on the Stream Cipher System using Error Correcting Codes)

  • 태영수
    • 정보보호학회논문지
    • /
    • 제1권1호
    • /
    • pp.66-78
    • /
    • 1991
  • 본 논문에서는 스트림 암호시스템의 종류와 오류전파 특성에 대해 분석한다. 또한, 암호문 전송중 전송로상에서 발생하는 오류르 제어할 목적으로 DSEC(31, 27) RS 부호를 암호문 귀환암호시스템에 내부오류제어 및 외부오류제어로 분류하여 적용하고 오류정정과정을 분석한다.

분산 멀티미디어 환경에서 실행되는 오류 분류 시스템의 성능 분석 (Performance Analysis of Error Classification System on Distributed Multimedia Environment)

  • 고응남
    • 디지털콘텐츠학회 논문지
    • /
    • 제4권2호
    • /
    • pp.181-189
    • /
    • 2003
  • 분산 멀티미디어 응용에 대한 요구는 정교한 QoS 관리를 위해서 필요하다. 분산 멀티미디어 시스템 견지에서 보면, QoS의 가장 중요한 범주는 시간성, 볼륨, 신뢰성이다. 본 논문에서는 결함 허용을 통해서 신뢰성을 향상시키는 방법에 대해서 기술한다. ECA는 분산 멀티미디어에서 하나의 소프트웨어 오류를 자동적으로 분류할 수 있는 시스템이다. 본 논문은 규칙-기반 DEVS 모델링과 시뮬레이션 기법을 사용하면서 분산 멀티미디어 상에서의 오류 분류 시스템의 성능 분석을 설명한다. DEVS에서 하나의 시스템은 시간, 입력, 상태, 출력 및 함수들을 가지고 있다.

  • PDF

말뭉치를 기반으로 한 한국어 철자 교정기의 구현 (Korean Spelling Corrector Based on Corpus Analysis)

  • 이병훈;윤준태;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.285-293
    • /
    • 1993
  • 대량의 말뭉치에서 나타나는 맞춤법 오류의 대부분은 타자수의 입력 실수로 인한 것이다. 맞춤법 오류의 유형은 크게 띄어 쓰기 오류, 철자 오류, 띄어 쓰기와 철자의 복합 오류의 세 가지로 나타난다. 이 중, 철자 오류를 표층 형태만으로 표준어 오류, 조사/어미 오류, 자소 대치 오류로 유형을 분류하였다. 본 논문은 300만 말뭉치에서 형태소 분석이 실패한 맞춤법 오류 어절 중에서 띄어 쓰기와 철자 오류를 분석하여, 각 오류 유형에 따른 교정 방법과 자소 대치 규칙 베이스를 이용한 교정 방법을 구현하였다. 또한 형태소 분석기를 거친 40만 어절 사전을 이용한 분석기로 기존의 형태소 분석기를 대치시켜 교정 어절을 검증하였고, 위의 사전에서 추출한 순위 결정 요소와 Heuristic 정보를 이용하여 각 후보 어절에 대한 가중치를 계산하고 가능성이 높은 교정 어절을 제시하는 시스템을 구현하였다.

  • PDF