• 제목/요약/키워드: 통계 분류

검색결과 2,146건 처리시간 0.026초

80년대 한국 통계의 현황과 장래: 통계이론을 중심으로

  • 우정수
    • Journal of the Korean Statistical Society
    • /
    • 제20권
    • /
    • pp.10-18
    • /
    • 1991
  • 한국통계학회 창립 20주년을 맞아 80년대의 한국통계의 현황과 장래의 나아갈 방향에 대해 의견을 교환하는 것은 뜻깊은 일이라 할 것이다. 그러나 통계이론에 관해 깊이 있는 의견을 제시하는 것은 쉬운 일은 아닌 것 같다. 10주년 기념호 통계학연구에서 백운붕 박사께서 통계이론의 범위를 광의의 수리통계학으로 해석하였듯이 필자도 통계이론을 이론통계학과 같은 차원의 넓은 의미로 사용하기로 한다. 한국통계에서의 통계이론의 현황을 살펴보기 위해서는 국제적인 현황을 먼저 살펴보아야 한다고 생각된다. 여기에는 여러가지 이유가 있겠지만 자연과학이라는 학문이 그러하듯이 통계학이란 학문 자체가 외국에서 발생되어 우리나라에 도입된 학문으로 우리나라에서 독자적으로 연구 교육되어온 학문이 아니기 때문에 당연히 국제적인 현황가 깊은 관계가 있으리라고 짐작되기 때문이다. 그러한 이유에서 먼저 1980년대에 Annals of Statistics와 JASA에 게재된 논문의 내용을 분류하여, 1970년대 후반기의 경향과 비교하여 1980년대의 흐름을 간략히 살펴보고자 한다. 물론 한국 통계의 현황을 알아보기 위해서는 한국통계학회지인 통계학연구를 분석해 보는 것이 무엇보다 필요하리라 생각된다. 그리고 한국통계학자들의 연구 동향을 고찰하기 위해서는 학술발표회의 논문을 분류하는 것이 타당하다고 생각된다. 따라서 본고에서는 1981년부터 1990년까지의 통계학연구지 논문과 1985년부터 1990년까지의 춘계 및 추계 학술논문발표회의 발표 논문을 분류하여 비교해 보고자 한다.

  • PDF

불완비 데이터에서 분류 나무의 구축

  • 우주성;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.105-108
    • /
    • 2001
  • 본 논문에서는 결측치가 있는 불완비 데이터에서 분류나루를 구축하는 방법을 고찰하였다. 기존의 결측치 처리 방법인 대리 분리 방법의 대안으로 대체 방법으로 결측치를 처리한 후 분류나무를 구축하는 방법을 제안하였다.

  • PDF

범주형 자료에서 경험적 베이지안 오분류 분석 (Empirical Bayesian Misclassification Analysis on Categorical Data)

  • 임한승;홍종선;서문섭
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.39-57
    • /
    • 2001
  • 범주형 자료에서 오분류는 자료를 수집하는 과정에서 발생될 수 있다. 오분류되어 있는 자료를 정확한 자료로 간주하여 분석한다면 추정결과에 편의가 발생하고 검정력이 약화되는 결과를 초래하게 되며, 정확하게 분류된 자료를 오분류하고 판단한다면 오분류의 수정을 위해 불필요한 비용과 시간을 낭비해야 할 것이다. 따라서 정확하게 분류된 표본인지 오분류된 표본인지를 판정하는 것은 자료를 분석하기 전에 이루어져야할 매우 중요한 과정이다. 본 논문은 I$\times$J 분할표로 주어지는 범주형 자료에서 두 변수 중 하나의 변수에서만 오분류가 발생되는 경우에 오분류 여부를 검정하기 위해서 오분류 가능성이 없는 변수에 대한 주변합은 고정시키고, 오분류 여부를 가능성이 있는 변수의 주변합을 Sebastiani와 Ramoni(1997)가 제안한 Bound와 외부정보로 표현되는 Collapse의 개념, 그리고 베이지안 방법을 확장하여 자료에 적합한 모형과 사전정보를 고려한 사전모수를 다양하게 설정하면서 재분류하는 연구를 하였다. 오분류에 대한 정보를 얻기 위해서 Tenenbein(1970)에 의해 연구된 이중추출법을 이용하여 오분류 검정을 위한 새로운 통계량을 제안하였으며, 제안된 오분류 검정통계량에 관한 분포를 다양한 모의실험을 통하여 연구하였다.

  • PDF

옥타브밴드 순서 통계량에 기반한 음악 장르 분류 (A Musical Genre Classification Method Based on the Octave-Band Order Statistics)

  • 서진수
    • 한국음향학회지
    • /
    • 제33권1호
    • /
    • pp.81-86
    • /
    • 2014
  • 본 논문은 음악신호의 옥타브 밴드 상에서 주파수와 시간 방향의 순서 통계량에 기반한 음악분류기에 대한 연구이다. 음악의 화음 및 강약 구조를 표현하기 위해서 파워스펙트럼의 옥타브 밴드 순서 통계량을 이용하였다. 널리 사용되고 있는 두 음악 데이터셋을 이용한 성능 실험을 통해서, 옥타브 밴드 순서 통계량이 기존의 MFCC 와 옥타브밴드 스펙트럼 고저차 특징에 비해서 두 데이터셋에대해 각각 2.61 %와 8.9 % 장르 분류정확도가 개선되었다. 실험결과는 옥타브 밴드 순서 통계량이 음악 장르 분류에 적합함을 보인다.

ROC 곡면에서 VUS의 판단기준 (Standard Criterion of VUS for ROC Surface)

  • 홍종선;정의석;정동근
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.977-985
    • /
    • 2013
  • 현실세계에는 두 가지 범주 이상으로 분류되는 경우가 많이 존재한다. 본 논문은 분류범주가 세 종류인 분류모형을 시각적으로 표현하는 방법인 ROC 곡면과 이 곡면 아래의 체적을 나타내는 VUS 통계량을 고려한다. 바젤 II에 기반한 부도확률에 관한 AUC 통계량의 판단기준을 ROC 곡면에서의 VUS에 대하여 확장하여, VUS에 의한 판별력 판단기준 13단계를 제안한다. 제안한 판단기준 각 단계에서의 VUS값에 대응하는 AUC, K-S 통계량 그리고 세 분포의 평균차이에 대한 범위를 탐색하고, 이들의 관계를 살펴봄으로써 VUS 통계량의 판별력 판단기준을 설정한다.

전기화재 조사 및 통계의 신뢰성 향상을 위한 원인분류방법의 개발 (Development of Cause Classification Method for Improving Reliability of Electrical Fire Statistics)

  • 전정채;전현재;이상익;유재근
    • 한국산학기술학회논문지
    • /
    • 제8권3호
    • /
    • pp.466-471
    • /
    • 2007
  • 전기화재는 전체 화재의 30% 이상을 차지하고 있지만 전기화재 통계의 신뢰성에 대한 검토가 제대로 이루어지지 못하였다. 전기화재는 원인분류 방법 또는 체계의 미흡으로 전기적 요인이 아닌 경우에도 전기화재로 분류되어 높은 점유율을 차지하게 되었고 그로 인한 전기화재 통계의 문제점이 제기되었다. 따라서 기존의 전기화재 원인 분류 방법의 개선을 통해 전기화재 통계의 신뢰성 확보가 필요하다. 본 논문에서는 기존의 전기화재 원인분류에 따른 전기화재 조사 및 통계의 문제점을 분석하였고 새로운 전기화재 원인분류 방법을 제시하였다.

  • PDF

부분 AUC와 최적분류점들 (Partial AUC and optimal thresholds)

  • 홍종선;조현수
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.187-198
    • /
    • 2019
  • ROC와 CAP 곡선을 이용하여 다양한 정확도 측도를 바탕으로 최적분류점을 추정하는 많은 연구가 있다. 본 연구에서는 ROC와 CAP 곡선의 특정한 부분 면적을 나타내는 대안적인 통계량을 제안한다. 새롭게 정의된 부분 면적을 나타내는 통계량의 미분방정식을 이용하여 ROC와 CAP 함수와의 관계를 살펴보고, 다음으로는 ROC와 CAP 곡선에 대한 다양한 정확도 측도들의 조건에서의 최적분류점과의 관계를 유도한다. 혼합분포를 구성하는 두 종류의 분포함수를 다양한 정규분포로 가정하여 최적분류점을 설정하고, 다양한 정확도 측도들의 조건에서의 최적분류점에 대응하는 제1종과 제2종 오류의 크기를 탐색하고 토론한다.

Hotelling의 T$^{2}$ 통계량을 이용한 cDNA 마이크로어레이 분석

  • 김병수;이선호;김인영;김상철;라선영;정현철
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.295-297
    • /
    • 2003
  • 본 논의에서는 cDNA 마이크로어레이 분석에서 다변량 분석의 한 방법인 Hotelling의 T제곱 통계량을 이용하여 유의적 유전자군을 검색하고, 이 유전자군을 사용하여 검사자료를 두군으로 분류하는데 단변량 t통계량에 기초한 접근보다 얼마나 효율적인지를 평가하고자 한다.

  • PDF

자동차의 사후관리를 위한 등록통계 시스템 개발에 관한 연구 (A study on total registration statistics system development for after service of automobile)

  • 강지호
    • 오토저널
    • /
    • 제17권1호
    • /
    • pp.31-43
    • /
    • 1995
  • 본 연구에서는 교통부 자동차 등록 원시자료를 이용하여 자동차제작사가 직접 사용할 수 있는 사후관리를 위한 등록통계 시스템을 개발해서 결과를 제시하고자 한다. 특히 통계 활용범위를 극대화하도록 하기 위해 차명은 코드화로 작성하여 통합차명으로 표준화, 업계재편과정으로 인한 종전 자동차 제작사는 합병, 인수한 최종 자동차제작사에 통합, 단산 및 양산 차명별로 차령별분류, 시.군.구의 행정단위별의 통계정보 수록 및 자동차소유자의 구매성형분석을 위한 년령별분류외 15개 유형별로 개발결과를 제시함으로써 효율적이고 과학적인 통계를 산출할 수 있도록 하고자 한다.

  • PDF

그룹분류가능계획를 이용한 최적 블록 CDC의 설계

  • 김진;배종성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.109-114
    • /
    • 2001
  • m=2 또는 n=2이고, ${\lambda}_1<{\lambda}_2$인 그룹분류가능계획을 매개디자인으로 사용한 완전이면교배가 A-최적, D-최적임을 보였다. 또한, ${\lambda}_2={\lambda}_1+1$이면 일반화된 최적계획이 됨을 보였다.

  • PDF