• 제목/요약/키워드: 최적분류기준

검색결과 118건 처리시간 0.025초

대안적인 분류기준: 오분류율곱 (Alternative Optimal Threshold Criteria: MFR)

  • 홍종선;김효민;김동규
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.773-786
    • /
    • 2014
  • 본 연구는 ROC 곡선에서 형성되는 면적 형태로 나타나는 분류정확도기준인 오분류율곱(multiplication of false rates; MFR)를 제안한다. MFR 기준과 다른 기준로부터 구한 최적분류점의 분류성과에 대하여 비교 분석한다. 다양한 분포함수에 대하여 최적분류점을 구하고 이에 대응하는 FNR과 FPR을 비교하면서 MFR의 특징과 장점을 유도한다. 일반적인 비용함수를 바탕으로 분류점에 대한 비용비율을 다양한 분류기준을 이용하여 구한다. 비용곡선에 대한 비용비율의 관계를 정리하여 MFR 기준의 장점을 탐색한다. MFR 기준의 정의를 다차원 ROC 분석으로 확장하고 다차원의 다른 분류기준과의 관계를 설명하면서 토론한다.

전자해도 수심객체 최적표현 방안 연구

  • 오세웅;고현주;박종민;이문진
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2010년도 추계학술대회
    • /
    • pp.7-9
    • /
    • 2010
  • 전자해도에는 해안선, 등심선, 수심, 항로표지, 위험물, 항로 등 선박의 항해와 관련된 모든 해도정보를 포함하고 있으며, 각 정보는 속성정보와 공간정보를 가지고 데이터 레코드 단위로 저장된다. 수심 정보의 경우 점 형태의 공간정보로서 전자해도 격자 구역에 포함되는 수백에서 수천 개의 수심 위경도 좌표와 수심정보를 포함하고 있다. 수심 정보는 전자해도 중첩의 주된 원인이 되어 수심정보의 최적표현 기법 개발이 요구되었다. 본 연구에서는 전자해도 수심정보의 표현 기준을 수립하고, 기준에 따라 수심정보의 최적표현 방법을 제안하였다. 세부 내용으로 전자해도 수심정보 표현기준을 작성하고 전자해도에서 수심정보를 추출한 다음 기준에 따라 수심정보를 분류 하였다. 또한 분류한 수심정보를 전자해도에 저장하고 그 결과를 확인 하였다.

  • PDF

이변량 ROC곡선 (Bivariate ROC Curve)

  • 홍종선;김강천;정진아
    • Communications for Statistical Applications and Methods
    • /
    • 제19권2호
    • /
    • pp.277-286
    • /
    • 2012
  • 신용평가모형에서 부도로 잘못 예측된 정상 차주의 비율과 정확하게 평가된 부도차주의 비율인 일변량 누적분포함수로 표현된 ROC 곡선을 이용하여 분류성과를 평가한다. 본 연구에서는 스코어 확률변수를 이변량으로 확장하여 부도와 정상 차주의 결합누적분포함수를 이용하여 표현할 수 있는 ROC 곡선을 제안한다. 이변량 평균벡터를 통과하는 확률변수의 선형 관계를 이용하여 이변량 ROC 곡선을 구현한다. 그리고 다양한 이변량 정규분포에 대한 ROC 곡선으로부터 분류성과를 탐색하고, 이에 대응하는 AUROC 통계량과 비교분석한다. 본 연구에서 제안한 이변량 ROC 곡선으로부터 분류기준에 적합한 최적분류점을 구하고 이를 통해 이변량 혼합분포함수의 최적 분류기준을 설정할 수 있음을 보인다.

불균형 자료에서 불순도 지수를 활용한 분류 임계값 선택 (Selecting the optimal threshold based on impurity index in imbalanced classification)

  • 장서인;여인권
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.711-721
    • /
    • 2021
  • 이 논문에서는 불균형 자료에 대한 분류 분석에서 불순도지수를 이용하여 임계값을 조정하는 방법에 대해 알아본다. 이항자료에 대한 분류에서는 소수범주를 Positive, 다수범주를 Negative라고 하면, 일반적으로 사용하는 0.5 기준으로 범주를 정하면 불균형 자료에서는 특이도는 높은 반면 민감도는 상대적으로 낮게 나오는 경향이 있다. 소수범주에 속한 개체를 제대로 분류하는 것이 상대적으로 중요한 문제에서는 민감도를 높이는 것이 중요한데 이를 분류기준이 되는 임계값을 조정을 통해 높이는 방법에 대해 알아본다. 기존연구에서는 G-mean이나 F1-score와 같은 측도를 기준으로 임계값을 조정했으나 이 논문에서는 CHAID의 카이제곱통계량, CART의 지니지수, C4.5의 엔트로피를 이용하여 최적임계값을 선택하는 방법을 제안한다. 최적임계값이 여러 개 나올 수 있는 경우 해결방법을 소개하고 불균형 분류 예제로 사용되는 데이터 분석을 통해 0.5를 기준으로 ?(무엇?)을 때와 비교하여 어떤 개선이 이루어졌는지 등을 분류성능측도로 알아본다.

정규혼합에서 분류정확도 측도들의 최적기준 (Optimal Criterion of Classification Accuracy Measures for Normal Mixture)

  • 유현상;홍종선
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.343-355
    • /
    • 2011
  • 두 분포함수의 혼합모형을 가정한 자료에서 적절한 분류점을 찾고 평가하는 것은 중요한 문제이다. 분류정확도 측도로 많이 사용하는 아홉 종류의 MVD, Youden지수, (0,1)까지 최단기준, 수정된(0,1)까지 최단 기준, SSS, 대칭점, 정확도면적, TA, TR에 대하여 설명하고, 이 측도들의 관계를 발견하면서 정확도 측도들의 조건을 몇 개의 범주로 군집화한다. 정규혼합분포를 가정하여 군집된 측도들에 기반하는 분류점들을 구하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율합을 구하여 크기를 비교하고 토론하다. 추정된 혼합분포에 대하여 어떤 분류 정확도 측도의 제I종과 II종 오류율 또는 오류율합이 최소인지를 탐색할 수 있으며 자주 인용하는 정확도 측도의 장점과 단점을 파악할 수 있다.

GIS를 이용한 해안단구 지형면 분류 기법 연구 - 감포지역을 사례로 - (Development of the GIS Method for Extracting a Specific Geomorphic Surface of Coastal Terrace at Gampo Area, Southeastern Coast in Korea)

  • 박한산;윤순옥;황상일
    • 대한지리학회지
    • /
    • 제36권4호
    • /
    • pp.458-473
    • /
    • 2001
  • 지형면 분류도는 지형학 연구에 있어서 가장 기본적인 자료이다 최근가지 이루어지고 있는 항공사진, 지형도 및 현지조사에 의한 지형면 분류 방법은 많은 시간과 높은 숙련도를 요구하며, 항공사진 획득에도 어려움이 있다. 현재 우리나라는 수치지도가 거의 완성되었으므로. GIS를 이용하여 해안단구 지형이 갖는 해발고도와 경사도의 특성을 정량적으로 분석하면, 적합한 지형면을 찾아낼 수 있다. 본 연구에서는 이미 전통적인 방법에 의해 해안단구 연구가 다수 이루어진 한국 남동해안 경주시 감포읍 지역에서, GIS를 이용하여 보다 효율적이고 객관적인 해안단구 지형면 분류 기법을 제시하였다. 이를 위하여 해안단구 지형면 분류 과정을 설계하였으며, 지형면 분류에 적합한 분류요인을 선정하고, 최적분류기준을 추출하여 지형면을 분류한 후, 부합을 및 오류율을 통하여 이러한 방법에 대한 효용성과 문제점을 검토하였다.

  • PDF

K-평균 군집방법을 이요한 가중커널분류기 (Kernel Pattern Recognition using K-means Clustering Method)

  • 백장선;심정욱
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.447-455
    • /
    • 2000
  • 본 논문에서는 커널분류기에 요구되는 다량의 계산량과 자료저장공간을 감소시키도록 고안된 최적군집방법을 적용한 K-평균 가중커널분류기법이 제안되었다. 이 방법은 원래의 훈련표본보다 작은 수의 참고벡터들과 그들의 가중값을 들을 찾아 원래 커널분류 기준을 근사화하여 패턴을 인식하는 것이다. K-평균 가중커널분류기법은 가중파젠윈도우(WPW)분류기법을 개량한 것으로서 참고벡터들을 계산하기 위한 초기 부적절하게 군집된 관측값들을 최적으로 재군집화 함으로써 WPW기법의 단범을 극복하였다. 실제자료들에 제안된 방법을 적용한 결과 WPW분류기법보다 참고벡터들의 대표성과 자료축소면에서 월등히 향상된 결과를 확인하였다

  • PDF

신 분류기준을 적용하기 위한 원전 해체폐기물량 및 처분 비용 산정에 대한 사전 연구 (A Pre-Study on the Estimation of NPP Decommissioning Radioactive Waste and Disposal costs for Applying New Classification Criteria)

  • 송종순;김영국;이상헌
    • 방사성폐기물학회지
    • /
    • 제13권1호
    • /
    • pp.45-53
    • /
    • 2015
  • 1978년 고리 1호기의 상업 운전을 시작으로 현재 우리나라에서는 총 23기의 원전이 운영 중에 있다. 운영 중인 원전으로부터 방사성폐기물이 계속 발생되고 누적되어 갈 것이다. 또한 원전의 수명 연장과 신규 원전의 추가 건설 이외에도 제염해체 연구시설 등 각종 원자력 시설에서 발생하는 방사성폐기물은 꾸준히 증가하고 있다. 우리나라는 최근 IAEA에서 권고하는 신 분류기준을 적용한 신분류기준에 대해 원자력안전위원회 고시를 개정하였다. 중·저준위폐기물을 IAEA 신 분류기준을 적용하여 세분화한다면, 약 98%를 차지하는 저준위 및 극저준위 방사성폐기물과 규제면제폐기물을 효과적으로 처분 할 수 있게 된다. 본 논문에서는 신 분류기준을 적용한 해외 적용 사례와 처분 방안 현황을 분석하여 국내에 적용 가능한 최적의 합리적인 적용 방안 및 해체 방사성폐기물량을 산정해 보고자 한다.

분산 환경하에서의 데이타관리 분류체계에 대한 연구

  • 박주석;편흥렬
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1994년도 춘계공동학술대회논문집; 창원대학교; 08월 09일 Apr. 1994
    • /
    • pp.49-57
    • /
    • 1994
  • 진정한 의미의 다운사이징을 구현하기 위해서는 필요한 분산데이타베이스의 구현은 현재 여러가지 기술적인 문제점들을 안고 있다. 따라서 동시성 제어(concurrency control)와 갱신 (update propagation), 복구(recovery), 질의어 처리(query processing), 카달로그 관리(catalog management)등과 같은 분산 환경에서의 데이타베이스에 관련된 기술적인 문제점들을 해결하기 위해서는 어떠한 최적의 방법들을 개발해야만 한다. 이러한 방법들의 개발은 관계형 데이타베이스의 데이타관리 분류체계를 통한 대안들의 선택과 운용에 의해 가능할 것이다. 분산 환경하에서 사용되어질 수 있는 관계형 데이타베이스의 데이타관리 분류체계를 availability, expression, currency의 관점에서 Basic table과 view로 구분하여 정립해 보았다. Basic table은 current update가 필수적이므로 availability와 expression의 관점에서 분류하였고, view는 physical file의 존재성 유무와 시간적 실행의 차이를 기준으로 분류하였다. 그리고 이러한 분류기준에 따른 특성들을 분산데이타베이스 구축에 이용하는 방법들에 대해 이야기 하였다. 다시 말해 non-current materialized view 뿐만 아니라 current materialized view를 동시에 지원하는 하나의 distributed view update architecture를 개발하는 것에 대해 하나의 방법으로 제시하였다. 즉 immediate update와 deferred update는 current view를 이용하고 periodical update는 non-current view를 이용하여 100%의 distributed data resources를 관리 할 수 있는 효율적인 distributed system를 개발하는 것을 제시하였다. 본 논문은 데이타베이스론의 입장에서 아직 정립되어 있지 않은 분산 환경하에서의 관계형 데이타베이스의 데이타관리의 분류체계를 나름대로 정립하였다는데 그 의의가 있다. 또한 이것의 응용은 현재 분산데이타베이스 구축에 있어 나타나는 기술적인 문제점들을 어느정도 보완할 수 있다는 점에서 그 중요성이 있다.

SSP 시나리오의 기간 구분을 통한 유출 특성 변화 연구 (A study on changes in runoff characteristics through period classification of SSP scenarios)

  • 문남기;박동혁;임상우;안재현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.393-393
    • /
    • 2023
  • 최근 기후변화에 대한 관심이 높아짐에 따라 전 세계적으로 미래 기후변화 예측 전망에 대한 다양한 연구들이 수행되었으며, 특히 IPCC(Intergovernmental Panel on Climate Change)의 기후변화 6차 보고서에 채택된 SSP(Shared Socio-economic Pathway) 시나리오를 이용한 연구가 활발한 상황이다. 이들 연구에서는 미래 기후변화의 양상 비교를 위한 기간 구분은 통상적으로 F1(2011-2040), F2(2041-2070), F3(2071-2100)으로 구성된다. 하지만 이는 단순하게 동일한 기간으로 나누어 설정한 것으로, 통계적 근거가 부족할 뿐만 아니라 변화 추이를 확인하기 위한 수단으로 사용하기에 부족할 수 있다는 한계점이 존재한다. 이 연구에서는 기후변화 패턴에 대한 기존 연구의 한계, 특히 미래 기후변화를 비교하기 위해 사용되는 기간 분류와 관련하여 한계점을 보완하고자 한다. SSP 시나리오 모델 중 UKESM1 모델을 활용하여 ASOS(Automated Synoptic Observation System) 기상관측소 기준 59개 지점에서 추출한 강수량 데이터를 분석하였다. 이후, 기후변화 비교를 위한 최적의 분류를 결정하기 위해 장마철인 6월부터 9월까지의 강수 데이터에 대해 통계분석 및 Pettitt 검정을 수행해 최적 기간을 산정하였다. 이를 통해 기존의 F1, F2, F3 분류 방식과 통계분석을 통해 도출한 최적 시기의 유출 특성 분석결과의 변화양상을 비교하였으며, 각 방법에 대한 비교를 통해 기후변화 추이에 대한 이해를 제공할 수 있을 것으로 판단하였다. 결과적으로 이 연구는 기후변화 시나리오를 활용하는 연구 수행 시 기간 구분에 대한 발전된 접근 방식을 제시하고자 한다.

  • PDF