• 제목/요약/키워드: 자료분류

검색결과 5,182건 처리시간 0.036초

자기조직화방법을 적용한 강우 유출과 강우-TOC변동에 관한 패턴 분류 및 분석 (Pattern Classification and Analysis of Rainfall-Runoff and TOC Variation by the application of Self Organizing Map)

  • 박성천;김종록;진영훈;정천리
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.2061-2065
    • /
    • 2008
  • 본 연구는 강우-유출 및 TOC의 패턴 분류를 위하여 광주 광산 강우관측소의 강우량자료와 나주지점의 유출량 그리고 기존의 BOD 및 COD 수질농도 측정값에 비하여 적은 오차요인과 빠른 시간에 결과 값을 얻을 수 있으며 유출량과 난분해성 물질에 대한 해석이 가능하고 재현성이 탁월한 TOC자료를 사용하였다. SOM을 적용하기 위해 먼저 Map의 크기는 Garcia가 제시한 $M=5{\sqrt{N}}$을 이용하여 결정한다. 이러한 비선형적인 다변량 자료를 분석하기 위해서 Map에 의해 구분된 자료 위치를 추출하여 원자료를 재구축하고 이를 통해 원자료를 패턴별로 분류 할 수 있었다. 이러한 패턴별 분류를 통해 유출량에 따른 TOC자료를 2차원의 Map 상에 시각적으로 가시화하여 비선형적인 경향이 강한자료의 분포적 양상을 이해하는데 큰 도움이 되며, 향후 이를 통해 예측을 위한 모형화 과정에도 크게 도움을 줄 것으로 기대된다. 또한, 강우자료 또는 유출량 자료만을 이용한 단일변량의 패턴분류를 위해 SOM의 적용이 가능할 것으로 판단되며, 이는 각 변량의 본질적인 특성을 파악할 수 있을 것으로 기대된다.

  • PDF

퇴적물의 분류를 위한 Landsat TM자료와 Hyperspectral reflectance 자료 적용

  • 유영철;송무영;안충현
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2000년도 춘계 학술대회 논문집 통권 3호 Proceedings of the 2000 KSRS Spring Meeting
    • /
    • pp.178-182
    • /
    • 2000
  • 본 연구의 목적은 실험실에서 퇴적물의 다분광반사 특성과 물성을 측정하고 이를 위성 영상에 적용하여 영상에서 나타나는 퇴적물의 분광차이의 원인을 해석하고, 위성영상에서의 퇴적물의 분류 가능성을 연구하는데 있다. 연구에서는 Landsat TM위성 영상과 350~2500nm 파장대역에 대한 퇴적물 시료의 분광측정 자료를 사용하였으며, 기존의 조사 자료를 토대로 TM 영상에서 퇴적물을 분류한 후, 현장에서 시료를 채취하여 입도 분류를 실시하였다. 퇴적물의 입도와 함수비에 따른 분광특성변화를 검증하였으며, 입도와 함수비에 대한 회귀식을 구하여 이를 영상에 적용 분류하였다. 분석 결과 다분광자료 측정시 퇴적물입도에 따른 분광차이는 미약하였으며 이를 TM 자료로 재구성하였을 때는 분광특성을 구분할 수 없었다. 퇴적물의 분류는 TM Band 4, 5, 7을 이용한 회귀식을 적용할 때 비교적 정확하게 나타났으나, 영상에서 퇴적물의 분광 차이는 입도 크기가 직접적인 요인이 아니라 입도에 의한 함수비 및 유기물 함량의 차이에 기인한 것으로 해석된다.

  • PDF

코리안 디아스포라 문학 자료 분류현황 분석 및 제언 (Analysis and Suggestion of the Classification Status of Korean Diaspora Literature)

  • 여지숙
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.285-304
    • /
    • 2022
  • 이 연구는 코리안 디아스포라 문학이 가지는 이중언어 및 한국어 이외의 현지 언어로 발간된다는 특징에 주목하여 도서관의 자료분류에서 문학류의 언어에 의한 분류현황을 조사하였다. 이를 위하여 이 연구는 국내 대학 및 공공도서관이 소장하고 있는 디아스포라 문학 자료의 분류기호를 조사하였으며, 조사결과 국내 도서관들은 원작품의 언어에 분류하거나 또는 작가 중심으로 분류하고 있는 것으로 나타났다. 그러나 KDC의 문학류 분류규정에는 원작품의 언어에 대한 규정은 있지만, 작가에 대한 규정은 없는 것이 사실이다. 그러나 국내 도서관들은 동일한 작가의 작품을 언어에 따라 분산하는 것이 아니라 한 곳에서 이용할 수 있도록 하기 위하여 디아스포라 문학작품을 원작품의 언어가 아니라 작가에 따라 다르게 분류하고 있었다. 따라서 국내 도서관이 가지는 코리안 디아스포라 문학 작품의 분류의 혼란을 해결하기 위하여 이 연구에서는 KDC에 코리안 디아스포라 문학과 한국문학을 포괄하는 '한민족 문학'을 810에 분류할 수 있는 별법을 제안하였다. 그러나 이 별법은 코리안 디아스포라 문학에 대한 특별한 요구가 있는 도서관을 위한 시도적 제안이며, 이 별법의 적용을 위해서는 추가의 조사 및 연구가 반드시 필요할 것이다.

아시아-오세아니아 지역의 MODIS 지면피복분류 개선 (Improvement of MODIS land cover classification over the Asia-Oceania region)

  • 박지열;서명석
    • 대한원격탐사학회지
    • /
    • 제31권2호
    • /
    • pp.51-64
    • /
    • 2015
  • 본 연구에서는 MODerate resolution Imaging Spectroradiometer (MODIS) 지면피복 분류자료(MCD12Q1)에서 분류오류로 판단되는 화소들을 재분류함으로써 분류 정확도를 개선하였다. 최근 12년(2001-2012)간의 MODIS 지면피복 분류자료에서 지면피복 유형이 3개 이상으로 분류된 화소는 분류상에 오류가 있다고 판단하여 지면피복 재분류 화소로 선정하였다. 지면피복 재분류를 위해 공간해상도는 1 km이고 시간주기는 8일인 MODIS Normalized Difference Vegetation Index (NDVI) 자료를 이용하였다. NDVI 자료 중 구름 등으로 오염된 화소를 보정하기 위해 시 공간 연속성을 이용한 보정기법인 Correction based on Spatial and Temporal Continuity (CSaTC) 기법을 이용하였다. 보정된 NDVI 자료를 1개월 주기로 합성한 후 분류 오류로 판단된 화소들에 대해 Iterative Self-Organizing Data Analysis (ISODATA) 기법으로 군집화를 수행하였다. 각 군집별 식생 계절변동 특성을 고려하여 지면피복을 분류한 후 정상으로 판정된 MODIS 지면피복과 합성하여 최종 지면피복 재분류 자료를 산출하였다. 분류 정확도는 GPS를 이용한 현장관측 자료와 유럽우주국의 지상검증참조자료 등 총 138개 지상 관측자료를 이용하여 검증을 수행하였다. 2012년 MODIS 지면피복 분류자료의 정확도는 약 68%이었으나 본 연구에서 재분류한 지면피복자료의 정확도는 약 74%로 나타나 일부 화소들에서 분류 정확도가 개선되었다.

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

초분광 영상의 Morphological Attribute Profiles와 추가 밴드를 이용한 감독분류의 정확도 평가 (Accuracy Evaluation of Supervised Classification by Using Morphological Attribute Profiles and Additional Band of Hyperspectral Imagery)

  • 박홍련;최재완
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.9-17
    • /
    • 2017
  • 초분광 영상(hyperspectral imagery)은 주성분분석이나 최소잡음비율 등을 이용하여 자료의 차원과 잡음을 감소시켜 토지피복분류에 사용되는 것이 일반적이다. 최근에는 분광정보와 공간적 특성을 가진 다양한 입력 자료를 이용한 감독분류에 관한 연구가 활발히 진행되고 있다. 본 연구에서는 초분광 영상을 이용한 토지피복분류를 위해 principle component(PC) 밴드와 normalized difference vegetation index(NDVI) 자료를 감독분류의 입력자료로 활용하였다. NDVI 자료는 초분광 영상에서 추출된 PC 밴드가 포함하고 있지 않는 추가적인 정보를 활용하여 식생지역에 대한 토지피복분류 정확도를 높이고자 사용하였으며, morphological filter를 통해 각 밴드의 extended attribute profiles(EAP)를 제작하여 분류를 위한 입력 자료로 사용하였다. 감독분류기법은 random forest 알고리즘을 이용하였으며, EAP를 기반으로 다양한 입력 자료의 적용에 따른 분류정확도를 비교하고자 하였다. 연구지역으로는 두 대상지를 선정하였으며, 영상 내에서 취득한 참조자료를 이용하여 정량적인 평가를 수행하였다. 본 연구에서 제안한 기법의 분류정확도는 85.72%와 91.14%로 다른 입력 자료들을 이용한 경우와 비교하여 가장 높은 분류정확도를 나타냈다. 향후, 초분광 영상을 이용한 토지피복분류의 정확도를 높이기 위한 분류 알고리즘 개발과 대상지역 특성에 맞는 추가 입력자료 개발에 관한 연구가 필요할 것으로 사료된다.

시계열 토지피복도 제작을 위한 준감독학습 기반의 훈련자료 자동 추출 (Automatic Extraction of Training Data Based on Semi-supervised Learning for Time-series Land-cover Mapping)

  • 곽근호;박노욱
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.461-469
    • /
    • 2022
  • 이 연구에서는 시계열 토지피복도를 제작하기 위해 분석자 개입 없이 준감독학습 기반 분류를 이용하는 새로운 훈련자료 추출 기법을 제안하였다. 준감독학습 기반 훈련자료 추출 기법은 먼저 분류 대상 영상과 유사한 토지피복 특성을 포함하는 과거 영상으로부터 획득한 초기 훈련자료를 이용하여 초기 분류를 수행한다. 이후, 분류의 불확실성 정보와 인접 화소의 분류 항목을 제약 조건으로 이용하는 준감독학습 기반 반복 분류를 이용하여 초기 분류 결과로부터 신뢰할 수 있는 훈련자료를 추출한다. 준감독학습 기반 훈련자료 추출기법의 적용 가능성은 농경지에서 unmanned aerial vehicle 영상을 이용하는 분류 실험을 통해 평가되었다. 제안한 준감독학습 기반 훈련자료 추출 기법에 의해 자동으로 추출된 새로운 훈련자료를 이용하는 것은 초기 분류 결과에서 나타난 오분류를 두드러지게 완화할 수 있었다. 특히, 인접 화소의 공간 문맥 정보를 고려함으로써 고립된 화소가 크게 감소하였다. 결과적으로, 제안 기법의 분류 정확도는 수동으로 추출한 훈련자료를 이용하는 분류 정확도와 유사하였다. 이러한 결과는 이 연구에서 제시한 준감독학습 기반 반복 분류가 시계열 토지피복도를 제작하기 위해 신뢰할 수 있는 훈련자료를 자동으로 추출하는데 효과적으로 적용될 수 있음을 나타낸다.

주암호 수문자료의 자기조직화 패턴분류 및 분석 (Self Organized Pattern Classification and Analysis of Hydrologic Data in Juam Lake)

  • 박성천;진영훈;노경범;양동현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.790-794
    • /
    • 2012
  • 우리나라는 여름철에 강우가 편중되어 있고 동고서저의 산악지형으로 수자원확보가 어려운 실정이며 이는 곧 하천의 유지유량확보의 어려움과도 직결된다. 이러한 수자원확보를 위해 최근 기존 저수지 둑을 높이는 사업이 전국적으로 활발히 진행되고 있으며 이는 저수지나 댐의 수체와 같은 수자원을 보다 적극적으로 활용하여 그 가치를 높임과 동시에 하천에 대한 활용도를 높이고자 하는 데 그 목적이 있다. 따라서 저수지나 댐의 저류량에 기여하는 강우량, 유입량과 같은 수문학적 자료의 심도 있는 분석이 필요하며 수문변수들이 나타내는 복잡한 패턴에 대한 연구가 이루어져야 할 것이다. 본 연구에서는 저수지나 댐의 저류량에 직접적으로 영향을 주는 수문변수들을 전체적으로 파악하기 위해 수집된 수문자료의 각각의 특성 및 자료들 사이의 복합적인 관계를 파악하였으며 이를 위하여 패턴분류 분야에서 그 적용타당성이 입증된 자기조직화 지도(Self-Organizing Map: SOM)를 이용하였다. 본 연구의 대상지점은 섬진강 유역내에 위치한 주암호를 대상지점으로 선정하였으며 패턴분석에 사용한 수문자료의 기간은 2007~2010년까지 5년간의 월평균 자료를 활용하였다. SOM의 적용 결과, 측정수문자료에 대한 전체적인 특성을 패턴분류를 통해 분류하였으며, 각 변수에 대한 패턴별 상대성을 고려한 클러스터별 특성 및 시간적 이질성을 파악할 수 있었다. 이는 측정 자료에 대한 분석 기법개발의 일환으로 향후 수자원 확보에 대한 개발 및 정책의 기초자료로 활용될 것으로 기대된다.

  • PDF

KDC 영화자료 분류체계의 개선 방안에 관한 연구 - DDC 및 LCC와 비교하여 - (A Study on the Improvement of Classification Schemes of Motion Picture Materials in KDC)

  • 이명희;이인순
    • 한국도서관정보학회지
    • /
    • 제41권3호
    • /
    • pp.351-372
    • /
    • 2010
  • 다양한 영화자료의 적극적인 활용과 공유를 위해서 기존의 주요 분류표인 DDC, KDC, LCC의 분류체계를 알아보고, 영화자료의 특성과 함께 기존의 분류체계의 문제점을 파악하고 개선방안을 제시하기 위하여 연구가 수행되었다. 세 체계를 비교한 결과, DDC와 LCC 분류표의 영화관련 항목은 비교적 상세히 전개되어 있었으나 KDC 5판의 영화 관련 항목 수는 매우 미흡하여 영화자료를 포괄하지 못하는 것으로 나타났다. KDC 5판에서는 영화자료의 분류가 4개 강 하에 22개의 하위 항목으로 이루어져 있었지만 본 개선안에서는 9개의 강 하에 53개의 하위 항목을 세분하여 전개하였다. 특히 개선안에는 영화인물, 영화장르, 영화제, 각국의 영화 항목을 추가하였다.

  • PDF

순서 바이어스 최소화에 의한 안정적 클러스터링 구축에 관한 연구 (A Study on the Construction of Stable Clustering by Minimizing the Order Bias)

  • 이계성
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1571-1580
    • /
    • 1999
  • 데이터 마이닝 또는 기계학습을 위한 무감독 학습 알고리즘인 개념적 클러스터링을 이용하여 계층적 구조를 유도해낼 때 자료를 처리하는 순서에 따라 서로 다른 결과에 도달하는 양상을 보인다. 이 순서 바이어스 문제를 해결하는 방안으로 먼저 주어진 자료 세트에 분류를 시행하여 초기 분류를 형성한다. 이 분류를 통해 최종 분류의 가능한 클래스 수를 예측하고 이 정보에 기반하여 자료 분석과 중심 정렬을 통해 자료 처리 순서를 새로이 결정한다. 재배열된 자료 세트에 ITERATE 분류 과정을 적용해 새로운 분류를 생성한다. 본 논문에서는 이 과정을 반복하여 안정적이고 최적의 분류 점수를 갖도록 하는 알고리즘 REIT를 제안하였다. 이 알고리즘을 여러 자료 세트에 적용하고 순서 바이어스의 영향을 최소화하는지 여부를 실험을 통해 비교 분석하였다.

  • PDF