• Title/Summary/Keyword: 자료분류

Search Result 5,177, Processing Time 0.049 seconds

Assessing spatial uncertainty distributions in remote sensing data classification using geostatistical simulation (지구통계학적 시뮬레이션을 이용한 원격탐사 화상 분류 결과의 공간적 불확실성 분포의 추정)

  • 박노욱;지광훈;권병두
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.463-468
    • /
    • 2004
  • 이 연구에서는 원격탐사 자료를 이용하여 얻어진 분류 결과로부터 분류 정확도의 공간적 불확실성을 추정하고자 하였다. 기존 분류결과로부터 얻어지는 토지 피복별 확률값을 지구통계학적 시뮬레이션 기법을 이용하여 참조자료의 공간적 분포와 통합하였다. 다중센서 화상 통합에 적용한 결과, 각 토지피복 항목별로 공간적인 정확도 분포를 얻을 수 있을 수 있었으며 이러한 자료는 분류결과를 해석하는데 유용하게 사용될 수 있을 것으로 기대된다.

  • PDF

Surface Sediments Classification in Tidal Flats using Multivariate Kriging and KOMPSAT-2 Imagery (다변량 크리깅과 KOMPSAT-2 영상을 이용한 간석지 표층 퇴적물 분류)

  • LEE, Sang-Won;PARK, No-Wook;JANG, Dong-Ho;YOO, Hee Young;LIM, Hyosuk
    • Journal of The Geomorphological Association of Korea
    • /
    • v.19 no.3
    • /
    • pp.37-49
    • /
    • 2012
  • The objective of this paper is to propose a methodology for surface sediments classification in tidal flats that can combine ground survey data with high-resolution remote sensing data by multivariate kriging. Unlike conventional methodologies that have classified remote sensing data by using pre-classified sediment components, a new classification methodology presented in this paper first generates sediment component fraction maps and then classifies the sediments on a final stage. For generating sediment component fractions, regression kriging, as one of multivariate kriging algorithms, is applied to integrate ground survey data and remote sensing data. First, trend components of sand, silt, and clay are derived through regression analysis of ground survey data and spectral information from remote sensing data. Then, residuals at sample locations are computed and interpolated to generate residual components in the study area. Finally, the sediment component fractions are computed by adding the residuals to the trend components and are classified on a final stage. A case study at the Baramarae tidal flats with KOMPSAT-2 imagery is carried out to evaluate the classification capability of the proposed classification methodology. Through the case study, the proposed methodology showed the best classification accuracy, compared with the conventional classification methodologies. Especially, much improvement of classification accuracy for fine-grained sediments were also obtained. Therefore, it is expected that the presented classification methodology would be an effective one for surface sediments classification in tidal flats.

Semi-supervised classification with LS-SVM formulation (최소제곱 서포터벡터기계 형태의 준지도분류)

  • Seok, Kyung-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.3
    • /
    • pp.461-470
    • /
    • 2010
  • Semi supervised classification which is a method using labeled and unlabeled data has considerable attention in recent years. Among various methods the graph based manifold regularization is proved to be an attractive method. Least squares support vector machine is gaining a lot of popularities in analyzing nonlinear data. We propose a semi supervised classification algorithm using the least squares support vector machines. The proposed algorithm is based on the manifold regularization. In this paper we show that the proposed method can use unlabeled data efficiently.

Weighted L1-Norm Support Vector Machine for the Classification of Highly Imbalanced Data (불균형 자료의 분류분석을 위한 가중 L1-norm SVM)

  • Kim, Eunkyung;Jhun, Myoungshic;Bang, Sungwan
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.1
    • /
    • pp.9-21
    • /
    • 2015
  • The support vector machine has been successfully applied to various classification areas due to its flexibility and a high level of classification accuracy. However, when analyzing imbalanced data with uneven class sizes, the classification accuracy of SVM may drop significantly in predicting minority class because the SVM classifiers are undesirably biased toward the majority class. The weighted $L_2$-norm SVM was developed for the analysis of imbalanced data; however, it cannot identify irrelevant input variables due to the characteristics of the ridge penalty. Therefore, we propose the weighted $L_1$-norm SVM, which uses lasso penalty to select important input variables and weights to differentiate the misclassification of data points between classes. We demonstrate the satisfactory performance of the proposed method through simulation studies and a real data analysis.

Automatic Text Classification Method Using Keywords and Unlabeled Text (주제어와 미분류 문서들을 이용한 문서의 자동 분류 방법)

  • Lee Kang-Il;Lee Chang-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.592-594
    • /
    • 2005
  • 문서를 분류하기 위해서는 분류주제에 맞춰 미리 분류가 된 자료(labeled data)가 필요하다. 하지만 미리 분류가 된 자료를 만들기 위해서는 사람이 직접 그 문서의 의미를 해석하고 일일이 분류를 해야 하기 때문에 시간이 많이 소모가 된다. 본 논문에서는 비록 사랑이 직접 분류한 자료를 이용하는 것에 비해서 분류 정확도는 조금 떨어지지만, 대신 주제어와 미분류 문서(unlabeled data)를 이용해서 문서를 분류하는 방법을 제시하려고 한다. 이와 같은 주제어와 미분류 문서의 경우에는 구하기가 쉽고, 사랑이 일일이 분류하는 작업이 필요로 하지 않기 때문에 비용과 시간이 크게 절약이 된다는 장정이 있다.

  • PDF

Classification of Land Cover over the Korean Peninsula Using Polar Orbiting Meteorological Satellite Data (극궤도 기상위성 자료를 이용한 한반도의 지면피복 분류)

  • Suh, Myoung-Seok;Kwak, Chong-Heum;Kim, Hee-Soo;Kim, Maeng-Ki
    • Journal of the Korean earth science society
    • /
    • v.22 no.2
    • /
    • pp.138-146
    • /
    • 2001
  • The land cover over Korean peninsula was classified using a multi-temporal NOAA/AVHRR (Advanced Very High Resolution Radiometer) data. Four types of phenological data derived from the 10-day composited NDVI (Normalized Differences Vegetation Index), maximum and annual mean land surface temperature, and topographical data were used not only reducing the data volume but also increasing the accuracy of classification. Self organizing feature map (SOFM), a kind of neural network technique, was used for the clustering of satellite data. We used a decision tree for the classification of the clusters. When we compared the classification results with the time series of NDVI and some other available ground truth data, the urban, agricultural area, deciduous tree and evergreen tree were clearly classified.

  • PDF

Comparison of recently developed classification tools in microarray data analysis (마이크로어레이자료분석에서의 최신 분류방법들의 비교연구)

  • Lee, Jae-Won;Lee, Jeong-Bok;Park, Mi-Ra
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.99-104
    • /
    • 2002
  • cDNA 마이크로어레이자료를 이용한 분류방법은 수많은 유전자의 발현을 동시에 모니터링 할 수 있으므로 특정 질병간의 분자생물학적 변이를 이해하는데 있어 기존의 분류방법보다 신뢰성이 훨씬 높을 것으로 기대되고 있다 최근에 Dudoit et al.(2001)은 cDNA 마이크로어레이를 이용한 유전자발현자료의 분석에 있어 분류를 위한 여러 고전적인 판별분류기법 및 최근에 개발된 기법들을 비교, 평가하였다. 본 논문에서는 Dudoit et al.(2001)에서 다루지 않았던 많은 최신 기법들을 포함하여 인간의 종양 자료뿐만이 아니라 농작물을 포함한 동식물 자료에 적용하여 보다 폭넓은 비교연구를 하였다.

  • PDF

A Machine learning Approach for Knowledge Base Construction Incorporating GIS Data for land Cover Classification of Landsat ETM+ Image (지식 기반 시스템에서 GIS 자료를 활용하기 위한 기계 학습 기법에 관한 연구 - Landsat ETM+ 영상의 토지 피복 분류를 사례로)

  • Kim, Hwa-Hwan;Ku, Cha-Yang
    • Journal of the Korean Geographical Society
    • /
    • v.43 no.5
    • /
    • pp.761-774
    • /
    • 2008
  • Integration of GIS data and human expert knowledge into digital image processing has long been acknowledged as a necessity to improve remote sensing image analysis. We propose inductive machine learning algorithm for GIS data integration and rule-based classification method for land cover classification. Proposed method is tested with a land cover classification of a Landsat ETM+ multispectral image and GIS data layers including elevation, aspect, slope, distance to water bodies, distance to road network, and population density. Decision trees and production rules for land cover classification are generated by C5.0 inductive machine learning algorithm with 350 stratified random point samples. Production rules are used for land cover classification integrated with unsupervised ISODATA classification. Result shows that GIS data layers such as elevation, distance to water bodies and population density can be effectively integrated for rule-based image classification. Intuitive production rules generated by inductive machine learning are easy to understand. Proposed method demonstrates how various GIS data layers can be integrated with remotely sensed imagery in a framework of knowledge base construction to improve land cover classification.

A Study on the Organizing Web Materials in the Field of Medicine (의학 분야 웹 자료의 분류에 대한 개선 방안 연구)

  • 정경희
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.2
    • /
    • pp.89-106
    • /
    • 2004
  • There are lots of Web materials in the field of medicine and many search engines classify the medical materials on the Web through directories. But the organization of these directories are wanting in consistency and systematization. In order for manager of search engines to organize medical materials on the Web systematically, this paper suggests several guidelines. NLMC, a special classification system for medicine, need to be applied to develop directories of medicine in search engines. Also, items of the directories should be arranged based on the relevance of subjects among subfields of medical science. For classifying an item to several directories repeatedly, clear criteria should be established. In addition to, controlled vocabularies or glossaries for medicine such as MeSH and the English-Korean, Korean-English Medical Terminology Collection should be used for selection of the name of items in medical directories.

Time Series Analysis of Agricultural Reservoir Water Level Data for Abnormal Behavior Detection (농업용 저수지 이상거동 탐지를 위한 시계열 수위자료 특성 분석)

  • Lee, Sung Hack;Lee, Sang Hyun;Hong, Min Ki;Cho, Jin Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.275-275
    • /
    • 2015
  • 최근 기후변화에 따른 극한 강우사상의 증가로 인하여 농업용 저수지의 재해 위험도가 증가하고 있는 추세이며, 사고가 발생할 때 마다 파손/붕괴된 시설물을 보수하는 대응형 유지관리체계에서 벗어나 기반시설의 성능과 생애주기 등을 고려하여 재해 발생을 사전에 예보 및 경보를 알릴 수 있는 예방적 관리체계로의 전환이 필요하다. 한국농어촌공사는 전국 1,500개 저수지에서 10분 단위 수위자료를 측정하고 있으며, 이를 분석하여 재해예방에 활용할 수 있는 기반이 조성되어 있으나 이에 대한 관리가 이루어지지 않고 있고 수집된 자료를 활용하여 재해 징후를 분석할 수 있는 재해 예방적 분석기술이 마련되어 있지 않은 실정이다. 본 연구에서는 농업용 저수지 수위자료를 이용한 저수지 이상거동을 판별하기 위하여 전국 34개 한국농어촌공사 관할 저수의 시계열 수위자료의 특성(Feature)을 분석하고자 한다. 시계열 자료의 시계열 특성을 분석하기 위하여 한국농어촌공사 관할의 전국 34개 저수지를 선정하여 분석을 실시하였다. 대상저수지는 지역별, 저수용량, 안정등급, 붕괴발생, 1개 지사관할 저수지로 각각 구분하여 선정하였으며, 각 저수지의 수위 측정기간(최소 5개년)에 대한 자료를 수집하였다. 농업용 저수지의 시계열 수위 자료의 특성을 분석하기 위하여 자료의 전처리를 수행하였다. 자료의 전처리는 시계열 수위자료의 잡음 특성, 기상자료 관련 변동특성 등 분류(Classification)에 영향을 미치는 노이즈 요소를 제거하는 과정이다. 전처리과정을 거친 자료는 특징(Feature) 추출 과정을 거치게 되고, 추출된 특징의 적합성에 따라 분류 알고리듬 성능에 많은 영향을 미친다. 따라서 시계열 자료의 특성을 파악하고 특징을 추출하는 것은 이상치 탐지에 있어 매우 중요한 과정이다. 본 연구에서는 시계열 자료 특징 추출 방법으로 물리적인 한계치, 확률적인 문턱값(Threshold), 시계열 패턴, 주변 저수지와의 시계열 상관분석 등을 적용하였으며, 이를 데이터베이스로 구축하여 이후 분류알고리듬 학습에 적용하여 정상치와 이상치를 판별하는데 이용될 수 있도록 하였다. 따라서 본 연구에서 제시되는 농업용 저수지의 시계열 특성은 다양한 분류알고리듬에 적용할 수 있으며, 이를 통하여 저수지 이상거동 판별을 위한 최적을 분류알고리듬의 선택에 도움이 될 것이다.

  • PDF