• 제목/요약/키워드: Data classification

검색결과 7,933건 처리시간 0.046초

영상 융합을 통한 고해상도 위성 영상의 토지 피복 분류 (Land Use Classification in Very High Resolution Imagery by Data Fusion)

  • 서민호;한동엽;김용일
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.17-22
    • /
    • 2005
  • 일반적으로 위성 영상의 분류에 있어서 널리 사용되고 있는 기법은 특징 공간에서 화소 값들의 거리 유사성을 이용하여 인접한 화소들을 동일 클래스로 결정하는 분류기법을 적용하고 있다. 하지만 이러한 기법을 고해상도 위성 영상에 적용시킬 경우 다양한 분광 반사 값을 가지는 영상의 특성상 정확한 결과를 얻기 힘들다. 특히 도시 지역의 경우 분광 정보만을 이용할 경우 높은 이질성과 복잡성으로 영상이 가지는 다양한 정보를 제대로 반영하지 못한다. 본 연구에선 이러한 복잡한 토시지역에 대한 분류를 수행하기 위해 위성 영상과 LiDAR의 높이값 및 반사강도 정보를 이용하여 데이터 융합을 통해 단계적인 방법으로 분류를 수행하였다. 그에 앞서 영상 정보만을 이용하였을 경우와 LiDAR 자료를 보조적으로 활용하였을 경우의 MLC 및 ISODATA 분류를 수행하였고, 단계적 방법의 결과와 시각적 비교를 수행하였다. 전체 분류 결과에 있어서 단계적 방법이 가장 향상된 결과를 보였으며, MLC, ISODATA 분류에 있어서도 LiDAR 자료를 활용할 경우 더 향상된 분류 결과를 얻을 수 있었다.

  • PDF

클라우드 컴퓨팅 환경에서 무감독학습 방법과 퍼지이론을 이용한 결합형 데이터 분류기법 (Coupled data classification method using unsupervised learning and fuzzy logic in Cloud computing environment)

  • 조규철;김재권
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권8호
    • /
    • pp.11-18
    • /
    • 2014
  • 본 논문은 무감독학습을 통한 데이터 분류기법인 ART에서 퍼지이론을 이용한 결합형 데이터 분류 방법을 제안한다. 무감독학습기법 기반의 데이터 분류 기술은 분류기술의 향상의 장점이 있지만, 처리성능이 저하된다는 단점이 있다. 민첩성 있는 대용량데이터 처리와 분류인식률을 만족하는 최적의 임계값 결정기법이 필요하지만, 이는 불확실성이 많이 따르기 때문에 두 가지를 고려하여 상호보완 할 수 있는 처리기법이 필요하다. 제안하는 기법은 무감독학습을 하기 위해 퍼지매개변수와 퍼지 규칙을 설계하여 최적의 임계값을 도출한다. 제안하는 기법의 성능평가를 위해 클라우드 컴퓨팅환경에서 G 단백질 연결 수용체(G protein coupled receptor, GPCR)데이터를 이용하여 실험하였으며, 실험결과는 높은 인식률과 낮은 처리시간을 통해 결합형 데이터 분류에 효과적임을 입증하였다.

분류용 MARC 포맷에 관한 연구 (A Study on the MARC Format for Classification Data)

  • 오동근
    • 한국문헌정보학회지
    • /
    • 제33권1호
    • /
    • pp.87-111
    • /
    • 1999
  • 본고는 분류용 MARC 포맷에 대해 기능과 필요성, 개발현황에 대해 살펴보고, KORMARC 분류용포맷의 개발필요성을 제시하였다. 아울러 MARC포맷의 3요소로 일컬어지는 구조와, 내용표지법, 레코드의 내용을 이미 개발된 USMARC 포맷을 중심으로 분석하였다. 레코드의 구조와 내용표지법은 서지용 및 전거용포맷과 대부분 동일하다. 데이터필드는 기본적으로 기능별블록으로 구분되어 있다. 고정길이필드의 레코드의 내용에는 기호의 유형, 유효성, 표준 및 임의규정, 합성기호표시 등 분류기호에 관련된 요소들이 추가되어 있다. 가변길이필드의 내용은 번호와 코드 분류기호와 용어 참조 및 표목지시, 주기, 색인어, 기호합성, 전자상의 소재 및 접근 필드 등으로 구성되어 있다. 각 필드의 데이터들은 가능한 한 관련포맷과 조기성을 유지할 수 있도록 배려하고 있다.

  • PDF

Remote Sensing Image Classification for Land Cover Mapping in Developing Countries: A Novel Deep Learning Approach

  • Lynda, Nzurumike Obianuju;Nnanna, Nwojo Agwu;Boukar, Moussa Mahamat
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.214-222
    • /
    • 2022
  • Convolutional Neural networks (CNNs) are a category of deep learning networks that have proven very effective in computer vision tasks such as image classification. Notwithstanding, not much has been seen in its use for remote sensing image classification in developing countries. This is majorly due to the scarcity of training data. Recently, transfer learning technique has successfully been used to develop state-of-the art models for remote sensing (RS) image classification tasks using training and testing data from well-known RS data repositories. However, the ability of such model to classify RS test data from a different dataset has not been sufficiently investigated. In this paper, we propose a deep CNN model that can classify RS test data from a dataset different from the training dataset. To achieve our objective, we first, re-trained a ResNet-50 model using EuroSAT, a large-scale RS dataset to develop a base model then we integrated Augmentation and Ensemble learning to improve its generalization ability. We further experimented on the ability of this model to classify a novel dataset (Nig_Images). The final classification results shows that our model achieves a 96% and 80% accuracy on EuroSAT and Nig_Images test data respectively. Adequate knowledge and usage of this framework is expected to encourage research and the usage of deep CNNs for land cover mapping in cases of lack of training data as obtainable in developing countries.

적은 양의 음성 및 텍스트 데이터를 활용한 멀티 모달 기반의 효율적인 감정 분류 기법 (Efficient Emotion Classification Method Based on Multimodal Approach Using Limited Speech and Text Data)

  • 신미르;신유현
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.174-180
    • /
    • 2024
  • 본 논문에서는 wav2vec 2.0과 KcELECTRA 모델을 활용하여 멀티모달 학습을 통한 감정 분류 방법을 탐색한다. 음성 데이터와 텍스트 데이터를 함께 활용하는 멀티모달 학습이 음성만을 활용하는 방법에 비해 감정 분류 성능을 유의미하게 향상시킬 수 있음이 알려져 있다. 본 연구는 자연어 처리 분야에서 우수한 성능을 보인 BERT 및 BERT 파생 모델들을 비교 분석하여 텍스트 데이터의 효과적인 특징 추출을 위한 최적의 모델을 선정하여 텍스트 처리 모델로 활용한다. 그 결과 KcELECTRA 모델이 감정 분류 작업에서 뛰어난 성능이 보임을 확인하였다. 또한, AI-Hub에 공개되어 있는 데이터 세트를 활용한 실험을 통해 텍스트 데이터를 함께 활용하면 음성 데이터만 사용할 때보다 더 적은 양의 데이터로도 더 우수한 성능을 달성할 수 있음을 발견하였다. 실험을 통해 KcELECTRA 모델을 활용한 경우가 정확도 96.57%로 가장 우수한 성능을 보였다. 이는 멀티모달 학습이 감정 분류와 같은 복잡한 자연어 처리 작업에서 의미 있는 성능 개선을 제공할 수 있음을 보여준다.

Domain Adaptation Image Classification Based on Multi-sparse Representation

  • Zhang, Xu;Wang, Xiaofeng;Du, Yue;Qin, Xiaoyan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권5호
    • /
    • pp.2590-2606
    • /
    • 2017
  • Generally, research of classical image classification algorithms assume that training data and testing data are derived from the same domain with the same distribution. Unfortunately, in practical applications, this assumption is rarely met. Aiming at the problem, a domain adaption image classification approach based on multi-sparse representation is proposed in this paper. The existences of intermediate domains are hypothesized between the source and target domains. And each intermediate subspace is modeled through online dictionary learning with target data updating. On the one hand, the reconstruction error of the target data is guaranteed, on the other, the transition from the source domain to the target domain is as smooth as possible. An augmented feature representation produced by invariant sparse codes across the source, intermediate and target domain dictionaries is employed for across domain recognition. Experimental results verify the effectiveness of the proposed algorithm.

의사결정나무 모델에서의 중요 룰 선택기법 (Rule Selection Method in Decision Tree Models)

  • 손지은;김성범
    • 대한산업공학회지
    • /
    • 제40권4호
    • /
    • pp.375-381
    • /
    • 2014
  • Data mining is a process of discovering useful patterns or information from large amount of data. Decision tree is one of the data mining algorithms that can be used for both classification and prediction and has been widely used for various applications because of its flexibility and interpretability. Decision trees for classification generally generate a number of rules that belong to one of the predefined category and some rules may belong to the same category. In this case, it is necessary to determine the significance of each rule so as to provide the priority of the rule with users. The purpose of this paper is to propose a rule selection method in classification tree models that accommodate the umber of observation, accuracy, and effectiveness in each rule. Our experiments demonstrate that the proposed method produce better performance compared to other existing rule selection methods.

A Correction Approach to Bidirectional Effects of EO-1 Hyperion Data for Forest Classification

  • Park, Seung-Hwan;Kim, Choen
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.1470-1472
    • /
    • 2003
  • Hyperion, as hyperspectral data, is carried on NASA’s EO-1 satellite, can be used in more subtle discrimination on forest cover, with 224 band in 360 ?2580 nm (10nm interval). In this study, Hyperion image is used to investigate the effects of topography on the classification of forest cover, and to assess whether the topographic correction improves the discrimination of species units for practical forest mapping. A publicly available Digital Elevation Model (DEM), at a scale of 1:25,000, is used to model the radiance variation on forest, considering MSR(Mean Spectral Ratio) on antithesis aspects. Hyperion, as hyperspectral data, is corrected on a pixel-by-pixel basis to normalize the scene to a uniform solar illumination and viewing geometry. As a result, the approach on topographic effect normalization in hyperspectral data can effectively reduce the variation in detected radiance due to changes in forest illumination, progress the classification of forest cover.

  • PDF

Evaluation of the Pi-SAR Data for Land Cover Discrimination

  • Amarsaikhan, D.;Sato, M.
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.1087-1089
    • /
    • 2003
  • The aim of this study is to evaluate the Pi-SAR data for land cover discrimination using a standard method. For this purpose, the original polarization and Pauli components of the Pi-SAR X-band and L-band data are used and the results are compared. As a method for the land cover discrimination, the traditional method of statistical maximum likelihood decision rule is selected. To increase the accuracy of the classification result, different spatial thresholds based on local knowledge are determined and used for the actual classification process. Moreover, to reduce the speckle noise and increase the spatial homogeneity of different classes of objects, a speckle suppression filter is applied to the original Pi-SAR data before applying the classification decision rule. Overall, the research indicated that the original Pi-SAR polarization components can be successfully used for separation of different land cover types without taking taking special polarization transformations.

  • PDF

소 부류 객체 분류를 위한 CNN기반 학습망 설계 (Training Network Design Based on Convolution Neural Network for Object Classification in few class problem)

  • 임수창;김승현;김연호;김도연
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.144-150
    • /
    • 2017
  • 최근 데이터의 지능적 처리 및 정확도 향상을 위해 딥러닝 기술이 응용되고 있다. 이 기술은 다층의 데이터 처리 레이어들로 구성된 계산 모델을 통해 이루어지는데, 이 모델은 여러 수준의 추상화를 거쳐 데이터의 표현을 학습한다. 딥러닝의 한 부류인 컨볼루션 신경망은 인간 행동 추정, 얼굴 인식, 이미지 분류, 음성 인식 같은 연구 분야에서 많이 활용되고 있다. 이미지 분류에 좋은 성능을 보여주는 컨볼루션 신경망은 깊은 학습망과 많은 부류를 이용하면 효과적으로 분류율을 높일수 있지만, 적은 부류의 데이터를 사용할 경우, 과적합 문제가 발생할 확률이 높아진다. 따라서 본 논문에서는 컨볼루션 신경망기반의 소부류의 분류을 위한 학습망을 제작하여 자체적으로 구축한 이미지 DB를 학습시키고, 객체를 분류하는 연구를 실험 하였으며, 1000개의 부류를 분류하기 위해 제작된 기존 공개된 망들과 비교 실험을 통해 기존 망보다 평균 7.06%이상의 상승된 분류율을 보여주었다.