• 제목/요약/키워드: 분류 정확도

검색결과 4,178건 처리시간 0.032초

프랙탈 분석을 통한 비용효과적인 기준자료추출 알고리즘에 관한 연구 (A Cost Effective Reference Data Sampling Algorithm Using Fractal Analysis)

  • 김창재;이병길;김용일
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2000년도 춘계 학술대회 논문집 통권 3호 Proceedings of the 2000 KSRS Spring Meeting
    • /
    • pp.149-154
    • /
    • 2000
  • 분류기법을 통해 얻어진 원격탐사 자료는 사용되기 이전에 그 정확성에 관한 신뢰도 검증을 해야 한다. 분류 정확도를 평가하기 위해서는 오분류행렬(confusion matrix)을 사용하여 정확도 평가를 하게 되는데, 이때 오분류행렬을 구성하기 위해서는 기준자료(reference data)에 대한 표본추출이 이루어져야 한다. 기준자료의 표본을 추출하는 기법간의 비교 및 표본 크기를 줄이고자 하는 연구는 많이 이루어져 왔으난, 추출된 표본들간의 거리를 줄임으로써 정확도 평가 비용을 감소시키고자 하는 연구는 미미한 실정이다. 따라서, 본 연구에서는 프랙탈 분석을 통하여 기준자료의 표본을 추출하였으며, 이를 바탕으로 기존의 표본추출 기법과 정확도 차이 및 비용효과 측면을 비교 분석하였다. 연구 결과, 프랙탈 분석을 통하여 표본을 추출하는 기법은 그 정확도 추정에 있어 기존적 표본 추출 기법과 큰 차이가 보이지 않았으며, 추출된 화소들이 가까운 거리에 군집해 있어 비용효과측면에서 보다 유리함을 확인하였다.

  • PDF

세그먼트 기반의 Shape-Size Index 추출을 통한 고해상도 영상의 분류정확도 개선 (Segment-based Shape-Size Index Extraction for Classification of High Resolution Satellite Imagery)

  • 한유경;김혜진;최재완;김용일
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2009년도 춘계학술대회 논문집
    • /
    • pp.207-212
    • /
    • 2009
  • 고해상도 위성영상이 갖는 공간 객체의 복잡성과 다양성에 의해 기존 중 저해상도 영상에서 사용하던 분류 방식을 고해상도 영상에 그대로 적용하기에는 한계가 있다. 이러한 문제를 극복하기 위하여 영상은 공간적인 특성을 추가적으로 추출하여 분광정보와 결합하여 분류를 수행하는 방식의 연구가 진행되고 있다. 본 연구의 목적은 고해상도 영상의 분류정확도를 개선하기 위하여 새로운 공간 개체(spatial feature)인 SSI(Shape-Size Index)를 제안하는데 있다. SSI는 영역 확장(Region Growing) 기반의 영상 분할(Image Segmentation)을 수행한 후, 객체 내에 객체의 크기와 모양에 대한 고려를 모두 할 수 있는 공간 속성값을 할당하여 공간정보를 추출한다. 추출된 공간정보를 고해강도 영상의 다중분광 밴드와 결합하여 Support Vector Machine(SVM)을 이용한 분류를 수행하였다. 실험 결과, 제안한 기법의 분류 결과가 분광밴드만을 이용하여 분류를 수행한 결과뿐만 아니라 기존의 공간 개체 추출방식인 GLCM, PSI 기법을 이용한 분류 결과에 비해 높은 분류정확도를 도출함을 알 수 있었다.

  • PDF

고해상도 위성영상을 이용한 SVM의 분류정확도 분석 (Analysis of the SVM using High Resolution Satellite Imagery)

  • 강준묵;이성순;박준규;백승희
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2010년 춘계학술발표회 논문집
    • /
    • pp.271-273
    • /
    • 2010
  • 고해상도 위성영상을 이용하여 대상물을 분류하는 것은 원격탐사의 중요한 분야이며, 위성영상 분류에 대한 주요 주제 중 하나는 분류정확도를 높이는 것이다. 본 연구에서는 KOMPSAT-2 영상을 이용하여 SVM(Support Vector Machine)과 MLC(Maximum Likelihood Classification) 방법으로 감독분류를 수행하고 각 분류결과의 비교를 통해 분류방법에 따른 정확도를 평가하고자 하였다. 적은 수의 표본 데이터를 이용한 고해상도 위성영상의 분류결과 SVM이 MLC에 비해 양호한 분류결과를 나타냄을 알 수 있었다.

  • PDF

GAN 기반 데이터 증강을 통한 반려동물 종 분류 (Pet-Species Classification with Data augmentation based on GAN)

  • 박찬;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.930-932
    • /
    • 2021
  • 영상처리에서 데이터 증강(Data augmentation)은 단순히 사진을 편집하여 사진의 개수를 증강하는 것이다. 단순 데이터 증강은 동물의 반점이나 다양한 색깔을 반영하지 못하는 한계가 있다. 본 논문에서는 GAN을 통한 데이터 증강 기법을 제안한다. 제안하는 방법은 CycleGAN을 사용하여 GAN 이미지를 생성한 뒤, 데이터 증강을 거쳐 동물의 종 분류 정확도를 측정한다. 정확도 비교를 위해 일반 사진으로만 구성한 집단과 GAN 사진을 추가한 두 집단으로 나누었다. ResNet50을 사용하여 종 분류 정확도를 측정한다.

U-Net 기반 딥러닝 모델을 이용한 다중시기 계절학적 토지피복 분류 정확도 분석 - 서울지역을 중심으로 - (Accuracy analysis of Multi-series Phenological Landcover Classification Using U-Net-based Deep Learning Model - Focusing on the Seoul, Republic of Korea -)

  • 김준;송용호;이우균
    • 대한원격탐사학회지
    • /
    • 제37권3호
    • /
    • pp.409-418
    • /
    • 2021
  • 토지피복도는 국토정책, 환경정책을 위한 의사결정 근거 자료로 활용되는 매우 중요한 자료이다. 토지피복도는 원격탐사 자료를 활용하여 제작되는데, 이때 사용되는 데이터의 취득 시기에 따라 동일한 지역을 대상으로 하더라도 분류 결과가 달라질 수 있다. 본 연구에서는 단시기 데이터의 분류 정확도를 개선하기 위해 다중시기 위성영상을 활용하였으며 계절에 따른 지표면의 분광 반사 특성 차이를 딥러닝 알고리즘의 하나인 U-Net 모델에 학습시켜 분류하였다. 또한 단시기 분류 결과와 정확도 비교를 통해 분류 정확도의 향상 정도를 비교하였다. 구역 내에 30%의 녹지와 한강을 포함하여 다양한 토지피복으로 이루어진 서울특별시를 연구대상지로 설정하고 2020년 분기별 Sentinel-2 위성영상을 산출하였다. 대한민국 환경부에서 작성한 세분류 토지피복도를 활용하여 U-Net 모델을 학습시켰다. 학습한 U-Net 모델을 통해 단시기, 2시기, 3시기, 4시기로 모델을 학습하여 분류한 결과, 단시기를 제외하고 토지피복도 분류 정확도 확보기준인 75%를 상회하는 81%, 82% 79%의 정확도를 나타냈다. 이를 통해 다중 시계열 학습을 통해 토지피복의 분류 정확도 향상이 가능하다는 것을 확인하였다.

암 분류를 위한 기계학습 분류기의 성능평가 (Performance Evaluation of Machine Learning Classifiers for Cancer Classification)

  • 원홍희;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.405-408
    • /
    • 2002
  • Microarray 기술의 발전으로 많은 양의 유전자 정보를 얻게 되어 암의 정확한 분류와 진단에 대한 기대가 커지고 있다. 암을 정확하게 분류하기 위해서는 추출된 유전자에 많은 잡음이 들어가기 때문에 암과 관련이 있는 유전자만을 추출할 필요가 있다. 본 논문에서는 여러 가지 유전자 추출방법과 다양한 분류기의 성능을 체계적으로 평가하기 위하여, 세 가지 벤치마크 암 데이터에 대하여 실험하여 보았다. 또한 분류 성능을 향상시키기 위하여 분류기를 적절하게 결합한 결과, 결합된 분류기의 성능을 확인해볼 수 있었다.

  • PDF

Utilizing UPCA and SPCA in Unsupervised Classification Using Landsat TM data

  • Lee, Byung-Gul;Kang, In-Joon
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2003년도 춘계학술발표회 논문집
    • /
    • pp.167-170
    • /
    • 2003
  • 본 연구는 무감독영상해석(Unsupervised Classification)에서 주성분 분석법(Principal Component Analysis)의 응용성을 연구하기 위하여, 주성분 분석법을 K-means, ISODATA 두가지 무감독분류법에 적용하였다. 적용대상지역은 제주도이다. 본 연구에서 주성분 분석 방법중에서 비정규형 주성분 분석방법 (Unstandardized PCA)과 정규형 주성분 분석방법(Standardized PCA) 두가지 경우로 나누어서 각각 연구하였다. 이를 위하여 제주도의 Landsat TM영상과 국토연구원에서 조사한 제주도 식생분류 조사자료와 현장조사 자료 그리고 1/25,000 수치지도를 이용하였다. 그리고 분석된 자료의 정확도를 평가하기 위하여 오차행렬(Error Matrix)을 도입하여 계산하였다. 우선 비정규형 주성분 분석법으로 구한 주성분 영상과 Landsat TM 원래 영상을 오차행렬을 이용하여 제주도의 식생 분류에 각각 적용하였다. 그 결과, K-means 무감독분류법에서는 Landsat TM 자료를 직접 이용한 경우에는 바다와 육상의 분류가 잘 되지 않았으며, 또한 전반적인 영상분류결과가 관측치와 많은 차이를 보였다. 그러나, 주성분 분석법으로 계산된 주성분 영상으로 K-means방법으로 분류 한 결과는 관측치와 잘 일치를 하였다. ISODATA의 경우, Landsat TM 원래영상을 계산하면, K-means으로 분류한 결과보다는 좋은 값을 나타냈으나, 주성분 분석법으로 구한 영상의 계산결과와 비교하면, 주성분 영상으로 구한 분류결과의 정확도가 약 15%정도 높게 나타났다. 정규형 주성분 분석법의 경우를 보면 K-means에서는 Landsat TM원래 자료보다 우수한 결과를 보여주었으나, 비정규형 주성분 분석법으로 계산된 결과보다는 정확도가 다소 떨어지는 단점이 있었고, ISODATA의 경우도 Landsat TM원래 자료보다 약 7%정도의 높은 정확도를 보였으나, 비정규형 영상보다는 약8%정도 낮은 정확도를 보였다. 본 연구에서 주성분 분석법으로 계산된 결과에서 주목되는 것은, 주성분 분석법으로 구한 주성분 영상은 분류방법(K-means, ISODATA, artificial neural networks)에 따라 분류된 결과값이 비슷하게 나타난 반면, Landsat TM원래 자료는 분류방법에 따라 결과값이 많은 차이를 보여 주었다. 그리고 주성분 분석 방법 중에서도 비정규형 주성분 분석법(Unstandardized PCA)이 정규형 주성분 분석법(Standardized PCA)보다 영상분석에서 더 좋은 결과를 보여주는 것으로 나타났다.

  • PDF

비용곡선과 ROC곡선에서의 비용비율 (Cost Ratios for Cost and ROC Curves)

  • 홍종선;유현상
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.755-765
    • /
    • 2010
  • 혼합분포의 분류문제에서 비용함수를 고려한 분류점은 최소 기대비용이라는 측면에서 최적이다. 비용에 관한 어떠한 정보가 주어지지 않은 경우에 ROC곡선을 이용하여 분류정확도 측도인 전체정확도와 진실율이 최대일 때의 분류점에 대응하는 기대비용에서의 비용비율을제안하고, 최소 기대비용의 비용비율과의 관계를 설명한다. 그리고 비용곡선을 이용하여 분류정확도 측도들에 기반하는 최소 기대비용에서의 비용비율을 제안하였고 이 비용비율은 대표적인 두 종류의 분류정확도가 최대일 때의 기대비용에 대한 비용비율들 사이에 존재하며, 최소 기대비용에서의 비용비율에 수렴하는 것을 발견하였다. 본 연구는 기대비용과 정규화된 기대비용을 최소화할 때의 비용비율과 분류정확도가 최대일 때의 비용비율들의 관계를 토론한다.

TTF와 ITTF의 차를 이용한 자동 문서 분류 (Automatic Text Categorization using difference TTF and ITTF)

  • 이상철;하진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.133-135
    • /
    • 2001
  • 본 논문에서는 일반적으로 Word Based Matching 방법에서 많이 쓰이는 TFIDF 방법대신에 TTF(Total Term Frequency)와 ITTF(Inverse Total Term Frequecy) 에 가중치를 주어 문서분류의 정확도를 높이는 방법을 제안하고자 한다. TFIDF방법에서 IDF는 역문헌빈도를 나타내는데 Term에 대한 빈도비율의 공정성이 떨어져 문서 분류의 정확도에 한계가 있다. 본 논문에서 제시하는 문서 분류방법은 TTF와 ITTF에 각각의 가중치를 준 후에 차연산 이용하여 문서를 분류하는 것이다. 이러한 방법의 특징은 IDF를 사용할 때 보다 각 카테고리에 있는 term, 즉 단어의 중요도에 대한 가중치를 좀 더 공평하게 줌으로써 문서의 분류를 높일 수 있다. 본 논문에서는 조선일보의 카테고리를 사용하였으며 조선일보의 기사를 대상으로 문서 자동 분류 실험을 수행하였다. 실험 결과 TFIDF보다 본 논문에서 제안한 방법이 문서 분류에 높은 정확도를 나타냄을 보였다.

  • PDF

목적행위를 기반으로 한 악성코드 분류 방식에 관한 연구 (A Study on Classification of Malware Based on Purpose of Behavioral)

  • 김호연;박민우;서상욱;정태명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.872-875
    • /
    • 2011
  • 악성코드 개체 수의 급격한 증가와 정형화되지 않은 악성코드 분류 기준 때문에 업체별, 연구기관별 악성코드 분류 방식이 서로 상이하다. 이 때문에 악성코드를 분석하는 분석가들은 모호한 악성코드 분류 방식 때문에 업무에 불필요한 시간이 소요되고 있다. 또한 안티 바이러스 제품을 사용하는 최종 사용자로 하여금 혼란을 유발하고, 악성코드에 대응하기 위해 진행되는 연구에서 악성코드에 대한 정확한 분류 지표가 없어, 연구에 혼선을 빚고 있다. 본 논문에서는 악성코드의 정확한 분류와 새로운 악성코드가 발견되고, 새로운 매체가 출현하여도 이에 유기적으로 대응할 수 있도록 악성코드의 목적행위에 따라서 총 7개 그룹으로 나누었다. 제안 분류 방식을 사용할 경우 분류된 악성코드에 대하여 보다 정확한 정보를 얻을 수 있을 것으로 기대한다.