• 제목/요약/키워드: 자료분류

검색결과 5,202건 처리시간 0.04초

지구통계학적 시뮬레이션을 이용한 원격탐사 화상 분류 결과의 공간적 불확실성 분포의 추정 (Assessing spatial uncertainty distributions in remote sensing data classification using geostatistical simulation)

  • 박노욱;지광훈;권병두
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.463-468
    • /
    • 2004
  • 이 연구에서는 원격탐사 자료를 이용하여 얻어진 분류 결과로부터 분류 정확도의 공간적 불확실성을 추정하고자 하였다. 기존 분류결과로부터 얻어지는 토지 피복별 확률값을 지구통계학적 시뮬레이션 기법을 이용하여 참조자료의 공간적 분포와 통합하였다. 다중센서 화상 통합에 적용한 결과, 각 토지피복 항목별로 공간적인 정확도 분포를 얻을 수 있을 수 있었으며 이러한 자료는 분류결과를 해석하는데 유용하게 사용될 수 있을 것으로 기대된다.

  • PDF

다변량 크리깅과 KOMPSAT-2 영상을 이용한 간석지 표층 퇴적물 분류 (Surface Sediments Classification in Tidal Flats using Multivariate Kriging and KOMPSAT-2 Imagery)

  • 이상원;박노욱;장동호;유희영;임효숙
    • 한국지형학회지
    • /
    • 제19권3호
    • /
    • pp.37-49
    • /
    • 2012
  • 이 논문의 목적은 간석지 표층 퇴적상 분류를 목적으로 다변량 크리깅을 기반으로 고해상도 원격탐사 자료와 현장 조사 자료를 결합하는 방법론을 제안하는데 있다. 퇴적물 성분에 따라 미리 범주화시킨 퇴적물 자료를 사용하여 원격탐사 자료를 분류하는 기존 방법론과 달리 현장 조사 자료와 원격탐사 자료를 이용하여 퇴적물 성분별 분포도를 제작한 후에 최종 단계에서 범주화 시키는 분류 방법론을 제안하였다. 퇴적물 성분별 분포도 제작 과정에서 현장 조사 자료와 원격탐사 자료의 결합을 위해 다변량 크리깅 기법인 회귀 크리깅 기법을 이용하였다. 우선 현장조사 자료의 모래, 실트, 점토 성분별로 고해상도 원격탐사 자료의 분광 정보와 회귀 분석을 수행하여, 각 성분별 경향 성분을 추출하였다. 그리고 현장 조사 자료 위치에서 잔차를 계산한 후에, 잔차에 대해 크리깅을 적용하여 잔차분포도를 얻게 된다. 이후 성분별 경향 성분과 잔차 성분을 합하여 성분별 비율 분포도를 작성한 후에 최종 단계에서 퇴적상 분류를 수행하게 된다. 제안 기법의 적용성 평가를 위해 바람아래 간석지를 대상으로 고해상도 KOMPSAT-2 자료를 이용한 사례 연구를 수행하였다. 사례 연구를 통해 제안 기법이 기존 분류 방법에 비해 상대적으로 높은 분류 정확도를 나타내었으며, 특히 세립질 퇴적물 분류에 더 우수한 것으로 나타났다. 따라서 제안 기법은 원격탐사 자료를 이용한 간석지 표층 퇴적상 분류에 유용하게 사용될 수 있을 것으로 기대된다.

최소제곱 서포터벡터기계 형태의 준지도분류 (Semi-supervised classification with LS-SVM formulation)

  • 석경하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.461-470
    • /
    • 2010
  • 라벨 있는 자료가 분류규칙을 만들 만큼 충분하지 않거나, 라벨 없는 자료가 분류규칙을 만드는데 도움을 줄 수 있는 경우에는 라벨 있는 자료와 라벨 없는 자료를 모두 사용하는 준지도분류가 더 효과적이다. 준지도분류 중 그래프기반 다양체정칙법이 개발되어 최근에 많은 연구가 이루어지고 있다. 본 연구에서는 통계적학습에서 좋은 성능을 보이는 최소제곱 서포터벡터기계를 준지도분류에 적용시키는 방법을 제안한다. 모의실험을 통해 제안된 방법이 라벨 없는 자료를 잘 활용하는 것을 볼 수 있었다.

불균형 자료의 분류분석을 위한 가중 L1-norm SVM (Weighted L1-Norm Support Vector Machine for the Classification of Highly Imbalanced Data)

  • 김은경;전명식;방성완
    • 응용통계연구
    • /
    • 제28권1호
    • /
    • pp.9-21
    • /
    • 2015
  • SVM은 높은 수준의 분류 정확도와 유연성을 바탕으로 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 집단별 개체수가 상이한 불균형 자료의 분류분석에서 SVM은 다수집단으로 편향되게 분류함수를 추정하므로 소수집단의 분류 정확도가 심각하게 감소하게 된다. 불균형 자료의 분류분석을 위하여 집단별 오분류 비용을 차등 적용하는 가중 $L_2$-norm SVM이 개발되었으나, 이는 릿지 형태의 벌칙함수를 사용하므로 분류함수의 추정에서 불필요한 잡음변수의 제거에는 효율적이지 못하다. 따라서 본 논문에서는 라소 형태의 별칙함수를 사용하고 훈련개체의 오분류 비용을 차등적으로 부여함으로서 불균형 자료의 분류분석에서 변수선택의 기능을 지니는 가중 $L_1$-norm SVM을 제안하였으며, 모의실험과 실제자료의 분석을 통하여 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

주제어와 미분류 문서들을 이용한 문서의 자동 분류 방법 (Automatic Text Classification Method Using Keywords and Unlabeled Text)

  • 이강일;이창환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.592-594
    • /
    • 2005
  • 문서를 분류하기 위해서는 분류주제에 맞춰 미리 분류가 된 자료(labeled data)가 필요하다. 하지만 미리 분류가 된 자료를 만들기 위해서는 사람이 직접 그 문서의 의미를 해석하고 일일이 분류를 해야 하기 때문에 시간이 많이 소모가 된다. 본 논문에서는 비록 사랑이 직접 분류한 자료를 이용하는 것에 비해서 분류 정확도는 조금 떨어지지만, 대신 주제어와 미분류 문서(unlabeled data)를 이용해서 문서를 분류하는 방법을 제시하려고 한다. 이와 같은 주제어와 미분류 문서의 경우에는 구하기가 쉽고, 사랑이 일일이 분류하는 작업이 필요로 하지 않기 때문에 비용과 시간이 크게 절약이 된다는 장정이 있다.

  • PDF

극궤도 기상위성 자료를 이용한 한반도의 지면피복 분류 (Classification of Land Cover over the Korean Peninsula Using Polar Orbiting Meteorological Satellite Data)

  • 서명석;곽종흠;김희수;김맹기
    • 한국지구과학회지
    • /
    • 제22권2호
    • /
    • pp.138-146
    • /
    • 2001
  • 이 연구에서는 극궤도 기상위성인 NOAA/AVHRR 시계열 자료를 이용하여 한반도의 지면 피복을 분류하였다. 일주기 기상위성자료로부터 구름이 없는 상태의 지면상태 자료를 획득하기 위하여 10일 간격 최대치 합성법 자료를 작성하였으며 27개의 10일주기 식생지수 자료들(겨울철 12, 1, 2월 자료 9개 제외)로부터 4개의 식생 계절성 자료를 작성하였다. 또한 위성자료로부터 분석한 연 최고 및 연평균 지면온도, 그리고 지형고도 자료를 이용하였다. 각 지면 피복에 대한 특성 자료 수집이 어렵기 때문에 여기서는 2단계 무감독 분류법을 이용하였다. 즉, 초기 입력자료는 신경망 기법의 일종인 SOFM을 이용하여 군집화한 다음 결정나무를 이용하여 각 군집을 분류하였다. 최종 분류 결과는 식생지수의 시계열과 지상 자료로 검증한 결과 대도시, 농지, 낙엽수림 및 상록수림 등 우리 나라의 지면 피복을 개략적으로 잘나타내고 있는 것으로 판단된다.

  • PDF

마이크로어레이자료분석에서의 최신 분류방법들의 비교연구 (Comparison of recently developed classification tools in microarray data analysis)

  • 이재원;이정복;박미라
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.99-104
    • /
    • 2002
  • cDNA 마이크로어레이자료를 이용한 분류방법은 수많은 유전자의 발현을 동시에 모니터링 할 수 있으므로 특정 질병간의 분자생물학적 변이를 이해하는데 있어 기존의 분류방법보다 신뢰성이 훨씬 높을 것으로 기대되고 있다 최근에 Dudoit et al.(2001)은 cDNA 마이크로어레이를 이용한 유전자발현자료의 분석에 있어 분류를 위한 여러 고전적인 판별분류기법 및 최근에 개발된 기법들을 비교, 평가하였다. 본 논문에서는 Dudoit et al.(2001)에서 다루지 않았던 많은 최신 기법들을 포함하여 인간의 종양 자료뿐만이 아니라 농작물을 포함한 동식물 자료에 적용하여 보다 폭넓은 비교연구를 하였다.

  • PDF

지식 기반 시스템에서 GIS 자료를 활용하기 위한 기계 학습 기법에 관한 연구 - Landsat ETM+ 영상의 토지 피복 분류를 사례로 (A Machine learning Approach for Knowledge Base Construction Incorporating GIS Data for land Cover Classification of Landsat ETM+ Image)

  • 김화환;구자용
    • 대한지리학회지
    • /
    • 제43권5호
    • /
    • pp.761-774
    • /
    • 2008
  • 원격탐사에서 위성 영상의 디지털 처리 기술이 발달하면서 GIS 자료와 지식 기반 전문가 시스템과의 통합에 대한 관심이 증가하고 있다. 본 연구에서는 위성영상을 토지피복 분류하는 과정에서 GIS 자료를 통합하기 위하여 기계 학습 기법과 규칙 기반 분류 기법을 적용하였다. 사례 지역을 대상으로 Landsat ETM+ 영상과 고도, 경사, 향, 수역과의 거리, 도로와의 거리, 인구밀도 등의 GIS 자료를 함께 활용하였다. C5.0 추론 기계 학습 알고리듬을 이용하여 350개의 표본점으로부터 결정 트리와 분류 규칙을 생성하였다. 본 연구에서 도출된 규칙을 이용하여 분류한 결과, 고독 수역과의 거리, 인구밀도 등의 GIS 자료가 규칙 기반 분류에 효과적인 것으로 나타났다. 본 연구에서 제안한 기계 학습과 지식 기반 분류 기법을 이용하면 다양한 GIS 자료들을 통합하여 위성영상을 보다 효과적으로 분류할 수 있다.

의학 분야 웹 자료의 분류에 대한 개선 방안 연구 (A Study on the Organizing Web Materials in the Field of Medicine)

  • 정경희
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.89-106
    • /
    • 2004
  • 웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 $\boxDr$의학용어집$\boxUl$의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

농업용 저수지 이상거동 탐지를 위한 시계열 수위자료 특성 분석 (Time Series Analysis of Agricultural Reservoir Water Level Data for Abnormal Behavior Detection)

  • 이성학;이상현;홍민기;최진용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.275-275
    • /
    • 2015
  • 최근 기후변화에 따른 극한 강우사상의 증가로 인하여 농업용 저수지의 재해 위험도가 증가하고 있는 추세이며, 사고가 발생할 때 마다 파손/붕괴된 시설물을 보수하는 대응형 유지관리체계에서 벗어나 기반시설의 성능과 생애주기 등을 고려하여 재해 발생을 사전에 예보 및 경보를 알릴 수 있는 예방적 관리체계로의 전환이 필요하다. 한국농어촌공사는 전국 1,500개 저수지에서 10분 단위 수위자료를 측정하고 있으며, 이를 분석하여 재해예방에 활용할 수 있는 기반이 조성되어 있으나 이에 대한 관리가 이루어지지 않고 있고 수집된 자료를 활용하여 재해 징후를 분석할 수 있는 재해 예방적 분석기술이 마련되어 있지 않은 실정이다. 본 연구에서는 농업용 저수지 수위자료를 이용한 저수지 이상거동을 판별하기 위하여 전국 34개 한국농어촌공사 관할 저수의 시계열 수위자료의 특성(Feature)을 분석하고자 한다. 시계열 자료의 시계열 특성을 분석하기 위하여 한국농어촌공사 관할의 전국 34개 저수지를 선정하여 분석을 실시하였다. 대상저수지는 지역별, 저수용량, 안정등급, 붕괴발생, 1개 지사관할 저수지로 각각 구분하여 선정하였으며, 각 저수지의 수위 측정기간(최소 5개년)에 대한 자료를 수집하였다. 농업용 저수지의 시계열 수위 자료의 특성을 분석하기 위하여 자료의 전처리를 수행하였다. 자료의 전처리는 시계열 수위자료의 잡음 특성, 기상자료 관련 변동특성 등 분류(Classification)에 영향을 미치는 노이즈 요소를 제거하는 과정이다. 전처리과정을 거친 자료는 특징(Feature) 추출 과정을 거치게 되고, 추출된 특징의 적합성에 따라 분류 알고리듬 성능에 많은 영향을 미친다. 따라서 시계열 자료의 특성을 파악하고 특징을 추출하는 것은 이상치 탐지에 있어 매우 중요한 과정이다. 본 연구에서는 시계열 자료 특징 추출 방법으로 물리적인 한계치, 확률적인 문턱값(Threshold), 시계열 패턴, 주변 저수지와의 시계열 상관분석 등을 적용하였으며, 이를 데이터베이스로 구축하여 이후 분류알고리듬 학습에 적용하여 정상치와 이상치를 판별하는데 이용될 수 있도록 하였다. 따라서 본 연구에서 제시되는 농업용 저수지의 시계열 특성은 다양한 분류알고리듬에 적용할 수 있으며, 이를 통하여 저수지 이상거동 판별을 위한 최적을 분류알고리듬의 선택에 도움이 될 것이다.

  • PDF