• 제목/요약/키워드: Spatial Clustering

검색결과 354건 처리시간 0.025초

Pixel layer 들 간의 색상 공간 분포에 따른 공간적 분포를 이용한 영상 검색 (Image Retrieval Using Color & Spatial Distribution between Pixel Layers)

  • 안재현;하성종;이상화;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.294-297
    • /
    • 2012
  • 본 논문에서는 컬러 영상의 검색을 위하여 영상을 색상 정보에 기반한 pixel layer (cluster)의 집합체로 모델링하고, 두 layer 간의 유사도를 각 layer 를 이루는 pixel 들의 색상 분포에 따른 공간적 분포를 이용하여 측정하는 기법을 제안한다. 먼저 pixel layering 단계에서는 HSV 색 공간에서 mean-shift clustering 알고리즘을 통해 초기 layer 들을 얻고, 비슷한 색상의 layer 들은 합쳐 영상의 soft segmentation 과 유사한 결과를 얻는다. 비교할 두 영상에서 pixel layering 을 한 후, 각 layer 를 이진화된 공간분포 지도로 형성하고 그 차이를 비교함으로써 유사도를 측정한다. 이 때, 사용하는 가중치로서 HSV 색 공간 분포의 비슷한 정도를 정의하는데, 이는 HSV 색 공간을 XYZ 의 3 차원 좌표로 설정하고, overlap 되는 pixel 수로 정의하였다. 본 논문에서 제안한 pixel layer 들 간의 색상 공간 분포에 따른 공간적 분포를 이용한 영상 검색 기법은 MPEG-7 에서 정의한 대표색상 기반의 영상 검색보다 우수한 성능을 보여주었다.

  • PDF

수정 이방성 분산 복원을 이용한 영상 분류 (Image Classification Using Modified Anisotropic Diffusion Restoration)

  • 이상훈
    • 대한원격탐사학회지
    • /
    • 제19권6호
    • /
    • pp.479-490
    • /
    • 2003
  • This study proposed a modified anisotropic diffusion restoration for image classification. The anisotropic diffusion restoration uses a probabilistic model based on Markov random field, which represents geographical connectedness existing in many remotely sensed images, and restores them through an iterative diffusion processing. In every iteration, the bonding-strength coefficient associated with the spatial connectedness is adaptively estimated as a function of brightness gradient. The gradient function involves a constant called "temperature", which determines the amount of discontinuity and is continuously decreased in the iterations. In this study, the proposed method has been extensively evaluated using simulated images that were generated from various patterns. These patterns represent the types of natural and artificial land-use. The simulated images were restored by the modified anisotropic diffusion technique, and then classified by a multistage hierarchical clustering classification. The classification results were compared to them of the non-restored simulation images. The restoration with an appropriate temperature considerably reduces error in classification, especially for noisy images. This study made experiments on the satellite images remotely sensed on the Korean peninsula. The experimental results show that the proposed approach is also very effective on image classification in remote sensing.

Optimal SVM learning method based on adaptive sparse sampling and granularity shift factor

  • Wen, Hui;Jia, Dongshun;Liu, Zhiqiang;Xu, Hang;Hao, Guangtao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1110-1127
    • /
    • 2022
  • To improve the training efficiency and generalization performance of a support vector machine (SVM) in a large-scale set, an optimal SVM learning method based on adaptive sparse sampling and the granularity shift factor is presented. The proposed method combines sampling optimization with learner optimization. First, an adaptive sparse sampling method based on the potential function density clustering is designed to adaptively obtain sparse sampling samples, which can achieve a reduction in the training sample set and effectively approximate the spatial structure distribution of the original sample set. A granularity shift factor method is then constructed to optimize the SVM decision hyperplane, which fully considers the neighborhood information of each granularity region in the sparse sampling set. Experiments on an artificial dataset and three benchmark datasets show that the proposed method can achieve a relatively higher training efficiency, as well as ensure a good generalization performance of the learner. Finally, the effectiveness of the proposed method is verified.

영상감시시스템에서 은닉마코프모델을 이용한 불검출 방법 (Fire detection in video surveillance and monitoring system using Hidden Markov Models)

  • ;김정현;강동중;김민성;이주섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2009
  • The paper presents an effective method to detect fire in video surveillance and monitoring system. The main contribution of this work is that we successfully use the Hidden Markov Models in the process of detecting the fire with a few preprocessing steps. First, the moving pixels detected from image difference, the color values obtained from the fire flames, and their pixels clustering are applied to obtain the image regions labeled as fire candidates; secondly, utilizing massive training data, including fire videos and non-fire videos, creates the Hidden Markov Models of fire and non-fire, which are used to make the final decision that whether the frame of the real-time video has fire or not in both temporal and spatial analysis. Experimental results demonstrate that it is not only robust but also has a very low false alarm rate, furthermore, on the ground that the HMM training which takes up the most time of our whole procedure is off-line calculated, the real-time detection and alarm can be well implemented when compared with the other existing methods.

유의어 사전 기반 환경기술 검색 시스템 설계 (Design of environmental technology search system using synonym dictionary)

  • ;;구영현;유성준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.582-586
    • /
    • 2020
  • 국가기후기술정보시스템은 국내 환경기술과 국외의 수요기술 정보를 제공하는 검색 시스템이다. 그러나 기존의 시스템은 유사한 뜻을 가진 단일 단어와 복수 단어들을 모두 식별하지 못하기에 유의어를 입력했을 경우 검색 결과가 다르다. 이런 문제점을 해결하기 위해 본 연구에서는 유의어 사전을 기반으로한 환경기술 검색 시스템을 제안한다. 이 시스템은 Word2vec 모델과 HDBSCAN(Hierarchical Density-Based Spatial Clustering of Application with Noise) 알고리즘을 이용해 유의어 사전을 구축한다. Word2vec 모델을 이용해 한국어와 영어 위키백과 코퍼스에 대해 형태소 분석을 진행한 후 단일 단어와 복수 단어를 포함한 단어를 추출하고 벡터화를 진행한다. 그 다음 HDBSCAN 알고리즘을 이용해 벡터화된 단어를 군집화 해주고 유의어를 추출한다. 기존의 Word2vec 모델이 모든 단어 간의 거리를 계산하고 유의어를 추출하는 과정과 대비하면 시간이 단축되는 역할을 한다. 추출한 유의어를 통합해 유의어 사전을 구축한다. 국가기후기술정보시스템에서 제공하는 국내외 기술정보, 기술정보 키워드와 구축한 유의어 사전을 Multi-filter를 제공하는 Elasticsearch에 적용해 최종적으로 유의어를 식별할 수 있는 환경기술 검색 시스템을 제안한다.

  • PDF

가뭄사상에 대한 3차원적 시공간 분석을 통한 가뭄지도 개발 (Development of Drought Map Based on Three-dimensional Spatio-temporal Analysis of Drought)

  • 유지영;소병진;권현한;김태웅
    • 대한토목학회논문집
    • /
    • 제40권1호
    • /
    • pp.25-33
    • /
    • 2020
  • 가뭄사상은 지속기간, 심도, 피해면적 등으로 특성화 할 수 있다. 일반적으로 가뭄사상은 관측소별로 구축된 시계열 자료를 이용하여 가뭄지수를 산정한 후, 연속이론에 따라 가뭄의 시작과 종료 시점을 파악하여 정의된다. 하지만 이와 같은 1차원적 분석방법은 가뭄의 시공간적인 발생특성 및 이동경로를 분석하는 데에는 한계가 있다. 따라서 본 연구에서는 단순 클러스터링 알고리즘을 활용하여 3차원(경도, 위도, 시간)적 가뭄사상을 정의하고, 가뭄의 시공간적 확장에 따른 가뭄상황을 파악할 수 있는 가뭄지도를 개발하였다. 이러한 가뭄지도는 가뭄지수를 공간적으로 표출하는 2차원적 가뭄 모니터링 정보와 비교하여 3차원적 가뭄사상에 대한 특성(지속기간, 공간적 누적심도, 가뭄의 중심)을 모두 표출하는 것이다. 그 결과 가뭄 지속기간 내 가뭄 발생면적이 최소 10 % 미만인 국소면적인 경우도 있는 반면, 최대 90 % 이상으로 확장되는 비율도 44%(25개 사상 중 11개 사상)로 확인되었다. 이는 3차원적으로 해석한 다양한 가뭄 지속기간 변화에 따른 공간적인 가뭄의 면적 변화와 심도(강도) 변화에 대한 관계는 매우 중요하다는 것을 재확인 하는 것이다. 3차원 시공간적 가뭄분석을 통한 가뭄지도 개발을 위한 연구는 미래 극한가뭄 대응 방안을 마련함에 있어서는 지역적 가뭄의 시공간적 발생특성 및 패턴을 해석하는 데 활용가능성이 있을 것으로 기대된다.

GIS-AMR 시스템에서 시공간 데이터마이닝 기법을 이용한 전력 소비 패턴의 분석 및 예측 (Analysis and Prediction of Power Consumption Pattern Using Spatiotemporal Data Mining Techniques in GIS-AMR System)

  • 박진형;이헌규;신진호;류근호
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.307-316
    • /
    • 2009
  • 이 논문에서는 자동 원격 검침(AMR) 시스템에서 수집되는 전력 사용량 데이터의 분석 결과를 실세계에 적용하기 위하여 시간과 공간의 변화에 따른 전력 소비 패턴의 주기성 탐사를 위한 시공간 데이터마이닝 기법을 제안하였다. 첫째, 고객의 전력 사용 목적에 따른 군집 분석을 위하여 분할 군집화 기법을 적용하였다. 둘째, 3차원 큐브 마이닝 기법을 적용하여 고객의 전력 소비 데이터가 갖는 시간 속성과 공간 속성에 대한 패턴을 탐색하였다. 셋째, 다양한 시간 도메인에서의 주기 패턴 발견을 위한 캘린더 패턴 마이닝 기법을 이용하여 탐사된 패턴들이 갖고 있는 시간 속성의 의미와 관계를 분석 및 예측하였다. 제안된 시공간 데이터마이닝 기법을 평가하기 위해 한국 전력 연구원에서 구축된 GIS-AMR 시스템에 의해 제공되는 고압 전력 소비 고객 3,256명의 2007년 1월부터 4월까지 총 266,426건의 데이터로부터 시간의 주기성 및 공간적 특성을 포함한 전력 소비 패턴을 분석하였다. 제안한 분석 기법을 통하여 특정 그룹에 속한 각각의 대표 프로파일이 시간과 공간상에서 갖는 주기성을 발견하였다.

SPOT/VEGETATION NDVI 자료를 이용한 동북아시아의 생태기후지도 (Ecoclimatic Map over North-East Asia Using SPOT/VEGETATION 10-day Synthesis Data)

  • 박윤영;한경수
    • 한국농림기상학회지
    • /
    • 제8권2호
    • /
    • pp.86-96
    • /
    • 2006
  • 새로운 개념과 알고리즘으로 완성된 지표 변수 데이터베이스인 Ecoclimap-1이 전 지구 영역에 대해 1km의 해상도로 제공 된 바 있다. 이것은 기상과 기후의 모델에서 토양과 식물과 대기 사이의 이동을 정량적으로 표현하기 위해 고안 되었으며, Ecoclimap-1 데이터베이스를 구성하는 지표변수 자료들은 토지피복지도와 기후지도를 중첩하여 얻어진 생태기후 지도를 기본 주제도로 사용하여 각 클래스에 대한 값(per-class)로 제공된다. 생태기후지도의 제작은 일반적으로 사용하는 토지피복분류가 나타내지 못하는 동질 피복 내 생장 주기의 변동성을 고려하기 위한 것이다. 그러나 이렇게 중첩하여 얻은 주제를 사용하더라도 역시 같은 class내부의 식생 생장 주기의 변동성은 여전히 높게 나타나는 경향을 보였다. 본 연구에서는 이러한 단점을 보완하기 위하여 새로운 방법으로, SPOT/VEGETATION S10 NDVI 자료를 이용하여 토지피복지도와 기후지도의 단순 중첩이 아닌 동일 토지피복 클래스 내의 sub-clustering을 통하여 보다 동질의 하위 집단으로 분류한다. 본 연구는 Ecoclimap-2 project의 전 지구 데이터 베이스 구축의 일환으로 동북 아시아 지역의 생태기후지도 제작을 수행하였다. 사용된 토지피복지도는 University of Maryland Global Land Cover Database를 사용하였고 기후지도는 각 토지피복 클래스의 sub-clustering시 초기 군집의 수를 결정하기 위한 보조 자료로 사용하였다. 1999년부터 2004년 총 6년 동안의 NDVI 10-day 자료를 이용하였고 한 UMD토지피복 class내에 존재하는 모든 화소의 시 공간 긴밀도를 분석하여 비슷한 NDVI 정보를 가지는 화소들을 통합하였다. 이러한 과정을 통해 동북아시아를 총 29개의 ecosystem으로 정의 하였다. 이러한 ecosystem map은 앞으로의 기후 모델 연구에 있어 중요한 기본 주제도로 유용할 것으로 보이며 또한 생태계모델, 기상모델의 중요한 input 자료로서 쓰여 질 것으로 사료 된다.

인구이동 연구에 대한 공간통계학적 접근: 장소특수적 거리 패러미터의 추출과 공간적 패턴 분석 (A Spatial Statistical Approach to Migration Studies: Exploring the Spatial Heterogeneity in Place-Specific Distance Parameters)

  • 이상일
    • 한국지역지리학회지
    • /
    • 제7권3호
    • /
    • pp.107-120
    • /
    • 2001
  • 이 연구의 목적은 장소-특수적 거리 패러미터를 측정하는 방법론을 제시하고, 그것이 인구이동 연구에서 가지는 의미에 대해 미국의 48개 주간(州間) 인구 이동자료를 사례로 검토해보는 것이다. 전통적인 인구이동 연구에서 추출하는 거리 패러미터는 인구 이동량에 대해 거리가 가지는 평균적인 효과를 측정하는 것이다. 그러나, 그 평균적인 거리 패러미터는 모든 지역간 인구이동의 대표값일 뿐 인구이동에 있어 거리가 가지는 효과의 공간적 변이에 대해서는 아무런 통찰을 제공해 주지 못한다. 장소-특수적 거리 패러미터란 개개 소지역이 평균적인 거리 패러미터에 대해 가지는 상대적인 값이며, 거리가 인구이동에 대해 가지는 효과의 지역적 특이성을 측정하려고 한다. 이러한 연구는 최근 계량지리학 분야에서 발생하고 있는 변화에 부응하는 것이다. 1980년대 이후, 계량지리학은 공간통계학이라는 보다 폭넓은 개념의 확장과 일반연구환경으로서의 지리정보체계(GIS)치 성장으로 학문적 재구조화 과정 속에 있다. 이러한 재구조화 과정은 특정한 패러다임으로서의 탐구적 공간자료분석(ESDA)과 그것을 통계적으로 가능케 하는 국지 통계(local statistics)의 발달로 특징 지워진다. 통계적으로 가공되어 지역에 부여된 값으로 정의되는 국지 통계는 그것의 시각화를 효과적으로 수행하는 GIS와 결합함으로써, 시각화(visualization)와 과학활동으로서의 탐구(exploration)를 강조하는 탐구적 공간자료분석이라는 계량지리학의 새로운 패러다임을 효과적으로 수행하게 된다. 이러한 맥락에서, 장소-특수적 거리 패러미터는 하나의 국지 통계치로 인식될 수 있으며, 그것이 보여주는 공간적 패턴을 탐구하는 것은, 인구이동연구에서 탐구적 공간자료분석의 전형을 수행하는 것이라 올 수 있다. 장소-특수적 거리 패러미터는 출발지-특수적 거리 패러미터와 도착지-특수적 거리 패러미터로 나뉘어 지는데, 이러한 패러미터를 추출하기 위해서는 특정한 통계기법이 요구된다. 이러한 패러미터를 추출하기 위해 전통적인 혹은 보다 진보된 형태의 중력모델이나 엔트로피-극대화 모델이 활용될 수 있지만, 본 논문은 포아송 회귀분석을 이용함으로써 패러미터의 추출이 가장 효과적으로 이루어짐을 논증하고 있다. 이 방법론은 1985년과 1990년 사이에 발생한 미국 48개 주간 인구이동량에 대한 사례연구에 적용되었다. 그 연구 결과는 장소-특수적 거리 패러미터의 공간성을 명확히 보여준다. 즉, 평균적 거리 패러미터로 부터의 편기로 이해될 수 있는 장소-특수적 거리 패러미터들이 지역별로 상당한 차이를 보여줄 뿐만 아니라(공간적 이질성), 유사한 장소-특수적 거리 패러미터들이 공간적으로 집중되어 있음을 확인할 수 있었다(공간적 의존성). 지역차에 대한 강한 전통을 가지고 있는 지리학내에서 태동한 계량지리학이 지역적 특이성을 무시하는 방향으로 발전해 온 것은 아이러니라 할 수 있다. 그것은 계량적 방법론의 한계라기 보다는 그 방법론을 사용하는 전통적 계량지리학자의 한계라고 보아야 할 것이다. 이러한 의미에서 본 연구는 최근 계량지리학의 경향을 인구이동연구에 적용한 사례임과 동시에 맥락 의존성을 강조하는 보다 폭넓은 과학운동의 계량지리적 반응이다.

  • PDF

유전자 알고리즘을 이용한 서울시 군집화 최적 변수 선정 (Selection of Optimal Variables for Clustering of Seoul using Genetic Algorithm)

  • 김형진;정재훈;이정빈;김상민;허준
    • 대한공간정보학회지
    • /
    • 제22권4호
    • /
    • pp.175-181
    • /
    • 2014
  • 정부 3.0이라는 새로운 정부운영 계획과 함께 다양한 공공정보를 민간이 활용할 수 있게 되었으며, 특히 서울은 이러한 행정정보 공개 및 활용을 선도하고 있다. 공개된 행정정보를 통해 각 지역을 특징짓는 행정요소를 발견할 경우, 각종 행정정책을 위한 의사결정 수단에 반영할 수 있을 뿐만 아니라 특정 지역의 고객 특성을 파악하여 특화된 서비스나 상품을 판매하는 마케팅 수단으로도 사용할 수 있을 것으로 사료된다. 하지만, 방대한 양의 행정자료로부터 각 군집의 특성을 명확히 구분할 수 있는 최적의 조합을 찾는 과정은 조합최적화 문제로서 상당한 연산량을 요구한다. 본 연구에서는 서울시에서 제공하는 다차원 행정자료로부터 서울시를 대표하는 문화 산업의 중심인 서초구, 강남구, 송파구 등의 강남 3구를 다른 지역과 효과적으로 구분하는 행정요인를 찾고자 하였다. 방대한 양의 행정정보로부터 두 군집간의 차이점을 극대화하는 요인을 선별하기 위한 최적화 방법으로 유전자 알고리즘을 이용하였으며, 군집간 차이를 계산하는 척도로는 Dunn 지수를 이용하였다. 또한 유전자 알고리즘의 연산속도의 향상을 위해 Microsoft Azure에서 제공하는 cloud computing을 이용한 분산처리를 수행하였다. 자료로는 통계청으로 부터 취득한 총 718개의 행정자료를 이용하였으며, 그 중 28개가 최적 변수로 선정되었다. 검증을 위해 선정된 28개의 변수를 입력값으로 Ward의 최소분산법 및 K-means 알고리즘을 통한 군집화를 수행한 결과 두 경우 모두 강남 3구가 다른 지역으로부터 효과적으로 분류됨을 확인하였다.