• Title/Summary/Keyword: 클러스터링 샘플링

Search Result 14, Processing Time 0.024 seconds

Light Contribution Based Importance Sampling for the Many-Light Problem (다광원 문제를 위한 광원 기여도 기반의 중요도 샘플링)

  • Kim, Hyo-Won;Ki, Hyun-Woo;Oh, Kyoung-Su
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.240-245
    • /
    • 2008
  • 컴퓨터 그래픽스에서 많은 광원들을 포함하는 장면을 사실적으로 렌더링하기 위해서는, 많은 양의 조명 계산을 수행해야 한다. 다수의 광원들로부터 빠르게 조명 계산을 하기 위해 많이 사용되는 기법 중에 몬테 카를로(Monte Carlo) 기법이 있다. 본 논문은 이러한 몬테 카를로(Monte Carlo) 기법을 기반으로, 다수의 광원들을 효과적으로 샘플링 할 수 있는 새로운 중요도 샘플링 기법을 제안한다. 제안된 기법의 두 가지 핵심 아이디어는 첫째, 장면 내에 다수의 광원이 존재하여도 어떤 특정 지역에 많은 영향을 주는 광원은 일부인 경우가 많다는 점이고 두 번째는 공간 일관성(spatial coherence)이 낮거나 그림자 경계 지역에 위치한 픽셀들은 영향을 받는 주요 광원이 서로 다르다는 점이다. 제안된 기법은 이러한 관찰에 착안하여 특정 지역에 광원이 기여하는 정도를 평가하고 이에 비례하게 확률 밀도 함수(PDF: Probability Density Function)를 결정하는 방법을 제안한다. 이를 위하여 이미지 공간상에서 픽셀들을 클러스터링(clustering)하고 클러스터 구조를 기반으로 대표 샘플을 선정한다. 선정된 대표 샘플들로부터 광원들의 기여도를 평가하고 이를 바탕으로 클러스터 단위의 확률 밀도 함수를 결정하여 최종 렌더링을 수행한다. 본 논문이 제안하는 샘플링 기법을 적용했을 때 전통적인 샘플링 방식과 비교하여 같은 샘플링 개수에서 노이즈(noise)가 적게 발생하는 좋은 화질을 얻을 수 있었다. 제안된 기법은 다수의 조명과 다양한 재질, 복잡한 가려짐이 존재하는 장면을 효과적으로 표현할 수 있다.

  • PDF

The Collection of Clustering Data to Design a Fuzzy System (퍼지 시스템 설계를 위한 클러스터링 데이터의 수집)

  • Yoon, Yong-Seock;Kim, Seo-Gwang;Kong, Seong-Gon
    • Proceedings of the KIEE Conference
    • /
    • 2000.11d
    • /
    • pp.821-823
    • /
    • 2000
  • 전문가의 지식이 없거나 이를 이용하기가 힘든 상황에서 클러스터링과 GA를 이용하여 퍼지 시스템을 설계하는 방법에 관해 연구하였다. 클러스터링에 사용될 데이터의 획득을 위해 두 가지 상황을 고려하여 연구하였다. 먼저 기존의 제어기가 있는 상황에서 개선된 제어기를 설계하기 위해 기존 제어 시스템의 동작시 입출력에 관계된 상태를 샘플링하여 데이터를 획득하였으며, 다음으로 기존의 제어기가 없는 상황에서는 사람이 시스템을 최적으로 동작시키고 이때 시스템에 관계된 상태를 샘플링하였다. 획득된 데이터를 클러스터링하여 퍼지 시스템을 설계하고 이의 최적화에는 GA를 사용하였다.

  • PDF

Optimization Technique for Water Quality Monitoring Stations in a Reservoir (저수지내 수질모니터링 지점의 최적화 기법)

  • Park, Sang-Young;Jeong, Seon-A;Yi, Hye-Suk;Lee, Hye-Keun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1014-1017
    • /
    • 2007
  • 본 연구에서는 K-mean 알고리즘을 이용하여 수지조사지점을 클러스터링하고, 수질변화 특성을 비교 분석하였다. 현행 용담댐 저수지의 호내 수질조사점은 10개소를 운용하고 있으나, 샘플링의 경제성과 효율성을 위하여 수질변동 특성이 유사한 몇 개의 지점으로 클러스터링을 할 필요성이 있다. 군집의 개수를 3개, 4개, 5개로 변화해 가면서 알고리즘을 적용한 결과, 크게 3개의 영역으로 분류되었다. 즉, 지류의 유입부분과 용담호의 중류 지역 그리고 댐앞 지점으로 분류되었다. 지류로 부터의 오염부하 유입에 따른 영향을 직접적으로 받는 3번, 8번, 9번 조사지점은 수질변동 특성이 유사한 것으로 분석되었으나, 공간적으로 이격되어 있어 조사지점을 계속 유지하는 것이 바람직할 것으로 판단된다. 용담호의 중류에 해당하는 5번, 6번, 7번 지점은 하천과 호소의 중간적인 성격을 지닌 전이지대(transitional zone)에 해당하며, 수질변동특성이 유사하여 하나의 조사지점으로 통합하는 것이 적절할 것으로 판단된다. 1번, 2번, 4번 조사지점은 댐앞 지점으로써 호소의 성격이 강한 지점으로 볼 수 있으며, 하나의 조사지점으로 통합할 수 있다. 통합된 조사지점의 강우기 수질 변화는 매우 유사한 패턴을 보이고 있는 것을 확인할 수 있다.

  • PDF

A Study on the Extraction of Slope Surface Orientation using LIDAR with respect to Triangulation Method and Sampling on the Point Cloud (LIDAR를 이용한 삼차원 점군 데이터의 삼각망 구성 방법 및 샘플링에 따른 암반 불연속면 방향 검출에 관한 연구)

  • Lee, Sudeuk;Jeon, Seokwon
    • Tunnel and Underground Space
    • /
    • v.26 no.1
    • /
    • pp.46-58
    • /
    • 2016
  • In this study, a LIDAR laser scanner was used to scan a rock slope around Mt. Gwanak and to produce point cloud from which directional information of rock joint surfaces shall be extracted. It was analyzed using two different algorithms, i.e. Ball Pivoting and Wrap algorithm, and four sampling intervals, i.e. raw, 2, 5, and 10 cm. The results of Fuzzy K-mean clustering were analyzed on the stereonet. As a result, the Ball Pivoting and Wrap algorithms were considered suitable for extraction of rock surface orientation. In the case of 5 cm sampling interval, both triangulation algorithms extracted the most number of the patch and patched area.

자기조립 나노구조체의 단위체 구조 연구

  • Yu, Yeong-Jae;Jo, Yeong-Beom;Lee, Min-Jun;Sin, Seok-Min
    • Proceeding of EDISON Challenge
    • /
    • 2015.03a
    • /
    • pp.32-39
    • /
    • 2015
  • 최근 펩티드를 포함한 다양한 물질들의 자기조립 (self-assembly) 나노구조체에 대한 연구들이 많이 진행되고 있다. 이는 이러한 분자들로 구성된 구조체들이 환경친화적이며, 생체 나노구조체를 묘사함을 통해 세포소기관의 기능 역시 모방할 수 있다고 기대되기 때문이다. 만약 분자 수준에서 자기조립을 형성하는 단위체를 살펴본다면 자기조립 나노 구조를 개발하는 방법에 대한 통찰을 얻을 수 있을 것이다. 본 연구에서는 최근에 Wen Li 그룹에서 개발한 쉽게 합성할 수 있는 자기조립 펩티드의 적합성을 분자 수준에서 규명하였다. 이를 위해 복제계-맞바꿈 분자 동역학 시뮬레이션 (replica exchange molecular dynamics simulation)을 통해 구조를 샘플링 (sampling)하였고, 얻어진 구조들을 평균 제곱근 편차 (root mean square deviation, RMSD)를 기준으로 클러스터링하였다. 그 결과로 매우 우세한 상대빈도를 보이는 하나의 구조를 얻었으며, 그 구조가 탄소 골격과 잔기의 배열의 측면에서 자기조립 펩티드로 사용되기에 적합함을 규명하였다.

  • PDF

A Scalable Clustering Method for Categorical Sequences (범주형 시퀀스들에 대한 확장성 있는 클러스터링 방법)

  • Oh, Seung-Joon;Kim, Jae-Yearn
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.14 no.2
    • /
    • pp.136-141
    • /
    • 2004
  • There has been enormous growth in the amount of commercial and scientific data, such as retail transactions, protein sequences, and web-logs. Such datasets consist of sequence data that have an inherent sequential nature. However, few clustering algorithms consider sequentiality. In this paper, we study how to cluster sequence datasets. We propose a new similarity measure to compute the similarity between two sequences. We also present an efficient method for determining the similarity measure and develop a clustering algorithm. Due to the high computational complexity of hierarchical clustering algorithms for clustering large datasets, a new clustering method is required. Therefore, we propose a new scalable clustering method using sampling and a k-nearest-neighbor method. Using a real dataset and a synthetic dataset, we show that the quality of clusters generated by our proposed approach is better than that of clusters produced by traditional algorithms.

Resampling Feedback Documents Using Overlapping Clusters (중첩 클러스터를 이용한 피드백 문서의 재샘플링 기법)

  • Lee, Kyung-Soon
    • The KIPS Transactions:PartB
    • /
    • v.16B no.3
    • /
    • pp.247-256
    • /
    • 2009
  • Typical pseudo-relevance feedback methods assume the top-retrieved documents are relevant and use these pseudo-relevant documents to expand terms. The initial retrieval set can, however, contain a great deal of noise. In this paper, we present a cluster-based resampling method to select better pseudo-relevant documents based on the relevance model. The main idea is to use document clusters to find dominant documents for the initial retrieval set, and to repeatedly feed the documents to emphasize the core topics of a query. Experimental results on large-scale web TREC collections show significant improvements over the relevance model. For justification of the resampling approach, we examine relevance density of feedback documents. The resampling approach shows higher relevance density than the baseline relevance model on all collections, resulting in better retrieval accuracy in pseudo-relevance feedback. This result indicates that the proposed method is effective for pseudo-relevance feedback.

New Optimization Algorithm for Data Clustering (최적화에 기반 한 데이터 클러스터링 알고리즘)

  • Kim, Ju-Mi
    • Journal of Intelligence and Information Systems
    • /
    • v.13 no.3
    • /
    • pp.31-45
    • /
    • 2007
  • Large data handling is one of critical issues that the data mining community faces. This is particularly true for computationally intense tasks such as data clustering. Random sampling of instances is one possible means of achieving large data handling, but a pervasive problem with this approach is how to deal with the noise in the evaluation of the learning algorithm. This paper develops a new optimization based clustering approach using an algorithm specifically designed for noisy performance. Numerical results show this algorithm better than the other algorithms such as PAM and CLARA. Also with this algorithm substantial benefits can be achieved in terms of computational time without sacrificing solution quality using partial data.

  • PDF

A generating samples method for multiple object tracking using motion histogram (다중 물체 추적에서의 모션 히스토그램을 이용한 샘플 생성 기법)

  • Chun, Ki-Hong;Kang, Hang-Bong
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.744-749
    • /
    • 2007
  • 물체 추적시스템은 비디오 감시 시스템, 화상회의 시스템과 같은 다양한 비전 응용 분야에서 점점 비중이 높아지고 있다. 이 시스템에서 가장 널리 사용되고 있는 방법 중 하나로 Particle-Filter를 들 수 있다. 하지만, 이 Particle-Filter의 단점은 유사한 여러 물체를 추적할 때에 그 물체들이 겹치거나 사라질 경우 정확한 추적을 하기 어렵다는 것이다. 이 단점을 극복하기 위해 많은 연구가 진행되고 있으며, 본 논문에서는 이 문제를 극복하기 위한 새로운 방법을 제안하고자 한다. 다중 물체 추적에서 빈번히 일어나는 문제는 두 가지로 요약할 수 있는데, 동일한 다중 물체가 부분적으로 엇갈리거나 다른 객체에 완전히 겹친 후 떨어질 때 한 물체를 중복하여 추적하는 문제(merge and split problem)와 이 때 분리되어 추적은 됐지만, 물체를 혼동하여 추적하는 문제(Labeling problem)이다. 본 논문에서는 이 러한 문제들을 풀기 위해 이미지 필드에서 보다 정확한 확률분포를 만들고, 이 확률분포의 신뢰성을 높이기 위해서 물체의 특징정보를 표현하는 몇 가지 방법을 제안한다. 전자의 문제는 두 가지 문제로 나누어 생각해 보았다. 첫째, 복잡환 환경에서의 분포를 찾아내는 것과 둘째, 추적 중인 물체를 잃어버릴 경우 새로운 샘플을 생성함으로써 나누어 보았다. 이 문제 중 첫번째는 K-means 클러스터링을 이용하여 유사한 물체가 주변에 퍼져 있을 때, 하나의 후보 위치가 아닌, K개의 후보 위치들을 만들어 내어 보다 정확한 추적이 가능하게 하였으며, 두 번째 문제는 추적 중인 물체가 다른 커다란 물체에 가려질 경우이다. 이 상황에서 샘플을 생성하는 방법은 지금까지 해왔던 간단한 환경에서의 생성 범위와는 다르게 넓게 해야 생성시켜야 한다. 이 때 샘플링의 수를 늘리지 않으면서, 최대한 정확하게 추적하기 위해서 동영상에서 물체의 모션을 이용한 모션 히스토그램을 얻어내고, 그 정보를 이용하여 샘플을 생성하는 위치를 조절함으로써 이 문제를 풀어 보았다. 그리고, 후자의 문제인 이미지 필드상에서 확률분포의 신뢰성을 높이기 위한 특징 정보는 기존에 많이 사용하던 칼라 히스토그램에 공간정보의 의미를 부여하는 칼라 히스토그램을 분할하는 방법과 SIFT에서 사용하는 방향정보와 크기정보를 사용했다. 이것들을 사용하여 보다 정확한 물체추적시스템을 다음과 같이 제안한다.

  • PDF

A Study on the Development of Data Mining Tool named XM-Tool/Miner (데이터 마이닝 도구 XM-Tool/Miner 개발에 관한 연구)

  • Rhee, Nahm-Guhn;Lee, Chang-Ho;Kim, Ju-Young;Lee, Byung-Yup;Lee, Seung-Hee
    • Annual Conference of KIPS
    • /
    • 2000.10a
    • /
    • pp.23-26
    • /
    • 2000
  • 정보기술이 발달하면서 자료의 흔적들이 체계화된 데이터베이스에 저장이 되고, 더불어 데이터베이스의 규모는 점점 커지고 있다. 데이터 마이닝은 이런 방대한 자료의 분석을 통해, 그 속에 숨어있는 의미를 찾는 과정이라고 볼 수 있다. 본 논문에서는 대용량 데이터베이스에 존재하는 여러 유용한 지식을 추출하는 방법으로서 데이터 마이닝을 분류화, 클러스터링, 요약규칙, 시간에 따른 분석 및 예측등으로 분류하여 요약, 제시하였고, 이렇게 추출된 패턴, 정보, 지식들의 유용성을 측정하는 지표를 정리하였다. 개발된 XM-Tool/Miner은 문제 중심적 마이닝 도구를 목표로 하였으며, 대표적인 마이닝 알고리즘을 적용하였고, 또한 사용의 편이성에 초점을 맞추었다. 더 나아가 데이터 마이닝 기법뿐만 아니라 데이터의 샘플링과 성능향상을 통하여 방대한 데이터로부터 다양한 지식탐사가 가능해지고, 발견된 규칙 또는 지식의 유용성 측정을 통하여 업무 분야의 특성에 따라 효과적으로 반영되며 의사결정 및 CRM 마케팅, 동향분석 및 예측 등에 유용한 정보를 추출하는 도구로 사용할 수 있을 것이다.

  • PDF