• Title/Summary/Keyword: 선택적샘플링

Search Result 109, Processing Time 0.022 seconds

A Study on Selective Sampling using SOM (SOM을 적용한 선택적 샘플링에 관한 연구)

  • Kim, Man-Sun;Yang, Hyung-Jeong;Kim, Jeong-Sik;Kim, Sun-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.38-41
    • /
    • 2007
  • 데이타 마이닝을 위하여 수집된 대용량의 데이타를 여과 없이 기계학습에 적용하는 것은 많은 시간과 비용이 요구될 뿐만 아니라 저장 공간면에서도 비효율적이다. 선별적 샘플링은 이러한 상황에서 매우 효율적으로 적용할 수 있도록 원본 데이타의 특성을 가능한 반영하여 새로운 훈련 데이타를 생성하는 방법이다. 본 연구에서는 신경망의 하나인 SOM을 적용한 선별적 샘플링을 수행하는데 있어서 여러 가지 선택 문제를 효과적으로 해결하기 위한 실험을 수행한다. 실험 결과로는 두 가지 결과를 얻었다. 1) 충분한 맵 사이즈를 선택해야 학습 데이타의 함축적인 특성을 잘 반영한다, 2) 선택적 샘플링을 위한 유닛선택 방법에서는 의미없는 유닛을 제거함으로서 분류 성능향상을 얻을 수 있다.

Sampling Set Selection Algorithm for Weighted Graph Signals (가중치를 갖는 그래프신호를 위한 샘플링 집합 선택 알고리즘)

  • Kim, Yoon Hak
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.17 no.1
    • /
    • pp.153-160
    • /
    • 2022
  • A greedy algorithm is proposed to select a subset of nodes of a graph for bandlimited graph signals in which each signal value is generated with its weight. Since graph signals are weighted, we seek to minimize the weighted reconstruction error which is formulated by using the QR factorization and derive an analytic result to find iteratively the node minimizing the weighted reconstruction error, leading to a simplified iterative selection process. Experiments show that the proposed method achieves a significant performance gain for graph signals with weights on various graphs as compared with the previous novel selection techniques.

Efficient Sampling of Graph Signals with Reduced Complexity (저 복잡도를 갖는 효율적인 그래프 신호의 샘플링 알고리즘)

  • Kim, Yoon Hak
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.17 no.2
    • /
    • pp.367-374
    • /
    • 2022
  • A sampling set selection algorithm is proposed to reconstruct original graph signals from the sampled signals generated on the nodes in the sampling set. Instead of directly minimizing the reconstruction error, we focus on minimizing the upper bound on the reconstruction error to reduce the algorithm complexity. The metric is manipulated by using QR factorization to produce the upper triangular matrix and the analytic result is presented to enable a greedy selection of the next nodes at iterations by using the diagonal entries of the upper triangular matrix, leading to an efficient sampling process with reduced complexity. We run experiments for various graphs to demonstrate a competitive reconstruction performance of the proposed algorithm while offering the execution time about 3.5 times faster than one of the previous selection methods.

Adaptive DCT-Spatial Domain Image Up-Sampling (DCT 도메인과 공간 도메인의 적응적 이미지 업샘플링)

  • Kim, Jaehun;Kim, Kibaek;Jeong, Jechang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.394-397
    • /
    • 2012
  • 멀티미디어 장치와 사용자의 욕구가 다양해짐에 따라 이를 충족시키기 위하여 이미지 크기는 장치에서 지원하는 해상도나 사용자의 욕구에 맞게 조정되어야 한다. 이미지 업샘플링 방법은 크게 공간 도메인과 주파수 도메인에서 수행될 수 있다. 일반적으로 공간 도메인에서의 업샘플링 방법은 주파수 도메인의 업샘플링에 비해 상대적으로 주관적인 화질 측면에서 좋은 성능을 나타내지만 객관적인 성능이 낮다. 반대로 주파수 도메인에서의 업샘플링 방법은 객관적인 화질이 좋고 주관적인 화질 측면에서 상대적으로 성능이 낮게 나타난다. 본 논문에서는 공간 도메인과 주파수 도메인에서의 업샘플링 방법을 블록의 특성에 따라 적응적으로 업샘플링 방법을 선택하는 알고리듬을 제안한다. 제안하는 방법은 객관적 성능 뿐 아니라 주관적 성능까지도 향상 시킬 수 있다. 실험 결과를 통해 제안하는 알고리듬이 기존의 알고리듬에 비해 PSNR 측면에서 0.87dB~1.15dB 증가하고, 주관적 화질도 향상됨을 알 수 있다.

  • PDF

Accelerating the EM Algorithm through Selective Sampling for Naive Bayes Text Classifier (나이브베이즈 문서분류시스템을 위한 선택적샘플링 기반 EM 가속 알고리즘)

  • Chang Jae-Young;Kim Han-Joon
    • The KIPS Transactions:PartD
    • /
    • v.13D no.3 s.106
    • /
    • pp.369-376
    • /
    • 2006
  • This paper presents a new method of significantly improving conventional Bayesian statistical text classifier by incorporating accelerated EM(Expectation Maximization) algorithm. EM algorithm experiences a slow convergence and performance degrade in its iterative process, especially when real online-textual documents do not follow EM's assumptions. In this study, we propose a new accelerated EM algorithm with uncertainty-based selective sampling, which is simple yet has a fast convergence speed and allow to estimate a more accurate classification model on Naive Bayesian text classifier. Experiments using the popular Reuters-21578 document collection showed that the proposed algorithm effectively improves classification accuracy.

GA based Adaptive Sampling for Image-based Walkthrough (영상기반 항해를 위한 유전 알고리즘 기반 적응적 샘플링)

  • Lee, Dong-Hoon;Kim, Jong-Ryul;Jung, Soon-Ki
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.721-723
    • /
    • 2005
  • 본 논문에서는 영상 기반 항해를 위하여 최적의 영상 샘플링을 획득하기 위한 영상 샘플링 알고리즘을 제안한다. 이를 위해 초기 과다 샘플링 된 영상열의 입력으로부터 장면 전역에 걸쳐 적절한 렌더링 품질을 보장하는 최소의 샘플링을 선택하는 감소 샘플링(decremental sampling)의 접근 방법을 기반으로 본 문제를 Set Covering 문제로 공식화한다. 각 시점으로부터 최상의 영상 품질을 보장하는 영역을 3D 와핑 알고리즘을 사용하여 포함 영역으로 표현하여, 이렇게 표현된 Set Covering 문제는 유전 알고리즘을 사용하여 최적화 문제로 설계한다. 실험 결과 본 논문에서 제안한 방법을 통해 최적 해를 구함으로서 만족할 만한 영상 기반 항해의 결과를 얻을 수 있었다.

  • PDF

Classification using Hierarchical Sampling in Large Classification System (대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류)

  • Hong, SungMo;Jang, HeonSeok;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.51-55
    • /
    • 2017
  • 대규모 분류체계를 사용하는 경우, 기존 방법의 딥 러닝으로는 분류 정확도가 현저히 떨어진다. 이를 해결하기 위해 계층 구조를 활용한 네거티브 샘플링 방법을 제안한다. 학습 문서가 속한 카테고리의 상위 카테고리와 일정부분 겹치는 범위에서 네거티브 샘플을 선택하면, 하나의 큰 문제를 다수개의 하위 문제로 쪼개서 해결하는 학습 효과가 있다. 소규모 분류 체계와 대규모 분류체계 각각에서 샘플링 전략을 차용하였을 때를 비교한 결과, 대규모에서 효과가 좋았으며 그 때의 정확도가 150배 이상 차이가 나는 것을 보였다.

  • PDF

Classification using Hierarchical Sampling in Large Classification System (대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류)

  • Hong, SungMo;Jang, HeonSeok;Kang, Inho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.51-55
    • /
    • 2017
  • 대규모 분류체계를 사용하는 경우, 기존 방법의 딥 러닝으로는 분류 정확도가 현저히 떨어진다. 이를 해결하기 위해 계층 구조를 활용한 네거티브 샘플링 방법을 제안한다. 학습 문서가 속한 카테고리의 상위 카테고리와 일정부분 겹치는 범위에서 네거티브 샘플을 선택하면, 하나의 큰 문제를 다수개의 하위 문제로 쪼개서 해결하는 학습 효과가 있다. 소규모 분류 체계와 대규모 분류체계 각각에서 샘플링 전략을 차용하였을 때를 비교한 결과, 대규모에서 효과가 좋았으며 그 때의 정확도가 150배 이상 차이가 나는 것을 보였다.

  • PDF

Sparse Index Tracking Using Monte-Carlo Genetic Algorithm (몬테카를로 유전 알고리즘을 활용한 부분복제 지수 추종)

  • Yoon, Dong-Jin;Lee, Ju-Hong;Song, Jae-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.751-754
    • /
    • 2020
  • 본 논문은 지수를 추종하기 위해 유전 알고리즘에 몬테카를로 샘플링을 추가한 방법을 제안한다. 몬테카를로 샘플링을 통해 효율적으로 축소된 탐색공간을 탐험하는 유전 알고리즘은 최적의 종목들을 선택한다. 제안된 방법을 KOSPI200 지수 추종에 대하여 실험하였다. 제안된 방법이 몬테카를로 샘플링을 사용하지 않는 유전 알고리즘에 비해 지수 추종 오차가 더 낮고 더 빠르게 수렴하는 것을 보여주었다.

A Simple GMSK Modulator Using the Combined Gaussian Lowpass Filter and Integrator (가우시안 저역 통과 필터와 적분기를 결합시킨 간단한 GMSK 변조기)

  • 오성근;황병대
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.12B
    • /
    • pp.2039-2045
    • /
    • 2000
  • 본 논문에서는 계산이 간단한 두 가지의 GMSK (Gaussian minimum shift-keying) 변조기들을 제안한다. 제안된 방법들에서는 필터링과 적분과정의 순차적인 처리 대신에, 필터링되는 데이터 계열들에 따른 적분기 출력에서의 위상 성분들을 미리 구하고, ROM (read only memory)에 저장함으로써 계산량을 크게 줄일 수 있다. 첫 번째 방법에서는 필터링되는 심벌들에 따른 각 샘플시점에서의 위상 변화량들이 미리 계산되며, 위상 샘플 값은 필터에 입력되는 데이터 계열에 의한 샘플시점에서의 총 위상 변화량을 구하여 누적함으로써 얻어진다. 두 번째 방법에서는 입력되는 모든 가능한 데이터 계열들에 따른 모든 샘플시점에서의 총 위상 변화량들을 미리 구하여 ROM에 저장하며, 위상 샘플 값은 입력되는 데이터 계열에 따라 샘플시점에 해당하는 총 위상 변화량을 선택하여 누적함으로써 얻어진다. 또한, 두 번째 방법에서는 데이터 계열의 패턴에 따른 총 위상 변화량들의 대칭적인 성질을 이용함으로써 필요한 메모리량을 줄일 수 있다.

  • PDF