• 제목/요약/키워드: 샘플링집합 선택

검색결과 12건 처리시간 0.024초

가중치를 갖는 그래프신호를 위한 샘플링 집합 선택 알고리즘 (Sampling Set Selection Algorithm for Weighted Graph Signals)

  • 김윤학
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.153-160
    • /
    • 2022
  • 그래프신호가 각각의 가중치를 갖고 발생하는 경우 그래프상의 최적의 샘플링 노드집합을 선택하는 탐욕알고리즘에 대해 연구한다. 이를 위해 가중치를 반영한 복원오차를 비용함수로 사용하고 여기에 QR 분해를 적용하여 단순한 형태로 전개한다. 이렇게 도출된 가중치 복원오차를 최소화하기 위해 다양한 수학적 증명을 통해 반복적으로 노드를 선택할 수 있는 수학적 결과식을 유도한다. 이러한 결과식에 기반하여, 노드를 선택하는 샘플링 집합 선택알고리즘을 제안한다. 성능평가를 위해 다양한 그래프에서 발생하는 가중치를 갖는 그래프신호에 적용하여 기존 샘플링 선택 기술대비, 복잡도를 유지하면서 가중치 신호의 복원성능이 우수함을 보인다.

임의의 그래프신호를 위한 고속 샘플링 집합 선택 알고리즘 (Fast Sampling Set Selection Algorithm for Arbitrary Graph Signals)

  • 김윤학
    • 한국전자통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1023-1030
    • /
    • 2020
  • 임의의 그래프 신호를 복원하기 위해 그래프상의 일부 노드로 구성된 샘플링 집합내의 노드들의 신호값만을 사용하게 되는 경우, 이를 위한 최적의 샘플링 집합 선택 문제에 대해 연구한다. 고도의 계산량을 요구하는 고유값 분해 (eigen decomposition)를 사용하지 않고, 노드를 선택하는 과정에서의 신호 변화값의 차이를 비용함수로 제시한다. 구체적으로, 기존 방식의 비용함수인 신호 복원오차를 최소화하는 대신에 본 연구에서는 신호 변화값의 차이를 비용함수로 채택하여 이를 최소화하는 간단하고 고속의 탐욕 (greedy) 샘플링 집합선택 알고리즘을 제안한다. 기존의 고속알고리즘과 성능평가 비교를 위해 다양한 그래프 신호에 대한 폭넓은 실험을 진행하여, 기존 방식 대비 신호복원 성능감소를 약 7% 이내로 유지하면서 실행시간을 10배이상으로 단축하였음을 보인다.

저 복잡도를 갖는 효율적인 그래프 신호의 샘플링 알고리즘 (Efficient Sampling of Graph Signals with Reduced Complexity)

  • 김윤학
    • 한국전자통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.367-374
    • /
    • 2022
  • 그래프 노드상에서 발생하는 그래프 신호의 일부를 선택해서 만든 샘플링 신호로부터 원신호를 복원하기 위해, 복원오차를 최소화하기 위한 최적의 샘플링 집합을 선택하는 알고리즘에 관해 연구한다. 복잡도 개선을 위해 복원오차를 직접적으로 최소화하는 대신에, 복원오차의 상한값을 비용함수로 사용하고, QR분해 적용을 통해 발생하는 상삼각행렬의 대각선상에 위치하는 값으로 샘플링을 결정할 수 있게 하는, 저 복잡도를 갖는 반복적 탐욕알고리즘을 제안한다. 기존의 샘플링 선택 방법과 비교하여, 제안 알고리즘이 복원 성능 저하를 평균 5%미만으로 유지하면서, 약 3.5배 빠른 실행시간을 보임을 다양한 그래프 상황에서 실험을 통해 확인한다.

대역폭 제한 그래프신호를 위한 저 복잡도 샘플링 집합 선택 알고리즘 (Low-complexity Sampling Set Selection for Bandlimited Graph Signals)

  • 김윤학
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1682-1687
    • /
    • 2020
  • 대역폭 제한 그래프신호의 신호복원을 위해서 최대의 정보를 제공하기 위한 그래프 상의 노드를 선택하는 샘플링 집합 선택 알고리즘에 대해 연구한다. 저 복잡도 선택알고리즘을 구현하기 위해 직접적인 비용함수인 신호 복원오차를 최소화 하는 대신, 신호 복원오차의 최대값을 최소화하는 방법에 대해 집중한다, 이를 위해, 추가적인 복잡도 개선을 위해 유용한 근사화공식을 적용하여 성능손실을 최소화하면서 복잡도를 개선한 저 복잡도 탐욕알고리즘을 제안한다. 다양한 그래프신호에 대한 폭넓은 실험을 통해, 기존 저 복잡도 방식과 신호복원성능 및 복잡도를 평가 비교하여 기존방식대비 신호복원 및 복잡도면에서 모두 성능 개선이 있음을 보였으며, 이는 실시간 응용분야에서 실용적인 해결방식으로써 경쟁력 있는 대안을 제시한다.

나이브베이즈 문서분류시스템을 위한 선택적샘플링 기반 EM 가속 알고리즘 (Accelerating the EM Algorithm through Selective Sampling for Naive Bayes Text Classifier)

  • 장재영;김한준
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.369-376
    • /
    • 2006
  • 본 논문은 온라인 전자문서환경에서 전통적 베이지안 통계기반 문서분류시스템의 분류성능을 개선하기 위해 EM(Expectation Maximization) 가속 알고리즘을 접목한 방법을 제안한다. 기계학습 기반의 문서분류시스템의 중요한 문제 중의 하나는 양질의 학습문서를 확보하는 것이다. EM 알고리즘은 소량의 학습문서집합으로 베이지안 문서분류 알고리즘의 성능을 높이는데 활용된다. 그러나 EM 알고리즘은 최적화 과정에서 느린 수렴성과 성능 저하 현상을 나타내는데, EM 알고리즘의 기본 가정을 따르지 않는 온라인 전자문서환경에서 특히 그러하다. 제안 기법의 주요 아이디어는 전통적 EM 알고리즘을 개선하기 위해 불확정성도 기반 선택적 샘플링 기법을 활용한 것이다. 성능평가를 위해 Reuter-21578 문서집합을 사용하여, 제안 알고리즘의 빠른 수렴성을 보이고 전통적 베이지안 알고리즘의 분류 정확성을 향상시켰음을 보인다.

중첩 클러스터를 이용한 피드백 문서의 재샘플링 기법 (Resampling Feedback Documents Using Overlapping Clusters)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.247-256
    • /
    • 2009
  • 대부분의 잠정적 적합피드백기법들은 질의에 대해 검색된 상위검색문서들이 적합하다고 가정하고, 그 문서들을 질의 확장을 위한 피드백 문서로 이용하고 있다. 그러나 초기검색결과에는 상당한 양의 부적합 문서를 포함하고 있는 것이 현실이다. 이 논문에서는 보다 좋은 피드백 문서를 선택하기 위해서 중첩클러스터를 이용한 피드백문서의 재샘플링 기법을 제안한다. 주요 아이디어는 질의 중심적인 초기검색문서집합에 대해서 중첩이 허용된 문서클러스터를 이용하여 문서들 사이의 관계를 반영하여 질의에 핵심역할을 하는 지배적 문서를 찾고, 이 문서들을 반복적으로 피드백 하여 질의가 내포하는 핵심 주제를 강조하는 것이다. 대규모 실험집합인 TREC GOV2와 WT10g에 대한 실험비교에서, 최근 잠정적 적합피드백 기법들 중에서 가장 좋은 성능을 보이고 있는 적합모델보다 재샘플링기법이 우수한 성능향상을 보였다. 제안기법에 대한 검증을 위해서 피드백문서에 포함된 적합문서의 정도를 나타내는 적합밀도를 측정하였다. 재샘플링 기법이 TREC 실험집합에 대해서 적합모델에 비해 높은 적합밀도를 보였고, 이 결과 적합피드백에서 검색성능을 향상시키게 되었다. 이는 제안 기법이 잠정적 적합피드백에서 유효한 방법임을 알 수 있다.

임계값 적용에 기반한 저 복잡도 그래프 신호 샘플링 알고리즘 (Low-Complexity Graph Sampling Algorithm Based on Thresholding)

  • 김윤학
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.895-900
    • /
    • 2023
  • 그래프에서 전체 노드중 일부 노드를 선택하고 선택된 노드에서 발생하는 신호로부터 원 신호를 복원하는 저 복잡도를 갖는 샘플링 기술에 대해 연구한다. 이를 위해, 매 단계에서 한 개의 노드를 선택하는 탐욕 알고리즘을 기반으로, 기존의 방식인 최소 비용값을 갖는 노드를 찾기 위해 전체노드를 탐색 및 계산하는 방식을 취하지 않고 임계값을 설정하여 임계값 이하의 값을 갖는 노드를 선택하도록 하여 탐색 및 비용함수 계산비용을 줄이는 방식을 제안한다. 복원성능 저하를 막기 위해 정확한 임계값 설정이 요구되며, 이를 위해 임계값을 구하기 위한 매 단계에서 샘플링 집합 크기와의 관계식을 정립한다. 다양한 그래프상에서 복원성능 및 복잡도 (실행시간) 평가를 수행하여, 기존 방식 대비 복원성능을 유지하면서 평균 1.3배 이상 빠른 실행시간이 보임을 확인했다.

확장 가능한 요소선택방법을 위한 분석적 접근 (Analytical Approach for Scalable Feature Selection)

  • 양재경;이태한
    • 산업경영시스템학회지
    • /
    • 제29권2호
    • /
    • pp.75-82
    • /
    • 2006
  • 본 연구에서 조합 최적화(Combinatorial Optimization) 이론에 바탕을 두고 있는 네스티드 분할(Nested Partition, 이하 NP) 방법을 이용한 최적화 기탄 요소선택 방법(Feature Selection)을 제안한다. 이 새로운 방법은 좋은 요소 부분집합을 찾는 휴리스틱 탐색 절차를 채용하고 있으며 데이터의 인스턴스(Instances 또는 Records)의 무작위 추출(Random Sampling)을 이용하여 이 요소선택 방법의 처리시간 관점에서의 성능을 항상 시키고자 한다. 이 새로운 접근 방법은 처리시간 향상을 위해 2단계 샘플링 방법을 채용하여 근접 최적해로의 수렴(Convergence)을 보장하는 샘플 사이즈를 결정한다. 이는 앨고리듬이 유한한 시간내에 끝이날 때 최종 요소 부분집합 해의 질(Qualtiy)에 관한 정확한 설명을 할 수 있는 이론적인 배경을 제시한다. 중요 결과를 예시하기 위해서 다양한 형태의 다섯 개의 데이터 셋을 이용하였으며 다섯 번의 반복 실험을 통한 실험 결과가 제시되며, 이 새로운 접근 방법이 기존의 단순 네스티드 분할 방법 기반의 요소선택 방법보다 처리시간 관점에서 더욱 효율적임을 보여준다.

도계육의 시료 채취방법에 따른 세균의 검출량 비교

  • 윤혜숙
    • 식품기술
    • /
    • 제18권1호
    • /
    • pp.127-135
    • /
    • 2005
  • 상업적으로 시판되는 10주 미만의 식용 영계육을 처리하는 공정에서 25 그룹의 내장적출하지 않은 것 또는 내장적출한 도계육을 도계공정의 네지점에서 채취하였다. 도계 공정 각 지점의 계육으로부터 무작위로 선택된 부위에서 껍질을 잘라낸 것, 목의 껍질을 잘라낸 것, 셀룰로스 아세테이트 스폰지 재질의 스왑봉으로 계육을 스왑법으로 채취한 것, 또는 도계육을 통째로 세척한 세척액이다. 총균수, 대장균군, 대장균을 각 시료로부터 증균하였다. 사방 1 cm 안의 평균 로그값(log A)과 사방 25cm안에서 측정된 전체 측값치들의 로그값(N)은각 그룹 당 25개였다. 동일한 처리공정 단계에서 얻은 계육으로부터 얻은 같은 그룹의 세균의 측정값의 경우에, 무작위로 선택한 부위에서 잘라낸 껍질 또는 목에서 벗겨낸 껍질, 세척액 샘플에서 측정한 균수의 집합인 N의 세 값 또는 log A의 세 값은 <0.5 logunit 차이였다.그러나 스왑법으로 측정한 사방 1 cm안의 평균로그값(log A)과 사방 25 cm 안에서 측정된 전체측정치의 로그값(N)의 대략 절반이 다른 방법들로 측정한 동일한 측정항목의 값과 >0.5 log unit 까지 차이가 났다. 이런 결과로부터 도계육에서 무작위로 선택한 부위나 목에서 껍질을 잘라내는 방법, 또는 세척액 채취 등의 샘플링 방법은 도계육 표면의 단위영역 당 유사한 양의 세균이 검출될 것이라는 것을 나타낸다.

  • PDF

계층적 군집화를 이용한 능동적 학습 (Active Learning based on Hierarchical Clustering)

  • 우호영;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.705-712
    • /
    • 2013
  • 능동적 학습(active learning)은 소수의 라벨 데이터로 구성된 훈련 집합이 주어진 경우에 분류기 학습에 가장 도움이 될 만한 언라벨드 데이터를 선택하여 전문가에 의한 라벨링을 통해 훈련 집합에 포함시키는 과정을 반복함으로써 분류기의 성능을 향상시키는 것을 목적으로 한다. 본 논문에서는 워드 연결(ward's linkage)을 이용한 계층적 군집화(hierarchical clustering)를 바탕으로 한 능동적 학습 방법을 제안한다. 제안된 방법은 각 군집에서 적어도 하나의 샘플을 포함하도록 초기 훈련 집합을 능동적으로 구성하거나 또는 기존의 훈련 집합을 확장함으로써 전체 데이터 분포를 반영할 수 있게 한다. 기존의 능동적 학습 방법들 중 대부분은 초기 훈련 집합이 주어져 있을 경우를 가정하는 반면에 제안하는 방법은 초기 클래스 정보를 가진 훈련 데이터가 주어지지 않은 경우와 주어진 경우에 모두 적용 가능하다. 실험을 통하여 제안하는 방법이 비교 방법들에 비해 분류기 성능을 크게 향상시킬 수 있는 효과적인 데이터 선택을 수행함을 보인다.