• 제목/요약/키워드: 클리스터링

검색결과 9건 처리시간 0.026초

함수 변환과 FFT에 기반한 조정자가 없는 XML 문서 클러스터링 기법 (An Unsupervised Clustering Technique of XML Documents based on Function Transform and FFT)

  • 이호석
    • 정보처리학회논문지D
    • /
    • 제14D권2호
    • /
    • pp.169-180
    • /
    • 2007
  • 본 논문은 함수 변환(Function Transform)과 FFT(Fast Fourier Transform)를 사용하는 새로운 XML 문서 클리스터링 기법에 대하여 논한다. 본 문서 클러스터링 기법은 조정자 없이 점진적으로 수행된다. XML 문서는 엘리먼트의 계층적인 구조에 기반하여 이산 함수로 변환된다. 이산 함수는 FFT를 사용하여 벡터로 변환된다. 문서를 나타내는 벡터는 가중치 유클리디안 거리 메트릭을 사용하여 비교된다. 비교 결과가 미리 정의된 값보다 작을 때에는 비교되는 두 개의 문서는 구조적으로 비슷한 것으로 간주되어 동일한 그룹으로 분류된다. XML 문서 클리스터링은 XML 문서의 저장과 검색에 유용하게 사용될 수 있다. 800개의 합서 문서와 520개의 실제 문서를 사용하여 실험하였다. 실험 결과는 함수변환과 FFT는 XML 문서를 엘리먼트의 구조를 기반으로 하여 점진적으로 조정자 없이 효과적으로 분류하는 것을 보여주었다.

무선 센서 네트워크에서 노드 밀도를 고려한 효율적인 클러스터링 알고리즘 (An Efficient Clustering Algorithm Considering Node Density in Wireless Sensor Networks)

  • 김창현;김건우;이원주;전창호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.301-304
    • /
    • 2009
  • 무선 센서 네트워크는 제한된 에너지로 동작하는 다수의 센서 노드로 구성되기 때문에 효율적으로 에너지를 사용 것이 중요하다. 기존의 클러스터 기반 알고리즘은 지역적으로 인접한 다수의 노드들을 클러스터로 구성하고 멤버 노드로부터 수신된 데이터를 병합하여 전송함으로써 에너지 소모를 줄였다. 하지만 클러스터링 과정에서 노드의 밀도를 고려하지 않았기 때문에 불균등한 노드 분포상에서 데이터 병합의 효과를 얻을 수 없는 클러스터를 생성할 수 있다. 따라서 본 논문에서는 클러스터링과정에 노드의 밀도를 고려하여 데이터 병합 효과를 최대화하고, 에너지 소모를 줄일 수 있는 새로운 클러스터링 알고리즘을 제안한다.

  • PDF

대용량 데이터베이스에서 클러스터링을 이용한 빈발 패턴 생성 (Creation of Frequent Patterns using Clustering in Large Database)

  • 김의찬;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.100-102
    • /
    • 2005
  • 데이터베이스에 저장되어 있는 데이터들을 통해서 의미있는 정보를 찾는 것이 데이터 마이닝이다. 많은 데이터 마이닝 기법들 중에 연관규칙을 다루는 연구가 많이 이루어지고 있다. 연관규칙 기법도 다양하게 연구되고 있는데 그 중 빈발 패턴 트리(FP-Tree)라는 방법을 이용하여 빈발 패턴을 찾아내는 연구가 활발히 진행되고 있다. 빈발 패턴 트리는 기존에 잘 알려져있는 연관규칙 생성 기법인 Apriori 기법보다 우수한 성능을 가지는 방법이다. 그러나 빈발 패턴 트리도 몇가지 문제점을 가지고 있다. 본 논문에서는 빈발 패턴 트리의 문제점 중 하나인 과도한 FP-Tree 생성을 줄이려 한다. 조건부 패턴 베이스를 통해 얻어지는 조건부 FP-Tree의 생성을 줄여 기존의 FP-Tree보다 더 나은 성능을 얻기 위해서 적절한 클리스터링을 이용하려 한다. 클러스터링 기법은 비트 트랜잭션을 이용한 클러스터링 방법을 이용한다.

  • PDF

3단계 과정의 장면 전환검출 (Scene Change Detection with 3-Step Process)

  • 신성윤;이양원
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.147-154
    • /
    • 2008
  • 본 논문에서는 우선 $X^2$ 히스토그램과 컬러 히스토그램을 합성한 방법과 정규화를 통하여 프레임 간 차이값을 계산한다. 다음으로 거리에 대한 클러스터링과 k-mean 군집화를 이용하여 클러스터의 대표 프레임을 결정한다. 마지막으로 우도비를 이용하여 그룹의 대표 프레임을 결정한다. 제안한 방법은 차이값 계산, 클리스터링과 군집화, 대표 프레임 추출의 3단계 과정을 수행하므로 다른 방법보다 검출이 뛰어나다는 것을 실험을 통해 알 수 있다.

  • PDF

유사성 체크 방법을 이용한 Fuzzy Rule선택 Genetic Algorithm에 관한 연구 (A Study on the Choice of Fuzzy Rule Genetic Algorithm Using Similarity Check Method)

  • 강전근;김명순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.731-734
    • /
    • 2017
  • GA(Genetic Algorithm)는 자연계 진화 과정의 적자생존의 유전적 부호화 및 처리과정을 모델링함으로서 해석적으로 처리하기 힘든 문제의 최적화에 널리 이용하고 있으며, 퍼지제어에서 룰의 선택에도 적용된다. 본 논문에서는 일반적인 GA방법에 자료의 유사성을 체크하는 방법을 도입하여 Fuzzy Rule선택 환경에 적용하고 시뮬레이션을 통해 이를 확인한다. 시뮬레이션 결과 제안된 SFRGA(Similarity Fuzzy Rule Genetic Algorithm)방법은 일반적 GA방법보다 단축된 지연시간 효과와 부수적으로 조기포화 현상(premature convergence)의 감소 및 자동 배정 퍼지 클리스터링(Fuzzy clustering)의 가능성을 얻을 수 있었다.

링 구조 다중프로세서 시스템에서 링 대역폭 확장을 위한 효율적인 방안 (Efficient Schemes for Scaling Ring Bandwidth in Ring-based Multiprocessor System)

  • 장병순;정성우;장성태;전주식
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권2호
    • /
    • pp.177-187
    • /
    • 2000
  • 최근 몇 년간 클리스터링 기반 다중 프로세서 시스템에서의 상호 연결망으로서의 버스의 제약을 극복하기 위한 단방향 지점간 링크를 이용한 링 구조가 제안되었다. 하지만 계속되는 프로세서의 고속화와 지역 버스 및 메모리의 고성능화로 인해 지점간 링크의 현재 표준 대역폭으로는 시스템 확장성에 한계를 보이며 이에 따라 대역폭 확장에 대한 연구가 필요하다. 본 논문에서는 클리스터링 기반 다중프로세서 시스템으로 개발된 PANDA 시스템을 기본 모델로 채택한다. 최근 대중화된 프로세서 및 지역 버스의 사양을 반영한 모의실험을 통해 현재의 지점간 링크가 전체 시스템 성능에 병목이 됨을 보여주고 두 배 이상의 대역폭 확장이 필요함을 보인다. 상호 연결망의 대역폭을 확장하기 위해, 두 배 증가된 대역폭을 지닌 새로운 링크를 개발하는 것은 과다한 설계비용과 개발시간이 요구된다. 이에 대한 대안으로 본 논문에서는 상용화되어있어 쉽게 적용 가능한 기존 IEEE 표준 대역폭을 가진 링크를 이용해 이중으로 링을 구성하는 몇 가지 방법 단순 이중 링, 트랜잭션 분리 이중 링, 방향 분리 이중 링 - 을 제시하고 모의실험을 통해 두 배 대역폭 단일 링과 더불어 각각의 방식에 대한 장단점을 분석한다.

  • PDF

국제특허분류 클러스터링을 이용한 특허 검색 시스템 (Patent Search System Using IPC Clustering)

  • 김한기;이석형;윤화묵
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.103-106
    • /
    • 2007
  • 지적재산권의 중요성이 커지면서 특허 검색을 이용하는 일반 사용자의 숫자가 늘어나고 있다. 일반적으로 한 두개의 키워드만을 사용하는 일반 사용자의 검색 패턴을 고려할 때, 대량의 특허 문서에서 원하는 검색 결과를 찾는 일은 쉽지 않은 일이다. 이에 모든 특허 문서에서 제공되는 국제 특허 분류(IPC) 정보를 사용해서 사용자의 검색 결과를 클리스터링하여 보여주어 사용자가 검색하고자 하는 검색범위를 손쉽게 제한 할 수 있도록 도와주어 원하는 결과를 좀 더 빠르게 찾을 수 있는 특허 검색 시스템을 소개하고자 한다.

  • PDF

개념 상승과 속성의 최적 감축에 의한 결정 규칙의 생성 (Generation of Decision Rules Bsed on Concept Ascension and Optimal Reduction of Attributes)

  • 정환묵
    • 한국지능시스템학회논문지
    • /
    • 제9권4호
    • /
    • pp.367-374
    • /
    • 1999
  • 본 논문은 대규모 데이터베이스에서 의사 결정을 위한 지식을 효율적으로 추출하기 위해 개념 상승과 속성 감축에 기반한 통합적 방법을 제안한다. 본 방법은 클리스터링 기법에 의해 개념 트리를 자동생성하고 개념 상승기법에 의해 데이터 베이스를 일반화하며 속성의 중요도를 사용한 속성 감축에 의해 최적감축을 하고 식별가능 행렬과 함수를 사용하여 효율적으로 속성값을 감축하여 최적의 최소결정 규칙을 유도한다. 본 방법은 투자 계획이나 가격 결정과 같은 의사결정 업무 각종 고장 진단이나 의료 진단을 위한 지식 베이스구축 마케팅 분석이나 실험 데이터 분석 고수준의 질의 에 의한 정보검색 등에 효과적으로 사용될수 있다.

  • PDF

퍼지 클러스터링 기반의 국소평가 유전자 알고리즘 (Partially Evaluated Genetic Algorithm based on Fuzzy Clustering)

  • 유시호;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1246-1257
    • /
    • 2004
  • 유전자 알고리즘은 원하는 최적해를 찾기 위해서 개체 집단의 크기를 가능한 크게 유지하여야 한다. 하지만 실제 문제에서 개체의 적합도를 평가하는 것이 어려운 경우가 많기 때문에 큰 집단의 모든 개체에 대하여 적합도를 평가하는 것은 많은 시간과 비용을 요구한다. 이에 본 논문에서는 집단의 크기를 크게 유지하되 클러스터링에 의해 대표 개체만을 평가함으로써 효율을 높이는 퍼지 글러스터링 기반의 국소 평가 유전자 알고리즘을 제안한다. 나머지 개체들은 대표 개체로부터 간접적으로 적합도를 분배받는다. 다수의 집단에 소속되는 개체들의 경우, 하드 클러스터링 방법으로는 정확한 적합도 분배를 하기 어렵기 때문에 퍼지 c-means 알고리즘을 사용하였고, 클러스터 결과인 퍼지 소속 행렬에 의해 적합도를 배분하였다. 9개의 벤치마크 적합도 함수에 대하여 6가지 하드 클러스터링 알고리즘을 적용한 유클리디안 거리와 피어슨 상관계수에 의한 적합도 배분 방법과 본 논문에서 제안하는 방법을 비교 실천한 결과, 제안한 방법의 우수한 성능을 확인할 수 있었다.