• 제목/요약/키워드: 클러스터 추정

검색결과 101건 처리시간 0.028초

DNA chip 통합분석 프로그램을 이용한 효모의 세포주기 유전자 발현 통합 데이터의 분석 (Analysis of Combined Yeast Cell Cycle Data by Using the Integrated Analysis Program for DNA chip)

  • 양영렬;허철구
    • KSBB Journal
    • /
    • 제16권6호
    • /
    • pp.538-546
    • /
    • 2001
  • 효모의 세포주기 관련 유전자 발현 통합 데이터를 사용하여 본 연구실에서 개발한 유전자 발현 통합 분석프로그램을 사용하여, 클러스터링 알고리즘의 성능을 비교하고 데이터내에 존재하는 클러스터 개수를 추정하기 위해 FOM 분석을 적용하였으며, 이 분석방법을 통하여 K-means, SOM, Fuzzy c-means 클러스터링 방법의 성능을 서로 비교하였다. 클러스터 개수를 추정한 다음 3가지 클러스터링 방법에 대한 클러스터링 결과 비교, 클러스터의 기능할당 및 모티프 분석을 시도하였다. 본 논문에서 제시하는 분석 방법은 DNA chip 발현 데이터의 일반적인 분석방법을 유전자 발현 패턴의 유사성을 토대로 한 클러스터링 방법에 근간을 두고 있다. 본 논문에서는 클러스터링한 후 각 클러스터의 기능할당 및 모티프 분석에 대한 일반적인 분석방법을 제시하였으며, 본 연구실에서 개발한 유전자 발현분석 통합 프로그램이 효율적으로 사용될 수 있음을 보여주고 있다.

  • PDF

Possibilistic Fuzzy C-Means 클러스터링 알고리즘의 확장 (Extension of the Possibilistic Fuzzy C-Means Clustering Algorithm)

  • 허경용;우영운;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.423-426
    • /
    • 2007
  • 클러스터링은 주어진 데이터 포인트들을 주어진 개수의 그룹으로 나누는 비지도 학습의 한 방법이다. 클러스터링의 방법 중 하나로 널리 알려진 퍼지 클러스터링은 하나의 포인트가 모든 클러스터에 서로 다른 정도로 소속될 수 있도록 함으로써 각 포인트가 하나의 클러스터에만 속할 수 있도록 하는 K-means와 같은 방법에 비해 자연스러운 클러스터 형태의 유추가 가능하고, 잡음에 강한 장점이 있다. 이 논문에서는 기존의 퍼지 클러스터링 방법 중 소속도(membership)와 전형성(typicality)을 동시에 계산해 낼 수 있는 Possibilistic Fuzzy C-Means (PFCM) 방법에 Gath-Geva (GG)의 방법 을 적용하여 PFCM을 확장한다. 제안한 방법은 PFCM의 장점을 그대로 가지면서도, GG의 거리 척도에 의해 클러스터들 사이의 경계를 강조함으로써 분류 목적에 적합한 소속도를 계산할 수 있으며, 전형성은 가우스 형태의 분포에서 생성된 포인트들의 분포 함수를 정확하게 모사함으로써 확률 밀도 추정의 방법으로도 사용될 수 있다. 또한 GG 방법은 Gustafson-Kessel 방법과 달리 클러스터에 포함된 포인트의 개수가 확연히 차이 나는 경우에도 정확한 결과를 얻을 수 있다는 사실을 실험 결과를 통해 확인할 수 있었다.

  • PDF

클러스터링 균형을 사용하여 최적의 클러스터 개수를 결정하기 위한 효율적인 휴리스틱 (An efficient heuristics for determining the optimal number of cluster using clustering balance)

  • 이상욱
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.792-796
    • /
    • 2009
  • 데이터 클러스터링 분야에서 최적의 클러스터 개수를 추정하는 것은 매우 중요한 일이다. 그것은 클러스터링의 적합성을 판단할 기준을 정하고 그 적합성을 극대화 하는 최적의 클러스터의 개수를 찾는 것이다. 본 논문에서는 클러스터의 적합성을 판단할 기준으로써 클러스터링 균형을 사용하여 최적의 클러스터 개수를 찾기 위한 효율적인 휴리스틱 방법을 제안하였다. k-means 사용하여 가상 및 실제 데이터 셋에 적용한 결과, 제안한 알고리즘이 계산효율 측면에서 우수함을 확인할 수 있었다.

  • PDF

서버 클러스터 환경에서 에너지 절약을 위한 향상된 서버 전력 소비 추정 모델 (An Improved Estimation Model of Server Power Consumption for Saving Energy in a Server Cluster Environment)

  • 김동준;곽후근;권희웅;김영종;정규식
    • 정보처리학회논문지A
    • /
    • 제19A권3호
    • /
    • pp.139-146
    • /
    • 2012
  • 서버 클러스터 환경에서 에너지 절약을 위한 방법 중 하나는 서버의 전원을 트래픽 상황에 맞게 제어하는 전원 제어 기술이다. 이는 현재 데이터 센터의 전체 에너지 사용량과 각 서버의 에너지 사용량을 파악하여 적절하게 ON/OFF 상태로 관리하는 기술이다. 이를 위해서 각 서버의 전력을 효과적으로 추정하는 방식이 필요한데, 본 논문에서는 비용 면과 에너지 면에서 효율적인 소프트웨어 방식의 추정 모델을 사용하여 전력을 추정한다. 또한 기존의 전력 추정 모델은 CPU의 유휴(idle) 사용량만을 사용함으로써 현재 서버의 세부적인 CPU 상태나 I/O 장치의 사용량을 정확히 파악하지 못하고, 이는 해당 서버의 전력을 효과적으로 추정하지 못하는 단점으로 이어진다. 본 논문에서는 CPU의 다양한 상태 필드를 활용하여 서버의 CPU 및 시스템의 전반적인 상태를 보다 정확히 파악하고, 이에 따라 서버의 전력을 기존의 두 소비전력 추정 모델(CPU/디스크/메모리 기반의 전력 소비 추정 모델 및 CPU 유휴값 기반의 전력 소비 추정 모델)보다 정확히 측정하는 CPU 필드(field) 기반의 전력 추정 모델을 제안한다. 2대의 서버를 사용하여 실험을 수행하였으며, 전력계를 통해 측정한 실제 전력과 각 추정 모델의 추정 값을 비교하여 평균 오차율을 계산하였다. 실험 결과 기존 소비전력 추정 모델이 평균 8-15%대의 오차율을 보이는 반면, 본 논문에서 제안하는 서버 전력 추정 모델은 2%대의 오차율을 보여 주었다.

경계 차감 클러스터링에 기반한 클러스터 개수 추정 화자식별 (Speaker Identification with Estimating the Number of Cluster Based on Boundary Subtractive Clustering)

  • 이윤정;최민정;서창우;한헌수
    • 한국음향학회지
    • /
    • 제26권5호
    • /
    • pp.199-206
    • /
    • 2007
  • 본 논문에서는 화자식별을 위한 특징벡터의 새로운 클러스터링 방법을 제안한다. 제안된 방법은 클러스터 센터에 대한 초기값 설정과 클러스터 개수에 대한 사전 정보 없이 클러스터링이 가능하다. 각 클러스터 센터는 경계 차감 클러스터링 알고리즘으로 한 번에 한 개의 클러스터 센터가 추가됨으로써 순차적으로 구해지며, 클러스터 개수는 클러스터간의 상호관계를 조사하여 결정된다. 인공 생성 데이터 및 TIMIT 음성을 이용하여 실험한 결과로부터 제안된 방법이 기존의 방법보다 우수함을 확인하였다.

이동 Ad-hoc 통신을 위한 지능형 거리추정 클러스터방식 (Clustering Technique of Intelligent Distance Estimation for Mobile Ad-hoc Network)

  • 박기홍;신성윤;이양원;이종찬;이진관;장혜숙
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.105-111
    • /
    • 2009
  • 본 논문에서는 차량 간 안전통신을 위하여 다중홉 클러스터링 방식의 문제점을 개선하여, 거리를 계산한 지능형 클러스터링(Intelligence Cluster) 기법을 제안하고자 한다. 고속 이동시 연계성이 없는 차량간에 거리를 계산하여 클러스터링을 하게 되면 설정된 거리 값으로 각 노드들의 연계성이 형성되게 된다. 동일 구성원이 된 노드들 사이에서 거리 값으로 헤더를 선출하게 되고 헤더는 멤버가 된 노드들에게 그룹 내 정보를 전달하게 된다. 헤더 선출 후, 이동성으로 인해 헤더가 이탈되면 긴급상황이 발생될 수 있다. 이때 정보전달은 패킷에 포함된 프로그램의 실행으로 노드에서 제공하는 지능형 클러스터를 이용하여 새로운 클러스터 헤더를 선출하여 전송할 수 있도록 하였다. 본 논문에서는 기존의 Store-and-Forward 라우팅 방식에 컴퓨팅 능력을 추가한 Store-Compute-Forward 방식으로 클러스터를 선출하는 이동 Ad-hoc 통신을 위한 지능형 거리추정 클러스터방식을 제안한다. 논문에서 제안한 이동 Ad-hoc 통신을 위한 지능형 거리추정 클러스터방식은 능동적이고 지능적인 멀티 홉 클러스터 라우팅 프로토콜로서 안정된 통신이 이루어 질 수 있도록 한다.

단어 의미 표현과 질병 중심 의학 문서 클러스터 기반 의학 문서 검색 기법 (Method of Document Retrieval Using Word Embeddings and Disease-Centered Document Clusters)

  • 조승현;이경순
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.51-55
    • /
    • 2016
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질병중심 문서 클러스터와 단어 의미 표현을 이용하여 질의 확장 및 문서를 재순위화하는 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출하고 의학 인과 관계를 구축한다. 또한, 위키피디아에 나타나는 의학 용어들에 대하여 단어의 효율적인 의미 추정 기법을 이용하여 질병 어휘의 의미 표현 벡터를 구축하고 임상 인과 관계를 이용하여 질병 중심 문서 클러스터를 구축한다. 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 이후 질의와 관련된 병명과 단어 의미 표현을 이용하여 확장 질의를 선택한다. 또한, 질병 중심 문서 클러스터를 이용하여 문서 재순위화를 진행한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014, 2015 테스트 컬렉션에 대해 비교 평가한다.

  • PDF

개선된 Quantum 클러스터링을 이용한 자동적인 퍼지규칙 생성 및 비선형 회귀로의 응용 (An Automatic Fuzzy Rule Extraction using an Advanced Quantum Clustering and It's Application to Nonlinear Regression)

  • 김승석;곽근창
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.182-183
    • /
    • 2007
  • 본 논문에서는 전형적인 비선형 회귀문제를 다루기 위해 슈뢰딩거 방정식에 의해 표현되는 Hilbert공간에서 수행되는 Quantum 클러스터링과 Mountain 함수를 이용하여, 수치적인 입출력데이터로부터 TSK 형태의 자동적인 퍼지 if-then 규칙의 생성방법을 제안한다. 여기서 슈뢰딩거 방정식은 분석적으로 확률함수로부터 유도되어질 수 있는 포텐셜 함수를 포함한다. 이 포텐셜의 최소점들은 데이터의 특성을 포함하는 클러스터 중심들과 관련되어진다. 그러나 이들 클러스터 중심들은 데이터의 수와 같으므로 퍼지 규칙을 생성하기 어려울 뿐만 아니라 수렴속도가 느린 문제점을 가지고 있다. 이러한 문제점들을 해결하기 위해서, 본 논문에서는 밀도 척도에 기초한 클러스터 중심의 근사적인 추정에 대해 간단하면서 효과적인 Mountain 함수를 이용하여 효과적인 클러스터 중심을 얻음과 동시에 적응 뉴로-퍼지 네트워크의 자동적인 퍼지 규칙을 생성하도록 한다. 자동차 MPG 예측문제에 대한 시뮬레이션 결과는 제안된 방법이 기존 문헌에서 제시한 예측성능보다 더 좋은 특성을 보임을 알 수 있었다.

  • PDF

스펙트럴 클러스터링 - 요약 및 최근 연구동향 (Spectral clustering: summary and recent research issues)

  • 정상훈;배수현;김충락
    • 응용통계연구
    • /
    • 제33권2호
    • /
    • pp.115-122
    • /
    • 2020
  • K-평균 클러스터링은 매우 널리 사용되고 있으나 유사도가 구면체 또는 타원체로 정의되어 각 클러스터가 볼록 집합 형태인 자료에는 좋은 결과를 주지만 그렇지 않은 경우에는 매우 형편 없는 결과를 나타낸다. 스펙트럴 클러스터링은 K-평균 클러스터링의 단점을 잘 보완해 줄 뿐아니라 여러 형태의 자료나 고차원 자료 등에 대해서도 좋은 결과를 나타내서 최근 인공 신경망 모형에 많이 이용되고 있다. 하지만, 개선되어야 할 단점도 여전히 많다. 본 논문에서는 스펙트럴 클러스터링에 대해 알기 쉽게 소개하고, 클러스터 갯수의 추정, 척도모수의 추정, 고차원 자료의 차원 축소 등 스펙트럴 클러스터링에 대한 최근의 연구 동향을 소개한다.

보행 관련 뇌파의 신호원 추정을 위한 비통합 데이터 분석 방법 (A non-merging data analysis method to localize brain source for gait-related EEG)

  • 송민수;정지욱;지인혁;추준욱
    • 전기전자학회논문지
    • /
    • 제25권4호
    • /
    • pp.679-688
    • /
    • 2021
  • 보행능력은 의학적으로 다양한 뇌신경계 질환에서 사용되는 평가 지표이다. 보행에 관련된 뇌 활성화를 측정하고 분석하는 방법으로 뇌파 데이터에 대해 독립성분을 추출한 뒤 신호원 추정 및 시간-주파수 분석이 주로 사용된다. 기존의 트레드밀 기반 보행 뇌파 분석은 분할 측정한 뒤, 데이터를 병합하여 신호 전처리, 독립성분분석 및 신호원 추정을 수행하고 피험자 간 군집화를 통하여 대표 성분 클러스터들을 추출한다. 본 연구에서는 보행 뇌파에 대하여 데이터 통합 없이 각각의 분할 측정된 데이터에 대하여 개별적으로 신호 전처리, 독립성분분석 및 신호원 추정을 수행하고 모든 피험자로부터 추정된 독립성분에 대하여 피험자 간 군집화를 수행하는 새로운 방법을 제안한다. 데이터 통합이 독립성분 군집화 및 시간-주파수 분석에 미치는 영향을 조사하기 위해 기존의 통합 데이터에 기반한 두 가지 분석 방법과 본 연구에서 제안하는 데이터 통합이 없는 분석 방법을 비교하였다. 그 결과, 통합 데이터 방법들에서는 각각 2개씩의 성분 클러스터를 도출하였으나 제안하는 방법을 통해 4개의 성분 클러스터를 도출, 적은 피험자 수에도 불구하고 세분화된 보행 뇌 신호 성분 클러스터를 도출할 수 있었음을 확인하였다.