• 제목/요약/키워드: 군집 수 결정

검색결과 365건 처리시간 0.031초

454 Pyrosequencing을 이용한 실규모 혐기성 소화조의 아케아 군집구조 분석 (Analysis of Archaeal Communities in Full-Scale Anaerobic Digesters Using 454 Pyrosequencing)

  • 강현진;김택승;이영행;이택준;한금석;최영준;박희등
    • 미생물학회지
    • /
    • 제47권3호
    • /
    • pp.209-217
    • /
    • 2011
  • 결론적으로 본 연구에서는 16S rRNA 유전자 기반의 454 pyrosequencing을 통해 혐기성 소화조에 존재하는 다양한 아케아를 규명할 수 있었으며, 지금까지 그 중요성이 잘 알려지지 않은 Methanococcales 목에 속하는 아케아가 소화조에 공통적으로 존재함을 확인할 수 있었다. 또한, 소화조의 운전조건은 아케아의 다양성과 군집구조를 결정하는데 영향을 미치는 중요한 인자라는 것을 알 수 있었다. 실규모 6개 혐기성 소화조를 대상으로 11개 소화 슬러지 시료를 채취해, 16S rRNA 유전자 기반의 454 pyrosequencing을 이용하여 아케아 군집구조를 조사하였다. 아케아 16S rRNA 유전자 염기서열로부터 측정된 observed operational taxanomic units (OTUs)는 13-55 OTUs이었으며(3% cutoff), 이는 Chao1 richness estimate로 계산된 값의 29-89%에 해당하였다. 소화조에는 메탄생성에 직접적으로 관련이 있다고 알려진 Methanomicrobiales, Methanobacteriales, Methanococcales, Methanosarcinales, Methanocellales 목에 속하는 아케아 뿐만 아니라, Thermoproteales, Thermoplasmatales, Desulfurococcales목에 속하는 아케아도 함께 발견되었다. 이 중 수소를 기질로 해서 메탄을 생성한다고 알려진 Methanoacoccales가 전체 염기서열의 51.8-99.7%를 차지해 가장 많이 발견된 분류군으로 나타났다. Heat map 분석결과 각 시료들의 아케아 군집구조는 1개 시료를 제외한 나머지 10개 시료가 매우 비슷한 군집구조를 가지고 있었다(Pearson 상관지수=0.99). 또한, 아케아 군집구조와 환경변수들의 상관성을 분석한 canonical correspondence analysis를 통해 혐기성 소화조의 아케아 군집구조에 영향을 미치는 중요 환경변수는 소화조의 온도와 총고형물 제거율임을 확인하였다. 모든 결과들을 종합해 볼 때 소화조의 운전조건은 아케아의 다양성과 군집구조를 결정하는데 영향을 미치는 중요한 인자라고 사료된다.

범주형 속성 기반 군집화를 위한 새로운 유사 측도 (A New Similarity Measure for Categorical Attribute-Based Clustering)

  • 김민;전주혁;우경구;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.71-81
    • /
    • 2010
  • 데이터의 군집을 찾아내는 문제는 패턴 인식, 이미지 처리, 시장 조사 등 많은 응용 분야에서 널리 사용되고 있다. 군집의 질을 결정하는 핵심 요소로는 유사 측도, 차원의 개수 등이 있다. 유사 측도는 데이터의 특성을 반영하여 다르게 정의되어야 하는데, 대부분 기존의 연구들은 데이터를 특징 지어주는 속성이 수치형으로 주어진 경우에 국한되어 있었다. 속성이 범주형으로 주어진 경우도 실생활에 많이 존재하지만, 범주형 변수에 대한 속성값의 유사성은 값의 순서가 고유하게 정해지지 않아서 정의하기 어렵다. 이에 더하여, 고차원 데이터에 대해서는 데이터 점들이 희박하게 위치하여 가까운 점과 먼 점간의 차이가 거의 없고, 군집화 결과가 좋지 않을 수 있다. 이 문제를 해결하기 위해 부분 차원 군집화 방법이 제안되어 왔다. 부분 차원 군집화 방법은 각 군집을 발견하기에 적합한 부분 차원을 선택하면서 군집화를 수행하는 방법이다. 본 논문에서는 범주형 속성으로 특징지어진 고차원 데이터를 부분 차원 군집화하기 위한 새로운 유사 측도를 제안한다. 유사 측도는 각 군집은 다른 군집과 구별되는 특정 정보를 잘 표현할 수 있어야 한다는 기본적인 가정 하에 속성들 사이의 상관성을 반영하여 정의되었다. 이들 모두를 반영한 유사측도는 기존에 존재하지 않았다는 점에서 본 연구는 의미가 있다. 실제 데이터 집합을 군집화하는 실험을 통해 제안하는 방법이 다른 군집화 방법보다 저차원 데이터와 고차원 데이터 모두에 대해 좀 더 정확한 군집 결과를 얻을 수 있음을 보였다.

의미 경계의 현실화를 위한 공기정보의 자동 군집화 (Automatic word sense clustering using collocation for practical sense boundaries)

  • 신사임;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.559-561
    • /
    • 2004
  • 본 논문에서는 다의어의 현실적인 의미 분포의 결정에 대해 이야기 하고자 한다. 수동으로 구축한 의미체계인 사전이나 시소러스들은 그 의미구분의 경개가 모호하고 비현실적인 부분이 많아서 언어처리 시스템의 적용에 문제점으로 지적되고 있다. 그러므로, 본 연구에서는 대용량 코퍼스에서 추출한 공기정보와 자동 군집화 방법들을 사용하여 실질적인 다의어의 의미 경계를 발견하는 방법을 제안하였다. 수동 구축된 사전과 코퍼스 기반 사전의 다의어 의미 분포와 비교해 본 결과, 본 논문에서 제안한 방법의 결과가 코퍼스 기반 사전의 의미 분포와 매우 유사한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

데이터 분포를 고려한 연속 값 속성의 이산화 (Discretization of continuous-valued attributes considering data distribution)

  • 이상훈;박정은;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.217-220
    • /
    • 2003
  • 본 논문에서는 특정 매개변수의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(conti-nuous) 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

  • PDF

인과관계 문맥정보를 사용한 용어 군집화 연구 (Term Clustering based on Causal Context Information)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

다변량 통계 기법을 이용한 물리검층 자료로부터의 암석물리학상 결정 (Automatic Electrofacies Classification from Well Logs Using Multivariate Statistical Techniques)

  • 임종세;김정환;강주명
    • 지구물리와물리탐사
    • /
    • 제1권3호
    • /
    • pp.170-175
    • /
    • 1998
  • 이 연구는 다변량 통계 기법을 이용한 물리검층 자료로부터의 암석물리학상 결정으로 암상을 예측하는 것이다. 기술 통계 분석으로 물리검층 자료의 특성을 파악하고 주성분 분석에 의한 다변량 검층 자료들의 상관도 분석을 통해 변수들을 변환시켜 새로운 변수인 주성분을 구하고 변수들의 차원을 축소한다. 통계적 방법에 의한 주성분 검층 자료의 구획에 의한 효율적 자료 축소와 계산의 효율성을 높여 양질의 해석결과를 얻을 수 있다. 구획된 주성분 검층 자료로부터 계보적 군집 분석에 의해 암석물리학상을 결정한다. 최적 암석물리학상의 수는 전체 변동과 군집내의 변동사이의 비와 코어자료 등에 의해 비교 결정된다. 이 연구에서 개발된 암석물리학상 결정법을 국내대륙붕 물리검층자료에 적용한 결과 결정된 암석물리학상은 시추 코어 및 시추 암편 분석에 의한 암상 구분화와 잘 일치하였다. 이러한 연구는 저류층 특성인자의 신뢰성 있고 정량적인 평가로 유전 개발 및 생산 계획 시 유용한 도구로 활용될 수 있을 것이다.

  • PDF

씬씨내티 대도시지역의 산업군집과 경계설정 (Industrial Clusters and Their Boundaries: A Case Study for Plants in the Cincinnati metropolitan Area)

  • 이보영
    • 한국지역지리학회지
    • /
    • 제6권3호
    • /
    • pp.169-184
    • /
    • 2000
  • 미국의 씬씨내티 대도시지역을 대상으로 인자분석 및 Hot Spot 분석에 의해 산업 군집과 그것의 경계가 확인되어졌다. 전통적 투입 산출 접근법이 비공간적 산업 군집을 추출하는 반면 이 연구는 전통적 접근을 GIS 기법과 결합하여 경계를 설정한다. 투입 산출 산업 군집의 결과를 선도산업 부문과 결합하여 5개 선도 산업 군집을 추출하였는데 그것은 음식료품, 화학, 금속, 금속제품, 기계공업 부분이다. 그리고 Hot Spot 기법을 이용하여 연구지역의 산업 군집을 Arcview에 통합하여 시각화하였다. 산업 군집의 공간적 결합정도와 공간적 한계를 결정하는 것은 경제의 공간구조의 효율성을 측정하는 부가적 접근이 될 수 있다. 산업 군집과 산업의 공간적 군집 접근은 하나의 공장이나 기업의 수준보다 집계적인 차원에서 산업의 공간적 배열의 새로운 모형 개발 기초의 가능성을 제시한다.

  • PDF

한국(韓國) 동남해역(東南海域)의 대륙붕(大陸棚)에 분포(分布)하는 다모류군집(多毛類群集) (The Polychaete Assemblages on the Continental Shelf off the Southeastern Coast of Korea)

  • 최진우;고철환
    • 한국해양학회지
    • /
    • 제23권4호
    • /
    • pp.169-183
    • /
    • 1989
  • 한국(韓國) 동남해역(東南海域)의 대륙란(大陸爛)에 서식(棲息)하는 다모류군집(多毛類群集)의 종류를 파악(把握)하고, 또한 이들 군집(群集)이 서식지(棲息地) 환경(環境)에 어떻게 적응, 서식하는가를 밝히고자 하였다. 총80개 조사정점에서 채집된 다모류(多毛類)의 종류와 개체수의 자료로부터 집괴분석(集塊分析)을 실시한 결과 본 연구해역은 크게 연안역(沿岸域)과 외해역(外海域)으로 양분되었고, 8개의 다모류(多毛類) 군집(群集)이 구별되었다. 이질(泥質) 퇴적물(堆積物)이 우세한 연안역(沿岸域)에서는 Nothria holobranchiata 군집(群集)이 포항 근해역에, Magelona-Maldane 군집(群集), Ophelina acuminata 군집(群集), Nothria conchylega 군집(群集)이 연안해역의 남북방향으로 존재(存在)하였다. 이들 연안역(沿岸域)의 군집(群集)들은 종수가 적고 종다양성 지수도 낮았다. 외해역(外海域)에서는 이질퇴적물(泥質堆積物)로 구성된 대륙붕단에 Terebellides-Aglaophamus 군집(群集)이 존재(存在)하였고, 이사질(泥砂質)과 사질(砂質)이 우세한 지역에서는 Myriochele oculata 군집(群集), Spiophanes kroyeri 군집(群集) 및 Ninoe palmata 군집(群集)이 존재(存在)하였다. 외해역(外海域)의 군집(群集)들은 연안역(沿岸域)에 비해 종수나 종다양성이 높았으나, 평균서식밀도는 낮았다. 대부분의 우점종들은 그들의 식이형(食餌型)과 내장의 내용물로부터 특정 퇴적물(堆積物)에 높은 선호도를 보임을 알 수 있었다. 동일 퇴적물(堆積物)에서의 다양한 군집(群集)의 존재(存在)는 수심과 수온이 저서(底棲) 다모류(多毛類)의 분포와 관계가 있음을 시사하였다. 따라서 연구해역의 다모류군집(多毛類群集)은 퇴적물(堆積物)의 특성과 수심(水深) 또는 수온(水溫)에 따라 결정됨을 보여준다.

  • PDF

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

상대인력 모델에 기반한 자연적 개체 군집화 알고리즘 (A Natural Clustering Algorithm based on the Relative Gravitation Model)

  • 김은주;고재필;변혜란;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권10호
    • /
    • pp.757-763
    • /
    • 2001
  • 본 논문에서는 상대인력 모델에 기반한 새로운 군집화 알고리즘, G-CLUS를 제안한다. 제한한 방법에서 모든 개체들은 초기에 동일한 질량을 가지고, 개체간의 인력에 의해 인력이 작용하는 방향으로 점진적으로 이동하게 되어, 초기 시작점 선택이나 군집의 개수를 미리 지정하지 않은 상태에서 자연스럽게 군집을 형성한다. 제안한 방법을 인력작용과정에서 군집의 수가 자연스럽게 결정되며, 한 개체가 받는 힘은 개체간의 인력을 합한 합력을 사용하기 때문에 이상치에 대한 민감성을 완화하였다. 본 알고리즘은 계산복잡도를 낮추기 위하여 큐브개념을 적용하여 O(nk)의 계산 복잡도를 유지하도록 하였다. 실험에서는 개체들의 움직임 특성, 군집화 모델에 따른 군집화 과정, 임의의 데이타 집합에 대한 군집화 결과를 보이고, 또한 타 군집화 알고리즘과 제안한 알고리즘 군집화 결화를 비교한다.

  • PDF