• 제목/요약/키워드: 군집

검색결과 6,637건 처리시간 0.038초

다계층 밀도기반 군집화 기법 (Multi-hierarchical Density-based Clustering Method)

  • 신동문;정석호;이경민;이동규;손교용;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.797-798
    • /
    • 2009
  • 군집화는 대용량의 데이터로부터 유용한 정보를 추출하는 데에 적합한 데이터마이닝 기법들 중 하나이다. 군집화 기법은 주어진 데이터그룹 내에서 사전정보 없이 의미있는 지식을 발견할 수 있으므로 큰 어려움이 없이 실제 응용분야에 적용할 수 있다. 또한, 대용량 데이터를 다룰 때에 개별적인 데이터에 대한 접근 횟수를 줄이고, 알고리즘이 다루어야 할 데이터 구조의 크기를 줄일 수 있다. 본 논문에서는 밀도-기반 군집화 기법을 기반으로 하는 새로운 군집화 기법을 제안한다. 우리가 제안하는 군집화 기법은 반복적인 군집화 과정을 통하여 군집 내 주변 잡음을 제거하고 더 세밀하게 집단을 세분화하는 것이 가능하다. 또한, 군집을 표현하는 데에 계층구조로 나타내어 각 군집의 상관관계를 파악하는 데에 유리하다. 본 논문에서 제안하는 군집화 기법을 통하여 다양한 밀도를 가진 군집들을 효과적으로 분류할 수 있을 거라고 기대된다.

군집분석 비교 및 한우 관능평가데이터 군집화 (A Comparison of Cluster Analyses and Clustering of Sensory Data on Hanwoo Bulls)

  • 김재희;고윤실
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.745-758
    • /
    • 2009
  • 자발적인 군집을 유도하는 다변량 통계기법으로 널리 사용되는 군집분석은 데이터에 기반한 탐색적 방법으로 쓰이며 군집원칙에 따라 여러 가지 방법이 제안되어 왔다. 또한 군집화된 결과에 대하여 유효성을 측정하는 측도도 다양한방법이 개발되었다. 본 연구에서는 계층적 군집분석 방법으로 최장연결법과 Ward의 방법, 비계층적 군집분석 방법으로 K-평균법 그리고 확률분포정보를 활용한 모형기반 군집분석방법을 이용하여 모의실험으로 군집분석을 실시하고 군집유효성 측도로는 연결성, Dunn 지수, 실루엣을 구하여 각 군집방법에 대해 유효성을 비교한다. 또한, 한우 관능평가 데이터에 군집분석을 적용하여 최적의 군집 상황을 구하고자 한다.

군집 분석을 이용한 학생들의 성취 목적 양식 조사 (Pattern Examination of Students' Achievement Goal by Cluster Analysis)

  • 전경문;박현주;노태희
    • 한국과학교육학회지
    • /
    • 제25권3호
    • /
    • pp.321-326
    • /
    • 2005
  • 본 연구는 군집 분석을 통해 학생들의 복합적인 성취 목적 양식을 확인하고, 이것이 학습 전략(심층적/피상적)과 과학 성취도에 미치는 영향을 조사하였다. 성취 목적(과제 지향/수행 지향/수행 회피)에 대해 군집 분석을 실시한 결과, '과제 지향 목적이 높은 집단(군집 1)'. '과제 지향 목적과 수행 지향 목적이 모두 높은 집단(군집 2)', '과제 지향 목적과 수행 지향 목적이 모두 낮은 집단(군집 3)'으로 구분되었다. 일원 변량 분석 결과, 심층적 학습 전략에서 군집 2의 평균이 군집 1과 군집 3보다 유의미하게 높았으며, 과학 성취도에서 군집 1과 군집 2의 평균이 군집 3보다 유의미하게 높은 것으로 나타났다. 피상적 학습 전략에서는 군집 3의 평균이 군집 1과 군집 2보다 유의미하게 높았다. 본 연구 결과에 대한 교육적 함의를 논의하였다.

2단계 k-평균 군집화를 활용한 한류컨텐츠 기업 주가 예측 연구 (A Study On Predicting Stock Prices Of Hallyu Content Companies Using Two-Stage k-Means Clustering)

  • 김정우
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.169-179
    • /
    • 2021
  • 본 연구는 기존의 k-평균 군집화를 활용한 2단계 k-평균 군집화 방법을 사용하여 한류콘텐츠 기업들의 주식가격을 예측함으로써 본 기법이 예측성능을 개선할 수 있음을 보이고자 하였다. 이를 위하여 본 연구는 2단계 k-평균 군집화의 알고리즘을 소개하고, 다양한 머신러닝 기법들과의 예측값 비교를 통하여 본 기법의 예측성능을 검증하였다. 본 기법은 기존의 k-평균 군집화로부터 얻어진 군집들 중에서 예측 대상에 근접한 군집을 추출하고 이 군집에 k-평군 군집화 방법을 다시 적용하여 실제 값에 보다 근접한 군집을 탐색하는 방식이다. 본 기법을 한류콘텐츠 기업들의 주가 시계열 자료에 적용한 결과, 다른 머신러닝 기법의 예측값들보다 실제 주식가격에 근접한 예측값을 나타내어, 기존의 k-평균 군집화 방법보다 개선된 예측성능을 보였다. 또한, 본 기법은 상대적으로 적은 크기의 군집을 사용함에도 불구하고 비교적 안정적인 예측값을 나타내었다. 이에 따라, 2단계 k-평균 군집화 기법은 예측의 정확성과 안정성을 동시에 개선할 수 있으며, 소규모 자료에도 유용할 수 있는 새로운 군집화 방식을 제시했다고 볼 수 있다. 향후에는 본 기법을 발전시켜 대규모 자료에도 적용하는 방안을 검토하는 연구가 요구된다.

Time Control Microarray 자료의 군집 분석에 관한 고찰

  • 손인석;이재원
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.299-304
    • /
    • 2003
  • 생물학자들은 시간 패턴에 따라 발현 수준이 변화하는 유전자의 군집화를 시도하고 있다. 지금까지는 군집 방법의 비교 연구가 주로 진행되어 왔으나, 군집화 이전의 유전선택 방법에 따라 군집화 결과가 달라지기 때문에 유전자 선택 단계도 같이 고려되어야 한다. 따라서 본 연구에서는 Time Control Microarray 자료를 가지고 군집 분석을 하는데 있어서 유전자 선택, 군집분석 방법의 선택, Validation 방법의 선택 등 3가지 요인별로 보다 폭 넓은 비교 연구를 하였다.

  • PDF

추천 시스템의 예측 정확도 향상을 위한 전처리 방법 (Preprocessing Methods for Improving Prediction Accuracy in Recommender Systems)

  • 박석인;김택헌;류영석;양성봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.247-249
    • /
    • 2002
  • 협력적 여과(collaborative filtering) 방법을 사용하는 추천 시스템에서 예측 정확도를 높이는 방법들 중 하나는 군집화(clustering)방법이 있다. 군집화 방법은 선호도가 유사한 사용자들을 미리 같은 군집으로 만들고, 군집 내에 속한 사용자들을 이웃으로 선정하여 예측을 수행하기 때문에 군집화의 결과가 예측의 정확도에 직접적인 영향을 주게 된다. 본 연구에서는 군집화 결과의 향상을 위해 데이터를 전 처리하는 두 가지 방법과 군집화의 특성을 이용한 새로운 예측식을 제안하고, 기존 연구 방법과의 비교 실험을 통해 실험결과를 분석한다.

  • PDF

강원도 대관령 목장 현존식생 및 식물군집구조 (Actual Vegetation and Structure of Plant Community in Daegwallyeong Ranch, Gangwon-do (Province))

  • 노태환;한봉호;김종엽;이민영;유기준
    • 한국환경생태학회지
    • /
    • 제27권5호
    • /
    • pp.579-591
    • /
    • 2013
  • 본 연구는 온대 북부 기후대에 위치한 강원도 대관령 목장 산림생태계의 현존식생, 식물군집구조, 천이계열 특성과 보전가치를 밝히고, 향후 복원 및 관리계획 수립 시 필요한 기초자료를 제공하고자 수행하였다. 현존식생은 총 56개 유형으로 분류되었고, 조사면적 $19,397,361m^2$ 중 신갈나무가 우점하는 지역은 $7,669,593m^2$(39.1%), 1차 초지 지역은 $4,785,417m^2$(24.7%), 신갈나무-낙엽활엽수군집이 우점하는 지역은 $2,182,276m^2$(11.3%)이었다. 조사구는 $20m{\times}20m$($400m^2$) 28개소를 설정하였으며, DCA분석 결과 군집 I(소나무-신갈나무군집), 군집 II(신갈나무-소나무군집), 군집 III(신갈나무군집), 군집 IV(신갈나무-낙엽활엽수군집), 군집 V(낙엽활엽수군집), 군집 VI(팥배나무군집) 등 6개의 식물군집으로 분류되었다. 표본목 수령은 군집 I은 57~62년생, 군집 II는 41~77년생, 군집 III은 47~108년생, 군집 IV는 47~82년생, 군집 V는 47년생, 군집 VI은 55년생으로 전체적으로 41~108년생이었다. 대관령 목장의 생태적 천이는 소나무군집에서 신갈나무군집으로 발달하고 있는 것으로 예측되었으며, 계곡부를 중심으로 낙엽활엽수군집도 분포하고 있었다. 단위면적 $400m^2$당 샤논의 종다양도지수를 분석한 결과, 군집 IV(0.8203~1.1439) ${\rightarrow}$ 군집 III(0.8019~1.1375) ${\rightarrow}$ 군집 V(1.0993) ${\rightarrow}$ 군집 I(0.9475~1.0797) ${\rightarrow}$ 군집 II(0.6896~1.0324) ${\rightarrow}$ 군집 VI(0.9909) 순으로 높았다.

소백산지역 달밭재-비로봉 능선부의 삼림군집구조 (Forest Community Structure of the Dalbatjae-Birobong Ridge in Sobaeksan Area)

  • 박인협;최영철;문광선
    • 한국환경생태학회지
    • /
    • 제6권2호
    • /
    • pp.147-153
    • /
    • 1993
  • 소백산지역 달밭재-비로봉 능선부(해발 770-1,410m)의 삼림군집구조를 조사하기 위하여 해발고에 따라 20m$\times$25m 조사구 20개를 설치한 후 흉고직경 1cm 이상의 교목층을 대상으로 조사하였다. 능선부 전체의 군집형은 소나무우점군집과 신갈나무우점군집이었으며, 수종별 중요치에 의하여 cluster 분석한 결과 소나무군집, 소나무-신갈나무군집, 신갈나무군집, 신갈나무-활엽수군집 등의 4개 군집으로 구분할 수 있었다. 소나무군집의 우점종인 소나무, 소나무-신갈나무군집의 우점종과 준우점종인 소나무와 신갈나무, 신갈나무군집의 우점종인 신갈나무의 교목하층 중요치가 비교적 높게 나타남으로써 상당기간 현 상태의 삼림군집이 지속될 것으로 추정되었다. 신갈나무군집의 경우 교목상층에서 비교적 중요치가 높은 소나무가 교목하층에서는 출현하지 않음으로써 신갈나무의 우점도가 더욱 높아질 것으로 추정되었다. 교목층 전체의 종다양도는 신갈나무-활엽수군집 0.7136, 소나무-신갈나무군집 0.6850, 소나무군집 0.6791, 신갈나무군집 0.5296의 순으로 높았다. 조사구별 중요치에 의하여 주요 수종간 종간상관을 분석한 결과 소나무는 쇠물푸레나무와 유의적인 정의 상관을 보였으며, 신갈나무, 자작나무, 피나무 등과는 유의적인 부의 상관을 보였다. 신갈나무는 쇠물푸레나무와 유의적인 부의 상관을 보였다.

  • PDF

오대산국립공원 중대사-비로봉 구간 식물군집구조 (The Structure of Plant Community in Jungdaesa-Birobong Area, Odaesan National Park)

  • 한봉호;최진우;노태환;김동욱
    • 한국환경생태학회지
    • /
    • 제29권5호
    • /
    • pp.764-776
    • /
    • 2015
  • 본 연구는 오대산국립공원 해발 1,000m 이상의 고지대인 중대사~비로봉 구간에 대한 산림식생현황 및 천이계열, 변화양상을 파악하는데 그 목적이 있다. 중대사~비로봉 구간의 식물군집구조를 파악하기 위하여 $20m{\times}20m(400m^2)$의 방형구 17개소를 설정하였다. 설정된 조사구별 상대우점치, 흉고직경급별 분포, 표본목의 생장량 및 수령, 유사도지수, 종다양도지수 등을 분석하였다. DCA분석 결과, 군집 I(신갈나무-피나무군집), 군집 II(신갈나무-낙엽활엽수군집), 군집 III(신갈나무-잣나무군집), 군집 IV(전나무-신갈나무군집), 군집 V(전나무-낙엽활엽수군집) 등 5개 식물군집으로 분류되었다. 조사구별 상대우점치 분석결과, 신갈나무는 해발고가 높을수록, 전나무는 해발고가 낮을수록 군집내 상대 우점치가 높아지는 경향을 나타내었다. 군집 I, 군집 II, 군집 III은 현상태가 지속적으로 유지될 것으로 판단되었으며, 군집 IV, 군집V에서는 신갈나무의 세력이 약화될 것으로 파악되었다. 표본목의 수령은 85~161년(평균 123년)이었다. 유사도지수 분석결과 5개의 군집은 이질성이 강한 것으로 나타났으며, 특히 높은 해발고의 군집 I과 낮은 해발고의 군집 IV, V간의 이질성이 높았다. 단위면적 $400m^2$당 샤논의 종다양도지수를 분석한 결과, 군집 III(1.1109) > 군집 II(1.0475) > 군집 I(1.0125) > 군집 IV(0.9918) > 군집 V(0.8686)의 순으로 높았다. 신갈나무가 우점하는 군집의 종다양도는 과거 연구 및 주변 지역 연구 결과와 비교하여 유사한 반면, 전나무가 우점하는 군집의 경우 다소 낮은 것으로 확인되었다.

고차원 응용에서의 군집 유효성 평가 기법 (Cluster Validity Assessment Techniques for High-Dimensional Applications)

  • 김민호;유현진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.715-717
    • /
    • 2005
  • 군집 유효성은 다양한 입력 변수에 따라 변하는 군집화 알고리즘의 결과들을 평가하는 것이다. 본 논문에서는 고차원의 데이터 집합에 대한 군집 유효성의 문제점에 대한 새로운 해결책을 제시한다. 고차원 군집화 결과들을 평가할 때 발생하는 기존의 군집 유효성 지수들의 적용성의 문제점을 살펴보고, 고차원으로 인해 발생하는 문제를 효과적으로 다룰 수 있는 다양한 새로운 군집 유효성 지수들을 제안한다. 제안된 군집 유효성 지수들은 본 논문에 제공된 실험에서 최적의 군집 유효성 결과를 제공한다.

  • PDF