• 제목/요약/키워드: 계층적 군집

검색결과 232건 처리시간 0.031초

군집분석 기법을 이용한 공공도서관 그룹화에 대한 연구 (A Study of Library Grouping using Cluster Analysis Methods)

  • 곽철완
    • 한국비블리아학회지
    • /
    • 제31권3호
    • /
    • pp.79-99
    • /
    • 2020
  • 이 연구의 목적은 공공도서관 그룹화를 위해 적합한 군집분석 모델을 파악하고 그 특징을 분석하는데 있다. 국가도서관통계시스템의 공공도서관 통계 데이터를 사용하였으며, 군집분석 기법의 3가지 모델을 적용하였다. 공공도서관 규모를 기준으로 군집분석을 실시한 결과 크게 2가지 군집으로 구분되었으며, 군집의 크기는 크게 한쪽으로 치우쳤다. 그룹화 모델로 도서관 규모를 기준으로 삼으면, 계층적 군집분석의 와드측정법과 k-평균군집분석 모델이 적합하였다. 공공도서관 그룹화 연구 결과에 대한 시사점은 다음과 같다. 첫째, 통계 데이터 외에 도서관 서비스 관련 다양한 데이터 수집이 진행되어야 한다. 둘째, 분석 대상이 되는 데이터 세트에 적합한 분석 모델이 적용되어야 한다. 셋째, 도서관 서비스 향상을 위해 군집분석 기법의 다양한 분야 적용 가능성에 대한 적극적인 연구가 필요가 있다.

인자 점수를 이용한 이상치 데이터의 군집화 (Outlier Data Clustering using Factor Score)

  • 전성해;임민택;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.77-80
    • /
    • 2002
  • 이상치를 포함한 학습 데이터의 군집화 전략은 일반적으로 이상치를 포함하여 학습하거나, 이상치를 제거하는 두 가지 선택이 가능하다. 이상치를 제거하지 않고 학습에 반영시켜야 할 경우 한 개 또는 소수의 이상치가 독자적인 군집을 형성하거나 객관적인 군집화를 방해하는 문제가 발생할 수 있다. 이 때 주어진 학습 데이터의 군집 결과가 이상치의 영향으로부터 벗어나기 위해 원래의 학습 데이터에 대한 변환 작업을 거친 후 군집화를 수행할 수 있다. 이러한 변환 방법으로서 본 논문에서는 차원 축소의 기법으로 알려진 인자 분석의 점수를 사용하였다. 인자 점수로 변환된 학습 데이터에 대해 계층적 군집화, K-means 그리고 자기조직화 지도 등과 같은 군집화 알고리즘을 적용하면 이상치가 자신만의 군집을 별도로 형성하지 않고 다른 학습 데이터의 군집에 소속되면서 이상회의 영향으로부터 벗어남을 실험을 통하여 확인하였다.

  • PDF

Motif 기반의 단백질 군집화 (Motif-Based Protein Clustering)

  • 진훈;김현식;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.235-237
    • /
    • 2002
  • motif란 기능적으로 유사한 단백질 군의 아마노산 서열들에 공통적으로 나타나는 일정한 패턴이나 부분서열을 말한다. 본 논문에서는 motif들로 각 단백질의 특성을 표현한 다음, 이것을 기초로 유사성을 비교하여 단백질들을 기능적으로 유사한 여러개의 계층적 군으로 나누는 군집화 방법을 소개하였다. 영역 특성상 확장성과 계층성을 가지는 신경망 GHSOM을 군집화 알고리즘으로 사용하였고, 실제 307 개의 단백질들에 대한 군집화 실험을 통해 그 효과를 확인해보았다.

  • PDF

군집분석 비교 및 한우 관능평가데이터 군집화 (A Comparison of Cluster Analyses and Clustering of Sensory Data on Hanwoo Bulls)

  • 김재희;고윤실
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.745-758
    • /
    • 2009
  • 자발적인 군집을 유도하는 다변량 통계기법으로 널리 사용되는 군집분석은 데이터에 기반한 탐색적 방법으로 쓰이며 군집원칙에 따라 여러 가지 방법이 제안되어 왔다. 또한 군집화된 결과에 대하여 유효성을 측정하는 측도도 다양한방법이 개발되었다. 본 연구에서는 계층적 군집분석 방법으로 최장연결법과 Ward의 방법, 비계층적 군집분석 방법으로 K-평균법 그리고 확률분포정보를 활용한 모형기반 군집분석방법을 이용하여 모의실험으로 군집분석을 실시하고 군집유효성 측도로는 연결성, Dunn 지수, 실루엣을 구하여 각 군집방법에 대해 유효성을 비교한다. 또한, 한우 관능평가 데이터에 군집분석을 적용하여 최적의 군집 상황을 구하고자 한다.

군집분석을 이용한 수도권 도시의 유형화에 관한 연구 (Charaterization of Cities in Seoul Metropolitan Area by Cluster Analysis)

  • 송민경;장훈
    • 대한공간정보학회지
    • /
    • 제18권1호
    • /
    • pp.83-88
    • /
    • 2010
  • 본 논문은 수도권 내 지역을 도시적 특성에 따라 군집 분석하여 수도권의 지역유형을 구분하고 그 특성을 파악하고자 하였다. 수도권 도시의 유형화를 위해 2005년을 시점으로 도시의 구성요소인 인구, 활동, 토지 및 시설을 나타내는 지표 10가지를 선정하였으며, 주성분분석을 통해 변수들의 공통된 특성이나 유사한 성질에 따라 공통인자를 추출하였다. 추출된 인자에 대한 인자득점을 이용하여 군집분석을 행하였고, 군집분석의 방법은 계층적 군집방법인 최단연결법, 최장연결법, 평균연결법, 와드법을 이용하였다. 그 결과 수도권을 5개의 군집으로 유형화 할 수 있었다.

한강 유역에서의 강우 지역빈도 해석 방법의 비교 연구 (Comparative Study of Regional Frequency Analysis Methods of Rainfall in Han River Basin)

  • 엄명진;임승택;남우성;조원철;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1072-1076
    • /
    • 2008
  • 본 연구에서는 한강유역 109개 지점의 강우관측소에서 관측된 지속기간별 연최대강우량을 기본으로 각 지속기간별 L-모멘트값을 산정하고, 한강유역에 적합한 빈도해석기법을 정의하기 위하여 지역구분을 실시하였다. 지역구분을 위한 군집분석을 수행하기 위하여 각 지점별 기상학적 인자와 지형학적 인자를 변수로 사용하였다. 군집분석 기법인 Ward, 평균연결법, Fuzzy-c means, Two-Step방법을 이용하여 지역구분을 실시하였다. GIS를 이용하여 각 방법들을 이용하여 군집된 결과를 도시한 결과 Fuzzy-c means방법으로 구분된 지역구분이 적합한 것으로 나타났다. 또한 구분된 지역의 동질성 여부를 판단하고 적정 분포형을 선정하였으며 지점빈도해석 및 지역빈도해석을 통하여 빈도별 확률 수문량을 산정하였다. 산정된 결과의 정확도 알아보기 위해 모의발생을 시킨 후, 각 기법별로 산정된 상대 평균 제곱근 오차(Relative Root Mean Square Error, RRMSE)를 비교 분석한 결과 대체적으로 지수홍수법과 계층적 방법이 낮은 RRMSE를 나타냈다. 따라서 한강유역에서는 지수홍수법과 계층적 방법을 적용한 지역빈도해석이 적합한 것으로 판단된다.

  • PDF

다중계층 통행배분 알고리즘 개발 (다차종을 중심으로) (Development of multiclass traffic assignment algorithm (Focused on multi-vehicle))

  • 강진구;류시균;이영인
    • 대한교통학회지
    • /
    • 제20권6호
    • /
    • pp.99-113
    • /
    • 2002
  • 교통량배분문제 가운데 다중계층 교통량배분문제는 유일해가 보장되지 않는 대표적 사례로 최근 들어 모형의 정식화 및 해법에 관해서 활발하게 전개되고 있다. 정식화에 있어서는 변동부등식이나 고정점 문제를 활용한 정식화가 보편적으로 활용되고 있으나 해법(알고리즘)에 관한 연구는 미흡한 실정이다. 본 연구에서는 변동부등식으로 정의된 다중계층 이용자균형 교통량배분문제의 해법으로서 GA알고리즘과 대각화알고리즘, 군집화알고리즘을 조합한 Hybrid Algorithm을 개발, 제안한다. GA알고리즘과 군집화알고리즘은 해의 탐색을 전역적이면서도 효과적으로 수행하기 위해서 도입된 대각화 알고리즘의 보완적 알고리즘이라 할 수 있다. 본 연구에서는 또한, 다중계층 이용자균형 교통량배분문제의 해법으로서의 제안된 AMSA(The Algorithm of Multiclass Static User Equilibrium Assignment)의 특징을 예제풀이를 통해서 설명하고 있다.

온습도에 따른 대중의 감성(감정+감각) 활동 변화 (A change of the public's emotion depending on Temperature & Humidity index)

  • 양중기;김근영;이영호;강운구
    • 디지털융복합연구
    • /
    • 제12권10호
    • /
    • pp.243-252
    • /
    • 2014
  • 소셜 미디어 데이터를 통해 파급되는 형태를 분석하여 국내 외 정치, 경제, 보건, 사회 문화현상을 대응하고자 하는 연구가 활발히 진행 중이다. 본 연구는 한국인이 가장 많이 사용하는 검색 서비스인 검색 정보를 알 수 있는 네이버 트렌드와 소셜 데이터인 네이버 블로그, 네이버 카페와 Open Data(API)를 사용하고 기상청의 온도, 습도 데이터를 사용하였다. 사람의 감성을 나타내는 감정 어휘와 감각을 표현하는 감각어휘 중 미각 어휘를 분석하여 대중의의 감성 활동 변화를 연구하였다. 적합도 검증과 계층적 군집분석으로 군집의 개수를 정하여 비 계층적 군집분석으로 군집화 하였다. 군집분석 결과 8개의 군집으로 군집화되어 감성어휘를 알 수 있었다. 판별분석에 의하면, 군집분석에서 결정된 8개의 그룹은 98.9% 정확성을 갖는 것으로 나타났다. 본 연구에서 연구한 감성 활동 변화는 온도와 습도에 의해 감성 활동을 예측 할 수 있어 감성을 공유하고 대중의 기분을 파악하여 서로 공감대를 형성 할 수 있다.

다계층 밀도기반 군집화 기법 (Multi-hierarchical Density-based Clustering Method)

  • 신동문;정석호;이경민;이동규;손교용;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.797-798
    • /
    • 2009
  • 군집화는 대용량의 데이터로부터 유용한 정보를 추출하는 데에 적합한 데이터마이닝 기법들 중 하나이다. 군집화 기법은 주어진 데이터그룹 내에서 사전정보 없이 의미있는 지식을 발견할 수 있으므로 큰 어려움이 없이 실제 응용분야에 적용할 수 있다. 또한, 대용량 데이터를 다룰 때에 개별적인 데이터에 대한 접근 횟수를 줄이고, 알고리즘이 다루어야 할 데이터 구조의 크기를 줄일 수 있다. 본 논문에서는 밀도-기반 군집화 기법을 기반으로 하는 새로운 군집화 기법을 제안한다. 우리가 제안하는 군집화 기법은 반복적인 군집화 과정을 통하여 군집 내 주변 잡음을 제거하고 더 세밀하게 집단을 세분화하는 것이 가능하다. 또한, 군집을 표현하는 데에 계층구조로 나타내어 각 군집의 상관관계를 파악하는 데에 유리하다. 본 논문에서 제안하는 군집화 기법을 통하여 다양한 밀도를 가진 군집들을 효과적으로 분류할 수 있을 거라고 기대된다.

건물 형태 발생을 위한 3차원 선소의 계층적 군집화 (Hierarchical Grouping of Line Segments for Building Model Generation)

  • 한지호;박동철;우동민;정태경;이윤식;민수영
    • 전기전자학회논문지
    • /
    • 제16권2호
    • /
    • pp.95-101
    • /
    • 2012
  • 위성 영상에서 건물형태를 발생하기위한 새로운 접근방식이 본 논문에서 제안되었다. 제안된 알고리즘은 낮은 수준의 선소들을 연결하고 유사한 개체들을 군집화하기 위해 선소 측정함수가 적용된 신경망이다. 제안된 신경망은 윤곽선 영상에서 추출된 윤곽선들을 군집화 목적으로 사용된다. 본 논문에서는 3차원 선소의 오류에 의한 군집화 결과의 비현실적 건물모델의 발생을 근원적으로 차단하기 위하여, 높이 정보를 이용한 계층적 군집화를 제안하였다. 제안된 새로운 거리척도의 신경망과 군집화를 통해 성공적인 건물모델의 재구성을 실험으로 보여주었다.