• 제목/요약/키워드: 계층적 군집

검색결과 232건 처리시간 0.036초

세그먼트 적합성 판단을 위한 계층적 최근접 검색 기법 (Hierarchical Nearest-Neighbor Method for Decision of Segment Fitness)

  • 신복숙;차의영;이임건
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.418-421
    • /
    • 2007
  • 이 논문에서는 곤충 발자국의 패턴을 판별하기 위한 전 단계로 추출되는 군집화된 세그먼트들 중에서, 곤충 발자국의 패턴을 분석하는 데에 부적합한 세그먼트들을 제거하기 위한 계층적 최근접 검색 기법을 제안한다. 발자국 형태와 거의 구별되지 않는 비정형적인 노이즈는 발자국과 서로 구별되는 특징을 규명하기 전까지는 영상처리 전 단계에서 완전히 제거될 수 없어 군집화 기법에 의해 추출된 세그먼트에도 이러한 노이즈를 내포하게 된다. 따라서 모든 세그먼트의 적합성을 평가하여, 노이즈 정보로 인해 타당성이 부족한 세그먼트를 제거함으로써 다음 단계에 수행되는 세그먼트들에 대한 곤충 발자국 패턴의 특징값 추출 성능이 향상될 수 있다.

  • PDF

데이터 마이닝에서의 군집분석 알고리즘 비교 연구

  • 이영섭;안미영
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 춘계학술대회
    • /
    • pp.19-25
    • /
    • 2003
  • 데이터베이스에 내재된 패턴이나 관계를 묘사한 것만으로도 의사결정에 필요한 정보를 제공할 수 있는데 이 데이터들의 변수들을 비슷한 특징을 가지는 소그룹으로 나누어 패턴을 찾는 것을 군집분석이라 한다. 이러한 군집 분석에는 분리군집방법과 계층적군집방법이 있는데, 재할당이 가능한 분리군집방법의 여러 알고리즘에 대해 비교해보자. 분리군집알고리즘에는 중심을 평균으로 하는 k-평균 알고리즘과, 중심을 메도이드로하는 PAM, CLARA, CLARANS 알고리즘이 있다. 이러한 알고리즘에 대한 이론과, 장단점을 설명하고, 분산과 중심들간의 평균 거리로 비교해 본다.

  • PDF

계층적 군집화를 이용한 능동적 학습 (Active Learning based on Hierarchical Clustering)

  • 우호영;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.705-712
    • /
    • 2013
  • 능동적 학습(active learning)은 소수의 라벨 데이터로 구성된 훈련 집합이 주어진 경우에 분류기 학습에 가장 도움이 될 만한 언라벨드 데이터를 선택하여 전문가에 의한 라벨링을 통해 훈련 집합에 포함시키는 과정을 반복함으로써 분류기의 성능을 향상시키는 것을 목적으로 한다. 본 논문에서는 워드 연결(ward's linkage)을 이용한 계층적 군집화(hierarchical clustering)를 바탕으로 한 능동적 학습 방법을 제안한다. 제안된 방법은 각 군집에서 적어도 하나의 샘플을 포함하도록 초기 훈련 집합을 능동적으로 구성하거나 또는 기존의 훈련 집합을 확장함으로써 전체 데이터 분포를 반영할 수 있게 한다. 기존의 능동적 학습 방법들 중 대부분은 초기 훈련 집합이 주어져 있을 경우를 가정하는 반면에 제안하는 방법은 초기 클래스 정보를 가진 훈련 데이터가 주어지지 않은 경우와 주어진 경우에 모두 적용 가능하다. 실험을 통하여 제안하는 방법이 비교 방법들에 비해 분류기 성능을 크게 향상시킬 수 있는 효과적인 데이터 선택을 수행함을 보인다.

시간경로 유전자 발현자료의 군집분석에서 이질적인 시계열의 탐지를 위한 패턴일치지수 (A Pattern Consistency Index for Detecting Heterogeneous Time Series in Clustering Time Course Gene Expression Data)

  • 손영숙;백장선
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.371-379
    • /
    • 2005
  • 본 논문에서는 피어슨 상관계수를 이용한 시간경로 유전자 발현자료의 군집분석에서 군집의 대표적인 패턴에서 벗어나는 이질적인 패턴을 보이는 시계열을 탐지하기 위한 패턴일치지수를 제안하고, 이를 마이크로어레이 실험으로부터 얻어진 혈청 시간경로 유전자 발현자료에 적용하여 유용성을 검토해 본다.

에너지 효율성을 높인 무선 센서 네트워크의 부하 균형 군집모델 (Energy Effective Load Balanced Clustering Model for Wireless Sensor Networks)

  • 이재희;김병기;강승호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.379-382
    • /
    • 2015
  • 무선 센서 네트워크는 제한된 에너지 자원으로 동작하므로 에너지 소비를 최소화하여 통신하는 기법이 무선 센서 네트워크 설계에 있어 매우 중요한 요소이다. 센서 노드들의 에너지 효율을 개선하기 위한 다양한 방법 중 클러스터링 알고리즘에 기반 한 계층적 라우팅 방법이 무선 센서 네트워크의 성능과 수명을 증가시키기 위해 효과적인 기술임이 알려지면서 다양한 접근법이 제시되고 있다. 클러스터 기반 아키텍처에서 클러스터의 부하 균형을 위한 효율적인 군집 모델은 게이트웨이와 센서 노드의 수명을 증가시켜 전체 네트워크의 성능을 향상 시킨다. 본 논문에서는 네트워크의 수명과 에너지 효율성을 높이기 위해 새로운 부하 균형 군집 모델을 제시한다. 또한 최적해를 보장하는 분기 한정 알고리즘을 설계하고 이를 이용해 다양한 조건에서 기존에 제시된 부하 균형 군집 모델과 실험하고 성능을 비교한다.

대표 경로에 기반한 XML 문서의 계층 군집화 기법 (A Hierarchical Clustering Technique of XML Documents based on Representative Path)

  • 김우생
    • 인터넷정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.141-150
    • /
    • 2009
  • XML은 데이터 교환과 정보 관리에 점차 중요해지고 있다. 근래에 XML 문서들에 대한 접근, 질의, 저장을 위한 효율적인 기법들을 개발하기 위해 많은 노력들이 이루어지고 있다. 이 논문에서 우리는 XML 문서들을 효율적으로 군집화하는 새로운 방법을 제안한다. XML 문서의 특징을 위해 XML 문서의 구조와 내용을 대표할 수 있는 새로운 대표 경로, 즉 가상 경로가 제안된다. XML 문서들을 군집화하기 위해 잘 알려진 계층 군집화 기법들을 대표 경로들에 적용하기 위한 방법도 제안된다. 실험을 통해 XML 문서의 특징으로 가상 경로를 사용했을 때 실제적인 군집들이 촘촘한 형상으로 잘 형성됨을 알 수 있다.

  • PDF

계층적 군집분석 기반의 Continuous Risk Profile을 이용한 고속도로 사고취약구간 선정 (Identifying Hotspots on Freeways Using the Continuous Risk Profile With Hierarchical Clustering Analysis)

  • 이서영;김철순;김동규;이청원
    • 대한교통학회지
    • /
    • 제31권4호
    • /
    • pp.85-94
    • /
    • 2013
  • Continuous Risk Profile(CRP)은 고속도로의 사고취약구간을 선정하는 방법론 중에서 정확성과 효율성이 뛰어난 것으로 알려져 있다. 그러나 전통적인 CRP는 데이터베이스 구축을 위한 대규모 투자를 필요로 하는 안전성능함수를 이용한다. 본 연구는 안전성능함수 대신 동질 그룹들의 평균사고건수를 규모조정계수로 이용하는 CRP를 제안하는 것을 목적으로 한다. 고속도로 구간들을 동질 그룹으로 분류하기 위하여 각 구간의 AADT와 차로 수 자료를 기반으로 하는 계층적 군집분석이 수행된다. 제안된 모형은 캘리포니아의 I-880 자료를 이용하여 다른 여러 가지 사고취약구간 선정방법들과 비교된다. 분석 결과에 따르면, 제안된 모형은 false negative를 발생시키지 않으며 false positive rate를 감소시킨다. 본 연구에서 개발된 방법론은 추가적인 복잡한 데이터베이스 없이 고속도로 사고취약구간을 선정하는 데에 활용될 수 있으며, 또한 고속도로 안전관리시스템을 개선하는 데에 기여할 수 있다.

온라인 소프트웨어 교육에서 학습자의 자기조절학습 관련 특성에 기반한 온라인 학습 유형 분석: 계층적 군집 분석 기법을 활용하여 (Investigating Online Learning Types Based on self-regulated learning in Online Software Education: Applying Hierarchical Cluster Analysis)

  • 한정윤;이성혜
    • 컴퓨터교육학회논문지
    • /
    • 제22권5호
    • /
    • pp.51-65
    • /
    • 2019
  • 본 연구에서는 온라인 소프트웨어 교육 환경에서 학습자의 자기조절학습특성에 따른 온라인 학습 유형을 파악하고 각 유형의 특징을 살펴봄으로써 보다 전략적인 온라인 소프트웨어 교육을 위한 시사점을 제공하고자 하였다. 이를 위해 K대학의 온라인 소프트웨어 교육과정에 참여하고 있는 K-12 학생 809명의 온라인 학습 로그 데이터로부터 자기조절학습 특성 변인을 추출한 후, 계층적 군집 분석 기법(hierarchical cluster analysis)을 활용하여 자기조절학습 특성에 따른 학습자 군집 도출 및 군집 유형에 따른 온라인 학습 특성과 학습 결과의 차이를 비교 분석하였다. 그 결과, 온라인 소프트웨어 교육 학습자들의 자기조절학습 유형은 '고수준 자기조절학습형(군집 1)', '중수준 자기조절학습형(군집 2)', 그리고 '저수준 자기조절학습형(군집 3)'으로 나타났다. 온라인 자기조절학습 유형에 따른 학업성취도 수준은 '고수준 자기조절학습형(군집 1)'이 가장 높고, '저수준 자기조절학습형(군집 3)'이 가장 낮은 것으로 확인되었다. 이러한 결과를 바탕으로 효과적인 온라인 소프트웨어 교육 운영을 위한 시사점을 제시하였다.

Gazebo 기반 UAV 군집 비행 시뮬레이션 개발 및 비행 고도 계층화 개발 (Development of UAV Cluster Flight Simulation and Altitude Layer based on Gazebo)

  • 최효현;김응빈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.271-272
    • /
    • 2021
  • 본 논문에서는 Gazebo 시뮬레이터 기반 UAV 군집 시뮬레이션 구현 및 비행 고도 계층화를 구현한 결과를 보인다. Gazebo 시뮬레이션과 Autopilot Program인 Pixhawk4 SITL(Software In The Loop)을 이용하여 UAV를 시뮬레이터에 생성한 뒤 사전에 정의된 Mission에 대한 정보에 따라 비행이 되도록 구현하였다. 또한, Gazebo 시뮬레이터의 Box Object를 이용하여 UAV의 비행 고도를 시각적으로 계층화하여 표현하였다.

  • PDF

계층적 군집화를 이용한 근사 단어 필터링 기법 (Proximate Word Filtering by Hierarchical Clustering)

  • 김성환;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1101-1104
    • /
    • 2012
  • 단어 필터링은 유해정보를 차단위한 기본적인 기능이다. 그러나 악의적인 사용자는 필터링 시스템을 우회하기 위하여 금지 단어에 의도적인 변형을 가한다. 이에 대응하기 위해 일정 오류를 허용하여 필터링을 수행하는 근사 단어 필터링이 있다. 근사 단어를 검색하기 위한 문자열 색인 방법으로는 주로 기준 단어(Pivot)을 이용한 유클리드 공간에의 사상을 이용하는데, 이는 단어 필터링에 응용하기에는 근본적인 구조상의 한계점이 있다. 본 논문에서는 필터링 대상이 되는 단어 집합 내에서 군집화를 수행하여 계층적인 자료구조를 구성하고, 단어 필터링을 위한 필터링 질의(Filtering query)를 정의한 뒤 그에 적합한 탐색 상의 적용에 관하여 설명한다. 실험 결과 기존의 기준 단어(Pivot)을 이용한 색인 기법에 비하여 16.9%~26.6%의 탐색 속도 향상을 확인할 수 있었다.