• 제목/요약/키워드: 계층형군집

검색결과 31건 처리시간 0.024초

정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구 (Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval)

  • ;강대현;박한샘;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

청소년이 지각한 부모의 양육태도 유형별 자아존중감 및 그릿 (Self-esteem and grit for each type of parenting attitude recognized by adolescents)

  • 박일태
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.557-565
    • /
    • 2021
  • 본 연구는 청소년을 대상으로, 부모의 양육태도 유형에 따른 자아존중감과 그릿 정도의 차이를 파악하고자 시도되었다. 한국청소년정책연구원의 한국아동·청소년패널조사(Korea Children Youth Panel Survey: KCYPS) 자료 중 2018년도 조사에 참여한 중학교 1학년 2,438명의 자료를 분석하였다. 수집된 자료는 계층적 군집분석(Hierachical Cluster Analysis)과 비계층적 방법(k-mean cluster analysis)으로 분석하였다. 그 결과, 청소년이 지각한 부모의 양육태도 유형은 '소극적 애정 수용형', '적극적 애정 수용형', '독재적 비일관형', '애정부족 거부형' 4개 유형으로 분류되었다. 또한, 양육태도의 4개 군집별로 자아존중감과 그릿의 정도에 유의한 차이가 있었다. 자아존중감과 그릿 모두 '적극적 애정 수용형'인 군집 2에서 가장 높게 나타났다. 향후, 청소년의 자아존중감과 그릿을 향상시키기 위해 각 군집별로 차별화된 부모교육이 필요하며, 교육 프로그램 개발에 본 연구가 기초자료로 활용될 수 있을 것이다.

계층적 군집분석을 이용한 반도체 웨이퍼의 불량 및 불량 패턴 탐지 (Wafer bin map failure pattern recognition using hierarchical clustering)

  • 정주원;정윤서
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.407-419
    • /
    • 2022
  • 반도체는 제조 공정이 복잡하고 길어 결함이 발생될 때 빠른 탐지와 조치가 이뤄져야 결함으로 인한 손실을 최소화할 수 있다. 테스트 공정을 거쳐 구성된 웨이퍼 빈 맵(WBM)의 체계적인 패턴을 탐지하고 분류함으로써 문제의 원인을 유추할 수 있다. 이 작업은 수작업으로 이뤄지기 때문에 대량의 웨이퍼를 단 시간에 처리하는 데 한계가 있다. 본 논문은 웨이퍼 빈 맵의 정상 여부를 구분하기 위해 계층적 군집 분석을 활용한 새로운 결함 패턴 탐지 방법을 제시한다. 제시하는 방법은 여러 장점이 있다. 군집의 수를 알 필요가 없으며 군집분석의 조율 모수가 적고 직관적이다. 동일한 크기의 웨이퍼와 다이(die)에서는 동일한 조율 모수를 가지므로 대량의 웨이퍼도 빠르게 결함을 탐지할 수 있다. 소량의 결함 데이터만 있어도 그리고 데이터의 결함비율을 가정하지 않더라도 기계학습 모형을 훈련할 수 있다. 제조 특성상 결함 데이터는 구하기 어렵고 결함의 비율이 수시로 바뀔 수 있기 때문에 필요하다. 또한 신규 패턴 발생시에도 안정적으로 탐지한다. 대만 반도체 기업에서 공개한 실제 웨이퍼 빈 맵 데이터(WM-811K)로 실험하였다. 계층적 군집 분석을 이용한 결함 패턴탐지는 불량의 재현율이 96.31%로 기존의 공간 필터(spatial filter)보다 우수함을 보여준다. 결함 분류는 혼합 유형에 장점이 있는 계층적 군집 분석을 그대로 사용한다. 직선형과 곡선형의 긁힘(scratch) 결함의 특징에 각각 주성분 분석의 고유값과 2차 다항식의 결정계수를 이용하고 랜덤 포레스트 분류기를 이용한다.

온라인 소프트웨어 교육에서 학습자의 자기조절학습 관련 특성에 기반한 온라인 학습 유형 분석: 계층적 군집 분석 기법을 활용하여 (Investigating Online Learning Types Based on self-regulated learning in Online Software Education: Applying Hierarchical Cluster Analysis)

  • 한정윤;이성혜
    • 컴퓨터교육학회논문지
    • /
    • 제22권5호
    • /
    • pp.51-65
    • /
    • 2019
  • 본 연구에서는 온라인 소프트웨어 교육 환경에서 학습자의 자기조절학습특성에 따른 온라인 학습 유형을 파악하고 각 유형의 특징을 살펴봄으로써 보다 전략적인 온라인 소프트웨어 교육을 위한 시사점을 제공하고자 하였다. 이를 위해 K대학의 온라인 소프트웨어 교육과정에 참여하고 있는 K-12 학생 809명의 온라인 학습 로그 데이터로부터 자기조절학습 특성 변인을 추출한 후, 계층적 군집 분석 기법(hierarchical cluster analysis)을 활용하여 자기조절학습 특성에 따른 학습자 군집 도출 및 군집 유형에 따른 온라인 학습 특성과 학습 결과의 차이를 비교 분석하였다. 그 결과, 온라인 소프트웨어 교육 학습자들의 자기조절학습 유형은 '고수준 자기조절학습형(군집 1)', '중수준 자기조절학습형(군집 2)', 그리고 '저수준 자기조절학습형(군집 3)'으로 나타났다. 온라인 자기조절학습 유형에 따른 학업성취도 수준은 '고수준 자기조절학습형(군집 1)'이 가장 높고, '저수준 자기조절학습형(군집 3)'이 가장 낮은 것으로 확인되었다. 이러한 결과를 바탕으로 효과적인 온라인 소프트웨어 교육 운영을 위한 시사점을 제시하였다.

지방자치단체의 유형별 보행자사고 특성분석 및 보행환경조성사업 개선방안 연구 (A Study on the Implementation of Walking Environment Projects by Analyzing Characteristics of Pedestrian Accidents by Local Government Types)

  • 박진경;한명주
    • 대한교통학회지
    • /
    • 제32권6호
    • /
    • pp.615-627
    • /
    • 2014
  • 본 연구는 비계층적 K-평균 군집분석을 이용하여 보행자사고와 토지이용특성에 따른 지방자치단체의 유형을 분류하고 유형별 보행자사고의 세부특성을 Mann-Whitney U검증과 Kruskal-Wallis 검증을 이용하여 분석한 다음 그 결과로부터 보행환경 조성사업에 대한 개선방안을 제안하였다. 지역은 행정시와 행정구를 제외한 기초지방자치단체를 기준으로 230개 시 군 구로 구분된다. 비계층적 K-평균 군집분석 결과 230개 지방자치단체는 유형 1-A(상업지가 상대적으로 우세한 도시형), 유형 1-B(주거지가 우세한 도시형), 유형 2(농촌형)로 분류되었으며, 지자체 유형별 보행자사고 차이 검증결과 9m 미만 생활형 도로의 보행자사고 발생율은 공통적으로 60% 이상으로 도시형에 비해 농촌형에서 발생할 비율이 더 높았다. 또한 유형별로 유형 1-B는 교차로 내 보행자사고 사상자수가 많고 횡단 중 사고 비율도 높은 반면 길가장자리구역 통행 중 보행자 사상자수 비율은 유형 2에 해당하는 농촌형이 가장 높았다.

한강 유역에서의 강우 지역빈도 해석 방법의 비교 연구 (Comparative Study of Regional Frequency Analysis Methods of Rainfall in Han River Basin)

  • 엄명진;임승택;남우성;조원철;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1072-1076
    • /
    • 2008
  • 본 연구에서는 한강유역 109개 지점의 강우관측소에서 관측된 지속기간별 연최대강우량을 기본으로 각 지속기간별 L-모멘트값을 산정하고, 한강유역에 적합한 빈도해석기법을 정의하기 위하여 지역구분을 실시하였다. 지역구분을 위한 군집분석을 수행하기 위하여 각 지점별 기상학적 인자와 지형학적 인자를 변수로 사용하였다. 군집분석 기법인 Ward, 평균연결법, Fuzzy-c means, Two-Step방법을 이용하여 지역구분을 실시하였다. GIS를 이용하여 각 방법들을 이용하여 군집된 결과를 도시한 결과 Fuzzy-c means방법으로 구분된 지역구분이 적합한 것으로 나타났다. 또한 구분된 지역의 동질성 여부를 판단하고 적정 분포형을 선정하였으며 지점빈도해석 및 지역빈도해석을 통하여 빈도별 확률 수문량을 산정하였다. 산정된 결과의 정확도 알아보기 위해 모의발생을 시킨 후, 각 기법별로 산정된 상대 평균 제곱근 오차(Relative Root Mean Square Error, RRMSE)를 비교 분석한 결과 대체적으로 지수홍수법과 계층적 방법이 낮은 RRMSE를 나타냈다. 따라서 한강유역에서는 지수홍수법과 계층적 방법을 적용한 지역빈도해석이 적합한 것으로 판단된다.

  • PDF

대용량 데이터 처리를 위한 하이브리드형 클러스터링 기법 (A Hybrid Clustering Technique for Processing Large Data)

  • 김만선;이상용
    • 정보처리학회논문지B
    • /
    • 제10B권1호
    • /
    • pp.33-40
    • /
    • 2003
  • 데이터 마이닝은 지식발견 과정에서 중요한 역할을 수행하며, 여러 데이터 마이닝의 알고리즘들은 특정의 목적을 위하여 선택될 수 있다. 대부분의 전통적인 계층적 클러스터링 방법은 적은 양의 데이터 집합을 처리하는데 적합하여 제한된 리소스와 부족한 효율성으로 인하여 대용량의 데이터 집합을 다루기가 곤란하다. 본 연구에서는 대용량의 데이터에 적용되어 알려지지 않은 패턴을 발견할 수 있는 하이브리드형 신경망 클러스터링 기법의 PPC(Pre-Post Clustrering) 기법을 제안한다. PPC 기법은 인공지능적 방법인 자기조직화지도(SOM)와 통계적 방법인 계층적 클러스터링을 결합하여 두 과정에서는 군집의 내부적 특징을 나타내는 응집거리와 군집간의 외부적 거리를 나타내는 인접거리에 따라 유사도를 측정한다. 최종적으로 PPC 기법은 측정된 유사도를 이용하여 대용량 데이터 집합을 군집화한다. PPC 기법은 UCI Repository 데이터를 이용하여 실험해 본 결과, 다른 클러스터링 기법들 보다 우수한 응집도를 보였다.

온라인 문제기반학습에서의 학습행태 분석: 학습분석 기법을 적용하여 (Investigating Learning Type in Online Problem-Based Learning: Applying Learning Analysis Techniques)

  • 이성혜;최경애;박민서;한정윤
    • 컴퓨터교육학회논문지
    • /
    • 제23권1호
    • /
    • pp.77-90
    • /
    • 2020
  • 본 연구는 온라인 문제기반학습에서 학습자의 학습행태에 따른 학습유형을 파악하고 각 학습유형의 특징을 조사하여 효과적인 온라인 문제기반학습 설계를 위한 시사점을 도출하기 위해 수행되었다. 본 연구를 위해 6주 동안 K대학에서 운영된 문제기반학습 프로그램에 참여한 1,341명의 초·중학생의 온라인 활동 데이터가 수집되었고, 이를 통하여 학습자들의 학습행태를 나타내는 48개의 변인이 추출되었다. 추출된 변인은 학습자들의 학습유형을 구분하기 위한 계층적 군집분석 기법에 활용되었으며, 구분된 학습유형에 따라 학습행태와 학업성취도 측면에서 어떠한 차이가 있는지 비교·분석하였다. 그 결과, 학습자의 온라인 학습유형은 학습참여 수준에 따라 '고수준 학습참여형(군집 1)', '중수준 학습참여형(군집 2)', '저수준 학습참여형(군집 3)'으로 구분되었다. 또한, 학습참여 수준이 높은 군집이 높은 학업성취도를 얻은 것으로 확인되었다. 이러한 결과를 바탕으로 온라인 문제기반학습을 효과적으로 설계·운영하기 위한 시사점을 제시하였다.

식생활 라이프스타일에 따른 비만도와 외식선택속성에 관한 연구 - 부산지역 대학생을 중심으로 - (A Study on Obesity Index and Attributes of Selecting Places to Eat Out by Food-Related Lifestyle Types - Focusing on Pusan University Students -)

  • 이종호
    • 한국조리학회지
    • /
    • 제18권4호
    • /
    • pp.47-58
    • /
    • 2012
  • 본 연구는 부산지역 K대학교 학생들을 대상으로 식생활 라이프스타일유형에 따른 군집을 도출하고 각 집단과 외식선택속성과 비만도와의 차이를 고찰하고자 연구를 진행하였다. 연구의 목적을 달성하기 위하여 통계프로그램 PASW Statistic 18.0(Predictive Analytics Software)을 이용하여 빈도분석, 요인분석 및 신뢰도분석, t-test, ${\chi}^2$-test, 비 계층적 군집분석과 ANOVA을 실시하였다. 남자 대학생들의 평균키는 175.59 cm, 체중은 69.53kg이고, 여자 대학생들의 평균키는 162.81 cm, 체중은 53.42kg으로 나타내었다. 남학생 체질량지수를 저체중이 1.7%, 정상체중은 64.6%, 과체중 19.7%이고, 비만은 14.0%로 나타났다. 여학생 체질량지수는 저체중이 22.9%. 정상체중은 62.7%, 과체중이 8.5%, 비만은 5.9%를 나타내었다. 식생활라이프스타일 항목은 건강추구, 안전성추구, 분위기추구, 미각추구, 서양음식추구요인으로 추출되었고, 외식선택속성은 음식의 질과 서비스, 합리적인가격, 접근성과 분위기, 먹어본 경험 요인으로 추출되었다. 식생활라이프스타일은 군집1은 [식생활 무관심형 집단] 군집2는 [건강지향형 집단] 군집3은 [건강무관심형 집단]으로 군집 명을 부여하였다. 식생활라이프스타일 군집과 외식선택속성 요인간의 차이분석에서 군집1은 먹어본 경험에서 높은 평균값을 나타내었고, 군집2는 음식과 서비스의 질에서 높은 평균값을 나타내었고, 군집3은 접근선과 이미지에서 높은 평균값을 나타내었다.

  • PDF

K-평균 군집화 기반 WSN에서 클러스터 헤드 선택 방법 제안 (Proposal of Cluster Head Election Method in K-means Clustering based WSN)

  • 윤대열;박세영;황치곤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.447-449
    • /
    • 2021
  • 에너지 소비를 최소화하여 네트워크를 오랫동안 유지하기 위해 다양한 무선 센서 네트워크 프로토콜이 제안되었다. K-평균 군집화 알고리즘을 사용하면 최종 군집이 설정될 때까지 중심점을 반복적으로 이동해야 하기 때문에 기존 계층형 알고리즘보다 군집화에 시간이 더 오래 걸린다. K-평균 클러스터링 기반 프로토콜의 경우 클러스터 헤드가 선택되었을 때 클러스터 중심점 근처의 노드 또는 노드의 잔류 에너지만 고려된다. 본 논문에서는 앞서 언급한 문제를 개선하면서 에너지 효율을 개선하기 위해 K-평균 클러스터링을 기반으로 하는 새로운 무선 센서 네트워크 프로토콜을 제안한다.

  • PDF