• 제목/요약/키워드: K-means 군집분석

검색결과 313건 처리시간 0.027초

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.

영상의 히스토그램 군집화에 의한 영상 대비 향상 (A Image Contrast Enhancement by Clustering of Image Histogram)

  • 홍석근;이기환;조석제
    • 융합신호처리학회논문지
    • /
    • 제10권4호
    • /
    • pp.239-244
    • /
    • 2009
  • 영상 대비 향상은 영상 처리 분야에서 중요한 역할을 한다. 히스토그램 스트레칭이나 히스토그램 균등화 등 기존 대비 향상 기법들과 히스토그램 균등화 기반의 수많은 방법들은 저대비에 소수의 화소들이 넓게 퍼져 있는 영상에 대해서 만족할만한 결과를 내지 못한다. 따라서 본 논문은 군집화 방법에 기반한 새로운 영상 대비 향상 기법을 제안한다. 히스토그램의 군집수는 원영상의 히스토그램을 분석하여 얻을 수 있다. 히스토그램 성분들을 K-means 알고리즘을 이용하여 군집화한다. 그리고 히스토그램 군집 범위와 군집의 화소수 비율을 비교하여 히스토그램 스트레칭과 히스토그램 균등화를 선택적으로 적용한다. 실험 결과로부터 제안한 방법이 기존의 대비 향상 기법들보다 더 효과적임을 확인할 수 있었다.

  • PDF

당뇨 환자의 관리행태에 대한 군집 분류 (Group Classification on Management Behavior of Diabetic Mellitus)

  • 강성홍;최순호
    • 한국산학기술학회논문지
    • /
    • 제12권2호
    • /
    • pp.765-774
    • /
    • 2011
  • 본 연구는 효율적인 당뇨관리사업을 할 수 있는 기초자료를 제공하기 위해 수행되었다. 연구를 위해 2007년, 2008년도 국민건강영양조사를 통해 검진에 참여한 당뇨인지환자 666명의 자료를 수집하여 분석하였다. 당뇨인지 환자의 관리행태에 대한 군집분류는 K-means 기법을 이용하였고 관리행태에 대한 요인분석은 의사결정나무와 다중로지스틱 회귀분석을 이용하였다. 당뇨인지환자의 군집은 크게 3개로 분류되었다. 건강행태사업 대상군은 당뇨 치료와 합병증 검사는 잘 받고 있으나 음주, 흡연, 운동실천 등 건강행태 개선이 보다 적극적으로 이루어져야 하는 집단이다, 중점관리사업 대상군은 치료를 제대로 받지 않고, 합병증검사도 하지 않으며 혈당관리를 위한 건강행태 개선도 적극적으로 하지 않는 집단이다, 합병증검사사업 대상군은 치료를 잘 받고 있으며 건강행태도 개선하고 있지만 급만성 합병증을 조기 발견하기 위한 합병증검사를 소흘히 하는 집단이다. 군집을 분류하는데 가장 중요한 요인은 고지혈증 유무로 나타났으며 그 외 성, 소득, 연령, 직업, 주관적 건강상태도 주요한 변수였다. 당뇨 조절율을 향상시키기 위해서는 각 군집의 특성에 따라 보다 특화된 당뇨관리 프로그램이 적용되어야 할 것이다.

군집분류를 이용한 흙막이 벽체 배면 지반의 상대적 침하거동 분석 (Analysis of Relative Settlement Behavior of Retaining Wall Backside Ground Using Clustering)

  • 곽영준;한희수
    • 지질공학
    • /
    • 제33권1호
    • /
    • pp.189-200
    • /
    • 2023
  • 도시화와 산업화에 따라 도심지에 개발이 늘어나면서 지반침하로 인한 피해가 지속적으로 발생되고 있으며, 도심지에서의 건물붕괴는 대규모 인명 및 재산 피해로 이어질 위험이 크다. 굴착지반에 균등하지 않은 하중이 작용하고, 대상지반의 사전지식이 없는 경우의 지반거동에 대해서는 연구가 거의 이루어지지 않았다. 이에 따라 지반 조사 정보가 없는 흙막이 공사의 굴착 과정에서 발생되는 배면 지반의 침하거동을 분석하는 방법이 기존에는 없었고, 본 연구에서는 시계열 데이터를 가공하여 상대적 침하거동과 상호관련성을 분석하여 흙막이 벽체 배면 지반의 침하거동을 분석하고자 하였다. 본 논문에서는 평균침하량차지수와 평균상대침하량차를 정의 및 계산하였으며, 이를 좌표계에 도시하여 시간경과에 따라 측점간의 상대적 침하거동을 분석하였다. 또한 관측점들의 군집을 분류할 수 있는 기준이 필요하여 k-평균군집분석과 Dunn Index를 이용하여 분류하였다. 분석결과 계측지점의 침하량이 일정한 값으로 수렴하면서 모든 군집들이 안정영역으로 이동한 것을 확인할 수 있었으며, 군집은 세분화되었다. 이러한 분석결과를 바탕으로 연구대상의 각 측점 간 상관관계를 분석하여 연구대상 지반의 독자거동영역과 동일거동영역을 구분할 수 있었다. 이처럼 측점들 간의 상대적 침하거동을 분석을 통해 거동영역을 구분할 수 있다면, 주변지역의 융기, 지반파괴영역 예측, 터파기 공사 시 활동파괴의 방지 등 침하관리와 안정관리에 도움을 줄 수 있다고 판단된다.

강원도 강우관측 자료를 이용한 지역빈도분석 (Regional frequency analysis using rainfall observation data in Gangwon Province)

  • 전영일;김상욱;서동일;한재욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.211-211
    • /
    • 2023
  • 본 연구에서는 지역빈도분석을 이용하고 있는 홍수량 산정 지침에서 활용되고 있는 전국대상의 강우관소에 대한 확률강우량과 강원지역에 위치한 강우관측소만을 대상으로 산정한 확률강우량을 비교하였다. 이를 위해서 강원도 지역의 48개 지점의 지속기간별 강우자료를 수집한 후, K-means 기법을 이용하여 6개의 군집으로 구분하였다. 강원도 대부분이 산악지형임을 고려해 산악효과를 야기하는 지형인자와 강우자료의 관계를 파악하였다. 국가수자원관리종합정보시스템에서 수집한 강우자료를 사용하여 지속시간별 최대강우량과 산악효과를 야기하는 지형인자로 선정한 고도 이외에 위도, 경도를 각각 추가인자로 고려해 지역빈도분석을 수행하였다. 위 지형인자와 강우자료를 이용하여 수문학적 동질한 특성을 가지는 군집을 구성하였으며, 위도와 경도를 인자로 추가하면 더욱 강한 상관성을 보임을 알 수 있었다. 군집분석결과를 통해 모수를 추정하고 적절한 분포를 선택하였으며, 이상치검정과 적합도 검정을 통해 최종 분포를 결정하였다. 고도와 위도, 경도를 모두 고려해 이용한 지역빈도분석 결과 강원도의 실제 강우특성과 마찬가지로 고도의 높낮이에 따라 강우형태를 전국단위 지역빈도분석과 비교하였다. 최종적으로 현재 활용되고 있는 홍수량 산정 지침의 확률강우량과 강원지역에 위치한 강우관측소만을 대상으로 한 지역빈도분석의 차이의 발생원인과 강원지역에서의 특이성을 결론으로 제시하였다.

  • PDF

단어-역문서 빈도 벡터화를 통한 한국 걸그룹의 음반 메타 정보 군집화 (Clustering Meta Information of K-Pop Girl Groups Using Term Frequency-inverse Document Frequency Vectorization)

  • 현준서;조재혁
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.12-23
    • /
    • 2023
  • 2020 년대 K-Pop 시장은 보이그룹보다 걸그룹이, 3 세대보다 4 세대가 전반에서 주목받았다. 해당 논문은 걸그룹의 세대가 바뀌기 시작했는지 알아보고자 가사 군집화에 대한 방법과 결과를 제시한다. 2013 년부터 2022 년까지 발표된 47 개 그룹의 1469 곡에 대한 메타정보를 수집하여 가사 정보와 가사 외 메타정보로 분류하여 각각 수치화했다. 가사 정보는 선행연구를 기반으로 단어역문서 빈도 벡터화를 적용한 뒤 상위 벡터 값만 선정하는 전처리를 하였다. 가사 외 메타정보는 가사 정보만 사용했을 때의 편향성을 줄이고 더 좋은 군집화 결과를 보여주기 위해 One-Hot Encoding 으로 전처리하여 적용했다. 전처리된 데이터에 대한 군집화 성능은 Spherical K-Means 의 Silhouette Coefficient, Calinski-Harabasz Score 가 Hierarchical Clustering 에 비해 각각 129%, 45% 더 높았다. 본 연구는 한국 대중가요 발전사와 걸그룹 가사 분석 및 군집화 연구에 기여할 수 있을 것으로 기대된다.

  • PDF

군집분석을 이용한 아동의 창의적 사고유형 분석 (An Analysis of Children's Creative Thinking Styles According to Cluster Analysis)

  • 김경은;김은아;김성희
    • 아동학회지
    • /
    • 제35권2호
    • /
    • pp.103-115
    • /
    • 2014
  • This study explored the creative thinking styles of children according to cluster analysis and examined group differences in the gender of children. The participants consisted of 250 elementary school students living in Seoul, Korea. Data were analyzed by means of cluster analysis and ${\chi}^2$ test. The results from the cluster analysis based on the scores on the sub-factors of TTCT(Torrance Test of Creative Thinking) suggested the existence of four clusters('Non-creative', 'Divergent creative', 'Elaborate creative, 'Multiple creative'). Additionally, four clusters were found to be differentiated according to gender.

잠재적 의미와 k-means 군집화를 이용한 개념추출 검색 (Extraction of Concept by Latent Semantic Indexing and k-means Clustering)

  • 장유진;임호섭;박기림;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.22-24
    • /
    • 2001
  • 정보검색 시스템에서 사용자의 질의어가 불완전함에 따라 생기는 검색 효율의 저하를 줄이기 위하여 용어의 상호관련성을 반영함과 동시에 벡터의 공간을 축소하는 LSI 모델을 사용하여 문서 집합으로부터 잠재적 의미 공간을 구축하였다. 또한 의미 공간상에 있는 문서의 분포에 따라 \"개념\"을 추출하기 하기 위해 k-means algorithm을 사용하여 군집화 시켰다. 이로부터 불완전한 초기 사용자 질의어를 의미 공간에 구축된 클러스터링 정보로 수정하여 새로운 질의어를 생성함으로 검색의 효율을 높이고자 하였다. 검색 효율을 측정하기 위해 TREC 데이터를 이용하여 분석하였으며 결과는 질의어의 성격에 따라 달라졌으나 대체적으로 우수한 성능을 보였다.한 성능을 보였다.

  • PDF

κ-공간중위 군집방법을 활용한 층화방법 (Stratification Method Using κ-Spatial Medians Clustering)

  • 손순철;전명식
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.677-686
    • /
    • 2009
  • 표본조사에서 널리 쓰이는 모집단의 층화는 추정의 효율을 높이는 방법 중의 하나지만, 이상점을 포함하는 변수가 있는 경우에 여러 가지 문제점을 유발시킬 수 있다. 특히, 이상점이 존재하는 다변량 자료의 경우, 층화를 위한 $\kappa$-평균 군집방법은 이상점에 매우 민감하여 추정의 효율을 떨어뜨릴 수 있다. 본 연구에서는 이상점이 존재하는 다변량 자료의 층화를 위해 $\kappa$-평균 군집방법보다 강건하며 이상점을 따로 식별하는 과정이 배제된 $\kappa$-공간중위수 군집방법을 제안한다. 기존 관련연구인 박진우와 윤석훈 (2008)과 동일한 자료에 대한 사례분석을 통해 층화과정들을 비교, 검토하였으며 이들의 효율성을 추정량의 분산을 통해 비교하였다.

k-means clustering DB를 통한 Multi-cell headrest의 상해지수 간 상관관계 분석 (Correlation Analysis between Injury Index of Multi-cell Headrest through k-means Clustering DB)

  • 조성욱;전성식
    • Composites Research
    • /
    • 제37권1호
    • /
    • pp.46-52
    • /
    • 2024
  • 운송 수단의 발전은 인간의 교통 편의 증진과 더불어 이동이 불편한 장애인들의 이동 반경 확대를 가능하게 하였다. 그러나 휠체어 탑재 차량의 경우 차량 사고 시 발생할 수 있는 안전성은 일반 승객 좌석에 비해 여전히 낮다. 특히 무방비 상태에서 발생할 수 있는 후방 추돌 사고의 경우 장애인 탑승객의 목 부상에 치명적으로 작용할 수 있다. 따라서 휠체어 탑재 차량에 적용될 headrest에는 보다 세밀한 설계안이 반영되어야 한다. 본 연구에서는 휠체어 운송 차량의 저속 후방 추돌 시 headrest의 국부적 압축 특성 분포 구현을 위해 multi-cell headrest가 제안되었다. 이후 해석을 통한 데이터셋 구축과 k-means clustering을 적용한 군집화 결과를 이용해 탑승객의 목 상해지수와 충격 에너지 흡수량 간 상관관계 분석이 수행되었다. 군집화 결과 유사한 특성을 지닌 데이터 군집이 형성된 것을 확인하였으며, 각 군집의 특성을 통한 목 상해지수와 충격 에너지 흡수량 간의 상관관계 분석이 수행되었다. 분석 결과 Mid3와 Mid6에서의 cell 압축 특성이 soft할수록 충격 에너지 흡수량이 증가하는 것을 확인하였으며, Front2, Mid3, Mid6에서의 cell 압축 특성이 hard할수록 목 상해지수 감소에 효과적임을 확인하였다.