• Title/Summary/Keyword: K-평균 군집방법

검색결과 192건 처리시간 0.031초

다중상황의 군집분석과 연관규칙을 이용한 지식추론 모델 (Knowledge Reasoning Model using Association Rules and Clustering Analysis of Multi-Context)

  • 신동훈;김민정;오상엽;정경용
    • 한국융합학회논문지
    • /
    • 제10권9호
    • /
    • pp.11-16
    • /
    • 2019
  • 사람들은 바쁜 현대사회 속에서 시간적 제재를 받고 있다. 이에 따라 사람들은 건강에 나쁜 영향을 미치는 간편한 인스턴트 식품을 섭취하고 간단한 운동조차하기 어려운 상황에 놓여있다. 또한 불필요한 정보과부화 현상으로 인해 개인의 특성에 적합하고 정확한 추론을 하는 것에 대한 중요성이 커지고 있다. 따라서 본 논문에서는 다중상황의 군집분석과 연관규칙을 이용한 지식추론 모델을 제안한다. 제안하는 방법은 상황정보에 따른 군집을 기반으로 연관규칙을 생성함으로써 사용자들에게 개인화된 헬스케어 방법을 제공한다. 이를 통해 각 질병에 대한 위험도를 추론함으로써 해당 질병에 대한 발병률을 낮출 수 있다. 또한 성능 평가를 통해 제안하는 모델이 비교 모델보다 수치상으로 F-measure 값이 0.027 더 높게 나타나며, 비교 모델 보다 우수하게 평가된다.

직관적 퍼지 C-평균 모델을 이용한 자기 공명 영상 분할 (MRI Data Segmentation Using Fuzzy C-Mean Algorithm with Intuition)

  • 김태현;박동철;정태경;이윤식;민수영
    • 전기전자학회논문지
    • /
    • 제15권3호
    • /
    • pp.191-197
    • /
    • 2011
  • 직관적 퍼지 c-평균 군집화 모델을 이용하는 자기공명 영상의 분할 방법이 본 논문에서 제안되었다. 본 논문에서 채택하는 fuzzy c-means with intuition (FCM-I)은 잡음의 영향을 줄이기 위하여 직관이라는 척도를 사용한다. 실제적 자기 공명 영상에 대해 영상 분할의 실험을 수행하고 기존의 몇몇 군집화 알고리즘과 성능을 비교하였다. 기존의 모델들과 성능을 비교한 결과, FCM-I 기반의 분할 방법은 잡음과 필요한 계수의 선택에 대해 상대적으로 강인하여, 영상 분할에 유용한 모델이 될 수 있음을 확인할 수 있었다.

기후인자가 일본잎갈나무의 연륜생장에 미치는 영향 분석 (Effect of Climate Factors on Tree-Ring Growth of Larix leptolepis Distributed in Korea)

  • 임종환;성주한;천정화;신만용
    • 한국산림과학회지
    • /
    • 제105권1호
    • /
    • pp.122-131
    • /
    • 2016
  • 본 연구는 연륜기후학적 방법에 의해 기후인자가 우리나라에 분포하는 일본잎갈나무의 연륜생장에 미치는 영향을 구명하기 위해 수행하였다. 본 연구에서는 먼저 일본잎갈나무의 연도별 생장특성을 분석하기 위해 제5차 국가산림자원자료에서 수집된 일본잎갈나무의 연륜생장 자료를 정리하였다. 한편 일본잎갈나무의 연륜생장과 기후변수와의 관계를 구명하기 위해 1950년부터 2010년까지 정리된 월평균 기온과 월강수량 자료를 시군 단위로 정리하였다. 기후조건의 유사성에 근거하여 일본잎갈나무의 시군별 연륜생장 자료를 군집분석한 결과 6 개의 기후 군집으로 구분할 수 있었다. 이와 함께 연륜생장 자료에 대한 크로스데이팅과 표준화 절차를 통해 각 군집별 지표연대기를 제작하였다. 각 군집별 지표연대기의 적합성은 연륜생장의 평균민감도, 자기상관계수, 신호 대 잡음비, 신호강도와 같은 기초통계량 분석을 통해 점검하였다. 최종적으로 각 군집별 일본잎갈나무의 연륜생장과 기후변수 간의 관계를 구명하기 위해 반응함수 분석을 실시하였다. 본 연구에서 얻어진 결과는 일본잎갈나무의 지역별 생장특성의 추정뿐만 아니라 기후변화에 따른 생장패턴의 변화 예측에 필요한 유용한 정보로 활용될 수 있을 것으로 기대된다.

딥러닝 기반의 딥 클러스터링 방법에 대한 분석 (Analysis of deep learning-based deep clustering method)

  • 권현;이준
    • 융합보안논문지
    • /
    • 제23권4호
    • /
    • pp.61-70
    • /
    • 2023
  • 클러스터링은 데이터의 정답값(실제값)이 없는 데이터를 기반으로 데이터의 특징벡터의 거리 기반 등으로 군집화를 하는 비지도학습 방법이다. 이 방법은 이미지, 텍스트, 음성 등 다양한 데이터에 대해서 라벨링이 없이 적용할 수 있다는 장점이 있다. 기존 클러스터링을 하기 위해 차원축소 기법을 적용하거나 특정 특징만을 추출하여 군집화하는 방법이 적용되었다. 하지만 딥러닝 기반 모델이 발전하면서 입력 데이터를 잠재 벡터로 표현하는 오토인코더, 생성 적대적 네트워크 등을 통해서 딥 클러스터링의 기술이 연구가 되고 있다. 본 연구에서, 딥러닝 기반의 딥 클러스터링 기법을 제안하였다. 이 방법에서 오토인코더를 이용하여 입력 데이터를 잠재 벡터로 변환하고 이 잠재 벡터를 클러스터 구조에 맞게 벡터 공간을 구성 및 k-평균 클러스터링을 하였다. 실험 환경으로 pytorch 머신러닝 라이브러리를 이용하여 데이터셋으로 MNIST와 Fashion-MNIST을 적용하였다. 모델로는 컨볼루션 신경망 기반인 오토인코더 모델을 사용하였다. 실험결과로 k가 10일 때, MNIST에 대해서 89.42% 정확도를 가졌으며 Fashion-MNIST에 대해서 56.64% 정확도를 가진다.

K-Means 군집모형과 계층적 군집(교차효율성 메트릭스에 의한 평균연결법, Ward법)모형 및 혼합모형을 이용한 컨테이너항만의 클러스터링 측정에 대한 실증적 비교 및 검증에 관한 연구 (An Empirical Comparison and Verification Study on the Containerports Clustering Measurement Using K-Means and Hierarchical Clustering(Average Linkage Method Using Cross-Efficiency Metrics, and Ward Method) and Mixed Models)

  • 박노경
    • 한국항만경제학회지
    • /
    • 제34권3호
    • /
    • pp.17-52
    • /
    • 2018
  • 본 논문에서는 K-Means 군집모형과 계층적 군집모형, 혼합모형으로, 아시아 38개 컨테이너항만 들의 2006년부터 2015년까지의 자료와 선석길이, 수심, 총면적, 크레인 수를 투입물, 컨테이너화물처리량을 산출물로 하여 국내대표 컨테이너항만 들(부산, 인천, 광양항)이 클러스터링 해야만 하는 항만들을 적출해 내는 측정방법을 보여 주고 비교, 분석, 검증하였다. 실증분석의 주요한 결과는 다음과 같다. 첫째, 10년간의 자료를 이용한 분석에서 클러스터링 후의 효율성 증가폭이 큰 순서대로 살펴보면 평균연결법[average linkage(AL)]은 42.04% 상승, Mixed Ward는 35.01% 상승, 경험법칙[rule of thumb(RT)]&Elbow는 30.47% 상승, Ward는23.65% 상승, Mixed AL는 23.25% 상승의 순서였다. 둘째, RT와 Elbow모형에 의한 국내항만들의 클러스터링을 살펴보면 (1)부산항은 두바이, 홍콩, 광저우, 칭타오, 포트 클랑, 싱가포르, 림찬방 (2)인천항은 하이파, 포트슐탄 카부스, 담만, 크호르 파칸, 탄중프리옥, 탄중퍼락, 동경, 나고야, 오사카, 카라치, 오아심, 마닐라, 다바오, 콜롬보, 킬롱, 방콕, (3)광양항은 아카바, 크호르 파칸, 광정우, 닝보, 칭타오, 포트 클랑, 카오슝, 림찬방 항과 클러스터링 해야만 하는 것으로 나타났다. 셋째, 최적 군집 수를 살펴보면 AL(6개), Mixed Ward(5개), RT&ELBOW (4개), Ward(5개), Mixed AL(6개)가 최적 군집 수인 것으로 나타났다. 넷째, 전문가 그룹에 의해서 선호되는 항만들과 본 실증분석결과에 의해서 도출된 국내항만들의 클러스터링 되는 항만들과의 일치성 여부는 부산항은 80%, 인천항은 17%, 광양항은 50%수준에서 일치하는 것으로 검증되었다. 본 논문이 제안하고 있는 정책적인 측면의 의미는 첫째, 항만정책입안자, 항만운영관리자들이 본 연구에서 사용한 모형들을 항만의 클러스터링에 도입하여 벤치마킹항만들을 선정해야만 한다. 둘째, 실증분석의 결과로서 도출된, 국내항만들의 참조항만, 클러스터링항만들에 대하여, 그들 항만들의 항만개발, 운영방안 등에 대한 내용을 비교 분석하고 벤치마킹이 필요한 부분은 신속하게 도입하여 실시하는 것이 필요하다는 점이다.

군집분석 (Cluster Analysis)을 활용한 사용자 등급 기반의 서비스 수락 정책 (User-Class based Service Acceptance Policy using Cluster Analysis)

  • 박혜숙;백두권
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.461-470
    • /
    • 2005
  • 본 논문에서는 마케팅에서 주로 적용되는 CRM(Customer Relationship Management)의 군집분석 방법을 활용하여 콘텐츠 서비스를 이용하는 고객들을 서비스 패턴에 따라 세분화(Segmentation)하고, 군집별로 미디어 서버의 자원을 차별적으로 할당하여, 기업의 수익성을 높이기 위한 새로운 정책을 제시하였다. 새로운 서비스 정책의 구현을 위해 첫째, 고객 데이터에 대해 군집분석 중에서 K Means Method를 적용하여 고객들의 서비스 패턴 (총 사이트 방문 횟수, 서비스 종류, 서비스 이용 기간, 지불금액, 평균 서비스 시간, 사이트 방문 당 서비스 요금)과 수익에 대한 기석도 둥을 분석하였다. 고객들은 수익에 대한 기여도에 따라 4개의 군집으로 분류되었다. 둘째, 군집별로 미디어 서버 자원을 할당하는 알고리즘인 CRFA(Client Request Filtering Algorithm)를 제시하였다. CRFA 는 고객이 속한 군집의 자원 한도 내에서 승인제어를 실시하는 기능을 수행하였다. 분석된 결과에 의하면 CRFA를 적용하였을 때 기업의 네트워크 비용은 감소하고 기업의 수익에 기여도가 높은 군집에 속한 고객들의 수락률이 높아졌음을 알 수 있었다.

초등과학영재 어머니들의 자녀 진로에 대한 인식 분석 (An Analysis on Perception of Mothers about Career for Elementary Science-Gifted Children)

  • 권윤아;김효남
    • 한국과학교육학회지
    • /
    • 제37권4호
    • /
    • pp.577-586
    • /
    • 2017
  • 이 연구의 목적은 개념도 연구법을 적용하여 초등과학영재 어머니들의 자녀 진로에 대한 인식을 구조화하는 것이다. 개념도 연구법은 참여자가 자유롭게 주제에 대해 말하고, 그 내용을 진술문으로 추출하여 직접 분류하는 과정을 거친다. 이 연구에 참여한 어머니들은 자녀가 초등학교 5, 6학년이며 과학영재교육대상자로 선발되었다. 다양한 영재 어머니들의 의견이 반영되도록 영재학급, 과학고 영재원, 대학부설 영재원 그룹의 어머니들을 따로 만나 연구를 진행하였다. 먼저 26명을 섭외하여 브레인스토밍을 통해 주제에 대해 이야기 하며 50개 진술문을 추출하였고 그 가운데 10명을 다시 만나 무선화한 진술문 카드를 각자 분류하도록 하였다. 분류결과는 비유사성행렬로 변환하여 SPSS 다차원 척도분석과 군집분석을 하여 개념도를 작성하였다. 그리고 총 140명의 어머니들로부터 리커트 5점으로 진술문에 대한 의견을 조사하였다. 연구 결과, 과학영재 어머니들이 갖고 있는 자녀 진로에 대한 인식은 총 6개의 군집과 50개의 진술문으로 이루어져 있으며 각각의 군집명은 '사교육, 성적, 진학에 대한 부담감', '영재교육원 및 학교의 진로교육에 대한 생각', '자녀 진로교육에 관한 부모역할', '가정에서 겪는 진로지도의 어려움', '진로지도를 위한 부모역량강화 요구', '사회적 지원요구'이다. 군집별 공감 정도 평균은 '사회적 지원요구'가 가장 높았으며 '가정에서 겪는 진로지도의 어려움'과 '사교육, 성적, 진학에 대한 부담감' 군집은 낮은 편이었다. 이 연구결과를 통해 논의하고자하는 시사점은 영재 어머니들이 자녀 진로를 인식할 때 진학, 사교육, 성적이 큰 부담으로 자리 잡고 있다는 점이다. 이러한 부담은 진로교육에 대한 부정적 염려로 이어지고 있으므로 우려스러운 부분이다. 또한, 어머니들은 가정에서 진로지도의 어려움을 겪고 있으며 이를 해결하고자 하는 요구가 높았다. 이를 위한 구체적인 지원 내용과 방법에 있어서는 개별화, 맞춤화된 방법과 문제해결능력 관련 부모역량을 강화하는 내용으로 이루어져야함을 시사한다. 또한 영재 진로지도를 위한 사회적 지원요구가 높으므로 이에 대한 적절한 지원방법에 대한 논의가 이루어져야 한다.

빈도해석과 지역 스케일 모델을 이용한 확률강우량 추정에 대한 연구 (A Study on Estimation of Quantile using Regional Scaling Model and Frequency Analysis)

  • 정영훈;김성훈;김한빈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.301-301
    • /
    • 2016
  • 국내의 경우 수공구조물을 설계하기 위해서는 빈도해석을 통해 설계수문량을 산정한다. 일반적으로 실무에서는 지점빈도해석을 수행하게 되는데 설계빈도보다 대부분 짧은 기간의 자료를 이용하여 산정한다. 지역빈도해석은 이러한 자료기간이 가지는 문제점을 극복하기 위하여 확률수문량의 정확도와 신뢰도를 향상시키는 기법이다. 스케일 모델은 지속기간별로 관측된 강우자료를 이용하여 재현기간에 대한 지속기간의 함수로 표현이 가능하며, 이를 통해 강우의 IDF곡선을 제시할 수 있는 수학적 모델이다. 대상지역의 강우관측소에서 관측된 강우자료가 일단위이면, 기준지속기간이 24시간이 되며, 기준지속기간에 대한 확률강우량으로부터 임의의 지속기간에 대한 확률강우량을 스케일 모델을 이용하여 추정할 수 있다. 따라서 짧은 자료를 보유한 지역이거나 미계측 지역에 대한 확률강우량을 추정을 위해 지역빈도해석과 지역 스케일 모델을 이용하여 확률강우량을 추정하여 지점빈도해석과 비교하고자 한다. 본 연구를 위해 한강유역의 강우 관측소를 이용하였으며, 군집분석 중 k-means방법을 적용하여 수문학적 동질성을 확보한 후 지역을 구분하였다. 구분된 지역은 지점 및 지역빈도해석을 수행한 후 상대평균제곱근오차(relative root mean square error, RRMSE)를 비교하여 정확도를 판단하였고, 정확도가 높은 빈도해석에 지역 스케일 모델을 적용하여 미계측 지점에 대한 임의의 시간에 대한 확률강우량을 추정하고자 한다.

  • PDF

교통카드자료를 이용한 통행패턴분석과 정책활용방안 연구 -경기도를 중심으로- (A Study on Travel Pattern Analysis and Political Application using Transportation Card Data: In Gyeonggi-Do Case)

  • 빈미영;문주백;조창현
    • 한국경제지리학회지
    • /
    • 제15권4호
    • /
    • pp.615-627
    • /
    • 2012
  • 본 연구는 교통카드 데이터를 이용하여 대중교통 이용과 관련하여 통행패턴을 분석하였으며 교통정책에 활용할 수 있는 방안을 제시하였다. 교통카드 데이터는 경기도권역을 대상으로 하였고 활용방안으로 교통정책 의사결정자가 버스정류소 시설을 개선할 때 교통카드데이터에서 얻어질 수 있는 여러 변수를 이용하여 대상지를 선정한다는 시나리오를 설정하여 분석하였다. 분석결과, 의사결정방법론인 K평균 군집분석과 CHAID(Chi-squared automatic interaction detection)를 이용하였으며, 유의수준 p<0.01에서 정책에 유용하게 이용될 수 있는 결과를 얻었다. 또한 본 연구에서는 이러한 결과들을 근거로 교통카드데이터를 실제로 정책에 활용되기 위해서 개선되어야 할 정책적 함의를 제시하였다.

  • PDF

다중 클라이언트 환경에서 동형 암호를 이용한 프라이버시 보장형 K-평균 클러스터링 (Privacy-Preserving K-means Clustering using Homomorphic Encryption in a Multiple Clients Environment)

  • 권희용;임종혁;이문규
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권4호
    • /
    • pp.7-17
    • /
    • 2019
  • 기계 학습은 다양한 현상의 예측 및 분석 등을 가장 정확하게 수행하는 기술 중 하나이다. K-평균 클러스터링은 주어진 데이터들을 비슷한 데이터들의 군집으로 분류하는 기계 학습 기법의 한 종류로 다양한 분야에서 사용된다. K-평균 클러스터링의 성능을 높이기 위해서는 가능하면 많은 데이터에 기반한 분석을 수행하는 것이 바람직하므로, K-평균 클러스터링은 데이터를 제공하는 다수의 클라이언트들과 제공받은 데이터들을 사용하여 클러스터의 중심값을 계산하는 서버가 있는 모델에서 수행될 수 있다. 그러나 이 모델은 클라이언트들의 데이터가 민감한 정보를 포함하고 있는 경우, 서버가 클라이언트들의 프라이버시를 침해할 수 있다는 문제점이 있다. 본 논문에서는 다수의 클라이언트가 있는 모델에서 이러한 문제를 해결하기 위해 동형 암호를 사용하여 클라이언트의 프라이버시를 보호하며 기계 학습을 수행할 수 있는 프라이버시 보장형 K-평균 클러스터링 방법을 제안한다.