• 제목/요약/키워드: K-means 군집화

검색결과 273건 처리시간 0.024초

행동 시계열 데이터와 k-평균 군집화를 통한 젖소의 일일 행동패턴 검출 (Daily Behavior Pattern Extraction using Time-Series Behavioral Data of Dairy Cows and k-Means Clustering)

  • 이성훈;박기철;박재화
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.83-92
    • /
    • 2021
  • 지난 동안 낙농업계에서는 다양한 센서 기술과 ICT 응용이 도입되어왔으며 축적된 낙농 데이터를 토대로 과학적인 낙농생산관리가 가능해졌다. 그러나 이러한 시도들은 젖소의 출산이나 우유 생산량과 같은 낙농 생산성에 직접적으로 관여하는 요인들에 대해서만 집중적으로 이루어졌으며 이러한 결과에 근본적으로 관여하는 생리학적 혹은 동물심리학적 요인에 대해서는 연구가 더딘 실정이다. 이 논문에서는 이러한 연구의 일환으로서 젖소의 시간별 행동 데이터로부터 일일 행동패턴을 검출하는 기초적인 방안을 제시하였다. k-평균 군집화를 통해 한 젖소의 1594일간 행동을 네 개의 군집으로 구분하였으며 각 군집에 속한 데이터와 군집의 대푯값을 시각화하여 군집 형성의 합리성을 확인하였다. 또한 개체의 일별 군집 변화를 토대로 군집 개수의 적정성을 판단하였다. 이 연구 결과가 향후 젖소의 이상상태나 질병징후의 포착 연구에 기여하기를 기대한다.

디자인 패턴을 적용한 위성영상처리를 위한 군집화 분류시스템의 설계 (A Design of Clustering Classification Systems using Satellite Remote Sensing Images Based on Design Patterns)

  • 김동연;김진일
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.319-326
    • /
    • 2002
  • 본 논문에서는 위성영상을 처리하기 위한 무감독분류 기법인 군집분류 시스템을 설계하고 구현하였다. 구현된 시스템은 새로운 위성영상 포맷과 군집분류 기법의 지원이 용이하고, 확장성 있는 시스템의 설계를 위하여 팩토리 패턴과 전략적 패턴 등 다양한 디자인 패턴을 적용하였다. 군집분류 시스템은 순차군집분류 기법, K-Means 군집분류 기법, ISODATA 기법, Fuzzy C-Means군집분류 기법을 설계, 구현하였으며 Landsat TM 위성영상을 분류기의 입력영상으로 실험하였다. 그 결과 군집분류 기법은 사전지식이 없는 위성영상의 분류를 위한 표본영역의 추출작업과 위성영상의 실시간 분류에 효과적인 사용이 가능함을 보였으며, 재사용성 및 확장성이 우수한 시스템을 개발하였다.

단어 군집 기반 모바일 애플리케이션 범주화 (Word Cluster-based Mobile Application Categorization)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 단어 군집 정보를 활용하여 모바일 애플리케이션의 범주를 분류하는 방법을 제안한다. 제안하는 방법은 모바일 애플리케이션 설명이 짧을 수 있다는 점을 고려하여, 모바일 애플리케이션 설명에 포함된 단어 정보 뿐만 아니라 각 단어의 단어 군집 대표 정보를 범주화 자질로 활용한다. 그리고, 모바일 애플리케이션의 카테고리가 세분화되어 있으므로, 제안하는 방법은 범주별 단어 발생 빈도를 K 평균 군집화 알고리즘에 적용하여 단어 군집을 생성한다. 모바일 애플리케이션 설명이 설치사양과 같이 범주와 관련없는 내용이 있을 수 있다는 점을 반영하여, 제안하는 방법은 단어 군집 중에서 범주화에 유용한 일부 단어 군집만을 선별하여 활용한다. 실험결과 제안하는 방법은 단어 군집 정보를 활용하여 모바일 애플리케이션 범주화 재현율을 5.65% 개선시켰다.

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.12-17
    • /
    • 2003
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다

K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템 제안 (Proposal of a Monitoring System to Determine the Possibility of Contact with Confirmed Infectious Diseases Using K-means Clustering Algorithm and Deep Learning Based Crowd Counting)

  • 이동수;;김영광;신혜주;김진술
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.122-129
    • /
    • 2020
  • 전 세계적으로 무증상의 코로나바이러스 감염증-19 감염자가 자신이 감염된 것을 모르고 주변인들에게 전파할 수 있다는 가능성은 국민이 전염병 확산에 대한 불안과 두려움에서 벗어나지 못하고 있다는 점에서 여전히 매우 중요한 이슈이다. 본 논문에서는 K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템을 제안하였다. 모든 입력 학습 영상에 대해 300회 반복 학습한 결과, PSNR값은 21.51, 전체 데이터 셋에 대한 최종 MAE값은 67.984였다. 이는 확진자와 주변인과의 거리와 감염률 산출, 잠재적 환자 동선 주변 인원의 위험도 순 그룹 및 감염률 예측에 대한 영상 속 화질 정보, 관측치 간의 평균 절대 오차를 의미하며 각 CCTV 장면에서 군중의 수가 4,000명 이하일 때에는 평균 절대 오차 값이 0에 가까움을 증명하였다.

k-평균 군집화 기법을 활용한 SNS의 부적절한 광고성 콘텐츠 탐지 (Detection of inappropriate advertising content on SNS using k-means clustering technique)

  • 이동환;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.570-573
    • /
    • 2021
  • 오늘날 SNS를 사용하는 사람들이 증가함에 따라, 생성되는 데이터도 많아지고 종류도 매우 다양해졌다. 하지만 유익한 정보만 존재하는 것이 아니라, 부정적, 반사회적, 사행성 등의 부적절한 콘텐츠가 공존한다. 때문에 사용자에 따라 적절한 콘텐츠를 필터링 할 필요성이 증가하고 있다. 따라서 본 연구에서는 SNS Instagram을 대상으로 콘텐츠의 해시태그를 수집하여 데이터화 했다. 또한 k-평균 군집화 기법을 적용하여, 유사한 특성의 콘텐츠들을 군집화하고, 각 군집은 실루엣 계수(Silhouette Coefficient)와 키워드 다양성(Keyword Diversity)을 계산하여 콘텐츠의 적절성을 판단하였다.

mRMR과 수정된 입자군집화 방법을 이용한 다범주 분류를 위한 최적유전자집단 구성 (A hybrid method to compose an optimal gene set for multi-class classification using mRMR and modified particle swarm optimization)

  • 이선호
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.683-696
    • /
    • 2020
  • 표본의 다범주 표현형을 예측하는데 사용되는 최적의 유전자집단이란 적은 수의 유전자로 표현형을 정확히 예측할 수 있는 유전자들의 모임이다. 특이발현유전자를 검색하는 통계량은 이미 여러 가지가 있고, K-평균 군집화를 곁들여 중복성이 적은 특이발현유전자들을 선택 가능하다. 이들을 바탕으로 적은 수로 정확하게 다범주 분류가 가능한 유전자집단을 구성할 수 있도록 수정한 입자최적화 방법을 제안한다. 널리 알려진 ALL 248례와 SRBCT 83례를 이용하여 제안된 방법으로 최적유전자집단을 찾을 수 있음을 보였다.

온라인 문서 군집화에서 군집 수 결정 방법 (Determining the number of Clusters in On-Line Document Clustering Algorithm)

  • 지태창;이현진;이일병
    • 정보처리학회논문지B
    • /
    • 제14B권7호
    • /
    • pp.513-522
    • /
    • 2007
  • 군집화는 주어진 데이터를 분할하여 데이터 속에 숨겨져 있는 의미를 자동으로 발견하는 방법으로, 사람이 일일이 살펴보기 어려운 데이터를 분석해서 비슷한 성향을 가진 데이터들끼리 모은 여러 개의 군집들을 만들어 낸다. 온라인 문서 군집화는 검색 엔진을 통해 검색된 문서들을 대상으로 군집화를 실행하여 유사한 특성의 문서들을 묶어서 보여줌으로써 사용자의 검색 환경의 편의성을 증진시키는 것이 목적이다. 문서군집화는 사람의 개입이 없이 자동으로 이루어져야 하고, 군집화 결과에 영향을 미치는 군집의 개수 선정도 자동으로 이루어져야 한다. 또한, 온라인 시스템에서는 빠른 응답 시간을 보장하는 것이 중요하다. 본 논문에서는 기하학적인 정보를 이용하여 군집의 수를 결정하는 방법을 제안한다. 제안하는 방법은 군집의 중심을 저차원 평면에 사상하는 것과 사상된 군집 중심의 거리 정보를 이용하여 군집들을 병합하는 두 단계로 이루어져 있다. 제안하는 방법을 실데이터에 적용하여 실험한 결과 군집화 성능이 향상되고, 처리 시간도 온라인 환경에 적합한 것을 확인 할 수 있었다.

군집분석 비교 및 한우 관능평가데이터 군집화 (A Comparison of Cluster Analyses and Clustering of Sensory Data on Hanwoo Bulls)

  • 김재희;고윤실
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.745-758
    • /
    • 2009
  • 자발적인 군집을 유도하는 다변량 통계기법으로 널리 사용되는 군집분석은 데이터에 기반한 탐색적 방법으로 쓰이며 군집원칙에 따라 여러 가지 방법이 제안되어 왔다. 또한 군집화된 결과에 대하여 유효성을 측정하는 측도도 다양한방법이 개발되었다. 본 연구에서는 계층적 군집분석 방법으로 최장연결법과 Ward의 방법, 비계층적 군집분석 방법으로 K-평균법 그리고 확률분포정보를 활용한 모형기반 군집분석방법을 이용하여 모의실험으로 군집분석을 실시하고 군집유효성 측도로는 연결성, Dunn 지수, 실루엣을 구하여 각 군집방법에 대해 유효성을 비교한다. 또한, 한우 관능평가 데이터에 군집분석을 적용하여 최적의 군집 상황을 구하고자 한다.

시간 가중치와 가변형 K-means 기법을 이용한 개인화된 음악 추천 시스템 (A Personalized Music Recommendation System with a Time-weighted Clustering)

  • 김재광;윤태복;김동문;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.504-510
    • /
    • 2009
  • 근래 들어 개인 적응형 서비스에 대한 관심이 높아지고 있으나 아직 음악에 관련된 서비스는 보편화되어 있지 않다. 그 이유는 음악의 관련 정보를 분석하는 것이 텍스트 기반의 자료에 비해 어렵기 때문이다. 이에 본 논문은 사용자가 선택했던 음악을 분석해서 사용자의 성향을 파악하고 그와 유사한 음악을 추천해주는 시스템을 제안한다. 음악의 속성을 추출하는 방법으로 음파 분석 기법을 사용한다. 음파에서 세 가지의 수치화된 속성을 추출하여 이를 특성 공간에 나타낸다. 이 때 사용자가 선택한 음악이 많이 모여 있는 군집을 분석한다면, 사용자의 취향을 파악할 수 있다. 하지만 몇 개의 군집이 형성될 것인지를 예측하기란 쉽지 않다. 이를 해결하기 위하여 군집의 수를 상황에 따라 유동적으로 변경할 수 있는 가변형 K-means 기법을 제시한다. 이 기법은 군집의 직경 크기를 제한하여, 일정치 이상일 때 군집의 수를 늘리는 방법으로 데이터의 범위를 알고 있을 때 매우 효율적으로 적용할 수 있다. 이 방법을 이용하여 군집의 중심을 찾고 이와 가까운 음악을 추천한다. 또한 사용자의 성향은 꾸준하게 변화하므로 본 논문은 사용자가 근래에 선택한 음악의 반영 비율을 높이고자 무게의 개념을 이용한 시간 가중치 기법을 적용하였다. 그리고 음악의 발매 시기도 고려하여 음악을 추천하는 시스템을 제안한다. 제안 방법의 검증을 위하여 100개의 음악 조각을 통한 실험적 검증을 하였으며 그 결과 제안 방법이 효과적인 것을 보인다.