• 제목/요약/키워드: k-means 군집 알고리즘

검색결과 191건 처리시간 0.03초

군집분석 (Cluster Analysis)을 활용한 사용자 등급 기반의 서비스 수락 정책 (User-Class based Service Acceptance Policy using Cluster Analysis)

  • 박혜숙;백두권
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.461-470
    • /
    • 2005
  • 본 논문에서는 마케팅에서 주로 적용되는 CRM(Customer Relationship Management)의 군집분석 방법을 활용하여 콘텐츠 서비스를 이용하는 고객들을 서비스 패턴에 따라 세분화(Segmentation)하고, 군집별로 미디어 서버의 자원을 차별적으로 할당하여, 기업의 수익성을 높이기 위한 새로운 정책을 제시하였다. 새로운 서비스 정책의 구현을 위해 첫째, 고객 데이터에 대해 군집분석 중에서 K Means Method를 적용하여 고객들의 서비스 패턴 (총 사이트 방문 횟수, 서비스 종류, 서비스 이용 기간, 지불금액, 평균 서비스 시간, 사이트 방문 당 서비스 요금)과 수익에 대한 기석도 둥을 분석하였다. 고객들은 수익에 대한 기여도에 따라 4개의 군집으로 분류되었다. 둘째, 군집별로 미디어 서버 자원을 할당하는 알고리즘인 CRFA(Client Request Filtering Algorithm)를 제시하였다. CRFA 는 고객이 속한 군집의 자원 한도 내에서 승인제어를 실시하는 기능을 수행하였다. 분석된 결과에 의하면 CRFA를 적용하였을 때 기업의 네트워크 비용은 감소하고 기업의 수익에 기여도가 높은 군집에 속한 고객들의 수락률이 높아졌음을 알 수 있었다.

딥러닝 기법을 이용한 낚시성 기사 제목 분류에 대한 연구 (A study on classification of hooking headlines using deep learning techniques)

  • 최용석;최한나;신지혜;정창민;안정연;유채영;임채은;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.15-17
    • /
    • 2015
  • 본 논문은 낚시성 기사 제목과 비낚시성 기사 제목을 판별하기 위한 시스템을 제시한다. 서포트 벡터 머신(SVM)을 이용하여 기사 제목을 분류하며, 분류하는 기준은 딥러닝 기법중의 하나인 워드임베딩(Word Embedding), 군집화 알고리즘 중 하나인 K 평균 알고리즘(K-means)을 이용한다. 자질로서 기사 제목의 단어를 사용하였으며, 정확도가 83.78%이다. 결론적으로 낚시성 기사 제목에는 낚시를 유도하는 특별한 단어들이 존재함을 알 수 있다.

  • PDF

K-means 클러스터링과 토픽 모델링을 기반으로 한 국민청원 사이트의 카테고리 재구성 (Reconstruction of Categories on the National Petition Site Using K-Means clustering and Topic Modeling)

  • 우윤희;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.302-305
    • /
    • 2019
  • 국민 청원 사이트가 뛰어난 접근성과 신속성으로 인하여 국민들로부터 많은 관심을 받고 있다. 현재 국민청원 사이트의 카테고리 분류는 '미래', '성장동력' 등을 포함한 16개의 카테고리 및 기타로 구성되어 있으나 그 기준이 모호하여 많은 청원글들이 기타 카테고리로 분류되고 있는 상황이다. 이는 청원글의 내용을 명확히 반영하지 않고 미리 정의된 카테고리 구조를 사용하고 있는데서 기인한다고 할 수 있다. 본 논문에서는 보다 구체적으로 정의된 카테고리를 정의하고자 추천 순으로 1,500개의 청원글을 수집하였고, 수집된 청원글의 내용을 바탕으로 카테고리 구조를 추출하였다. 먼저, k-평균 알고리즘을 적용하여 청원글을 군집하여 대분류를 정의하였고, 보다 구체적인 세부 분류를 정의하기 위하여 토픽모델링을 실시하였다. 본 논문에서 제시하는 계층적 카테고리 구조는 청원글의 내용을 바탕으로 대분류와 세부분류로 구성된 것이므로 새로운 청원글을 등록하거나 분류하는 데 적절한 것으로 보인다.

강수/비강수 사례 분류를 위한 RBFNN 기반 패턴분류기 설계 (Design of RBFNN-Based Pattern Classifier for the Classification of Precipitation/Non-Precipitation Cases)

  • 최우용;오성권;김현기
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.586-591
    • /
    • 2014
  • 본 연구에서는 인공 벌 군집(ABC: Artificial Bee Colony) 알고리즘을 이용하여 주어진 레이더 데이터로부터 강수 사례와 비강수 사례를 분류하는 방사형 기저함수 신경회로망(RBFNNs: Radial Basis Function Neural Networks)분류기를 소개한다. 기상청에서 사용하고 있는 기상 레이더 데이터의 특성 분석을 통해 입력 데이터를 구성한다. 방사형 기저함수 신경회로망의 조건부에서는 Fuzzy C-Means 클러스터링 방법을 이용하여 적합도를 계산하고, 결론부에서는 최소자승법(LSE: Least Square Method)을 이용하여 다항식 계수를 추정한다. 추론부에서 최종출력 값은 퍼지 추론 방법을 이용하여 얻어진다. 제안된 분류기의 성능은 기상청에서 사용하는 QC와 CZ 데이터를 고려하여 비교 및 분석되어진다.

가변어휘 핵심어 검출 성능 향상을 위한 비핵심어 모델 (Non-Keyword Model for the Improvement of Vocabulary Independent Keyword Spotting System)

  • 김민제;이정철
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.319-324
    • /
    • 2006
  • 본 논문에서는 화자독립 가변어휘 핵심어 검출기의 성능을 개선하기 위하여 두 가지의 새로운 비핵심어 모델링 방법을 제안한다. 첫째는 K-means 알고리즘 기반 monophone 군집화 방법을 개선하기 위해 monophone을 state단위로 결정트리를 기반으로 군집화하여 비핵심어를 모델링하는 방법이다. 둘째는 single state multiple mixture 방법을 개선하기 위해 음절단위 multi-state multiple mixture 방법으로 모델링하는 방법이다. 실험에서 ETRI 표준 한국어 공통음성 단어 DB를 이용하여 트라이폰 모델을 훈련하였고, 훈련에 사용하지 않은 음성데이터를 이용하여 핵심어 검출closed 테스트를 수행하였다. 그리고 사무실 환경에서 4명의 화자가 각각 100문장씩 발성한 400문장의 음성데이터를 이용하여 100단어 핵심어 검출 open 테스트를 수행하였다. 실험 결과 결정트리기반 상태 군집화 방법이 기존의 K-means 알고리듬 기반 monophone clustering 방법보다 핵심어 검출 성능이 28%/29%(closed/open test) 향상되었다 그리고 음절단위 multi-state multiple mixture 방법이 비핵심어 전체를 single state 모델로 구성하는 방법보다 핵심어 검출 성능이 22%/2%(closed/open test) 향상됨으로써 본 논문에서 제안한 두 가지 알고리듬이 우수한 결과를 나타내었다

상황인식기반 선형회귀의 적응적 가중치를 적용한 클러스터링 (Clustering with Adaptive weighting of Context-aware Linear regression)

  • 이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.271-273
    • /
    • 2021
  • 본 논문은 이동노드의 클러스터링내에서 보다 효율적인클러스터링을 제공하고 유지하기위한 딥러닝의 선형회귀적 적응적 보정가중치에 따른 군집적 알고리즘을 제안한다. 대부분의 클러스터링 군집데이터를 처리함에 있어 상호관계에 따른 분류체계가 제공된다. 이러한 경우 이웃한 이동노드중 목적노드와는 연결가능성이 가장높은 이동노드를 클러스터내에서 중계노드로 선택해야 한다. 본 연구에서는 이러한 상황정보를 이해하고 동적이동노드간 속도와 방향속성정보간의 상관관계의 친밀도를 고려한 자율학습기반의 회귀적 모델에서 적응적 가중치에 따른 분류를 제시한다. 본 논문에서는 이러한 상황정보를 이해하고 클러스터링을 유지할 수 있는 자율학습기반의 적응적 가중치에 따른 딥러닝 모델을 제시 한다.

  • PDF

그래프 컷을 이용한 학습된 자기 조직화 맵의 자동 군집화 (Automatic Clustering on Trained Self-organizing Feature Maps via Graph Cuts)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.572-587
    • /
    • 2008
  • SOFM(Self-organizing Feature Map)은 고차원의 데이타를 군집화(clustering)하거나 시각화(visualization)하기 위해 많이 사용되고 있는 비교사 학습 신경망(unsupervised neural network)의 한 종류이며, 컴퓨터비전이나 패턴인식 분야에서 다양하게 활용되고 있다. 최근 SOFM이 실제 응용분야에 다양하게 활용되고 좋은 결과를 보이고 있지만, 학습된 SOFM의 뉴론(neuron)을 다시 군집화해야 하는 후처리가 필요하며, 대부분의 경우 수동으로 이루어지고 있다. 후처리를 자동으로 하기 위해 k-means와 같은 기존의 군집화 알고리즘을 많이 이용하지만, 이 방법은 특히 다양한 모양의 클래스를 가진 고차원의 데이타에서 만족스럽지 못한 결과를 보인다. 다양한 모양의 클래스에서 좋은 성능을 보이기 위해, 본 논문에서는 그래프 컷(graph cut)을 이용하여 학습된 SOFM을 자동으로 군집화하는 방법을 제안한다. 그래프 컷을 이용할 때 터미널(terminal)이라는 두 개의 추가적인 정점(vertex)이 필요하며, 터미널과 각 정점 사이의 가중치는 대부분 사용자에 의해 입력받은 사전정보를 기반으로 설정된다. 제안된 방법은 SOFM의 거리 매트릭스(distance matrix)를 기반으로 한 모드 탐색(mode-seeking)과 모드의 군집화를 통하여 자동으로 사전정보를 설정하며, 학습된 SOFM의 군집화를 자동으로 수행한다. 실험에서 효율성을 검증하기 위해 제안된 방법을 텍스처 분할(texture segmentation)에 적용하였다. 실험 결과에서 제안된 방법은 기존의 군집화 알고리즘을 이용한 방법보다 높은 정확도를 보였으며, 이는 그래프기반의 군집화를 통해 다양한 모양의 클러스터를 처리할 수 있기 때문이다.

K-MEANS 알고리즘을 이용한 인지 재활 훈련 방법의 개선 (Improvement of Cognitive Rehabilitation Method using K-means Algorithm)

  • 조하연;이혁민;문호상;신성욱;정성택
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.259-268
    • /
    • 2018
  • 본 연구의 목적은 인지기능 훈련 콘텐츠들을 사용하는 동안 사용자들의 흥미와 몰입도를 높이기 위하여 인지 능력 수준에 맞춘 훈련 방법을 제시하는 것이다. 사용자의 인지 능력 수준은 K-means 알고리즘을 적용한 협업 필터링을 사용하여 사용자들의 정보와 한국형 아동 간이 정신 상태 검사 점수를 기반으로 군집화한 결과를 바탕으로 이루어졌다. 이 결과를 구현된 인지기능 훈련 통합 시스템에 적용하여 사용자의 인지 능력 수준에 알맞은 인지기능 훈련 영역 별 콘텐츠 순서와 난이도를 추천하였다. 특히 콘텐츠 난이도 조절은 사용자들이 긴장감과 편안함을 반복적으로 느낄 수 있도록 제안한 '몰입이론' 방법을 적용하여 높은 몰입감을 주고자 하였다. 결론적으로 본 논문에서 제안한 사용자 맞춤형 인지기능 훈련 방법은 기존의 치료사가 콘텐츠 순서와 난이도를 주관적으로 설정하는 것보다 더욱 효과적이고 재활 결과를 기대할 수 있을 것이다.

K-means 알고리즘과 GBR 알고리즘을 이용한 정수장 응집제 투입률 결정 기법 (Determination of coagulant input rate in water purification plant using K-means algorithm and GBR algorithm)

  • 김진영;강복선;정회경
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.792-798
    • /
    • 2021
  • 본 논문에서는 인공지능 기반의 빅데이터 분석과 예측을 통하여 정수장의 공정 중 약품투입곤정에서 응집제 투입률을 결정하는 알고리즘을 도출하였다. 또한, 빅데이터 기술 및 인공지능 알고리즘 적용 방법에 대한 분석 및 기존의 학문적, 기술적 자료를 검토하여 유사 분야 적용 사례를 분석 검토하였다. 이를 통한 최적 응집제 투입률 제시를 목표로 운영 근무자의 의사결정 패턴을 입력 변수와 출력변수의 관계 패턴으로 학습한 후 학습된 패턴을 실제 응집제 주입 공정에 적용하여 침전수 탁도가 목표치에 근사한 일정 수준을 유지할 수 있도록 운영이 가능하였다. 데이터 범위 산정과 전처리를 거친 변수를 선정하여 알고리즘 수행을 준비한 후 군집화와 분류 알고리즘을 적용하여 알고리즘 수행과 결과에 대한 피드백을 반복하여 학습을 진행하였다.

AI기반 물공급 시스템내 동파위험 조기경보를 위한 AI모델 개발 연구 (Development of an AI-based Early Warning System for Water Meter Freeze-Burst Detection Using AI Models)

  • 이소령;장현준;이진욱;김성훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.511-511
    • /
    • 2023
  • 기후변화로 동절기 기온 저하에 따른 수도계량기의 동파는 지속적으로 심화되고 있으며, 이는 계량기 교체 비용, 누수, 누수량 동결에 의한 2차 피해, 단수 등 사회적 문제를 야기한다. 이와같은 문제를 해결하고자 구조적 대책으로 개별 가정에서 동파 방지형 계량기를 설치할 수 있으나 이를 위한 비용발생이 상당하고, 비구조적 대책으로는 기상청의 동파 지도 알림 서비스를 활용하여 사전적으로 대응하고자 하나, 기상청자료는 대기 온도를 중심으로 제공하고 있기 때문에 해당서비스만으로는 계량기의 동파를 예측하는데 필요한 추가적인 다양한 변수를 활용하는데 한계가 있다. 최근 정부와 공공부문에서 22개 지역, 110개소 이상의 수도계량기함내 IoT 온도센서를 시범 설치하여 계량기 함내의 상태 등을 확인할 수 있는 사업을 수행했다. 전국적인 계량기 상태의 예측과 진단을 위해서는 추가적인 센서 설치가 필요할 것이나, IoT센서 설치 비용 등의 문제로 추가 설치가 더딘 실정이다. 본 연구에서는 겨울 동파 예방을 위해 실제 온도센서를 기반으로 가상센서를 구축하고, 이를 혼합한 하이브리드 방식으로 동파위험 기준에 따라 전국 동파위험 지도를 구축하였다. 가상센서 개발을 위해 독립변수로 위경도, 고도, 음·양지, 보온재 여부 및 기상정보(기온, 강수량, 풍속, 습도)를 활용하고, 종속변수로 실제 센서의 온도를 사용하여 기계학습 모델을 개발하였다. 지역 특성에 따라 정확한 모델을 구축하기 위해 위치정보 및 보온재여부 등의 변수를 활용하여 K-means 방법으로 군집화 하였으며, 각 군집별로 3가지의 기계학습 회귀모델을 적용하였다. 최적의 군집 수를 검토한 결과 4개가 적정한 것으로 판단되었다. 군집의 특성은 지역별 구분과 유사한 패턴을 보이며, 모든 군집에서 Gradient Boosting 회귀모델을 적용하는 것이 적합한 것으로 나타났다. 본 연구에서 개발한 모델을 바탕으로 조건에 따라 동파 예측 알람서비스에 실무적으로 활용할 수 있도록 양호·주의·위험·매우위험 총 4개의 기준을 설정하였다. 실제 본 연구에서 개발된 알고리즘을 국가상수도정보 시스템에 반영하여 테스트 수행중에 있으며, 향후 지속 검증을 할 예정에 있다. 이를 통해 동파 예방 및 피해 최소화, 물절약 등 직간접적 편익이 기대된다.

  • PDF