• 제목/요약/키워드: K-평균 군집방법

검색결과 192건 처리시간 0.031초

사용자 의도에 따른 행동 모델을 이용한 의도 인식 기법 (Intention-Awareness Method using Behavior Model Based User Intention)

  • 김건수;김동문;윤태복;이지형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.3-6
    • /
    • 2007
  • 사람들이 어떠한 행동을 할 때는 특정 의도를 가지고 있기 때문에 상황에 맞는 적합한 서비스를 제공하기 위해서는 사용자가 현재 하고 있는 행동에 대한 의도를 파악해야한다. 이를 위해 의도와 행동사이의 연관성을 이용하여 사용자의 의도에 따른 행동의 모델을 만든다. 일상생활에서 사람들이 하는 행동은 작은 단위 행동들의 연속(sequence)으로 이루어지므로, 사용자의 단위행동의 순서를 분석한다면 의도에 따른 행동 모델을 만들기가 용이해진다. 하지만, 이런 단위 행동 분석 방법의 문제점은 같은 의도를 가진 행동이 완벽하게 동일한 단위 행동의 순서로 일어나지는 않는다는 점이다. 시스템은 동일한 동작 순서로 일어나지 않는 행동들을 서로 다른 의도를 가진 행동으로 이해하게 된다. 따라서 이 문제점을 해결할 수 있는 사용자 의도 파악 기법이 필요하다. 본 논문에서는 과거의 사용자의 행동 정보를 기반으로 행동들의 유사성을 판별하였고, 그 결과를 이용하여 행동의 의도를 파악하는 방법을 사용한다. 이를 위해, 과거 사용자가 한 행동들을 단위 시간 별로 나누어 단위 행동의 순서로 만들고, 이를 K-평균 군집화 방법(K-means)으로 군집들의 순서로 나타내었다. 이 변경된 사용자 행동 정보를 사용하여 은닉 마코프 모델을 학습 시키고, 이렇게 만들어진 은닉 마코프 모델은 현재 사용자가 행한 행동이 어떤 행동인지를 예측하여 사용자의 의도를 파악한다.

  • PDF

ISSR 분석에 의한 전나무 집단의 유전변이 (Genetic Variation of Abies holophylla Populations in South Korea Based on ISSR Markers)

  • 김영미;홍경낙;이제완;양병훈
    • 한국산림과학회지
    • /
    • 제103권2호
    • /
    • pp.182-188
    • /
    • 2014
  • ISSR 표지를 이용하여 전나무 6개 집단의 유전다양성과 유전구조를 분석하였다. 6개 ISSR primer로 유전다양성을 추정한 결과, 집단별 다형성 유전자좌의 비율은 평균 85.6%, 이형접합도 기대치($H_e$)는 0.288로 나타났다. AMOVA 결과, 전체 유전변이에서 5.6%는 집단간, 94.4%는 집단내 개체간 차이에 기인하는 것으로 나타났다. 베이즈 추론에 근거한 유전분화는 ${\theta}^{II}$$G_{ST}$가 각각 0.045, 0.038로, 근연교배 정도는 0.509로 추정되었다. Mental 검증에서 집단간 지리적 거리가 멀수록 유전적으로 상이한 것으로 판명되었다(r = 0.74, P < 0.05). UPGMA 방법과 PCA 결과에 따라서 남원, 청도, 문경 집단을 한 군집으로, 인제, 홍천, 평창 집단을 다른 군집으로 나눌 수 있었다. 베이즈 군집분석에서는 유전변이 분포에 따라서 남원, 문경 집단이 한 군집으로 인제, 홍천, 평창, 청도 집단이 다른 한 군집으로 묶여서 2개의 상위 군집으로 나뉘었다. 빈도주의 분석에 따른 '군집'을 반영한 AMOVA 결과에서 전체 유전변이의 3.9%를 군집의 영향으로 설명할 수 있었으며, 전나무 집단의 지리적 분포는 베이즈 분석보다는 UPGMA 방법에 의한 구분과 일치하는 것으로 나타났다.

시판 복분자주의 기호도 분석을 통한 탐색적 등급 분류 (Exploratory Study on the Quality Grade of Korea Black Raspberry Wines by Using Consumer Preference Data)

  • 이승주
    • 한국식품과학회지
    • /
    • 제46권3호
    • /
    • pp.352-357
    • /
    • 2014
  • 수도권 거주 소비자 100명을 대상으로 전국에서 시판되는 24종의 복분자주의 소비자 기호도 조사를 실시하였다. 24개 복분자주 시료의 전반적인 기호도 평가의 분산분석을 통해 기호도 평가에 연령 및 성별간의 차이보다는 개인 간의 차이가 더 크게 작용한 것으로 나타났다. 전체 소비자 기호도 평가 결과를 바탕으로 군집분석을 실시하여 시료 간 유사한 기호도 평가를 보인 세 개의 군집으로 분류하였다. 세 개의 군집은 기호척도의 빈도수 분포와 실제 기호도 평균 점수에서 군집 간의 차이가 확인되었다. 이러한 군집 분류를 바탕으로 판별분석을 활용하여 군집의 분류가 적절한지 또한 판별함수의 예측력은 적정한지 파악하였다. 판별분석결과 분류율이 100%로 적절한 예측력을 보였고, 세 군집간의 마할라노비스거리와 추출된 요인 내에서의 분포도도 적정한 것으로 나타났다. 향후 다양한 우리술의 품질평가시스템 개발에 소비자 기호도 조사를 활용한 평가방법이 활용 가능하리라 여겨진다.

자기공명 심장 영상의 좌심실 경계추출에서의 k 평균 군집화와 병합 알고리즘의 사용으로 인한 전처리 효과 (Preprocessing Effect by Using k-means Clustering and Merging .Algorithms in MR Cardiac Left Ventricle Segmentation)

  • Ik-Hwan Cho;Jung-Su Oh;Kyong-Sik Om;In-Chan Song;Kee-Hyun Chang;Dong-Seok Jeong
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권2호
    • /
    • pp.55-60
    • /
    • 2003
  • 심장 질환의 정량적 분석을 위해서 자기공명 심장 영상에서 좌심실의 경계를 추출하는 것이 중요하다. Snake 또는 active contour 모델은 좌심실 경계 추출을 위해서 사용되어 왔다. 그러나 이 모델을 사용하는데 있어서 좌심실의 경계선이 좌심실 내부에 생긴 결절 때문에 경계선이 지역최소값으로 빠져서 원하는 경계선에 수렴하지 못 할 수도 있다. 그러므로 본 논문에서는 active contour 모델의 성능을 향상시킬 수 있는 k 평균 군집화와 병합 알고리즘을 이용한 전처리 방법을 제안하였다. 제안된 방법으로 지역 최소값 수렴 문제를 해결함을 확인하였다.

기계학습 알고리즘을 사용한 스포츠 경기장 방문객 마케팅 적용 방안 (A Study on Application of Machine Learning Algorithms to Visitor Marketing in Sports Stadium)

  • 박소현;임선영;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.27-33
    • /
    • 2018
  • 본 연구에서는 마케팅 분야 중 스포츠 경기장을 찾는 관람객의 빅 데이터를 분석하여 소비자에게 맞춤형 마케팅 서비스를 제공하는 연구를 진행한다. 이를 위해 본 연구에서는 K-평균 군집화 방법을 사용하여 유사 관람객 그룹을 도출하고자 하며, K-근접 이웃 방법을 사용하여 새로운 방문객의 관심 매장을 예측하고자 한다. 실험 결과를 통해 상기 두 가지 알고리즘을 사용하는 것은 유사 관람객 그룹을 도출하며 신규 관람객 입장 시 신규 관람객의 특성에 맞는 적합한 마케팅 서비스를 제공 할 수 있게 하였다.

효율적인 진화알고리즘을 이용한 적응형 퍼지 분류 규칙 생성 (Generating Adaptive Fuzzy Classification Rules using An Efficient Evolutionary Algorithm)

  • 류정우;김성은;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.769-771
    • /
    • 2005
  • 데이터 특성이 연속적이고 애매할 때 퍼지규칙으로 분류 규칙을 표현하는 것은 매우 유용하고 효과적이다. 그러나 일반적으로 정확하지 않은 데이터 특성에 대해서 소속함수를 결정한다는 것은 어려운 일이다. 본 논문에서는 진화알고리즘을 이용하여 효과적인 퍼지 분류 규칙을 자동으로 생성하는 방법을 제안한다. 제안한 방법에서 규칙의 정확성과 이해성을 고려하여 최적화된 소속함수를 생성하기 위해 진화알고리즘을 사용한다. 먼저 지도 군집화로 진화를 위한 초기 소속함수를 생성한다. 진화알고리즘은 전역적 최적 해를 찾는데 효과적이다. 그러나 시간에 대한 효율성이 낮다. 특히 모델 최적화 문제에서는 개체 평가 단계에서 많은 시간이 소요된다. 따라서 본 논문에서는 전체 데이터를 여러 개의 부분 데이터들로 나누고 개체들은 전체 데이터 대신 매번 부분 데이터를 임의적으로 선택하여 개체를 평가함으로써 수행 시간을 단축시킬 수 있는 진화 방법을 제안한다. 제안한 퍼지 분류 규칙 생성 방법의 타당성을 검증하기 위한 실험 데이터로 UCI에서 제공하는 데이터들을 사용하였으며, 실험 결과는 기존 방법에 비해 평균적으로 더 효과적임을 확인하였다.

  • PDF

최소 중복을 이용한 Hotspot 시간 데이터의 관리 (Management Strategy of Hotspot Temporal Data using Minimum Overlap)

  • 강지형;윤홍원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.196-199
    • /
    • 2005
  • 이 논문에서는 과학적 응용에서 발생하는 군집을 이루는 시간 데이터를 관리하는 방법을 제안한다. 먼저, 시간데이터를 구분하는 경계값 LB와 RB를 정의하고 과거, 현재, 미래 세그먼트에 각각 저장되는 개체버전을 정의하였다. 또한 Hotspot 분포를 가지는 시간 데이터에 대하여 각 세그먼트 사이에 이동하는 알고리즘을 나타내었다. 이 논문에서 제안하는 최소중복을 이용한 이동 방법과 기존방법에 대하여 성능을 비교하였다. 질의에 대한 평균 응답 시간에서는 기존의 방법과 비슷한 결과를 보였다. 제안한 이동 방법은 세그먼트 사이에 중복해서 저장되는 데이터 수를 적게 하므로 공간 이용율 측면에서는 기존의 이동 방법보다 효율적이었다.

  • PDF

빅데이터 K-평균 클러스터링을 위한 RHadoop 플랫폼 (RHadoop platform for K-Means clustering of big data)

  • 신지은;오윤식;임동훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.609-619
    • /
    • 2016
  • 본 논문에서는 대용량 데이터를 처리 및 분석하기 위해 RHadoop 플랫폼에서 실제 데이터와 모의 실험 데이터를 가지고 K-평균 클러스터링을 구현하고, MapReduce의 컴바이너 사용여부에 따른 처리 속도를 비교하고자 한다. 또한, K-평균 클러스터링에서 최적의 군집수 결정방법을 MapReduce 프로그램으로 구현하여 실제 데이터에 적용하고자 한다. 그리고 제안된 RHadoop 플랫폼의 확장 가능성을 보이기 위해 실제 데이터에서 R의 기본 패키지에서 kmeans() 함수와 bigmemory 패키지 상에서 유용한 bigkmeans() 함수와 처리 속도를 비교하고자 한다.

ISSR 표지자를 이용한 느릅나무 자연집단의 유전변이 분석 (Population Genetic Variation of Ulmus davidiana var. japonica in South Korea Based on ISSR Markers)

  • 안지영;홍경낙;이제완;양병훈
    • 한국산림과학회지
    • /
    • 제102권4호
    • /
    • pp.560-565
    • /
    • 2013
  • 국내의 느릅나무(Ulmus davidiana var. japonica) 집단에 대한 유전구조와 유전다양성을 분석하였다. 느릅나무 7개 자연집단, 171개체에 대하여 7개 ISSR 표지자를 이용하여 총45개의 다형적 증폭산물을 확인하였다. 유효대립인자와 다형적 유전자좌 비율의 평균값은 1.5개와 89%이었다. Shannon의 다양성 지수(I)가 0.435, 빈도주의 방법에 의한 이형접합도 기대치($H_e$)는 0.289, 베이즈 추정에 의한 이형접합도 기대치(hs)가 0.323으로 나타났다. AMOVA 분석에서 느릅나무 집단의 유전변이 중 4.2%가 집단간 차이(${\Phi}_{ST}=0.042$)에 기인하였으며, 95.8%를 집단내 개체들이 보유하고 있었다. 베이즈 추정에 의한 집단간 유전분화율(${\theta}^{II}$)은 0.043으로 나타났다. 국내 느릅나무 집단의 유전다양성은 다른 느릅나무속 수종과 유사한 수준에 해당하였으나, 집단간 유전분화 정도는 매우 낮았다. 베이즈 근사추정에서 집단별 고정지수(평균 $PS-F_{IS}=0.822$)나 집단 특이적 유전분화율(평균 $PS-F_{ST}=0.101$)에서 유의할 만한 차이를 보이는 집단은 없었다. 군집분석과 주성분분석에서 7개의 집단들을 3개 군집으로 나눌 수 있었으나, 두 방법의 군집 양상은 일치하지 않았다. 또한 베이즈 군집분석에서 집단간 유연관계와 지리적 분포의 상관성을 확인할 수 없었다.

카드소팅을 활용한 디지털 신기술 과정 핵심역량 군집화에 관한 연구 (A Study on Clustering of Core Competencies to Deploy in and Develop Courseworks for New Digital Technology)

  • 이지운;이호;권정흠
    • 실천공학교육논문지
    • /
    • 제14권3호
    • /
    • pp.565-572
    • /
    • 2022
  • 카드소팅(Card sorting)은 항목 간의 관계에 대한 사용자의 인식을 이해하는 데 유용한 데이터 수집 방법으로서, 일반적으로 카드소팅은 사용자 조사 및 평가에 매우 유용한 직관적이고 비용 효율적인 기술이다. 본 연구에서는 각 분야 직업별 핵심역량들은 코스 개발을 위하여 다음 단계인 카드소팅 단계에서 활용되는 역량카드로 사용하고, 결과를 군집화 하기 위해 K-평균 알고리즘을 적용하여 군집화 결과를 도출하였다. 카드소팅 결과 각 분야 직업별 핵심역량들에 대한 역량 군집화는 Participant-Centric Analysis (PCA)를 바탕으로 검증하였고, 이를 바탕으로 역량에 따른 직업별 코스 및 역량 분류 결과와 클러스터링에 의한 카드 유사성 정도는 각 직업별 핵심 역량 카드수에 대해 소팅 참여자 수 대비 군집화에 적합하게 동의한 참여자의 수와 카드 유사성 정도를 도출하였다.