• 제목/요약/키워드: 데이터 군집화

검색결과 566건 처리시간 0.031초

EM(Expectation Maximization) 군집화(Clustering)을 통한 인간의 이동 패턴 연구 (A Study on Characterizing the Human Mobility Pattern with EM(Expectation Maximization) Clustering)

  • 김현욱;송하윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.222-225
    • /
    • 2011
  • 이전에 수행된 연구에서 인간의 이동 패턴은 Levy flight 행동을 보인다고 알려져있다. 그러나 우리의 경험적 지식을 바탕으로 생각해 볼 때 인간의 이동 패턴을 Levy flight 행동만 가지고 나타내기에는 한계가 있어 보인다. 인간의 이동 패턴은 주위환경, 시간, 개인의 습관, 그리고 사회적 지위 등에 따라 서로 다른 모양을 보인다. 즉, 인간 이동의 형태를 파악하기 위해서는 좀 더 다양한 정보가 있어야만 인간 이동의 패턴을 사실적으로 모델링 할 수 있다. 인간의 이동 패턴을 사실적으로 모델링하기에 필요한 정보를 얻기 위해서 상향식 방법(Bottom up)으로 우선 실제 이동 패턴을 분석하여 모델링에 필요한 정보를 추출하고 다시 그 정보를 검증하는 과정으로 모델링에 필요한 정보가 구체적으로 나타나게 될 것이다. 이에 실제 인간의 이동 패턴을 분석하기 위해 아무런 매개변수 없이 개인의 GPS 데이터를 바탕으로 위치정보만을 가지고 군집화(Clustering)를 하게 되면 특정 위치에 대한 군집이 생성된다. 이러한 군집이 나타내는 것은 자주 머무는 지역, 이동 경로 등이 될 것이다. 본 논문에서는 인간의 이동 정보인 GPS 데이터를 가지고 EM 군집화를 통하여 생성된 군집을 통해 인간의 이동 패턴을 분석할 것이다.

효율적 군집화를 위한 탐색 방법 연구 (A Study of Search Methodology for Efficient Clustering)

  • 전진호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.571-573
    • /
    • 2010
  • 경제, 경영, 의료 및 공학 등 실세계의 많은 시스템들은 복잡한 현상을 갖는다. 이러한 특징의 시스템들을 이해하는 방법은 시스템에 대한 모델을 세우고 분석하는 것이다. 모델을 세우고 분석하는 과정은 두 단계로 이루어진다. 첫째, 데이터에 대하여 효율적 군집을 결정하는 과정, 둘째, 각 군집에 대한 적합한 모델을 생성하는 과정이다. 본 연구에서는 효율적 군집화를 위한 탐색 방법에 대하여 살펴본다.

  • PDF

개인화 영양정보 제공을 위한 소셜 네트워크 서비스 활용방안 (Implementation of Social Network Services for Providing Personalized Nutritious Information on Facebook)

  • 안효진;최재원
    • 한국전자거래학회지
    • /
    • 제19권4호
    • /
    • pp.21-30
    • /
    • 2014
  • 소셜 네트워크 서비스 사용자의 개인 데이터를 활용하는 것은 개인화된 영양정보의 제공을 위한 새로운 자원으로서 활용 가능하다. 기존 영양정보 제공 방식과 비교하여 사용자가 입력한 소셜 네트워크 서비스의 기록을 바탕으로 맞춤화된 정보를 제공하는 방법 및 개인화된 영양정보를 어떻게 제공할 것인지에 대한 연구는 매우 부족한 실정이다. 본 연구는 대표적인 소셜 네트워크 서비스인 페이스북의 사용자들이 입력한 텍스트 데이터를 바탕으로 개인화된 영양정보를 제공하기 위한 방안을 확인하고자 하였다. 이를 위하여 사용자의 페이스북 게시정보를 분석하여 개인별 영양정보를 효과적으로 제공하는 방식을 제시하였다. 연구의 목적에 따라, 본 연구는 수집된 데이터를 이용하여 데이터마이닝 기법 중 군집화를 수행하였다. 사용자 데이터에 대한 군집분석 결과, 나트륨과 당류가 사용자의 식단에서 중요한 변수로 추출되었다. 추가적으로 판매원/제조원에 따라 사용자의 식단과 관련하여 변수의 중요도에 차이가 있음을 확인하였다.

대용량 음악콘텐츠 환경에서의 데이터마이닝 기법을 활용한 추천시스템에 관한 연구 (A Study on Recommendation System Using Data Mining Techniques for Large-sized Music Contents)

  • 김용;문성빈
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.89-104
    • /
    • 2007
  • 본 연구는 대용량 음악콘텐츠환경에서 개인화 추천 서비스를 위한 기반구조의 제공을 위하여 시도되었다. 추천서비스를 위한 기존의 많은 연구와 상용프로그램에도 불구하고 대규모의 쇼핑몰들은 개인화 추천서비스와 실시간으로 대용량의 데이터를 처리할 수 있는 추천시스템을 필요로 하고 있다. 이를 위하여 본 연구에서는 데이터마이닝 기술과 새로운 패턴매칭 알고리즘을 제안하고 있다. 콘텐츠 주제분야에 대한 이용자의 선호도를 이용한 이용자 분할을 위하여 군집화 기법이 사용되었다. 다음으로는 군집화를 통하여 생성된 분할된 이용자 그룹에서 개별 이용자의 콘텐츠에 대한 접근 패턴의 추출을 위하여 순차패턴 마이닝기법을 적용하였다. 최종적으로 각각의 이용자 군집의 콘텐츠 접근 패턴과 콘텐츠 선호도에 기반한 제안된 추천 알고리즘에 의해 추천이 이루어진다. 이러한 추천을 위하여 기반 구조와 함께, 전처리과정과 원본 데이터의 형식변환이 데이터베이스에서 수행되어진다. 본 연구에서 제안하고 있는 기반구조의 적절성을 보여주기 위하여 제안된 시스템을 구현하였다. 실제 이용자에 의해 이용된 데이터를 실험에 적용하였으며, 해당 실험에서 추천은 실시간으로 이루어졌으며 추천결과에 있어서는 적절한 정확성을 보여주고 있다.

자기 조직화 지도 모형을 이용한 인종별 얼굴 영상 군집화 기법 (Face Data Clustering Method for Face Recognition Using Self Organizing Feature Map)

  • 권혜련;고병철;변혜란;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.577-579
    • /
    • 2003
  • 본 논문에서는 생체인식 분야 중 얼굴인식의 검색 정확성 향상 및 검색 시간을 단축하기 위한 단계로 인종별 얼굴영상 데이터베이스에 대한 군집화 기법을 연구하였다. 우선, 일반적으로 얼굴 및 이미지 검색에 사용되는 다양한 특징을 추출하고, 추출한 다차원의 특징 데이터들로부터 다 인종 얼굴 데이터를 유사한 인종별로 정확하게 군집화 하기 위해 최적의 특징벡터를 자동으로 선택 할 수 있는 방법을 제안하였다. 군집결과 분석을 위해 자기 조직화 지도 모형을 이용하였는데, 이는 2차원 분석 및 가시화에 유용하며, 학습 후 코드북벡터를 사용하여 유사한 의미간의 거리부터 검색할 수 있는 특징을 가지고 있다. 특징추출에 관한 실험결과 인종별 구분을 위한 특징벡터로는 웨이블릿 주파수 성분(lowpass 성분)과 CbCr 특징벡터가 인종별 군집화에 가장 유용한 특징으로 선택되었으며. 추출된 특징을 바탕으로 semantic map을 구성하여 제안방법의 효율성을 제시하였다.

  • PDF

스키마간 연관성을 이용한 테이블 군집화 기법 (Table Clustering Using Inter-schema Association)

  • 조순이;이도헌
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.85-87
    • /
    • 2001
  • 업무 데이터 분석을 통한 종합적인 의사결정을 지원할 수 있도록 데이터웨어하우스, OLAP, 데이터마이닝을 적용하려는 기업의 요구가 많아졌다. 그래서 기초 데이터의 이해, 선별, 수집, 가공, 정제가 매우 중요한 과정이나 테이블명 및 속성명이 표준화되어있지 않고 코드나 시스템 카탈로그와 같은 기본 데이터는 부정확하고 부족하다. 본 논문에서는 거의 스키마 정보에만 의존하여 테이블의 의미적 연관성에 근거한 유사한 특성을 가진 집단끼리 분류하는 대략적인 군집분석 방법을 제안한다. 질의 수행시 사용자가 설정한 임계 거리에 ㄸ라 관련된 군집만 검색함으로써 신속한 응답시간을 보장하고, 분석시점에서 다양한 질의에 유연하게 대처할 수 있다는 장점이 있다. 또한 실제 데이터에 본 연구를 적용하여 산출한 군집결과와 사람이 매뉴얼하게 그룹핑한 군집결과와 비교한다.

  • PDF

K-평균 군집화의 재현성 평가 및 응용 (Reproducibility Assessment of K-Means Clustering and Applications)

  • 허명회;이용구
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.135-144
    • /
    • 2004
  • K-평균 군집화(K-means clustering)는 고객 세분화(customer segmentation) 등 데이터 마이닝에서 중요한 한 몫을 하는 비지도 학습방법 (unsupervised learning method)이다. K-평균 군집화가 재현성(reproducibility)이 있는가를 보기 위하여, 다수의 기존 연구에서는 관측 자료를 2개 셋으로 나눈 자료 분할(data partitioning) 방법이 활용되고 있다. 본 교신에서 우리는 이보다 개념적으로 명확한 새로운 자료 분할 방법을 제안한다. 이 방법은 관측 자료를 3개 셋으로 나누어 그 중 2개 자료 셋을 독립적인 군집화 규칙을 생성하는 데 사용하고 나머지 1개의 자료 셋을 규칙간 일치성을 테스트하는데 사용한다. 또한 2개의 군집화 규칙간 일치성 평가를 위한 지표로서 엔트로피 기준의 환용 방법을 제시한다.

온습도에 따른 대중의 감성(감정+감각) 활동 변화 (A change of the public's emotion depending on Temperature & Humidity index)

  • 양중기;김근영;이영호;강운구
    • 디지털융복합연구
    • /
    • 제12권10호
    • /
    • pp.243-252
    • /
    • 2014
  • 소셜 미디어 데이터를 통해 파급되는 형태를 분석하여 국내 외 정치, 경제, 보건, 사회 문화현상을 대응하고자 하는 연구가 활발히 진행 중이다. 본 연구는 한국인이 가장 많이 사용하는 검색 서비스인 검색 정보를 알 수 있는 네이버 트렌드와 소셜 데이터인 네이버 블로그, 네이버 카페와 Open Data(API)를 사용하고 기상청의 온도, 습도 데이터를 사용하였다. 사람의 감성을 나타내는 감정 어휘와 감각을 표현하는 감각어휘 중 미각 어휘를 분석하여 대중의의 감성 활동 변화를 연구하였다. 적합도 검증과 계층적 군집분석으로 군집의 개수를 정하여 비 계층적 군집분석으로 군집화 하였다. 군집분석 결과 8개의 군집으로 군집화되어 감성어휘를 알 수 있었다. 판별분석에 의하면, 군집분석에서 결정된 8개의 그룹은 98.9% 정확성을 갖는 것으로 나타났다. 본 연구에서 연구한 감성 활동 변화는 온도와 습도에 의해 감성 활동을 예측 할 수 있어 감성을 공유하고 대중의 기분을 파악하여 서로 공감대를 형성 할 수 있다.

4D 이미징 레이더의 저밀도 PCD 데이터 군집화와 각 군집에 복셀 특징 추출 기법을 적용한 3D 객체 인식 기법 (3D Object Detection with Low-Density 4D Imaging Radar PCD Data Clustering and Voxel Feature Extraction for Each Cluster)

  • 오차영;권순재;정현정;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권6호
    • /
    • pp.471-476
    • /
    • 2022
  • 본 논문은 악천후에 약한 카메라와 라이다(LiDAR)의 문제점을 해결하기 위해 개발된 4D 이미징 레이더를 활용한 객체 인식 기법을 제안한다. 4D 이미징 레이더를 통해 데이터를 측정 및 수집하는 경우 라이다 데이터보다 포인트 클라우드 데이터의 밀도가 낮다는 단점이 있다. 밀도가 낮아 객체 사이의 거리가 넓은 특성을 이용하여, 객체를 군집화하고 해당 군집에서 voxel을 통해 객체의 특징을 추출하는 기법을 제안한다. 또한, 추출된 특징을 이용한 객체 인식 기법을 제안한다.