• Title/Summary/Keyword: 군집기능

Search Result 336, Processing Time 0.026 seconds

웹로그 데이터에 대한 군집분석 알고리즘에 관한 연구

  • Gang, Hyeon-Cheol;Han, Sang-Tae;Seon, Yeong-Su
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.313-318
    • /
    • 2003
  • 최근 인터넷은 기업이 고객과 접촉할 수 있는 새로운 수단으로써 기업의 홍보나 서비스를 제공하는 기능을 수행할 뿐만 아니라 사업을 위한 중요한 도구로 여겨지고 있다. 따라서 방문자의 웹사이트 이용형태를 파악하기 위한 다양한 기법들이 제시되고 있으며, 웹로그 데이터에 대한 자료분석 기법들이 여러 학문분야에서 연구되고 있다. 본 연구에서는 웹로그 데이터에 대한 군집분석을 위해 거리측도 및 분석 알고리즘을 제안하였으며, 실제 자료에 이를 적용하여 제안된 알고리즘의 특성을 살펴보았다.

  • PDF

Deciphering Functions of Uncultured Microorganisms (난배양성 미생물의 기능 분석 방법)

  • Kim, Jeong-Myeong;Song, Sae-Mi;Jeon, Che-Ok
    • Korean Journal of Microbiology
    • /
    • v.45 no.1
    • /
    • pp.1-9
    • /
    • 2009
  • Microbes within complex communities show quite different physiology from pure cultured microbes. However, historically the study of microbes has focused on single species in pure culture and most of microbes are unculturable in our labs, so understanding of complex communities lags behind understanding of pure cultured cells. Methodologies including stable isotope probing (SIP), a combination of fluorescence in situ hybridization (FISH) and microautoradiography (MAR), isotope micrarray, and metagenomics have given insights into the uncultivated majority to link phylogenetic and functional information. Here, we review some of the most recent literatures, with an emphasis on methodological improvements to the sensitivity and utilities of these methods to link phylogeny and function in complex microbial communities.

A Comparative Study on Statistical Clustering Methods and Kohonen Self-Organizing Maps for Highway Characteristic Classification of National Highway (일반국도 도로특성분류를 위한 통계적 군집분석과 Kohonen Self-Organizing Maps의 비교연구)

  • Cho, Jun Han;Kim, Seong Ho
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.29 no.3D
    • /
    • pp.347-356
    • /
    • 2009
  • This paper is described clustering analysis of traffic characteristics-based highway classification in order to deviate from methodologies of existing highway functional classification. This research focuses on comparing the clustering techniques performance based on the total within-group errors and deriving the optimal number of cluster. This research analyzed statistical clustering method (Hierarchical Ward's minimum-variance method, Nonhierarchical K-means method) and Kohonen self-organizing maps clustering method for highway characteristic classification. The outcomes of cluster techniques compared for the number of samples and traffic characteristics from subsets derived by the optimal number of cluster. As a comprehensive result, the k-means method is superior result to other methods less than 12. For a cluster of more than 20, Kohonen self-organizing maps is the best result in the cluster method. The main contribution of this research is expected to use important the basic road attribution information that produced the highway characteristic classification.

Tree-structured Clustering for Continuous Data (연속형 자료에 대한 나무형 군집화)

  • Huh Myung-Hoe;Yang Kyung-Sook
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.3
    • /
    • pp.661-671
    • /
    • 2005
  • The aim of this study is to propose a clustering method, called tree-structured clustering, by recursively partitioning continuous multivariate dat a based on overall $R^2$ criterion with a practical node-splitting decision rule. The clustering method produces easily interpretable clustering rules of tree types with the variable selection function. In numerical examples (Fisher's iris data and a Telecom case), we note several differences between tree-structured clustering and K-means clustering.

Word Clustering Scheme for Twitter Sentiment Analysis Based on POS (트위터 감정 분석을 위한 POS 기반의 단어 군집화 기법)

  • Kim, Se-Jun;Lim, Hwan-Hee;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.31-32
    • /
    • 2019
  • 본 논문에서는 최근 빅데이터 활용 분야의 큰 이슈인 트위터 메시지의 효율적인 감정 분석을 위한 POS 기반의 단어 군집화 기법을 제안하였다. 기존에 군집화를 통한 다양한 텍스트 감정 분석 기법이 제시되어 왔으나, 군집화 된 기능과 분류 결과 간의 관련성에 대한 연구는 미흡하였다. 또한 모든 단어에 대한 감정 분석은 노이즈로 작용될 수 있는 단어로 인해 정확도가 감소할 수 있다. 본 논문에서는 이를 해결하기 위하여 Chi Square 기법을 통하여 분석 결과에 영향을 미치는 단어에 가중치를 부여함으로써 정확도를 향상시킨다.

  • PDF

Performance Analysis of Interleaved Short Length Codes over Burst Erasure Channel (군집 소실 채널 상에서의 인터리빙된 짧은 코드의 성능 분석)

  • Jang, Jae-Yoon;Jang, Min;Kim, Sang-Hyo;Lee, Sung-Jun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2009.11a
    • /
    • pp.281-283
    • /
    • 2009
  • 본 논문에서는 군집 소실 채널 상에서 동작할 수 있는 짧은 길이의 인터리빙 된 코드들의 성능을 분석한다. 먼저 좋은 성능을 갖는 짧은 길이의 그래프 부호와 해밍부호를 설계한다. 이 후 군집 소실에 잘 대응하기 위하여 인터리빙 기능을 채널 부호화 방법에 적용한다. 생성된 짧은 코드에 적용한 인터리빙 부호를 군집 소실에 최적의 성능을 보이는 Reed-Solomon (RS) 부호와 성능을 비교한다. 짧은 길이의 부호이므로, ML(Maximum Likelihood)방법과 BP(Belief propagation)의 두 가지 복호 방법들을 이용한 경우 성능의 차이 또한 비교해 본다.

  • PDF

A study of area assignment to the crowd sensor system (군집형 센서 시스템의 영역 지정의 연구)

  • Park, Sangjoon;Lee, Jongchan
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.01a
    • /
    • pp.249-250
    • /
    • 2020
  • 본 논문에서는 무선 이동 환경에서 군집형 센서 시스템의 영역 지정 방식에 대해 고려한다. 이동 기능을 보유한 다수의 군집형 센서 시스템들이 임무를 수행할 경우 이동 경로 상에서 센서 시스템들의 이동 영역을 설정한다. 이동 영역의 설정을 위해 센서 세스템들의 영역 지정을 위한 네트워크를 형성한다. 형성된 네트워크 안에서 센서 시스템들은 이동 지점을 통해 경로를 따라 이동을 수행한다.

  • PDF

Presenting the possibility of using water pipe network data through R-based data mining analysis (R기반 데이터마이닝 분석을 통한 상수관망 자료 활용가능성 제시)

  • Hong, Sung Jin;Lee, Chan Wook;Yoo, Do Guen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.236-236
    • /
    • 2020
  • 데이터마이닝은 빅데이터를 활용하는데 주로 활용되는 기술이다. 빅데이터 활용의 중요성이 증대됨에 따라 빅데이터를 기반으로 데이터마이닝을 활용한 생산, 금융, 통신 등의 성공적인 활용사례가 있지만 상수도 시설물에 적용한 사례는 드물다. 본 연구에서는 R프로그램을 기반으로 확보하기 어려운 데이터를 얻고자 관련 기사를 수집하고 데이터마이닝의 주요 기능인 분류, 군집(K-means)분석을 수행하였다. 예를들어, 상수관로의 정밀한 누수 분석을 위해서는 관경, 매설년도 등의 세분화된 자료가 필요하나 이러한 자료들은 쉽게 확보할 수 없다는 한계를 갖고 있다. 이러한 관점에서 상수관망 단수, 누수 등의 키워드를 통해 얻을 수 있는 기사를 기반으로 주요 키워드에 대한 군집분석을 수행하여 세분화된 상수관망 자료를 획득 및 분석하였다. 단수, 누수 키워드 기사에 의해 관경정보 등 파손된 관로의 정보를 확보할 수 있는 것으로 나타났으며 향후 확보하기 어려운 데이터를 보완할 수 있는 방법 중 하나로 활용될 수 있을것으로 기대된다. 그러나, 데이터의 양과 보다 정교한 군집분석을 위한 키워드설정 등의 추가연구가 필요할 것으로 판단된다.

  • PDF