• Title/Summary/Keyword: 모형기반 군집분석

Search Result 65, Processing Time 0.04 seconds

Identifying Hotspots on Freeways Using the Continuous Risk Profile With Hierarchical Clustering Analysis (계층적 군집분석 기반의 Continuous Risk Profile을 이용한 고속도로 사고취약구간 선정)

  • Lee, Seoyoung;Kim, Cheolsun;Kim, Dong-Kyu;Lee, Chungwon
    • Journal of Korean Society of Transportation
    • /
    • v.31 no.4
    • /
    • pp.85-94
    • /
    • 2013
  • The Continuous Risk Profile (CRP) has been well known to be the most accurate and efficient among existing network screening methods. However, the classical CRP uses safety performance functions (SPFs) which require a huge investment to construct a database system. This study aims to suggest a new CRP method using average crash frequencies of homogeneous groups, instead of SPFs, as rescaling factors. Hierarchical clustering analysis is performed to classify freeway segments into homogeneous groups based on the data of AADT and number of lanes. Using the data from I-880 in California, the proposed method is compared to other several network screening methods. The results show that the proposed method decrease false positive rates while it does not produce any false negatives. The method developed in this study can be easily applied to screen freeway networks without any additional complex database systems, and contribute to the improvement of freeway safety management systems.

Construction of Onion Sentiment Dictionary using Cluster Analysis (군집분석을 이용한 양파 감성사전 구축)

  • Oh, Seungwon;Kim, Min Soo
    • Journal of the Korean Data Analysis Society
    • /
    • v.20 no.6
    • /
    • pp.2917-2932
    • /
    • 2018
  • Many researches are accomplished as a result of the efforts of developing the production predicting model to solve the supply imbalance of onions which are vegetables very closely related to Korean food. But considering the possibility of storing onions, it is very difficult to solve the supply imbalance of onions only with predicting the production. So, this paper's purpose is trying to build a sentiment dictionary to predict the price of onions by using the internet articles which include the informations about the production of onions and various factors of the price, and these articles are very easy to access on our daily lives. Articles about onions are from 2012 to 2016, using TF-IDF for comparing with four kinds of TF-IDFs through the documents classification of wholesale prices of onions. As a result of classifying the positive/negative words for price by k-means clustering, DBSCAN (density based spatial cluster application with noise) clustering, GMM (Gaussian mixture model) clustering which are partitional clustering, GMM clustering is composed with three meaningful dictionaries. To compare the reasonability of these built dictionary, applying classified articles about the rise and drop of the price on logistic regression, and it shows 85.7% accuracy.

Study on driftwood behavior considering wood collision and bed deformation (충돌과 하상변동을 고려한 유목거동 연구)

  • Kang, Tae Un;Jang, Chang-Lae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.5-5
    • /
    • 2021
  • 최근 기후변화로 인해 예측이 어려운 국지성 호우가 빈번하게 발생하고 있다. 국지성 호우는 대량의 홍수를 일으키고 산사태와 유송잡물을 동반한 흐름을 야기할 수 있으며 이로 말미암아 인근의 초목과 식생들로부터 유목(driftwood)이 발생하기도 한다. 유목이 흐름과 함께 떠내려 오게 되면 그로 인한 운동에너지가 크게 발생하게 되며, 수공구조물과 주택가옥 등에 충돌시, 순수한 수류의 충돌보다 훨씬 큰 손상을 주기도 한다. 또한 유목이 수공구조물 인근 하상에 군집하면 통수능을 저하시키기도 하며 식생효과와 마찬가지로 유목주변으로 유속이 증가하면서 세굴현상이 발생하게 되는데, 이는 하상저하를 일으키며 수공구조물의 안정성에 지속적으로 피해를 줄 수 있다. 특히 군집된 유목들이 교각에 충격을 주면 흐름방향으로 교각에 작용하는 외력을 증가시키게 되고 군집된 유목들이 다른 유목들을 연쇄적으로 포착하는 동시에 흐름을 지속적으로 방해하여 수위상승을 야기하게 된다. 이는 유목주변으로 세굴을 발생시켜 교량의 붕괴를 촉진시킬 수 있다. 일본의 경우에는 대부분의 하천유역의 경사가 매우 급하기 때문에 홍수발생시 산사태와 유송잡물들이 빈번하게 발생하고 있다. 그에 따라 대량의 유목들이 하천으로 유입되어 하천의 수공구조물과 주거지역에 심각한 피해를 주는 경우도 많다. 따라서 유목의 거동과 군집현상을 이해하여 사전에 유목거동의 예측과 유목과 하상변동의 상호작용 분석을 통해 유목에 의한 수리구조물 피해를 예측하는 연구들이 필요할 것으로 판단된다. 본 연구는 유목의 거동과 군집양상을 예측분석하기 위해 유목과 흐름의 이동상 실내실험과 수치해석을 수행하여 유목유입량에 따른 하상변동과 유목의 하상퇴적양상 및 다양한 거동을 관측분석 하였다. 특히, 유목간의 상호충돌과 측벽충돌을 고려하는 수치모듈을 유목동역학모형에 적용하여 수치해석을 수행하였다. 이를 통해 이동상 하상에서의 유목의 군집과정을 분석하고 수치해석의 한계와 개선사항들을 논의하였다.

  • PDF

Study on Development of Classification Model and Implementation for Diagnosis System of Sasang Constitution (사상체질 분류모형 개발 및 진단시스템의 구현에 관한 연구)

  • Beum, Soo-Gyun;Jeon, Mi-Ran;Oh, Am-Suk
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.08a
    • /
    • pp.155-159
    • /
    • 2008
  • In this thesis, in order to develop a new classification model of Sasang Constitutional medical types, which is helpful for improving the accuracy of diagnosis of medical types. various data-mining classification models such as discriminant analysis. decision trees analysis, neural networks analysis, logistics regression analysis, clustering analysis which are main classification methods were applied to the questionnaires of medical type classification. In this manner, a model which scientifically classifies constitutional medical types in the field of Sasang Constitutional Medicine, one of a traditional Korean medicine, has been developed. Also, the above-mentioned analysis models were systematically compared and analyzed. In this study, a classification of Sasang constitutional medical types was developed based on the discriminate analysis model and decision trees analysis model of which accuracy is relatively high, of which analysis procedure is easy to understand and to explain and which are easy to implement. Also, a diagnosis system of Sasang constitution was implemented applying the two analysis models.

  • PDF

밀도 기반 공간 군집체계를 반영한 해양사고 위험 예측 모델 개발에 관한 연구

  • 양지민;최충정;백연지;임광현;노유나
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2023.05a
    • /
    • pp.146-147
    • /
    • 2023
  • 해양사고는 도로교통과 달리 지속적으로 증가하고 있으며, 인명피해가 주로 발생하는 주요 사고의 치사율은 도로교통의 11.7배 이상이다. 해양사고는 외부 환경에 따라 사고 위치가 변하고 즉각적인 조치가 어려워 타 교통에 비해 대형 사고로 이어질 가능성이 매우 크다. 그러나 여전히 사고가 발생하고 난 후 대응하는 등 사후적 관리 단계에 무르고 있어 사고의 주요 요인을 사전에 식별·관리하는 선제적 관리단계로의 전환 필요성이 대두되고 있다. 따라서 본 연구에서는 해양사고 발생 지점 밀도 기반의 가변 공간 군집체계를 반영한 해양사고 예측모델을 개발하였다. 반복적인 공간 가산분석을 통해 밀도가 높을수록 작은 규모의 격자 체계를 가질 수 있도록 상세한 공간 군집체계를 구성하였으며, 단순 사고 위험도 예측뿐만 아닌 사고 인과관계를 설명할 수 있는 BN(Bayesian Network) 기반의 모형을 사용하여 해양사고 위험예측 모델을 개발하였다. 또한, Cost-of-Omission을 통해 해양사고 예측확률의 변화와 각 변수들의 영향력을 확인하였으며, 월별 해양사고예측 결과를 GIS를 활용하여 2D/3D 기반으로 시각화하였다.

  • PDF

Recommender Systems using Structural Hole and Collaborative Filtering (구조적 공백과 협업필터링을 이용한 추천시스템)

  • Kim, Mingun;Kim, Kyoung-Jae
    • Journal of Intelligence and Information Systems
    • /
    • v.20 no.4
    • /
    • pp.107-120
    • /
    • 2014
  • This study proposes a novel recommender system using the structural hole analysis to reflect qualitative and emotional information in recommendation process. Although collaborative filtering (CF) is known as the most popular recommendation algorithm, it has some limitations including scalability and sparsity problems. The scalability problem arises when the volume of users and items become quite large. It means that CF cannot scale up due to large computation time for finding neighbors from the user-item matrix as the number of users and items increases in real-world e-commerce sites. Sparsity is a common problem of most recommender systems due to the fact that users generally evaluate only a small portion of the whole items. In addition, the cold-start problem is the special case of the sparsity problem when users or items newly added to the system with no ratings at all. When the user's preference evaluation data is sparse, two users or items are unlikely to have common ratings, and finally, CF will predict ratings using a very limited number of similar users. Moreover, it may produces biased recommendations because similarity weights may be estimated using only a small portion of rating data. In this study, we suggest a novel limitation of the conventional CF. The limitation is that CF does not consider qualitative and emotional information about users in the recommendation process because it only utilizes user's preference scores of the user-item matrix. To address this novel limitation, this study proposes cluster-indexing CF model with the structural hole analysis for recommendations. In general, the structural hole means a location which connects two separate actors without any redundant connections in the network. The actor who occupies the structural hole can easily access to non-redundant, various and fresh information. Therefore, the actor who occupies the structural hole may be a important person in the focal network and he or she may be the representative person in the focal subgroup in the network. Thus, his or her characteristics may represent the general characteristics of the users in the focal subgroup. In this sense, we can distinguish friends and strangers of the focal user utilizing the structural hole analysis. This study uses the structural hole analysis to select structural holes in subgroups as an initial seeds for a cluster analysis. First, we gather data about users' preference ratings for items and their social network information. For gathering research data, we develop a data collection system. Then, we perform structural hole analysis and find structural holes of social network. Next, we use these structural holes as cluster centroids for the clustering algorithm. Finally, this study makes recommendations using CF within user's cluster, and compare the recommendation performances of comparative models. For implementing experiments of the proposed model, we composite the experimental results from two experiments. The first experiment is the structural hole analysis. For the first one, this study employs a software package for the analysis of social network data - UCINET version 6. The second one is for performing modified clustering, and CF using the result of the cluster analysis. We develop an experimental system using VBA (Visual Basic for Application) of Microsoft Excel 2007 for the second one. This study designs to analyzing clustering based on a novel similarity measure - Pearson correlation between user preference rating vectors for the modified clustering experiment. In addition, this study uses 'all-but-one' approach for the CF experiment. In order to validate the effectiveness of our proposed model, we apply three comparative types of CF models to the same dataset. The experimental results show that the proposed model outperforms the other comparative models. In especial, the proposed model significantly performs better than two comparative modes with the cluster analysis from the statistical significance test. However, the difference between the proposed model and the naive model does not have statistical significance.

Development of on-demand control technique based on ICT for multiple wells (ICT기반 수요대응형 관정군집제어 기술 개발)

  • Park, Changhui;Kim, Sunghyun;Yi, Myeong-Jae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.32-32
    • /
    • 2020
  • 하나의 수계 또는 용수구역 내에서 작물생육기간 동안 지하수자원 수요량의 집중적인 증가로 인해 지역적 지하수 고갈이 발생하여 농작물 피해가 발생하고 있으며 과잉양수로 인한 지하수위 하강으로 사용자간 갈등도 빈번하다. 또한, 기후변화로 인해 극한기후인 가뭄의 잦은 발생은 이러한 현상을 가속화 한다. 지하수 산출성이 좋은 대수층의 공간적 분포는 복잡한 지질구조로 인해 균일하지 않으며 같은 대수층 내에서도 양수 위치에 따라 산출성은 다르게 나타난다. 이러한 지하수 수요와 공급 및 대수층 분포로 인한 지하수자원 불균형의 해소를 위해 지하수가 풍부한 지역에서 부족한 지역으로 지하수를 공급하는 방법을 적용할 수 있다. 이때 기술적용 지역의 지하수 사용 상황 및 공급 가능량을 정량적으로 평가하고 이를 기반으로 지하수 공급을 제어하는 것이 매우 중요하다. 지하수자원의 수요-공급 불균형이 발생할 때 즉각적으로 대응하기 위해서는 실시간으로 지하수 현황을 감시하고 이를 기반으로 공급 가능량을 산정할 필요가 있으며 이는 정보통신기술(Information and Communication Technology, ICT)에 기반한 관정연계관리체계(Well Network System, WNS)를 구성하는 기술 중 하나인 관정군집제어 기술로 구현될 수 있다. 수계 내에 설치된 기존의 양수정과 새롭게 추가된 관측정들을 4G LTE 네트워크를 통해 하나의 관정군으로 묶고 중앙 서버를 통한 자료 분석 및 양수 펌프 제어를 통해 대수층의 공급 능력과 사용자의 수요 현황에 따른 지하수자원의 체계적 분배를 구현하고자 하였다. 관정군집제어는 관정별 지하수위 및 양수정 양수량을 실시간으로 관측하고 이를 분석서버에 전송하여 해당 지하수계의 공급 가능량 및 인접관정 간섭 등을 분석하여 양수정의 펌프를 실시간으로 제어하고 양수된 지하수를 수요 지역으로 이송한다. 본 연구를 통해 관정군집제어 기술의 구현에 필요한 구성요소를 정의하고 이에 대한 구현 방법을 기술하여 WNS를 구성하는 하나의 요소기술 모델로 제시하고자 하였다.

  • PDF

Development of Naïve-Bayes classification and multiple linear regression model to predict agricultural reservoir storage rate based on weather forecast data (기상예보자료 기반의 농업용저수지 저수율 전망을 위한 나이브 베이즈 분류 및 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Journal of Korea Water Resources Association
    • /
    • v.51 no.10
    • /
    • pp.839-852
    • /
    • 2018
  • The purpose of this study is to predict monthly agricultural reservoir storage by developing weather data-based Multiple Linear Regression Model (MLRM) with precipitation, maximum temperature, minimum temperature, average temperature, and average wind speed. Using Naïve-Bayes classification, total 1,559 nationwide reservoirs were classified into 30 clusters based on geomorphological specification (effective storage volume, irrigation area, watershed area, latitude, longitude and frequency of drought). For each cluster, the monthly MLRM was derived using 13 years (2002~2014) meteorological data by KMA (Korea Meteorological Administration) and reservoir storage rate data by KRC (Korea Rural Community). The MLRM for reservoir storage rate showed the determination coefficient ($R^2$) of 0.76, Nash-Sutcliffe efficiency (NSE) of 0.73, and root mean square error (RMSE) of 8.33% respectively. The MLRM was evaluated for 2 years (2015~2016) using 3 months weather forecast data of GloSea5 (GS5) by KMA. The Reservoir Drought Index (RDI) that was represented by present and normal year reservoir storage rate showed that the ROC (Receiver Operating Characteristics) average hit rate was 0.80 using observed data and 0.73 using GS5 data in the MLRM. Using the results of this study, future reservoir storage rates can be predicted and used as decision-making data on stable future agricultural water supply.

창업연구 실증연구 분석방법론

  • Lee, Il-Han
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2017.04a
    • /
    • pp.17-17
    • /
    • 2017
  • 구조방정식모델(Structural Equation Modeling: SEM)은 변수들 간의 인관관계 및 상관관계를 검증하기 위한 통계기법으로 사회학 및 심리학 분야에서 개발되었지만 현재는 경영학, 광고학, 교육학, 생물학, 체육학, 의학, 정치학 등 여러 학문분야에서 광범위하게 사용되고 있다. Amos는 기본적으로 그래픽(Amos graphics)과 베이직(Amos basic)을 제공하기 때문에 정확한 프로그램의 작성이나 행렬에 대한 지식이 없는 초보자들도 아이콘을 이용하여 복잡한 연구모델이나 다중집단분석모델을 분석할 수 있다. PLS(Partial Least Square)는 모형 추정과정에서 발생하는 잔차 또는 예측오차를 최소화하여 예측력을 극대화하기 위한 프로그램이며, 즉, PLS-SEM는 표본 수가 적고 자료가 정규분포를 보이지 않거나 조형지표 모델이거나 복잡한 연구모델 분석에 유용하다. 최근 빅데이터의 열풍으로 자료들을 분석을 위한 도구로 R이 실무 현장에서 인기를 끌고 있다. R은 통계 프로그래밍 언어이자 오픈 소프트웨어 환경으로 통계, 그래픽, 데이터마이닝 등의 다양하고 방대한 양의 패키지들을 지원한다. R에서 제공되는 패키지들이 오픈 소스이고 선형 및 비선형 모델링, 고전적인 통계분석, 시 계열 분석, 분류 및 군집분석 등의 다양한 통계 패키지들을 제공한다는 측면에서 R은 실무는 물론 학문적인 측면에서도, 특히 통계를 기반으로 실증분석을 수행하는 사회과학연구들에서 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF

An Integrated Data Mining Model for Customer Relationship Management (고객관계관리를 위한 데이터마이닝 통합모형에 관한 연구)

  • Song, Im-Young;Oh, R.D.;Yi, T.S.;Shin, K.J.;Kim, K.C.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.154-159
    • /
    • 2006
  • 본 논문은 웹 서버에 의해 자동으로 수집되는 로그 파일로부터 고객 가치 판단 기준을 고객의 행동 기반에 두고 군집화 기법을 이용하여 고객을 세분화하고 세분화 결과에 의사결정나무를 적용함으로써 고객을 분류하는 통합 모형을 제안하였다. 또한, 분류된 고객들의 주 서비스 활용 패턴을 분석하기 위하여 연관규칙기법을 적용하여 고객의 과학기술정보 활용의 연관성을 분석함으로써, 과학정보포털 서비스를 제공하는 사이트 이용자의 분류군에 해당하는 정보와 인터페이스를 제공하는 새로운 방법에 대하여 연구하였다. 고객 관리 측면에서 본 논문은 정보 서비스를 제공하는 웹 사이트의 기존고객을 분류하여 패턴을 분석함으로써 고객 위주의 사이트 운영정책과 동적 인터페이스를 제공하기 위한 웹사이트 활용 방안을 제시하였다. 또한, 고객의 지속적인 관리라 각 고객 분류군별에 안는 서비스를 제공하고 고객의 관리에도 기여할 수 있을 것이다.

  • PDF