• 제목/요약/키워드: Clustering Strategy

검색결과 195건 처리시간 0.026초

FDC 및 상관관계 분석을 이용한 금호강 유역에서의 오염원추적 (Water Pollution Source Tracing Using FDC and Correlation Analysis in Geumho River Basin)

  • 박경옥;이창희;차일권
    • 한국습지학회지
    • /
    • 제18권3호
    • /
    • pp.232-243
    • /
    • 2016
  • 수질오염총량관리제에서 유역 수질관리 전략을 수립하기 위해서는 수질 항목간 영향관계를 파악하는 것과 함께 유역내의 환경기초시설 방류와 상류 및 지류 하천 부하가 유역 하류에 위치한 목표수질 설정지점의 수질에 미치는 영향을 규명하는 것이 필요하다. 이에 본 연구에서는 지류 및 본류 구간내의 환경부 수질측정자료와 환경기초시설 방류수 측정 자료를 이용하여 오염물질 간의 영향을 파악하고, 단위유역 말단의 수질에 미치는 오염원추적을 실시하였다. 대상유역은 도시지역과 비도시지역 특성을 모두 가지며, 수질오염총량제에서 금호A, 금호B, 금호C 유역으로 구성된 금호강유역으로 설정하였다. FDC(Flow duration curve) 분석을 통해 유량을 5개의 유황 등급별로 군집화 및 상관성분석이 수행되었고, 이를 통해 목표수질 설정지점의 수질을 악화시키는 원인이 되는 지점과 수질항목을 보다 명확하게 규명할 수 있었다. FDC 분석과의 연계를 통해 오염물질 추적의 도구로 사용될 수 있으며, 이를 통해 수질오염총량관리 목표수질 설정 지점에 대한 유역 수질관리 전략을 보다 효율적으로 수립할 수 있을 것이다.

RFM 기반 SOM을 이용한 매장관리 전략 도출 (Strategy for Store Management Using SOM Based on RFM)

  • 정윤정;최일영;김재경;최주철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.93-112
    • /
    • 2015
  • 소비자의 소비성향이 필요 품목을 중심으로 근거리에서 구매하는 근린형으로 변화함에 기존의 소매점은 식료품, 생활용품을 위주로 제공하는 슈퍼마켓, 하이퍼마켓 또는 편의점으로 진화하고 있다. 따라서 소매점이 한정된 공간에서 효율적으로 공간을 활용하고 매출을 증대하기 위해서는 소비자의 구매욕을 충족시킬 수 있는 상품배치와 적정한 재고수준을 유지하는 것이 매우 중요하다. 본 연구에서는 소매점의 판매 상품에 대하여 RFM 기반 SOM 군집화를 하여 효율적으로 매장을 관리할 수 있는 상품 배치전략 및 재고전략을 제안하였다. 실제 M마트의 판매데이터를 이용하여 RFM모델을 상품에 적용한 후, 기존 문헌 연구뿐만 아니라 해석 가능성, 응용 가능성 등을 고려하여 3X3 총 9개의 군집으로 분류하여 분석한 결과, 주요 군집으로 R값, F값, M값이 모두 높은 군집, R값, F값, M값 모두 낮은 군집, R값만 높은 군집, F값만 높은 군집이 도출되었다. 본 논문에서는 다른 군집과 비교시 R값, F값, M값이 차이를 보이는 주요 4개의 군집의 상품 배치 및 재고 전략을 제시하였다. R값, F값, M값이 모두 높은 군집의 상품은 소비자 동선을 늘림으로써 상품 노출을 확대시킬 수 있는 장소에 배치하여야 할 뿐만 아니라 높은 수준의 재고를 보유할 필요가 있다. 반면에 R값, F값, M값이 모두 낮은 군집의 상품은 가시성이 낮은 곳에 배치하고 최소한의 안전재고만 보유할 필요가 있다. 또한 R값이 높은 군집은 신상품으로 매장 입구에 배치하여 상품의 판매를 유도할 필요가 있다. 그리고 F값만 높은 군집의 경우, R값과 M값이 평균 값 보다 작은 상품들의 군집이므로 최근에는 판매가 저조하며 빈도 수에 비해 총 판매액이 낮다는 것을 유추할 수 있다. 따라서 현재보다 과거에 많이 판매된 저가의 상품군집으로 재고 수준을 점차 감소시킬 필요가 있다. 본 연구에서 제시한 방법은 POS 시스템의 보유한 소매점에서 상품배치 및 재고관리 방법으로 활용되어 매장의 수익성 증대에 기여할 수 있을 것으로 기대된다.

Hierarchical Clustering Approach of Multisensor Data Fusion: Application of SAR and SPOT-7 Data on Korean Peninsula

  • Lee, Sang-Hoon;Hong, Hyun-Gi
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.65-65
    • /
    • 2002
  • In remote sensing, images are acquired over the same area by sensors of different spectral ranges (from the visible to the microwave) and/or with different number, position, and width of spectral bands. These images are generally partially redundant, as they represent the same scene, and partially complementary. For many applications of image classification, the information provided by a single sensor is often incomplete or imprecise resulting in misclassification. Fusion with redundant data can draw more consistent inferences for the interpretation of the scene, and can then improve classification accuracy. The common approach to the classification of multisensor data as a data fusion scheme at pixel level is to concatenate the data into one vector as if they were measurements from a single sensor. The multiband data acquired by a single multispectral sensor or by two or more different sensors are not completely independent, and a certain degree of informative overlap may exist between the observation spaces of the different bands. This dependence may make the data less informative and should be properly modeled in the analysis so that its effect can be eliminated. For modeling and eliminating the effect of such dependence, this study employs a strategy using self and conditional information variation measures. The self information variation reflects the self certainty of the individual bands, while the conditional information variation reflects the degree of dependence of the different bands. One data set might be very less reliable than others in the analysis and even exacerbate the classification results. The unreliable data set should be excluded in the analysis. To account for this, the self information variation is utilized to measure the degrees of reliability. The team of positively dependent bands can gather more information jointly than the team of independent ones. But, when bands are negatively dependent, the combined analysis of these bands may give worse information. Using the conditional information variation measure, the multiband data are split into two or more subsets according the dependence between the bands. Each subsets are classified separately, and a data fusion scheme at decision level is applied to integrate the individual classification results. In this study. a two-level algorithm using hierarchical clustering procedure is used for unsupervised image classification. Hierarchical clustering algorithm is based on similarity measures between all pairs of candidates being considered for merging. In the first level, the image is partitioned as any number of regions which are sets of spatially contiguous pixels so that no union of adjacent regions is statistically uniform. The regions resulted from the low level are clustered into a parsimonious number of groups according to their statistical characteristics. The algorithm has been applied to satellite multispectral data and airbone SAR data.

  • PDF

센서네트워크에서 클러스터기반의 에너지 효율형 센서 스케쥴링 연구 (Cluster-based Delay-adaptive Sensor Scheduling for Energy-saving in Wireless Sensor Networks)

  • 최욱;이용;정유진
    • 한국시뮬레이션학회논문지
    • /
    • 제18권3호
    • /
    • pp.47-59
    • /
    • 2009
  • 다양한 응용에 적용될 수 있는 특성을 가진 무선 센서 네트워크는 적용되는 응용에 따라 데이터 리포팅 지연시간의 제한과 같이 요구사항이 다양하므로 각 응용별로 구분되는 알고리즘이나 프로토콜 설계 패러다임을 적용하여 에너지 효율을 최대화하고 네트워크의 생존기간을 최대화할 수 있어야 한다. 이 논문에서는 2단계 클러스터링(Two Phase Clustering : TPC) 방식을 이용하여 에너지 효율 데이터 수집을 제공하기 위한 새로운 알고리즘으로 지연시간 적응형 센서 스케쥴링 방안을 제안한다. 이 논문의 궁극적인 목표는 센서들에게 응용 환경의 특성과 시간에 따라 변하는 특성을 갖는 지연시간에 대한 요구사항에 대하여 높은 적응성을 제공하여 네트워크의 생존기간을 늘리는 것이다. TPC 방식은 센서들이 직접 링크와 릴레이 링크의 두 가지 링크를 구성하도록 한다. 직접 링크는 제어 메시지나 시간에 민감한 센서 데이터들을 포워딩하는 데 사용된다. 릴레이 링크는 사용자의 지연시간 제한에 따라 데이터를 포워딩하는데 사용되며 이를 이용하여 센서들이 에너지-절약효과를 갖는 릴레이를 사용할 기회가 증가하도록 멀티홉 경로를 구성할 수 있도록 한다. 이 논문에서는 제안하는 CD-DGS 방식이 사용자의 지연시간 제한 요구사항에 잘 적응하여 센서 네트워크의 분포 밀도가 높은 경우에 상당한 비율의 에너지 효율을 보이는 것을 시뮬레이션 결과로 증명한다.

클러스터링을 통한 유통매장의 역할 재설계 전략 수립: 몽골유통사를 대상으로 (Developing the Strategies of Redesigning the Role of Retail Stores Using Cluster Analysis: The Case of Mongolian Retail Company)

  • ;신광섭
    • 한국빅데이터학회지
    • /
    • 제8권1호
    • /
    • pp.131-156
    • /
    • 2023
  • 전통적인 오프라인 중심의 상거래 방식은 온라인과 모바일 기술의 발전으로 인해 크게 변화하고 있으며, 이러한 변화는 구매 패턴에 관한 소비자 행동의 변화를 동반했다. 온라인 쇼핑의 성장에도 불구하고 몽골에는 여전히 '가공식품'과 같은 특정 제품군에서는 전통적인 오프라인 매장을 더욱 선호하고 있다. 이러한 온라인과 오프라인 채널의 공존과 기능 변화에 대응하기 위해서는 기존 채널에 대한 성과를 면밀히 분석해야 한다. 특히, 채널의 역할 전환 혹은 통합과 같은 새로운 전략을 수립할 필요가 있다. 이에 본 연구에서는 몽골 유통 시장을 중심으로 오프라인 매장에 대한 매출, 이익, 판매량과 같은 성과 지표를 기준으로 군집분석을 실시하였으며, 각 군집의 특징을 주변환경과 비교하여 주요 특징을 발견하였다. 주요 군집에 속한 오프라인 매장의 성과 향상을 위해 온-오프라인 채널 간의 풀필먼트 허브 매장, 고객의 매장 체류 시간을 늘리기 위한 체험 매장, 그리고 매장 특성에 따라 서로 보완하여 트래픽을 증가시킬 수 있는 비관련 채널 간의 합병 등 세 가지 전략을 제안하였다. 이를 통해, 기존 유통 채널의 다변화와 함께 고객 경험 향상 및 수익성 개선을 달성할 수 있을 것이다.

토픽 분석을 활용한 관심 기반 고객 세분화 방법론 (Interest-based Customer Segmentation Methodology Using Topic Modeling)

  • 현윤진;김남규;조윤호
    • Journal of Information Technology Applications and Management
    • /
    • 제22권1호
    • /
    • pp.77-93
    • /
    • 2015
  • As the range of the customer choice becomes more diverse, the average life span of companies' products and services is becoming shorter. Most companies are striving to maximize the revenue by understanding the customer's needs and providing customized products and services. However, companies had to bear a significant burden, in terms of the time and cost involved in the process of determining each individual customer's needs. Therefore, an alternative method is employed that involves grouping the customers into different categories based on certain criteria and establishing a marketing strategy tailored for each group. In this way, customer segmentation and customer clustering are performed using demographic information and behavioral information. Demographic information included sex, age, income level, and etc., while behavioral information was usually identified indirectly through customers' purchase history and search history. However, there is a limitation regarding companies' customer behavioral information, because the information is usually obtained through the limited data provided by a customer on a company's website. This is because the pattern indicated when a customer accesses a particular site might not be representative of the general tendency of that customer. Therefore, in this study, rather than the pattern indicated through a particular site, a customer's interest is identified using that customer's access record pertaining to external news. Hence, by utilizing this method, we proposed a methodology to perform customer segmentation. In addition, by extracting the main issues through a topic analysis covering approximately 3,000 Internet news articles, the actual experiment applying customer segmentation is performed and the applicability of the proposed methodology is analyzed.

자기조직화지도(Self-organizing map)와 랜덤 포레스트 분석(Random forest)을 이용한 논습지에 도래하는 수조류 군집 특성 파악 (Patterning Waterbird Assemblages on Rice Fields Using Self-Organizing Map and Random Forest)

  • 남형규;최승혜;유정칠
    • 한국환경농학회지
    • /
    • 제34권3호
    • /
    • pp.168-177
    • /
    • 2015
  • BACKGROUND: In recent year, there has been great concern regarding agricultural land uses and their importance for the conservation of biodiversity. Rice fields are managed unique wetland for wildlife, especially waterbirds. A comprehensive monitoring of the waterbird assemblage to understand patterning changes was attempted for rice ecosystem in South Korea. This rice ecosystem has been recognized as one of the most important for waterbirds conservation. METHODS AND RESULTS: Biweekly monitoring was implemented for the 4 years from April 2009 to March 2010, from April 2011 to March 2014. 32 species of waterbirds were observed. Self-organizing map (SOM) and random forest were applied to the waterbirds dataset to identify the characteristics in waterbirds distribution. SOM and random forest analysis clearly classified into four clusters and extract ecological information from waterbird dataset. Waterbird assemblages represented strong seasonality and habitat use according to waterbird group such as shorebirds, herons and waterfowl. CONCLUSION: Our results showed that the combination of SOM and random forest analysis could be useful for ecosystem assessment and management. Furthermore, we strongly suggested that a strict management strategy for the rice fields to conserve the waterbirds. The strategy could be seasonally and species specific.

빅데이터 수집 처리를 위한 분산 하둡 풀스택 플랫폼의 설계 (Design of Distributed Hadoop Full Stack Platform for Big Data Collection and Processing)

  • 이명호
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.45-51
    • /
    • 2021
  • 급속한 비대면 환경과 모바일 우선 전략에 따라 해마다 많은 정형/비정형 데이터의 폭발적인 증가와 생성은 모든 분야에서 빅데이터를 활용한 새로운 의사 결정과 서비스를 요구하고 있다. 그러나 매년 급속히 증가하는 빅데이터를 활용하여 실무 환경에서 적용 가능한 표준 플랫폼으로 빅데이터를 수집하여 적재한 후, 정재한 빅데이터를 관계형 데이터베이스에 저장하고 처리하는 하둡 에코시스템 활용의 참조 사례들은 거의 없었다. 따라서 본 연구에서는 스프링 프레임워크 환경에서 3대의 가상 머신 서버를 통하여 하둡 2.0을 기반으로 쇼셜 네트워크 서비스에서 키워드로 검색한 비정형 데이터를 수집한 후, 수집된 비정형 데이터를 하둡 분산 파일 시스템과 HBase에 적재하고, 적재된 비정형 데이터를 기반으로 형태소 분석기를 이용하여 정형화된 빅데이터를 관계형 데이터베이스에 저장할 수 있게 설계하고 구현하였다. 향후에는 데이터 심화 분석을 위한 하이브나 머하웃을 이용하여 머신 러닝을 이용한 클러스터링과 분류 및 분석 작업 연구가 지속되어야 할 것이다.

Technology Development Strategy of Piggyback Transportation System Using Topic Modeling Based on LDA Algorithm

  • Jun, Sung-Chan;Han, Seong-Ho;Kim, Sang-Baek
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.261-270
    • /
    • 2020
  • 본 연구는 피기백 화차운송 시스템의 특허문서를 활용하여 관련 분야의 유망기술을 파악하는 것을 목표로 한다. 이를 위해 피기백 운송 시스템의 선행연구 및 관련 보고서로 기술 키워드를 추출하여 특허문서를 추출한다. 추출된 특허문서에 텍스트마이닝 기법을 적용하여 빈도수가 높은 키워드를 확인하고 피기백 운송 시스템의 핵심기술의 토픽을 식별하기 위해 LDA(Latent Dirichlet Allocation) 알고리즘을 적용하였다. 마지막으로, 시계열 분석 기법인 ARIMA 모델을 핵심기술의 토픽에 적용하여 기술 추세를 예측하고 피기백 운송 시스템에 대한 유망한 기술을 식별하였다. 특허 분석 결과, 데이터 기반 통합관리 시스템과 운영 계획 시스템 그리고 복합수송 중 특수 화물(기체, 액체류) 운송 및 보관 기술이 미래에 유망한 핵심기술로 도출되었고, 데이터 송수신 및 분석 기술이 중요한 세부 기술임을 확인하였다. 제안된 분석 방법은 피기백 운송 시스템의 R&D 연구개발 전략 및 기술 로드맵을 개발하는 데 있어 충분한 자료가 될 수 있다.

Associations Between Conventional Healthy Behaviors and Social Distancing During the COVID-19 Pandemic: Evidence From the 2020 Community Health Survey in Korea

  • Rang Hee, Kwon;Minsoo, Jung
    • Journal of Preventive Medicine and Public Health
    • /
    • 제55권6호
    • /
    • pp.568-577
    • /
    • 2022
  • Objectives: Many studies have shown that social distancing, as a non-pharmaceutical intervention (NPI) that is one of the various measures against coronavirus disease 2019 (COVID-19), is an effective preventive measure to suppress the spread of infectious diseases. This study explored the relationships between traditional health-related behaviors in Korea and social distancing practices during the COVID-19 pandemic. Methods: Data were obtained from the 2020 Community Health Survey conducted by the Korea Disease Control and Prevention Agency (n=98 149). The dependent variable was the degree of social distancing practice to cope with the COVID-19 epidemic. Independent variables included health-risk behaviors and health-promoting behaviors. The moderators were vaccination and unmet medical needs. Predictors affecting the practice of social distancing were identified through hierarchical multiple logistic regression analysis. Results: Smokers (adjusted odds ratio [aOR], 0.924) and frequent drinkers (aOR, 0.933) were more likely not to practice social distancing. A greater degree of physical activity was associated with a higher likelihood of practicing social distancing (aOR, 1.029). People who were vaccinated against influenza were more likely to practice social distancing than those who were not (aOR, 1.150). However, people with unmet medical needs were less likely to practice social distancing than those who did not experience unmet medical needs (aOR, 0.757). Conclusions: Social distancing practices were related to traditional health behaviors such as smoking, drinking, and physical activity. Their patterns showed a clustering effect of health inequality. Therefore, when establishing a strategy to strengthen social distancing, a strategy to protect the vulnerable should be considered concomitantly.