• 제목/요약/키워드: 자기 조직화지도

검색결과 136건 처리시간 0.025초

구매순서를 고려한 개선된 협업필터링 방법론 (Considering Customer Buying Sequences to Enhance the Quality of Collaborative Filtering)

  • 조영빈;조윤호
    • 지능정보연구
    • /
    • 제13권2호
    • /
    • pp.69-80
    • /
    • 2007
  • 고객의 선호도는 시간에 따라 변화하지만 기존 협업필터링기법(Collaborative Filtering : CF)은 정적인 데이터만을 다룬다. 이는 기존 CF 기법이 특정 기간 동안 고객의 구매 여부만 고려할 뿐 고객의 구매순서를 사용하지 않기 때문이다. 따라서 기존 CF 기법은 고객의 동적인 데이터인 구매순서를 고려함으로써 추천의 품질을 높일 가능성이 있다. 본 연구에서는 고객의 구매순서를 활용함으로써 CF 기법의 추천 품질을 향상시키는 새로운 상품추천 방법론을 제안한다. 즉, 군집분석기법인 자기조직화지도(Self-Organizing Map : SOM)를 활용하여 고객의 구매순서를 파악한 후 연관규칙탐사(Association Rule Mining : ARM)를 사용하여 고객들의 구매순서 중 일정 정도의 통계적인 타당성을 갖는 구매순서 패턴을 찾아내어 이를 추천 시에 활용한다. 대형 백화점의 구매자료에 적용하여 제안한 방법론의 효과성을 실험한 결과 제안한 방법론이 기존 CF 기법보다 우수한 추천품질을 가지고 있음이 실증적으로 확인되었다.

  • PDF

자기조직화지도를 이용한 서울 폭염사례 분류 연구 (Classification of Heat Wave Events in Seoul Using Self-Organizing Map)

  • 백승윤;김상욱;정명일;노준우;손석우
    • 한국기후변화학회지
    • /
    • 제9권3호
    • /
    • pp.209-221
    • /
    • 2018
  • The characteristics of heat wave events in Seoul are analyzed using weather station data from Korea Meteorological Administration (KMA) and European Centre for Medium-Range Weather Forecast (ECMWF) ERA-Interim reanalysis data from 1979 to 2016. Heat waves are defined as events in the upper 10th percentile of the daily maximum temperatures. The associated synoptic weather patterns are then classified into six clusters through Self-Organizing Map (SOM) analysis for sea-level pressure anomalies in East Asia. Cluster 1 shows an anti-cyclonic circulation and weak troughs in southeast and west of Korea, respectively. This synoptic pattern leads to southeasterly winds that advect warm and moist air to the Korean Peninsula. Both clusters 2 and 3 are associated with southerly winds formed by an anti-cyclonic circulation over the east of Korea and cyclonic circulation over the west of Korea. Cluster 4 shows a stagnant weather pattern with weak winds and strong insolation. Clusters 5 and 6 are associated with F?hn wind resulting from an anti-cyclonic circulation in the north of the Korean Peninsula. In terms of long-term variations, event frequencies of clusters 4 and 5 show increasing and decreasing trends, respectively. However, other clusters do not show any long-term trends, indicating that the mechanisms that drive heat wave events in Seoul have remained constant over the last four decades.

사회인구통계 및 상수도시설 특성을 고려한 소블록 단위 물 수요예측 연구 (Water demand forecasting at the DMA level considering sociodemographic and waterworks characteristics)

  • 진샘물;최두용;김경필;구자용
    • 상하수도학회지
    • /
    • 제37권6호
    • /
    • pp.363-373
    • /
    • 2023
  • Numerous studies have established a correlation between sociodemographic characteristics and water usage, identifying population as a primary independent variable in mid- to long-term demand forecasting. Recent dramatic sociodemographic changes, including urban concentration-rural depopulation, low birth rates-aging population, and the rise in single-person households, are expected to impact water demand and supply patterns. This underscores the necessity for operational and managerial changes in existing water supply systems. While sociodemographic characteristics are regularly surveyed, the conducted surveys use aggregate units that do not align with the actual system. Consequently, many water demand forecasts have been conducted at the administrative district level without adequately considering the water supply system. This study presents an upward water demand forecasting model that accurately reflects real water facilities and consumers. The model comprises three key steps. Firstly, Statistics Korea's SGIS (Statistical Geological Information System) data was reorganized at the DMA level. Secondly, DMAs were classified using the SOM (Self-Organizing Map) algorithm to consider differences in water facilities and consumer characteristics. Lastly, water demand forecasting employed the PCR (Principal Component Regression) method to address multicollinearity and overfitting issues. The performance evaluation of this model was conducted for DMAs classified as rural areas due to the insufficient number of DMAs. The estimation results indicate that the correlation coefficients exceeded 0.9, and the MAPE remained within approximately 10% for the test dataset. This method is expected to be useful for reorganization plans, such as the expansion and contraction of existing facilities.

K-IFRS에 따른 사례기반추론에 기반한 지능형 기업 진단 모형 (A Intelligent Diagnostic Model that base on Case-Based Reasoning according to Korea - International Financial Reporting Standards)

  • 이형용
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.141-154
    • /
    • 2014
  • 최근 재무제표분석을 통하여서 기업을 진단하려고 하는 다양한 학문적인 연구와 실질적인 적용이 실행되고 있다. 특히, 최근 새롭게 변경된 회계기준인 한국채택 국제회계기준(K-IFRS: Korea - International Financial Reporting Standards)에 따라서 제무제표분석에도 변화가 발생하고, 그에 따라서 기업 진단도 새롭게 변화되어야 하는 상황이 되었다. 이에 현재, 금융권에서도 관심을 갖고 있는 매출채권 처리의 변화에 따라서 발생하는 재무제표상의 진단 및 분석을 반영하여서 처리하는 새로운 진단모형의 필요성이 대두되었다. 특히, 최근 모뉴엘이라는 기업의 매출채권을 이용한 금융스캔들의 영향으로 이러한 연구가 더욱 활발하게 진행되고 있다. 매출채권은 일반적 상거래에서 발생하는 신용채권 으로서, 기업이 만기까지 보유하거나 만기 전에 양도가 가능한 금융 상품이다. 기업이 매출 채권을 할인하여 양도할 경우에 매출채권 할인을 매각거래로 처리하고, 할인료에 해당하는 금액을 매출채권처분 손실로 처리하며, 해당 거래를 우발 채무로 공시하였다. 그러나, K-IFRS 하에서는 모든 위험과 보상이 이전되지 않는 한 매출채권 할인을 차입거래로 인식한다. 이는 기업 부채의 증가로 기업가치에 영향을 미치게 된다, 이 논문에서는 매출채권 할인이 실질적으로 기업가치에 부정적인 영향을 미치는지 추정하는 지능형진단시스템을 제안한다. 본 논문에서는 매출채권 할인이 주가에 미치는 영향을 인공지능기법인 사례기반추론(case based reasoning)과 자기조직화지도 (self-organizing maps)기법을 통하여 진단 모형을 구축하였다.

하이브리드 인공신경망 모형을 이용한 부도 유형 예측 (Bankruptcy Type Prediction Using A Hybrid Artificial Neural Networks Model)

  • 조남옥;김현정;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.79-99
    • /
    • 2015
  • 부도 예측은 회계와 재무 분야에서 꾸준히 연구되고 있는 분야이다. 초기에는 주로 다중판별분석(multiple discriminant analysis)와 로짓 분석(logit analysis)과 같은 통계적 방법을 이용하였으나, 1990년대 이후에는 경영 분야의 분류 문제를 위해 많은 연구자들이 인공신경망(back-propagation neural network), 사계기반추론(case-based reasoning), 서포트 벡터 머신(support vector machine) 등과 같은 인공지능을 통한 접근법을 이용하여 통계적 방법보다 분류 성과 측면에서 우수함을 입증해왔다. 기존의 기업의 부도에 관한 연구에서 많은 연구자들이 재무비율을 이용하여 부도 예측 모형을 구축하는 것에 초점을 맞추어왔다. 부도예측에 관한 연구가 꾸준히 진행되고 있는 반면, 부도의 세부적인 유형을 예측하여 제시하는 것에 대한 연구는 미흡한 실정이었다. 따라서 본 연구에서는 수익성, 안정성, 활동성 지표를 중심으로 국내 비외감 건설업 기업들의 부도 여부뿐만 아니라 부도의 세부적인 유형까지 예측 가능한 모형을 개발하고자 한다. 본 연구에서는 부도 유형을 예측하기 위해 두 개의 인공신경망 모형을 결합한 하이브리드 접근법을 제안하였다. 첫 번째 인공신경망 모형은 부도예측을 위한 역전파 인공신경망을 이용한 모형이며, 두 번째 인공신경망 모형은 부도 데이터를 몇 개의 유형으로 분류하는 자기조직화지도(self-organizing map)을 이용한 모형이다. 실험 결과를 통해 정의된 5개의 부도 유형인 심각한 부도(severe bankruptcy), 안정성 부족(lack of stability), 활동성 부족(lack of activity), 수익성 부족(lack of profitability), 회생 가능한 부도(recoverable bankruptcy)는 재무 비율에 따라 유형별로 상이한 특성을 갖는 것을 확인할 수 있었다. 본 연구 결과를 통해 신용 평가 분야의 연구자와 실무자들이 기업의 부도의 유형에 대한 유용한 정보를 얻을 것으로 기대한다.

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권2호
    • /
    • pp.101-112
    • /
    • 1995
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 클러스터러(clusterer)로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사상(local topographical mapping)에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해 먼저, 인식 대상음소는 모음군 17개, 자음의 경우 파열음9개, 마찰음 3개, 파찰음 3개, 유음 및 비음 4개, 음소의 성질이 다른 종성 7개의 음소군으로 모두 43개의 음소를 대상으로 실험하였으며, 각 음소군에 대한 특징 지도를 구성하여 레이블러(labeler)의 기능을 수행하게 하였다. 화자 종속 인식 실험 결과 $87.2\%$의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

클래스 불균형 문제를 해결하기 위한 개선된 집중 샘플링 (Improved Focused Sampling for Class Imbalance Problem)

  • 김만선;양형정;김수형;챠위핑
    • 정보처리학회논문지B
    • /
    • 제14B권4호
    • /
    • pp.287-294
    • /
    • 2007
  • 실세계의 문제에서 많은 기계학습의 알고리즘들은 데이터의 클래스 불균형 문제에 어려움을 겪는다. 이러한 클래스 불균형 문제를 해결하기 위하여 데이터의 비율을 변경하거나 좀 더 나은 샘플링 전략으로 극복하려는 연구들이 제안되었다. 그러나 데이터의 비율을 변경하는 연구에서는 전체 데이터 분포의 특성을 고려하지 못하고, 샘플링 전략을 제안하는 연구에서는 여러 가지 제한 조건을 고려해야만 한다. 본 논문에서는 위의 두가지 방법의 장점을 모두 포함하는 개선된 집중 샘플링 방법을 제안한다. 제안된 방법에서는 클래스 불균형 문제를 해결하기 위해 학습에 유용한 데이터들을 샘플링하는데 스코어링에 기반한 데이터 분할 방법을 이용한다. 즉, 입력 데이터들에 대해 SOM(Self Organizing Map)의 학습 결과로 얻은 BMU(Best Matching Unit)와의 거리를 계산하고, 이 거리론 스코어라 한다. 측정된 스코어는 오름차순으로 정렬되며, 이 과정에서 입력 데이터의 분포가 재 표현되고, 재 표현된 분포는 전체 데이터의 특성을 대표하게 된다. 그 결과로 얻은 데이터들 중에서 유용하지 못한 데이터들에 대해 제거하는 과정을 수행하여 새로운 학습 데이터 셋을 얻는다. 새로운 학습 데이터 생성 과정에서는 재 표현된 분포의 결과를 두 구간(upper, lower)으로 분할하는데, 두 추간 사이의 데이터들은 유용하지 못한 패턴들로 간주되어 학습에 이용되지 않는다. 본 논문에서 제안한 방법은 클래스 불균형의 비율 감수 훈련 데이터의 크기 감소, 과적합의 방지 등 몇 가지 장점을 보인다. 제안한 방법으로 샘플링된 데이터에 kNN 을 적용하여, 분류 실험한 결과 심한 불균형이 있는 ecoli 데이터의 분류 성능이 최대 2.27배 향상되었다.

긴장과 이완상태의 자동인식을 위한 SOM의 적용 (Applying of SOM for Automatic Recognition of Tension and Relaxation)

  • 정찬순;함준석;고일주;장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.65-74
    • /
    • 2010
  • 본 연구에서는 비행슈팅게임을 플레이하는 피험자의 긴장 또는 이완상태를 자동으로 인식하는 시스템을 제안한다. 기존 연구에서는 피험자에게 자극원을 제시하여 나타난 변화 값을 비교하기 때문에 자동으로 분류하는데 한계가 있었다. 본 연구에서는 피험자의 상태 변화를 자동으로 분류하여 인식할 수 있도록 비지도학습의 SOM을 적용한다. 긴장과 이완상태의 자동인식을 위한 SOM의 적용은 두 가지 단계로 구성된다. 첫 번째 단계는 ECG측정 및 분석으로 피험자에게 게임을 플레이하게 한 후 ECG를 측정하여 HRV 분석으로 특징벡터를 추출한다. 두 번째 단계는 SOM 학습 및 인식으로 특징이 추출된 심박신호의 입력벡터들을 SOM으로 학습하여 피험자의 긴장과 이완상태를 분류하여 인식 한다. 실험 결과는 세 가지로 나누어진다. 첫 번째, HRV의 주파수변화와 두 번째 심박신호의 SOM 학습결과를 나타냈다. 세 번째 단계는 SOM학습의 성능을 알기 위해서 매칭율을 분석했다. HRV의 주파수분석의 LF/HF 비율을 1.5 기준으로 SOM의 승자뉴런 거리와 매칭한 결과 평균 72%의 매칭율을 보였다.

풍력 데이터를 이용한 발전 패턴 예측 (Predicting Power Generation Patterns Using the Wind Power Data)

  • 서동혁;김규익;김광득;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.245-253
    • /
    • 2011
  • 화석 연료의 무분별한 사용으로 환경이 심각하게 오염되고, 화석 연료의 고갈에 대한 문제가 대두됨에 따라서 화석 연료에 대한 문제를 해결 할 수 있는 대체 에너지원에 대해 관심이 집중되기 시작하였다. 현재 신재생 에너지 중에서 가장 각광을 받고 있는 에너지는 중에 하나가 풍력에너지이다. 풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다. 본 논문에서는 풍력 데이터를 이용하여 발전 패턴을 예측하기 위해 SOM(Self-Organizing Feature Map) Clustering 기법과 의사결정나무(decision tree)를 이용한 연구를 진행하였다. 즉, 1) 풍력 데이터의 누락된 데이터와 이상치 데이터를 처리하기 위하여, 전처리 과정을 수행하였고, 이 과정에서 특징 벡터를 추출하였다. 2) 전처리 단계를 거쳐 정제되고 정규화된 데이터 집합을 MIA(Mean Index Adequacy) 척도와 SOM Clustering 기법에 적용하여 대표 발전 패턴을 찾아내고 각각의 데이터에 해당하는 대표 패턴을 클래스 레이블로 할당하도록 하였다. 3) 의사결정나무 기반의 분류 기법에 데이터 집합을 적용시켜 새로운 풍력에너지에 대한 분석 및 예측 모델을 생성하였다. 실험 결과, 의사결정나무를 통한 풍력에너지 발전 패턴을 예측하기 위한 모델을 구축하였다.

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.