• 제목/요약/키워드: Self organizing map

검색결과 424건 처리시간 0.023초

함수근사와 규칙추출을 위한 클러스터링을 이용한 강화학습 (Reinforcement Learning with Clustering for Function Approximation and Rule Extraction)

  • 이영아;홍석미;정태충
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1054-1061
    • /
    • 2003
  • 강화학습의 대표적인 알고리즘인 Q-Learning은 상태공간의 모든 상태-행동 쌍(state-action pairs)의 평가값이 수렴할 때까지 반복해서 경험하여 최적의 전략(policy)을 얻는다. 상태공간을 구성하는 요소(feature)들이 많거나 요소의 데이타 형태가 연속형(continuous)인 경우, 상태공간은 지수적으로 증가하게 되어, 모든 상태들을 반복해서 경험해야 하고 모든 상태-행동 쌍의 Q값을 저장하는 것은 시간과 메모리에 있어서 어려운 문제이다. 본 논문에서는 온라인으로 학습을 진행하면서 비슷한 상황의 상태들을 클러스터링(clustering)하고 새로운 경험에 적응해서 클러스터(cluster)의 수정(update)을 반복하여, 분류된 최적의 전략(policy)을 얻는 새로운 함수근사(function approximation)방법인 Q-Map을 소개한다. 클러스터링으로 인해 정교한 제어가 필요한 상태(state)는 규칙(rule)으로 추출하여 보완하였다. 미로환경과 마운틴 카 문제를 제안한 Q-Map으로 실험한 결과 분류된 지식을 얻을 수 있었으며 가시화된(explicit) 지식의 형태인 규칙(rule)으로도 쉽게 변환할 수 있었다.

데이터마이닝 기법을 활용한 비외감기업의 부실화 유형 분석 (The Pattern Analysis of Financial Distress for Non-audited Firms using Data Mining)

  • 이수현;박정민;이형용
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.111-131
    • /
    • 2015
  • 본 연구에서는 데이터마이닝 기법의 일종인 자기조직화지도(Self-Organizing Map, SOM)를 이용하여 비외감기업의 부실화 유형을 구분하고자 한다. 자기조직화지도는 인공 신경망을 기초로 자율학습을 통해 입력된 값을 유사한 군집끼리 묶어내는 방법으로, 기존의 통계적 군집 분류 방법보다 성능이 뛰어나고, 고차원의 입력데이터를 저차원으로 시각화할 수 있다는 장점 때문에 다양한 분야에서 각광받고 있다. 본 연구에서는 기존 연구의 주요 분석대상이었던 외감기업에 비해 부실화 빈도는 높지만 데이터 수집의 어려움으로 인해 분석대상에서 다소 제외되었던 비외감기업의 부실화 유형에 대해 알아보고, 유형별 구체적인 사례도 소개하고자 한다. 재무자료수집이 가능한 100개의 비외감 부실기업에 대해 분석한 결과, 비외감기업의 부실화 유형은 다섯 가지로 구분되었다. 유형 1은 전체 집단의 약 12%를 차지하며, 수익성, 성장성 등 재무지표가 다른 유형에 비해 열등하였다. 유형 2는 전체 집단의 약 14%로, 유형 1보다는 덜 심각하지만 재무지표가 대체로 열등하였다. 유형 3은 성장성 지표가 열등한 그룹으로 기업간 경쟁이 극심한 가운데 지속적으로 성장하지 못하고 부실화된 경우로 약 30%의 기업이 포함되었다. 유형 4는 성장성은 탁월하나 부채경영 등 과감한 경영으로 인해 유동성 부족이나 현금부족 등의 이유로 부실화된 그룹으로 약 25%의 기업이 포함되었다. 유형 5는 거의 모든 재무지표가 우수한 건전기업으로, 단기적인 경영전략의 실수 또는 중소기업의 특성상 경영자의 개인적 사정으로 부실화 되었을 가능성이 큰 그룹으로 약 18%의 기업이 포함되었다. 본 연구 결과는 부실화 유형을 구분하는데 기존의 통계적 방법이 아닌 자기조직화지도를 이용하였다는 점에서 학문적 의의가 있고, 비외감기업의 재무지표만으로도 1차적인 부실화 징후를 발견할 수 있다는 점에서 실무적 의의가 있다고 할 수 있다.

MODIS 자료를 이용한 한반도 지면피복 분류 (Classification of Land Cover over the Korean Peninsula using MODIS Data)

  • 강전호;서명석;곽종흠
    • 대기
    • /
    • 제19권2호
    • /
    • pp.169-182
    • /
    • 2009
  • To improve the performance of climate and numerical models, concerns on the land-atmosphere schemes are steadily increased in recent years. For the realistic calculation of land-atmosphere interaction, a land surface information of high quality is strongly required. In this study, a new land cover map over the Korean peninsula was developed using MODIS (MODerate resolution Imaging Spectroradiometer) data. The seven phenological data set (maximum, minimum, amplitude, average, growing period, growing and shedding rate) derived from 15-day normalized difference vegetation index (NDVI) were used as a basic input data. The ISOData (Iterative Self-Organizing Data Analysis), a kind of unsupervised non-hierarchical clustering method, was applied to the seven phenological data set. After the clustering, assignment of land cover type to the each cluster was performed according to the phenological characteristics of each land cover defined by USGS (US. Geological Survey). Most of the Korean peninsula are occupied by deciduous broadleaf forest (46.5%), mixed forest (15.6%), and dryland crop (13%). Whereas, the dominant land cover types are very diverse in South-Korea: evergreen needleleaf forest (29.9%), mixed forest (26.6%), deciduous broadleaf forest (16.2%), irrigated crop (12.6%), and dryland crop (10.7%). The 38 in-situ observation data-base over South-Korea, Environment Geographic Information System and Google-earth are used in the validation of the new land cover map. In general, the new land cover map over the Korean peninsula seems to be better classified compared to the USGS land cover map, especially for the Savanna in the USGS land cover map.

다중 구조적응 자기구성지도의 퍼지결합을 이용한 웹 마이닝 (Web Mining Using Fuzzy Integration of Multiple Structure Adaptive Self-Organizing Maps)

  • 김경중;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.61-70
    • /
    • 2004
  • 폭발적으로 성장하고 있는 웹은 수백만 개의 웹 문서를 포함하고 있기 때문에, 적절한 웹사이트를 찾기 어렵다. 사용자 프로파일을 사용하여 적절한 웹사이트를 추천함으로써 웹의 탐색을 개인화 할 수도 있지만 웹 컨텐츠에 대한 사용자의 평가는 사용자의 성격에 관한 다양한 측면을 표현하므로 사용자의 선호도를 예측하기 위해서는 보다 효과적인 방법이 필요하다. 사용자 프로파일은 비선형적인 특성을 가지고 있으므로 분류기를 사용하여 예측하여야 하며 다양한 특성을 예측하기 위해 분류기의 결합이 필요하다. 패턴분류와 시각화에 유용한 구조적응 자기구성지도(SASOM)는 개선된 SOM 모델로서 웹 마이닝에 적절하다. 퍼지 적분은 주관적으로 정의된 분류기의 중요도를 이용하여 결합하는 방법이다. 본 논문에서는 독립적으로 학습된 SASOM의 퍼지적분(fuzzy integral)기반 결합을 이용하여 사용자의 프로파일을 예측하고 UCI 벤치마크 데이타인 Syskill & Webert 데이타를 사용하여 그 성능을 평가한다. 실험결과 제안한 방법이 기존의 naive Bayes 분류기뿐만 아니라 SASOM의 투표결합보다 우수한 성능을 보였다.

신한옥의 평면구성에 따른 공간활용상태에 관한 연구 - 전라남도 신한옥을 중심으로 - (A Study on the Space Usage by the New Hanok Plan Composition - Focused on the New Hanok in Jeollanam-do Province -)

  • 박진아;김수암
    • 한국주거학회논문집
    • /
    • 제23권4호
    • /
    • pp.59-67
    • /
    • 2012
  • Developing the modern design of Hanok and providing support for the commercialization model development in recent years propelled by the New Hanok Support Strategies of the central government in conjunction with the New Hanok revitalization related projects reflecting local goverments. New Hanok revitalization, the rekindling and revaluing of human behaviors and interests in local goverments following the social and cultural changes of the past decades, has emeraged as an increasingly traditional area of concerning in New Hanok planning. In this paper we attempt to this discussion by describing recent projects in New Hanok revitalization in Jeollanam-do Province. Therefore, this study aims to examine the classification of compound knowledges based multidimensional relationship by using Self-Organizing Maps (SOM). SOM is an unsupervised learning neural network model for the analysis of high-dimensional input data. By using SOM, we were able to create a cluster map reflecting the characteristics of the New Hanok. In this case the pattern of the preference data was easily understood by visual analysis. Liking for compound knowledge deduced from this data was classified into 8 categories according to the compound knowledge properties of New Hanok. As a result, a systematic approach for analysis the characteristics of individual family and living environment of New Hanoks and 10 space usage patterns the changes in some aspects of New Hanok.

자기조직화지도 클러스터링을 이용한 종단자료의 탐색적 분석방법론 (An Exploratory Methodology for Longitudinal Data Analysis Using SOM Clustering)

  • 조영빈
    • 융합정보논문지
    • /
    • 제12권5호
    • /
    • pp.100-106
    • /
    • 2022
  • 종단연구는 동일 대상에 대하여 반복적으로 측정한 종단자료를 기반으로 하는 연구방법을 말한다. 대부분의 종단분석 방법은 예측이나 추론에 적합하고, 탐색적 목적으로 사용하기에는 적합하지 않은 경우가 많다. 본 연구에서는 종단자료를 분석하는 탐색적 방법을 제시한다. 이 방법은 자기조직화지도기법을 사용하여 종단자료를 군집화 하여 최선의 군집 수를 정한 후 종단궤적을 찾는 방법이다. 제안한 방법론은 고용정보원의 종단자료에 적용되었으며, 총 2,610개의 샘플에 대하여 분석을 하였다. 방법론을 적용한 결과 패널 별로 시계열적으로 군집 화되는 결과를 얻었다. 이는 종단자료를 사전에 클러스터링하고 다층 종단분석을 하는 것이 더욱 효과적이라는 사실을 나타낸다.

관계적시점지도로 구성된 SOM을 이용한 가스배관 부식상태의 자율적 판단 방법 (A Method For Autonomous Determination Of Corrosion State Of Gas-pipeline Using RPM-based SOM)

  • 손충연;여지혜;고일주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.137-140
    • /
    • 2011
  • 시설의 안전성 평가에 대한 연구는 안전성에 영향을 주는 데이터를 정량화하여 획일적인 자동 수행하는 안전관리가 주를 이루고 있다. 이와 달리 자율수행은 수집 된 상황 정보나 상태 데이터를 이용하여 안전성을 예측하고 사고 위험성을 경보하여 사고를 예방 할 수 있다. 본 연구에서는 다양한 시설물 중에서 가스배관의 부식에 대한 판단을 위해서 신경망의 대표적 비지도학습인 자기조직화지도를 적용한다. SOM의 적용에서는 주변효과를 보완하기 위해서 관계적관점지도로 맵을 구성한다. 학습 할 데이터는 가스배관의 방식전위이다. 배관의 부식상태를 확인하기 위하여 수집 된 데이터인 방식전위에는 부식에 대한 위험요인이 내재되어 있다. 학습 후 새로운 데이터가 입력되면 각 상태 군집의 중심뉴런과 맵핑된 뉴런의 유사도를 측정하여 배관의 부식상태를 결정한다. 제안 된 방법으로 판단 된 결과를 기존에 사람이 판단한 결과와 비교하여 검증한다. 이를 통해 배관의 부식상태를 자율적이고 신속하게 판단하여 지능화 된 가스배관 관리로 활용한다.

  • PDF

Finding Genes Discriminating Smokers from Non-smokers by Applying a Growing Self-organizing Clustering Method to Large Airway Epithelium Cell Microarray Data

  • Shahdoust, Maryam;Hajizadeh, Ebrahim;Mozdarani, Hossein;Chehrei, Ali
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제14권1호
    • /
    • pp.111-116
    • /
    • 2013
  • Background: Cigarette smoking is the major risk factor for development of lung cancer. Identification of effects of tobacco on airway gene expression may provide insight into the causes. This research aimed to compare gene expression of large airway epithelium cells in normal smokers (n=13) and non-smokers (n=9) in order to find genes which discriminate the two groups and assess cigarette smoking effects on large airway epithelium cells.Materials and Methods: Genes discriminating smokers from non-smokers were identified by applying a neural network clustering method, growing self-organizing maps (GSOM), to microarray data according to class discrimination scores. An index was computed based on differentiation between each mean of gene expression in the two groups. This clustering approach provided the possibility of comparing thousands of genes simultaneously. Results: The applied approach compared the mean of 7,129 genes in smokers and non-smokers simultaneously and classified the genes of large airway epithelium cells which had differently expressed in smokers comparing with non-smokers. Seven genes were identified which had the highest different expression in smokers compared with the non-smokers group: NQO1, H19, ALDH3A1, AKR1C1, ABHD2, GPX2 and ADH7. Most (NQO1, ALDH3A1, AKR1C1, H19 and GPX2) are known to be clinically notable in lung cancer studies. Furthermore, statistical discriminate analysis showed that these genes could classify samples in smokers and non-smokers correctly with 100% accuracy. With the performed GSOM map, other nodes with high average discriminate scores included genes with alterations strongly related to the lung cancer such as AKR1C3, CYP1B1, UCHL1 and AKR1B10. Conclusions: This clustering by comparing expression of thousands of genes at the same time revealed alteration in normal smokers. Most of the identified genes were strongly relevant to lung cancer in the existing literature. The genes may be utilized to identify smokers with increased risk for lung cancer. A large sample study is now recommended to determine relations between the genes ABHD2 and ADH7 and smoking.

사용자 클러스터링을 통한 개선된 협력적 정보여과 (Improved Collaborative Information Filtering with User Clustering)

  • 김학균;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.75-77
    • /
    • 1999
  • 정보추천 시스템은 사용자가 어떤 정보를 선호하는지를 식별함으로써 산재한 정보 중에서 적절한 정보만을 제공하는 것을 목표로 한다. 이러한 정보추천 시스템에서 사용되는 정보여과 기술에는 내용기반 여과와 협력적 여과가 있다. 기존의 협력적 정보여과 기술은 선호도를 적게 제시한 사용자에게 정보를 추천하기 어렵고, 동일한 상품 정보에 대해서 사용자의 평가가 없을 경우 사용자간의 유사성을 판단하기 어려운 단점이 있다. 본 논문은 SVD (Singular Value Decomposition)를 통해 사용자 프로파일을 정량화함으로써 사용자 선호도 행렬로부터 숨어있는 의미정보를 추출하여 동일한 정보에 대해 선호도를 평가해야 한다는 단점을 극복한다. 이때, 사용자 프로파일 벡터를 비감독 학습 알고리즘인 SOM (Self0Organizing Map)으로 클러스터링하여 사용자를 분류하고, 정보추천은 사용자 그룹간에서 이루어지며 Pearson correlation 알고리즘을 이용한다. 기존의 방법과 비교한 결과, 제안한 방법이 새로운 사용자에 대해서도 적절한 정보를 추천할 수 있음을 볼 수 있었다.

  • PDF

비교사 학습과 교사 학습 알고리즘을 결합한 구조 적응형 자기구성 지도 (A Structure-Adaptive Self-Organizing Map with Combination of Supervised and Unsupervised Learning Algorithms)

  • 김현돈;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.333-335
    • /
    • 1999
  • 일반적으로 자기구성 지도에서는 구조가 초기에 결정되어 학습이 끝날때까지 변하기 않기 때문에 각 문제에 대한 구조를 반복된 실험을 통해서 최적화시켜야 한다. 그러나, 지도의 구조가 학습중에 적절하게 변경된다면, 해당 문제에 가장 알맞은 구조의 지도를 생성할 수 있을 것이다. 이 논문에서는 기존의 적응형 자기 구성 지도의 비교사 학습방법에 LVQ 알고리즘을 이용한 교사 학습방법을 결합한 구조 적응형 자기 구성 지도 모델을 제안한다. 이 방법은 일반적인 자기구성 지도 알고리즘보다 작은 수의 노드를 가지고 높은 성능을 보일 뿐만 아니라, 자기 구성 지도의 특성인 위상 보존도 잘 이루어진다. 오프라인 필기 숫자 데이터로 실험한 결과, 제안한 방법이 유용함을 알 수 있었다.

  • PDF