• Title/Summary/Keyword: 분류분석

Search Result 15,973, Processing Time 0.041 seconds

A Review of the Methodology for Sophisticated Data Classification (정교한 데이터 분류를 위한 방법론의 고찰)

  • Kim, Seung Jae;Kim, Sung Hwan
    • Journal of Integrative Natural Science
    • /
    • v.14 no.1
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

Utilizing UPCA and SPCA in Unsupervised Classification Using Landsat TM data

  • Lee, Byung-Gul;Kang, In-Joon
    • Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography Conference
    • /
    • 2003.04a
    • /
    • pp.167-170
    • /
    • 2003
  • 본 연구는 무감독영상해석(Unsupervised Classification)에서 주성분 분석법(Principal Component Analysis)의 응용성을 연구하기 위하여, 주성분 분석법을 K-means, ISODATA 두가지 무감독분류법에 적용하였다. 적용대상지역은 제주도이다. 본 연구에서 주성분 분석 방법중에서 비정규형 주성분 분석방법 (Unstandardized PCA)과 정규형 주성분 분석방법(Standardized PCA) 두가지 경우로 나누어서 각각 연구하였다. 이를 위하여 제주도의 Landsat TM영상과 국토연구원에서 조사한 제주도 식생분류 조사자료와 현장조사 자료 그리고 1/25,000 수치지도를 이용하였다. 그리고 분석된 자료의 정확도를 평가하기 위하여 오차행렬(Error Matrix)을 도입하여 계산하였다. 우선 비정규형 주성분 분석법으로 구한 주성분 영상과 Landsat TM 원래 영상을 오차행렬을 이용하여 제주도의 식생 분류에 각각 적용하였다. 그 결과, K-means 무감독분류법에서는 Landsat TM 자료를 직접 이용한 경우에는 바다와 육상의 분류가 잘 되지 않았으며, 또한 전반적인 영상분류결과가 관측치와 많은 차이를 보였다. 그러나, 주성분 분석법으로 계산된 주성분 영상으로 K-means방법으로 분류 한 결과는 관측치와 잘 일치를 하였다. ISODATA의 경우, Landsat TM 원래영상을 계산하면, K-means으로 분류한 결과보다는 좋은 값을 나타냈으나, 주성분 분석법으로 구한 영상의 계산결과와 비교하면, 주성분 영상으로 구한 분류결과의 정확도가 약 15%정도 높게 나타났다. 정규형 주성분 분석법의 경우를 보면 K-means에서는 Landsat TM원래 자료보다 우수한 결과를 보여주었으나, 비정규형 주성분 분석법으로 계산된 결과보다는 정확도가 다소 떨어지는 단점이 있었고, ISODATA의 경우도 Landsat TM원래 자료보다 약 7%정도의 높은 정확도를 보였으나, 비정규형 영상보다는 약8%정도 낮은 정확도를 보였다. 본 연구에서 주성분 분석법으로 계산된 결과에서 주목되는 것은, 주성분 분석법으로 구한 주성분 영상은 분류방법(K-means, ISODATA, artificial neural networks)에 따라 분류된 결과값이 비슷하게 나타난 반면, Landsat TM원래 자료는 분류방법에 따라 결과값이 많은 차이를 보여 주었다. 그리고 주성분 분석 방법 중에서도 비정규형 주성분 분석법(Unstandardized PCA)이 정규형 주성분 분석법(Standardized PCA)보다 영상분석에서 더 좋은 결과를 보여주는 것으로 나타났다.

  • PDF

A study on Developmental History of the Knowledge and Library Classification in the Epistemological Subject Viewpoint (인식론적 주제관점에서의 지식과 문헌분류의 전개고)

  • 김옥희;남태우
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.133-136
    • /
    • 1994
  • 문헌분류는 지식분류에 입각하여야 한다는 분류의 제 1원리를 규명하기 위하여 지식의 발전과정을 인식론적 관점에서 규명하였으며. 이를 바탕으로 지식분류가 문헌분류에 어떤 영향력을 미쳤는가를 규명하였다. 주제개념은 주관적 관념론, 객관적 관념론, 실용주의, 유물론으로 구분하여 분석하였다. 분석된 결과에 따라 지식분류가 어떤 인식의 관점에서 전개되어 왔는지를 인도의 베다분류법을 비롯하여 플라톤과 아리스토텔레스의 지식분류에서부터 현재의 머시럼, 브리테니카 3의 분류법에 이르기까지 분석하였다. 또한 이를 토대로 지식분류와 문헌분류의 상보성을 규명하였다.

  • PDF

IPAA의 효과를 고찰하기 위한 분류분석방법들의 비교연구

  • Lee, Seung-Yeon;Lee, Eun-Ju;Choe, Ho-Sik
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.291-298
    • /
    • 2005
  • 지속성 외래 복막투석은 말기 신부전 환자들에게 널리 시행하는 신 대체 요법으로, 복막투석 환자에게서 주된 합병증으로 일어나는 단백질-열량 영양실조를 치료하기 위하여 아미노산을 복강 내로 주입하는 치료방법이다. 이현석 등(2004)의 연구에서는 아미노산 복막 투석액(IPAA)이 영양실조 환자들에게 실제로 영양상태에 미치는 영향을 평가하기 위하여 지속성 외래 복막투석 환자 43명을 12개월 동안 3개월 주기로 관측하여 얻어낸 반복측정자료를 바탕으로 IPAA의 효과 여부에 따라 반응군과 비반응군을 분류하였다. 본 논문에서는 이러한 두 그룹을 효과적으로 분류할 수 있는 분류기준변수들을 찾아내고 이 분류기준변수의 값을 바탕으로 새로운 환자에게 IPAA의 투여 여부를 진단할 수 있는 여러 분류방법들을 고찰하여 비교 연구하였다. 모수적인 방법으로 선형판별분석, 이차판별분석 및 로지스틱 판별분석을 소개하고 비모수적인 방법으로 support vector machine(SVM)을 소개하여 분류분석의 결과를 비교하여 두 그룹을 최소한의 오류로 분류하는 방법을 제안하였다.

  • PDF

인터넷 쇼핑몰에서의 동적 고객 분류에 관한 연구

  • 임승재;서의호;정태수
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2003.05a
    • /
    • pp.586-590
    • /
    • 2003
  • 고객 분류는 고객관계관리(CRM)의 한 부분으로서 기업에게 이익을 주는 고객의 속성과 구매패턴을 분석함으로써 목표 고객을 결정하는 것을 의미한다. 현재까지 고객 분류에 관한 연구는 특정한 시점에서 고객의 속성과 구매 패턴을 분석함으로써 이루어졌다. 그러나 인터넷 쇼핑몰과 같은 동적인 환경에 있어서 기존의 정적인 분석방법은 시간에 따라 지속적으로 변하는 고객의 행동 변화를 찾아내고, 예측하는데 적합하지 않다. 본 논문에서는 Decision Tree, ANOVA 분석, ARIMA 모형을 사용하여, 특정한 시점에서의 고객 분류뿐만 아니라 미래 시점에서의 고객 분류를 예측하고 패턴을 분석하는 동적인 고객 분류 방법을 제안한다. 동적인 고객 분류를 통해 인터넷 쇼핑몰 기업은 효율적인 마케팅 전략을 작성하여 기업의 이익을 증진시킬 수 있다.

  • PDF

Prescriptive Analytics System Design Fusing Automatic Classification Method and Intellectual Structure Analysis Method (자동 분류 기법과 지적 구조 분석 기법을 융합한 처방적 분석 시스템 구현 방안 연구)

  • Jeong, Do-Heon
    • Journal of the Korean Society for information Management
    • /
    • v.34 no.4
    • /
    • pp.33-57
    • /
    • 2017
  • This study aims to introduce an emerging prescriptive analytics method and suggest its efficient application to a category-based service system. Prescriptive analytics method provides the whole process of analysis and available alternatives as well as the results of analysis. To simulate the process of optimization, large scale journal articles have been collected and categorized by classification scheme. In the process of applying the concept of prescriptive analytics to a real system, we have fused a dynamic automatic-categorization method for large scale documents and intellectual structure analysis method for scholarly subject fields. The test result shows that some optimized scenarios can be generated efficiently and utilized effectively for reorganizing the classification-based service system.

A Study of CPC-based Technology Classification Analysis Model of Patents (CPC 기반 특허 기술 분류 분석 모델)

  • Chae, Soo-Hyeon;Gim, Jangwon
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.10
    • /
    • pp.443-452
    • /
    • 2018
  • With the explosively increasing intellectual property rights, securing technological competitiveness of companies is more and more important. In particular, since patents include core technologies and element technologies, patent analysis researches are actively conducted to measure the technological value of companies. Various patent analysis studies have been conducted by the International Patent Classification(IPC), which does not include the latest technical classification, and the technical classification accuracy is low. In order to overcome this problem, the Cooperative Patent Classification(CPC), which includes the latest technology classification and detailed technical classification, has been developed. In this paper, we propose a model to analyze the classification of the technologies included in the patent by using the detailed classification system of CPC. It is possible to analyze the inventor's patents in consideration of the relation, importance, and efficiency between the detailed classification schemes of the CPCs to extract the core technology fields and to analyze the details more accurately than the existing IPC-based methods. Also, we perform the comparative evaluation with the existing IPC based patent analysis method and confirm that the proposed model shows better performance in analyzing the inventor's core technology classification.

Development of Classification Method for the Remote Sensing Digital Image Using Canonical Correlation Analysis (정준상관분석을 이용한 원격탐사 수치화상 분류기법의 개발 : 무감독분류기법과 정준상관분석의 통합 알고리즘)

  • Kim, Yong-Il;Kim, Dong-Hyun;Park, Min-Ho
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.4 no.2 s.8
    • /
    • pp.181-193
    • /
    • 1996
  • A new technique for land cover classification which applies digital image pre-classified by unsupervised classification technique, clustering, to Canonical Correlation Analysis(CCA) was proposed in this paper. Compared with maximum likelihood classification, the proposed technique had a good flexibility in selecting training areas. This implies that any selected position of training areas has few effects on classification results. Land cover of each cluster designated by CCA after clustering is able to be used as prior information for maximum likelihood classification. In case that the same training areas are used, accuracy of classification using Canonical Correlation Analysis after cluster analysis is better than that of maximum likelihood classification. Therefore, a new technique proposed in this study will be able to be put to practical use. Moreover this will play an important role in the construction of GIS database

  • PDF

Study on Classification Scheme for Multilateral and Hierarchical Traffic Identification (다각적이고 계층적인 트래픽 분석을 위한 트래픽 분류 체계에 관한 연구)

  • Yoon, Sung-Ho;An, Hyun-Min;Kim, Myung-Sup
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.3 no.2
    • /
    • pp.47-56
    • /
    • 2014
  • Internet traffic has rapidly increased due to the supplying wireless devices and the appearance of various applications and services. By increasing internet traffic rapidly, the need of Internet traffic classification becomes important for the effective use of network resource. However, the traffic classification scheme is not much studied comparing to the study for classification method. This paper proposes novel classification scheme for multilateral and hierarchical traffic identification. The proposed scheme can support multilateral identification with 4 classification criteria such as service, application, protocol, and function. In addition, the proposed scheme can support hierarchical analysis based on roll-up and drill-down operation. We prove the applicability and advantages of the proposed scheme by applying it to real campus network traffic.

A Case Study for Rock Mass Classification and Statistical Analysis in Roadway Tunnel (도로터널에서의 암반분류 및 통계분석 사례)

  • 김영근;유동욱
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2003.06b
    • /
    • pp.197-226
    • /
    • 2003
  • 터널에서의 암반분류/평가는 지보패턴결정 뿐만 아니라 터널주변암반에 대한 설계정 수 산정 및 물성평가에 있어 매우 중요한 요소라 할 수 있다. 암반분류는 각 국 또는 주요기관 별로 분류안이 만들어져 있으며, 현재 RMR분류와 Q-system이 가장 활발히 적용되고 있다. 본고에서는 터널설계단계에서 암반분류방법과 지보패턴결정과정을 고찰하였으며, 도로설계를 중심으로 적용현황을 분석하였다 또한 실제 터널시공시 암반분류 및 판정에 의한 지보공 변경사례를 살펴봄으로서 시공 중 암반분류/평가의 의미를 고찰하였다. 그리고 암반분류요소들에 대한 통계분석을 실시하여 암반분류요소들간의 상관관계를 분석하였다.

  • PDF