• 제목/요약/키워드: Graphical Data

검색결과 634건 처리시간 0.016초

그래프 LASSO에서 모형선택기준의 비교 (Comparison of model selection criteria in graphical LASSO)

  • 안형석;박창이
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.881-891
    • /
    • 2014
  • 그래프모형(graphical model)은 확률 변수들간의 조건부 독립성(conditional independence)을 시각적인 네트워크형태로 표현할 수 있기 때문에, 정보학 (bioinformatics)이나 사회관계망 (social network) 등 수많은 변수들이 서로 연결되어 있는 복잡한 확률 시스템에 대한 직관적인 도구로 활용될 수 있다. 그래프 LASSO (graphical least absolute shrinkage and selection operator)는 고차원의 자료에 대한 가우스 그래프 모형 (Gaussian graphical model)의 추정에서 과대적합 (overfitting)을 방지하는데에 효과적인 것으로 알려진 방법이다. 본 논문에서는 그래프 LASSO 추정에서 매우 중요한 문제인 모형선택에 대하여 고려한다. 특히 여러가지 모형선택기준을 모의실험을 통해 비교하며 실제 금융 자료를 분석한다.

Graphical Models for DNA Microarray Data Mining

  • 양진산;장병탁
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2002년도 제1차워크샵
    • /
    • pp.49-61
    • /
    • 2002
  • 현대적 실험방법 및 유전공학의 발전으로 최근 생물학적 자료는 비약적으로 늘어나고 있다. 이러한 자료의 기계학습을 이용한 분석방법은 많은 비용과 시간을 요구하는 전통적인 생물적 실험에 있어서 실험 시간을 단축시켜주고 실험비용을 줄여 주게 된다. 본 논문에서는 특별히 micro array data의 분석에 있어서 graphical model에 기반한 기계학습 방법들을 소개한다. 이중 GTM 은 특히 시각화 효과가 뛰어난 방법으로 Graphical model 에 기반한 GTM의 제반 특성을 소개하고 이를 yeast data의 분석에 적용시킨 결과를 자세히 알아보고자 한다. (**Presentation file을 수신 보관 중)

  • PDF

PROCESS ANALYSIS OF AUTOMOTIVE PARTS USING GRAPHICAL MODELLING

  • IRIKURA Norio;KUZUYA Kazuyoshi;NISHINA Ken
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 1998년도 The 12th Asia Quality Management Symposium* Total Quality Management for Restoring Competitiveness
    • /
    • pp.295-300
    • /
    • 1998
  • Recently graphical modelling is being studied as a useful process analysis tool for exploratory causal analysis. Graphical modelling is a presentation method that uses graphs to describe statistical models of the structures of multivariate data. This paper describes an application of this graphical modeling with two cases from the automotive parts industry. One case is the unbalance problem of the pulley, an automotive generator part. There is multivariate data of the product from each of the processes which are connected in the series. By means of exploratory causal analysis between the variables using graphical modeling, the key processes which causes the variation of the final characteristics and their mechanism of the causal relationship have become clear. Another case is, also, the unbalanced problem of automotive starter parts which consists of many parts and is manufactured by complex machinery and assembling process. By means of the similar technique, the key processes are obtained easily and the results are reasonable from technical knowledge.

  • PDF

데이터 정제와 그래프 분석을 이용한 대용량 공정데이터 분석 방법 (An Analysis Method of Superlarge Manufacturing Process Data Using Data Cleaning and Graphical Analysis)

  • 박재홍;변재현
    • 품질경영학회지
    • /
    • 제30권2호
    • /
    • pp.72-85
    • /
    • 2002
  • Advances in computer and sensor technology have made it possible to obtain superlarge manufacturing process data in real time, letting us extract meaningful information from these superlarge data sets. We propose a systematic data analysis procedure which field engineers can apply easily to manufacture quality products. The procedure consists of data cleaning and data analysis stages. Data cleaning stage is to construct a database suitable for statistical analysis from the original superlarge manufacturing process data. In the data analysis stage, we suggest a graphical easy-to-implement approach to extract practical information from the cleaned database. This study will help manufacturing companies to achieve six sigma quality.

S-PLUS의 소개 및 SAS 와의 그래픽 비교 (Introduction to S-PLUS and graphical comparison with SAS)

  • 김성수;한경수
    • 응용통계연구
    • /
    • 제6권1호
    • /
    • pp.1-11
    • /
    • 1993
  • 통계자료분석에서 그래픽에 의한 분석방법은 컴퓨터의 급속한 발전과 더불어 많은 기법이 개발되어 왔으며, 이는 자료에 내포된 정보 및 통계적인 모형선택방법에 유용하게 이용될 수 있다. 개인용 컴퓨터에서 그래픽 자료 분석방법에 다양하게 응용될 수 있는 소프트웨어로서 S-PLUS(version 2.0)를 소개하고, 그래픽기능의 관점에서 SAS/GRAPH(version 6.04)와 비교, 논의하고자 한다.

  • PDF

그래픽 객체 질의어에서 집합 속성과 메소드를 포함한 경로식의 시각화 (Visualization of Path Expressions with Set Attributes and Methods in Graphical Object Query Languages)

  • 조완섭
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.109-124
    • /
    • 2003
  • 대부분의 상용 관계 DBMS(Database Management System)에서는 사용자 편의성을 위하여 SQL과 함께 그래픽 질의어를 제공하고 있으나, 객체 DBMS의 경우에는 그래픽 질의어에 관한 연구와 개발이 미흡한 실정이다. 그래픽 질의어에서는 복잡한 질의 조건을 간결하고도 직관적인 방법으로 표현하는 것이 중요한 이슈이다. 특히, 객체 DBMS는 관계 DBMS 보다 복잡한 데이타 모델과 객체 질의어를 제공하므로 그래픽 객체 질의어를 설계하고 구현할 때 간결성과 직관성을 유지하는 것이 더욱 중요하다. 본 논문에서는 인터넷 환경에서 원격지 객체 데이타베이스에 접근하여 자료를 검색하고 관리하는 그래픽 객체 질의어인 GOQL(Graphical Object Query Language)을 제안한다. GOQL은 그래픽 관계 질의어에서 다루지 않은 집합값 속성과 한정어 및 메소드를 포함한 길이가 2 이상인 경로를 간단한 그래픽 요소들로 시각화함으로써 간결성과 직관성을 높인다. 그리고 대표적인 객체 질의어인 XSQL(1,2)에서 사용하는 경로는 GOQL에서 제공하는 간단한 시각적 도구로 표현할 수 있음을 보인다. 또한, 논문에서는 GOQL의 그래픽 질의어를 텍스트 객체 질의어로 변환하는 알고리즘을 제안하고, 실제로 인터넷 환경에서 동작하도록 구현한 결과를 소개한다.

A Study on Bias Effect on Model Selection Criteria in Graphical Lasso

  • Choi, Young-Geun;Jeong, Seyoung;Yu, Donghyeon
    • Quantitative Bio-Science
    • /
    • 제37권2호
    • /
    • pp.133-141
    • /
    • 2018
  • Graphical lasso is one of the most popular methods to estimate a sparse precision matrix, which is an inverse of a covariance matrix. The objective function of graphical lasso imposes an ${\ell}_1$-penalty on the (vectorized) precision matrix, where a tuning parameter controls the strength of the penalization. The selection of the tuning parameter is practically and theoretically important since the performance of the estimation depends on an appropriate choice of tuning parameter. While information criteria (e.g. AIC, BIC, or extended BIC) have been widely used, they require an asymptotically unbiased estimator to select optimal tuning parameter. Thus, the biasedness of the ${\ell}_1$-regularized estimate in the graphical lasso may lead to a suboptimal tuning. In this paper, we propose a two-staged bias-correction procedure for the graphical lasso, where the first stage runs the usual graphical lasso and the second stage reruns the procedure with an additional constraint that zero estimates at the first stage remain zero. Our simulation and real data example show that the proposed bias correction improved on both edge recovery and estimation error compared to the single-staged graphical lasso.

트랜잭션 데이터 분석을 위한 확률 그래프 모형 (Probabilistic Graphical Model for Transaction Data Analysis)

  • 안길승;허선
    • 대한산업공학회지
    • /
    • 제42권4호
    • /
    • pp.249-255
    • /
    • 2016
  • Recently, transaction data is accumulated everywhere very rapidly. Association analysis methods are usually applied to analyze transaction data, but the methods have several problems. For example, these methods can only consider one-way relations among items and cannot reflect domain knowledge into analysis process. In order to overcome defect of association analysis methods, we suggest a transaction data analysis method based on probabilistic graphical model (PGM) in this study. The method we suggest has several advantages as compared with association analysis methods. For example, this method has a high flexibility, and can give a solution to various probability problems regarding the transaction data with relationships among items.

Graphical Methods for Evaluating the Degree of the Orthogonal Blocking

  • Jang, Dae-Heung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권3호
    • /
    • pp.669-675
    • /
    • 2006
  • When using response surface designs, the experimental trials should be carried out in blocks in case of heterogeneity of conditions. When we use nearly orthogonal blocking, we need evaluate the degree of orthogonal blocking. Graphical methods for evaluating the degree of orthogonal blocking are suggested.

  • PDF

Graphical exploratory data analysis for ball games in sports

  • Yi, Seongbaek;Jang, Dae-Heung
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1413-1421
    • /
    • 2016
  • In this paper graphical exploratory data analyses are proposed for ball games in sports. The plot of sequence of scoring points of each team can be used to see how the playing game has been processed until the end of each set or quarter. With the plot of sequential score differences through all the games we can see a dominance of each team and the times of score changes, i.e., turnovers. The ternary plots show the contours of scoring compositions for each player and enable us to compare the scoring patterns of each team if any. Using the score sequence plot we also can see the score pattern distribution of players. For demonstration we use the results of the gold medal match between Russia and Brazil for men's volleyball and between USA and Spain for men's basketball at the London 2012 Summer Olympics.