• Title/Summary/Keyword: 자료 연관

Search Result 1,985, Processing Time 0.039 seconds

Discovery of Association Rules Based on Data of Quantitative Attribute and Time Series (수량적 속성과 시계열 분석에 의한 연관규칙 탐사)

  • 양신모;정광호;김진수;최성용;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.175-177
    • /
    • 2003
  • 연관규칙은 데이터 안에 존재하는 항목들간의 종속 관계를 찾아내는 것이다. 기존의 연구에서는 연관규칙 탐사 과정에서 발견항목 자체에만 관심을 두고 연구되어 왔다. 즉, 연관규칙 생성을 위한 후보 항목은 수량을 배제한 항목 대 수량비가 1:1인 상태에서 규칙을 발견하는 연구였다. 이것은 항목의 구매 수량에 관계없이 같은 가중치로 규칙을 발견하는 문제점을 갖고 있다. 두 번째 문제점은 연관규칙은 시간적 연장선상에서 발견되는 규칙이라 할 수 있다. 즉, 규칙을 발견하는 과정에서 모든 자료를 동일한 시간적 가중치를 두어 취급하는 것이다. 본 논문에서는 각각의 아이템을 (아이템, 수량)의 묶음 단위로 후보항목을 만들어 수량적 속성이 포함된 아이템 대 수량 비 1:n의 관계에서 규칙을 발견하는 방법을 제안한다. 또한 과거의 자료들을 이용하여 예측할 때 모든 자료를 동일하게 취급하기보다는 최근의 자료에 더 큰 비중을 주는 예측법을 사용하여 연관규칙 발견의 신뢰성을 높인다. 성능평가는 기존의 알고리즘과 비교하여 제안한 알고리즘의 성능향상 및 타당성을 보인다.

  • PDF

Joint model of longitudinal data with informative observation time and competing risk (결시적 자료에서 관측 중단을 모형화하기 위해 사용되는 경쟁 위험의 적용과 결합 모형)

  • Kim, Yang-Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.1
    • /
    • pp.113-122
    • /
    • 2016
  • Longitudinal data often occur in prospective follow-up studies. Joint model for longitudinal data and failure time has been applied on several works. In this paper, we extend it to the case where longitudinal data involve informative observation time process as well as competing risks survival times. We use a likelihood approach and derive an EM algorithm to obtain maximum likelihood estimate of parameters. A suggested joint model allows us to make inferences for three components: longitudinal outcome, observation time process and competing risk failure time. In addition, we can test the association among these components. In this paper, liver cirrhosis patients' data is analyzed. The relationship between prothrombin times measured at irregular visiting times and drop outs is investigated with a joint model.

A Unified Measure of Association for Complex Data Obtained from Independence Tests (혼합자료에서 독립성 검정에 의한 연관성 측정)

  • 이승천;허문열
    • The Korean Journal of Applied Statistics
    • /
    • v.16 no.1
    • /
    • pp.151-167
    • /
    • 2003
  • Although there exist numerous measures of association, most of them are lacking in generality in that they do not intend to measure the association between heterogeneous type of random variables. On the other hand, many statistical analyzes dealing with complex data sets require a very sophisticate measure of association. In this note, the p-value of independence tests is utilized to obtain a measure of association. The proposed measure of association have some consistency in measuring association between various types of random variables.

A unified measure of association for complex data obtained from independence tests (혼합자료에서 독립성검정에 의한 연관성 측정)

  • Lee, Seung-Chun;Huh, Moon Yul
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.4
    • /
    • pp.523-536
    • /
    • 2021
  • Although there exist numerous measures of association, most of them are lacking in generality in that they do not intend to measure the association between heterogeneous type of random variables. On the other hand, many statistical analyzes dealing with complex data sets require a very sophisticate measure of association. In this note, the p-value of independence tests is utilized to obtain a measure of association. The proposed measure of association have some consistency in measuring association between various types of random variables.

Categorical Date Analysis System in the internet (인터넷상에서의 범주형 자료분석 시스템 개발)

  • 홍종선;김동욱;오민권
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.1
    • /
    • pp.83-95
    • /
    • 1999
  • 본 논문의 목적은 인터넷에서 범주형 자료분석에 대한 전문적인 지식이 없는 일반 분석자들에게 보다 쉽고, 간편하게 다룰 수 있는 범주형 자료 분석 시스템을 제공하는것이다. 이 분석 시스템은 크게 세 가지 측면으로 설계하여 구현하였다. 첫째, 범주형 자료에 대한 탐색적 자료분석을 위하여 세 가지 종류의 히스토그램을 제공한다. 둘째, 범주형 변수들간에 존재하는 연관성을 측정하기 위한 여러 연관성 측도들을 제공한다. 특히, 현재 많이 사용되는 통계 패키지들에서 제공하지 못하는 모자익 그림과 연관 그림을 동적 그래픽스로 구현하여 연관성을 측정하거나 모형을 설정하는데 유용한 정보를 얻을 수 있도록 하였다. 셋째, 대수선형모형에 대한 분석을 통해 사용자가 가장 잘 적합된 대수선형모형을 선택할 수 있게 하였다.

  • PDF

Efficient Data Structure for Mining Association Rules (연관 규칙 탐사를 위한 효율적인 자료 구조)

  • 권경희;정균락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.7-9
    • /
    • 2001
  • 정보화 시대에 정보의 양이 폭발적으로 증가함에 따라 데이터 마이닝(Data Mining) 또는 데이터베이스에서의 지식 발견이라 불리는 분야가 새로운 정보기술의 활용방법으로 대두되었다. 데이터 마이닝의 한 기법인 연관 규칙 탐사를 위한 자료 구조로 그 동안 해쉬 트리, prefix 트리, 이진 트리 구조 등이 제안되었다. 본 논문에서는 연관 규칙 탐사를 위한 효율적인 자료 구조를 제안하고 실험을 통해 해쉬 트리보다 그 성능이 우수함을 보였다.

  • PDF

Association Rule Mining for Space Reduction and Performance Improvement (저장공간 축소와 실행시간 개선을 고려한 연관규칙 마이닝)

  • 한영우;이수원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.337-339
    • /
    • 2002
  • 연관규칙 탐사기법은 거래(사건) 속에 포함된 품목(항목)간의 연관관계를 발견하고자 할 때 사용하는 기법이며, 독특한 형태의 자료구조를 사용하는 다양한 연관규칙 알고리즘들이 제안되었다. 다양한 특성을 갖는 대용량의 데이터에 대해 효율적으로 연관규칙 탐사를 수행하기 위해서는 저장공간과 실행시간을 모두 고려해야 한다. 본 논문에서는 후보항목집합 발생과정 없이 압축빈발항목집합과 동적링크집합을 이용하여 저장공간 축소와 실행시간 개선을 동시에 고려한 연관규칙 알고리즘을 제안하며, 그 우수성을 증명하기 위해 연관규칙 탐사의 대표적인 자료 구조인 FP-struct, H-Struct와의 저장공간 비교 및 이들 저장구조를 사용하는 FP-growth, H-mine 알고리즘과의 실행시간을 비교한다.

  • PDF

Comparisons of Kruglyak and Lander's Nonparametric Linkage Test and Weighted Regression Incorporating Replications (KRUGLYAK과 LANDER의 유전연관성 비모수 방법과 반복 자료를 고려한 가중 회귀분석법의 비교)

  • Choi, Eun-Kyeong;Song, Hae-Hiang
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.1
    • /
    • pp.1-17
    • /
    • 2008
  • The ordinary least squares regression method of Haseman and Elston(1972) is most widely used in genetic linkage studies for continuous traits of sib pairs. Kruglyak and Lander(1995) suggested a statistic which appears to be a nonparametric counterpart to the Haseman and Elston(1972)'s regression method, but in fact these two methods are quite different. In this paper the relationships between these two methods are described and will be compared by simulation studies. One of the characteristics of the sib-pair linkage study is that the explanatory variable has only three different values and thus dependent variable is heavily replicated in each value of the explanatory variable. We propose a weighted least squares regression method which is more appropriate to this situation and the efficiency of the weighted regression in genetic linkage study was explored with normal and non-normal simulated continuous traits data. Simulation studies demonstrated that the weighted regression is more powerful than other tests.

Comparison of the Family Based Association Test and Sib Transmission Disequilibrium Test for Dichotomous Trait (이산형 형질에 대한 가족자료 연관성 검정법 FBAT와 형제 전달 불균형 연관성 검정법 S-TDT의 비교)

  • Kim, Han-Sang;Oh, Young-Sin;Song, Hae-Hiang
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.6
    • /
    • pp.1103-1113
    • /
    • 2010
  • An extensively used approach for family based association test(FBAT) is compared with the sib transmission/disequilibrium test(S-TDT), and in particular the adjusted S-TDT, in which the covariance among related siblings is taken into consideration, can provide a more sensitive test statistic for association. A simulation study comparing the three test statistics demonstrates that the type I error rates of all three tests are larger than the prespecified significance level and the power of the FBAT is lower than those of the other two tests. More detailed studies are required in order to assess the influence of the assumed conditions in FBAT on the efficiency of the test.

Investigation of the Effect of a Learning Program for University Engineering Mathematics (대학 공업수학 학습자료 개발 및 효과)

  • Jeong, Su-Youn;Song, Yeong-Moo
    • Communications of Mathematical Education
    • /
    • v.25 no.2
    • /
    • pp.361-379
    • /
    • 2011
  • The purposes of this research are to develop Engineering Mathematics materials using the relations between Engineering Mathematics contents and not only pre-study contents but also major contents and to find the effect of the mathematics study which is applying them for students majoring in electronics. To accomplish the goals, I made list of Engineering Mathematics contents which is necessary to study electronics. Based on the list, I researched relations between Engineering Mathematics contents and not only pre-study contents but also major contents. After research, I selected some subjects which are related each other, developed study materials and examined responses to the materials. Then I analysed the effects on study attitude after used developed materials in my class. As a result, the major contents which was described in the introduction of the materials helped students to be motivated to study Engineering Mathematics and Pre-study contents described before Engineering Mathematics contents helped them to concentrate on studying Engineering Mathematics. Also it showed that developed study materials were effective in increasing self-confidence which is one attitude in the subcategories for Mathematics study.