• 제목/요약/키워드: 자료 연관

검색결과 1,991건 처리시간 0.029초

수량적 속성과 시계열 분석에 의한 연관규칙 탐사 (Discovery of Association Rules Based on Data of Quantitative Attribute and Time Series)

  • 양신모;정광호;김진수;최성용;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.175-177
    • /
    • 2003
  • 연관규칙은 데이터 안에 존재하는 항목들간의 종속 관계를 찾아내는 것이다. 기존의 연구에서는 연관규칙 탐사 과정에서 발견항목 자체에만 관심을 두고 연구되어 왔다. 즉, 연관규칙 생성을 위한 후보 항목은 수량을 배제한 항목 대 수량비가 1:1인 상태에서 규칙을 발견하는 연구였다. 이것은 항목의 구매 수량에 관계없이 같은 가중치로 규칙을 발견하는 문제점을 갖고 있다. 두 번째 문제점은 연관규칙은 시간적 연장선상에서 발견되는 규칙이라 할 수 있다. 즉, 규칙을 발견하는 과정에서 모든 자료를 동일한 시간적 가중치를 두어 취급하는 것이다. 본 논문에서는 각각의 아이템을 (아이템, 수량)의 묶음 단위로 후보항목을 만들어 수량적 속성이 포함된 아이템 대 수량 비 1:n의 관계에서 규칙을 발견하는 방법을 제안한다. 또한 과거의 자료들을 이용하여 예측할 때 모든 자료를 동일하게 취급하기보다는 최근의 자료에 더 큰 비중을 주는 예측법을 사용하여 연관규칙 발견의 신뢰성을 높인다. 성능평가는 기존의 알고리즘과 비교하여 제안한 알고리즘의 성능향상 및 타당성을 보인다.

  • PDF

결시적 자료에서 관측 중단을 모형화하기 위해 사용되는 경쟁 위험의 적용과 결합 모형 (Joint model of longitudinal data with informative observation time and competing risk)

  • 김양진
    • 응용통계연구
    • /
    • 제29권1호
    • /
    • pp.113-122
    • /
    • 2016
  • 경시적 자료는 반복적으로 측정된 다변량 자료의 한 형태로 임상학, 보건학, 경제학에서 자주 발생된다. 시계열자료와 구분되는 가장 큰 특징은 표본수와 공변량 효과의 추정에 있다. 경시적 자료는 일반적으로 시계열 자료보다 더 큰 표본 개체로 이루어져 있으며 연구의 주 관심은 특정 공변량의 효과를 추정하는 데 있다. 또한 시계열 자료보다 반복 측정 횟수가 짧으며 개체마다 다른 관측 횟수와 다른 관측 중단 시점을 가질 수 있다. 본 연구에서는 관측 시점과 관측 종료 원인이 경시자료와 서로 연관된 경우에 결합 모형을 적용함으로써 이들간의 연관성을 분석하고자한다. 따라서 이들 변량간의 연관성을 모형화하기 위해 이변량 랜덤효과가 적용된다. 실제 자료 분석에서는 간경변증 환자의 핼액 응고 수치 시간을 관심 있는 경시적 자료로 환자가 병원 방문시점과 관측 중단원인들간의 상호 연관관계를 규명하고자 하였다. 특히, 중도 절단원인은 사망이나 간이식을 받는 사건일 때 발생하는데 본 연구에서는 사망 사건과의 연관성이 고려되었다. 결과를 통해 혈액 응고 시간이 길고 병원 방문 시점이 빈번할수록 사망할 가능성이 높음을 알수 있었다. 또한 혈액응고 시간이 길수록 병원 방문 횟수가 빈번하였다.

혼합자료에서 독립성 검정에 의한 연관성 측정 (A Unified Measure of Association for Complex Data Obtained from Independence Tests)

  • 이승천;허문열
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.151-167
    • /
    • 2003
  • 두 확률변수의 연관성을 측정하는 측도는 많이 있으나, 이러한 측도는 같은 유형인 변수들 간의 관계를 측정하기 위한 것으로 여러 가지 유형의 변수들이 혼재되어 있는 혼합자료에서 사용하기는 곤란하다 본 논문에서는 두 확률변수의 독립성 검정을 통해 구한 p-값으로 혼합자료에서 사용될 수 있는 새로운 연관성 측도를 구하였으며, 이렇게 구하여진 연관성 측도가 혼합자료에서 변수들 간의 연관성을 비교하는데 유용하게 사용될 수 있음을 보였다.

혼합자료에서 독립성검정에 의한 연관성 측정 (A unified measure of association for complex data obtained from independence tests)

  • 이승천;허문열
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.523-536
    • /
    • 2021
  • 두 확률변수의 연관성을 측정하는 측도는 많이 있으나, 이러한 측도는 같은 유형인 변수들 간의 관계를 측정하기 위한 것으로 여러 가지 유형의 변수들이 혼재되어 있는 혼합자료에서 사용하기는 곤란하다. 본 논문에서는 두 확률변수의 독립성 검정을 통해 구한 p-값으로 혼합자료에서 사용될 수 있는 새로운 연관성 측도를 구하였으며, 이렇게 구하여 진 연관성 측도가 혼합자료에서 변수들 간의 연관성을 비교하는데 유용하게 사용될 수 있음을 보였다.

인터넷상에서의 범주형 자료분석 시스템 개발 (Categorical Date Analysis System in the internet)

  • 홍종선;김동욱;오민권
    • 응용통계연구
    • /
    • 제12권1호
    • /
    • pp.83-95
    • /
    • 1999
  • 본 논문의 목적은 인터넷에서 범주형 자료분석에 대한 전문적인 지식이 없는 일반 분석자들에게 보다 쉽고, 간편하게 다룰 수 있는 범주형 자료 분석 시스템을 제공하는것이다. 이 분석 시스템은 크게 세 가지 측면으로 설계하여 구현하였다. 첫째, 범주형 자료에 대한 탐색적 자료분석을 위하여 세 가지 종류의 히스토그램을 제공한다. 둘째, 범주형 변수들간에 존재하는 연관성을 측정하기 위한 여러 연관성 측도들을 제공한다. 특히, 현재 많이 사용되는 통계 패키지들에서 제공하지 못하는 모자익 그림과 연관 그림을 동적 그래픽스로 구현하여 연관성을 측정하거나 모형을 설정하는데 유용한 정보를 얻을 수 있도록 하였다. 셋째, 대수선형모형에 대한 분석을 통해 사용자가 가장 잘 적합된 대수선형모형을 선택할 수 있게 하였다.

  • PDF

연관 규칙 탐사를 위한 효율적인 자료 구조 (Efficient Data Structure for Mining Association Rules)

  • 권경희;정균락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.7-9
    • /
    • 2001
  • 정보화 시대에 정보의 양이 폭발적으로 증가함에 따라 데이터 마이닝(Data Mining) 또는 데이터베이스에서의 지식 발견이라 불리는 분야가 새로운 정보기술의 활용방법으로 대두되었다. 데이터 마이닝의 한 기법인 연관 규칙 탐사를 위한 자료 구조로 그 동안 해쉬 트리, prefix 트리, 이진 트리 구조 등이 제안되었다. 본 논문에서는 연관 규칙 탐사를 위한 효율적인 자료 구조를 제안하고 실험을 통해 해쉬 트리보다 그 성능이 우수함을 보였다.

  • PDF

저장공간 축소와 실행시간 개선을 고려한 연관규칙 마이닝 (Association Rule Mining for Space Reduction and Performance Improvement)

  • 한영우;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.337-339
    • /
    • 2002
  • 연관규칙 탐사기법은 거래(사건) 속에 포함된 품목(항목)간의 연관관계를 발견하고자 할 때 사용하는 기법이며, 독특한 형태의 자료구조를 사용하는 다양한 연관규칙 알고리즘들이 제안되었다. 다양한 특성을 갖는 대용량의 데이터에 대해 효율적으로 연관규칙 탐사를 수행하기 위해서는 저장공간과 실행시간을 모두 고려해야 한다. 본 논문에서는 후보항목집합 발생과정 없이 압축빈발항목집합과 동적링크집합을 이용하여 저장공간 축소와 실행시간 개선을 동시에 고려한 연관규칙 알고리즘을 제안하며, 그 우수성을 증명하기 위해 연관규칙 탐사의 대표적인 자료 구조인 FP-struct, H-Struct와의 저장공간 비교 및 이들 저장구조를 사용하는 FP-growth, H-mine 알고리즘과의 실행시간을 비교한다.

  • PDF

KRUGLYAK과 LANDER의 유전연관성 비모수 방법과 반복 자료를 고려한 가중 회귀분석법의 비교 (Comparisons of Kruglyak and Lander's Nonparametric Linkage Test and Weighted Regression Incorporating Replications)

  • 최은경;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 형제 쌍(sibpair)의 연속형 형질(continuous traits) 자료를 이용한 유전연관성 검정 법(linkage test)으로서 Haseman과 Elston (1972)의 최소제곱(ordinary least square, OLS) 회귀분석법이 주로 사용된다. 비모수적 방법으로서 제시된 Kruglyak과 Lander (1995)의 검정통계량은 Haseman과 Elston (1972)의 방법에 대응되는 방법처럼 보이지만 실제로는 매우 다르다. 본 논문에서는 Kruglyak와 Lander (1995)의 검정통계량과 Haseman과 Elston (1972)의 검정통계량의 관계를 설명하고 모의실험으로 두 검정통계량의 검정력을 비교한다. 유전연관성에 사용되는 형제 자료의 특징은 한정된 설명변수의 값에 매우 많은 자료가 반복(replicated)되었다는 점이며, 이러한 반복 자료에 더욱 적절한 가중 회귀분석법을 제안한다. 가중 회귀분석법의 효율성을 정규분포 또는 정규분포가 아닌 연속형 형질 모의실험 자료로 알아본 결과 형제 쌍 자료의 유전연관성 검정에서 가중 회귀분석법이 다른 검정법들보다도 검정력이 높음을 확인하였다.

이산형 형질에 대한 가족자료 연관성 검정법 FBAT와 형제 전달 불균형 연관성 검정법 S-TDT의 비교 (Comparison of the Family Based Association Test and Sib Transmission Disequilibrium Test for Dichotomous Trait)

  • 김한상;오영신;송혜향
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1103-1113
    • /
    • 2010
  • 광범위하게 사용되는 가족자료에 근거한 연관성 검정법 FBAT를 형제 전달 불균형 연관성 검정법 S-TDT와 비교하였고, 특히 형제간의 공분산을 고려한 분산추정량을 사용한 수정 S-TDT로써 유전연관성의 정도가 다른 가족자료가 검정통계량값으로 구분될 수가 있다. 모의실험으로 세 검정법을 비교한 결과, 형제의 표현형 자료가 서로 독립이 아닌 경우에 세 검정법 모두의 제 1종 오류가 정해진 유의수준보다 커지며, 또한 FBAT의 검정력이 S-TDT와 수정 S-TDT의 검정력에 미치지 못한다. FBAT 검정법에서 가정하는 조건이 검정법의 효율성에 미치는 영향을 더욱 심도있게 평가하는 연구가 요구된다.

대학 공업수학 학습자료 개발 및 효과 (Investigation of the Effect of a Learning Program for University Engineering Mathematics)

  • 정수연;송영무
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제25권2호
    • /
    • pp.361-379
    • /
    • 2011
  • 본 연구는 대학의 전자공학과 학생들을 대상으로 수학 교과 내용과 전공 교과 내용의 연관성 및 수학교과 내의 선수 학습 내용과의 연관성을 이용한 공업수학 학습자료를 개발하고 이를 활용한 수학학습의 효과를 알아보는데 목적이 있다. 이러한 목적을 위해 먼저 전자공학과 전공 학습을 위해 필요한 공업수학 내용의 목록을 작성하고 이를 바탕으로 선수학습 내용 및 전공교과 내용과의 연관성을 조사한 후 연관성이 있는 내용을 학습자료의 주제로 선정하여 학습자료를 개발하였다. 그리고 개발된 학습자료를 이용하여 학습하게 한 후 학습자료에 대한 반응을 조사하고, 학습 태도에 대한 효과를 분석하였다. 그 결과, 학습자료의 도입부에 기술된 전공내용은 학생들에게 공업수학 학습에 대한 동기 부여에 도움을 주었으며, 공업수학 학습 내용 전에 기술된 선수학습 내용은 학생들에게 공업수학 학습내용의 학습에 집중하는데 도움을 주었다. 또한 개발된 학습자료는 학생들의 수학 학습 태도 중 수학 학습에 대한 자신감을 향상시키는데 효과가 있는 것으로 나타났다.