• Title/Summary/Keyword: 다중희귀

Search Result 20, Processing Time 0.025 seconds

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

수질개선용 인공습지 실험자료에 의한 유출수 농도 추정식 개발 (Development of Effluent Concentration Estimation Equation from Treatment Wetland Experimental Data)

  • 윤춘경
    • 한국농공학회지
    • /
    • 제41권5호
    • /
    • pp.86-92
    • /
    • 1999
  • Effluent concentration estimation equations for wetland system were developed throught statistical analysis of treatment wetland experimental data. Existin g empirical equations were reviewed for thier accuracy with experimental data, and compared with the estimatin equations. About 70 experimental data sets were used for multiple regression, and variables include influent concentration, hydraulic loading rate, average daily air temperature , and plant coverage. The estimatin equations developed for BOD5 , SS ,T-P, and T-N predicted effluent concentrations moderately well, and coefficient fo determination ($R^2$) for them was 0.74 , 0.60, 0.59 and 0.58 respectively. The equations obtained from same data but excluding plant coverage showed relatively lower $R^2$ than the former case, and it was 0.66, 0.52, 0.41 and 0.57 respectively. The EPA, WPCF , and Kadlec and Knight equations worked poorly and $R^2$ for them was significantly lower than the estimation equation developed in the study. The reason might be that the existing equations were oversimplified that they did ot include important parameters such as air temperature and plant coverage. Therefore, developing reasonable estimation equations from experiment under realistic condition is highly recommended rather than using exiting estimation equations.

  • PDF

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

대학생 도박경험자의 스트레스 및 도박변화동기가 단도박 자기효능감에 미치는 융복합 영향 연구 (Convergence Study on the Effects of Stress and Gambling Change Motivation on Gambling Abstinence Self-Efficacy among College Students Using Gambling)

  • 최정현;김정숙;김성의
    • 융합정보논문지
    • /
    • 제9권6호
    • /
    • pp.19-25
    • /
    • 2019
  • 본 연구는 대학생 도박경험자의 단도박 자기효능감에 영향을 미치는 융복합적 요인을 파악하기 위해 시도되었다. 연구대상자는 C시 및 G시에 소재한 대학교 2곳에서 도박 경험이 있는 학생들을 대상자로 하였다. 연구방법은 서술적 조사연구이며 빈도분석, Pearson's correlation coefficients 및 다중희귀분석을 실시하였다. 자료수집기간은 2018년 11월 1일 부터 12월 31일이다. 상관관계분석에서 스트레스(r=-.314, p<.001), 도박변화동기(r=.272, p=.001)는 단도박 자기효능감과 유의미한 상관관계를 보여 스트레스가 낮을수록, 도박변화동기가 높을수록 단도박 자기효능감이 높은 것으로 나타났다. 다중회귀분석에서 단도박 자기효능감에 가장 큰 영향을 미치는 것은 스트레스(${\beta}=-.29$, p<.001), 도박변화동기 (${\beta}=.25$, p=.003) 순으로 확인되었다. 본 연구의 결과는 대학생 도박경험자들의 단도박 자기효능감을 높이기 위해 스트레스에 대한 관리 및 도박변화동기를 강화하기 위한 도박예방교육프로그램이 필요함을 시사하고 있다.

신용사용과 경제적 만족도 (Credit Use & Financial Satisfaction)

  • Lown, Jean M.;Ju, In-Sook
    • 가정과삶의질연구
    • /
    • 제9권1호통권17호
    • /
    • pp.179-186
    • /
    • 1991
  • 본 연구는 미국 Utah주의 Logan시에 있는 유타주립대하(USU)Credit Union의 멤버들을 대상으로, 신용사용과 신용에 대한 태도가 그들의 경제적 만족도와 어느정도 관련이 있는지를 조사하였다. 연구는 1989년 3월에서 5월까지 걸쳐 USU Credit Union의 지원으로 이루어졌으며, 자료는 21세에서 65세까지의 멤버들 중 500명을 임의 추출하여 설문지 조사를 실시하여(설문지는 본 연구를 위한 문항과 Credit Union 멤버 Survey문항이 함께 이루어졌다) 그중 274명(54.8%)으 답변이 자료분석에 사용되었다. 대부분의 사람들은 집이나 차, 또는 교육비, 의료비에 신용을 사용하는데 긍정적 태도를 보였으며, 반수 이상의 사람들이 신용을 사용함으로써 수수료 또는 이자를 지불하고 있었다. 월평균 신용 납부액은 $643이였으며, 반수 이상의 응답자가 그들의 신용차입액에 대해 걱정하고 있는 반면, 4.4%의 응답자만이 신용을 사용하지 않고 있다고 대답했다. t-테스트, 변량분석, 그리고 상관관계 분석에 의해 경제적 만족도와 의미있는 관계를 가지고 있는 요인들이 단계별 다중 희귀분석에 이용되었는데, 그 결과 사람들의 신용부담액에 대한 근심도가 그 어느것보다도 경제적 만족도와 강하게 연관되어 있는 것으로 나타났다. 이는 과거의 조사들이 가정의 빚, 즉 신용부담액과 수입에 대한 비율로써 가정의 경제적 만족정도(financial well-being)를 측정해온 것에 반한 사실로서, 경제적 만족도는 개인의 주관적 측정인 신용부담액에 대한 근심도와 큰 관련이 있음을 보여주었다.

  • PDF

노인교육 참여가 노인의 심리적 안녕감에 미치는 영향 (A Study about the Effects of Education for the Elderly on their Psychological Well-Being)

  • 이진희;김욱
    • 한국노년학
    • /
    • 제28권4호
    • /
    • pp.887-905
    • /
    • 2008
  • 본 연구는 노인교육 참여가 노인이 지각하는 심리적 안녕감에 미치는 영향을 규명하고자 하였다. 심리적 안녕감의 하위개념을 노인이 경험하는 부정적 정서상태인 고독감과 긍정적 정서상태인 삶의 만족도로 구분하여 노인교육 참여가 노인의 고독감 감소와 삶의 만족도 증진에 기여하는지를 검증하였다. 이를 위해 수도권에 거주하는 만 60세 이상 노인 288명(노인교육 참여 146명, 노인교육 비참여 142명)을 대상으로 구조화된 설문지를 사용하여 조사하였고, SPSS 13.0 WIN을 사용하여 분석하였다. 조사도구는 UCLA 고독감 척도, 삶의 만족도 척도(LSIZ) 그리고 일반적 문항으로 구성하였다. 연구결과, 노인교육 참여노인이 비참여노인에 비해 고독감은 낮고 삶의 만족도는 높게 나타났다. 일반적 특성과 노인교육 참여여부를 포함하여 실시한 다중회귀분석 결과 건강상태가 나쁠수록, 교육수준이 낮을수록, 노인교육에 참여하지 않을수록, 주관적 생활수준이 어려울수록 고독감이 높았고, 희귀모형은 전체고독감 변량의 22.1%를 설명해 주고 있는 것으로 나타났다. 반면, 건강하다고 느낄수록, 노인교육에 참여할수록, 종교활동을 할 경우, 주관적 생활수준이 부유할수록 삶의 만족도가 높았고, 희귀모형은 전체 삶의 만족도 변량의 28.1%를 설명해 주는 것으로 나타났다. 연구의 결과로부터 노후생활과 노인교육을 위한 정책, 실천, 그리고 후속연구에 대한 시사점을 제공하였다.

조현병환자의 삶의 질에 미치는 영향요인 연구 (Schizophrenic Patients Impact on Quality of Life)

  • 김정숙
    • 융합정보논문지
    • /
    • 제8권1호
    • /
    • pp.53-58
    • /
    • 2018
  • 본 연구는 조현병환자의 삶의 질에 영향을 미치는 요인을 파악하기 위해 시도 되었다. 본 연구는 C시 지역에 거주하는 조현병환자 125명을 대상으로 한 서술적 조사연구이며 자료는 SPSS 21.0 을 이용하여 t-test, ANOVA, Pearson's correlation coefficients 산출 및 다중희귀분석을 실시하였다. 자료수집은 2016년 6월 1일부터 2016년 7월 31일 까지 였다. 본 연구결과는 다음과 같다. 조현병 환자의 일반적 특성에 따른 삶의 질 차이는 종교와 지지하는 팀의 종류에 따라 유의한 차이(p<.05)가 나타났다. 삶의 질은 자아존중감(r=.270), p<.0001), 가족지지(r=.348, p<.0001)와 유의한 양적 상관관계를 나타내었다. 자아존중감, 병식, 가족지지는 삶의 질을 49.5% 설명하였으며, 이중 가족지지와 자아존중감이 삶의 질에 의미 있는 영향을 주었다. 조현병 환자의 삶의 질 증진을 위해 가족지지와 자아존중감 강화를 위한 프로그램 개발이 요구된다.

독거노인의 자살생각 영향 요인에 대한 융합연구 (A Converged Study on the Influence on the Suicide of Idea the Elderly Living Alone.)

  • 김정숙
    • 융합정보논문지
    • /
    • 제8권5호
    • /
    • pp.11-17
    • /
    • 2018
  • 본 연구는 독거노인의 자살영향요인에 영향을 미치는 요인을 파악하기 위해 시도 되었다. 본 연구는 K & C 지역에 거주하는 독거노인 175명을 대상으로 한 융합적 서술조사연구이며 자료는 SPSS/WIN 21.0을 이용하여 t-test, ANOVA, Pearson's correlation coefficients 산출 및 다중희귀분석을 실시하였다. 자료수집은 2017년 1월 부터 2017년 3월까지 였다. 본 연구결과는 다음과 같다. 자살생각은 사회활동(r=-.106, p<.05), 주관적 건강상태(r=-.292, p<.01), 자아존중감(r=-.069, p<.05), 자기통제감(r=-.201, p<.01)과 부적 상관관계를 보였고, 우울(r=.023, p<.01), 스트레스(r=.320 p<.05)는 자살과 양의 상관관계를 보였다. 또한 자살생각에 영향을 미치는 요인은 주관적 건강상태, 자아통제감, 사회활동 순으로 나타났고, 총 43.5%의 설명력을 나타났다. 독거노인의 자살을 예방하기 위해서는 자살요인을 파악하고 건강상태, 사회활동, 자아존중감, 자기통제감 관련하여 상담 및 프로그램을 마련해야 할 것이며 자살예방을 돕는 적극적인 간호중재의 모색이 필요하다 하겠다.

주택 ${\cdot}$ 부동산정책이 주택가격에 미치는 영향분석 (A Effect Analysis of the Housing Policy on the Housing Price)

  • 노진호;한숙희;김봉식;고현;권용호;김재준
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2006년도 정기학술발표대회 논문집
    • /
    • pp.665-668
    • /
    • 2006
  • 1997년 후반 외환위기 이후 내수침체로 인한 불황이 우려되자 정부는 부동산 수요와 거래를 진작시키는 방안을 통하여 경기활성화를 꾀하는 시책을 지속적으로 시행하였다. 주택 ${\cdot}$ 부동산 정책을 통해 경기부양을 꾀한 결과 경제성장률이 1999년 10.9%, 2000년에 8.8%의 고 성장세를 유지하며 경기가 뚜렷이 회복되었으나 지속된 경기부양책을 지속한 결과 2001년 하반기부터 주택시장이 과열되는 문제가 발생되었다. 이에 부동산 투기를 진작시킬 목적으로 투기억제정책을 실시한 결과 주택시장을 개선시키기보다 오히려 경제전반의 불안정을 초래하는 폐해를 발생시켰다. 이에 본 논문은 외환위기 이후의 주택매매가격지수, 주택전세가격지수 변동률을 통하여 주택 ${\cdot}$ 부동산 정책이 주택가격에 끼친 영향을 분석하여 향후 부동산 정책을 수립하는데 기초자료로 활용하고자 한다.

  • PDF

가족형성의 양상과 관련된 한국아동의 신체형성 및 지능발달에 관한 연구 (Physical and Intellectual Development of Korean Children in Relation to Family formation patterns)

  • Kim, Joung-Soon; Chung, Moon-Ho;Suh, Sung-Jae
    • 한국인구학
    • /
    • 제15권2호
    • /
    • pp.104-124
    • /
    • 1992
  • 형제수, 출산순위, 출산터울, 모성의 출산시 연령 등 가족형성 양상은 아동의 신체적 발육 성장 및 지능발달과 강한 관련성을 보여 왔음이 세계 여러나라 아동을 대상으로 수행된 연구에서 보고되었다. 본 연구는 형제수와 출산순위, 그리고 출산시 모성의 연령은 아동의 신체적 지능적 발달과는 역상관관계를, 출산터울의 길이는 순상관관계를 나타낼 것이라는 가설을 증명하고자 1984년 한국중학생 1,2,3학년 약 46,000명을 대상으로 수행되었다. 지역별 그리고 사회경제적 상태별 비교를 위하여 서울시 고소득층이 주로 거주하는 학구내의 중학교와 저소득층이 거주하는 학구내 중학교 각각 5개를 선정하고 강원도내 전형적 농촌의 중학교 12개를 선정하여 신장, 체중, 좌고, 혈구용적 지능지수를 측정하였다. 이들 측정치들의 평균은 학부모와 담임선생님의 도움으로 작성된 가족형성 변수별로 비교되었으며 다중 희귀분석과 부분상관분석으로 연관성의 통계적 유의성을 검정하였다. 동일연령의 신체적 발육성장 지표들은 도시의 고소득지역 아동들이 가장 우수했으며 다음이 도시저소득 지역 아동이었고 농촌아동이 가장 빈약하였다. 남녀별 신체적 발육지표들의 차이는 연령이 많을수록 더 현저했으며 연령별 지역별 차이는 남학생에게서 더 두드러졌다. 평균 지능지수는 도시고소득지역 남학생들이 월등히 높아 114.8인데 비해 도시저소득지역 남학생들은 106.1, 그리고 농촌 남학생들은 105.3이었다. 남학생보다는 여학생의 지능지수가 낮았는데 이것은 대만 아동들도 여학생이 모든 연령에서 남학생보다 낮았다는 보고와 일치하였다. 한편 도시저소득지역과 농총지역 학생들은 남녀모두 평균지능지수가 비슷하였다. 가족형성변수들은 혼란변수들은 모든 제어했을 경우에도 아동들의 신체적 지능적 발달에 독립적으로 영향을 미쳤다. 발육지표중에 지능지수와 형제수가 가장 가족형성 변수들과의 연관성이 강했다.

  • PDF