• Title/Summary/Keyword: multiple corresponding analysis

검색결과 216건 처리시간 0.028초

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

도시내 첨단 산업단지 이용자 특성을 고려한 지원시설 분석 연구 (An Analysis on Support Facilities Which Consider User's Characteristics in High-tech Industrial Estate in Urban Area)

  • 최형구;김원필
    • 한국산학기술학회논문지
    • /
    • 제17권6호
    • /
    • pp.291-299
    • /
    • 2016
  • 최근 지식산업센터는 지식산업, 정보통신 관련 첨단업체들이 주로 입주하여 경제적 부가가치를 창출하는 시설로써의 역할을 담당하고 있다. 반면, 지식산업센터 내부에 설치되는 지원시설은 입주기업 지원, 그리고 근로자의 근로환경개선을 위하여 역할을 충실해야 하고, 다양한 활동을 영위할 수 있는 공간을 지원한다. 하지만 정부의 정책 지원이 해당 기업에 한하여 실행되고 있으며, 첨단지식산업센터 내 지원시설에는 어떠한 정책적 지원도 이루어지지 않고 있는 실정이다. 이에 본 연구는 근로자 근로환경 지원을 위한 시설인 지식산업센터 지원시설을 대상으로 다각적 분석을 실시하였으며, 근로자 지원시설의 분석결과, 정리하면 다음과 같다. 첫째, 지식산업센터 지원시설에 대한 적정면적 확보규정 도입이 필요하다. 둘째, 지원시설 중, 설치율이 저조한 시설에 대하여 주변시설과의 공유 방안이 필요하다. 셋째, IPA 분석결과, 상업시설 지원면적이 높은 것으로 나타났으나 문화지원시설에 대한 선호도 및 중요도가 높은 것으로 제시되어, 근로자의 근본적 욕구 및 기대에 부응할 수 있는 이용자 특성을 고려한 지원시설 구성방안이 요구되어진다. 마지막으로 근로환경에 영향을 미치는 시설은 사업초기부터 지구단위계획수법을 통한 계획적 도시관리가 적용된다면 근로자의 생산활동 지원에 많은 기여를 할 것으로 분석된다.

안진(眼診) 설문지 개발 및 안진(眼診) 설문의 허실(虛實) 연관성 연구 (Development of Eyes Inspection Questionnaire(EIQ) and Regression Analysis between EIQ Items and deficiency or excess patterns of Eyes Inspection)

  • 서재호;최진용;오환섭;박영배;박영재
    • 대한한의진단학회지
    • /
    • 제18권2호
    • /
    • pp.75-84
    • /
    • 2014
  • Objectives Eyes, one of visual inspection regions, present important clues to pathological patterns including deficiency and excess patterns to the clinicians. The purpose of this study was to develop Eyes Inspection Questionnaire (EIQ) and to examine which items among the EIQ were more predictive of clinicians' determination for the deficiency and excess patterns. Methods Nine questionnaire items for Visual Inspection of Eyes were extracted through the literature review. These items were presented to the 4 Korean medical doctors who are specialized in visual inspection to conduct the Delphi method. The Korean medical doctors were asked to rate the importance of each items for the corresponding Visual Inspection of Eyes, using a Likert 5-point scale(the 3 points of importance as a cut-off point). Then, out of 75 photographs submitted to the Society of HyungSang Medicine in 2009, 30 portrait pictures were selected as samples. The samples were copied to make 60 sample pictures, and then randomly assigned to 4 clinicians. The 4 clinicians evaluated the 60 samples for excess and deficiency of the eyes and were asked to check the 6 questionnaire items. The results were recorded as 5-points-scale, and their average and standard deviations were calculated. Intra- class reliability test and multi regression test were performed using SPSS 13. Results Intra-class correlation coefficient (ICC) was between 0.750 to 0.841 (P<0.05). Indices for visual inspection of the eyes were: endowment of the bone structure around the eyes; brightness of the eyes; upward deviation of the eyes; eye shapes; and definition of iris. 76.92% of deficiency symptom patterns and 86.42% of the excess symptom patterns matched the patterns predicted by the visual inspection of the eyes, according to the frequency analysis. According to the multiple regression analysis, were significantly related to the excessive symptoms, and to the deficiency symptoms. Conclusion This study is the first attempt of development for checklist of excess and deficiency of Visual Inspection of Eyes and quantitative measurement of excess and deficiency using the Visual Inspection of Eyes by the visual inspection experts. Still, additional studies are needed regarding the relationship visual inspection methods have with existing standards of diagnosis.

한국 성인들의 24시간 소변 분석법에 근거한 고나트륨군의 혈압과 고나트륨 섭취관련 위험인자에 관한 연구 (Blood Pressure and Dietary Related Risk Factors Associated with High Sodium Intake Assessed with 24-hour Urine Analysis for Korean Adults)

  • 정연선;임화재;김숙배;김희준;손숙미
    • 대한지역사회영양학회지
    • /
    • 제19권6호
    • /
    • pp.537-549
    • /
    • 2014
  • Objectives: This study was conducted to examine blood pressure and other characteristics of a high sodium intake group assessed with 24-hr urine analysis and the dietary factors related to the risk of high sodium intake among Korean adults. Methods: A cross-sectional study was conducted with adults aged 20-59 years. Subjects who completed 24-hr urine collection (N = 205) were divided into 3 groups (tertile) according to the sodium intake estimated with 24-hour urine analysis. We compared the blood pressure, BMI and dietary related factors of the 3 groups (low, medium, high sodium intake group) with General Linear Model (GLM) and Duncan's multiple range test (p < 0.05). The risk factors related to high sodium intake were assessed with odds ratio (p < 0.05). Results: The sodium intake (mg/day) of the 3 groups were $3359.8{\pm}627.9$, $4900.3{\pm}395.1$ and $6770.6{\pm}873.9$, respectively, corresponding to daily salt intake (g/day) 8.5, 12.4 and 17.2, respectively. High sodium group showed significantly elevated age, BMI and systolic/diastolic blood pressure. Being male gender was associated with significantly increased risk of sodium intake (OR = 1.972; 95%CI: 1.083-3.593). The other factors related to high sodium intake were higher BMI (${\leq}25$) (OR = 2.619; 95% CI: 1.368-5.015), current alcohol consumption (OR = 1.943; 95%CI: 1.060-3.564), and having salty soybean paste with salt percentage > 14% (OR = 3.99; 95% CI: 1.404-6.841). The dietary attitude related to increased risk of high sodium intake included 'enjoy dried fish and salted mackerel' (p < 0.001) and 'eat all broth of soup, stew or noodle' (p < 0.001). Conclusions: Because high sodium intake was associated with higher blood pressure, nutrition education should focus on alcohol consumption, emphasis on related dietary factors such as using low salt soybean paste, improvements in the habit of eating dried fish and salted mackerel or eating all broth of soup, stew or noodle.

지표홍수 빈도곡선의 개발에 의한 미 계측지점의 확률 홍수량 추정 (An Estimation of Flood Quantiles at Ungauged Locations by Index Flood Frequency Curves)

  • 윤용남;신창건;장수형
    • 한국수자원학회논문집
    • /
    • 제38권1호
    • /
    • pp.1-9
    • /
    • 2005
  • 본 연구에서는 지표홍수 빈도곡선을 개발하여 미계측 지점에서의 확률 홍수량을 추정해 보았다. 홍수빈도 분석은 한강유역의 9개 지점에 대하여 연최대치 홍수량 자료를 이용하여 분석하였다. 홍수빈도 곡선을 작성한 후 각 지점별 연평균홍수량( $Q_{2.33}$)을 결정하였고, 각 지점별 재현기간에 따른 연평균 홍수량에 대한 비를 산정 후 평균하였다. 그 결과 재현기간별로 다른 홍수량비가 산정되었다. 연평균 홍수량과 유역의 지형인자와의 상관 분석을 통해 다중선형 회귀식을 도출하였다. 미계측 지점의 확률 홍수량은 그 지점의 유역면적과 하상경사를 이용하여 경험식에 의해 연평균 홍수량을 산정 한 후 재현기간에 따른 홍수량비를 곱하여 산정 할 수 있다. 본 연구의 검증을 위하여 하천정비 기본계획에 수록되어 있는 재현기간별 확률홍수량과 비교한 결과 유역면적 2,000k $m^2$ 이하의 유역에서는 유사한 값을 모의 할 수 있었다. 기존 강우-유출 해석을 기반으로 한 설계 홍수량 추정 방법에의 적용은 재평가되어야 한다. 왜냐하면, 수문자료와 강우-유출모형은 많은 불확실성이 내포하고 있기 때문이다.

또래 괴롭힘 피해경험 발달유형에 따른 내면화 및 외현화 문제 양상 (Long-term sequelae of trajectories of bullying victimization in youth: Internalizing and externalizing behavioral outcomes)

  • 박현선;김민정;정익중
    • 사회복지연구
    • /
    • 제45권2호
    • /
    • pp.5-30
    • /
    • 2014
  • 본 연구의 목적은 아동기와 청소년기에 걸쳐 또래괴롭힘 피해경험 정도의 변화에 따라 구분되는 잠재계층의 수와 그 모양을 파악하고, 각 발달유형별 내면화 및 외현화 문제 수준을 비교하는 데 있다. 이를 위하여 서울아동패널(Seoul Panel Study of Children)의 자료(초등학교 5학년~고등학교 2학년)를 잠재계층성장모형과 공변량분석을 사용하여 분석하였다. 분석 결과 또래괴롭힘 피해경험의 변화 형태에 따라 지속적으로 피해 경험이 낮은 '안정적 저수준 계층'(81.2%), 초기 높은 피해경험 후 피해경험이 점진적으로 줄어드는 '초기 피해후 감소 계층'(15.6%), 높은 수준의 피해경험이 발달기간 동안 지속되는 '지속적 피해계층'(3.5%)으로 세 개 유형의 잠재계층이 도출되었다. 또래괴롭힘 피해의 발달유형에 따라 내면화와 외현화 문제의 수준에 유의미한 차이가 나타났는데, 지속적 피해계층과 초기 피해 후 감소 계층 모두 안정적 저수준 계층에 비하여 3개 내면화 문제(위축성향, 우울 및 불안성향, 자살생각)의 평균추정치가 높은 것으로 나타났다. 외현화 문제의 경우 내면화 문제에 비해 상대적으로 발달유형에 따른 차이가 덜 명확하였으나, 피해지속 계층에 속한 청소년들은 나머지 두 가지 계층에 비하여 공격성과 지위비행에서 유의미하게 높은 평균점수를 보였다. 결론 및 제언에서는 또래괴롭힘 예방 프로그램 개발 및 운영을 위한 실천적 정책적 함의를 제시하였다.

기계학습을 이용한 기업가적 혁신성 예측 모델에 관한 연구 (Machine Learning for Predicting Entrepreneurial Innovativeness)

  • 정두희;윤진섭;양성민
    • 벤처창업연구
    • /
    • 제16권3호
    • /
    • pp.73-86
    • /
    • 2021
  • 이 연구의 목적은 기업가적 혁신성을 정확하게 예측하는 고도화된 분석 모델을 탐색하는 것이다. 기업가정신 연구 분야에서는 최초로, 데이터 과학적 접근방식에 해당되는 기계학습(Machine learning)을 이용해 기업가적 혁신성(entrepreneurial innovativeness)을 예측하는 모델을 제시한다. 예측모델을 구축하기 위하여 Global Entrepreneurship Monitor(GEM)의 62개국 22,099건 데이터를 이용한다. 27개 설명변수로 이뤄진 데이터 셋을 토대로 전통적 통계방법인 다중회귀분석과, 회귀트리, 랜덤포레스트, XG부스트, 인공신경망 등 기계학습을 이용한 예측모델을 구축하고 각 모델의 성능을 비교한다. 모델의 성능 평가를 위해 RMSE(Root mean square error), MAE(Mean absolute error)와 상관관계(Correlation) 등 지표를 사용한다. 분석 결과 5가지 기계학습 기반 모델은 모두 전통적 방법에 비해 우수한 성능을 보였으며, 예측 성능이 가장 좋은 모델은 XG부스트였다. XG부스트를 통한 기업가적 혁신성 예측에 있어서 기여도가 높은 변수는 창업가의 기회인지 및 시장 확장의 교차항 변수이며, 이는 신시장에서 기회를 획득하고자 하는 유형의 창업기업이 높은 혁신성을 보인다는 점을 확인했다. 이 연구는 고도화된 분석방법인 기계학습을 이용해 새로운 예측모델을 제시, 기업가정신 연구의 시야를 확장했다는 점에서 의의를 지닌다.

CBR을 활용한 해외건설 수익성 예측 모델 개발 - 중소·중견기업을 중심으로 - (A Profit Prediction Model in the International Construction Market - focusing on Small and Medium Sized Construction Companies)

  • 황건욱;장우식;박찬영;한승헌;김종성
    • 한국건설관리학회논문집
    • /
    • 제16권4호
    • /
    • pp.50-59
    • /
    • 2015
  • 한국 건설 기업들의 해외 진출이 기하급수적으로 늘어나고 있지만 프로젝트를 수행함에 있어 사업의 수익률은 대기업과 경험이 부족한 중소기업을 비교하였을 때 큰 차이가 나타난다(대기업 5건 중 1건 적자, 중소기업 3건 중 1건 적자 공사). 또한 경험이 부족한 중소, 중견 기업들, 특히 하도급 업체에게는 프로젝트 참여시 사업의 적절성을 판단하기란 어려우며 그에 따른 수익률 또한 예측하기 어렵다. 이에 본 연구는 중소/중견 업체, 특히 하도급 업체 관점에서 해외 건설공사 진출 시 수익률에 영향을 미치는 영향인자를 도출하기 위해 1965년부터 시행된 8,637건의 해외건설 준공데이터 및 문헌고찰 기반으로 수익률에 영향을 미치는 10개 인자를 도출 후 다중회귀분석을 통해 영향인자 간 가중치를 도출하였다. 이를 기반으로 사례기반 추론 기법을 이용하여 수익률 예측 모델을 개발하였으며, Type1 &Type2 error 분석을 통해 검증 결과 11%의 오차율을 보였다. 이러한 수익성 예측 모델을 활용하여 국내 건설 하도급업체들은 해외건설공사 진출 시 해당 프로젝트의 수익성 분포를 사전에 확인하여 양질의 프로젝트를 선별하고, 사업 참여의 의사결정에 중요한 참고자료가 될 것을 기대한다.

Analysis, Detection and Prediction of some of the Structural Motifs in Proteins

  • Guruprasad, Kunchur
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.325-330
    • /
    • 2005
  • We are generally interested in the analysis, detection and prediction of structural motifs in proteins, in order to infer compatibility of amino acid sequence to structure in proteins of known three-dimensional structure available in the Protein Data Bank. In this context, we are analyzing some of the well-characterized structural motifs in proteins. We have analyzed simple structural motifs, such as, ${\beta}$-turns and ${\gamma}$-turns by evaluating the statistically significant type-dependent amino acid positional preferences in enlarged representative protein datasets and revised the amino acid preferences. In doing so, we identified a number of ‘unexpected’ isolated ${\beta}$-turns with a proline amino acid residue at the (i+2) position. We extended our study to the identification of multiple turns, continuous turns and to peptides that correspond to the combinations of individual ${\beta}$ and ${\gamma}$-turns in proteins and examined the hydrogen-bond interactions likely to stabilize these peptides. This led us to develop a database of structural motifs in proteins (DSMP) that would primarily allow us to make queries based on the various fields in the database for some well-characterized structural motifs, such as, helices, ${\beta}$-strands, turns, ${\beta}$-hairpins, ${\beta}$-${\alpha}$-${\beta}$, ${\psi}$-loops, ${\beta}$-sheets, disulphide bridges. We have recently implemented this information for all entries in the current PDB in a relational database called ODSMP using Oracle9i that is easy to update and maintain and added few additional structural motifs. We have also developed another relational database corresponding to amino acid sequences and their associated secondary structure for representative proteins in the PDB called PSSARD. This database allows flexible queries to be made on the compatibility of amino acid sequences in the PDB to ‘user-defined’ super-secondary structure conformation and vice-versa. Currently, we have extended this database to include nearly 23,000 protein crystal structures available in the PDB. Further, we have analyzed the ‘structural plasticity’ associated with the ${\beta}$-propeller structural motif We have developed a method to automatically detect ${\beta}$-propellers from the PDB codes. We evaluated the accuracy and consistency of predicting ${\beta}$ and ${\gamma}$-turns in proteins using the residue-coupled model. I will discuss results of our work and describe databases and software applications that have been developed.

  • PDF

Effect of severe neonatal morbidities on long term outcome in extremely low birthweight infants

  • Koo, Kyo-Yeon;Kim, Jeong-Eun;Lee, Soon-Min;NamGung, Ran;Park, Min-Soo;Park, Kook-In;Lee, Chul
    • Clinical and Experimental Pediatrics
    • /
    • 제53권6호
    • /
    • pp.694-700
    • /
    • 2010
  • Purpose: To assess the validity of individual and combined prognostic effects of severe bronchopulmonary dysplasia (BPD), brain injury, retinopathy of prematurity (ROP), and parenteral nutrition associated cholestasis(PNAC). Methods: We retrospectively analyzed the medical records of 80 extremely low birthweight (ELBW) infants admitted to the neonatal intensive care unit (NICU) of the Severance Children's Hospital, and who survived to a postmenstrual age of 36 weeks. We analyzed the relationship between 4 neonatal morbidities (severe BPD, severe brain injury, severe ROP, and severe PNAC) and poor outcome. Poor outcome indicated death after a postmenstrual age of 36 weeks or survival with neurosensory impairment (cerebral palsy, delayed development, hearing loss, or blindness) between 18 and 24 months of corrected age. Results: Each neonatal morbidity correlated with poor outcome on univariate analysis. Multiple logistic regression analysis revealed that the odds ratios (OR) were 4.9 (95% confidence interval [CI], 1.0-22.6; $P$=0.044) for severe BPD, 13.2 (3.0-57.3; $P$<.001) for severe brain injury, 5.3 (1.6-18.1; $P$=0.007) for severe ROP, and 3.4 (0.5-22.7; $P$=0.215) for severe PNAC. Severe BPD, brain injury, and ROP were significantly correlated with poor outcome, but not severe PNAC. By increasing the morbidity count, the rate of poor outcome was significantly increased (OR 5.2; 95% CI, 2.2-11.9; $P$<.001). In infants free of the above-mentioned morbidities, the rate of poor outcome was 9%, while the corresponding rates in infants with 1, 2, and more than 3 neonatal morbidities were 46%, 69%, and 100%, respectively. Conclusion: In ELBW infants 3 common neonatal mornidifies, severe BPD, brain injury and ROP, strongly predicts the risk of poor outcome.