• 제목/요약/키워드: McNemar test

검색결과 87건 처리시간 0.023초

한국인 자폐스펙트럼장애에서 Glutamate Receptor, Ionotropic, N-methyl-D-Aspartate 2B(GRIN2B) 유전자 다형성-가족기반연구 (Polymorphisms in Glutamate Receptor, Ionotropic, N-methyl-D-aspartate 2B(GRIN2B) Genes of Autism Spectrum Disorders in Korean Population : Family-based Association Study)

  • 유희정;조인희;박미라;유한익;김진희;김순애
    • 생물정신의학
    • /
    • 제13권4호
    • /
    • pp.289-298
    • /
    • 2006
  • 목 적: 본 연구의 목적은 자폐스펙트럼장애를 가진 아동들과 그 부모로 이루어진 trio를 대상으로 이 장애와 NMDA 수용체 유전자, 그 가운데 GRIN2B 유전자와의 관련성을 규명하고자 하는 것이다. 방 법: 발달지연을 주소로 가천의대 길병원과 경상대학교병원 소아정신과 외래를 내원한 아동을 선별 대상으로 하였다. DSM-IV 진단체계를 이용하여 2명의 소아정신과 의사가 자폐 스펙트럼 장애로 진단한 아동이 일차적인 연구 대상으로 선별되었다. 선별된 아동과 부모들에게는 한국판 자폐증 진단 관찰 스케줄(Autism Diagnostic Observation Schedule, 이하 ADOS) 및 자폐증 진단 면담-개정판(Autism Diagnostic Interview-Revised, 이하 ADI-R)를 실시하였다. PCR-RFLP법을 이용, GRIN2B 유전자에서 모두 4개의 단일 염기 다형성을 분석하였다(rs7301328, rs1806201, rs1805247, rs1805502). 각각의 SNPs에 대한 allelic association 을 평가하기 위하여 TDT 방법이 시행되었으며, 이를 통해 자폐장애 아동이 부모로부터 후보유전자의 특정 alleles들을 유의하게 더 많이 전달받았는지의 여부를 관찰한 뒤 McNemar chi-square test(df=1)에 의거하여 분석하였다. 결 과: 1) 연구 대상군의 특성 : 총 126명의 자폐 스펙트럼장애 아동과 그들의 생물학적 부모가 최종 분석 대상에 포함되었다. 전체 대상자 중 109명(86.5%)이 남아였으며 여아는 17명(13.5%)으로, 남아 대 여아의 비율은 6.41:1이었다. 대상군의 진단 분포는 자폐장애 107명(85.1%), 달리 분류되지 않는 전반적 발달장애(PDD, NOS) 17명(13.5%), 아스퍼거 씨 장애(Asperger's disorder) 2명(1.6%)이었다. 대상군 아동의 평균 연령은 $71.9{\pm}31.6$개월(range : 26~185개월)이었으며 한국판 사회성숙도 검사로 측정된 평균 사회지수(Social Quotient)는 $61.2{\pm}20.6$(range : 23.1~126), 측정 가능한 아동들의 평균 지능은 $65.0{\pm}27.7$(range : 25~126)이었다. K-CARS 점수는 $31.5{\pm}5.4$(range 18.5~46)로 나타났다. 2) 유전자 분석 : 분석한 GRIN2B 유전자의 4개 SNPs 가운데 하나의 SNP(rs1805247)에서 의미 있는 allelic transmission의 차이를 보였다. 이 SNP에서 transmission ratio(transmitted alleles/non-transmitted alleles)는 A allele과 G allele에서 각각 2.03과 .49로, A allele이 G allele에 비해 부모로부터 환자군에게 더 빈번하게 전달(preferential transmission) 되었음이 확인되었다(TDT ${\chi}^2$=12.89, p=.0003). 이는 Bonferroni correction 후에도 여전히 유의미한 수준을 유지하였다(p=.0009). 기타 3개의 SNP(rs7301328, rs1806201, rs1805502) 들에서는 의미 있는 transmission의 차이가 나타나지 않았다(p<.05). 결 론: 본 연구에서 GRIN2B 유전자의 단일유전자 다형성과 자폐스펙트럼장애 사이에 유의한 연관성을 보였다. 이는 glutamate NMDA 2B수용체 유전자가 이 질환의 발생에 관여할 가능성을 시사하는 것이라 생각된다.

  • PDF

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

뇌혈관 협착 환자에서 SPM과 확률뇌지도를 이용한 기저/아세타졸아미드 SPECT의 정량적 분석법의 유용성 (The efficacy of Quantitative Analysis of Basal/Acetazolamide SPECT Using SPM and Statistical Probabilistic Brain Atlas in Patients with Internal Carotid Artery Stenosis)

  • 이호영;이동수;팽진철;오창완;조맹제;정준기;이명철
    • 대한핵의학회지
    • /
    • 제36권6호
    • /
    • pp.357-367
    • /
    • 2002
  • 목적: 뇌혈관질환에 있어서 뇌혈류와 뇌혈류예비능을 기저/아세타졸아미드 뇌혈류SPECT로 평가 가능하나 재관류 수술효과를 비교 평가하기 위해서는 정량적인 평가가 필요하다. 대상 및 방법: 12명의 환자($51{\pm}15$세, 남:녀:6:6)의 수술 전후 기저 시와 아세타졸아미드 부하 뇌관류 SPECT를 SPM에서 공간정규화하고 소뇌의 계수를 기준으로 계수정규화한 후 확률뇌지도(statistical probabilistic anatomical map, SPAM)를 이용하여 부위별 혈류를 정량화하였다. 이 결과로부터 수술 전후 및 정상대조군($59{\pm}15$세, 남:녀:10:11)과의 비교를 McNemar test와 Mannwhitney test를 이용하여 비교하였다. 혈류예비능은 기저 시와 부하시의 차이를 기저 시 계수를 기준으로 백분율로 표현하였다. 결과: 수술 후 수술 부위의 기저 시와 아세타졸아미드 부하 시 혈류 그리고 혈류예비능 모두가 유의하게 향상되었다(p<0.05). 정상군과의 비교에 있어서는 기저 시 혈류는 정상군과 차이가 없을 정도로 호전되었으나, 아세타졸아미드 부하시 혈류와 혈류예비능은 수술 후에도 유의한 차이를 보였다(p<0.05). 혈류예비능은 주로 수술부위를 중심으로 향상되었다. 결론: SPM 및 SPAM을 이용하여 기저/아세타졸아미드 뇌혈류 SPECT의 수술 전후결과를 정량적, 객관적으로 쉽게 비교 평가할 수 있다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.

퍼지 관계를 활용한 사례기반추론 예측 정확성 향상에 관한 연구 (A Study on Forecasting Accuracy Improvement of Case Based Reasoning Approach Using Fuzzy Relation)

  • 이인호;신경식
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.67-84
    • /
    • 2010
  • 미래에 대한 정확한 예측은 경영자, 또는 기업이 수행하는 경영의사결정에 매우 중요한 역할을 한다. 예측만 정확하다면 경영의사결정의 질은 매우 높아질 수 있을 것이다. 하지만 점점 가속화되고 있는 경영 환경의 변화로 말미암아 미래 예측을 정확하게 하는 일은 점점 더 어려워지고 있다. 이에 기업에서는 정확한 예측을 위하여 전문가의 휴리스틱뿐만 아니라 과학적 예측모형을 함께 활용하여 예측의 성과를 높이는 노력을 해 오고 있다. 본 연구는 사례기반추론모형을 예측을 위한 기본 모형으로 설정하고, 데이터 간의 유사도 측정에 퍼지 관계의 개념을 적용함으로써 개선된 예측성과를 얻고자 하였다. 특히, 독립변수 중 기호 데이터 형식의 속성을 가지는 변수들간의 유사도를 측정하기 위해 이진논리의 개념(일치여부의 판단)과 퍼지 관계 및 합성의 개념을 이용하여 도출된 유사도 매트릭스를 사용하였다. 연구 결과, 기호 데이터 형식의 속성을 가지는 변수들 간의 유사도 측정에서 퍼지 관계 및 합성의 개념을 적용하는 방법이 이진논리의 개념을 적용하는 방법과 비교하여 더 우수한 예측정확성을 나타내었다. 그러나 유사도 측정을 위해 다양한 퍼지합성방법(Max-min 합성, Max-product 합성, Max-average 합성)을 적용하여 예측하는 경우에는 예측정확성 측면에서 퍼지 합성방법 간의 통계적인 차이는 유의하지 않았다. 본 연구는 사례기반추론 모형의 구축에서 가장 중요한 유사도 측정에 있어서 퍼지 관계 및 퍼지 합성의 개념을 적용함으로써 유사도 측정 및 적용 방법론을 제시하였다는데 의의가 있다.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.

유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용 (Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating)

  • 안현철
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.161-177
    • /
    • 2014
  • 기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.