• 제목/요약/키워드: Neural Predictor

검색결과 100건 처리시간 0.024초

단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측 (Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제20권9호
    • /
    • pp.1816-1821
    • /
    • 2016
  • 단백질은 대부분의 생물학적 과정에서 중대한 역할을 수행하고 있으므로, 단백질 진화, 구조와 기능을 알아내기 위하여 많은 연구가 수행되고 있는데, 단백질의 이차 구조는 이러한 연구의 중요한 기본적 정보이다. 본 연구는 대규모 단백질 구조 자료로부터 단백질 이차 구조 정보를 효과적으로 추출하여 미지의 단백질 서열이 가지는 이차 구조를 예측하려 한다. 질의 서열과 상동관계에 있는 단백질 구조자료내의 서열들을 광범위하게 찾아내기 위하여, 탐색에 사용하는 프로파일의 구성에 질의 서열과 유사한 서열들을 사용하고 갭을 허용하여 반복적인 탐색이 가능한 PSI-BLAST를 사용하였다. 상동 단백질들의 이차구조는 질의 서열과의 상동 관계의 강도에 따라 가중되어 이차 구조 예측에 기여되었다. 이차 구조를 각각 세 개와 여덟 개로 분류하는 예측 실험에서 상동 서열들과 신경망을 동시에 사용하여 93.28%와 88.79%의 정확도를 얻어서 기존 방법보다 성능이 향상되었다.

Preconceptional use of folic acid and knowledge about folic acid among low-income pregnant women in Korea

  • Kim, Jihyun;Yon, Miyong;Kim, Cho-il;Lee, Yoonna;Moon, Gui-Im;Hong, Jinhwan;Hyun, Taisun
    • Nutrition Research and Practice
    • /
    • 제11권3호
    • /
    • pp.240-246
    • /
    • 2017
  • BACKGROUND/OBJECTIVES: Folic acid supplementation before pregnancy is known to significantly reduce the risk of having a baby with neural tube defects (NTDs). Therefore, it is important for women to be aware of the effects of folic acid supplementation before pregnancy. The purpose of this study was to investigate the awareness and preconceptional use of folic acid and to assess the current knowledge about folic acid among low-income pregnant women in Korea. SUBJECTS/METHODS: A questionnaire survey was conducted in 2012. Five hundred pregnant women were selected from the waiting list for the Nutriplus program implemented in public health centers using a multistage clustered probability sampling design. Data from 439 women were analyzed after excluding ones with incomplete answers. RESULTS: Among women who responded to the questionnaire, 65.6% had heard of folic acid before pregnancy, and 26.4% reported on the preconceptional use of folic acid. Women with a university degree or higher education were more likely to be aware of folic acid and to take folic acid in the preconception period. In a multivariate logistic regression, when age, education level, household income, employment status, gravidity, parity, and folic acid awareness were included in the model, folic acid awareness was a strong predictor of preconceptional folic acid use. As of interview, 85.4% and 77.7% of women were aware of the NTD-preventive role of folic acid and the appropriate time to take folic acid, respectively. The main sources of information on folic acid were healthcare professionals (41.2%), friends and family members (31.2%), and the media (26.5%). CONCLUSIONS: Our results suggest that public health strategies are needed to increase the preconceptional use of folic acid among Korean women.

강화 학습을 이용한 자율주행 차량의 횡 방향 제어 (Lateral Control of An Autonomous Vehicle Using Reinforcement Learning)

  • 이정훈;오세영;최두현
    • 전자공학회논문지C
    • /
    • 제35C권11호
    • /
    • pp.76-88
    • /
    • 1998
  • 강화 학습은 이산적인 공간을 가상하여 많은 연구가 행해졌지만, 많은 실제적인 제어 문제는 연속적인 공간에서 이루어진다. 평가 함수와 행동 함수를 연속함수로 하면 강화 학습 구조를 연속 공간에서 사용할 수 있다. 그러나 이 경우 두 가지 고려해야 할 점이 있다. 하나는 어떤 종류의 함수 표현 법을 사용할 것인가 하는 문제고, 다른 하나는 첨가하는 잡음의 양을 결정하는 것이다. 평가 함수와 정책 함수(제어기)에는 신경회로를 사용하였다. 강화 예측기로 다음 순간의 강화 신호를 예측하고, 아울러 첨가하는 잡음의 양도 결정하였다. 제안된 강화 학습 구조를 사용하여 차량의 횡 방향 제어 모의 실험에서 온라인 학습의 특성을 확인하였다. 제안된 구조를 실차 실험에도 적용하여 유용성과 타당성을 검증하였다.

  • PDF

머신러닝을 활용한 대학생 중도탈락 위험군의 예측모델 비교 연구 : N대학 사례를 중심으로 (A Comparative Study of Prediction Models for College Student Dropout Risk Using Machine Learning: Focusing on the case of N university)

  • 김소현;조성현
    • 대한통합의학회지
    • /
    • 제12권2호
    • /
    • pp.155-166
    • /
    • 2024
  • Purpose : This study aims to identify key factors for predicting dropout risk at the university level and to provide a foundation for policy development aimed at dropout prevention. This study explores the optimal machine learning algorithm by comparing the performance of various algorithms using data on college students' dropout risks. Methods : We collected data on factors influencing dropout risk and propensity were collected from N University. The collected data were applied to several machine learning algorithms, including random forest, decision tree, artificial neural network, logistic regression, support vector machine (SVM), k-nearest neighbor (k-NN) classification, and Naive Bayes. The performance of these models was compared and evaluated, with a focus on predictive validity and the identification of significant dropout factors through the information gain index of machine learning. Results : The binary logistic regression analysis showed that the year of the program, department, grades, and year of entry had a statistically significant effect on the dropout risk. The performance of each machine learning algorithm showed that random forest performed the best. The results showed that the relative importance of the predictor variables was highest for department, age, grade, and residence, in the order of whether or not they matched the school location. Conclusion : Machine learning-based prediction of dropout risk focuses on the early identification of students at risk. The types and causes of dropout crises vary significantly among students. It is important to identify the types and causes of dropout crises so that appropriate actions and support can be taken to remove risk factors and increase protective factors. The relative importance of the factors affecting dropout risk found in this study will help guide educational prescriptions for preventing college student dropout.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

다중회귀모형과 인공신경망모형을 이용한 금강권역 강수량 장기예측 (Application of multiple linear regression and artificial neural network models to forecast long-term precipitation in the Geum River basin)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.723-736
    • /
    • 2022
  • 본 연구에서는 금강권역을 대상으로 최대 12개월까지 선행예측이 가능한 월 강수량 예측모형을 구축하였으며, 예측모형 구축에는 다중회귀분석과 인공신경망의 두 가지 통계적 기법을 적용하였다. 예측인자 후보로 NOAA에서 제공하는 글로벌 기후패턴 39종과 금강권역에 대한 기상인자 8종 등 총 47종의 기후지수를 활용하였다. 예측대상월을 기준으로 과거 40년간의 월 강수량과 기후지수와의 지연상관성 분석을 통해 상관도가 높은 기후지수를 예측인자로 활용하여 다중회귀모형 및 인공신경망 모형을 구축하였다. 1991~2021년에 대해 매월 예측결과의 평균값과 관측값과의 적합도를 분석한 결과, 다중회귀모형은 PBIAS -3.3~-0.1%, NSE 0.45~0.50, r 0.69~0.70으로 분석되었으며, 인공신경망모형은 PBIAS -5.0~+0.5%, NSE 0.35~0.47, r 0.64~0.70로, 다중회귀모형에 의해 도출된 예측치의 평균값이 인공신경망모형보다 관측치에 좀 더 근접한 것으로 나타났다. 각 월의 예측범위 안에 관측치가 포함될 확률을 분석한 결과에서는 다중회귀모형이 57.5~83.6%(평균 72.9%), 인공신경망모형의 경우에는 71.5~88.7%(평균 81.1%)로 인공신경망모형 결과가 우수한 것으로 나타났다. 3분위 예측확률을 비교한 결과는 다중회귀모형의 경우에는 25.9~41.9%(평균 34.6%), 인공신경망모형은 30.3~39.1%(평균 34.7%)로 비슷하며, 두 모형 모두 평균 33.3% 이상으로 월 강수량에 대한 장기예측성을 확인 할 수 있었다. 이상과 같이 두 모형의 예측성 차이는 비교적 크지 않은 것으로 나타났으나, 예측범위에 대한 적중률이나 3분위 예측확률로부터 판단할 때 예측성에 대한 월별 편차는 인공신경망모형의 결과가 상대적으로 작게 나타났다.

대출심사의 예측 정확도 향상을 위한 방법 제안 (Proposing the Method for Improving the Forecast Accuracy of Loan Underwriting)

  • 양유영;박상성;신영근;장동식
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1419-1429
    • /
    • 2010
  • 외환위기 이후 본격적으로 시작된 외국계 대형 은행의 국내 진출 및 선진 금융상품의 수입은 국내 은행 산업 구조와 환경을 변화시키고 경쟁을 가속화시켰다. 앞으로 일어날 변화 및 추세에 대한 정확한 예측은 경쟁이 치열한 환경에서 국내의 은행이 생존하고 발전하기 위해 필수적인 요소이며 그 중에서도 대출 신청 고객에 대한 승인 여부에 대한 예측은 대출 상품이 은행 경영에 있어 가장 큰 비중을 차지하는 수익의 원천이자 신용 리스크 관리의 중심이 된다는 점에서 큰 의미가 있다. 따라서 본 논문에서는 대출 심사 결과의 예측 정확성을 높이기 위한 방법을 제시하고자 한다. 수행 단계로는 상관관계 분석과 특징선택 기법을 통해 대출승인 결과에 유의한 영향을 주는 예측변수들을 선별하고 선별된 변수로 2-Step 군집화 기법을 통해 고객을 군집화 하였다. 이후 각 군집에 LR, NN, SVM 기법을 활용하여 구축한 예측 모형을 적용하여 정확도가 가장 높은 모형을 찾아보았다. 최종적으로 기존 방식의 대출 심사 모형에 LR, NN, SVM 예측 모형을 적용했을 때 산출된 결과와 제안한 모형의 결과를 비교하여 예측의 정확도를 평가하였다.

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구 (A Correction of East Asian Summer Precipitation Simulated by PNU/CME CGCM Using Multiple Linear Regression)

  • 황윤정;안중배
    • 한국지구과학회지
    • /
    • 제28권2호
    • /
    • pp.214-226
    • /
    • 2007
  • 강수는 다양한 대기 변수들의 영향으로 나타나기 때문에 비선형성이 매우 강하다. 따라서 역학 모형을 통해 예측된 강수의 보정은 비선형 모형인 인공 신경망 등을 통해 가능할 것이지만, 인공 신경망의 경우 초기 가중치 선택, 지역 최소화 문제, 뉴런의 수 결정 등의 문제로 인한 한계가 있다. 그러므로 본 연구에서는 가장 보편적으로 사용되는 다중 선형 회귀 모형을 이용하여 CGCM에 의해 모사된 강수를 보정하였으며, 예측성을 살펴보았다. 이를 위하여 우선 PNU/CME 접합 대순환 모형(Coupled General Circulation model, CGCM)(박혜선과 안중배, 2004)을 이용하여 1979년부터 2005년까지 매해 4월부터 8월까지 5개월간 앙상블 적분을 하였다. 적분 결과 중 한반도를 포함한 동북아시아 지역$(110^{\circ}E-145^{\circ}E,\;25^{\circ}N-55^{\circ}N)$의 여름철인 6월(리드 2), 7월(리드 3), 8월(리드 4) 및 여름철 평균인 JJA(from June to August) 기간의 PNU/CME CGCM에 의해 모사된 강수를 보정하기 위해 다중 선형 회귀(Multiple Linear Regression, MLR)를 이용하였다. PNU/CME 접합 대순환 모형의 결과 중 강수, 500 hPa 연직 속도, 200 hPa 발산장, 지상 기온 등의 예측 인자와 관측 강수와의 선형적인 관계를 이용하여 MLR 모형을 구축하였다. 그리고 교차 검증(cross- validation)을 수행하여 PNU/CME 접합 대순환 모형의 결과와 교차 검증 결과를 비교하였다. 상관계수, 적중률 (hit rate), 오보율(false alarm rate) 그리고 Heidke 기술 점수(Heidke skill score) 등을 살펴본 바, 보정하지 않은 모형의 결과에 비해 MLR 모형을 이용하여 보정한 결과의 강수에 대한 예측성이 뛰어난 것을 알 수 있었다.

알포트증후군 환자에서 안지오텐신전환효소 유전자 다형성의 의의 (Angiotensin Converting Enzyme Gene Polymorphism in Alport Syndrome)

  • 김지홍;이재승;김병길
    • Childhood Kidney Diseases
    • /
    • 제8권1호
    • /
    • pp.18-25
    • /
    • 2004
  • 목 적 : 알포트 증후군은 감각신경성 난청을 동반하는 만성 진행성 유전성 신질환으로, 질환의 경과의 다양성으로 인하여 진행성의 예후인자에 특히 유전학적인 역할에 대한 관심이 커지고 있다. 본 연구에서는 만성 진행성 신질환에서 신부전으로의 진행에 관여하는 것으로 알려진 안지오텐신전환효소 유전자 다형성의 발현빈도 및 병의 진행경과와의 관계를 조사하고, 신부전으로의 진행을 억제하는 치료제로서 안지오텐신전환효소 억제제의 가능성을 알아보고자 하였다. 방 법 : 임상양상 및 신조직검사상 알포트 증후군으로 진단된 12명의 환아와 발병하지 않은 12명의 가족들에서 안지오텐신전환효소 다형성의 빈도를 비교하였다. 대상 환아를 신염의 발생 후 10세 이후까지 정상적인 신기능을 유지하고 있는 신기능 유지군과, 발병 후 10세 이전에 만성신부전으로 진행을 시작한(신기능 유지기간 5년 이하) 조기 신부전 진행군으로 구분하여 신기능 감소의 진행시기와 다형성과의 관계를 비교하였고, 발병이 없는 가족에서 다형성의 빈도 및 양상을 관찰하였다. 정상 대조군으로 고혈압, 신장 혹은 심장질환이 없고, 신질환의 가족력, 안지오텐신전환효소 억제제 혹은 다른 항고혈압제의 사용경력이 없는 소아환자 35명을 정상대조군으로 선정하였다. 결과 : 1) 발병연령은 신기능 유지군이 평균 $3.45{\pm}2.4$세였고, 조기 신부전 진행군이 평균 $4.4{\pm}1.2$세로 의미있는 차이가 없었으며, 남녀비는 각각 5:3, 2:1이었다. 2) 12례의 환아 중 4례(33%)는 10세 이전에 평균 8.9세 이전에 만성신부전으로 진행하여 발병에서부터 평균 4.5년 안에 신부전으로 빠를 진행을 보여주는 조기 신부전 진행군이었고, 8례(67%)는 10세 이후까지 이상 신기능이 유지되는 신기능 유지군으로 발병 이후 평균 10.6년(최소 8년, 최대 15년 이상) 이상 신기능을 유지하고 있었으며, 두 군간의 발병 당시 신기능 및 임상양상의 의미있는 차이는 없었다. 3) 알포트 환자의 안지오텐신전환효소 유전자형태는 II type이 3례(25.0%), ID type이 5례(41.7%). DD type이 4례(33.3%)로 정상대조군의 IItype 44.3%, ID type 40.9%, DD type 14.8%와 비교하여 DD type이 많은 경향을 보였으나 두 군사이의 의미 있는 차이는 없었다. 4) 조기 신부전 진행군 4례 중 3례(75%)에서 DD type을 보였고, 신기능 유지군 8례 중 1례(12.5%)에서 DD type을 보여 두 군간의 의미있는 차이를 보였다(p<0.05). 5) 신질환을 나타내지 않은 가족을 대상으로한 조사에서는 총 12례 중 II type 5례(41.7%), ID type 5례(41.7%), DD type 2례(16.6%)로 역시 정상대조군과 유의한 차이를 보이지 않았으며, 신기능 유지여부와 가족내의 DD발현 빈도는 의미있는 관계가 없었다. 결 론 : 소아 알포트 증후군에서 안지오텐신전환효소 유전자의 다형성의 빈도는 정상대조군에 비하여 의미있는 차이가 없었으나 조기에 신부전으로 진행한 환아에서의 DD genotype의 발현율이 의미있게 높게 나타나, 예후인자로서 가능성을 시사하였으며, 따라서 안지오텐신전환효소 억제제 치료가 신부전으로의 진행을 억제하는데 도움을 줄 수 있을 것으로 생각되었다.

  • PDF

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.