• 제목/요약/키워드: linear predictive

검색결과 509건 처리시간 0.03초

RNN(Recurrent Neural Network)을 이용한 기업부도예측모형에서 회계정보의 동적 변화 연구 (Dynamic forecasts of bankruptcy with Recurrent Neural Network model)

  • 권혁건;이동규;신민수
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.139-153
    • /
    • 2017
  • 기업의 부도는 이해관계자들뿐 아니라 사회에도 경제적으로 큰 손실을 야기한다. 따라서 기업부도예측은 경영학 연구에 있어 중요한 연구주제 중 하나로 다뤄져 왔다. 기존의 연구에서는 부도 예측을 위해 다변량판별분석, 로짓분석, 신경망분석 등 다양한 방법론을 이용하여 모형의 부도 예측력을 높이고 과적합의 문제를 해결하고자 시도하였다. 하지만 기존의 연구들이 시간적 요소를 고려하지 않아 발생할 수 있는 문제점들을 갖고 있음에도 불구하고 부도 예측에 있어서 동적 모형을 이용한 연구는 활발히 진행되고 있지 않으며 따라서 동적 모형을 이용하여 부도예측모형이 더욱 개선될 여지가 있다는 점을 확인할 수 있었다. 이에 본 연구에서는 RNN(Recurrent Neural Network)을 이용하여 시계열 재무 데이터의 동적 변화를 반영한 모형을 만들었으며 기존의 부도예측모형들과의 비교분석을 통해 부도 예측력의 향상에 도움이 된다는 것을 확인할 수 있었다. 모형의 유용성을 검증하기 위해 KIS Value의 재무 데이터를 이용하여 실험을 수행하였고 비교모형으로는 다변량판별분석, 로짓분석, SVM, 인공신경망을 선정하였다. 실험 결과 제안된 모형이 비교 모형에 비해 우수한 예측력을 보이는 것으로 나타났다. 따라서 본 연구는 변수들의 변화를 포착하는 동적 모형을 부도예측에 새롭게 제안하여 부도예측 연구의 발전에 기여할 수 있을 것으로 기대된다.

한국에서 노화에 따른 폐기능지표의 변화양상 (The Influence of Aging on Pulmonary Function Tests in Elderly Korean Population)

  • 이재명;김은정;강민종;손지웅;이승준;김동규;박명재;이명구;현인규;정기석
    • Tuberculosis and Respiratory Diseases
    • /
    • 제49권6호
    • /
    • pp.752-759
    • /
    • 2000
  • 연구배경 : 폐기능 검사는 민족과 인종 그리고 거주지역뿐만 아니라 연령에 따라서도 차이가 있는 것으로 알려져 있다. 그러나 대부분의 검사실에서 검사기기에 내장된 평균적 표준치를 기준으로 삼고 있는 실정이어서 노령인구에 대한 폐기능검사 표준을 조사할 필요가 있었다. 이에 건강한 노인을 대상으로 폐기능검사를 시행하여 연령증가에 따른 폐기능의 변화를 확인하고 이를 토대로 표준치를 제시하고자 하였다. 방법 : 65세 이상의 남녀 각 100명을 대상으로 폐기능검사를 시행하였다. 측정된 FVC, $FEV_1을 Windows용 SPSS 8.0 version을 이용하여 연령 및 사용하여 다중회기분석을 시행하였다. 노인들의 연령과 키를 현재까지 많이 쓰이고 있는 다중선형회기식으로 분석하여 저자들의 다중선형회기식과의 차이를 분석하였다. 결과 : 대상 200예 중 남자노인의 평균연령은 $71.5{\pm}5.1$세였고, 평균신장은 $163.5{\pm}6.20$cm 였다. 이들의 평균 FVC는 $3.42{\pm}0.48{\ell}$, 평균 $FEV_1$$2.71{\pm}0.39{\ell}$였다. 여자노인의 평균연령은 $72.0{\pm}5.1$세였고, 평균 신장은 $149.1{\pm}5.93$cm 였다. 이들의 평균 FVC는 $2.22{\pm}0.42{\ell}$ 였고, 평균 $FEV_1$$1.83{\pm}0.33{\ell}$였다. 단변수 분석에서 선형적 연관성을 보인 연령과 신장을 독립변수로 한 다중회귀식을 계산하였고 이를 기존의 다종선형회기식과 비교한 결과 $FEV_1$은 Morris등의 다중선형회기식에 의한 예측치가 실측치보다 낮게 예측되어 유의한 차이가 있었다(p<0.01). 결론 : 65세 이상의 정상노인에서 폐기능 검사를 시행한 결과 연령의 증가에 따라 폐기능이 통계적으로 의미있게 감소함을 확인하였다. 또한 이들의 폐기능 실측치를 다종선형회귀식을 도출하여 기존에 보고된 식들과 비교한 결과 기존의 다중선형회귀식이 한국노인의 표준을 대변할 수 없음을 증명하였다. 저자들의 다중선형회귀식은 노인 연령균에서 오차가 적어 한국노인의 폐기능을 예측하는데 유용할 것으로 기대되었다.

  • PDF

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

지체장애근로자의 직업성공 요인에 관한 연구 (A study on the factors to affect the career success among workers with disabilities)

  • 이달엽
    • 한국사회복지학회:학술대회논문집
    • /
    • 한국사회복지학회 2003년도 추계학술대회 자료집
    • /
    • pp.185-216
    • /
    • 2003
  • 본 연구에서 지체장애근로자들의 직업성공을 구성하는 요인들을 분석하고 이들 요인이 직업성공과 이직에 영향을 미치는 정도를 조사하여 가설적 이론모형을 검증하려는 목적을 두었다. 이를 위해서 지체장애를 가진 근로자 374명과 일반근로자 453명을 대상으로 구조화된 설문지를 통해 나타난 주요 연구결과들은 다음과 같이 요약되었다. 첫째, 장애근로자와 일반근로자의 직업성공을 구성하는 요인은 개인, 가정, 조직의 측면에서 나타났다. 개인적인 측면은 자아존중감과 자아효능감으로 구성되었고, 가족적인 측면은 다중역할스트레스와 자녀의 수로 구성되었다. 조직적인 측면은 자원활용능력, 네트워킹, 그리고 조언자로 구성되었다 이 밖에도 주관적인 직업성공과 객관적인 직업성공이라는 잠재변수에서 종 10개의 측정변수가 도출되었다. 둘째, 장애근로자와 일반근로자 집단 모두 직종이 직업성공에 영향을 미치는 것으로 조사되었다. 관측변수에서는 두 집단에서 직업성공에 영향을 주는 변수가 서로 다르게 나왔다. 장애근로자집단은 이직을 했을 때 평균적으로 근속한 년수와 임금을 제외하고 나머지 모든 관측변수에서 영향을 미치는 것으로 나타났으며, 일반집단은 조언자와 근속년수를 제외하고 나머지 모든 관측변수에서 영향을 미치는 것으로 조사되었다. 셋째, 장애근로자와 일반근로자 집단 모두 연령과 이직 경험이 이직 (이직횟수)에 영향을 미치는 것으로 나타났다. 그러나 장애집단은 친구의 수, 일반집단은 직업선택 시 중요하게 고려하는 사망이 각각 이직에 강한 영향을 미치는 것으로 조사되어 두 집단의 자이를 보여주었다. 또한 관측변수에서도 장애집단은 배우자의 직업과 근속년수, 일반집단은 다중역할 스트레스와 이직평균 근무년수에서 각기 다르게 이직에 영향을 미치는 것으로 나타났다. 넷째, 가설적 경로모형을 검증한 결과 제 1모형은 어느 정도 타당하고 직업성공을 예측할 수 있는 것으로 나타났으며, 제 2모형은 카이스퀘어와 자유도 ($x^2=64950$, df=61, P=0341), 기초부합치 (AGFI)는 .954, 비적합지수 (CFI)는 997, 그리고 원소간의 평균차이 (RMR)도 .038로써 모형의 적합도 지수는 모두 허용된 범위 안에 있기 때문에 매우 적합한 모형으로 직업 성공을 보다 높게 예측할 수 있는 것으로 조사되었다. 이상의 연구결과를 바탕으로 본 연구에서는 다음과 같이 결론을 도출하였다. 첫째, 직종이 두 집단 모두에서 직업성공을 예측하는데 주요한 변수로 나타나 장애근로자들의 학력을 높이고 계속해서 전문화 육에 많은 노력이 필요할 것이다. 특히, 임금정도와 같은 객관적인 직업성공 보다는 임금과 진급에서의 만족과 같은 주관적인 직업성공에 더욱 더 많은 고려를 기울여야 할 것으로 사료된다. 둘째, 장애근로자의 이직을 줄이기 위해서는 직장 내에서 유용한 인적 자원과 네트웍의 수를 늘여야 할 것이다. 이것은 장애집단이 일반집단보다 대인관계에 대해서 더 많은 시간과 노력을 기울여야 한다는 것을 의미한다.

  • PDF

소아 단백뇨 검사에 있어서 단회뇨 단백/크레아티닌 비의 유용성 및 일일 요단백량과의 연관성 (The Usefulness of Spot Urine Protein/Creatinine Ratio in Evaluating Proteinuria in Children and the Correlation between 24-hour Urinary Protein Amount and Spot Urine Protein/Creatinine Ratio)

  • 홍선영;김지영;정우영
    • Clinical and Experimental Pediatrics
    • /
    • 제46권2호
    • /
    • pp.173-177
    • /
    • 2003
  • 목 적 : 근래에 들어 단회뇨를 이용한 단백/크레아티닌 농도비(P/C ratio; PCR)를 이용하여 24시간 요단백량을 예측하는데 있어서 영향을 미치는 인자에 대한 일치되지 않은 연구결과가 보고되고 있다. 이에 저자들은 소아에서 24시간 요단백량과 단회뇨의 PCR 사이의 상관관계를 분석하고, 이런 상관관계에 단백뇨의 양, 연령, 성별 및 사구체 여과율이 미치는 영향을 알아보고자 본 연구를 시행하였다. 방 법 : 2002년 3월부터 2002년 8월까지 인제대학교 부산백병원 소아과 신장클리닉에 내원한 외래 및 입원 환아 94명을 대상으로 24시간 채뇨를 실시하여 단백량과 크레아티닌 양, 사구체 여과율을 측정하였고, 24시간 채뇨 직후의 단회뇨를 이용하여 단백/크레아티닌 농도비(P/C ratio; PCR)를 측정하였다. 모든 예에서 혈청 크레아티닌, 알부민을 동시에 측정하였다. 검사의 신뢰성을 위하여 일일 요 중 크레아티닌 배설양이 15 mg/kg 이상이었던 68례 만을 분석대상에 포함하였다. 결 과 : 1) 대상 환아의 평균 연령은 $11{\pm}3.5$세였으며, 평균 혈청 크레아티닌은 $0.64{\pm}0.25mg/dL$, 사구체 여과율은 $132{\pm}68mL/min/1.73m^2$, 평균 혈청 알부민 수치는 $4.6{\pm}5.2g/dL$이었다. 평균 24시간 요단백량은 $826{\pm}2,891mg/m^2/day$이었고, 단회뇨의 PCR은 $1.39{\pm}4.15$였다. 2) 24시간 요단백량과 단회뇨의 PCR 사이의 상관관계 : 전체대상 환아에서 24시간 요단백의 양과 단회뇨의 PCR은 R=0.936의 상관계수를 보이며, 유의한 양의 선형 상관관계를 나타내었다(P<0.0001). 24시간 요단백량에 따라 분류된 두 군과, 연령에 따라 분류된 두 군에서도 각각 24시간 요단백량과 단회뇨의 PCR은 모두 유의한 상관관계를 보였다. 3) 24시간 요단백량을 예측하기 위한 PCR의 각 cutoff 치에 따른 민감도, 특이도, 양성 예측도 및 음성예측도 : 24시간 요단백량이 500 mg 이상임을 예측하기 위한 PCR의 cutoff치를 0.5 또는 1.0 이상으로 정했을 때, 그리고 24시간 요단백량이 1,000 mg 이상임을 예측하기 위한 PCR의 cutoff치를 0.5 또는 1.0 이상으로 정했을 때의 각각의 경우를 분석한 결과, 요단백량 500 mg/day 이상을 PCR 0.5의 cutoff치로 예측할 경우가 가장 높은 민감도, 특이도, 양성예측도 및 음성예측도를 보였다. 4) 24시간 요단백량과, 단회뇨의 PCR 사이의 오차에 관여하는 요인 : 24시간 요단백량과 단회뇨의 PCR 사이의 오차(fractional difference)와 일일 요단백량, 사구체 여과율, 연령 인자사이의 다중회귀분석 결과 연령이 유의하게 작용함을 나타내었고, 요단백량과 사구체 여과율은 유의하지 않았다. 남녀 각 군을 나누어서 분석하였을 경우도 오차에 연령이 유의하게 작용하였다. 성별에 따른 영향을 알아보기 위해, t-test를 이용하여 분석한 결과 오차는 성별에 따라서는 별다른 차이가 없었다. 결 론 : 본 연구에서는 24시간 요단백량과 단회뇨의 PCR 사이의 오차에 관여하는 요인으로 요단백량과 성별, 사구체 여과율은 의미있는 영향을 주지 않았고, 연령은 유의하게 작용하는 것으로 나타났다. 그러므로 소아에서도 24시간 요단백량을 예측하기 위한 단회뇨의 PCR의 cutoff치를 설정함에 있어서 나이와 성별 등의 요인들에 의한 영향을 보다 명확하게 규명하기 위한 더 광범위한 조사군을 대상으로 한 연구가 필요하다고 사료되며, 이런 연구결과를 바탕으로 얻어진 PCR cutoff 치가 설정되기 이전에는 단회뇨의 PCR의 임상적 적용은 검색검사의 목적으로 제한되어야 함이 타당하다고 생각한다.

Serum Tumor Marker Levels might have Little Significance in Evaluating Neoadjuvant Treatment Response in Locally Advanced Breast Cancer

  • Wang, Yu-Jie;Huang, Xiao-Yan;Mo, Miao;Li, Jian-Wei;Jia, Xiao-Qing;Shao, Zhi-Min;Shen, Zhen-Zhou;Wu, Jiong;Liu, Guang-Yu
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권11호
    • /
    • pp.4603-4608
    • /
    • 2015
  • Background: To determine the potential value of serum tumor markers in predicting pCR (pathological complete response) during neoadjuvant chemotherapy. Materials and Methods: We retrospectively monitored the pro-, mid-, and post-neoadjuvant treatment serum tumor marker concentrations in patients with locally advanced breast cancer (stage II-III) who accepted pre-surgical chemotherapy or chemotherapy in combination with targeted therapy at Fudan University Shanghai Cancer Center between September 2011 and January 2014 and investigated the association of serum tumor marker levels with therapeutic effect. Core needle biopsy samples were assessed using immunohistochemistry (IHC) prior to neoadjuvant treatment to determine hormone receptor, human epidermal growth factor receptor 2(HER2), and proliferation index Ki67 values. In our study, therapeutic response was evaluated by pCR, defined as the disappearance of all invasive cancer cells from excised tissue (including primary lesion and axillary lymph nodes) after completion of chemotherapy. Analysis of variance of repeated measures and receiver operating characteristic (ROC) curves were employed for statistical analysis of the data. Results: A total of 348 patients were recruited in our study after excluding patients with incomplete clinical information. Of these, 106 patients were observed to have acquired pCR status after treatment completion, accounting for approximately 30.5% of study individuals. In addition, 147patients were determined to be Her-2 positive, among whom the pCR rate was 45.6% (69 patients). General linear model analysis (repeated measures analysis of variance) showed that the concentration of cancer antigen (CA) 15-3 increased after neoadjuvant chemotherapy in both pCR and non-pCR groups, and that there were significant differences between the two groups (P=0.008). The areas under the ROC curves (AUCs) of pre-, mid-, and post-treatment CA15-3 concentrations demonstrated low-level predictive value (AUC=0.594, 0.644, 0.621, respectively). No significant differences in carcinoembryonic antigen (CEA) or CA12-5 serum levels were observed between the pCR and non-pCR groups (P=0.196 and 0.693, respectively). No efficient AUC of CEA or CA12-5 concentrations were observed to predict patient response toward neoadjuvant treatment (both less than 0.7), nor were differences between the two groups observed at different time points. We then analyzed the Her-2 positive subset of our cohort. Significant differences in CEA concentrations were identified between the pCR and non-pCR groups (P=0.039), but not in CA15-3 or CA12-5 levels (p=0.092 and 0.89, respectively). None of the ROC curves showed underlying prognostic value, as the AUCs of these three markers were less than 0.7. The ROC-AUCs for the CA12-5 concentrations of inter-and post-neoadjuvant chemotherapy in the estrogen receptor negative HER2 positive subgroup were 0.735 and 0.767, respectively. However, the specificity and sensitivity values were at odds with each other which meant that improving either the sensitivity or specificity would impair the efficiency of the other. Conclusions: Serum tumor markers CA15-3, CA12-5, and CEA might have little clinical significance in predicting neoadjuvant treatment response in locally advanced breast cancer.

우리나라 성인여성에서 정상 폐활량 예측을 위한 양팔벌린 손끝길이와 신장과의 관계 (Arm Span-Height Relationship for Prediction of Spirometric Values in Korean Adult Women)

  • 고원중;주영수;김태엽;박재성;유승도;최광수;백도명;한성구;심영수
    • Tuberculosis and Respiratory Diseases
    • /
    • 제46권6호
    • /
    • pp.786-794
    • /
    • 1999
  • 연구배경 : 척추의 이상굴곡 등으로 신장을 정확히 측정할 수 없는 환자에서 정상폐활량을 추정하기 위해서는 양팔벌린 손끝길이를 측정하여 신장을 예측한다. 연령을 고려하지 않고 고정된 비(AS/Ht ratio)를 이용하는 방법과 연령을 고려한 회귀방정식을 이용하는 두가지 방법이 있으며 이는 인종에 따라 다르다고 알려져있다. 대상 및 방법 : 우리나라 성인여성에서 양팔별린 손끝길이와 신장 그리고 연령과의 관계를 알아보고자 울산광역시에 거주하는 20-69세의 성인여성중 연령별로 표본추출된 381명(평균연령 $46.6{\pm}12.8$세, 평균신장 $154.3{\pm}5.7cm$)의 자료를 분석하였다. 결 과 : 우리나라 성인여성의 AS/Ht ratio는 $1.004{\pm}0.023$이다. 다중선형회귀분석상 양팔벌린 손끝길이와 연령이 모두 신장과 유의한 선형적 관련성을 보였다. Height(cm)=0.7094 Arm span(cm)-0.0891 Age(yr)+48.54(p=0.0001, $r^2$=0.76) AS/Ht ratio를 통한 신장 예측값와 실측값의 차이 즉, 잔차(residual)는 양팔벌린 손끝길이와 연령에 의해서 유의한 영향을 받는다 (p=0.0001). 양팔벌린 손끝길이 또는 연령이 감소할수록 AS/Ht ratio에 의한 신장 예측값은 실측값보다 낮아지며, 양팔벌린 손끝길이 또는 연령이 증가할수록 AS/Ht ratio에 의한 신장 예측값은 실측값보다 높아진다. 회귀방정식을 통한 신장 예측값과 실측값의 차이는 양팔벌린 손끝길이와 연령에 의한 영향을 받지 않는다(p>0.05). 결 론 : 우리나라 성인여성에서 정상폐활량 추정을 위한 신장 예측치를 구하고자 할 때 양팔벌린 손끝길이와 연령의 두 변수를 이용한 회귀방정식을 이용하는 것이 고정된 AS/Ht ratio를 이용하는 것보다 더 정확하다. As/Ht ratio는 양팔벌린 손끝길이와 연령의 양 극단에서 신장을 정확하게 예측하지 못한다.

  • PDF

승주지방(昇州地方)에서 기상요인(氣象要因)과 택사(澤瀉) 생육(生育) 및 수량(收量)과의 관계(關係) (Relationships between Meteorological Factors and Growth and Yield of Alisma plantago L. in Seungju Area)

  • 권병선;임준택;정동희;황종진
    • 한국약용작물학회지
    • /
    • 제2권1호
    • /
    • pp.7-13
    • /
    • 1994
  • 1983년(年) 부터 1992년(年) 까지 계속하여 재배(栽培)하여온 전남(全南) 승주군(昇州郡) 해룡면(海龍面) 농가(農家) 도장(圖場)에서 조사(調査)한 택사(澤瀉)의 주요특성(主要特性)과 재배기간중(栽培期間中) 관측(觀測)된 기상자료(氣象資料)를 이용(利用)하여 생육(生育) 및 수양(收量)과 기상요인(氣象要因)과의 상관관계(相關關係), 분산(分散) 및 수양(收量) 추정식(推定式)을 유도(誘導)한 결과(結果)는 다음과 같다. 1. 기상요인중(氣象要因中) 변리(變異)가 큰 것은 10월(月) 의 강수량(降水量)과 11월(月)의 최저기온(最低氣溫)으로서 변리계수(變異係數) (C.V)는 각각 106.44%와 144.08%였으며, 7월(月), 8월(月), 9월(月)의 평균기온(平均氣溫)과 최고기온(最高氣溫) 및 최저기온(最低氣溫)은 비교적 변리(變異)가 적었다. 2. 생육(生育) 및 수양형질(收量形質)의 변리계수(變異係數)는 수양형질중(收量形質中) 생근중(生根重)은 30.62% 건근중(乾根重)은 31.8%서 년차간(年次間) 변리(變異)가 아주 켰고 묘장(苗長)과 경장(莖長)은 $5.51{\sim}6.26%$로 변리(變異)가 중간정도였으며 엽폭(葉幅), 엽장(葉長), 경수(莖數) 및 근경(根莖)은 $1.08%{\sim}3.23%$로 변리(變異)가 아주 적어서 이들 형질(形質)은 년차간(年次間) 변리(變異)가 적음을 알 수 있었다. 3. 기상요인(氣象要因) 택사생육(澤瀉生育) 및 수양형질간(收量形質間)의 상관(相關)에서는 11월(月)의 최고기온(最高氣溫)과 엽장(葉長), 경장(莖長), 경수(莖數), 및 건근중(乾根重)에서 5% 수준(水準)의 유의성(有意性) 있는 정(正)의 상관(相關)이 인정(認定)되었다. 4.생육(生育) 및 수양형질(收量形質) 상호간(相互間)의 상관(相關)에서는 모두가 정(正)의 상관(相關)으로 고도(高度)의 유의성(有意性)이 인정(認定)되었으며 11월(月)의 최고기온(最高氣溫)을 이용(利用)하여 경수(莖數)를 추정(推定)한 결과(結果) $Y_1=4.114+0.5333\;X\;(R^2=0.4410)$,의 직선회귀식(直線回歸式)을 유도(誘導)할 수 있었고, 역시 11월(月)의 최고기온(最高氣溫)을 이용(利用)하여 건근중(乾根重)수양(收量)의 추정식(推定式) 유도(誘導)한 결과(結果)$Y_2=55.0405+14.3233\;X\;(R^2=0.4511)$의 직선회귀식(直線回歸式)을 얻을 수 있었으며 이들에 대한 분산(分散) 분석(分析)에서도 유의성(有意性)이 인정(認定)되었기에 수양(收量)에 대한 추정식(推定式)을 이용(利用)하여 이논적(理論的) 수양(收量)과 실제수양(實際收量)의 오차(誤差)를 구(求)한 결과(結果) l0%미만(未滿)의 차이(差異)를 보여 비교적 잘 적중되었다.

  • PDF

중기예보를 이용한 태양광 일사량 예측 연구 (A study on solar radiation prediction using medium-range weather forecasts)

  • 박수진;김효정;김삼용
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.49-62
    • /
    • 2023
  • 급속적으로 비중이 증가하고 있는 태양광 에너지는 지속적인 개발 및 투자가 이루어지고 있다. 신재생에너지 정책인 그린뉴딜과 가정용 태양광 패널의 설치가 증가함에 따라 국내 태양광 에너지 보급이 점차 확대되어 그에 맞추어 발전량의 정확한 수요 예측 연구가 활발하게 진행되고 있는 시점이다. 또한, 일사량 예측이 발전량 수요 예측에 가장 영향을 미치는 요소로 작용하고 있다는 점에서 일사량 예측의 중요성을 파악하였다. 덧붙여, 본 연구는 선행 연구들에서 사용되지 않은 중기예보 기상 데이터를 활용하여 일사량 예측을 하고자 하였다는 점에서 가장 큰 차이점을 확인할 수 있다. 본 논문에서는 서울, 인천, 수원, 춘천, 대구, 대전의 총 여섯 지역의 태양광 일사량 예측을 위하여 다중선형회귀모형, KNN, Random Forest 그리고 SVR 모형과 클러스터링 기법인 K-means 기법을 결합한 후, 클러스터별 확률밀도함수를 계산하여 시간별 일사량 예측을 진행하고자 하였다. 중기예보 데이터를 사용하기 전, 모형 예측 결과를 비교하기 위한 지표로서 MAE (mean absolute error)와 RMSE (root mean squared error)를 사용하였다. 데이터는 2017년 3월 1일부터 2022년 2월 28일까지의 시간별 원 관측 데이터를 중기예보 데이터 양식에 맞추어 일별 데이터로 변환하였다. 모형의 예측 성능 비교 결과, Random Forest로 일별 일사량을 예측한 후, K-means 클러스터링으로 기후요인이 유사한 날짜들을 분류한 뒤 클러스터별 일사량의 확률밀도함수를 계산하여 시간별 일사량 예측값을 나타낸 방법이 가장 우수한 성능을 보였다. 또한 이 방법론을 이용하여 중기예보 데이터에 모형 적합 후, 예측 결과를 확인하였을 때, 일자별로 예측 오류가 상승하는 것을 확인할 수 있었다. 이는 중기예보 기상데이터의 예측 오류로 인한 것으로 보인다. 향후 연구에서는 중기예보 데이터에서 활용할 수 있는 기상요인 중, 강수 여부와 같은 외생 변수를 추가하거나 시계열 클러스터링 기법을 적용한 연구가 이루어져야할 것으로 보인다.