• 제목/요약/키워드: Linear models

검색결과 3,288건 처리시간 0.032초

소방수 공급설비에 대한 공통원인고장을 고려한 확률론적 신뢰도 분석 (Reliability Analysis on Firewater Supply Facilities based on the Probability Theory with Considering Common Cause Failures)

  • 고재선;김효
    • 한국화재소방학회논문지
    • /
    • 제17권4호
    • /
    • pp.76-85
    • /
    • 2003
  • 본 논문에서는 공통원인고장의 이론적 고찰로서 정의와 그 원인, 분석방법을 기술하고 대표적인 소방설비의 하나인 소방펌프에 대해 공통원인고장을 고려한 신뢰도분석에 적용함으로써 공통원인고장의 중요성과 그 한계성을 규명하고자 한다. 공통원인고장을 고려한 소방수 공급설비에 대한 신뢰도분석 결과 알 수 있듯이 펌프의 운전고장이 계통실패의 가장 큰 요인으로 나타났으며 특히 두 펌프의 공통원인고장이 지배적이다. 다시 말하면 공통원인고장을 고려하지 않을 경우에 계통신뢰도를 실제보다 2배 이상 초과하여 평가할 수 있다는 것이다. 이로서 계통 신뢰도분석에서 공통원인고장의 중요성을 인식할 수 있으며 분석결과는 공통원인고장의 변수인자의 값에 크게 의존하는 것을 알 수 있다. 그리고 소방수 공급설비설계에 계통설계 시 다중성을 반영하면 신뢰도가 증가하는 것은 사실이나 공통원인고장 요인 때문에 다중기기 설치대수에 비례하는 정도의 신뢰도 향상을 얻지 못할 수도 있다. 또한 공통원인고장의 한계성으로는 분석모델의 차이로 인한 차이는 미미한 수준이었으나 각각 다른 데이터 원을 사용했을 경우 그 결과는 큰 차이를 나타내었다. 따라서 공통원인고장 분석에 사용되는 모델보다는 이용 가능한 경험데이터의 품질이 그 분석결과의 신뢰성에 큰 영향을 미친다는 것을 알 수 있었다. 결과적으로 다중기기의 공통원인고장을 방지하기 위한 기본적이고 공학적인 방안으로는 설계시 요구되는 적정 신뢰도를 유지하는 것이므로 적어도 소방펌프에 요구되는 신뢰도수준으로 설계되어야 한다. 즉 SIS(Safety Instrumented system)에 요구되는 신뢰도수준인 안전건전성수준(SIL; Safety integrity level)에 적합한가의 유무를 PFD를 활용하여 정량적으로 파악하는 것이다. 공통원인고장을 고려한 소방수 공급설비에 대한 신뢰도분석 결과 계통작동요구시 실패확률(PFD: Probability of failure on demand), 즉 계통 이용 불능도는 3.80E-3이므로 규정목표인 SIL5의 범주 안에 들어있지 않아 안전건전성수준으로 설계되어 있지 않다고 판단되며, 만일 공통원인고장을 고려하지 않았을 경우인 계통 이용불능도 또한 1.82E-3으로 계산되는데, 이 또한 SIL5의 범주 안에 들어있지 않으므로 단전건전성수준으로 설계되어 있지 않다고 판단된다.

귤응애 온도발육 매개변수 추정 및 개체군 추정 행렬모형 (Parameterization of the Temperature-Dependent Development of Panonychus citri (McGregor) (Acari: Tetranychidae) and a Matrix Model for Population Projection)

  • 양진영;최경산;김동순
    • 한국응용곤충학회지
    • /
    • 제50권3호
    • /
    • pp.235-245
    • /
    • 2011
  • 기존 보고된 귤응애 온도발육자료를 이용하여 온도발육 관련 매개변수 값을 추정하고 개체군 동태 추정에 필요한 행렬모형을 작성하였다. 귤응애 발육영점온도는 알 $8.4^{\circ}C$, 유충 $9.9^{\circ}C$, 제 1약충 $9.2^{\circ}C$, 제 2약충 $10.9^{\circ}C$ 이었으며, 발육완료에 필요한 적산온도는 각각 113.6, 29.1, 29.8, 33.4일도(DD)로 추정되었다. 귤응애 각 발육단계별 비선형 발육모형을 수립하였으며 또한 산란모형 작성에 필요한 온도별 총산란수 모형, 연령별 누적산란율모형, 연령별 생존율 모형의 매개변수 값을 각각 추정하였다. 귤응애 연령군을 알, 유충, 제 1약충, 제 2약충, 성충 등 5단계로 구분하여 행렬모형을 작성하였다. 전환행렬의 구성요소인 다음 발육단계로 전이확률 또는 잔존확률은 각 발육단계의 발육률 함수를 이용하였다. 또한 성충의 산란계수는 해당온도에서 성충수명 완료율과 총산란수의 곱으로 추정하였다. 수립된 행렬모형의 포장적합 능력을 평가하기 위하여 실제 감귤원에서 조사된 귤응애 실측밀도와 행렬모형으로 추정한 개체군 밀도를 비교하였다(2004년). 계절 초기 저온기와 계절중후기 고온기에 모형결과를 실측치와 비교한 결과 알 및 성충 개체군은 계절초 및 중후기 모두 약 30일까지 큰 차이가 없었다. 따라서 본 개발된 행렬모형을 이용하여 30일 내외의 단기간 동안 귤응애의 개체군밀도 증가를 예측할 수 있을 것으로 기대되었다.

항온조건에서 긴등기생파리 [Exorista japonica (Townsend)] (Diptera: Tachinidae) 온도별 발육 (The Temperature-Dependent Development of the Parasitoid Fly, Exorista Japonica (Townsend) (Diptera: Tachinidae))

  • 박창규;서보윤;최병렬
    • 한국응용곤충학회지
    • /
    • 제55권4호
    • /
    • pp.445-452
    • /
    • 2016
  • 야외에서 채집된 멸강나방(Mythimna separata) 유충 및 번데기로부터 우화한 기생파리를 NCBI 데이터베이스에 등록되어 있는 유전자 염기서열 정보(16S, 18S, 28S 그리고 CO I)와 비교하여 긴등기생파리(Exorista japonica)로 동정하였다. 긴등기생파리의 알부터 성충우화까지 발육 기간을 담배거세미나방(Spodoptera litura) 5~6령 유충을 숙주 곤충으로 하여 7개 항온조건(16, 19, 22, 25, 28, 31, $34{\pm}1^{\circ}C$)에서 조사하였고 온도에 따른 발육율과 발육완료 모델들의 매개변수들을 추정하였다. $34^{\circ}C$를 제외한 다른 항온 조건에서 알부터 성충우화까지 발육이 가능하였다. 알부터 번데기까지 발육 기간을 보면 $16^{\circ}C$(23.4일)에서 가장 길었고 $34^{\circ}C$(8.3일)에서 가장 짧았으나, 번데기부터 성충까지 발육기간은 $28^{\circ}C$(7.3일)에서 가장 짧았다. 알부터 성충우화까지 전체 발육 기간은 $31^{\circ}C$에서 16.3일로 가장 짧았고 $16^{\circ}C$에서 45.4일로 가장 길었으며 온도가 상승함에 따라 발육기간은 짧아졌다. 선형 발육율 모델을 이용하여 추정한 알부터 성충우화까지 발육영점온도와 유효적산온도는 각각 $7.8^{\circ}C$, 370.4DD 였다. 4개 비선형 발육율 모델(Briere 1, Lactin 2, Logan 6, Performance) 중에서는 Briere 1 모델($r^2_{adj}=0.96$)이 가장 높은 해석력을 보여주었다. 동일 연령 집단의 발육완료 분포를 설명하기 위해 사용된 3개 모델(2-parameter Weibull, 3-parameter-Weibull, Sigmoid)은 모두 같은 결정력($r^2_{adj}=0.90$)을 보였다.

70 MPa급 인공암반 내 실대형 쉴드TBM 굴진실험을 통한 굴진율 모델 및 활용방안 제안 (Development of a TBM Advance Rate Model and Its Field Application Based on Full-Scale Shield TBM Tunneling Tests in 70 MPa of Artificial Rock Mass)

  • 김정주;김경열;류희환;정주환;홍성연;조선아;배두산
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제6권3호
    • /
    • pp.305-313
    • /
    • 2020
  • 전력송전을 위한 터널식 전력구는 점차 시공실적이 증가하고 있는 추세이며, 해저 및 대심도 등 시공환경이 어려운 구간의 건설도 증가하고 있다. 이에 소단면 쉴드TBM의 효율적 운영을 위해 굴진율 및 설계모델이 필요하다. 그러나, 제한된 지반조사 회수 및 굴착면 맵핑으로 인하여 암반특성과 굴진데이터를 정확히 매칭시켜 상호간 상관관계 및 굴진율 모델을 도출하는데 어려움이 있다. 이에 소단면 쉴드TBM에 적합한 굴진율 및 설계모델을 제시하기 위하여 커터헤드의 직경이 3.56 m인 실험용 EPB 쉴드TBM을 제작하고, 총 부피 87.5 ㎥인 인공암반 내에서 총 19번의 실대형 굴진실험을 수행하였다. 본 실험은 70MPa의 균질한 암반강도에서 수행되었기 때문에 운전변수인 추력과 커터헤드의 RPM에 따른 굴진율과 기계데이터간 상관관계를 효율적으로 분석할 수 있으며, 실제 굴착메커니즘과 동일하기 때문에 도출된 압입깊이와 토크값은 활용성이 높다. 본 연구를 통해 디스크커터 당 연직력과 압입깊이의 상관관계 및 연직력과 회전력의 상관관계를 도출하였다. 이러한 상관관계들을 이용하여 70 MPa급 암반에 대해 굴진율 예측과 TBM 설계가 가능할 것으로 판단한다. 또한, 인공암반의 RQD가 100%로 현장적용에 대한 한계점에 대해 FPI의 개념을 도입하여 굴진율 모델의 활용성을 증대시키고자 하였다.

철새도래지인 주남저수지의 계절적 수질변동 (Temporal Dynamics of Water Quality in Junam Reservoir, as a Nest of Migratory Birds)

  • 이의행;안광국
    • 생태와환경
    • /
    • 제42권1호
    • /
    • pp.9-18
    • /
    • 2009
  • 본 연구에서는 우리나라의 주요한 철새도래지인 주남 저수지를 대상으로 1998년부터 2007년까지 10년간의 계절적 수질특성 분석 및 연별변이 특성, 강우분포에 따른 영양염류(N, P)의 부하특성 및 경험적 모델(Empirical model)을 이용한 부영양화 변수 간의 역동적 관계를 분석하였다. 수체내의 COD의 평균농도는 $7.8\;mg\;L^{-1}$이었고, TN 및 TP의 영양염류 농도는 각각 $1.4\;mg\;L^{-1}$, $83{\mu}g\;L^{-1}$로서 부영양-과영양 상태로 나타났다. 주남저수지의 월별 COD는 전기전도도(r=0.669, p<0.001)와 높은 상관관계를 보여 하절기 강우는 이온희석현상을 야기시키고 이는 수질향상에 기여하는 것으로 나타났다. TN 및 TP의 One-way ANOVA 분석 결과에 따르면, 철새 도래의 전 후에는 유의한 차이(F=$5.2{\sim}12.9$, p<0.05)를 보였다. 즉, 이는 철새 도래 전에 오히려 더 영영염류가 높은 것으로 나타나 철새도래에 의한 영양염류의 증가효과는 없는 것으로 나타났다. 또한, $NO_{3^-}N$$NH_{3^-}$의 Oneway ANOVA 분석 결과는 철새 도래 전 후에 유의한 차이(F=$0.37{\sim}0.48$, p>0.05)가 없는 것으로 나타났다. 부영양화에 관계된 변수를 이용한 경험적 모델(Empirical model)의 1차 회귀분석 결과에 따르면, 조류생체량은(CHL)은 TN ($R^2$=0.143, p<0.001, n=119) 및 TP ($R^2$=0.192, p<0.001, n=119)와 통계적으로 유의한 상관성을 보여 CHL의 증감에 영양염류가 영향을 미치나 그 효과는 미미한 것으로 나타났다. 이를 위해 영양상태 지수 변이성(Trophic State Index Deviation, TSID) 테스트에 따르면, "TSI (CHL)-TSI (SD)" 및 "TSI (CHL)-TSI (TP)"값은 전체 관측치 중 70% 이상이 음수값으로 나타나 CHL은 영양염류에 의한 제한보다는 무기성 부유물(Inorganic solids)에 의한 광제한 효과로 나타났다.

초분광 영상을 이용한 봄감자의 잎 Na 함량 예측 모델 개발 (Development of Prediction Model for the Na Content of Leaves of Spring Potatoes Using Hyperspectral Imagery)

  • 박준우;강예성;유찬석;장시형;강경석;김태양;박민준;백현찬;송혜영;전새롬;이수환
    • 한국농림기상학회지
    • /
    • 제23권4호
    • /
    • pp.316-328
    • /
    • 2021
  • 본 연구에서는 간척지의 염분 모니터링을 위한 다중 분광 센서를 개발하기 위해 400~1000 nm 초분광센서를 사용하여 봄 감자의 잎 Na 함량 예측 모델을 구축하고자 하였다. 관개조건은 표준, 한해, 염해(2, 4, 8 dS/m)로, 관수량은 증발량을 기준으로 산정하였다. 영양생장기, 괴경형성기, 괴경비대기에 각각 관개를 시작한 후 1주와 2주 후에 잎의 Na 함량을 측정하였다. 잎의 반사율은 10nm 파장 간격을 기준으로 5 nm에서 10nm, 25nm, 50nm FWHM (full width at half maximum)으로 변환되었다. PLS-VIP를 사용하여 봄 감자 잎의 Na 함량에 따른 염분 피해 수준을 예측하기 위한 10개의 밴드비가 선택되었다. 선택된 10개의 밴드비 중 가중치가 가장 낮은 순서대로 밴드비를 하나씩 제거하면서 MLR모델을 추정하였다. 모델의 성능은 R2, MAPE 뿐만 아니라 밴드비의 수, 다중 분광센서를 작게 만들기 위한 최적의 FWHM 수로 비교하였다. 1, 2주차의 영양생장기, 괴경형성기와 2주차의 괴경비대기에서 봄 감자의 잎 Na 함량을 예측하기 위해서는 25 nm의 FWHM을 사용하는 것이 유리하였다. 선택된 밴드필터는 430/440, 490/500, 500/510, 550/560, 570/580, 590/600, 640/650, 650/660, 670/680, 680/690, 690/700, 700/710, 710/720, 720/730, 730/740 nm로 Red 및 Red-edge 영역에서 15개 밴드비가 선택되었다.

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

Photo-Fenton 산화공정에서 반응표면분석법을 이용한 축산폐수의 COD 처리조건 최적화 및 예측식 수립 (Optimization and Development of Prediction Model on the Removal Condition of Livestock Wastewater using a Response Surface Method in the Photo-Fenton Oxidation Process)

  • 조일형;장순웅;이시진
    • 대한환경공학회지
    • /
    • 제30권6호
    • /
    • pp.642-652
    • /
    • 2008
  • 본 연구는 축산폐수 중 COD$_{Cr}$을 응집공정 후 Photo-Fenton 공정에 의해 산화분해 최적조건 및 제거 예측식에 수립에 관한 연구이다. 본 연구는 축산폐수 중 COD$_{Cr}$에 대한 Photo-Fenton 산화반응을 이용하여 이들 분해특성을 2차원 반응모델로 추정하기 위해 중심합설계법 대안으로 많이 사용되고 있는 박스-벤켄법(Box-Behnken method)을 이용하였다. 최적조건 수립을 위한 입력변수, 즉 3가지 변수(Fe(II)(x$_1$), $H_2O_2(x_2)$, pH(x$_3$)) 등을 램덤화, 반복화 및 블록화 원리에 따라 실험설계하여 반응값에 대한 예측식을 수학적으로 산출하였다. 수학적 및 통계적으로 산출된 예측식은 Y = 79.3 + 15.61x$_1$ - 7.31x$_2$ - 4.26x$_3$ - 18x$_1{^2}$ - 10x$_2{^2}$ - 11.9x$_3{^2}$ + 2.49x$_1x_2$ - 4.4x$_2x_3$ - 1.65x$_1x_3$와 같이 얻을 수 있었고 COD$^{Cr}$ 제거율(%)의 실측치에 대한 예측치의 적합도(goodness of fit) 검증시 결정계수(coefficient of determination: R$^2$) 0.96으로 에측식을 충분히 설명할 수 있었다. 예측 모형에 대한 최소제곱추정법으로 적합된 반응표면에서 1차 선형항(linear term)은 Fe(II)(x$_1$), $H_2O_2(x_2)$, 그리고 pH(x$_3$)은 상승작용(synergistic effect)으로 반응모델에 유의한 차이를 보였으며(p < 0.001) 그러나 교호항(cross-product term)은 $H_2O_2$ $\times$ pH(x$_2x_3$)와 순수이차항(quadratic terms)의 Fe(II) $\times$ Fe(II)(x$_1{^2}$), $H_2O_2$ $\times$ H$_2O_2$(x$_2{^2}$) 그리고 pH $times$ pH(x$_3{^2}$) 등은 대립적인(감쇠)(antagonistic effect) 작용으로 반응모델에 유의한 차이를 보였다(p < 0.01). 반응 모델에 대한 예측식 수립 후 COD$_{Cr}$ 제거율(%)의 최적조건을 도출하기 위해 정준분석(canonical analysis)와 능선분석(ridge analysis)에 이용한 결과 반응값(결과값: Y)은 84 $\pm$ 0.95%, COD$_{Cr}$ 최적처리를 위한 변수들의 조건은 Fe(II)(X$_1$) = 0.0146 mM, $H_2O_2$(X$_2$) = 0.0867 mM 그리고 pH(X$_3$) = 4.704 등의 결과를 얻을 수 있었다. 또한 이들 최적조건을 이용하여 재현성을 통한 모델검증 결과 높은 신뢰성을 보였다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.