• Title/Summary/Keyword: Multi-Parameters

검색결과 2,631건 처리시간 0.032초

금강 수계의 시.공간적 수질특성과 토지이용도의 영향 (Spatial and Temporal Variability of Water Quality in Geum-River Watershed and Their Influences by Landuse Pattern)

  • 한정효;배영주;안광국
    • 생태와환경
    • /
    • 제43권3호
    • /
    • pp.385-399
    • /
    • 2010
  • 본 연구는 금강 수계의 83개 하천 지점에서 이 화학적 수질의 시 공간적 변이를 파악하기 위하여 2003~2007년까지 측정된 환경부의 수질자료를 분석하였다. 이용된 수질 변수는 수온, 용존산소량(DO), 생물학적 산소요구량(BOD), 화학적 산소요구량(COD), 부유물(SS), 총질소(TN), 총인(TP) 및 전기전도도(EC)의 8개 항목으로 이들의 수질특성은 토지이용도, 연별, 계절별, 조사지점별로 큰 변이를 보였다. 각 지점들은 토지이용도에 따라 크게 산림형 하천(Forest stream, Fo), 농지형 하천(Agricultural stream, Ag), 도심형 하천(Urban stream, Ur)의 3가지 유형으로 구분하였다. 대부분의 수질변수들은 장마기인 7~8월 동안 접종강우로 인하여 계절적 변이 폭이 큰 것으로 나타났다. 장마기에 이온 희석현상의 지표로 이용되는 전기전도도와 영양염류인 총질소와 총인은 장마기 강우량과 역상관관계를 보이는 것으로 나타났다. BOD와 COD는 장마기에 크게 감소하는 것으로 나타났으며, 전기전도도, TN, TP 농도의 최소값도 여름철 장마기에 나타났는데, 이는 집중강우로 하천 유량이 증가하여 이온 및 영양염류가 희석되었기 때문으로 사료된다. 이에 반하여 계절별 SS의 농도는 여름철 강우기 동안에 주로 유입되는 것으로 나타났다. 토지이용도에 따른 계절별 수질 특성을 분석한 결과, BOD, COD, TN, TP 및 SS의 농도에서는 괄목할만한 차이를 보였으며, 농지형 하천(Ag)이 산림형 하천(Fo)과 도심형 하천(Ur)에 비하여 BOD, COD, SS의 농도가 더 높은 것으로 나타났으며, 도심형 하천에서 TN, TP의 농도가 더 높게 나타나 수질악화가 심각한 것으로 나타났다. 수계의 수질과 밀접한 상관성을 보이는 것으로 나타났으며, 또한 대전 및 청주의 도심에서 흘러나오는 지천인 갑천과 미호천 등 도심형 하천이 금강 수계 하류의 수질악화에 큰 영향을 주는 것으로 나타나 이런 지류부에서의 효율적인 수질관리가 시급한 것으로 사료되었다.

영산강 수계의 이화학적 수질에 관한 시공간적 변이 분석 (Spatio-temporal Variation Analysis of Physico-chemical Water Quality in the Yeongsan-River Watershed)

  • 강선아;안광국
    • 생태와환경
    • /
    • 제39권1호통권115호
    • /
    • pp.73-84
    • /
    • 2006
  • 본 연구는 영산강 수계 내 10개 지점의 이화학적 수질에 관한 시공간적 변이상태를 분석하기 위해 1995년부터 2004년까지 측정된 환경부 수질데이터를 이용하여 분석하였다. 이용된 수질 변수는 전기전도도(Conductivity), 생물화학적 산소요구량(BOD), 화학적 산소요구량(COD), 용존산소량 (Dissolved oxygen), 총인 (Total phosphorus), 총질소 (Total nitrogen) 및 총부유물 (Total suspended solids)의 7개 항목으로서 계절별, 연별, 및 조사지점별 농도변이가 큰 것으로 나타났다. 영산강 수계 내에서의 이화학적 수질측정값은 계절성 강우에 따라 수질측정값의 변동 폭이 심하며, 대부분의 수치 농도변이는7 ${\sim}$ 8월에 집중되는 하절기 몬순 강도에 의해 조절되었다. 장마기에 이온희석의 지표로 사용되는 전기전도도와 총인, 총질소와 같은 영양염류들의 경우 강우량과 역 상관관계 (|r|> 0.32, P< 0.01, n=119)를 보였으나, 생물학적 산소 요구량과 화학적 산소요구량의 경우에는 강우분포와 통계학적 유의성 (p>0.05, n=120)을 보이지 않았다. 총인, 총질소 및 전기전도도는 대부분 장마 중인 7 ${\sim}$ 8월에 최소값을 보였는데, 이는 강우에 의해 오염물질이 희석되기 때문으로 사료되었다. 반면, 총부유물의 유입은 하절기 몬순 동안에 최대치를 보여 이온 감소와는 대조적인 특성을 보였다. 생물학적 산소요구량의 계절적 변화패턴은 화학적 산소요구량과 유사한(r.=0.592, P<0.01)양상을 보였으며, 마찬가지로 총질소의 변차패턴 또한 총인과 유사한 (.=0.529, P<0.01) 양상을 보였다. 용존산소량의 계절별 변화에 따르면, 수온이 낮은 겨울에 최대값을 보이며 온도가 높은 여름에 최소값을 보여 수온과의 역 상관관계를 보였다. 지점별 변화 패턴 분석에 따르면, 전기전도도를 제외한 총인, 총질소, 생물학적 산소요구량, 화학적 산소요구량 및 총부유물은 상류 및 하류역 보다 중류역에서 높은 농도를 보인 반면, 전기전도도의 경우에는 하류역에서 높은 농도를 보였다. 특히, 총인, 총질소, 생물학적 산소요구량 및 화학적 산소요구량은 지점 4(광주 2)에서 급격히 악화되는 양상을 보였으며, 이는 광주도심으로부터 유출되는 가정하수 및 인접한 공단에서 배출하는 폐수유입에 의한 영향으로 사료되었다. 따라서, 영산강의 수질 개선을 위해서는 이런 도심지역의 오염부하 저감을 통한 효율적 수질관리가 요구된다.

유등천에서의 생태학적 건강도 평가 및 수질양상 (Ecological Health Assessments and Water Quality Patterns in Youdeung Stream)

  • 이재연;장하나;안광국
    • 생태와환경
    • /
    • 제38권3호통권113호
    • /
    • pp.341-351
    • /
    • 2005
  • 본 연구는 2004년 8월 (8월 16 ${\sim}$ 17일)부터 10월 (10월1 ${\sim}$ 2일)까지 금강 지류중의 하나인 유등천의 5개의 지점을 선정하여 어류군을 이용한 다변수 모델 적용 및 평가를 실시하였다. 본 연구에서 얻어진 생물학적 건강성평가 모델값은 유등천의 지점별 수질변수 값 (1995 ${\sim}$ 2004년:환경부 자료)과 비교 평가하였다. 이용된 수질변수는 전기전도도 (Conductivity), 생물화학적 산소요구량 $(BOD_5)$, 화학적 산소요구량 $(COD_{mn})$, 총인 (Total phosphorus), 총질소 (Total nitrogen) 및 총부유물 (Total suspended solids)의 6개 항목으로서 조사지점별, 계절별, 연별로 농도 변이가 큰 것으로 나타났다. 본 연구에서는 안 등 (2003)에 의해 국내 특성에 맞게 개발된 다변수 메트릭 모델을 이용하였으며, 이는 최근 미국 환경부(US EPA)의 Barbour et al. (1999)에 의한 RBP 모델을 기반으로 얻어졌다. 총체적인 건강성평가에 따르면, EPA (1993) 및 Barbour et al. (1999)의 기준에 따르면, 2차례 조사에 걸친 유등천의 생물학적 건강도는 27.8(n=10)로서, 수환경등급은 '보통상태' (Fair condition)로 나타났다. 8 ${\sim}$ 10월까지 지점별 개별적인 어류평가 모델 값은 24 ${\sim}$ 32범위로 나타났으며, 5지점에서 모델 값은 25 (Poor condition)로서 가장 낮은 것으로 나타났다. 1 ${\sim}$ 4지점까지 모델 값은 고도 구배에 대해 큰 차이를 보이지 않았다. 한편, 이화학 분석 자료에 따르며, 상류에서 하류로 갈수록 수질이 악화되는 경향을 보이고 있었으며, 특히 5지점 (S5)은 나머지 4개 지점 (S1 ${\sim}$ S4)의 수질에 비해 뚜렷한 수질악화를 보였는데, 이는 제 5지점 부근의 공단과 분뇨처리시설로부터 유입된 폐수에 의한 점 오염원의 효과로 사료되었다. 어류의 지표종 특성에 따르면, 버들치 (Rhynchocypris oxycephalus), 갈겨니 (Zacco temmincki)와 같은 수질에 대해 민감한 어종은 상류(S1 ${\sim}$ S2)에서의 출현빈도가 하류지점에의 출현빈도에 비해 뚜렷하게 높게 나타나 수질 특성을 반영하는 것으로 나타났으며, 트로픽구조 측면에서 내성종 (Tolerant species)및 잡식성종(Omnivore species)이 하류로 갈수록 증가하는 경향을 보였다.

선량 중첩 방식을 이용한 동적 배기 조사면의 특성 연구 (Commissionning of Dynamic Wedge Field Using Conventional Dosimetric Tools)

  • 이병용;나상균;최은경;김종훈;장혜숙;김미화
    • Radiation Oncology Journal
    • /
    • 제15권1호
    • /
    • pp.71-78
    • /
    • 1997
  • 목적 :동적 쐐기 조사면 측정을 다중 검출기 시스템과 같은 특수한 장치없이 보편적인 방사선 측정 방법을 사용하여 시행할 수 있는 방법을 고안, 수행하였다. 대상 및 방법 : $15^{\circ},\;30^{\circ},\;45^{\circ},\;60^{\circ}$의 동적 쐐기각(dynamic wedge angle)과 6MV와 15MV인 광자선을 발생시키는 선형 가속기(CL 2100 C/D)를 이용하여 wedge transmission factor 및 percentage depth dose(PDD, 선량 프로파일을 측정하였다. Wedge transmission factor는 6MV, 15MV인 광자선과 $15^{\circ},\;30^{\circ},\;45^{\circ},\;60^{\circ}$의 4개의 동적 쐐기각에 대해서 $4\times4cm^2-20\times20cm^2$까지 1-2cm간격의 정사각형 조사면과 Y-field가 4cm, 20cm일 때 여러개의 X-field에 대한 각각의 직사각형 조사면에서 측정하였다. 또한 동적 쐐기의 구간별 치료표(Segmented Treatment Table, STT)값을 이용하여 wedge factor를 계산해 내었다. PDD는 필름 dosimetry로 구하였는데 개방 조사면에 대해 전리함과 필름으로 PDD를 구한 후 필름의 환산값을 알아내어 쐐기 조사면에 대한 필름 dosimetry로 PDD를 구하여 필름 환산값으로 전리함을 통해 얻을 수 있는 실제 PDD를 구하였다. 선량 프로파일은 비대칭 정지 조사면을 선택적으로 전리함을 이용하여 측정하고 이때 얻은 측정치인 소구간 프로파일과 STT를 이용하는 선량 분포 중칩 방식으로 구하였다. 결과 : wedge transmission factor의 측정치와 STT를 이용하여 구한 계산치를 비교한 결과 실험 오차 범위내에서 거의 일치하였다. 또한 직사각형 조사면에서의 wedge transmission factor 변화를 측정한 결과 동일한 Y-field에 대해서 직사각형 조사면은 정사각형 조사면에서의 wedge factor와 같았다. PDD는 필름 방사선 측정값의 보정으로 개방 조사면에서 PDD와 동적 쐐기 조사면에서 PDD 사이의 차이는 무시될 수 있다. 그리고 전리함의 측정으로부터 중칩 방식으로 얻어진 동적 쫴기의 선량 프로파일은 필름 dosimetry로 얻은 동적 쐐기의 선량 프로파일과 비교한 결과 최대 2% 이내 정확도의 허용 오차 영역에 들어옴을 볼 수 있었다. 결론 :동적 조사면의 특성으로 동적 쐐기 측정에서의 정보 수집을 위하여 모든 조사면에서의 방대한 측정과 그로인한 장시간의 소비, 또한 동적 쐐기 측정을 위한 특수한 장치가 필요하지만 보편적으로 사용하는 측정 장치, 즉 단일 검출기와 필름 방사선 측정 방법으로 충분히 용이하게 행할 수 있었다.

  • PDF

단일 밴드 중적외선 영상으로부터 표면온도 추정을 위한 기초연구 (A Basic Study for the Retrieval of Surface Temperature from Single Channel Middle-infrared Images)

  • 박욱;이윤경;원중선;이승근;김종민
    • 대한원격탐사학회지
    • /
    • 제24권2호
    • /
    • pp.189-194
    • /
    • 2008
  • [ $3{\sim}5{\mu}m$ ] 파장대의 중적외선 영상은 화산 활동이나 산불과 같이 고온 현상을 관측하는데 효과적이다. 그러나 중적외선 영역은 지표의 복사율과 대기의 영향으로 인한 변화가 매우 심하고, 특히 낮 영상의 경우 태양 복사량에 의한 영향도 고려해야 하는 어려움이 있다. 따라서 단일밴드인 중적외선 영상을 이용하여 표면온도를 얻기 위해서는 영상이 취득된 시간과 장소에서 관측된 태양 복사량 및 여러 가지 대기 변수가 필요하다. 이 연구는 기존의 다중밴드 기반의 중적외선 영상 활용방법과 달리 단일 밴드 중적외선 영상을 이용하여 표면온도 측정을 위한 기초연구에 그 목적이 있다. 이를 위하여 MODIS 영상을 대상으로 MODTRAN을 사용하여 중적외선 영역의 대기보정 기법을 적용 한 뒤 복사전달 모델을 이용하여 지표의 온도를 측정하였다. 획득된 온도 영상의 정밀도를 측정하기 위해 기존의 온도 알고리즘인 MODIS Sea Surface Temperature 알고리즘에 의해 얻어진 해수온도와 비교를 통하여 오차 원인에 대해 분석을 실시하였다. 두 결과의 온도차는 낮 영상의 경우 $0.89{\pm}0.54^{\circ}C$ 밤 영상의 경우 $1.25{\pm}0.41^{\circ}C$로 비교적 긍정적인 결과를 보였다. 그러나 낮 영상의 육지의 경우 대기에 의한 영향보다 태양빛의 반사가 주된 오차의 원인이 되며 이는 지표 복사율에 의한 영향이 매우 크게 작용하고 있음을 추정할 수 있다. 이 연구는 현재까지 해수에 대한 적용에 국한된 것으로 육상의 경우 복사율 변화가 매우 크기 때문에 중적외선 단일밴드에 의한 온도추정이 매우 어려울 것으로 예상된다.

가시광에서 밝은 1형 활동은하핵의 근적외선 변광 (NEAR-INFRARED VARIABILITY OF OPTICALLY BRIGHT TYPE 1 AGN)

  • 전우열;심현진;김민진
    • 천문학논총
    • /
    • 제36권3호
    • /
    • pp.47-63
    • /
    • 2021
  • 와이즈/네오와이즈 자료를 사용하여 1형 활동은하핵의 근적외선 장기 변광 특성을 살펴보았다. 활동은하핵은 밀리퀘이사 목록을 사용해 가시광에서의 등급 제한을 두어 선정하였고, 여러 번의 다중시점 측광 자료를 확보하기 위해 황도북극과 황도남극에 가까운 대상으로 한정하였다. 이후 와이즈와 네오와이즈 데이터베이스에서 해당 대상들의 측광 자료를 추출하였다. 일부 근적외선에서 검출되지 않은 경우와 관측 횟수가 지나치게 적은 경우를 제외하고 총 73개의 1형 퀘이사 및 활동은 하핵, 140개의 측광학적으로 선택된 활동은하핵 후보에 대해 W1 (3.4 ㎛), W2 (4.6 ㎛) 밴드 광도곡선을 구성하고 이를 이용해 변광 분석을 수행하였다. 변광 여부를 판단하기 위해 초과 분산 값과 변광의 유의확률 Pvar를 계산하였다. 초과 분산이 포아송 오차에 의해 추정되는 오차값보다 큰 경우, 그리고 Pvar이 0.95보다 크거나 같은 경우를 변광으로 판단했는데, 활동은하핵 73개 중 19개, 활동은하핵 후보 140개 중 12개가 W1, W2 밴드 모두에서 변광 대상으로 판단되었다. W1 밴드보다 W2 밴드에서 변광 대상으로 판단되는 숫자가 작게 나타났는데, 이는 긴 파장으로 갈수록 변광의 정도가 작아짐을 시사하는 것으로 보인다. 약 9 ~ 26%의 대상들이 근적외선 변광을 보였다. 감쇠 랜덤워크 모형을 사용하여 변광 폭(σ)과 완화 시간(τ), W1과 W2 밴드 사이의 시간 지연 등을 추정하였다. 변광 폭 및 완화시간은 W1 등급과 큰 상관관계를 보이지 않았으며, 두 변수 사이에도 특별히 두드러지는 상관관계가 나타나지 않았다. 단, 감쇠 랜덤워크 모형을 사용해서 시간 규모를 추정할 때 광도곡선의 분량이 충분한지를 감안하면, 완화시간이 짧은 대상들에 대해서는 변광 폭과 완화시간이 음의 상관관계를 보인다고도 볼 수 있다. 대상의 개수가 통계적으로 유의미한 결과를 제시하기에는 부족하다. X선 광도와 변광 특성을 비교했을 때에는 상관관계를 찾아보기 어려웠으나, 앞으로 얻어질 X선 탐사자료와 전천 스펙트럼 탐사자료와 결합한 추가 연구가 기대된다. 전체 대상 중에서는 시간에 따라 (W1-W2) 색이 변하는 것으로 판단되는 흥미로운 대상이 4개가 존재했는데, 이들의 특성에 대해서는 추후 연구가 더 필요할 것으로 전망한다.

흑색한국재래닭, 한국화이트레그혼 집단의 산육 및 산란 형질 유전모수 추정 (Estimation of Genetic Parameters for Growth and Egg Production Traits in Black Korean Native Chicken and Korean White Leghorn Populations)

  • 차재범;김기곤;추효준;권일;박병호
    • 한국가금학회지
    • /
    • 제47권4호
    • /
    • pp.267-274
    • /
    • 2020
  • 본 연구에서는 국립축산과학원 가금연구소에서 보유하고 있는 흑색 재래종토종닭 L계통, 한국화이트레그혼 F, K계통의 150일령 및 270일령 체중, 시산일령, 시산 및 270일령 난중, 270일령 산란수 총 6가지 경제형질에 대한 유전모수를추정하였다. 기초통계량에서 150일령 및 270일령 체중은 L계통이 각각 1,714 g, 2,032 g으로 F, K계통에 비해 무겁게 나타났으며, 시산일령은 L, F, K계통에서 153, 140, 143일로 나타났으며, L계통의 시산난중 및 270일령 난중은 각각 37 g, 54 g으로 F, K계통에 비해 가벼웠으며, 270일령까지 산란수는 76개로 F, K계통의 산란수인 100, 99개에 비해 적은 경향을 나타냈다. 재래종토종닭과 화이트레그혼의 품종 간 경제형질 능력의 차이를 보였으며, 화이트레그혼 품종 내 F, K계통 간 경제형질 능력의 유의적인 차이는 없는 것으로 나타났다. L, F, K계통에서 150일령 체중의 유전력은 0.48~0.52로 고도의 유전력으로 나타났으며, 270일령 체중은 0.56~0.57로 고도의 유전력, 270일령 난중은 0.55~0.59로 고도의 유전력, 시산일령은 0.31~0.45로 중도에서 고도의 유전력, 270일령 산란수는 0.20~0.22로 중도의 유전력, 마지막으로 시산난중은 0.15~0.16으로 저도의 유전력을 보였다. 시산일령과 270일령까지 산란수의 유전 및 표현형 상관계수는 각각 -0.73~-0.63, -0.48~-0.42로 부의 상관관계가 나타났다. 시산일령과 체중의 유전 상관은 0.05~0.17로 정의 상관관계를 보였으나, 표현형 상관은 -0.04~0.10으로 대체적으로 부의 상관관계를 나타냈다. 또한, 270일령까지 산란수와 150일령, 270일령 체중 및 270일령 난중의 유전상관은 각각 -0.16~0.01, -0.14~-0.03, -0.45~-0.24로 나타났고, 표현형 상관은 각각 -0.08~0.07, -0.13~0.04, -0.15~-0.11로 나타나 전반적으로 부의 상관을 보였다. 270일령 난중과 150, 270일령 체중은 0.36~0.49의 유전 상관과 0.29~0.37의 표현형 상관을 나타냈으며, 모두 정의 상관을 나타냈다. 270일령 난중과 시산난중은 0.50~0.73의 유전 상관과 0.21~0.32의 표현형 상관을 나타냈으며, 모둔 정의 상관을 나타냈고, 유전 상관이 표현형 상관보다 높게 나타났다. 시산난중과 체중의 상관 관계는 0.22~0.39로 정의 유전 상관과 0.07~0.16의 정의 표현형 상관을 보였으며, 시산난중과 시산일령은 0.48~0.67로 높은 정의 유전 상관과 0.27~0.39 정의 표현형 상관을 보였다. 그리고 150일과 270일 체중 간 유전 상관 0.90~0.91, 표현형 상관 0.68~0.80으로 상당히 높은 상관 관계가 있는 것으로 나타났다.

NASA LIS(Land Information System)을 이용한 한반도의 토양수분·증발산량 산출 (Calculation of Soil Moisture and Evaporation on the Korean Peninsula using NASA LIS(Land Information System))

  • 박광하;유완식;황의호;정관수
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.83-100
    • /
    • 2020
  • 본 연구에서는 미국 NASA에서 개발한 LIS(Land Information System)를 이용하여 한반도 지역의 수문인자를 산출하여 토양수분 및 증발산량에 대한 정확도를 평가하였다. LIS를 이용한 수문인자 산출을 위해 사용된 지표면 모형은 Noah-MP(Noah-MultiParameterization)이며, 수문기상 자료는 MERRA2(Modern-Era Retrospective analysis for Research and Applications, Version 2)를 적용하였다. Land Cover 및 국내 기상자료 적용에 따른 정확도를 확인하기 위해 IGBP(International Geosphere-Biosphere Programme), UMD(University of Maryland) Land Cover를 적용하였고, 기상관측자료는 기상청의 종관기상관측(ASOS, Automated Synoptic Observing System) 자료를 사용하였다. 산출된 자료의 정확도를 평가하기 위해 토양수분 및 증발산량을 대상으로 지상 관측자료와 비교하여 상관계수(CC, Correlation Coefficient), 편의(BIAS), 효율계수(NSE, Nash-Sutcliffe Efficiency)를 분석하였다. 그 결과, IGBP를 적용한 토양수분의 상관계수는 평균 0.56, 증발산량은 평균 0.71로 나타났고, UMD를 적용한 토양수분은 평균 0.68, 증발산량은 평균 0.72이며, UMD를 적용한 결과의 상관계수가 높게 평가되었다. 수문기상 자료로 MERRA2를 사용하였을 경우 토양수분의 상관계수는 평균 0.68, 증발산량은 평균 0.72로 나타났고, ASOS를 적용한 토양수분은 평균 0.66, 증발산량은 평균 0.72이며, ASOS를 적용한 결과 상관계수가 낮아지는 것으로 분석되었다. 국내 기상자료를 적용할 경우 상관계수가 낮아지는 현상이 발생하였는데, 지점 자료의 격자화를 진행할 때 MERRA2와 동일한 공간해상도인 0.65°× 0.5°로 격자화하여 지역에 따라 정확도의 차이가 발생 된 것으로 판단된다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.