• 제목/요약/키워드: 알고리즘 개발

검색결과 8,236건 처리시간 0.038초

KOMPSAT-3/3A 영상 기반 하천의 탁도 산출 연구 (A Study on the Retrieval of River Turbidity Based on KOMPSAT-3/3A Images)

  • 김다희;원유준;한상명;한향선
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1285-1300
    • /
    • 2022
  • 탁도는 부유물질에 의한 빛의 산란 또는 흡수로 인한 수체의 흐림을 나타내는 수치로 수질 관리 분야에서 중요 지표로 활용되고 있다. 탁도는 소규모의 하천에서 변동성이 심할 수 있으며, 이는 국가하천의 수질에 직접적으로 영향을 준다. 따라서 고해상도의 탁도 공간정보 산출은 매우 중요하다. 이 연구에서는 Korea Multi-Purpose Satellite-3 및 -3A (KOMPSAT-3/3A) 영상으로부터 한강 수계 하천의 고해상도 탁도 매핑을 위한 eXtreme Gradient Boosting (XGBoost) 알고리즘 기반의 탁도 산출 모델을 개발하였다. 이를 위해 총 24장의 KOMPSAT-3/3A 영상과 150장의 Landsat-8 영상으로부터 계산된 대기 상단(Top Of Atmosphere, TOA) 반사율을 활용하였으며, Landsat-8 TOA 반사율은 KOMPSAT-3/3A의 관측 파장 대역에 적합하도록 교차검보정을 수행하였다. 국가수질자동관측망에서 측정된 탁도를 탁도 산출 모델의 참조자료로 사용하였고, 입력 변수로는 탁도가 실측된 위치에서의 TOA 분광반사율과 탁도 분석에 널리 이용되어 온 분광지수인 정규식생지수, 정규수분지수, 정규탁도지수, 그리고 Moderate Resolution Imaging Spectroradiometer (MODIS)의 대기 산출물(에어로졸 광학 두께, 수증기량, 오존)을 사용하였다. 또한 고탁도와 저탁도에 대한 KOMPSAT-3/3A TOA 분광반사율을 분석하여 탁도를 설명할 수 있는 새로운 정규탁도지수(new normalized difference turbidity index, nNDTI)를 제안하였고, 이를 탁도 산출 모델에 입력 변수로 추가하였다. XGBoost 기반 탁도 산출 모델은 현장관측 탁도와 비교하여 2.70 NTU의 평균 제곱근 오차(root mean square error, RMSE) 및 14.70%의 정규화된 RMSE(normalized RMSE)를 가지는 탁도를 예측하여 우수한 성능을 보였으며, 이 연구에서 새롭게 제안한 nNDTI가 탁도 산출에 있어 가장 중요한 변수로 사용되었다. 개발된 탁도 산출 모델을 KOMPSAT-3/3A 영상에 적용하여 하천 탁도를 고해상도로 매핑하였으며, 탁도의 시공간적 변동에 대한 분석이 가능하였다. 이 연구를 통하여 고해상도의 정확한 탁도 공간정보 산출에 KOMPSAT-3/3A 영상이 매우 유용함을 확인할 수 있었다.

특성평가 정보를 활용한 보리 유전자원 형태적 형질 다양성의 통계적 분석 (A Statistical Analysis of Phenotypic Diversity Based on Genetic Traits in Barley Germplasms)

  • 유동수;신명재;박진천;강만정
    • 한국자원식물학회지
    • /
    • 제35권5호
    • /
    • pp.641-651
    • /
    • 2022
  • 보리는 베타글루칸, 폴리페놀, 안토시아닌 등을 이용한 건강식품 소비 증가로 최근 관심이 높아지고 있다. 따라서 보리에 대한 수요자의 기호에 맞춘 기능성 품종개발과 소재로서 유전자원 활용성을 증대시키기 위해서는 자원의 특성 분석과 종, 원산지과의 관계, 군집화(Clustering)을 통한 유사성과 대표성, 형질 간의 상호관계 등과 같은 유전자원의 다양성 연구가 선행되어야 할 것이다. 본 연구는 농업유전자원센터에서 보존하고 있는 보리 25,104 유전자원(25종, 국적미상을 포함한 102개 원산지)을 대상으로 종과 원산지에 따른 다양성 분석을 수행하였다. 특히 종에 대한 작물 유효수(ENCS)는 1.17로 원산지(24.73)에 비해 매우낮게 나타났다. 이는 보존하고 있는 보리 유전자원의 대부분이 Hordeum vulgare subsp. vulgare 로 확인되었는데, 원산지에 비해 보존 자원이 특정 종에 편중된것을 알 수 있지만, 형태적으로 구분한 20가지 특성평가 항목에 대하여 종과 원산지에 따라 유의적인 차이(P-value < 0.05)가 검정되었다. 비록 종 다양성은 낮지만 종과 종간의 차이와 종 내에서도 다양한 특성이 존재함을 추정할 수 있었으며, 이를 토대로 특성평가 항목을 이용한 군집화를 통해서 특성에 대한 다양성을 확인하였다. 특성평가 항목을 바탕으로 cacGMS 알고리즘을 이용한 군집 분석을 수행했을 때, 전체 97%의 자원이 분류된 1번~7번 군집에서 병와성, 도복, 깜부기병 항목이 공통적으로 동일한 형질을 보였다. 반면에 군집 별 특이성에서는 특성평가 항목에 대한 조합의 차이와 함께 생장습성, 망활, 한해, 파성, 보리누른모자이크병에서 다른 군집과 차별되는 특이성이 확인되었다. 이러한 특성평가 항목에 의한 대표성과 특이성, 그리고 각 군집에 따른 특성의 조합은 특성 간의 상호적 관계와 관련이 있을 것으로 추정되어 상관관계를 분석하였다. 그 결과 1수립수와 보리누른모자이크병이 높은 상관성(상관계수 0.79)을 보였고, 종자연구에서 중요한 지표로 사용되고 있는 천립중은 낮은 상관계수이지만 이삭조성(0.31), 이삭길이(0.23), 병와성(0.24), 이삭모양(0.28), 보리누른모자이크병(0.23), 1수립수(0.43), 조단백함량(0.29)과 관련이 있을 것으로 추정된다. 본 연구에서 사용된 연구방법과 결과는 신품종개발, 육종산업에 활용가능한 정보를 제공하고, 이를 통해 농업유전자원의 활용성 제고와 연구 선진화에 기여할 수 있을 것으로 기대한다.

CCTV 영상 기반 강우강도 산정을 위한 실환경 실험 자료 중심 적정 강우 이미지 DB 구축 방법론 개발 (Rainfall image DB construction for rainfall intensity estimation from CCTV videos: focusing on experimental data in a climatic environment chamber)

  • 변종윤;전창현;김현준;이재준;박헌일;이진욱
    • 한국수자원학회논문집
    • /
    • 제56권6호
    • /
    • pp.403-417
    • /
    • 2023
  • 본 연구에서는 CCTV 영상 기반 강우강도 산정 시 필수적으로 요구되는 적정 강우 이미지 DB를 구축하기 위한 방법론을 개발하였다. 먼저, 실환경에서 불규칙적이고 높은 변동성을 보일 수 있는 변수들(바람으로 인한 빗줄기의 변동성, 녹화 환경에서 포함되는 움직이는 객체, 렌즈 위의 흐림 현상 등)에 대한 통제가 가능한 한국건설생활환경시험연구원 내 기후환경시험실에서 CCTV 영상 DB를 구축하였다. 서로 다른 5개의 실험 조건을 고려하여 이상적 환경에서 총 1,728개의 시나리오를 구성하였다. 본 연구에서는 1,920×1,080 사이즈의 30 fps (frame per second) 영상 36개에 대하여 프레임 분할을 진행하였으며, 총 97,200개의 이미지를 사용하였다. 이후, k-최근접 이웃 알고리즘을 기반으로 산정된 최종 배경과 각 이미지와의 차이를 계산하여 빗줄기 이미지를 분리하였다. 과적합 방지를 위해 각 이미지에 대한 평균 픽셀 값을 계산하고, 설정한 픽셀 임계치보다 큰 자료를 선별하였다. 180×180 사이즈로의 재구성을 위해서 관심영역을 설정하고 10 Pixel 단위로 이동을 진행하여 픽셀 변동성이 최대가 되는 영역을 산정하였다. 합성곱 신경망 모델의 훈련을 위해서 120×120 사이즈로 재변환하고 과적합 방지를 위해 이미지 증강 과정을 거쳤다. 그 결과, 이미지 기반 강우 강도 합성곱 신경망 모델을 통해 산정된 결과값과 우량계에서 취득된 강우자료가 전반적으로 유사한 양상을 보였으며, 모든 강우강도 실험 조건에 대해서 약 92%의 데이터의 PBIAS (percent bias)가 절댓값 범위 10% 이내에 해당하였다. 본 연구의 결과물과 전이학습 등의 방법을 연계하여 기존 실환경 CCTV의 한계점을 개선할 수 있을 것으로 기대된다.

드론기반 시공간 초분광영상을 활용한 식생유무에 따른 하천 수심산정 기법 적용성 검토 (Evaluation for applicability of river depth measurement method depending on vegetation effect using drone-based spatial-temporal hyperspectral image)

  • 권영화;김동수;유호준
    • 한국수자원학회논문집
    • /
    • 제56권4호
    • /
    • pp.235-243
    • /
    • 2023
  • 하천법 개정 및 수자원의 조사·계획 및 관리에 관한 법률 제정으로 하상변동조사를 정기적으로 실시하는 것이 의무화되었고, 지자체가 계획적으로 수자원을 관리할 수 있도록 제도가 마련되고 있다. 하상 지형은 직접 측량할 수 없기 때문에 수심 측량을 통해 간접적으로 이루어지고 있으며, 레벨측량이나 음향측심기를 활용한 접촉식 방법으로 이루어지고 있다. 접촉식 수심측량법은 자료수집이 제한적이기 때문에 공간해상도가 낮고 연속적인 측량이 불가능하다는 한계가 있어 최근에는 LiDAR나 초분광영상을 이용한 원격탐사를 이용한 수심측정 기술이 개발되고 있다. 개발된 초분광영상을 이용한 수심측정 기술은 접촉식 조사보다 넓은 지역을 조사할 수 있고, 잦은 빈도로 자료취득이 용이한 드론에 경량 초분광센서를 탑재하여 초분광영상을 취득하고, 최적 밴드비 탐색 알고리즘을 적용해 수심분포 산정이 가능하다. 기존의 초분광 원격탐사 기법은 드론의 경로비행으로 획득한 초분광영상을 면단위의 영상으로 정합한 후 특정 물리량에 대한 분석이 수행되었으며, 수심측정의 경우 모래하천을 대상으로 한 연구가 주를 이루었으며, 하상재료에 대한 평가는 이루어지지 않았었다. 본 연구에서는 기존의 초분광영상을 활용한 수심산정 기법을 식생이 있는 하천에 적용하고, 동일지역에서 식생을 제거한 후의 2가지 케이스에 대해서 시공간 초분광영상과 단면초분광영상에 모두 적용하였다. 연구결과, 식생이 없는 경우의 수심산정이 더 높은 정확도를 보였으며, 식생이 있는 경우에는 식생의 높이를 바닥으로 인식한 수심이 산정되었다. 또한, 기존의 단면초분광영상을 이용한 수심산정뿐만 아니라 시공간 초분광영상에서도 수심산정의 높은 정확도를 보여 시공간 초분광영상을 활용한 하상변동(수심변동) 추적의 가능성을 확인하였다.

참조 수문관측소 구성 조건에 따른 LSTM 모형 홍수위예측 정확도 검토 사례 연구 (Case study on flood water level prediction accuracy of LSTM model according to condition of reference hydrological station combination)

  • 이승호;김수영;정재원;윤광석
    • 한국수자원학회논문집
    • /
    • 제56권12호
    • /
    • pp.981-992
    • /
    • 2023
  • 최근 전세계적인 기후변화의 영향으로 강우가 집중되고 강우강도가 강해짐에 따라 홍수피해의 규모를 증가시키고 있다. 과거에 관측되지 않았던 규모의 비가 내리기도 하고, 기록되지 않았던 장기간의 장마가 발생하기도 한다. 이러한 피해들은 아세안 국가에도 집중되고 있으며, 태풍 및 집중호우로 인해 침수의 빈번한 발생과 함께 많은 사람들이 영향을 받고 있다. 특히, 인도네시아 찌따룸강 상류 유역에 위치한 반둥 지역은 분지 형태의 지형학적 특성을 가지고 있어서 홍수에 매우 취약한 실정이다. 이에 공적개발원조(ODA)를 통해 2017년에 찌따룸강 상류(Upper Citarum River) 유역에 대하여 홍수예경보시스템을 구축되었고, 현재 운영중에 있다. 그럼에도 불구하고, 찌따룸강 상류 (Upper Citarum River) 지역은 홍수발생시 인명 및 재산피해의 위험에 여전히 노출되어 있어 신속하고 정확한 홍수예경보의 실시를 통해 피해를 경감시키는 노력이 지속적으로 필요한 실정이다. 따라서 본 연구에서는 찌따룸강 상류의 Dayeuh Kolot 지점을 목표관측소로 하고, 강우관측소 4개소와 수위관측소 1개소의 10분 단위 수문자료를 수집하여 인공지능 기반의 하천홍수위예측모형을 개발하였다. 6개 관측소의 2017년 1월부터 2021년 1월까지의 10분 단위 수문관측자료를 활용하여 선행예보시간 0.5, 1, 2, 3, 4, 5, 6시간에 대해서 학습, 검증, 시험을 수행하였으며 인공지능알고리즘으로는 LSTM을 적용하였다. 연구결과 모든 선행예보시간에 대해 모형적합도 및 오차에서 좋은 결과를 나타냈으며, 학습자료 구축조건에 따른 예측정확도를 검토한 결과 참조관측소가 적은 경우에도 모든 관측소를 활용하는 경우와 유사하게 예측정확도를 확보하는 것으로 나타나 효율적인 인공지능 기반 모형 구축에 활용될 수 있을 것으로 기대된다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

연속촬영 전자조사 문 영상을 이용한 오프라인 기반 치료 중 내부 장기 움직임 확인 시스템의 개발 (Development of an Offline Based Internal Organ Motion Verification System during Treatment Using Sequential Cine EPID Images)

  • 주상규;홍채선;허웅;김민규;한영이;신은혁;신정석;김진성;박희철;안성환;임도훈;최두호
    • 한국의학물리학회지:의학물리
    • /
    • 제23권2호
    • /
    • pp.91-98
    • /
    • 2012
  • 방사선치료 중 내부 장기의 움직임을 확인하고 이를 보정하는 것은 움직이는 종양에 정확히 방사선을 조사하는데 매우 중요한 역할을 한다. 실제 치료 중 획득한 연속촬영 전자조사 문(cine EPID) 영상을 이용해 치료 중 내부 장기 움직임을 추적하는 오프라인 기반 분석 시스템(IMVS, Internal-organ Motion Verification System using cine EPID)을 개발하였고 모형을 이용하여 개발된 시스템의 정확도와 유용성을 평가했다. IMVS는 cine EPID영상을 이용한 내부 장기 움직임 추적을 위해 내부 표지자를 이용한 유형 정합 알고리즘을 이용했다. 시스템의 성능평가를 위해 폐와 폐 종양을 묘사한 인체 모형과 이를 상하(SI, superior-inferior)방향으로 직선 운동시키는 구동 장치와 제어 프로그램을 고안했다. 모형을 4초 주기로 2 cm 직선 운동 시키면서 10 MV X선으로 3.3 fps, 6.6 fps속도로 cine EPID 영상($1,024{\times}768$ 해상도)를 획득했다. 획득된 cine EPID 영상은 IMVS를 이용하여 표적의 움직임을 추적하고 기존 외부 표지자를 이용한 비디오 영상 기반 추적시스템(RPM, Real-time Position Management, Varian, USA)으로부터 얻은 결과와 비교했다. 정량적 평가를 위해 두 시스템으로부터 움직임의 평균 주기(Peak-To-Peak), 진폭과 패턴(RMS, Root Mean Square)을 측정하여 비교했다. RPM과 IMVS로 측정한 폐 종양 모형의 움직임 주기는 각각 $3.95{\pm}0.02$ (RPM), $3.98{\pm}0.11$ (IMVS 3.3 fps), $4.005{\pm}0.001$ (IMVS 6.6 fps) 초로 실제움직임 주기인 4초와 잘 일치했다. IMVS로 획득한 모형 내부장기의 평균 움직임 진폭은 3.3 fps에서 $1.85{\pm}0.02$ cm, 6.6 fps에서 $1.94{\pm}0.02$ cm으로 실제 진폭 2 cm에 비해 각각 0.15 cm (오차 7.5%) 및 0.06 cm (오차 3%)의 차를 보였다. 움직임 신호의 일치성 평가를 위해 측정한 RMS는 0.1044 (IMVS 3.3 fps), 0.0480 (IMVS 6.6 fps)로 계획된 신호와 잘 일치 했다. cine EPID 영상을 이용하여 내부 표지자의 움직임을 추적하는 IMVS는 모형 실험에서 내부 장기의 움직임을 3% 오차 내에서 확인 가능했다. IMVS는 치료 중 내부장기 움직임을 측정하고 이를 사차원 방사선 치료계획과 비교하여 오차를 보정하는데 기여할 것으로 생각된다.

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

데이터기반의 신규 사업 매출추정방법 연구: 지능형 사업평가 시스템을 중심으로 (A Data-based Sales Forecasting Support System for New Businesses)

  • 전승표;성태응;최산
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.1-22
    • /
    • 2017
  • 사업타당성 분석이나 기업 기술가치평가 등 미래의 사업에 대한 진입이나 투자 타당성을 분석하기 위해서는 새로운 사업과 관련한 시장을 추정하고 그 안에서 확보 가능한 매출을 객관적으로 추정하는 과정이 필수 불가결하다. 이런 신규 매출이나 시장규모의 추정 방법은 다양한 방법으로 구분이 가능한데 크게 정량적인 방법과 정성적인 방법으로 구분할 수 있다. 그러나 두 가지 방법 모두 많은 자원과 시간을 필요로 한다. 그래서 우리는 신규 사업의 평가지원을 위한 데이터 기반의 지능형 매출 예측 시스템을 제안하고자 한다. 본 연구는 사업타당성 분석이나 기술가치평가를 위한 신규 사업의 매출 추정 시스템을 개발하는데, 알고리즘 기반으로 전통적인 정량 예측방법 중 하나인 유추방법에 주목했다. 동일한 국내 산업에서 최근 창업한 기업의 매출 실적을 국내 신규 사업의 매출액을 추정하는 유추 대상 변수로 활용할 수 있는지 검토한다. 여기서 유추예측 대상은 최초 매출액과 초기 성장률이며, 주요 비교 차원은 산업분류, 창업시기 등이 고려된다. 특히 본 연구는 우리나라 창업 기업이 가지는 매출 성장률의 평균회귀 현상을 활용하는 지능형 정보 지원 시스템을 제안하다. 본 연구에서는 신규 매출 추정을 위해서 역사적 자료인 창업 매출 실적을 활용하는 방법이 적절한지 판단하기 위해서 잠재성장모형 등을 활용해 산업분류에 따른 신규 사업의 초기 매출액과 연도별 성장률이 산업분류별로 차이가 있는지 분석한다. 기존 기업의 창업 후 4년간 매출 성과의 종단자료를 잠재성장모형으로 분석하는데, 특정 산업분류에서 차이를 보여주는지 분석해 산업분류가 유추 예측에서 고려해야할 유의미한 변수인지 분석하는 것이다. 본 연구의 결과는 신속하고 객관적인 신규 사업 매출 추정을 가능하게 하는 지능형 정보시스템을 개발하게 해서 사업성타당성 분석이나 기술가치평가 과정의 효율성을 개선시켜 줄 것으로 기대된다.