• 제목/요약/키워드: Value Prediction

검색결과 2,396건 처리시간 0.027초

초소형 SAR 위성을 활용한 수체면적 추출: 대청댐 유역 대상 (Extraction of Water Body Area using Micro Satellite SAR: A Case Study of the Daecheng Dam of South korea)

  • 박종수;강기묵;황의호
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.41-54
    • /
    • 2021
  • 수자원 관리와 수재해 피해 분석 및 예측 등을 위해 원격탐사를 활용한 수체면적을 추정하는 것은 매우 필수적이다. 위성을 활용한 수체탐지는 주로 광학 및 영상레이더(Synthetic Aperture Radar, SAR) 센서를 탑재한 대형(무게 1,000kg 이상) 위성을 중심으로 수행되어왔다. 그러나 긴 재방문주기(repeat cycle)로 인해 재난/재해 시 적시 활용이 불가능한 한계가 존재한다. 최근 초소형위성(무게 100kg 미만) 개발이 활발히 이루어짐에 따라 기존 대형위성 중심의 시간해상도 한계를 극복할 수 있는 계기가 되었다. 현재 활발히 운용중인 초소형 SAR 위성은 핀란드의 ICEYE와 미국의 Capella 위성으로, 지구관측을 목적으로 군집(constellation) 형태로 운용되고 있다. 군집화 운용으로 인해 짧은 재방문주기(현재 0.8회/1일) 및 고해상도(Spot(0.5m))를 가지며, SAR센서 탑재로 기상 및 주야 무관하게 관측이 가능한 장점이 있다. 본 연구에서는 초소형위성의 운영 현황 및 특징에 대해서 기술하였으며, 초소형 SAR 위성 영상에 최적화된 수체면적 추정기술을 한반도 대청댐 유역에 적용해 보았다. 또한 광학 위성인 Sentinel-2 위성으로부터 생성된 수체를 참조값(reference)으로 하여 초소형위성 2기와 대형위성인 Sentinel-1위성과의 면적, 상관성 분석을 수행하였다. Capella 위성의 경우 가장 적은 면적의 차를 보였으며, 세 영상 모두 높은 상관관계를 나타냄을 확인하였다. 본 연구의 결과를 통해 초소형 SAR 위성의 낮은 NESZ(Noise Equivalent Sigma Zero)에도 불구하고 수체면적 추정이 가능함을 확인하였으며, 기존 대형 SAR 위성을 활용한 수자원/수재해 감시 활용의 한계를 극복할 수 있을 것으로 사료된다.

다중회귀모형과 인공신경망모형을 이용한 금강권역 강수량 장기예측 (Application of multiple linear regression and artificial neural network models to forecast long-term precipitation in the Geum River basin)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.723-736
    • /
    • 2022
  • 본 연구에서는 금강권역을 대상으로 최대 12개월까지 선행예측이 가능한 월 강수량 예측모형을 구축하였으며, 예측모형 구축에는 다중회귀분석과 인공신경망의 두 가지 통계적 기법을 적용하였다. 예측인자 후보로 NOAA에서 제공하는 글로벌 기후패턴 39종과 금강권역에 대한 기상인자 8종 등 총 47종의 기후지수를 활용하였다. 예측대상월을 기준으로 과거 40년간의 월 강수량과 기후지수와의 지연상관성 분석을 통해 상관도가 높은 기후지수를 예측인자로 활용하여 다중회귀모형 및 인공신경망 모형을 구축하였다. 1991~2021년에 대해 매월 예측결과의 평균값과 관측값과의 적합도를 분석한 결과, 다중회귀모형은 PBIAS -3.3~-0.1%, NSE 0.45~0.50, r 0.69~0.70으로 분석되었으며, 인공신경망모형은 PBIAS -5.0~+0.5%, NSE 0.35~0.47, r 0.64~0.70로, 다중회귀모형에 의해 도출된 예측치의 평균값이 인공신경망모형보다 관측치에 좀 더 근접한 것으로 나타났다. 각 월의 예측범위 안에 관측치가 포함될 확률을 분석한 결과에서는 다중회귀모형이 57.5~83.6%(평균 72.9%), 인공신경망모형의 경우에는 71.5~88.7%(평균 81.1%)로 인공신경망모형 결과가 우수한 것으로 나타났다. 3분위 예측확률을 비교한 결과는 다중회귀모형의 경우에는 25.9~41.9%(평균 34.6%), 인공신경망모형은 30.3~39.1%(평균 34.7%)로 비슷하며, 두 모형 모두 평균 33.3% 이상으로 월 강수량에 대한 장기예측성을 확인 할 수 있었다. 이상과 같이 두 모형의 예측성 차이는 비교적 크지 않은 것으로 나타났으나, 예측범위에 대한 적중률이나 3분위 예측확률로부터 판단할 때 예측성에 대한 월별 편차는 인공신경망모형의 결과가 상대적으로 작게 나타났다.

전기비저항 탐사 기반 TBM 터널 굴진면 전방 위험 지반 예측을 위한 실내 토조실험 연구 (Laboratory chamber test for prediction of hazardous ground conditions ahead of a TBM tunnel face using electrical resistivity survey)

  • 이준호;강민규;이효범;최항석
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.451-468
    • /
    • 2021
  • 터널 굴진면 전방 위험 지반 예측은 TBM (Tunnel Boring Machine) 굴진 성능 및 안정성 확보에 필수적이다. 국내·외에서 굴진면 전방 예측을 위한 전기비저항 탐사법에 대한 연구가 다수 이루어졌으나, TBM 터널 굴진을 고려한 전기비저항 탐사의 실내 실험 모사가 어렵기에 이와 관련된 실험 연구가 매우 부족한 실정이다. 따라서 본 연구에서는 전기비저항 탐사법의 터널 전방 위험 지반 예측 적용성을 분석하기 위한 TBM 굴진을 모사한 실내 축소 모형 실험을 수행하였다. 터널 굴진면 전방의 단층 파쇄대, 해수 침수대, 토사-암반 변화구간, 암반-토사 변화구간을 축소 모사하여, 굴진 중 전기비저항의 변화를 측정하였다. 본 연구에서는 실제 시공 조건을 재현하기 위해 화강암 블록을 사용하여 모형 지반을 모사하였다. 실험 결과, 터널이 굴진하면서 단층 파쇄대에 근접할수록 전기비저항이 감소하였으며, 해수 침수대도 동일한 경향을 보였으나, 단층 파쇄대와 비교하여 측정된 전기비저항이 크게 감소하였다. 토사-암반 변화구간의 경우, 전기비저항이 상대적으로 높은 암반에 터널 굴진면이 다가갈수록 전기비저항이 증가하는 양상을 보였다. 이와 반대로 암반-토사 변화구간의 경우, 전기비저항이 낮은 토사 지반에 굴진면이 근접할수록 전기비저항이 감소하였다. 실험 결과를 통해 전기비저항 탐사 굴진면 전방 위험 지반(단층 파쇄대, 해수 침수대, 토사-암반 변화구간, 암반-토사 변화구간)의 예측이 가능하다고 판단된다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

로지스틱 회귀모형을 이용한 우리나라 산지면적의 공간변화 예측에 관한 연구 (Change Prediction of Future Forestland Area by Transition of Land Use Types in South Korea)

  • 곽두안;박소희
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.99-112
    • /
    • 2021
  • 본 연구는 기존 연구에서 수행된 전국 단위의 정량적 산지면적 변화량을 공간적으로 배분하여 광역시도별 산지면적 변화를 추정함으로써 지역산림계획의 수립을 지원하기 위해 수행되었다. 토지를 산지, 농지, 도시 및 기타지로 구분하고 토지이용 형태별 변화 여부를 종속변수로, 지형요소, 이용 제한요소, 사회·경제적 요소, 개발 인프라를 독립변수로 하는 로지스틱 회귀모형을 개발하였다. 우리나라 전체를 30m×30m 격자로 분할하여 각 Cell에 해당하는 독립변수 자료를 구축하였고, 로지스틱 회귀모형을 이용하여 각 토지이용 형태가 타 유형으로 변화하는 확률을 추정하였다. 추정된 토지이용 변화확률을 기반으로 변화순위 지도를 구축하였고, 연도별 토지이용 변화량을 변화순위에 따라 순차적으로 배분함으로써 토지이용 변화의 공간적인 변화를 분석할 수 있었다. 경사도와 지자체별 개발 가능한 경사도 기준이 산지가 도시 및 기타지로 변화될 확률에 가장 큰 영향을 미쳤으며, 경사도와 개발 가능한 경사도 기준이 낮을수록, 토지가격과 인구밀도가 높을수록 산지가 도시 및 기타지로 변화될 확률이 높아졌다. 그 결과 2027년까지 수도권과 대도시의 산지가 도시 및 기타지로 변화하여 산지면적이 크게 감소하였다. 그러나 2028년 이후 2050년까지 서울, 경기, 제주를 제외한 대부분의 지역에서 산지면적이 빠르게 증가하는 것으로 예측되었는데, 이는 지방 소도시의 급격한 인구감소에 기인하는 것으로 분석되었다. 이에 중앙정부에서는 변화하는 산지면적에 대응하기 위해 산지관리 정책의 전환이 필요하고, 지자체 단위에서는 인구의 감소 정책과 그에 따른 산지를 포함한 토지의 효율적 보전 및 이용체계를 수립하는 것이 필요할 것으로 사료된다.

지형정보 기반 조난자 행동예측을 위한 마코프 의사결정과정 모형 (MDP(Markov Decision Process) Model for Prediction of Survivor Behavior based on Topographic Information)

  • 손진호;김수환
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 유사시 종심 깊숙한 곳에서 적을 타격하는 임무를 수행하는 항공기의 경우 격추될 위험에 항시 노출되어 있다. 현대전의 핵심 전투력으로써 최첨단의 무기체계를 운용하는 공중근무 요원은 양성하는데 많은 시간과 노력, 국가 예산이 소요되며 그들이 가진 작전 능력과 군사기밀이 매우 중요하기에 공중근무 요원의 생환은 매우 중요한 문제이다. 따라서, 본 연구에서는 적지에서 비상탈출한 조난자가 장애물을 피해 목표지점까지 도피·탈출을 시행할 경로를 예측하는 경로 문제를 연구하였으며 이를 통해 비상탈출한 조난자의 무사 생환 가능성을 높이고자 하였다. 본 연구 주제와 관련된 기존 연구들은 경로 문제를 네트워크 기반 문제로 접근하여 TSP, VRP, Dijkstra 알고리즘 등으로 문제를 변형하여 최적화 기법으로 접근한 연구가 있었다. 본 연구에서는 동적 환경을 모델링 하기에 적합한 MDP(마코프 의사결정과정)를 적용하여 연구하였다. 또한 GIS를 이용하여 지형정보 데이터를 추출하여 활용함으로써 모형의 객관성을 높였으며, MDP의 보상구조를 설계하는 과정에서 기존 연구 대비 모형이 좀 더 현실성을 가질 수 있도록 보다 상세히 지형정보를 반영하였다. 본 연구에서는 조난자가 지형적 이점을 최대한 이용함과 동시에 최단거리로 이동할 수 있는 경로를 도출하기 위하여 가치 반복법 알고리즘, 결정론적 방법론을 사용하였으며 실제 지형정보와 조난자가 도피·탈출 과정에서 만날 수 있는 장애요소들을 추가하여 모형의 현실성을 더하고자 하였다. 이를 통해 조난자가 조난 상황에서 어떠한 경로를 통해 도피·탈출을 수행할지 예측해 볼 수 있었다. 본 연구에서 제시한 모형은 보상구조의 재설계를 통해 여러 가지 다양한 작전 상황에 응용이 가능하며 실제 상황에서 조난자의 도피·탈출 경로를 예측하고 전투 탐색구조 작전을 진행시키는 데 있어 다양한 요소가 반영된 과학적인 기법에 근거한 의사결정 지원이 가능할 것이다.

고해상도 광학 위성영상의 항만선박관리 활용 가능성 평가: 부산 신항의 선석 활용을 대상으로 (Evaluation of the Utilization Potential of High-Resolution Optical Satellite Images in Port Ship Management: A Case Study on Berth Utilization in Busan New Port)

  • 김현수 ;장소영 ;김태호
    • 대한원격탐사학회지
    • /
    • 제39권5_4호
    • /
    • pp.1173-1183
    • /
    • 2023
  • 한국의 전체 수출입 물동량은 지난 20여년 동안 연평균 약 5.3%씩 증가하였고, 약 99%가량의 화물이 여전히 해상을 통해 운송되고 있는 것으로 나타났다. 최근 해상 물동량 증가, 코로나 및 전쟁 등의 이유로 해상 물류가 혼잡해지고 예측이 어려워지고 있어 지속적인 항만의 모니터링이 중요하다. 다양한 지상 관측 시스템과 automatic identification system (AIS) 정보를 이용하여 항만을 모니터링하고 항만 내 컨테이너 터미널의 효율적 운영과 물동량 예측을 위한 많은 선행 연구가 진행되었다. 하지만, 소형 무역항이나 개발도상국의 무역항의 경우 대형 항만에 비해 환경 문제와 노후화된 인프라 등의 이유로 항만을 모니터링하기에 어려움이 있다. 최근 인공위성의 활용성이 높아짐에 따라 광범위하고 접근하기 어려운 지역에 대해 위성 영상을 이용하여 지속적인 해상 물동량 데이터 수집 및 해양 감시체계 구축을 위한 선행 연구가 진행되고 있다. 본 연구는 고해상도 위성영상을 이용하여 부산 신항을 대상으로 항만 내 컨테이너 터미널에 존재하는 선석에 정박한 선박을 육안으로 탐지하고 선석 활용률을 정량적으로 평가하고자 한다. 국토위성, 아리랑위성 3호, PlanetScope, Sentinel-2A를 이용해 항만 내 선석에 정박하고 있는 선박을 육안으로 탐지하였고 선석에 정박 가능한 전체 선박의 수를 이용하여 선석 활용률을 산출하였다. 산출 결과 2022년 6월 2일의 경우 0.67, 0.7, 0.59로 변화하는 것을 보였으며, 영상 촬영 시각에 따라 선박의 수가 변화한 것으로 확인되었다. 2022년 6월 3일의 경우 0.7로 동일한 것으로 나타났고 이는 선박의 종류는 변화하였으나 촬영 시각에 선박의 수는 동일한 것으로 확인이 되었다. 선석 활용률은 값이 클수록 해당 선석에서의 작업이 활발하게 이루어지고 있는 것을 의미하고 있으며, 이는 선석이 혼잡하여 정박지에서 대기하고 있는 다른 선박의 대기시간이 길어지고 운임료가 증가할 수 있기 때문에 선석 활용률을 이용하여 기초적인 새로운 선박 운항 계획 수립에 도움이 될 것으로 판단된다. 선석에서의 작업시간은 수시간에서 수일이 소요되는데 영상의 촬영 시간 차이에 따른 선석에서의 선박의 변화율을 산출한 결과 4분 49초의 시간차이에도 선박의 변화가 있는 것을 확인할 수 있었다. 이는 관측 주기가 짧고 고해상도 위성영상을 모두 이용한다면 항만내 지속적인 모니터링이 가능할 것으로 사료된다. 그리고 항만 내 선박의 변화를 최소 시간 단위로 확인할 수 있는 위성 영상을 활용하면 항만 관리가 이루어지지 않는 소형 무역항이나 개발도상국의 무역항 등에서도 유용하게 사용할 수 있을 것으로 기대된다.

XGBoost를 활용한 리스크패리티 자산배분 모형에 관한 연구 (A Study on Risk Parity Asset Allocation Model with XGBoos)

  • 김영훈;최흥식;김선웅
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.135-149
    • /
    • 2020
  • 인공지능을 기반으로 한 다양한 연구들이 현대사회에 많은 변화를 불러일으키고 있다. 금융시장 역시 예외는 아니다. 로보어드바이저 개발이 활발하게 진행되고 있으며 전통적 방식의 단점을 보완하고 사람이 분석하기 어려운 부분을 대체하고 있다. 로보어드바이저는 인공지능 알고리즘으로 자동화된 투자 결정을 내려 다양한 자산배분 모형과 함께 활용되고 있다. 자산배분 모형 중 리스크패리티는 대표적인 위험 기반 자산배분 모형의 하나로 큰 자산을 운용하는 데 있어 안정성을 나타내고 현업에서 역시 널리 쓰이고 있다. 그리고 XGBoost 모형은 병렬화된 트리 부스팅 기법으로 제한된 메모리 환경에서도 수십억 가지의 예제로 확장이 가능할 뿐만 아니라 기존의 부스팅에 비해 학습속도가 매우 빨라 많은 분야에서 널리 활용되고 있다. 이에 본 연구에서 리스크패리티와 XGBoost를 장점을 결합한 모형을 제안하고자 한다. 기존에 널리 사용되는 최적화 자산배분 모형은 과거 데이터를 기반으로 투자 비중을 추정하기 때문에 과거와 실투자 기간 사이의 추정 오차가 발생하게 된다. 최적화 자산배분 모형은 추정 오차로 인해 포트폴리오 성과에서 악영향을 받게 된다. 본 연구는 XGBoost를 통해 실투자 기간의 변동성을 예측하여 최적화 자산배분 모형의 추정 오차를 줄여 모형의 안정성과 포트폴리오 성과를 개선하고자 한다. 본 연구에서 제시한 모형의 실증 검증을 위해 한국 주식시장의 10개 업종 지수 데이터를 활용하여 2003년부터 2019년까지 총 17년간 주가 자료를 활용하였으며 in-sample 1,000개, out-of-sample 20개씩 Moving-window 방식으로 예측 결과값을 누적하여 총 154회의 리밸런싱이 이루어진 백테스팅 결과를 도출하였다. 본 연구에서 제안한 자산배분 모형은 기계학습을 사용하지 않은 기존의 리스크패리티와 비교하였을 때 누적수익률 및 추정 오차에서 모두 개선된 성과를 보여주었다. 총 누적수익률은 45.748%로 리스크패리티 대비 약 5% 높은 결과를 보였고 추정오차 역시 10개 업종 중 9개에서 감소한 결과를 보였다. 실험 결과를 통해 최적화 자산배분 모형의 추정 오차를 감소시킴으로써 포트폴리오 성과를 개선하였다. 포트폴리오의 추정 오차를 줄이기 위해 모수 추정 방법에 관한 다양한 연구 사례들이 존재한다. 본 연구는 추정 오차를 줄이기 위한 새로운 추정방법으로 기계학습을 제시하여 최근 빠른 속도로 발전하는 금융시장에 맞는 진보된 인공지능형 자산배분 모형을 제시한 점에서 의의가 있다.

개인화된 뉴스 서비스를 위한 소셜 네트워크 기반의 콘텐츠 추천기법 (Content-based Recommendation Based on Social Network for Personalized News Services)

  • 홍명덕;오경진;가명현;조근식
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.57-71
    • /
    • 2013
  • 세계에는 수많은 사람들이 살아가고 있고, 사람들의 일상으로부터 매일, 매 시간 단위로 새로운 뉴스가 발생한다. 발생되는 뉴스는 예정된 일과 예상하지 못한 일들을 포함하고 있다. 발생하는 뉴스의 거대한 양과 이를 전달하는 수많은 미디어들로 인해 사람들은 뉴스 콘텐츠를 이용하는데 많은 시간을 소비하게 된다. 하지만 미디어에 시시각각 나타나는 속보와 실시간 이슈의 대부분이 가십 기사로 이루어져 있어 사용자들이 자신의 성향에 맞는 뉴스를 선별하고, 뉴스로부터 정보를 획득하는 것은 쉽지 않은 일이다. 또한 사용자의 관심사가 시간에 따라 변하기 때문에 뉴스 제공에 있어 사용자의 변하는 관심사를 반영하는 것이 요구된다. 본 논문에서는 사용자의 최근 관심사를 기반으로 사용자 선호도에 맞는 뉴스를 제공하기 위한 콘텐츠 기반의 추천 기법 및 시스템을 제안한다. 사용자의 최근 선호도를 파악하기 위하여 소셜 네트워크 서비스인 Facebook 사용자의 정보와 최근 게시글을 이용하여 동적으로 사용자 프로파일을 생성하여 이를 뉴스 서비스에 활용하고, 사용자 선호도에 적합한 뉴스를 추출하기 위해서 뉴스 콘텐츠의 분석을 요구한다. 뉴스 콘텐츠 분석을 위해 미디어에서 제공되는 뉴스의 카테고리를 사용하고, 뉴스 방송원고의 분석 및 주요 키워드 추출을 통해 뉴스 프로파일을 생성한다. 사용자 프로파일과 뉴스 프로파일 간의 유사도 측정을 위해서는 두 프로파일 간 형식의 일치화가 요구되므로 사용자 프로파일을 뉴스 프로파일과 동일한 형태로 생성한다. 사용자가 시스템에 접속하면 시스템은 사용자 프로파일에 명시된 선호도를 기반으로 뉴스 프로파일과의 유사도를 측정하고, 사용자 선호도에 가장 적합한 뉴스들을 제공하게 된다. 또한 사용자에게 제공된 뉴스 프로파일과 다른 뉴스 프로파일들 간에 유사도를 측정하여 유사도가 높은 관련된 뉴스들을 제공하게 된다. 제안한 개인화된 뉴스 서비스의 성능을 평가하기 위해 사용자에게 추천된 뉴스에 대한 사용자 평가와 시스템 예측값의 오차를 기반으로 6Sub-Vectors 벤치마크 알고리즘과 성능 평가를 수행하였고, 실험 결과를 통해 제안한 시스템의 우수성을 입증하였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.