• 제목/요약/키워드: Random forests

검색결과 109건 처리시간 0.026초

국내 예능 시청률과 회차 예측 및 영향요인 분석 (A study on entertainment TV show ratings and the number of episodes prediction)

  • 김미림;임소연;장초희;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.809-825
    • /
    • 2017
  • 오디션, 육아, 버라이어티 등 다양한 예능 프로그램들의 수가 점점 증가하고 있다. 특히 종합편성채널이 개국한 이후에 예능 시장 경쟁이 심화되고 있다. 그에 따라 시청률과 회차에 대한 연구의 필요성이 대두되고 있다. 본 연구의 목적은 예능 프로그램 시청률과 회차의 예측모형을 제시하고 주요요인을 살펴보는 데 있다. 모형 적합 시 선형회귀모형, 로지스틱 회귀모형, LASSO 회귀모형, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 머신 등과 같은 다양한 분석 방법을 고려하였다. 예능 시청률 예측 모형에서는 첫 회가 방영되기 전과 방영된 후 두 가지 모형을 적합하였고, 회차 예측 모형에서는 예능 시청률 예측 모형의 예측치를 추가 변수로 생성하여 모형을 적합하였다. 그 결과 첫 회 방영 전 예능 시청률 예측에서는 방송사, 이전 시즌 시청률, 시작 연도, 기사 수가 큰 영향을 주는 것으로 나타났다. 첫 회 방영 후 예능 시청률 예측에서는 첫 회 시청률, 방송사, 예능 유형이 중요한 변수로 나타났으며, 두 모형 모두 랜덤 포레스트 모형에서 가장 좋은 결과를 보였다. 예능 회차 예측에서는 평균 시청률 예측치, 시작 연도, 예능유형, 방송국 등이 중요한 변수로 나타났다.

용담댐 기존운영에 대한 의사결정중심 기후변화 영향 평가 (A decision-centric impact assessment of operational performance of the Yongdam Dam, South Korea)

  • 김대하;김은희;이승철;김은지;신준
    • 한국수자원학회논문집
    • /
    • 제55권3호
    • /
    • pp.205-215
    • /
    • 2022
  • 대기온실가스 증가로 인해 전지구 평균기온은 이미 1.0℃ 이상 상승했고 폭염, 가뭄, 홍수 등 극한 기상현상의 빈도는 점점 더 높아질 것으로 전망되고 있다. 본 연구에서는 전북·충청지역의 이·치수안전도 확보에 큰 역할을 하고 있는 용담댐의 기존 운영방식이 기후변화에 얼마나 취약한 지 의사결정 지표를 중심으로 평가하였다. 현실적인 기후 스트레스 테스트를 위해 GR6J 강우-유출 모형, Random Forests 댐운영 모형을 관측자료에 적합시켰고 추계학적 기법으로 생성된 294개의 기후스트레스 시계열을 모형에 입력해 연최대일방류량, 저수량신뢰도, 공급신뢰도의 변화를 분석하였다. 그 결과 2021~2040년 기간 용담댐 저수량신뢰도는 과도한 수준으로 증가할 것으로 전망되었고 이에 반해 공급신뢰도의 증가는 저수량 신뢰도에 미치지 못할 것으로 나타났다. 평균강수량과 강수변동성의 증가로 20년 빈도 연최대방류량은 50%의 확률로 43% 증가할 것으로 나타났다. 용담댐의 기존운영방식은 저수량 확보에 과도하게 치중되어 있는 것으로 판단되며 이 운영이 지속될 경우 용담댐 하류지역의 홍수위험은 더 가중될 것으로 예상된다.

양자 컴퓨터 기술 트렌드 예측과 분석 (Trend Forecasting and Analysis of Quantum Computer Technology)

  • 차은주;장병윤
    • 한국시뮬레이션학회논문지
    • /
    • 제31권3호
    • /
    • pp.35-44
    • /
    • 2022
  • 본 연구에서는 양자 컴퓨터 관련 기술 트렌드 분석과 예측을 수행한다. 기존 양자 컴퓨터 기술 분석 관련 연구는 주로 기술 특징을 중심으로 응용 가능 분야에 집중되었다. 본 논문은 시장 중심의 기술 분석과 예측을 위하여 양자 컴퓨터 관련 국내 뉴스 기사를 기반으로 중요하게 다뤄지는 양자 컴퓨터 기술들을 분석하고 미래신호 감지와 예측을 수행한다. 뉴스 기사에서 사용된 단어들을 분석하여 빠르게 변화하는 시장의 변화와 대중의 관심사를 파악한다. 본 논문은 Cha & Chang (2022) 컨퍼런스 발표 자료를 확장했다. 연구는 2019년부터 2021년까지의 국내 뉴스 기사를 수집하여 진행된다. 먼저, 텍스트 마이닝을 통해 주요 키워드를 정리한다. 다음으로, Term Frequency - Inverse Document Frequency(TF-IDF), Key Issue Map(KIM), Key Emergence Map(KEM) 등의 분석을 통해 양자컴퓨터관련 기술을 탐색한다. 마지막으로, 랜덤포레스트, 의사결정나무, 연관분석 등을 통해 미래기술들과 수요 및 공급의 연관성을 파악한다. 연구결과 빈도분석, 키워드 확산도 및 가시성 분석에서 모두 AI의 관심도가 가장 높게 나타났다. 사이버보안의 경우 시간이 지날수록 뉴스기사에서 언급되는 비율이 다른 기술에 비해 압도적으로 높게 나타났다. 또한 양자통신, 내성암호, 증강현실 역시 관심도의 증가율이 높게 나타났다. 따라서 이를 트렌드 기술의 적용에 대한 시장의 기대가 높음을 알 수 있다. 본 연구의 결과는 양자컴퓨터 시장의 관심 분야 파악과 기술 투자 관련 대응체계 구축에 응용될 수 있다.

A Comparative Study on Data Augmentation Using Generative Models for Robust Solar Irradiance Prediction

  • Jinyeong Oh;Jimin Lee;Daesungjin Kim;Bo-Young Kim;Jihoon Moon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.29-42
    • /
    • 2023
  • 본 논문은 서울, 부산, 인천과 같은 대한민국의 주요 도시들을 대상으로 일사량 예측 정확도를 향상하기 위한 방법론을 제안한다. 제안한 방법론은 먼저 GAN, CTGAN, Copula GAN, WGANGP, TVAE 등 다섯 가지 생성 모델을 이용하여 기존 학습 데이터와 유사한 독립 변수들을 생성한다. 다음으로 모델 학습에서의 데이터 편향성을 개선하고자, 생성한 독립 변수들에서 각각 랜덤 포레스트와 심층 신경망을 통해 종속 변숫값을 도출하여 학습 데이터 셋을 구축하고, 이를 기존 학습데이터 셋과 결합하여 예측 모델을 구성한다. 실험 결과, 증강된 데이터 셋으로 학습한 모델들은 기존 데이터 셋으로 학습한 모델들보다 향상된 성능을 나타내었다. 특히 CTGAN은 복잡한 다변량 데이터 관계를 효과적으로 다루는 메커니즘으로 인해 우수한 결과를 도출하였으며, 생성된 데이터는 일사량의 다양한 변화와 실제 변동성과 효과적으로 반영하였다. 제안한 방법론은 고품질의 생성 데이터로 학습 데이터를 증강함으로써, 데이터 부족 현상 문제를 다룰 수 있을 뿐만 아니라 지속 가능한 발전을 위한 태양광 발전 시스템 운영에도 이바지할 수 있을 것으로 기대한다.

Performance of Prediction Models for Diagnosing Severe Aortic Stenosis Based on Aortic Valve Calcium on Cardiac Computed Tomography: Incorporation of Radiomics and Machine Learning

  • Nam gyu Kang;Young Joo Suh;Kyunghwa Han;Young Jin Kim;Byoung Wook Choi
    • Korean Journal of Radiology
    • /
    • 제22권3호
    • /
    • pp.334-343
    • /
    • 2021
  • Objective: We aimed to develop a prediction model for diagnosing severe aortic stenosis (AS) using computed tomography (CT) radiomics features of aortic valve calcium (AVC) and machine learning (ML) algorithms. Materials and Methods: We retrospectively enrolled 408 patients who underwent cardiac CT between March 2010 and August 2017 and had echocardiographic examinations (240 patients with severe AS on echocardiography [the severe AS group] and 168 patients without severe AS [the non-severe AS group]). Data were divided into a training set (312 patients) and a validation set (96 patients). Using non-contrast-enhanced cardiac CT scans, AVC was segmented, and 128 radiomics features for AVC were extracted. After feature selection was performed with three ML algorithms (least absolute shrinkage and selection operator [LASSO], random forests [RFs], and eXtreme Gradient Boosting [XGBoost]), model classifiers for diagnosing severe AS on echocardiography were developed in combination with three different model classifier methods (logistic regression, RF, and XGBoost). The performance (c-index) of each radiomics prediction model was compared with predictions based on AVC volume and score. Results: The radiomics scores derived from LASSO were significantly different between the severe AS and non-severe AS groups in the validation set (median, 1.563 vs. 0.197, respectively, p < 0.001). A radiomics prediction model based on feature selection by LASSO + model classifier by XGBoost showed the highest c-index of 0.921 (95% confidence interval [CI], 0.869-0.973) in the validation set. Compared to prediction models based on AVC volume and score (c-indexes of 0.894 [95% CI, 0.815-0.948] and 0.899 [95% CI, 0.820-0.951], respectively), eight and three of the nine radiomics prediction models showed higher discrimination abilities for severe AS. However, the differences were not statistically significant (p > 0.05 for all). Conclusion: Models based on the radiomics features of AVC and ML algorithms may perform well for diagnosing severe AS, but the added value compared to AVC volume and score should be investigated further.

금강권역 주요 하천의 돌 부착돌말류 분포 및 출현예측 (Distribution and Species Prediction of Epilithic Diatom in the Geum River Basin, South Korea)

  • 조인환;김하경;최만영;권용수;황순진;김상훈;김백호
    • 생태와환경
    • /
    • 제48권3호
    • /
    • pp.153-167
    • /
    • 2015
  • 금강권역 (금강, 만경강, 동진강, 삽교천)의 돌부착돌말류 분포와 환경과의 관계를 파악하기 위하여 총 146개 지점의 토지이용, 수질 및 돌말류 조사를 실시하였다. 조사에서 출현한 돌말류는 총 183분류군으로 1강 2목 3아목 9과 35속 162종 18변종 2품종 1아종이었으며, 우점종은 Nitzschia palea (10.9%), Achnanthes convergens (8.4%)로 밝혀졌다. 돌말류의 현존량을 근거로 집괴분석을 실시한 결과, 25% 수준에서 4개 그룹으로 구분되었다. 지리적 특성 및 수질환경은 그룹 I, II는 각각 금강의 상류와 중류 지점으로 주변에 숲 구성비가 높고 수질이 양호하였다. 그룹 III은 도시를 관통하고 농경지였으며 수질은 영양염 (TN, TP), 전기전도도 등이 높았다. 그룹 IV는 대부분 평야지대로서 농경지로 구성되었으며 수질은 탁도, BOD, 영양염, 전기전도도 등이 상대적으로 높았다. CCA 결과는 그룹 I은 호청수성종 Meridion circulare가 지표종으로 해발고도와 숲의 영향을, 그룹 II는 광적응성종 Navicula cryptocephala가 Chlorophylla, AFDM, DO의 영향을 각각 받은 것으로 나타났다. 그룹 III, IV는 각각 광적응성종 Fragilaria elliptica와 호오탁성 종 Aulacoseira ambigua 등이 전기전도도, 탁도, 영양염의 영향을 받았다. 한편 그룹 I, II, III의 지표종들의 발생을 결정하는 예측요인으로는 공히 전기전도도였으며 그룹 IV는 탁도로 나타났다. 이상을 종합하면, 금강권역의 돌말류의 분포는 수계의 고유성 보다는 주변의 토지이용도와 그로 인한 수질에 의해 결정되는 것으로 판단되며, 미소서식처에 대한 제밀한 연구가 이루어진다면 보다 정확한 돌말류 분포특성을 이해할 수 있을 것으로 사려되었다.

산림지역에서의 2023년 봄철 꽃나무 개화시기 예측 (Prediction of Spring Flowering Timing in Forested Area in 2023)

  • 서지희;김수경;김현석;천정화;원명수;장근창
    • 한국농림기상학회지
    • /
    • 제25권4호
    • /
    • pp.427-435
    • /
    • 2023
  • 이상기상으로 인한 봄꽃 개화 시기의 변화는 식물의 생장기간 뿐 아니라 생물계절을 포함한 생태계의 모든 측면에 영향을 미친다. 따라서 봄꽃 개화 시기를 예측하는 것은 산림 생태계의 효과적인 관리에 필수적이다. 본 연구에서는 464곳의 산림에서 수집된 날씨정보를 기반으로 대한민국 산림의 대표적인 5가지 수종(미선나무, 아까시나무, 철쭉, 산철쭉, 마가목)의 2023년 개화 시기를 예측하기 위해 과정 기반 모형을 사용하였다. 이를 위해 28개 지역의 9년간(2009-2017) 개화 시기 자료를 활용하여 모형을 개발하였다. 개화 시기는 식물의 세 개 이상의 위치에서 처음으로 꽃이 피는 것을 기준으로 측정되었다. 본 연구에서는 STDD와 GDD 과정 기반 모형을 사용하여 개화 시기를 예측하였으며, 두 모형 모두 일반적으로 우수한 성능을 보였다. 과정 기반 모형의 주요 입력변수인 날씨 자료는 산악기상관측시스템과 기상청에서 제공하는 기온 정보를 융합하여 1km의 공간 해상도로 일 단위 기온 자료를 생성하였다. 지역별 보정 계수를 생산하고 적용하기 위해 랜덤포레스트 기계 학습을 활용하여 STDD와 GDD 모형을 기반으로 예측 정확도를 개선하였다. 결과적으로 보정 계수가 적용될 때 대부분의 수종에서 개화 시기의 예측 오차가 작았으며, 특히, 미선나무, 아까시나무, 철쭉에서 평균제곱근오차가 각각 1.2, 0.6, 1.2일로 매우 낮았다. 모형 성능을 평가하기 위해 10회의 무작위 샘플링 테스트를 실시하고, 최적의 결정계수 값을 가진 모형을 선택하여 모형의 성능을 평가하였다. 그 결과, 마가목을 제외한 모든 수종에서 보정 계수가 적용된 모형에서 결정계수가 최소 0.07에서 최대 0.7 증가하였으며 최종적으로 75%에서 90%의 설명력을 가졌다. 이를 기반으로 수종별 보정 계수를 산출하였으며, 1km 해상도의 전국 단위 개화시기예측 지도를 제작하였다. 본 연구는 식물의 계절 변화에 대한 자료로 활용될 것으로 예상되며, 수종 및 지역별로 개화 시기를 상세히 설명하여 기후 변화로 인한 계절 변화를 연구하는 데에 유용할 것으로 기대된다. 또한 우리나라 산림의 주요 수종에 대한 정확도 높은 개화 시기 예측 서비스는 산림 방문객들의 산림 경험 만족도를 크게 높일 수 있으며, 양봉업 등 임업 종사자들의 경제적 향상에 기여할 것으로 기대된다.

산림보험(山林保險)에 관한 연구(硏究) (A Study on Forest Insurance)

  • 박태식
    • 한국산림과학회지
    • /
    • 제15권1호
    • /
    • pp.1-38
    • /
    • 1972
  • 우리나라는 근래(近來) 고도경제성장(高度經濟成長)으로 인(因)하여 목재수요(木材需要)가 급증(急增)하고 있으나 국내생산재(國內生産材)가 공급율(供給率)은 수요량(需要量)의 20% 정도(程度)에 지나지 않아 많은 외재(外在)를 도입(導入)하고 있으므로 장래(將來)의 목재(木材) 수요공급(需要供給)의 균형(均衡)을 이룩하기 위하여 강력(强力)한 산림자원(山林資源) 조성사업(造成事業)의 추진(推進)이 요망(要望)된다. 산림자원(山林資源) 조성사업(造成事業)을 추진(推進)하는데 있어서 가장 중요(重要)한 것은 조림의욕(造林意慾)을 높이고 조림사업(造林事業)에 필요(必要)한 산업자본(産業資本)을 산림(山林)에 유치(誘致)하도록 하는 일인데, 이러한 역할(役割)을 할 수 있는 경제적시설(經濟的施設)의 하나가 산림보험제도(山林保險制度)의 실시(實施)인 것이다. 산림보험(山林保險)을 실시(實施)하면 산림재해(山林災害)가 보상(補償)되므로 자본가(資本家)는 안심(安心)하고 조림투자(造林投資)를 할 수 있을 뿐만 아니라 산림(山林)을 담보(擔保)로 한 금융(金融)의 길도 열리어 투자(投資)한 산림(山林)에 환금성(換金性)이 주어지므로 산업자본가(産業資本家)가 산림투자(山林投資)를 회피(回避)하지 않게 되어 산림자원(山林資源) 조성사업(造成事業)이 촉진(促進)될 수 있다. 이러한 관점(觀點)에서 외국(外國)에서는 19세기말(世紀末)부터 산림보험제도(山林保險制度)가 실시(實施)되기 시작(始作)하여 주요(主要) 임업선진국(林業先進國)에서는 모두 산림보험(山林保險)을 실시(實施)하고 있는 것이다. 산림보험(山林保險)을 실시(實施)하는데 있어서 가장 중요(重要)한 것은 장기간(長期間)에 걸친 산림재해(山林災害)의 통계자료(統計資料)를 정확(正確)히 조사(調査)하는 일과 그 나라의 여건(與件)에 맞는 산림보험제도(山林保險制度)를 창설(創設)하는 일이다. 과거(過去) 10년간(年間)(1961~1970)의 년평균(年平均) 산림재해상황(山林災害狀況)을 조사(調査)한 결과(結果)는 산림화재(山林火災)가 9,000여정보(餘町步), 곤충피해(昆蟲被害)가 570,000정보(町步), 병균피해(病菌被害)가 694정보(町步)로 나타났다. 특(特)히 그중 외국(外國)의 산림보험(山林保險)에서 재해보상(災害補償) 대상(對象)의 으뜸이 되고 있는 산림화재(山林火災) 피해상황(被害狀況)을 과거(過去) 18년간(年間)(1953~1970)에 걸쳐서 조사(調査)한 결과(結果)에 의하면 산화면적(山火面積) 위험율(危險率)이 $\frac{1.1853}{1,000}$였고 1960~1969년(年) 사이의 전국(全國) 산림화재면적(山林火災面積) 위험율(危險率)은 $\frac{1.3045}{1,000}$로서 유우럽에 비(比)하여 높았으나 일본(日本)에 비(比)하여 그리 높지 않았다. 또 과거(過去) 5년간(年間)(1966~1970)의 전국(全國)의 산화재적(山火材積) 위험율(危險率)은 $\frac{0.1991}{1,000}$로서 대단(大端)히 낮은데 이것은 우리나라 산림(山林)의 축적(蓄積)이 빈약(貧弱)한데서 온 결과(結果)였다. 이러한 산림재해상황(山林災害狀況)에 비추어 우리나라에서 산림보험(山林保險)을 실시(實施)하려면 어떠한 내용(內容)의 산림보험제도(山林保險制度)를 설립(設立)하는 것이 좋겠는가 하는 질문조사(質問調査)의 결과(結果)는 다음과 같았다. 1. 산림보험(山林保險)의 필요성(必要性) 산림보험(山林保險)은 산림담보(山林擔保)에 의(依)한 금융(金融)의 길을 열어주고(5.65%), 산림피해(山林被害)를 당(當)하였을 때 재조림비(再造林費)를 확보(確保)하게 하여(35.87%), 조림투자(造林投資)를 보증(保證)하는 수단(手段)(46.74%)으로 반드시 실시(實施)되어야 한다고 응답(應答)하였다. 2. 산림보험법(山林保險法) 산림(山林)의 특수성(特殊性)에 비추어 일반(一般) 손해보험(損害保險) 규정(規程)을 준용(準用)할 것이 아니라(8.35%), 산림보험(山林保險)을 위한 특별볍(特別法)을 제정(制定)하여야 한다고 응답(應答)하였다(88.26%). 3. 보험경영업체(保險經營業體)의 종류(種類) 일반(一般) 보험회사(保險會社)(17.42%)나 산림소유자(山林所有者) 상호조합(相互組合)(23.53%)에서 산림보험(山林保險)을 취급(取扱)할 수도 있겠으나, 산림보험(山林保險)의 특이성(特異性)에 비추어 국(國) 공영산림보험(公營山林保險)의 별도(別途)로 운영(運營)되어야 한다고 반응(反應)하였다(56.18%). 4. 보험사고(保險事故)의 종류(種類) 산림보험(山林保險) 사고(事故)를 산화(山火)에 국한(局限)시키거나(23.38%), 산화(山火) 및 기상해(氣象害)만을 포함(包含)시키면 된다는 의견(意見)도 있으나(14.32%), 산림보험(山林保險) 사고(事故)에 산화(山火), 기상해(氣象害), 병충해(病蟲害)까지 포함(包含)시켜야 한다는 의견(意見)이 가장 많았다(60.68%). 5. 보험사고(保險事故) 취급대상(取扱對象)의 종류(種類) 산림보험(山林보험) 취급대상(取扱對象) 수종(樹種)은 침엽수(針葉樹) 인공림(人工林)에 한정(限定)시키거나(13.47%), 침엽수(針葉樹)와 활엽수(濶葉樹)의 인공림(人工林)만을 포함(包含)시키기를 원(願)하는 반응자(反應者)도 있었으나(23.74%), 많은 반응자(反應者)가 수종(樹種), 임종(林種)(인공(人工), 천연(天然)) 구별(區別)없이 모두 포함(包含)시켜야 된다고 반응(反應)하였다(61.64%). 6. 보험사고(保險事故) 취급대상(取扱對象)의 범위(範圍) 산림보험(山林保險) 사고(事故) 취급대상(取扱對象) 범위(範圍)는 10년(年) 이하(以下)의 유령림(幼齡林)만 취급(取扱)하기를 원(願)하는 자(者)(15.23%), 20년(年) 이하(以下)의 임목(林木)만을 대상(對象)으로 하면 족(足)하다는 반응자(反應者)가 있었으나(32.95%), 많은 반응자(反應者)가 40년생(年生) 이하(以下)의 임목(林木)까지 포함(包含)하기를 바라고 있었다(46.37%). 7. 보험계약(保險契約) 기간(期間) 산림보험(山林保險) 계약기간(契約期間)은 1년(年) 단위(單位)가 좋다는 자(者)도 상당(相當)히 있었으나(31.74%), 과반수(過半數)가 5년(年) 단위(單位)로 계약(契約)하는 것을 바라고 있었다(58.68%). 8. 보험계약(保險契約)의 제한(制限) 5정보(町步) 미만(未滿)의 소면적(小面積)은 산림보험(山林保險) 대상(對象)에서 제외(除外)하고(20.78%), 단위(單位) 면적당(面積當) 일정(一定) 재적(材積) 또는 주수(株數)를 보유(保有)하고 있는 산림(山林)만을 계약대상(契約對象)으로 하는 것이 좋다고 반응(反應)하였다(63.77%). 9. 계약방법(契約方法) 산림보험(山林保險) 계약방법(契約方法)은 임의(任意)로 산림(山林)을 선택(選擇)하여 계약(契約)하기를 원(願)하는 자(者)(32.13%), 임의(任意)로 계약(契約)하되 소유산림(所有山林) 전체(全體)를 일괄(一括) 계약(契約)하도록 하는 방법(方法)을 택(擇)하여야 한다는 자(者)(33.48%), 특정임지(特定林地)(신식지(新植地), 보조조림지(補助造林地), 고가임지(高價林地))는 의무적(義務的)으로 계약(契約)하도록 하여야 한다는 반응자(反應者)(31.92%)로 나타나 비슷한 반응(反應)을 보였다. 10. 보험료율(保險料率) 산림보험(山林保險) 요율(料率)은 지역(地域)에 따르는 위험정도(危險程度)를 참작(參酌)하여 면적비례(面積比例)로 결정(決定)하여야 한다는 의견(意見)(31.59%)과 지역(地域) 위험율(危險率)을 참작(參酌)하여 보험가액(保險價額)에 따라 정(定)해야 한다는 의견(意見)이 있었으나(31.59%), 우리 나라에는 지역적(地域的) 위험율(危險率)에 큰 차이(差異)가 없을 것이므로 전국(全國) 일률적(一律的)인 보험료(保險料)를 보험가액(保險價額)에 따라 정(定)하기를 원(願)하는 경향(傾向)이 높았다(39.55%). 11. 보험료(保險料)의 납부(納付) 산림보험료(山林保險料)는 단기(短期)는 일시불(一時拂), 장기(長期)는 매년(每年) 납부(納付)하게 하는 의견(意見)도 있으나(13.80%), 단기(短期)는 고율(高率), 장기(長期)는 저율(低率)로 하되 단기(短期), 장기(長期)를 막론(莫論)하고 매년(每年) 납부(納付)하도록 하여야 한다고 반응(反應)하였다(86.71%). 12. 보험사무(保險事務) 취급기관(取扱機關) 산림보험(山林保險) 사무(事務)의 취급(取扱) 즉(即) 창구업무(窓口業務)의 취급(取扱)을 산림행정기관(山林行政機關)에 위탁(委託)하거나(18.75%), 일반(一般) 보험회사(保險會社)에 맡기기보다는(35.76%) 산림조합(山林組合)에 위탁(委託) 취급(取扱)하게 하고 보험료(保險料)의 일정율(一定率)을 환부(還付)해주는 것이 좋다고 반응(反應)하였다(44.22%). 13. 손해보상(損害補償)의 한도(限度) 산림보험(山林保險)의 손해보상(損害補償)은 유령림(幼齡林)이 피해(被害)를 입었을 때에는 재조림비(再造林費)를 한도(限度)로 하여 보상(補償)하는 것을 원칙(原則)으로 하고 성림(成林)의 경우(境遇)에는 손해액(損害額)의 80%정도(程度)를 한도(限度)로 하여 보상(補償)하기 보다는(29.70%) 실손(實損) 현재가액(現在價額)을 보상(補償)하거나(31.07%) 조림비(造林費)의 복리계산(複利計算) 합계액(合計額)을 보상(補償)하는 것을 바라고 있었다(36.99%). 14. 보험기금(保險基金)의 조성(造成) 산림보험(山林保險)의 기금조성(基金造成)은 손해(損害) 보상액(補償額)에서 일정액(一定額)을 공제(控除) 적립(積立)하여 조성(造成)하거나(15.65%), 임야세(林野稅)를 신설(新設)하여 기금(基金)을 확보(確保)하기 보다는(33.79%), 산림보험(山林保險) 무사고(無事故)로 인(因)한 잉여금(剩餘金)에서 일정액(一定額)씩을 적립(積立)하여 산림보험기금(山林保險基金)으로 하자는 의견(意見)에 많은 반응(反應)을 하였다(44.81%). 15. 산화(山火)의 원인(原因) 산림관계직(山林關係職)에 종사(從事)하고 있는 사람들의 과거(過去)의 경험(經驗)에 비추어 본 우리나라 산화(山火)의 주요원인(主要原因)은 실화(失火)(원인불명(原因不明), 32.39%), 담배불(28.89%), 화전(火田)(19.85%)에 의한 것으로 나타났는데 산림통계(山林統計)에 나타나 있는 산화(山火)의 주요원인(主要原因)과 일치(一致)하였다. 16. 산화경방(山火警防) 산림화재(山林火災) 경방조치(警防措置)로서 가장 중요(重要)하고 실효성(實効性)이 있으며 실천(實踐)할 수 있는 삼대대책(三大對策)으로는 (1) 방화선(防火線) 설치(設置)(23.84%), (2) 건조기(乾燥期)의 입산금지(入山禁止)(21.10%), (3) 메스콤에 의한 계몽교육(啓蒙敎育)(18.01%)이라고 반응(反應)하였다.

  • PDF

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.