• 제목/요약/키워드: Classification accuracy

검색결과 3,065건 처리시간 0.028초

KOSDAQ 시장의 관리종목 지정 탐지 모형 개발 (Development of a Detection Model for the Companies Designated as Administrative Issue in KOSDAQ Market)

  • 신동인;곽기영
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.157-176
    • /
    • 2018
  • 관리종목은 상장폐지 가능성이 높은 기업들을 즉시 퇴출하기 보다는 시장 안에서 일정한 제약을 부여하고, 그러한 기업들에게 상장폐지 사유를 극복할 수 있는 시간적 기회를 주는 제도이다. 뿐만 아니라 이를 투자자 및 시장참여자들에게 공시하여 투자의사결정에 주의를 환기시키는 역할을 한다. 기업의 부실화로 인한 부도 예측에 관한 연구는 많이 있으나, 부실화 가능성이 높은 기업에 대한 사회, 경제적 경보체계라 할 수 있는 관리종목에 관한 연구는 상대적으로 매우 부족하다. 이에 본 연구는 코스닥 기업들 가운데 관리종목 지정 기업과 비관리종목 기업을 표본으로 삼아 로지스틱 회귀분석과 의사결정나무 분석을 이용하여 관리종목 지정 예측 모형을 개발하고 검증하였다. 분석결과에 따르면 로지스틱 회귀분석 모형은 ROE(세전계속사업이익), 자기자본현금흐름률, 총자산회전율을 사용하여 관리종목 지정을 예측하였으며, 전체 평균 예측 정확도는 검증용 데이터셋에 대해 86%의 높은 성능을 보여주었다. 의사결정나무 모형은 현금흐름/총자산과 ROA(당기순이익)를 통한 분류규칙을 적용하여 약 87%의 예측 정확도를 보여주었다. 로지스틱 회귀분석 기반의 관리종목 탐지 모형의 경우 ROE(세전계속사업이익)와 같은 구체적인 관리종목 지정 사유를 반영하면서 기업의 활동성에 초점을 맞추어 관리종목 지정 경향성을 설명하는 반면, 의사결정 관리종목 탐지 모형은 기업의 현금흐름을 중심으로 하여 관리종목 지정을 예측하는 것으로 나타났다.

풍해 예측 결과 재분류를 통한 위험 감지확률의 개선 연구 (A Case Study: Improvement of Wind Risk Prediction by Reclassifying the Detection Results)

  • 김수옥;황규홍
    • 한국농림기상학회지
    • /
    • 제23권3호
    • /
    • pp.149-155
    • /
    • 2021
  • 농업기상재해 조기경보시스템에서는 일 최대순간 풍속에 과수의 낙과 피해 임계풍속을 대입하여 농작물의 풍해 위험을 예측, 자원농가에게 제공하고 있다. 강풍의 위험 예측확률을 높이기 위한 방법으로써, 기존 방식에서 '안전'으로 분류된 데이터들 중 실제로는 풍해위험이 있는 경우를 찾아내는 인공신경망 이항분류 기법을 도입하였다. 학습데이터는 전라남북도와 경북 및 경남 일부지역의 총 210개소 기상청 종관 및 방재기상관측지점에서 수집된 2019년 전체 일별 풍속자료이며, 최적 모델 도출을 위한 검증데이터는 동일지점의 2020년 1월 1일~12월 12일 자료를, 인공신경망 기법 사용 전/후의 풍해위험예측 성능 평가는 2020년 12월 13일~2021년 2월 18일까지의 자료를 사용하였다. 풍해위험 임계풍속은 과수의 낙과 피해기준으로 주로 사용되고 있는 11m/s를 설정하였다. 또한 2020년 동일 기간의 일 최대순간풍속 실측값으로 Weibull 분포를 작성한 후, 추정값과 임계풍속간의 편차를 이용하여 누적확률값을 계산, 풍해 경보에서 한 단계 낮은 주의보를 판단하고 인공신경망 기법 적용 결과와 비교하였다. 평가기간 중 기존의 풍해 위험 탐지확률은 65.36%였으나 인공신경망 기법으로 재분류 과정을 거친 후 93.62%로 크게 개선되었다. 반면, 오보율이 함께 증가되어(13.46% → 37.64%), 전반적인 정확도는 감소하였다. 한편 Weibull 분포를 이용하여 풍해주의보 구간을 두었을 때는 정확도 83.46%으로 인공신경망 기법에 비해 전반적인 예측 정확도는 더 높았던 반면 위험 탐지확률은 88.79%로 더 낮게 나타났다. 따라서, 상대적으로 위험예보의 미예측이 중대한 문제가 되는 사례에서 인공신경망 방식이 유용할 것으로 보인다.

토지피복지도를 활용한 IUCN 생태계유형분류 국내 적용 (A Study on the Application of IUCN Global Ecosystem Typology Using Land Cover Map in Korea)

  • 손희정;원수연;전정은;박은희;김도희;한상학;송영근
    • 한국환경생태학회지
    • /
    • 제37권3호
    • /
    • pp.209-220
    • /
    • 2023
  • 인간 활동으로 광범위한 자연 생태계 변화로 지난 몇 세기 동안 전 세계적으로 생물다양성이 심각하게 위협받고 있다. 생태계의 변화 양상을 파악하는 것은 생물다양성 위협을 파악하고 관리하는 데 필수적이다. 이러한 필요성에 따라 IUCN 의회는 2019년에 생태계의 기능과 유형을 고려한 IUCN Global Ecosystem Typology(GET)를 구성했다. IUCN은 10개의 생태계 군계, 108개의 생태기능별 토지 유형(EFG; Ecological Functional Group)을 전 지구적 범위에서 지도로 제공하고 있다. IUCN GET 생태계의 유형 분류에 따르면 국내 생태계는 Realm (1수준)이 8개, Biome (2수준)이 18개, Group (3수준)은 41개 유형으로 분류된다. IUCN이 제공하는 GET의 경우 전 세계 규모로 제작되었기 때문에 해상도가 낮고 실질적인 토지 현황과 일치하지 않는 경우가 많다. 본 연구는 토지피복지도를 활용하여 국내 IUCN GET 유형 분류의 정확도를 높이고 실질적인 현황을 반영한 지도를 제작하고자 했다. 이를 위해 ① IUCN GET에서 제공하는 국내 GET 데이터 체계를 검토하고, ② 이를 국내 현황과 비교 분석하였다. 이 과정을 통해 GET의 한계와 활용 가능성을 평가하고 ③ 이후 국가자료를 최대한 활용하여 국내 현황을 반영한 국내 GET 유형 분류를 수행하였다. 본 연구는 토지피복지도와 기존 국가자료를 최대한 활용하여 국내 GET를 총 25개 유형으로 분류했다(Terrestrial Realm :9, Freshwater: 9 Marine-Terrestrial: 5, Terrestrial-Freshwater :1, Marine-Freshwater-Terrestrial:1). 기존 지도와 비교했을 때 수정된 국내 GET의 경우 'F3.2 Constructed lacustrine wetlands', 'F3.3 Rice paddies', 'F3.4 Freshwater aquafarms', 'T7.3 Plantations'가 면적이 가장 많이 축소되었다. 온대 산림(T2.2)의 면적이 가장 많이 늘어났고, 'MFT1.3 Coastal saltmarshes and reedbeds', 'F2.2 Small permanent freshwater lakes'등 3개 유형 또한 수정 후 GET 면적이 증가했다. 해당 과정을 통해 기존 GET에서 모든 EFG의 합이 국토 면적의 8.33배를 차지하던 기존의 지도를, 토지피복지도를 활용하여 총합이 국토 면적의 1.22 배가 되도록 수정하였다. 이를 통해 유형별 차이가 작고 정확성이 떨어진 기존의 EFG가 본 연구를 통해 개선 및 수정되었음을 확인하였다. 본 연구는 현장 요건을 반영한 데이터를 최대한 활용하여 GET 기준에 상응하는 한국의 GET 지도를 제작한 것에 그 의의가 있다.

무인기 기반 RGB 영상 활용 U-Net을 이용한 수수 재배지 분할 (Sorghum Field Segmentation with U-Net from UAV RGB)

  • 박기수;유찬석;강예성;김은리;정종찬;박진기
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.521-535
    • /
    • 2023
  • 논·밭 전환 시 수수(sorghum bicolor L. Moench)는 뛰어난 내습성으로 콩과 함께 안정적인 생산이 가능하여 국내 식량작물의 자급률 향상과 쌀 수급 불균형 문제를 해결할 수 있을 것으로 기대되는 작물이다. 그러나 수량 추정을 위한 재배면적과 같은 기본적인 통계조사는 많은 인력을 투입하여도 오래 걸리는 전통적인 조사 방식으로 인해 잘 이루어 지지 않고 있다. 이에 따라 본 연구에서는 무인기 기반 RGB 영상에 U-Net을 적용하여 수수 재배지 비파괴적 분할가능성을 확인하였다. 2022년에 7월 28일, 8월 13일, 8월 25일에 각각 영상이 취득되었다. 각 영상취득 날짜에서 512 × 512 영상크기로 훈련데이터셋 6,000장과 검증데이터셋 1,000장으로 나누어 학습을 진행하였으며 수수 농경지(sorghum), 벼와 콩 농경지(others)와 비 농경지(background)로 구성된 세 개 클래스와 수수 농경지와 배경(others+background)으로 구성된 두 개 클래스 기반으로 분류모델을 개발하였다. 모든 취득 날짜에서 세 개 클래스 기반 모델에서는 수수 재배지 분류 정확도가 0.91 이상으로 나타났지만 8월 데이터셋의 others 클래스에서 학습 혼동이 일어났다. 대조적으로 두 개 클래스 기반 모델에서는 8월 데이터셋의 안정적인 학습과 함께 모든 클래스에서 0.95 이상의 정확도를 나타내었다. 결과적으로 8월에 두개클래스 기반 모델을 현장에 재현하는 것이 수수 재배지 분류를 통한 재배면적 산출에 유리할 것으로 판단된다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

덕유산 국립공원 삼림식생에 관한 연구 (A Study on the Forest Vegetation of Deogyusan National Park)

  • 김창환;오장근;이남숙
    • 생태와환경
    • /
    • 제46권1호
    • /
    • pp.33-40
    • /
    • 2013
  • 본 연구는 2012년 3월부터 2013년 1월까지 국립공원 자원모니터링 기본조사 자료의 활용성을 높이고 국립공원 관리의 효율성을 향상시키기 위한 고축척 식생전자지도 필요성에 따라 1/5,000 축척의 생태자연도 정밀화 사업의 일환으로 수행되어졌다. 식생조사의 정확성 및 신속성을 위하여 식생조사용 DB를 활엽수림, 침엽수림, 혼효림, 암벽식생, 기타식생으로 분류한 후 식생조사용 식생도를 제작하여 현지조사에 사용하였다. 식생조사식용 DB 구축 결과와 식생조사 결과를 반영한 식생도 구축 결과는 활엽수림이 77.20%, 78.45%로 거의 같았으며, 침엽수림 (16.70%, 13.41%), 혼효림 (9.50%, 7.49%), 암벽식생(0.60%, 0.15%) 분포비율의 차이가 크지 않았다. 식생조사 결과가 반영된 정밀식생도 중 식생 상관 대분류에서 나타난 식생유형은 산지낙엽활엽수림이 전체의 65.78%를 차지하고 있어 가장 넓은 분포역을 나타내고 있었으며, 산지습성림(15.17%), 산지침엽수림(10.90%), 식재림(7.00%) 순으로 분포비율이 높았다. 특히 수령이 50년 이상의 장령림, 극상림, 특이식생, 아고산대식생 등 매우 양호한 식생유형을 보이는 식생보전등급 I등급 지역의 비율이 약 20% 비율로 분포하고 있는것은 덕유산의 삼림식생이 매우 안정적이고 다양하다는 것을 암시한다. 결론적으로 현재 우리나라 17개 육상국립공원에 대한 식생연구는 식물군락과 관련된 조사는 비교적 상세하게 연구되어 왔으나 식생도 관련 연구는 매우 미흡한 실정이다. 이러한 이유는 현존식생에 대한 식생도는 1 : 25,000의 소축적 지형도에 주로 의존하여 조사가 이루어져 왔기 때문에 식물군락의 경계가 불확실하여 식생도에 대한 신뢰성이 높지 않았을 뿐만 아니라 식생조사용 식생도를 제작하지 않고 임상도, 항공사진 등을 참고하여 조사가 이뤄져왔기 때문이다. 본 연구는 이러한 경계불확실성을 최소화하기 위해 고해상도 영상자료 등 많은 자료를 참고하여 식생조사용 식생도면을 제작한 후 덕유산내에 분포하는 식생의 상관식생도면 및 식생보전가치평가도면을 작성하였다. 따라서 기존에 발표되었던 덕유산 식생도 관련 연구(Kim, 1991; Korea National Park Service, 2004)에 비해 크게 보완 향상된 결과를 도출하였다.

오대산국립공원 삼림식생에 관한 연구 (A Study on the Forest Vegetation of Odaesan National Park, Korea)

  • 김창환;오장근;이남숙;최영은;송명준
    • 생태와환경
    • /
    • 제48권1호
    • /
    • pp.61-67
    • /
    • 2015
  • 본 연구의 결과 식생조사용 DB 구축 결과와 식생조사 결과를 반영한 식생도 구축 결과는 활엽수림이 71.965%, 71.184%로 거의 같았으며, 침엽수림(16.010%, 15.747%), 혼효림(10.619%, 12.085%), 암벽식생(0.015%, 0.002%) 분포비율의 차이가 크지 않았다. 식생조사 결과가 반영된 정밀식생도 중 식생 상관대분류에서 나타난 식생유형은 산지낙엽활엽수림이 전체의 60.096%를 차지하고 있어 가장 넓은 분포역을 나타내고 있었으며, 산지침엽수림 (16.332%), 산지습성림 (15.887%), 식재림 (3.558%) 순으로 분포비율이 높았다. 국립공원내에서 평가된 식생보전등급은 I등급과 II등급 지역이 각각 61.80%, 33.55%로써 전체 면적의 95.35%로써 생태자연도 1등급 지역에 속하는 높은 식생보전가치를 지니고 있는 것으로 분석되었다. 특히 극상림, 특이식생, 아고산대식생 등 I등급 지역의 분포비율이 높은 것은 다양한 기질특성, 높은 고도, 낮은 인위적 교란의 정도, 산의 정상부 능선지역에 형성된 아고산대식생과 기후적 지형적 특성을 반영한 식생을 형성하고 있기 때문인 것으로 보인다.

비용효율적 지능형 침입탐지시스템 구현을 위한 유전자 알고리즘 기반 통합 모형 (An Integrated Model based on Genetic Algorithms for Implementing Cost-Effective Intelligent Intrusion Detection Systems)

  • 이현욱;김지훈;안현철
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.125-141
    • /
    • 2012
  • 본 연구는 최근 그 중요성이 한층 높아지고 있는 침입탐지시스템(IDS, Intrusion Detection System)의 침입탐지모형을 개선하기 위한 방안으로 유전자 알고리즘에 기반한 새로운 통합모형을 제시한다. 본 연구의 제안모형은 서로 상호보완적 관계에 있는 이분류 모형인 로지스틱 회귀분석(LOGIT, Logistic Regression), 의사결정나무(DT, Decision Tree), 인공신경망 (ANN, Artificial Neural Network), 그리고 SVM(Support Vector Machine)의 예측결과에 적절한 가중치를 부여해 최종 예측결과를 산출하도록 하였는데, 이 때 최적 가중치의 탐색을 위한 방법으로는 유전자 알고리즘을 사용한다. 아울러, 본 연구에서는 1차적으로 오탐지율을 최소화하는 최적의 모형을 산출한 뒤, 이어 비대칭 오류비용 개념을 반영해 오탐지로 인해 발생할 수 있는 전체 비용을 최소화할 수 있는 최적 임계치를 탐색, 최종적으로 가장 비용 효율적인 침입탐지모형을 도출하고자 하였다. 본 연구에서는 제안모형의 우수성을 확인하기 위해, 국내 한 공공기관의 보안센서로부터 수집된 로그 데이터를 바탕으로 실증 분석을 수행하였다. 그 결과, 본 연구에서 제안한 유전자 알고리즘 기반 통합모형이 인공신경망이나 SVM만으로 구성된 단일모형에 비해 학습용과 검증용 데이터셋 모두에서 더 우수한 탐지율을 보임을 확인할 수 있었다. 비대칭 오류비용을 고려한 전체 비용의 관점에서도 단일모형으로 된 비교모형에 비해 본 연구의 제안모형이 더 낮은 비용을 나타냄을 확인할 수 있었다. 이렇게 실증적으로 그 효과가 검증된 본 연구의 제안 모형은 앞으로 보다 지능화된 침입탐지시스템을 개발하는데 유용하게 활용될 수 있을 것으로 기대된다.

시계열 고해상도 항공영상을 이용한 소나무재선충병 감염목 탐지 - 강원대학교 학술림 일원을 대상으로 - (Detection of Pine Wilt Disease tree Using High Resolution Aerial Photographs - A Case Study of Kangwon National University Research Forest -)

  • 박정묵;최인규;이정수
    • 한국지리정보학회지
    • /
    • 제22권2호
    • /
    • pp.36-49
    • /
    • 2019
  • 본 연구는 강원대학교 학술림을 대상으로 현장조사 기반(Field Survey Based)에 의한 감염목(FSB_감염목)과 객체분류기반(Object Classification Based)에 의한 감염목(OCB_감염목)을 추출하고 감염목에 대한 공간적 분포특성 및 발생강도 평가를 목적으로 하였다. OCB 최적 가중치는 Scale 11, Shape 0.1, Color 0.9, Compactness 0.9, Smoothness 0.1로 선정되었으며, 전체 분류정확도는 약 94%, Kappa 계수는 0.88로 매우 높았다. OCB_감염목 지역은 약 2.4ha로 전체 면적의 약 0.05% 발생하였다. OCB_감염목와 FSB_감염목의 임분구조 분포특성 및 지형 지리적 요인을 비교 하면, OCB_감염목 영급은 IV영급의 분포비율이 약 44%로 가장 높았으며, FSB_감염목의 영급도 IV영급의 분포비율이 약 55%로 가장 높았다. OCB_감염목의 IV영급 비율은 FSB_감염목보다 약 11% 낮았다. OCB_감염목 경급은 소경목과 중경목이 약 93%로 대부분을 차지한 반면, FSB_감염목 경급은 중경목과 대경목이 약 87%로 전체 대상지의 경급 분포와 상이하였다. 한편, OCB_감염목 표고 분포비율은 401-500m에서 약 30%로 가장 높은 반면, FSB_감염목은 301-400m에서 약 45%로 상이하였으며, 임도로부터 접근성 분포 비율은 OCB_감염목과 FSB_감염목 모두 100m이하에서 각각 약 24%와 31%로 가장 높아 임도로부터 접근성이 높을수록 감염목이 높았다. OCB_감염목 핫스팟은 31임반과 32임반으로 영급과 경급이 높은 지역에서 높게 분포하였다.