• 제목/요약/키워드: Machine Accuracy

검색결과 3,157건 처리시간 0.03초

DeNERT: Named Entity Recognition Model using DQN and BERT

  • Yang, Sung-Min;Jeong, Ok-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.29-35
    • /
    • 2020
  • 본 논문에서는 새로운 구조의 개체명 인식 DeNERT 모델을 제안한다. 최근 자연어처리 분야는 방대한 양의 말뭉치로 사전 학습된 언어 표현 모델을 활용하는 연구가 활발하다. 특히 자연어처리 분야 중 하나인 개체명인식은 대부분 지도학습 방식을 사용하는데, 충분히 많은 양의 학습 데이터 세트와 학습 연산량이 필요하다는 단점이 있다. 강화학습은 초기 데이터 없이 시행착오 경험을 통해 학습하는 방식으로 다른 기계학습 방법론보다 조금 더 사람이 학습하는 과정에 가까운 알고리즘으로 아직 자연어처리 분야에는 많이 적용되지 않은 분야이다. 아타리 게임이나 알파고 등 시뮬레이션 가능한 게임 환경에서 많이 사용된다. BERT는 대량의 말뭉치와 연산량으로 학습된 구글에서 개발한 범용 언어 모델이다. 최근 자연어 처리 연구 분야에서 높은 성능을 보이고 있는 언어 모델이며 많은 자연어처리 하위분야에서도 높은 정확도를 나타낸다. 본 논문에서는 이러한 DQN, BERT 두가지 딥러닝 모델을 이용한 새로운 구조의 개체명 인식 DeNERT 모델을 제안한다. 제안하는 모델은 범용 언어 모델의 장점인 언어 표현력을 기반으로 강화학습 모델의 학습 환경을 만드는 방법으로 학습된다. 이러한 방식으로 학습된 DeNERT 모델은 적은 양의 학습 데이터세트로 더욱 빠른 추론시간과 높은 성능을 갖는 모델이다. 마지막으로 제안하는 모델의 개체명 인식 성능평가를 위해 실험을 통해서 검증한다.

환자의 주관적 증상 텍스트에 대한 진료과목 분류 모델 구축 (Classification Modeling for Predicting Medical Subjects using Patients' Subjective Symptom Text)

  • 이서희;강주영
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.51-62
    • /
    • 2021
  • 의료 인공지능 분야에서 의사의 판단에 도움을 줄 수 있는 질환 예측 및 분류 알고리즘에 대해선 많은 연구가 이뤄져왔지만, 의료 소비자의 정보 획득과 판단에 도움을 줄 수 있는 인공지능에 대해선 상대적으로 관심이 적다. 네이버 지식인에 지난 1년 간 자신의 증상엔 어떤 병원을 가야할 지 질문하는 질문 건수만 해도 15만 건이 넘는다는 사실은 의료소비자들에게 적합한 의료정보의 제공이 필요하다는 반증이기도 하다. 따라서 본 연구에선 의료소비자들이 자신의 증상에 대한 진료과목을 선택하는데 도움을 줄 수 있도록 네이버 지식인에서 환자들이 직접 서술한 증상 텍스트를 수집하여 8개 진료과목을 분류하는 분류모델을 구축했다. 우선 환자의 주관이 개입된 데이터의 타당성과 객관성을 확보하기 위해 객관적 증상 텍스트(서울응급의료 정보센터에서 정리한 진료과목 별 주요 질환 증상)와 주관적 증상 텍스트(지식인 데이터) 간 유사도 측정을 수행하였다. 유사도 측정 결과, 두 텍스트가 동일한 진료과목의 증상일 경우 상이한 진료과목의 증상 텍스트에 비해 상대적으로 높은 유사성을 가진다는 것을 입증했다. 상기 절차를 따라 타당성을 확보한 주관적 증상 텍스트를 대상으로 릿지회귀모델을 사용하여 분류모델을 구축한 결과 0.73의 정확도를 확보할 수 있었다.

표준유역단위 한계강우량 산정에 관한 연구 (A Study on the Estimation of the Threshold Rainfall in Standard Watershed Units)

  • 추경수;강동호;김병식
    • 한국방재안전학회논문집
    • /
    • 제14권2호
    • /
    • pp.1-11
    • /
    • 2021
  • 최근 우리나라에서는 기후변화로 인하여 기상재해의 위험성이 증가하고 있고 특히 강우로 인한 피해가 계속해서 강조되고 있다. 현재의 기상예보가 정량적 강우를 제시해주지만 피해 정도를 예상하는 데에는 여러 가지 어려움이 존재한다. 그래서 피해에 따른 영향을 파악하기 위해서는 유역별 한계강우량이 필요하다. 강우로 인한 피해는 지역별로 상이하게 일어나고 있고 각 유역의 특성인자가 고려된 분석은 한계가 존재한다. 또한 강우가 올 때마다 수문모델을 통한 강유-유출분석에는 시간이 많이 소모되고 단순 강우 데이터만 사용하여 분석되는 경우가 많다. 본 연구는 GIS데이터를 이용하였고 2개의 수문모델을 커플링하여 침수를 유발하는 한계유출량으로부터 한계강우량을 산정하였다. 산정결과는 실제사례와 비교하여 결과를 검증하였고 대체로 위험지역에 대해 피해가 난 것으로 분석되었다. 향후 본 연구를 통해 사전에 침수위험지역에 대해 대비를 할 수 있을 것이고 머신러닝 분석방법을 추가한다면 정확도가 높아질 것으로 예상된다.

미래교육 혁신을 위한 트렌드 분석과 예측: 20년간의 문헌 연구 데이터를 기반으로 한 키워드 추출 분석을 중심으로 (Analysis and Prediction of Trends for Future Education Reform Centering on the Keyword Extraction from the Research for the Last Two Decades)

  • 조헌국
    • 과학교육연구지
    • /
    • 제45권2호
    • /
    • pp.156-171
    • /
    • 2021
  • 본 연구는 미래 교육에 관련된 선행 연구를 분석하여 그 시기별 변화의 특징을 파악하고, 최근 나타나는 뉴스 기사를 비교하여 미래 교육에 대한 예측과 전망이 얼마나 일치하는지 비교 분석함으로써 교육을 위한 예측 모형 수립을 위한 시사점을 제공하고자 하였다. 이에 Web of Science를 통해 미래교육을 키워드로 포함한 국제전문학술지의 1,222건의 학술논문의 상세 서지정보를 수집하였고, 이를 2000년대부터 5년 단위로 4개의 시기로 구분하여 각 시기별 키워드를 추출하였다. 또한 최근 1년간 발간된 뉴스를 토대로 키워드를 추출하고 두 결과를 비교하여 얼마나 예측한 결과가 일치하는지 살펴보았다. 연구 결과, 문헌 조사 결과를 통한 키워드는 교사 교육을 제외하면 공통적으로 나타나는 주제나 경향성을 발견하기 어려웠으며 교육과정, 학습자 특성, 협동학습, 컴퓨터 기반 학습 등 교육과정과 내용, 방법, 환경 등 전반을 제시하고 있었다. 이에 반해 뉴스를 통해 도출된 키워드는 혁신학교나 미래교육센터 등 정부의 주요 추진 정책이나 코로나19와 관련된 키워드들이 부각되어 나타났다. 또한 온라인 플랫폼이나 콘텐츠 개발, 클라우드, 빅데이터, 개별학습 등 교육환경과 방법에 초점이 맞춰지고 있음을 파악할 수 있다. 뉴스를 통해 나타나는 키워드를 살펴보면 장기적인 예측을 통해 나타난 키워드는 거의 없었고, 최근 5년 내에 제시되었던 단기적인 내용들이나 최근 5년에서도 언급되지 않는 새로운 주제들을 다루고 있었다. 이는 미래 교육에 대한 예측과 망에 대한 모형이 실제 중장기적 예측에서는 여러 요인의 불확실성으로 인해 정확성을 기대하기 어렵다는 점을 의미한다. 이에 본 연구에서는 미래 교육 예측을 위해 필요한 과제와 방향에 대해 시사점으로 제시하였다.

인공신경망을 이용한 주택가격지수 예측 (Prediction of Housing Price Index Using Artificial Neural Network)

  • 이지영;유재필
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.228-234
    • /
    • 2021
  • 부동산의 시장 참여자들에게 부동산 가격에 대한 방향성을 예측하는 것은 의사결정에 있어서 매우 중요하다. 이를 위해 주로 회귀분석, ARIMA, VAR 등의 방법론을 사용하는데 이는 불특정 변수에 의해서 변동하는 자산의 가치를 예측하는데 한계점을 갖는다. 때문에 본 연구에서는 이를 보완하기 위해서 인공신경망 기법을 이용해 부동산 시장에서 유동성이 풍부한 서울 아파트 가격 추이를 예측하고자 한다. 인공신경망 학습을 위해서 총 12개의 거시 및 미시적 변수를 나눠 학습 모형을 설계하는데 거시적 요인은 CASE1, 미시적 요인은 CASE2 그리고 두 요인을 조합해서 요인을 구성한 CASE3 으로 나눠서 실험한다. 그 결과 CASE1 과 CASE2 는 약 2년 동안 87.5%의 예측을 보이고 CASE3은 95.8%의 예측성과를 보인다. 본 연구는 아파트 가격에 영향을 주는 다양한 요인들을 거시적 및 미시적으로 구분하여 정의하고 미래의 아파트 가격의 방향성을 예측하는데 인공신경망 기법을 제안하고 그 실효성을 분석했다. 따라서 최근 발전하고 있는 학습 기법이 부동산 분야에 다양한 관점으로 적용되어 시장 참여자들의 효율적인 의사결정을 할 수 있기를 기대한다.

쉴드 TBM 굴진 주요 영향인자분석 및 굴진율 예측모델 제시 (Study on the effective parameters and a prediction model of the shield TBM performance)

  • 조선아;김경열;류희환;조계춘
    • 한국터널지하공간학회 논문집
    • /
    • 제21권3호
    • /
    • pp.347-362
    • /
    • 2019
  • 도심지 터널 공사가 많아지면서 이에 따른 소음, 진동, 교통불편 및 민원 저감을 위해 TBM 굴착이 증가하고 있다. 그러나 이러한 추세에도 불구하고 국내 TBM 공동구 설계 및 시공을 위한 기준들은 대부분 해외기술(일본, 독일 등)을 이용하고 있어 국내환경을 고려하지 못하고 있다. 특히, 공동구 TBM 설계의 주요 기준이 되는 굴진율은 대부분 일축압축강도만으로 산정되며 이마저도 실제 현장 특성과 맞지 않아 개선이 필요하다. 본 연구에서는 국내 현장에 적합한 굴진율을 예측하기 위해 수행되었다. 이를 위해 시공 중인 소단면 쉴드 TBM 굴착 현장의 지반 및 굴진데이터를 수집하고 상관관계 분석을 통해 굴진율에 영향을 미치는 주요인자를 파악하였다. 도출된 영향인자들은 통계적 분석기법을 기반으로 한 다중선형 회귀분석에 적용되어 굴진율을 예측하는 회귀식의 예측변수로 이용되었다. 결과적으로 회귀분석을 통해 도출된 회귀식은 일축압축강도와 절리간격을 예측변수로 추정되었으며, 해외 경험식과 비교하여 국내현장 굴진율의 예측 정확도가 높은 것으로 나타났다. 다만, 이 회귀식을 타 국내 현장에 적용할 경우 예측오차가 다소 증가하였다. 회귀식이 갖는 이와 같은 적용 한계를 개선하기 위해서는 추가적인 연구를 통해 현장조건에 제약을 받지 않는 굴진율 예측모델 도출이 필요할 것으로 보인다.

수입식품 빅데이터를 이용한 부적합식품 탐지 시스템에 관한 연구 (Study on Anomaly Detection Method of Improper Foods using Import Food Big data)

  • 조상구;최경현
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.19-33
    • /
    • 2018
  • FTA체결의 증가, 식품교역 증가 및 소비자의 다양한 식품 선호도 등으로 농축수산물 및 가공식품의 수입량은 매년 증가하고 있는 추세이다. 수입식품의 안전성을 확인하는 정밀검사는 전체 수입식품건수 대비 20%정도를 차지하고 계속 증가하고 있는 반면에 정부의 수입안전관리에 필요한 예산과 인력은 그 한계점에 다다르고 있다. 수입식품 안전사고가 발생하게 되면 막대한 사회적, 경제적 손실을 야기할 수 있으므로 수입식품의 수입허용여부를 정확하게 예측하여 선제 대응하는 것은 수입안전관리의 효율성과 경제성을 획기적으로 높일 수 있게 된다. 식품분야에서는 이미 엄청난 양의 정형 데이터가 과거로부터 쌓여 왔으며 이에 대한 충분한 분석을 통한 활용은 아직은 부족한 것이 현실이다. 전체 수입건수와 중량 중에서 차지하는 가공식품의 비중은 평균 75%에 달하고 있어 식품분야에서도 빅데이터의 분석, 분석기법의 적용 등으로 다량의 데이터로부터 의미 있는 정보를 추출하는 과학적이고 자동화된 부적합탐지시스템의 연구가 절실한 상황이다. 이러한 배경에서 본 연구는 기계학습분야의 다양한 부적합 예측 모형을 적용하였으며 예측 모형의 정확도를 개선시키기 위한 방편으로 새로운 파생변수의 생성을 통한 데이터 전처리 방안을 제시하였다. 또한 본 연구에서는 기계학습분야의 일반적인 기저 분류기를 적용하여 예측 모형의 성능을 비교하였으며 여러 기저분류기 중 Gaussian Naïve Bayes예측 모형이 수입식품의 부적합을 탐지하여 예측하는 가장 좋은 성과를 보여주었다. 향후 Gaussian Naïve Bayes 예측 모형을 이용한 부적합 탐지 모형을 적용하여 수입식품의 정밀검사 비중을 낮추고 부적합률을 제고시킴으로써 수입안전관리 국가사무의 효율성과 수입통관의 신속성에 지대한 효과를 거둘 수 있으리라 기대한다.

수목 동정을 위한 수피 분류 데이터셋 구축과 합성곱 신경망 기반 53개 수종의 동정 모델 개발 (Construction of a Bark Dataset for Automatic Tree Identification and Developing a Convolutional Neural Network-based Tree Species Identification Model)

  • 김태경;백규헌;김현석
    • 한국산림과학회지
    • /
    • 제110권2호
    • /
    • pp.155-164
    • /
    • 2021
  • 자연환경에 대한 국민들의 관심 증가로 스마트폰과 같은 휴대용 기기를 이용한 수목 동정의 자동화에 대한 요구가 증가하고 있다. 최근 딥러닝 기술의 발전에 힘입어, 외국에서는 수목 인식 분야에의 적용이 활발하게 이루어지고 있다. 수목의 분류를 위해 꽃, 잎 등 다양한 형질들을 대상으로 연구가 진행되고 있지만, 접근성을 비롯한 여러 장점을 가진 수피의 경우 복잡도가 높고 자료가 부족하여 연구가 제한적이었다. 본 연구에서는 국내에서 흔히 관찰 가능한 수목 54종의 사진자료를 약 7,000 여장 수집 및 공개하였고, 이를 해외의 20 수종에 대한 BarkNet 1.0의 자료와 결합하여 학습에 충분한 수의 사진 수를 가지는 53종을 선정하고, 사진들을 7:3의 비율로 나누어 훈련과 평가에 활용하였다. 분류 모델의 경우, 딥러닝 기법의 일종인 합성곱 신경망을 활용하였는데, 가장 널리 쓰이는 VGGNet (Visual Geometry Group Network) 16층, 19층 모델 두 가지를 학습시키고 성능을 비교하였다. 또한 본 모형의 활용성 및 한계점을 확인하기 위하여 학습에 사용하지 않은 수종과 덩굴식물과 같은 방해 요소가 있는 사진들에 대한 모델의 정확도를 확인하였다. 학습 결과 VGG16과 VGG19는 각각 90.41%와 92.62%의 높은 정확도를 보였으며, 더 복잡도가 높은 모델인 VGG19가 조금 더 나은 성능을 보임을 확인하였다. 학습에 활용되지 않은 수목을 동정한 결과 80% 이상의 경우에서 같은 속 또는 같은 과에 속한 수종으로 예측하는 것으로 드러났다. 반면, 이끼, 만경식물, 옹이 등의 방해 요소가 존재할 경우 방해요소가 자치하는 비중에 따라 정확도가 떨어지는 것이 확인되어 실제 현장에서 이를 보완하기 위한 방법들을 제안하였다.

기상 데이터 기반 감귤 당도 예측 인공지능 모델 개발 (Development of Artificial Intelligence Model for Predicting Citrus Sugar Content based on Meteorological Data)

  • 서동민
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.35-43
    • /
    • 2021
  • 감귤의 품질은 일반적으로 당도와 산도로 결정된다. 특히, 당도는 감귤의 맛을 결정하기 때문에 매우 중요한 요소이다. 현재 농가에서 가장 많이 사용하는 감귤 당도 측정 방법은 휴대용 착즙당도계 및 비파괴당도계로 측정하는 방식이다. 이 방법은 개인이 손쉽게 측정 가능한 방법이지만, 감귤농협 정식기계보다 당도수치의 정확성이 떨어지며 특히 0.5 Brix 이상 오차 차이가 발생해 현장에서 사용하기에는 아직 많이 부족하다. 또한, 현재 시점의 측정이지 예측 측정이 아니다. 그래서 본 논문에서는 기존 수집된 감귤 당도 값과 기상 데이터(평균 온도, 습도, 강우량, 일사량, 평균 풍속)을 기반으로 측정되지 않은 날짜의 감귤 당도를 0.5 Brix 이하 오차범위 내에서 예측하는 AI 모델을 제안했다. 또한, 성능평가를 통해 제안하는 예측 모델이 제주 성산 지역에 대해서는 절대 평균 오차가 0.1154, 하원 지역에 대해서는 0.1983인 것을 확인했다. 마지막으로 제안한 모델은 0.5 Brix 이하 오차 차이를 지원하며, 예측 측정을 지원하는 기술이기에 그 활용성에 있어 진보성이 매우 높을 것으로 기대된다.

알려지지 않은 위협 탐지를 위한 CBA와 OCSVM 기반 하이브리드 침입 탐지 시스템 (A hybrid intrusion detection system based on CBA and OCSVM for unknown threat detection)

  • 신건윤;김동욱;윤지영;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.27-35
    • /
    • 2021
  • 인터넷이 발달함에 따라, IoT, 클라우드 등과 같은 다양한 IT 기술들이 개발되었고, 이러한 기술들을 사용하여 국가와 여러 기업들에서는 다양한 시스템을 구축하였다. 해당 시스템들은 방대한 양의 데이터들을 생성하고, 공유하기 때문에 시스템에 들어있는 중요한 데이터들을 보호하기 위해 위협을 탐지할 수 있는 다양한 시스템이 필요하였으며, 이에 대한 연구가 현재까지 활발히 진행되고 있다. 대표적인 기술로 이상 탐지와 오용 탐지를 들 수 있으며, 해당 기술들은 기존에 알려진 위협이나 정상과는 다른 행동을 보이는 위협들을 탐지한다. 하지만 IT 기술이 발전함에 따라 시스템을 위협하는 기술들도 점차 발전되고 있으며, 이러한 탐지 방법들을 피해서 위협을 가한다. 지능형 지속 위협(Advanced Persistent Threat : APT)은 국가 또는 기업의 시스템을 공격하여 중요 정보 탈취 및 시스템 다운 등의 공격을 수행하며, 이러한 공격에는 기존에 알려지지 않았던 악성코드 및 공격 기술들을 적용한 위협이 존재한다. 따라서 본 논문에서는 알려지지 않은 위협을 탐지하기 위한 이상 탐지와 오용 탐지를 결합한 하이브리드 침입 탐지 시스템을 제안한다. 두 가지 탐지 기술을 적용하여 알려진 위협과 알려지지 않은 위협에 대한 탐지가 가능하게 하였으며, 기계학습을 적용함으로써 보다 정확한 위협 탐지가 가능하게 된다. 오용 탐지에서는 Classification based on Association Rule(CBA)를 적용하여 알려진 위협에 대한 규칙을 생성하였으며, 이상 탐지에서는 One Class SVM(OCSVM)을 사용하여 알려지지 않은 위협을 탐지하였다. 실험 결과, 알려지지 않은 위협 탐지 정확도는 약 94%로 나타난 것을 확인하였고, 하이브리드 침입 탐지를 통해 알려지지 않은 위협을 탐지 할 수 있는 것을 확인하였다.