• 제목/요약/키워드: Recall and Precision

검색결과 724건 처리시간 0.029초

텍스트 분류 기반 기계학습의 정신과 진단 예측 적용 (Application of Text-Classification Based Machine Learning in Predicting Psychiatric Diagnosis)

  • 백두현;황민규;이민지;우성일;한상우;이연정;황재욱
    • 생물정신의학
    • /
    • 제27권1호
    • /
    • pp.18-26
    • /
    • 2020
  • Objectives The aim was to find effective vectorization and classification models to predict a psychiatric diagnosis from text-based medical records. Methods Electronic medical records (n = 494) of present illness were collected retrospectively in inpatient admission notes with three diagnoses of major depressive disorder, type 1 bipolar disorder, and schizophrenia. Data were split into 400 training data and 94 independent validation data. Data were vectorized by two different models such as term frequency-inverse document frequency (TF-IDF) and Doc2vec. Machine learning models for classification including stochastic gradient descent, logistic regression, support vector classification, and deep learning (DL) were applied to predict three psychiatric diagnoses. Five-fold cross-validation was used to find an effective model. Metrics such as accuracy, precision, recall, and F1-score were measured for comparison between the models. Results Five-fold cross-validation in training data showed DL model with Doc2vec was the most effective model to predict the diagnosis (accuracy = 0.87, F1-score = 0.87). However, these metrics have been reduced in independent test data set with final working DL models (accuracy = 0.79, F1-score = 0.79), while the model of logistic regression and support vector machine with Doc2vec showed slightly better performance (accuracy = 0.80, F1-score = 0.80) than the DL models with Doc2vec and others with TF-IDF. Conclusions The current results suggest that the vectorization may have more impact on the performance of classification than the machine learning model. However, data set had a number of limitations including small sample size, imbalance among the category, and its generalizability. With this regard, the need for research with multi-sites and large samples is suggested to improve the machine learning models.

무인기 영상 기반 옥수수 재배필지 추출을 위한 Attention U-NET 적용 및 평가 (Application and Evaluation of the Attention U-Net Using UAV Imagery for Corn Cultivation Field Extraction)

  • 신형섭;송석호;이동호;박종화
    • Ecology and Resilient Infrastructure
    • /
    • 제8권4호
    • /
    • pp.253-265
    • /
    • 2021
  • 본 연구에서는 위성영상 촬영 한계를 극복하고 재배 필지 현황 파악 기술 발전에 기여하고자 무인기 영상 및 딥러닝 모형을 이용하여 옥수수 재배 필지 추출 방법을 제안하였다. 연구대상지역은 충북 괴산군 감물면 이담리 일대로 설정하고, 무인기 촬영을 통해 해당지역의 정사영상을 취득하였다. 모형에 필요한 학습자료는 현장조사 자료와 팜맵을 이용하여 구축하였다. 본 연구에 적용한 딥러닝 모형은 의미론적 분할 모형인 Attention U-Net을 이용하였다. 모형의 성능 평가는 학습과정을 거친 후 비학습 자료를 이용하여 옥수수 재배 필지 추출에 대해서 실시 하였다. 모형 성능평가 결과 정밀도는 0.94, 재현율은 0.96 및 F1-Score는 0.92로 나타났다. 본 연구에 적용한 Attention U-Net방법은 옥수수 재배 필지를 효과적으로 추출할 수 있는 방법임을 확인하였다. 따라서 본 연구 방법은 옥수수는 물론 다른 작물에 대한 재배 필지 구분에도 유용하게 활용될 수 있을 것으로 기대된다.

다중필터와 축지적 활성 윤곽선 알고리즘을 이용한 용접 비드 검출 및 판단 알고리즘 (An Algorithm of Welding Bead Detection and Evaluation Using and Multiple Filters Geodesic Active Contour)

  • 존 믈랴히루;김영봉;이재은;김종남
    • 융합신호처리학회논문지
    • /
    • 제22권3호
    • /
    • pp.141-148
    • /
    • 2021
  • 본 논문에서는 다중필터와 축지적 활성 윤곽선 (geodesic active contour) 알고리즘을 이용하여 용접 비드 검출 및 용접 품질 판단 알고리즘을 제안한다. 제안하는 알고리즘은 전단의 히스토그램 평활화와 가우시안 필터를 적용하여 용접 비드의 영상의 대비향상과 함께 영상을 부드럽게 하며, 영상의 잡음을 줄인다. 후에 활성 윤곽선 세그멘테이션과 형태학적 필터를 적용하여 용접 비드 영역을 검출하게 된다. 축지적 활성 윤곽선 영역화에서 매개변수인 팽창 힘을 이용하여 윤곽선을 팽창하거나 또는 축소시켜서 좀 더 정확하게 용접 비드를 검출하도록 한다. 용접 비드 영역을 검출한 후에 비드 영역의 유효 길이와 유효 폭의 비율을 이용하여 해당 용접의 품질 정오를 판단하는 방법을 제시한다. 실험을 통하여 제안한 알고리즘은 재현율 0.990, 정밀도 0.967, F-측정 0.978, IOU 0.896의 성능을 보였다. 제안한 알고리즘의 성능을 평가하기 위하여 용접 비드 분할에 주로 사용되는 기존의 알고리즘들을 이용하여 비교 분석하였다. 제안한 알고리즘의 성능이 우수함을 보였으며 용접 비드의 분할 및 평가 시간은 최대 0.6초가 걸렸다.

무장 선택을 위한 딥러닝 기반의 비행체 식별 기법 연구 (A Study on Deep Learning based Aerial Vehicle Classification for Armament Selection)

  • 차은영;김정창
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.936-939
    • /
    • 2022
  • 최근 공중 전투체계 기술들이 발전함에 따라 대공방어 시스템의 발전이 요구되고 있다. 대공 방어 시스템의 운용개념에 있어, 표적에 적합한 무장을 선택하는 것은 제한된 대공 전력을 사용하여 위협체에 대해 효율적으로 대응한다는 측면에서 체계에 요구되는 능력 중 하나이다. 비행 위협체의 식별에 있어 많은 부분이 운용자의 육안 식별에 의존하는데 고속으로 기동하고 원거리에 위치한 비행체를 육안으로 판별하는 것은 많은 한계가 있다. 뿐만 아니라, 현대 전장에서 무인화 및 지능화된 무기체계의 수요가 증가함에 따라 운용자의 육안 식별 대신 체계가 자동으로 비행체를 식별하고 분류하는 기술의 개발이 필수적이다. 영상자료를 수집해 딥러닝 기반의 모델을 이용하여 무기체계를 식별한 사례로는 전차와 함정 등이 있지만 비행체의 식별에 대한 연구는 아직 많이 부족한 상황이다. 따라서 본 논문에서는 합성곱 신경망 모델을 이용하여 전투기, 헬기, 드론을 분류하는 모델을 제시하고 제시하는 모델의 성능을 분석한다. 본 논문에서 제시하는 모델은 시험세트에 대해 95% 이상의 정확도를 보이고, precision 0.9579, recall 0.9558, F1-socre 0.9568의 값을 나타내는 것을 확인할 수 있다.

드론 영상 기반 조난 선박 탐지를 위한 해양 환경 시뮬레이션을 활용한 딥러닝 모델 개발 (Development of a Deep-Learning Model with Maritime Environment Simulation for Detection of Distress Ships from Drone Images)

  • 오정효;이주희;전의익;이임평
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1451-1466
    • /
    • 2023
  • 해양 조난 사고에서 드론 활용이 빠르게 증가하고 있는 가운데, 특히 드론을 활용한 수색 구조 작업이 주목받고 있다. 조난 선박 및 기타 해양 표류체를 빠르게 탐지하기 위해 드론 영상을 활용한 딥러닝 모델들이 확장되고 있다. 그러나 이러한 모델을 효과적으로 학습시키기 위해서는 다양한 기상 조건과 선박 상태를 고려한 대량의 학습 데이터가 필요하다. 이에 대한 데이터 부족 문제는 학습된 모델의 성능 저하로 이어질 수 있다. 이에 본 연구는 해양 환경 시뮬레이터를 개발하고 데이터셋을 보강하여 조난 선박 탐지를 위한 딥러닝 모델의 성능 개선을 목표로 한다. 이 시뮬레이터는 눈, 비, 안개와 같은 다양한 기상 조건과 선박 상태, 그리고 드론과 센서의 규격과 특성을 설정할 수 있다. 시뮬레이션을 통해 얻은 데이터셋을 활용하여 딥러닝 모델을 학습시켰다. 이로써, 실제 드론 영상 데이터셋만을 사용한 모델과 비교했을 때 정확도와 재현율 등의 탐지 성능이 향상되었다. 특히, 비나 안개와 같은 악기상에서의 조난 선박 탐지 정확도(Average Precision, AP)는 약 2-5% 정도 향상되었으며 미탐지 비율이 현저히 낮아졌다. 이러한 결과는 개발된 시뮬레이터가 현실적이고 효과적으로 다양한 상황을 시뮬레이션하여 모델 학습에 기여함을 보여준다. 또한, 이에 기반한 조난 선박 탐지 딥러닝 모델은 해양 수색 및 구조 작업에서 효율적으로 활용될 것으로 기대된다.

랜섬웨어 탐지를 위한 머신러닝 기반 암호화 행위 감지 기법 (A Machine Learning-Based Encryption Behavior Cognitive Technique for Ransomware Detection)

  • 황윤철
    • 산업융합연구
    • /
    • 제21권12호
    • /
    • pp.55-62
    • /
    • 2023
  • 최근 등장하는 랜섬웨어들은 다양한 공격 기법과 다양한 경로를 통해 공격을 수행하고 있어 조기 탐지와 방어에 많은 어려움을 겪고 있으며, 그 피해 규모도 날로 증가하고 있다. 따라서 본 논문에서는 효과적인 랜섬웨어 탐지를 위하여 파일 암호화와 암호화 패턴을 머신러닝 기반으로 하는 감지 기법을 제안한다. 파일 암호화는 랜섬웨어가 공격하는데 필수적으로 사용하는 기능으로 암호 행위와 암호화 패턴을 분석함으로써 랜섬웨어를 탐지하고 랜섬웨어의 특정 변종이나 새로운 유형의 랜섬웨어를 탐지할 수 있기 때문에 랜섬웨어 공격을 식별하고 차단하는 데 매우 효과적이다. 제안한 머신러닝 기반의 암호화 행위 감지 기법은 암호화 특성과 암호화 패턴 특성을 추출하여 머신러닝 기반의 분류기를 통해 각각 학습을 시켜 해당 행위에 대한 탐지를 진행하고 최종 결과는 두 분류기의 평가 결과를 기반으로 앙상블 분류기에서 랜섬웨어 유무를 판별하여 좀 더 정확도를 높였다. 또한, 제안한 기법을 numpy와 pandas, 파이썬의 사이킷런 라이브러리를 사용하여 구현하여 평가지표를 사용한 성능를 평가한 결과 평균적으로 94%,의 정확도와 95%의 정밀도, 93%의 재현률과 95%의 F1 스코어가 산출되었다. 성능 평가 결과를 보면 암호화 행위 감지를 통해 랜섬웨어 탐지가 가능하다는 것을 확인할 수 있었고 랜섬웨어의 사전 탐지를 위해 제안한 기법의 성능을 높이기 위한 연구도 계속해서 진행되어야 한다.

재난약자 및 취약시설에 대한 APC실증에 관한 연구 (Research on APC Verification for Disaster Victims and Vulnerable Facilities)

  • 김승용;황인철;김동식;신정재;용승갑
    • 한국재난정보학회 논문집
    • /
    • 제20권1호
    • /
    • pp.199-205
    • /
    • 2024
  • 연구목적: 본 연구는 요양병원 등 재난취약시설에 재난이 발생할 경우 잔류한 요구조자를 정확하게 파악하여 소방 등 대응기관에 제공하는 APC(Auto People Counting)의 인식률 개선에 목적이 있다. 연구방법: 본 연구에서는 실제 재난취약시설에 설치되어 운영 중인 APC를 대상으로 카메라를 통해 출입 인원의 이미지를 인식하는 알고리즘을 개선하기 위해 CNN모델을 활용하여 베이스라인 모델링을 하였다. 다양한 알고리즘의 성능을 분석하여 상위 7개의 후보군을 선정하고 전이학습 모델을 활용하여 성능이 가장 우수한 최적의 알고리즘을 선정하는 방법으로 연구를 수행하였다. 연구결과: 실험결과 시간과 성능이 가장 좋은 Densenet201, Resnet152v2 모델의 정밀도와 재현율을 확인한 결과 모든 라벨에 대해서 정확도 100%를 나타내는 것을 확인할 수 있었다. 이 중 Densenet201 모델이 더 높은 성능을 보여주었다. 결론: 다양한 인공지능 알고리즘 중 APC에 적용할 수 있는 최적의 알고리즘을 선정하였다. 향후 연무 등 다양한 재난상황에서 재난취약시설 내 출입인원을 정확하게 파악할 수 있도록 알고리즘 분석 및 학습에 대한 추가 연구가 요구된다.

조명 변화 감지에 의한 영상 콘트라스트 개선 (Image Contrast Enhancement by Illumination Change Detection)

  • 바잉뭉흐 어드게렐;이창훈
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.155-160
    • /
    • 2014
  • 영상처리를 통한 이동 물체 인식과 화질 개선 등의 연구에서 조명 변화가 성능에 큰 영향을 미치기 때문에 조명 변환에 대한 대응은 컴퓨터 비전 응용 분야에서의 중요한 관심사 중 하나이다. 조명 변화를 감지할 수 있게 되면 변화가 있는 시점에서부터 적절한 개선 알고리즘을 적용함으로써 인식률 향상 및 화질 개선 효과를 증대시킬 수 있다. 이에 본 연구에서는 급격한 조명 변화를 감지함에 있어 실시간성을 얻기 위하여 지역 정보를 이요하고 퍼지 논리를 도입하여 이를 효과적으로 감지하는 방법을 제안한다. 급격한 조명 변화를 감지하는 효과적인 방법으로 모서리 영역과 가운데 영역에 대한 각각의 히스토그램의 평균과 편차, 그리고 변화 추이를 반영하기 위하여 이전 프레임의 각 영역에 대한 히스토그램의 평균과 편차와의 변화량을 입력으로 급격한 조명 변화가 있을 때 입력 값의 변화 패턴을 퍼지 규칙으로 만들어 조명 변화를 감지하도록 하였다. 또한 움직이는 물체에 가려 발생하는 변화와 구별하기 위하여 전체 영역에 대한 평균과 편차 변화량을 도입하여 논리적으로 추론하여 차이를 구별할 수 있도록 하였고 점진적으로 조명이 변화하는 것을 감지할 수 있도록 하였다. 다양한 테스트 데이터에 대해 객관적인 정확도 측정 기법을 이용하여 민감도와 특이도를 계산하여 제안한 방법의 효용성을 보였다. 적응형 뉴로-퍼지 추론시스템을 도입하여 대비제한 적응 히스토그램 평활화 (CLAHE)의 매개 변수를 자동으로 선택할 수 있는 방법을 제안하여 급격한 조명의 변화를 감지한 결과를 바탕으로 화질을 개선할 수 있음을 보였다.

트위터의 감정 분석을 통한 실시간 장소 추천 시스템 (Real-time Spatial Recommendation System based on Sentiment Analysis of Twitter)

  • 오평화;황병연
    • 한국전자거래학회지
    • /
    • 제21권3호
    • /
    • pp.15-28
    • /
    • 2016
  • 본 논문에서는 모바일에서 획득한 GPS(Global Positioning System)를 활용하여 사용자의 위치 주변에서 발생한 SNS 데이터를 수집하고 분석을 통해 사용자가 원하는 장소를 추천하는 시스템을 제안한다. 이를 위해 트위터에서 위치정보를 포함하는 게시글을 표본 집합으로 정하고 모바일의 위치정보와 함께 활용했을 때, 사용자의 검색의도에 부합하는 양질의 정보를 제공할 수 있음을 실험을 통해 증명하였다. 이를 위해 2015년 11월부터 12월까지 수집한 트윗(Tweet)을 대상으로 임의의 위치정보와 검색어로 구성된 질의를 구성하고 형태소 분석을 거쳐 분석에 적합한 형태의 데이터로 변환하였다. 또한 장소 추천을 위해 감정사전을 구축하여 긍정 및 부정을 의미하는 극성 키워드들을 정의하고 레이블을 구성한 후, 감정사전과 극성키워드를 이용해 개별 트윗의 추천 점수를 도출하였다. 논문은 추천 점수와 사용자의 현재 위치, 트윗이 작성된 위치와 사용자 위치 사이의 거리 계산을 통해 가까운 거리 순으로 10개의 장소 정보를 정렬하여 결과를 보인다. 또한 성능평가를 위해 감정 분석된 트윗에 대한 정밀도와 재현율을 도출하여 시스템의 성능을 확인한다. 실험은 '맛집', '공연' 2개의 키워드와 10개 지역을 기준으로 수행하였다. 실험 결과 키워드 1개당 수집된 트윗은 평균 10.5개였으며, 총 10번의 실험에 사용된 평균 210개의 트윗 중 긍정 또는 부정의 단어를 포함한 트윗의 개수는 평균 122개였다. 또한 감정 분석을 통해 긍정 또는 부정으로 분류된 트윗은 평균 65개였으며 그 중 실제로 긍정 또는 부정의 의미를 담은 트윗은 평균 46개였다. 이를 통해 시스템은 38%의 재현율로 감정요소를 담은 트윗을 탐지하고, 71%의 정밀도로 감정 분석을 수행했음을 확인했다.

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.