• 제목/요약/키워드: Classification accuracy

검색결과 3,065건 처리시간 0.031초

그래프 트랜스포머 기반 농가 사과 품질 이미지의 그래프 표현 학습 연구 (A Study about Learning Graph Representation on Farmhouse Apple Quality Images with Graph Transformer)

  • 배지훈;이주환;유광현;권경주;김진영
    • 스마트미디어저널
    • /
    • 제12권1호
    • /
    • pp.9-16
    • /
    • 2023
  • 최근 농가의 사과 품질 선별 작업에서 인적자원의 한계를 극복하기 위해 합성곱 신경망(CNN) 기반 시스템이 개발되고 있다. 그러나 합성곱 신경망은 동일한 크기의 이미지만을 입력받기 때문에 샘플링 등의 전처리 과정이 요구될 수 있으며, 과도 샘플링의 경우 화질 저하, 블러링 등 원본 이미지의 정보손실 문제가 발생한다. 본 논문에서는 위 문제를 최소화하기 위하여, 원본 이미지의 패치 기반 그래프를 생성하고 그래프 트랜스포머 모델의 랜덤워크 기반 위치 인코딩 방법을 제안한다. 위 방법은 랜덤워크 알고리즘 기반 위치정보가 없는 패치들의 위치 임베딩 정보를 지속적으로 학습하고, 기존 그래프 트랜스포머의 자가 주의집중 기법을 통해 유익한 노드정보들을 집계함으로써 최적의 그래프 구조를 찾는다. 따라서 무작위 노드 순서의 새로운 그래프 구조와 이미지의 객체 위치에 따른 임의의 그래프 구조에서도 강건한 성질을 가지며, 좋은 성능을 보여준다. 5가지 사과 품질 데이터셋으로 실험하였을 때, 다른 GNN 모델보다 최소 1.3%에서 최대 4.7%의 학습 정확도가 높았으며, ResNet18 모델의 23.52M보다 약 15% 적은 3.59M의 파라미터 수를 보유하여 연산량 절감에 따른 빠른 추론 속도를 보이며 그 효과를 증명한다.

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구 (A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN)

  • 서주현;유선모;박종화;박진주;이태진
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.

A Comparative Study on Prediction Performance of the Bankruptcy Prediction Models for General Contractors in Korea Construction Industry

  • Seung-Kyu Yoo;Jae-Kyu Choi;Ju-Hyung Kim;Jae-Jun Kim
    • 국제학술발표논문집
    • /
    • The 4th International Conference on Construction Engineering and Project Management Organized by the University of New South Wales
    • /
    • pp.432-438
    • /
    • 2011
  • The purpose of the present thesis is to develop bankruptcy prediction models capable of being applied to the Korean construction industry and to deduce an optimal model through comparative evaluation of final developed models. A study population was selected as general contractors in the Korean construction industry. In order to ease the sample securing and reliability of data, it was limited to general contractors receiving external audit from the government. The study samples are divided into a bankrupt company group and a non-bankrupt company group. The bankruptcy, insolvency, declaration of insolvency, workout and corporate reorganization were used as selection criteria of a bankrupt company. A company that is not included in the selection criteria of the bankrupt company group was selected as a non-bankrupt company. Accordingly, the study sample is composed of a total of 112 samples and is composed of 48 bankrupt companies and 64 non-bankrupt companies. A financial ratio was used as early predictors for development of an estimation model. A total of 90 financial ratios were used and were divided into growth, profitability, productivity and added value. The MDA (Multivariate Discriminant Analysis) model and BLRA (Binary Logistic Regression Analysis) model were used for development of bankruptcy prediction models. The MDA model is an analysis method often used in the past bankruptcy prediction literature, and the BLRA is an analysis method capable of avoiding equal variance assumption. The stepwise (MDA) and forward stepwise method (BLRA) were used for selection of predictor variables in case of model construction. Twenty two variables were finally used in MDA and BLRA models according to timing of bankruptcy. The ROC-Curve Analysis and Classification Analysis were used for analysis of prediction performance of estimation models. The correct classification rate of an individual bankruptcy prediction model is as follows: 1) one year ago before the event of bankruptcy (MDA: 83.04%, BLRA: 93.75%); 2) two years ago before the event of bankruptcy (MDA: 77.68%, BLRA: 78.57%); 3) 3 years ago before the event of bankruptcy (MDA: 84.82%, BLRA: 91.96%). The AUC (Area Under Curve) of an individual bankruptcy prediction model is as follows. : 1) one year ago before the event of bankruptcy (MDA: 0.933, BLRA: 0.978); 2) two years ago before the event of bankruptcy (MDA: 0.852, BLRA: 0.875); 3) 3 years ago before the event of bankruptcy (MDA: 0.938, BLRA: 0.975). As a result of the present research, accuracy of the BLRA model is higher than the MDA model and its prediction performance is improved.

  • PDF

GPT를 활용한 개인정보 처리방침 안전성 검증 기법 (Safety Verification Techniques of Privacy Policy Using GPT)

  • 심혜연;권민서;윤다영;서지영;이일구
    • 정보보호학회논문지
    • /
    • 제34권2호
    • /
    • pp.207-216
    • /
    • 2024
  • 4차 산업혁명으로 인해 빅데이터가 구축됨에 따라 개인 맞춤형 서비스가 급증했다. 이로 인해 온라인 서비스에서 수집하는 개인정보의 양이 늘어났으며, 사용자들의 개인정보 유출 및 프라이버시 침해 우려가 높아졌다. 온라인 서비스 제공자들은 이용자들의 프라이버시 침해 우려를 해소하기 위해 개인정보 처리방침을 제공하고 있으나, 개인정보 처리방침은 길이가 길고 복잡하여 이용자가 직접 위험 항목을 파악하기 어려운 문제로 인해 오남용되는 경우가 많다. 따라서 자동으로 개인정보 처리방침이 안전한지 여부를 검사할 수 있는 방법이 필요하다. 그러나 종래의 블랙리스트 및 기계학습 기반의 개인정보 처리방침 안전성 검증 기법은 확장이 어렵거나 접근성이 낮은 문제가 있다. 본 논문에서는 문제를 해결하기위해 생성형 인공지능인 GPT-3.5 API를 이용한 개인정보 처리방침 안전성 검증 기법을 제안한다. 새로운 환경에서도 분류 작업을 수행할 수 있고, 전문 지식이 없는 일반인이 쉽게 개인정보 처리방침을 검사할 수 있다는 가능성을 보인다. 실험에서는 블랙리스트 기반 개인정보 처리방침과 GPT 기반 개인정보 처리방침이 안전한 문장과 안전하지 않은 문장의 분류를 얼마나 정확하게 하는지와 분류에 소요된 시간을 측정했다. 실험 결과에 따르면, 제안하는 기법은 종래의 블랙리스트 기반 문장 안전성 검증 기법보다 평균적으로 10.34% 높은 정확도를 보였다.

3차원 안면자동인식기의 형상복원 오차검사 (An Error Examination of 3D Face Automatic Recognition)

  • 석재화;조경래;조용범;유정희;곽창규;이수경;고병희;김종원;김규곤;이의주
    • 사상체질의학회지
    • /
    • 제18권2호
    • /
    • pp.41-49
    • /
    • 2006
  • 1. Objectives The Face is an important standard for the classification of Sasang Contitutions. We are developing 3D Face Automatic Recognition Apparatus to analyse the facial characteristics. So We should examine a shape demobilization error of 3D Face Automatic Recognition Apparatus. 2. Methods We compared facial shape data be demobilized by 3D Face Automatic Recognition Apparatus with facial shape data that be demobilized by 3D laser scanner. The subject was two korean men. And We analysed the average error and the maximum error of two data. In this process, We used one datum point(the peak of nose) and two datum line(vertical section and horizontal section). 3. Results and Conclusions In each this comparison, the average error of vertical section was 1.962574mm and 2.703814mm. and the maximum error of vertical section was 16.968249mm and 18.61464mm. the average error of horizontal section was 4.173203mm and 21.487479mm. and the maximum error of horizontal section was 3.571210mm and 17.13255mm. Also We complemented this apparatus a little and We reexamined a shape demobilization error of 3D Face Automatic Recognition Apparatus again. Accuracy of a shape demobilization was improved a little. From now on We complement accuracy of a shape demobilization in 3D Face Recognition Apparatus.

  • PDF

빅데이터 분석을 통한 유명인 모델의 광고효과 예측 모형 개발 (Development of a Prediction Model for Advertising Effects of Celebrity Models using Big data Analysis)

  • 김유나;한상필
    • 한국융합학회논문지
    • /
    • 제11권8호
    • /
    • pp.99-106
    • /
    • 2020
  • 본 연구는 소셜 빅데이터에 기반을 둔 유명인과 브랜드의 이미지 유사도가 광고효과를 예측할 수 있는 결정변수가 될 수 있는지를 파악하기 위해, 광고효과 예측모형을 생성하고 빅데이터 분석기법인 기계학습 방법을 통해 그 타당도를 검증하는 것을 목적으로 하였다. 이를 위해 SNS상의 키워드 네트워크 구조에 기반하여 유명인-브랜드 이미지 유사도를 정량화하고, 학습 데이터를 통해 이미지 유사도를 독립변수로, 광고효과 데이터를 종속변수로 하는 다중회귀모형을 반복 실시하여 광고효과 예측모형을 생성하였다. 이렇게 생성된 예측모형의 정확도를 판단하기 위해 예측 데이터에서 얻은 광고효과 예측값과 비교 기준으로서의 서베이값을 비교한 결과, 타당도를 판단하는 기준치인 75%의 분류 정확도를 보였으므로 본 광고효과 예측 모델링의 타당성은 확보된 것으로 입증되었다. 본 연구는 유명인-브랜드 이미지 유사성 구조를 소셜 네트워크 구조로 설명하고 그 효과를 기계학습을 통한 예측 모델링으로 검증하여 빅데이터 기반 모델링 연구에 새로운 방법론적 대안과 방향을 제시하였다.

광고 글 필터링 모델 적용 및 성능 향상 방안 (Application of Advertisement Filtering Model and Method for its Performance Improvement)

  • 박래근;윤혁진;신의철;안영진;정승도
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.1-8
    • /
    • 2020
  • 최근 기하급수적인 인터넷 데이터의 증가로 딥러닝 등의 많은 분야가 발전하였지만 바이럴 마케팅(viral marketing)과 같은 상업적 목적의 광고가 발견되면서 정보증가의 부작용이 발생하고 있다. 이는 양질의 정보를 공유하고자 하는 인터넷의 본질을 훼손하고 있을 뿐만 아니라 사용자는 양질의 정보를 습득하기 위해 검색시간이 증가하는 문제가 야기된다. 이에 본 연구에서는 광고(Ad: Advertisement, 이하 Ad) 글을 정보 전달의 본질을 흐리는 내용의 글이라 정의하였으며 본 정의에 부합하는 정보로 필터링하는 모델을 제안하였다. 제안하는 모델은 광고 필터링 경로와 광고 필터링 성능 개선경로로 구성되었으며 지속적으로 성능이 개선되도록 설계하였다. 광고 글 필터링을 위해 데이터를 수집하고 KorBERT를 사용하여 문서분류를 학습하였다. 본 모델의 성능을 검증하기 위해 실험을 진행하였으며 5개의 주제를 통합한 데이터에 대한 정확도(Accuracy), 정밀도(Precision)는 각각 89.2%, 84.3%의 결과를 나타냈고 광고의 비정형적 특성을 고려하더라도 높은 성능이 보임을 확인하였다. 본 모델을 통해 바이럴 마케팅으로 구성된 문서에서 광고 문단을 판단하고 필터링하여 사용자에게 양질의 정보를 효과적으로 전달하며 검색하는 과정에서 낭비되는 시간과 피로가 감소할 것으로 기대된다.

기계학습 기반 IDS 보안이벤트 분류 모델의 정확도 및 신속도 향상을 위한 실용적 feature 추출 연구 (A Practical Feature Extraction for Improving Accuracy and Speed of IDS Alerts Classification Models Based on Machine Learning)

  • 신익수;송중석;최장원;권태웅
    • 정보보호학회논문지
    • /
    • 제28권2호
    • /
    • pp.385-395
    • /
    • 2018
  • 인터넷의 성장과 함께 각종 취약점을 악용한 사이버 공격들이 지속적으로 증가하고 있다. 이러한 행위를 탐지하기 위한 방안으로 침입탐지시스템(IDS; Intrusion Detection System)이 널리 사용되고 있지만, IDS에서 발생하는 많은 양의 오탐(정상통신을 공격행위로 잘못 탐지한 보안이벤트)은 여전히 해결되지 않은 문제로 남아있다. IDS 오탐 문제를 해결하기 위한 방법으로 기계학습 알고리즘을 통한 자동분류 연구가 진행되고 있지만 실제 현장 적용을 위해서는 정확도와 데이터 처리속도 향상을 위한 연구가 더 필요하다. 기계학습 기반 분류 모델은 다양한 요인에 의해서 그 성능이 결정된다. 최적의 feature를 선택하는 것은 모델의 분류 성능 및 정확성 향상에 크게 영향을 미치기 때문에 기계학습에서 매우 중요한 부분을 차지한다. 본 논문에서는 보안이벤트 분류 모델의 성능 향상을 위해 기존 연구에서 제안한 기본 feature에 추가로 10종의 신규 feature를 제안한다. 본 논문에서 제안하는 10종의 신규 feature는 실제 보안관제센터 전문 인력의 노하우를 기반으로 고안된 것으로, 모델의 분류 성능을 향상시킬 뿐만 아니라 단일 보안이벤트에서 직접 추출 가능하기 때문에 실시간 모델 구축도 가능하다. 본 논문에서는 실제 네트워크 환경에서 수집된 데이터를 기반으로 제안한 신규 feature들이 분류 모델 성능 향상에 미치는 영향을 검증하였으며, 그 결과, 신규 feature가 모델의 분류 정확도를 향상시키고 오탐지율을 낮춰주는 것을 확인할 수 있었다.

레이더기반 다중센서활용 강수추정기술의 개발 (Development of Radar-Based Multi-Sensor Quantitative Precipitation Estimation Technique)

  • 이재경;김지현;박혜숙;석미경
    • 대기
    • /
    • 제24권3호
    • /
    • pp.433-444
    • /
    • 2014
  • Although the Radar-AWS Rainrate (RAR) calculation system operated by Korea Meteorological Administration estimated precipitation using 2-dimensional composite components of single polarization radars, this system has several limitations in estimating the precipitation accurately. To to overcome limitations of the RAR system, the Korea Meteorological Administration developed and operated the RMQ (Radar-based Multi-sensor Quantitative Precipitation Estimation) system, the improved version of NMQ (National Mosaic and Multi-sensor Quantitative Precipitation Estimation) system of NSSL (National Severe Storms Laboratory) for the Korean Peninsula. This study introduced the RMQ system domestically for the first time and verified the precipitation estimation performance of the RMQ system. The RMQ system consists of 4 main parts as the process of handling the single radar data, merging 3D reflectivity, QPE, and displaying result images. The first process (handling of the single radar data) has the pre-process of a radar data (transformation of data format and quality control), the production of a vertical profile of reflectivity and the correction of bright-band, and the conduction of hydrid scan reflectivity. The next process (merger of 3D reflectivity) produces the 3D composite reflectivity field after correcting the quality controlled single radar reflectivity. The QPE process classifies the precipitation types using multi-sensor information and estimates quantitative precipitation using several Z-R relationships which are proper for precipitation types. This process also corrects the precipitation using the AWS position with local gauge correction technique. The last process displays the final results transformed into images in the web-site. This study also estimated the accuracy of the RMQ system with five events in 2012 summer season and compared the results of the RAR (Radar-AWS Rainrate) and RMQ systems. The RMQ system ($2.36mm\;hr^{-1}$ in RMSE on average) is superior to the RAR system ($8.33mm\;hr^{-1}$ in RMSE) and improved by 73.25% in RMSE and 25.56% in correlation coefficient on average. The precipitation composite field images produced by the RMQ system are almost identical to the AWS (Automatic Weather Statioin) images. Therefore, the RMQ system has contributed to improve the accuracy of precipitation estimation using weather radars and operation of the RMQ system in the work field in future enables to cope with the extreme weather conditions actively.

혈장 중 극미량 납 분석을 위한 ICP-MS 분석법 검증 (Validation of ICP-MS method for trace level analysis of Pb in plasma)

  • 이성배;김용순;이용훈;안병준;김남수;이병국;신호상
    • 분석과학
    • /
    • 제28권5호
    • /
    • pp.309-316
    • /
    • 2015
  • 본 연구에서는 ICP-MS의 혈장 중 극미량의 납 분석법을 검증하기 위하여 Class 1,000 이내의 환경조건을 확보한 후 특이성, 일내 및 일간 정확도, 정밀도, 검정곡선 등을 확인하였다. 청정실의 부유 분진량을 측정한 결과, 0.3 µm 크기는 0.3~62개, 0.5 µm 크기는 0.0~28.3 개로 총 부유분진량이 최대 90.3개로 요구 환경에 부합하였다. 우태아 혈청 공시료로 조제한 시료의 MDL (Method detection limit)은 1.77 ng/L이고, LOQ (Limit of quantification)값은 5.55 ng/L 이었다. 검정곡선은 y=1.09×10−3 x+4.88×10−2이었고, 상관계수 r=0.9999이었다. 분석법 확립을 위한 특이성, 일내 및 일간 정확성, 정밀성, 그리고 검정곡선을 확인한 결과 50 ng/L 이상에서 분석법 확인 기준에 적합하였다. 이를 토대로 분석한 일반인의 혈장 중 납 농도 평균은 55.4 ng/L 이었으며, 현직 근로자는 440 ng/L 이었고, 퇴직 근로자는 132 ng/L 이었다.