• 제목/요약/키워드: High Accuracy

검색결과 8,781건 처리시간 0.04초

CodeBERT 모델의 전이 학습 기반 코드 공통 취약점 탐색 (Detecting Common Weakness Enumeration(CWE) Based on the Transfer Learning of CodeBERT Model)

  • 박찬솔;문소영;김영철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.431-436
    • /
    • 2023
  • 소프트웨어 공학 영역에 인공지능의 접목은 큰 화두 중 하나이다. 전 세계적으로 1) 인공지능을 통한 소프트웨어 공학, 2) 소프트웨어 공학을 통한 인공지능 두 가지 방향으로 활발히 연구되고 있다. 그 중 소프트웨어 공학에 인공지능을 접목하여 나쁜 코드 영역을 식별하고 해당 부분을 리팩토링하는 연구가 진행되고 있다. 해당 연구에서 인공지능이 나쁜 코드 요소의 패턴을 잘 학습하기 위해서는 학습하려는 나쁜 코드 요소가 라벨링 된 데이터셋이 필요하다. 문제는 데이터셋이 부족할뿐더러, 자체적으로 수집한 데이터셋의 정확도는 신뢰할 수 없다. 이를 해결하기 위해 코드 데이터 수집 시 전체 코드가 아닌 높은 복잡도를 가진 코드 모듈 영역을 대상으로만 나쁜 코드 데이터를 수집한다. 이후 수집한 데이터셋을 CodeBERT 모델의 전이 학습하여 코드 공통 취약점을 탐색하는 방법을 제안한다. 해당 데이터셋을 통해 CodeBERT 모델이 코드의 공통 취약점 패턴을 더 잘 학습할 수 있다. 이를 통해 전통적인 방법보다 인공지능 모델을 이용해 코드를 분석하고 공통 취약점 패턴을 더 정확하게 식별할 수 있을 것으로 기대한다.

체납된 건강보험료 징수 가능성 예측모형 개발 연구 (Development Study of a Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions)

  • 나영균
    • 보건행정학회지
    • /
    • 제33권4호
    • /
    • pp.450-456
    • /
    • 2023
  • Background: This study aims to develop a "Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions" for the National Health Insurance Service to enhance administrative efficiency in protecting and collecting contributions from livelihood-type defaulters. Additionally, it aims to establish customized collection management strategies based on individuals' ability to pay health insurance contributions. Methods: Firstly, to develop the "Predictive Model for the Possibility of Collection Delinquent Health Insurance Contributions," a series of processes including (1) analysis of defaulter characteristics, (2) model estimation and performance evaluation, and (3) model derivation will be conducted. Secondly, using the predictions from the model, individuals will be categorized into four types based on their payment ability and livelihood status, and collection strategies will be provided for each type. Results: Firstly, the regression equation of the prediction model is as follows: phat = exp (0.4729 + 0.0392 × gender + 0.00894 × age + 0.000563 × total income - 0.2849 × low-income type enrollee - 0.2271 × delinquency frequency + 0.9714 × delinquency action + 0.0851 × reduction) / [1 + exp (0.4729 + 0.0392 × gender + 0.00894 × age + 0.000563 × total income - 0.2849 × low-income type enrollee - 0.2271 × delinquency frequency + 0.9714 × delinquency action + 0.0851 × reduction)]. The prediction performance is an accuracy of 86.0%, sensitivity of 87.0%, and specificity of 84.8%. Secondly, individuals were categorized into four types based on livelihood status and payment ability. Particularly, the "support needed group," which comprises those with low payment ability and low-income type enrollee, suggests enhancing contribution relief and support policies. On the other hand, the "high-risk group," which comprises those without livelihood type and low payment ability, suggests implementing stricter default handling to improve collection rates. Conclusion: Upon examining the regression equation of the prediction model, it is evident that individuals with lower income levels and a history of past defaults have a lower probability of payment. This implies that defaults occur among those without the ability to bear the burden of health insurance contributions, leading to long-term defaults. Social insurance operates on the principles of mandatory participation and burden based on the ability to pay. Therefore, it is necessary to develop policies that consider individuals' ability to pay, such as transitioning livelihood-type defaulters to medical assistance or reducing insurance contribution burdens.

고심도 균열암반대수층 수리지질특성 평가를 위한 정압주입시험 조사절차 및 현장적용사례 연구 (Standard Procedures and Field Application Case of Constant Pressure Injection Test for Evaluating Hydrogeological Characteristics in Deep Fractured Rock Aquifer)

  • 이항복;박찬;박의섭;정용복;천대;배성호;김형목;김기석
    • 터널과지하공간
    • /
    • 제33권5호
    • /
    • pp.348-372
    • /
    • 2023
  • 고심도 균열암반대수층 환경에서 주로 수행되는 방사성폐기물 처분사업과 관련하여, 부지적합성 및 운영 시 안정성 평가를 평가하는데 있어 해당 대상 부지의 수리지질특성 평가는 필수적이다. 이러한 심부 수리지질 특성평가에 사용되는 인자 자료는 대상 부지에 굴착된 시추공을 이용한 원위치 수리시험을 통해 얻어지는데, 이 때 조사 결과의 정확도와 신뢰성은 적합한 시험방법의 선택, 조사 시스템의 성능, 조사절차의 표준화와 직접적으로 연결된다. 본 보고에서는 심부 암반대수층의 핵심 수리지질 평가인자인 수리전도도와 저류계수를 구하기 위한 대표적인 시험법인 정압주입시험의 상세조사절차를 소개하였다. 본 보고는 2022년도에 제안한 암반공학회 정압주입시험 관련 표준시험법 자료를 보완하여 구체화 하였으며, 본 조사절차가 실제 적용된 화산암 지역 시추공 현장적용 사례도 함께 소개하였다.

고체상 추출 전처리 및 HPLC-UV를 이용한 수산물 중 domoic acid의 분석 (Determination of Domoic Acid in Seafood Matrices using HPLC-UV with Solid Phase Extraction Cleanup)

  • 김시은;이상유;박지은;정현진;전향숙
    • 한국식품위생안전성학회지
    • /
    • 제38권5호
    • /
    • pp.297-304
    • /
    • 2023
  • 본 연구는 패류 독소 중 기억상실성 독성을 유발하는 domoic acid의 분석법 개선, 검증 및 분석적용성을 살펴보았다. SAX 카트리지 정제, 검체 및 추출용매 양의 변경과 더불어 이동상을 용매구매 조건으로 변경시킨 분석법은 지중해담치, 홍게 그리고 멸치의 세 가지 매트릭스를 대상으로 세 농도에 대하여 식품공전법과 비교하여 유효성을 검증하였다. 그 결과 변경된 분석법은 LOD 0.02-0.03 mg/kg, LOQ 0.05-0.09 mg/kg, 일내 및 일간 정확도 86.2-100.4%와 일내 및 일간 정밀도 0.2-4.0%로 CODEX가이드라인을 만족하는 우수한 분석능을 나타내었다. 특히 변경된 시험법에서는 domoic acid와 유사한 머무름 시간을 갖는 방해물질이 검출되지 않아 위양성 결과를 방지할 수 있을 것으로 생각된다. 더 나아가 본 분석법이 국내 유통 중인 수산물을 대상으로 적용될 수 있는지 확인하고자 식품공전의 기억상실성 패독 분석법과 함께 수산물에 적용하여 분석하였다. 그 결과 5종의 수산물 87건 중 공전시험법으로 분석했을 때 domoic acid가 검출된 시료는 없었으나 변경된 분석법을 통하여 멸치 1건에 대하여 0.14 mg/kg의 domoic acid이 미량 검출되었다. 따라서 본 연구에서 확립된 분석법은 수산물 중 domoic acid 분석에 활용이 가능할 것으로 보인다.

이수식 TBM 데이터와 랜덤포레스트를 이용한 일축압축강도 분류 예측에 관한 연구 (A Study on the Prediction of Uniaxial Compressive Strength Classification Using Slurry TBM Data and Random Forest)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.547-560
    • /
    • 2023
  • 최근 국내외에서 기계학습 기법으로 TBM 굴진 데이터와 지반데이터를 분석하는 지반 분류예측 연구가 증가하고 있다. 본 연구에서는 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들 중 의사결정트리 기반 랜덤포레스트 모델을 3곳의 이수식 TBM 현장에서 획득한 기계 데이터와 지반 데이터에 적용하여 일축압축강도에 대한 다중 분류예측 연구를 하였다. 일축압축강도의 다중 분류 예측을 위해서 학습과 테스트 데이터를 7:3으로 분할하였으며, 최적의 파라미터를 선정을 위해서 분할 교차검증을 포함하는 그리드 서치를 활용하였다. 의사 결정 트리를 기반으로 한 랜덤 포레스트를 사용하여 일축압축강도 분류 학습을 수행한 결과, 다중 분류 예측 모델의 정확도는 학습 세트와 테스트 세트에서 각각 0.983 및 0.982로 모두 높게 나타났다. 다만, 클래스 간 데이터 분포의 불균형으로 인하여 클래스 4에서는 재현율이 낮게 평가되었다. 다양한 현장에서 획득한 일축압축강도의 측정 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

터널 막장 3차원 지형모델 상에서의 불연속면 자동 매핑을 위한 딥러닝 기법 적용 방안 (Deep Learning Approach for Automatic Discontinuity Mapping on 3D Model of Tunnel Face)

  • 추엔 팜;신휴성
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.508-518
    • /
    • 2023
  • 이 논문은 LiDAR 스캔 또는 사진측량 기술에 의해 재구성된 3D 디지털 모델을 기반으로 터널 벽면의 불연속면을 자동으로 매핑하는 새로운 접근 방식을 제안한다. 본 제안에서는 U-Net이라 불리는 딥러닝 시맨틱 영역분할 모델을 사용하며, 터널 막장면의 3D 지형 모델에서 불연속면 영역을 식별해 낸다. 제안된 딥러닝 모델은 투영된 RGB 이미지, 면의 깊이 이미지 및 국부적인 면의 표면 속성 이미지(즉, 법선 벡터 및 곡률 이미지)를 포함한 다양한 정보를 종합 학습하여 기본 3차원 이미지에서 불연속면 영역을 효과적으로 분할한다. 이후 영역분할 결과는 면의 깊이 맵과 투영 행렬을 사용하여 3D 모델로 다시 투영시키고, 3D 공간 내에서 불연속면의 위치 및 범위를 정확하게 표현한다. 영역분할 모델의 성능은 영역 분할된 결과를 해당 지면 실측 값과 비교함으로써 평가하였으며, IoU(intersection-over-union) 값이 약 0.8 정도로 나타나 영역분할 결과의 높은 정확성을 확인하였다. 여전히 학습데이터가 제한적 이었음에도 불구하고, 제안 기법은 3D 모델의 점군 데이터를 불연속면의 유사군으로 그룹화하기 위해 전 막장면의 법선 벡터와 클러스터링과 같은 비지도 학습기반 알고리즘에만 의존하던 기존 접근 방식의 한계의 극복 가능성을 보여주었다.

현수교 행어케이블의 장력 추정을 위한 직접탐색법 기반의 역해석 기법의 적용 (Application of Back Analysis Technique Based on Direct Search Method to Estimate Tension of Suspension Bridge Hanger Cable )

  • 김진수;박재봉;박광림;박동욱;김성완
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제27권5호
    • /
    • pp.120-129
    • /
    • 2023
  • 행어케이블의 장력은 현수교의 건전성과 안전성을 확인할 수 있는 주요 응답 중 하나이다. 일반적으로 공용 중인 현수교에서 행어케이블의 장력을 추정하기 위해 진동법이 주로 사용되고 있다. 진동법은 행어케이블에서 고유진동수들을 측정하고 행어케이블의 형상 조건을 이용하여 간접적으로 장력을 추정하는 방법이다. 이 연구에서는 영상계측시스템을 이용하여 팔영대교의 행어케이블에 대하여 장력을 추정하였다. 영상계측시스템은 측정의 편의성과 경제성을 고려하여 디지털 캠코더와 삼각대를 사용하였다. 영상계측시스템을 이용하여 측정된 행어케이블의 응답은 변위 기반이므로 진동법을 적용하기 위한 고차모드의 고유진동수는 측정하기 어려울 수 있다. 이 연구에서는 저차모드의 고유 진동수를 이용하여 장력을 추정할 수 있는 역해석 기법을 적용하였다. 역해석 기법은 현장에서 측정된 행어케이블의 고유진동수들과 유한요소해석을 이용하여 산정된 고유진동수들의 오차를 목적함수로 정의하여 최적화를 수행하였다. 최적화 방법은 목적함수의 편미분이 필요 없는 직접탐색법을 적용하였다. 역해석 기법을 이용하여 산정된 장력과 진동법을 이용하여 추정된 장력을 비교 분석하여 역해석 기법에 대한 신뢰도와 정확도를 확인하였다. 그 결과 역해석 기법을 적용하면 저차모드의 고유진동수를 이용하여도 신뢰성 있는 장력의 추정이 가능하였다.

Machine Learning-Based Prediction of COVID-19 Severity and Progression to Critical Illness Using CT Imaging and Clinical Data

  • Subhanik Purkayastha;Yanhe Xiao;Zhicheng Jiao;Rujapa Thepumnoeysuk;Kasey Halsey;Jing Wu;Thi My Linh Tran;Ben Hsieh;Ji Whae Choi;Dongcui Wang;Martin Vallieres;Robin Wang;Scott Collins;Xue Feng;Michael Feldman;Paul J. Zhang;Michael Atalay;Ronnie Sebro;Li Yang;Yong Fan;Wei-hua Liao;Harrison X. Bai
    • Korean Journal of Radiology
    • /
    • 제22권7호
    • /
    • pp.1213-1224
    • /
    • 2021
  • Objective: To develop a machine learning (ML) pipeline based on radiomics to predict Coronavirus Disease 2019 (COVID-19) severity and the future deterioration to critical illness using CT and clinical variables. Materials and Methods: Clinical data were collected from 981 patients from a multi-institutional international cohort with real-time polymerase chain reaction-confirmed COVID-19. Radiomics features were extracted from chest CT of the patients. The data of the cohort were randomly divided into training, validation, and test sets using a 7:1:2 ratio. A ML pipeline consisting of a model to predict severity and time-to-event model to predict progression to critical illness were trained on radiomics features and clinical variables. The receiver operating characteristic area under the curve (ROC-AUC), concordance index (C-index), and time-dependent ROC-AUC were calculated to determine model performance, which was compared with consensus CT severity scores obtained by visual interpretation by radiologists. Results: Among 981 patients with confirmed COVID-19, 274 patients developed critical illness. Radiomics features and clinical variables resulted in the best performance for the prediction of disease severity with a highest test ROC-AUC of 0.76 compared with 0.70 (0.76 vs. 0.70, p = 0.023) for visual CT severity score and clinical variables. The progression prediction model achieved a test C-index of 0.868 when it was based on the combination of CT radiomics and clinical variables compared with 0.767 when based on CT radiomics features alone (p < 0.001), 0.847 when based on clinical variables alone (p = 0.110), and 0.860 when based on the combination of visual CT severity scores and clinical variables (p = 0.549). Furthermore, the model based on the combination of CT radiomics and clinical variables achieved time-dependent ROC-AUCs of 0.897, 0.933, and 0.927 for the prediction of progression risks at 3, 5 and 7 days, respectively. Conclusion: CT radiomics features combined with clinical variables were predictive of COVID-19 severity and progression to critical illness with fairly high accuracy.

UAV와 LiDAR를 활용한 토석채취지의 시계열 변화 분석 (Time-series Change Analysis of Quarry using UAV and Aerial LiDAR)

  • 박동환;심우담
    • 한국지리정보학회지
    • /
    • 제27권2호
    • /
    • pp.34-44
    • /
    • 2024
  • 최근 기후변화로 인한 이상기후로 인해 홍수, 산사태, 토사 유출과 같은 자연재난의 피해가 급증하고 있다. 우리나라는 국토의 63% 이상이 산지라는 지형적 특성 때문에 사면 재해에 취약하며, 특히, 토석채취지는 소단형성 과정에서 흙과 암석을 채굴하기 때문에 산사태가 발생할 확률이 높으며, 사업장 내부 뿐만 아니라, 외부까지 재해발생 위험이 높은 지역이다. 이에 따라, 본 연구는 토석채취지의 모니터링을 위해 UAV와 항공LiDAR를 활용하여 DEM을 구축하고 시계열 변화 분석을 수행하였으며, 토석채취지 모니터링을 위한 최적의 DEM 구축방법을 제안하였다. DEM 구축을 위해 UAV와 LiDAR 기반 Point Cloud 구축하고 Aggressive Classification(AC), Conservative Classification(CC), Standard Classification(SC) 등 세가지 알고리즘을 활용하여 지면부를 추출하였다. 알고리즘에 따라 구축한 UAV 및 LiDAR기반 DEM은 수치지형도 기반 DEM과의 비교를 통해 정확도를 평가하였다. 정확도 평가 결과, 알고리즘 방법간의 높이 차는 최대 1 m 내외로 차이가 거의 없었다. 또한, 음영기복도를 활용한 지면부의 질감을 시각적 비교해보았을 때 CC 알고리즘의 성능이 가장 우수하였으며, 산림지역에서 LiDAR 기반 DEM이 높은 정확도를 보였다. 구축한 최적의 DEM을 통해 토석채취지의 시계열 변화량을 비교한 결과, 토석채취지역, 소단 형성지역 등 시계열 변화에 따른 토석채취지의 변화지역 탐지가 가능하였다.

동해 남서부 해역에서 $^{210}Pb$를 이용한 퇴적속도 추정 (Estimation of $^{210}Pb$-derived Sedimentation Rates in the Southwestern East Sea)

  • 한정희;최만식
    • 한국해양학회지:바다
    • /
    • 제12권4호
    • /
    • pp.273-279
    • /
    • 2007
  • 동해 남서부 해역 울릉분지 일대 대륙붕과 대륙사면에서 퇴적속도를 추정하기 위해 저배경방사능 우물형 고순도 게르마늄 감마선 검색기를 이용하여 $^{210}Pb$, $^{226}Ra$$^{137}Cs$를 측정하였다. 추정된 퇴적속도는 대륙붕에서 가장 높고 (0.6-1.1 cm/yr), 대륙붕의 정점 B1005로부터 외해로 갈수록 거리가 증가함에 따라 퇴적속도는 지수함수적으로 감소하여, 분지에서 0.2 cm/yr 이하로 계산되었다. $^{137}Cs$의 투과깊이을 이용하여 퇴적속도에 대한 퇴적 후 퇴적물 혼합작용의 영향을 평가한 결과, 정점 BS-1을 제외하고 다른 정점들에 대하여 퇴적속도 추정에서 생물교란의 영향이 미미하다고 판단되어, 추정된 퇴적속도는 이 지역의 퇴적속도를 잘 나타내고 있다고 판단되었다. 기존의 여러 연구들과 이 연구의 결과로부터 대한해협을 통해 공급된 퇴적물들이 한반도 동남해역 연안에 이르러 대륙붕지역에 주로 퇴적되며, 나머지는 한반도 동쪽 대륙사면과 분지에 퇴적되는 것으로 추정할 수 있다. 또한 $^{210}Pb$ 수직분포는 이 지역의 퇴적과정이 매우 복잡할 가능성을 제시한다.