• Title/Summary/Keyword: Systems Performance

검색결과 25,976건 처리시간 0.064초

비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측 모델 (A Recidivism Prediction Model Based on XGBoost Considering Asymmetric Error Costs)

  • 원하람;심재승;안현철
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.127-137
    • /
    • 2019
  • 재범예측은 70년대 이전부터 전문가들에 의해서 꾸준히 연구되어온 분야지만, 최근 재범에 의한 범죄가 꾸준히 증가하면서 재범예측의 중요성이 커지고 있다. 특히 미국과 캐나다에서 재판이나 가석방심사 시 재범 위험 평가 보고서를 결정적인 기준으로 채택하게 된 90년대를 기점으로 재범예측에 관한 연구가 활발해졌으며, 비슷한 시기에 국내에서도 재범요인에 관한 실증적인 연구가 시작되었다. 지금까지 대부분의 재범예측 연구는 재범요인 분석이나 재범예측의 정확성을 높이는 연구에 집중된 경향을 보이고 있다. 그러나 재범 예측에는 비대칭 오류 비용 구조가 있기 때문에 경우에 따라 예측 정확도를 최대화함과 동시에 예측 오분류 비용을 최소화하는 연구도 중요한 의미를 가진다. 일반적으로 재범을 저지르지 않을 사람을 재범을 저지를 것으로 오분류하는 비용은 재범을 저지를 사람을 재범을 저지르지 않을 것으로 오분류하는 비용보다 낮다. 전자는 추가적인 감시 비용만 증가되는 반면, 후자는 범죄 발생에 따른 막대한 사회적, 경제적 비용을 야기하기 때문이다. 이러한 비대칭비용에 따른 비용 경제성을 반영하여, 본 연구에서 비대칭 오류 비용을 고려한 XGBoost 기반 재범 예측모델을 제안한다. 모델의 첫 단계에서 최근 데이터 마이닝 분야에서 높은 성능으로 각광받고 있는 앙상블 기법, XGBoost를 적용하였고, XGBoost의 결과를 로지스틱 회귀 분석(Logistic Regression Analysis), 의사결정나무(Decision Trees), 인공신경망(Artificial Neural Networks), 서포트 벡터 머신(Support Vector Machine)과 같은 다양한 예측 기법과 비교하였다. 다음 단계에서 임계치의 최적화를 통해 FNE(False Negative Error)와 FPE(False Positive Error)의 가중 평균인 전체 오분류 비용을 최소화한다. 이후 모델의 유용성을 검증하기 위해 모델을 실제 재범예측 데이터셋에 적용하여 XGBoost 모델이 다른 비교 모델 보다 우수한 예측 정확도를 보일 뿐 아니라 오분류 비용도 가장 효과적으로 낮춘다는 점을 확인하였다.

M&S 지원을 위한 HEMOS-Cloud 서비스의 경제적 효과 (Economic Impact of HEMOS-Cloud Services for M&S Support)

  • 정대용;서동우;황재순;박성욱;김명일
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권10호
    • /
    • pp.261-268
    • /
    • 2021
  • 클라우드 컴퓨팅은 서비스 사용자 요구에 따라 컴퓨팅 자원을 임대하여 사용하는 컴퓨팅 패러다임이다. 클라우드 컴퓨팅에서 컴퓨팅 자원은 사용자의 서비스 수요에 따라 컴퓨팅 자원을 확장 또는 축소가 가능하여 전체 서비스 비용 절감 효과를 가질 수 있다. 그리고, M&S (Modeling and Simulation) 기술은 컴퓨팅 자원과 CAE 소프트웨어를 통해 엔지니어링 분석 작업 결과를 얻어, 실제 실험 결과가 없이 제품의 상태를 시뮬레이션을 수행하여 분석하는 방법이다. M&S 기술은 FEA(Finite Element Analysis), CFD(Computational Fluid Dynamics), MBD(Multibody Dynamics) 및 최적화 분야에서 활용된다. M&S 통한 작업 절차는 전처리, 해석, 후처리 단계로 구분된다. CAE 소트프웨어를 통한 3D 모델링 작업인 전/후처리는 GPU 연산이 집약적이며, 3D 모델 해석은 CPU 또는 GPU 연산이 요구된다. 일반적인 개인 데스크톱에서 복잡한 3D 모델을 해석하는 시간이 많이 소요된다. 결과적으로, M&S를 원활하게 수행하기 위해서는 고성능 컴퓨팅 자원이 요구된다. 이 문제를 해결하기 위해 우리는 통합 클라우드 및 클러스터 컴퓨팅 환경인 HEMOS-Cloud 서비스를 제안한다. 제안한 클라우드 기반 방식에서는 M&S에 필요한 전/후처리 및 솔버 작업을 원활하게 수행할 수 있도록 구성했다. 이 시스템에서 전/후처리는 VDI(Virtual Desktop Infrastructure)에서 수행되고 해석은 클러스터 환경에서 수행된다. 각 용도에 맞게 서로 다른 환경에서 분리하여 컴퓨팅 자원 간에 간섭을 최소화했다. HEMOS-Cloud 서비스는 기업 또는 학교에서 M&S의 경험이 필요로 하는 사용자에게 CAE 소프트웨어와 컴퓨팅 자원을 제공한다. 본 논문에서는 HEMOS-Cloud 서비스의 경제적 파급효과를 산업연관분석을 활용하여 분석했다. 전문가의 의견을 반영하여 조정된 계수를 통한 분석 결과는 생산유발효과 74억원, 부가가치유발효과 41억원, 취업자유발효과 10억원당 50명으로 분석되었다.

동남아와 아세안 2016: 기대와 혼돈 속에 커져가는 불확실성 (Southeast Asia and ASEAN in 2016: Disappointing Records and Increasing Uncertainty)

  • 신윤환
    • 동남아시아연구
    • /
    • 제27권1호
    • /
    • pp.95-129
    • /
    • 2017
  • 이 글은 2016년 한 해 동안 동남아 각국들과 아세안이 정치, 경제, 국제관계의 영역에서 보여 준 변화를 살펴보고, 그 변화가 민주화, 경제발전, 지역통합에 미치는 영향을 분석해 보고자 했다. 나아가 2016년에 대한 분석을 바탕으로 2017년 이후의 변화 가능성과 방향도 나름대로 가늠해 보았다. 아울러 2016년에 전개된 한-아세안관계를 전반적으로 살펴보고, 한국의 대아세안외교가 드러내는 문제점을 지적하였다. 2016년의 동남아 정치는 연초의 기대와 달리 대다수 나라에서 민주화 전망은 더 나빠지고 권위주의화는 더 강화되는 양상을 보였다. 태국, 말레이시아, 캄보디아는 권위주의적 집권세력이 야당을 더욱 약화시켰고, 필리핀, 베트남, 라오스에 들어선 새 지도부는 인권 상황을 되레 악화시켰다. 미얀마도 소수민족에 대한 군부의 탄압이 지속되고, 선거에 의해 들어선 민간정부는 첫해부터 내분, 부패, 무능을 드러내며 삐걱거리고 있다. 출범 이틀 째 새해를 맞은 아세안경제공동체(AEC)는 각 국의 내정에 밀려 관심과 주목을 받지 못했다. 경제는 2015년에 이어 뚜렷한 회복세를 보였으나, 중국과 미국 등 경제대국들에서 기인하는 세계경제의 불확실성이 커지고 있어, 앞날을 점치기 힘들게 되었다. 마지막으로 이 글은 한국의 대아세안외교가 경제중심, 국가주도, 비밀주의, 냉전적 경쟁외교의 덫에 빠져 있다고 비판하고, 지금이 바로 사고의 전환과 과감한 개혁이 필요한 때라고 주장한다.

패턴전사 프린팅을 활용한 리튬이온 배터리 양극 기초소재 Li2CO3의 나노스케일 패턴화 방법 (Nanoscale Pattern Formation of Li2CO3 for Lithium-Ion Battery Anode Material by Pattern Transfer Printing)

  • 강영림;박태완;박은수;이정훈;왕제필;박운익
    • 마이크로전자및패키징학회지
    • /
    • 제27권4호
    • /
    • pp.83-89
    • /
    • 2020
  • 지난 수십년간 인류에게 핵심적인 에너지 자원이었던 화석연료가 갈수록 고갈되고 있고, 산업발전에 따른 오염이 심해지고 있는 환경을 보호하기 위한 노력의 일환으로, 친환경 이차전지, 수소발생 에너지 장치, 에너지 저장 시스템 등과 관련한 새로운 에너지 기술들이 개발되고 있다. 그 중에서도 리튬이온 배터리 (Lithium ion battery, LIB)는 높은 에너지 밀도와 긴 수명으로 인해, 대용량 배터리로 응용하기에 적합하고 산업적 응용이 가능한 차세대 에너지 장치로 여겨진다. 하지만, 친환경 전기 자동차, 드론 등 증가하는 배터리 시장을 고려할 때, 수명이 다한 이유로 어느 순간부터 많은 양의 배터리 폐기물이 쏟아져 나올 것으로 예상된다. 이를 대비하기 위해, 폐전지에서 리튬 및 각종 유가금속을 회수하는 공정개발이 요구되는 동시에, 이를 재활용할 수 있는 방안이 사회적으로 요구된다. 본 연구에서는, 폐전지의 재활용 전략소재 중 하나인, 리튬이온 배터리의 대표적 양극 소재 Li2CO3의 나노스케일 패턴 제조 방법을 소개하고자 한다. 우선, Li2CO3 분말을 진공 내 가압하여 성형하고, 고온 소결을 통하여 매우 순수한 Li2CO3 박막 증착용 3인치 스퍼터 타겟을 성공적으로 제작하였다. 해당 타겟을 스퍼터 장비에 장착하여, 나노 패턴전사 프린팅 공정을 이용하여 250 nm 선 폭을 갖는, 매우 잘 정렬된 Li2CO3 라인 패턴을 SiO2/Si 기판 위에 성공적으로 형성할 수 있었다. 뿐만 아니라, 패턴전사 프린팅 공정을 기반으로, 금속, 유리, 유연 고분자 기판, 그리고 굴곡진 고글의 표면에까지 Li2CO3 라인 패턴을 성공적으로 형성하였다. 해당 결과물은 향후, 배터리 소자에 사용되는 다양한 기능성 소재의 박막화에 응용될 것으로 기대되고, 특히 다양한 기판 위에서의 리튬이온 배터리 소자의 성능 향상에 도움이 될 것으로 기대된다.

주문생산 기업을 위한 기계학습 기반 총생산시간 예측 기법 (A Machine Learning-based Total Production Time Prediction Method for Customized-Manufacturing Companies)

  • 박도명;최형림;박병권
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.177-190
    • /
    • 2021
  • 4차 산업혁명 기술의 발전으로 사람이 처리하지 못하는 부분을 기계학습 등 인공지능 기법을 활용하여 개선해 보려는 노력이 확대되고 있다. 주문형 생산 기업에서도 주문에 대한 총생산시간을 예측하여 납기 지연 등의 기업 리스크를 줄이고자 하나 주문마다 총생산시간이 모두 달라 이를 예측하는데, 어려움을 겪고 있다. 주문 처리량 증대, 주문 총비용 절감을 위해 효율성이 가장 낮은 영역을 찾아 그 영역을 강화하는 TOC(Theory of constraints) 이론이 개발되었으나 총생산시간 예측은 제시하지 못하였다. 주문생산은 고객의 다양한 요구로 인해 주문마다 그 특성이 모두 다르므로 개별적인 주문의 총생산시간을 사후에 측정할 수는 있으나 사전 예측을 하기는 어렵다. 기존 주문의 이미 측정된 총생산시간도 모두 달라 표준 시간으로 활용할 수 없는 한계성이 있다. 이에 따라 경험이 많은 관리자는 시스템의 이용보다는 감에 의존하고 있고, 경험이 부족한 관리자는 간단한 관리지표(예, 원재료가 파이프이면 총생산시간 60일, 철판이면 총생산시간 90일 등)를 사용하고 있다. 불완전한 감이나 지표를 기초로 하여 작업 지시를 너무 빨리하면 정체가 발생하여 생산성이 저하되고, 너무 늦게 하면 긴급 처리로 인해 생산비용이 증가하거나 납기를 지키지 못하는 경우가 발생한다. 납기를 지키지 못하면 지체상금을 배상해야 하거나 영업, 수금 등의 부문에 악영향을 미친다. 본 연구에서는 이러한 문제를 해결하기 위하여 주문생산시스템을 운영하는 기업의 신규 주문 총생산시간을 추정하는 기계학습 모델을 찾고자 한다. 기계학습에 활용된 자료는 수주, 생산, 공정 실적을 사용한다. 그리고 총생산시간의 추정에 가장 적합한 알고리즘으로 OLS, GLM Gamma, Extra Trees, Random Forest 알고리즘 등을 비교 분석하고 그 결과를 제시하고자 한다.

국내의 발달성협응장애(DCD) 연구에 관한 체계적 고찰 : 평가와 중재접근 중심으로 (A Systematic Review of Developmental Coordination Disorders in South Korea: Evaluation and Intervention)

  • 김민주;최정실
    • 대한감각통합치료학회지
    • /
    • 제19권1호
    • /
    • pp.69-82
    • /
    • 2021
  • 목적 : 본 연구는 발달성협응장애(Developmental Coordination Disorder; DCD)에 관한 국내 연구동향 및 DCD의 선별이나 중재에 관한 연구결과를 고찰하여 향후 관련 종사자들이 연구를 설계하거나 중재결과를 효과적으로 제시할 수 있도록 기본정보를 제공하고자 한다. 연구방법 : 체계적 고찰방법을 사용하여 1990년 1월부터 2020년 12월까지 국내에서 발행된 논문들 중 발달성협응장애와 관련된 논문을 검색하였다. 검색어는 국내의 연구현황을 확인하기 위해 '발달성협응장애', '발달협응', '발달적 협응'으로 선정하였다. 검색원은 한국교육학술정보원과 한국학술정보, 구글학술검색을 사용하였다. 검색된 4,878개의 논문 중 중복되어 검색된 논문과 배제기준에 해당되는 논문을 제외한 총 17편의 논문이 분석에 사용되었다. 선정된 논문은 DCD연구 중 평가와 중재접근을 분석하기 위하여 Wilson(2005)이 제시한 개념적 모델을 이용하였다. 결과 : 선정된 연구의 질적수준을 분석한 결과에 따르면 두 집단간의 비무작위 연구인 level II가 70%를 차지하였다. 연구설계 시대상 아동의 DCD 유무를 판별하기 위해 Movement Assessment Battery for Children test(MABC)와 MABC Second Edition(MABC-2)(72%)가 운동발달 평가도구로 주로 사용되었다. 중재연구 중 역동체계접근을 적용한 논문은 47%으로 가장 높았으며, 정상발달기술접근의 논문과 인지적 신경과학을 적용한 논문은 각각 18%이었고, 신경발달이론을 적용한 논문은 11%이었다. 정상발달기술접근과 일반적 능력접근을 병행한 논문은 6%로 가장 낮은 사용을 보였다. 이들 논문은 주로 DCD아동들의 운동특성이나 운동(체육)프로그램의 중재효과에 관한 것이었다. 결론 : 국내에서 진행된 DCD관련 연구는 대부분 DCD의 움직임 특성을 설명하거나 운동 중재프로그램의 효과성을 설명한 연구가 주류를 이루었다. 향후 DCD 연구에서는 국내 실정에 적합한 평가도구들의 타당성에 관한 연구와 재활 분야에서 사용하고 있는 다양한 중재접근의 효과를 입증하여 DCD 아동의 운동협응을 향상시키기 위한 시도가 필요하다.

실시간 헬스케어 모니터링의 독립 구동을 위한 접촉대전 발전과 전자기 발전 원리의 융합 (Stand-alone Real-time Healthcare Monitoring Driven by Integration of Both Triboelectric and Electro-magnetic Effects)

  • 조수민;정윤수;김현수;박민석;이동한;감동익;장순민;라윤상;차경제;김형우;서경덕;최동휘
    • Korean Chemical Engineering Research
    • /
    • 제60권1호
    • /
    • pp.86-92
    • /
    • 2022
  • 최근 COVID-19 팬데믹 등 다양한 이유로 인해 바이오 헬스케어 시장이 전세계적으로 활성화되고 있다. 그 중, 생체정보 측정 및 분석 기술은 앞으로의 기술적 혁신성과 사회경제적 파급효과를 불러일으킬 것으로 예측된다. 기존의 시스템은 생체 신호를 받아 신호 처리를 하는 과정에서 신호 송×수신부, 운영체제, 센서, 그리고 인터페이스를 구동하기 위한 대용량 배터리를 필수적으로 요구한다. 하지만, 배터리 용량의 한계가 인해 시×공간적인 기기 사용의 제한을 야기하며, 이는 사용자의 헬스케어 모니터링에 필요한 데이터의 단절에 대한 원인으로 작용할 수 있으므로 헬스케어 디바이스의 큰 걸림돌 중의 하나이다. 본 연구에서는 생체정보 측정 장치에 접촉대전 효과(Triboelectric effects)와 전자기유도 효과(Electro-magnetic effects)를 융합하여, 외부 전원을 요구하지 않는 독립 구동이 가능한 시스템을 구성하여 시×공간적으로 사용 제한이 없는 소형 생체정보 측정 모듈을 설계 및 검증했다. 특히, 다양한 헬스케어 모니터링 중 족압 계측을 통해 사용자의 보행 습관 등을 파악할 수 있는 무선 족압 계측 모니터링 시스템을 검증했다. 보행 시 발생하는 접촉×분리 움직임에서 접촉대전 효과를 이용한 효과적인 압력 센서와 압력에 따른 전기적 출력신호를 통해 족압 센서를 만들고, 축전기를 이용한 신호처리 회로를 통해 이의 동적 거동을 계측할 수 있다. 또한, 출력된 전기신호의 무선 송×수신용 전원으로 사용하기 위해 전자기 유도 효과를 이용하여 보행 시 생기는 생체역학적 에너지를 전기에너지로 수확했다. 따라서, 이번 연구는 사용자가 제한적인 배터리 용량 때문에 생기는 충전에 대한 불편함을 줄일 수 있고, 뿐만 아니라 데이터 단절에 대한 문제점을 극복할 수 있는 방법으로서 큰 잠재력을 보여줌을 시사한다.

KOMPSAT-3/3A 영상 기반 하천의 탁도 산출 연구 (A Study on the Retrieval of River Turbidity Based on KOMPSAT-3/3A Images)

  • 김다희;원유준;한상명;한향선
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1285-1300
    • /
    • 2022
  • 탁도는 부유물질에 의한 빛의 산란 또는 흡수로 인한 수체의 흐림을 나타내는 수치로 수질 관리 분야에서 중요 지표로 활용되고 있다. 탁도는 소규모의 하천에서 변동성이 심할 수 있으며, 이는 국가하천의 수질에 직접적으로 영향을 준다. 따라서 고해상도의 탁도 공간정보 산출은 매우 중요하다. 이 연구에서는 Korea Multi-Purpose Satellite-3 및 -3A (KOMPSAT-3/3A) 영상으로부터 한강 수계 하천의 고해상도 탁도 매핑을 위한 eXtreme Gradient Boosting (XGBoost) 알고리즘 기반의 탁도 산출 모델을 개발하였다. 이를 위해 총 24장의 KOMPSAT-3/3A 영상과 150장의 Landsat-8 영상으로부터 계산된 대기 상단(Top Of Atmosphere, TOA) 반사율을 활용하였으며, Landsat-8 TOA 반사율은 KOMPSAT-3/3A의 관측 파장 대역에 적합하도록 교차검보정을 수행하였다. 국가수질자동관측망에서 측정된 탁도를 탁도 산출 모델의 참조자료로 사용하였고, 입력 변수로는 탁도가 실측된 위치에서의 TOA 분광반사율과 탁도 분석에 널리 이용되어 온 분광지수인 정규식생지수, 정규수분지수, 정규탁도지수, 그리고 Moderate Resolution Imaging Spectroradiometer (MODIS)의 대기 산출물(에어로졸 광학 두께, 수증기량, 오존)을 사용하였다. 또한 고탁도와 저탁도에 대한 KOMPSAT-3/3A TOA 분광반사율을 분석하여 탁도를 설명할 수 있는 새로운 정규탁도지수(new normalized difference turbidity index, nNDTI)를 제안하였고, 이를 탁도 산출 모델에 입력 변수로 추가하였다. XGBoost 기반 탁도 산출 모델은 현장관측 탁도와 비교하여 2.70 NTU의 평균 제곱근 오차(root mean square error, RMSE) 및 14.70%의 정규화된 RMSE(normalized RMSE)를 가지는 탁도를 예측하여 우수한 성능을 보였으며, 이 연구에서 새롭게 제안한 nNDTI가 탁도 산출에 있어 가장 중요한 변수로 사용되었다. 개발된 탁도 산출 모델을 KOMPSAT-3/3A 영상에 적용하여 하천 탁도를 고해상도로 매핑하였으며, 탁도의 시공간적 변동에 대한 분석이 가능하였다. 이 연구를 통하여 고해상도의 정확한 탁도 공간정보 산출에 KOMPSAT-3/3A 영상이 매우 유용함을 확인할 수 있었다.

차원축소를 활용한 해외제조업체 대상 사전점검 예측 모형에 관한 연구 (Preliminary Inspection Prediction Model to select the on-Site Inspected Foreign Food Facility using Multiple Correspondence Analysis)

  • 박혜진;최재석;조상구
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.121-142
    • /
    • 2023
  • 수입식품의 수입 건수와 수입 중량이 꾸준히 증가함에 따라 식품안전사고 방지를 위한 수입식품의 안전관리가 더욱 중요해지고 있다. 식품의약품안전처는 통관단계의 수입검사와 더불어 통관 전 단계인 해외제조업소에 대한 현지실사를 시행하고 있지만 시간과 비용이 많이 소요되고 한정된 자원 등의 제약으로 데이터 기반의 수입식품 안전관리 방안이 필요한 실정이다. 본 연구에서는 현지실사 전 부적합이 예상되는 업체를 사전에 선별하는 기계학습 예측 모형을 마련하여 현지실사의 효율성을 높이고자 하였다. 이를 위해 통합식품안전정보망에 수집된 총 303,272건의 해외제조가공업소 기본정보와 2019년도부터 2022년 4월까지의 현지실사 점검정보 데이터 1,689건을 수집하였다. 해외제조가공업소의 데이터 전처리 후 해외 제조업소_코드를 활용하여 현지실사 대상 데이터만 추출하였고, 총 1,689건의 데이터와 103개의 변수로 구성되었다. 103개의 변수를 테일유(Theil-U) 지표를 기준으로 '0'인 변수들을 제거하였고, 다중대응분석(Multiple Correspondence Analysis)을 적용해 축소 후 최종적으로 49개의 특성변수를 도출하였다. 서로 다른 8개의 모델을 생성하고, 모델 학습 과정에서는 5겹 교차검증으로 과적합을 방지하고, 하이퍼파라미터를 조정하여 비교 평가하였다. 현지실사 대상업체 선별의 연구목적은 부적합 업체를 부적합이라고 판정하는 확률인 검측률(recall)을 최대화하는 것이다. 머신러닝의 다양한 알고리즘을 적용한 결과 Recall_macro, AUROC, Average PR, F1-score, 균형정확도(Balanced Accuracy)가 가장 높은 랜덤포레스트(Random Forest)모델이 가장 우수한 모형으로 평가되었다. 마지막으로 모델에 의해서 평가된 개별 인스턴스의 부적합 업체 선정 근거를 제시하기 위해 SHAP(Shapley Additive exPlanations)을 적용하고 현지실사 업체 선정 시스템에의 적용 가능성을 제시하였다. 본 연구결과를 바탕으로 데이터에 기반한 과학적 위험관리 모델을 통해 수입식품 관리체계의 구축으로 인력·예산 등 한정된 자원의 효율적 운영방안 마련에 기여하길 기대한다.

기침 소리의 다양한 변환을 통한 코로나19 진단 모델 (A COVID-19 Diagnosis Model based on Various Transformations of Cough Sounds)

  • 김민경;김건우;최근호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.57-78
    • /
    • 2023
  • 2019년 11월 중국 우한시에서 발병한 코로나19는 2020년 중국을 넘어 세계로 퍼져나가 2020년 3월에는 전 세계적으로 확산되었다. 코로나19와 같이 전염성이 강한 바이러스는 예방과 확진시 적극적인 치료도 중요하지만 우선 전파 속도가 빠른 바이러스인 점을 감안할 때, 확진 사실을 재빠르게 파악하여 전파를 차단하는 것이 더욱 중요하다. 그러나 감염여부를 확인하기 위한 PCR검사는 비용과 시간이 많이 소요되고, 자가키트검사 또한 접근성은 쉽지만 매번 수시로 받기에는 키트의 가격이 부담이 될 수밖에 없는 실정이다. 이러한 상황에서 기침 소리를 기반으로 코로나19 양성 여부를 판단할 수 있게 된다면 누구나 쉽게 언제, 어디서든 확진 여부를 체크할 수 있어 신속성과 경제성 측면에서 큰 장점을 가질 수 있을 것이다. 따라서 본 연구는 기침 소리를 기반으로 코로나19 확진 여부를 식별할 수 있는 분류 모델을 개발하는 것을 목적으로 하였다. 이를 위해, 본 연구에서는 먼저 MFCC, Mel-Spectrogram, Spectral contrast, Spectrogram 등을 통해 기침 소리를 벡터화 하였다. 이 때, 기침 소리의 품질을 위해 SNR을 통해 잡음이 많은 데이터는 삭제하였고, chunk를 통해 음성 파일에서 기침 소리만 추출하였다. 이후, 추출된 기침 소리의 feature를 이용하여 코로나 양성과 음성을 분류하기 위한 모델을 구축하였으며, XGBoost, LightGBM, FCNN 알고리즘을 통해 모델 학습을 수행하고 각 알고리즘별 성능을 비교하였다. 또한, 기침 소리를 다차원 벡터로 변환한 경우와, 이미지로 변환한 경우에 대해 모델 성능에 대한 비교 실험을 수행하였다. 실험 결과, 건강상태에 대한 기본정보와 기침 소리를 MFCC, Mel-Spectogram, Spectral contrast, 그리고 Spectrogram을 통해 다차원 벡터로 변환한 feature를 모두 활용한 LightGBM 모델이 0.74의 가장 높은 정확도를 보였다.