• 제목/요약/키워드: artificial image

검색결과 1,424건 처리시간 0.029초

준지도 학습과 전이 학습을 이용한 선로 체결 장치 결함 검출 (Detection Fastener Defect using Semi Supervised Learning and Transfer Learning)

  • 이상민;한석민
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.91-98
    • /
    • 2023
  • 오늘날 인공지능 산업이 발전함에 따라 여러 분야에 걸쳐 인공지능을 통한 자동화 및 최적화가 이루어지고 있다. 국내의 철도 분야 또한 지도 학습을 이용한 레일의 결함을 검출하는 연구들을 확인할 수 있다. 그러나 철도에는 레일만이 아닌 다른 구조물들이 존재하며 그중 선로 체결 장치는 레일을 다른 구조물에 결합시켜주는 역할을 하는 장치로 안전사고의 예방을 위해서 주기적인 점검이 필요하다. 본 논문에는 선로 체결 장치의 데이터를 이용하여 준지도 학습(semi-supervised learning)과 전이 학습(transfer learning)을 이용한 분류기를 학습시켜 선로 안전 점검에 사용되는 비용을 줄이는 방안을 제안한다. 사용된 네트워크는 Resnet50이며 imagenet으로 선행 학습된 모델이다. 레이블이 없는 데이터에서 무작위로 데이터를 선정 후 레이블을 부여한 뒤 이를 통해 모델을 학습한다. 학습된 모델의 이용하여 남은 데이터를 예측 후 예측한 데이터 중 클래스 별 확률이 가장 높은 데이터를 정해진 크기만큼 훈련용 데이터에 추가하는 방식을 채택하였다. 추가적으로 초기의 레이블된 데이터의 크기가 끼치는 영향력을 확인해보기 위한 실험을 진행하였다. 실험 결과 최대 92%의 정확도를 얻을 수 있었으며 이는 지도 학습 대비 5% 내외의 성능 차이를 가진다. 이는 제안한 방안을 통해 추가적인 레이블링 과정 없이 비교적 적은 레이블을 이용하여 분류기의 성능을 기존보다 향상시킬 수 있을 것으로 예상된다.

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

CNN 기반 스펙트로그램을 이용한 자유발화 음성감정인식 (Spontaneous Speech Emotion Recognition Based On Spectrogram With Convolutional Neural Network)

  • 손귀영;권순일
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.284-290
    • /
    • 2024
  • 음성감정인식(Speech Emotion Recognition, SER)은 사용자의 목소리에서 나타나는 떨림, 어조, 크기 등의 음성 패턴 분석을 통하여 감정 상태를 판단하는 기술이다. 하지만, 기존의 음성 감정인식 연구는 구현된 시나리오를 이용하여 제한된 환경 내에서 숙련된 연기자를 대상으로 기록된 음성인 구현발화를 중심의 연구로 그 결과 또한 높은 성능을 얻을 수 있지만, 이에 반해 자유발화 감정인식은 일상생활에서 통제되지 않는 환경에서 이루어지기 때문에 기존 구현발화보다 현저히 낮은 성능을 보여주고 있다. 본 논문에서는 일상적 자유발화 음성을 활용하여 감정인식을 진행하고, 그 성능을 향상하고자 한다. 성능평가를 위하여 AI Hub에서 제공되는 한국인 자유발화 대화 음성데이터를 사용하였으며, 딥러닝 학습을 위하여 1차원의 음성신호를 시간-주파수가 포함된 2차원의 스펙트로그램(Spectrogram)로 이미지 변환을 진행하였다. 생성된 이미지는 CNN기반 전이학습 신경망 모델인 VGG (Visual Geometry Group) 로 학습하였고, 그 결과 7개 감정(기쁨, 사랑스러움, 화남, 두려움, 슬픔, 중립, 놀람)에 대해서 성인 83.5%, 청소년 73.0%의 감정인식 성능을 확인하였다. 본 연구를 통하여, 기존의 구현발화기반 감정인식 성능과 비교하면, 낮은 성능이지만, 자유발화 감정표현에 대한 정량화할 수 있는 음성적 특징을 규정하기 어려움에도 불구하고, 일상생활에서 이루어진 대화를 기반으로 감정인식을 진행한 점에서 의의를 두고자 한다.

Prediction of Patient Management in COVID-19 Using Deep Learning-Based Fully Automated Extraction of Cardiothoracic CT Metrics and Laboratory Findings

  • Thomas Weikert;Saikiran Rapaka;Sasa Grbic;Thomas Re;Shikha Chaganti;David J. Winkel;Constantin Anastasopoulos;Tilo Niemann;Benedikt J. Wiggli;Jens Bremerich;Raphael Twerenbold;Gregor Sommer;Dorin Comaniciu;Alexander W. Sauter
    • Korean Journal of Radiology
    • /
    • 제22권6호
    • /
    • pp.994-1004
    • /
    • 2021
  • Objective: To extract pulmonary and cardiovascular metrics from chest CTs of patients with coronavirus disease 2019 (COVID-19) using a fully automated deep learning-based approach and assess their potential to predict patient management. Materials and Methods: All initial chest CTs of patients who tested positive for severe acute respiratory syndrome coronavirus 2 at our emergency department between March 25 and April 25, 2020, were identified (n = 120). Three patient management groups were defined: group 1 (outpatient), group 2 (general ward), and group 3 (intensive care unit [ICU]). Multiple pulmonary and cardiovascular metrics were extracted from the chest CT images using deep learning. Additionally, six laboratory findings indicating inflammation and cellular damage were considered. Differences in CT metrics, laboratory findings, and demographics between the patient management groups were assessed. The potential of these parameters to predict patients' needs for intensive care (yes/no) was analyzed using logistic regression and receiver operating characteristic curves. Internal and external validity were assessed using 109 independent chest CT scans. Results: While demographic parameters alone (sex and age) were not sufficient to predict ICU management status, both CT metrics alone (including both pulmonary and cardiovascular metrics; area under the curve [AUC] = 0.88; 95% confidence interval [CI] = 0.79-0.97) and laboratory findings alone (C-reactive protein, lactate dehydrogenase, white blood cell count, and albumin; AUC = 0.86; 95% CI = 0.77-0.94) were good classifiers. Excellent performance was achieved by a combination of demographic parameters, CT metrics, and laboratory findings (AUC = 0.91; 95% CI = 0.85-0.98). Application of a model that combined both pulmonary CT metrics and demographic parameters on a dataset from another hospital indicated its external validity (AUC = 0.77; 95% CI = 0.66-0.88). Conclusion: Chest CT of patients with COVID-19 contains valuable information that can be accessed using automated image analysis. These metrics are useful for the prediction of patient management.

분류 모델을 활용한 AI 기반 화학 I 수업의 효과에 대한 연구 (An Investigation Into the Effects of AI-Based Chemistry I Class Using Classification Models)

  • 양희선;안성혁;김승현;강성주
    • 대한화학회지
    • /
    • 제68권3호
    • /
    • pp.160-175
    • /
    • 2024
  • 본 연구의 목적은 AI 분류 모델을 기반으로 한 화학 I 수업의 효과를 검토하고자 한다. 이를 위하여 경북 D 고등학교에서 2023년 1학기에 시행된 화학 I 수업에서 AI 분류 모델을 활용한 수업의 개발과 적용 후 그 변화를 탐색하였다. 교과 내용과 AI 도구를 선정하고 교과-AI융합 교육 모형 및 AI 하드웨어 소프트웨어를 결정한 후, 프로그램의 세부 활동을 개발하여 실제 수업에 적용하였다. 수업 적용 후, 학생들의 화학 개념 형성, AI 가치 인식, AI 기반 메이킹 역량의 세가지 측면에서 자기 효능감이 향상되었음이 확인되었다. 구체적으로, 텍스트 및 이미지 분류 모델 기반의 화학 수업이 학생들의 화학 개념 형성에 대한 자아 효능감에 긍정적인 영향을 미쳤으며, 학생들의 AI 가치 인식과 흥미를 증진시켰고, 학생들의 AI와 피지컬 컴퓨팅 능력을 향상시키는데 기여하였다. 이러한 결과는 AI 분류 모델을 기반으로 한 화학 I 수업이 학생들에게 긍정적인 영향을 미침을 보여주며, 교육현장에서의 유용성을 입증한다.

특허 데이터 기반 생성형 AI 기술 동향 분석 (Analysis of Generative AI Technology Trends Based on Patent Data)

  • 유성무;송태원;이민정;최윤주;설순욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.1-9
    • /
    • 2024
  • 본 논문은 특허 출원 문서를 기초로 하여 생성형 AI 기술의 동향을 분석한다. 이를 위해 2003년부터 2023년까지 한국, 미국, 유럽에서 출원된 생성형 AI 관련 특허 5,433건을 선별하고, 국가별, 기술 분야별, 연도별, 출원인별 데이터를 분석하고 시각적으로 제시함으로써 시사점을 찾고 기술 흐름을 확인하고자 한다. 분석 결과, 이미지 분야의 특허가 36.9%로 가장 많고 지속적으로 출원 건수가 상승하고 있지만, 문장/문서나 음악/음성 분야는 2019년 이후로 출원이 감소하거나 유지되고 있다. 가장 많은 특허를 출원한 기업은 한국 기업이지만 상위 5개 출원인 중 4개가 미국 기업이며 모든 기업이 미국에 가장 많은 특허를 출원하고 있어 생성형 AI는 미국 시장을 중심으로 성장하고 경쟁하고 있음을 확인하였다. 논문의 분석 결과는 향후 생성형 AI 연구 개발과 지식 재산 확보 전략을 수립하는 데 활용될 수 있을 것으로 기대된다.

Accuracy of posteroanterior cephalogram landmarks and measurements identification using a cascaded convolutional neural network algorithm: A multicenter study

  • Sung-Hoon Han;Jisup Lim;Jun-Sik Kim;Jin-Hyoung Cho;Mihee Hong;Minji Kim;Su-Jung Kim;Yoon-Ji Kim;Young Ho Kim;Sung-Hoon Lim;Sang Jin Sung;Kyung-Hwa Kang;Seung-Hak Baek;Sung-Kwon Choi;Namkug Kim
    • 대한치과교정학회지
    • /
    • 제54권1호
    • /
    • pp.48-58
    • /
    • 2024
  • Objective: To quantify the effects of midline-related landmark identification on midline deviation measurements in posteroanterior (PA) cephalograms using a cascaded convolutional neural network (CNN). Methods: A total of 2,903 PA cephalogram images obtained from 9 university hospitals were divided into training, internal validation, and test sets (n = 2,150, 376, and 377). As the gold standard, 2 orthodontic professors marked the bilateral landmarks, including the frontozygomatic suture point and latero-orbitale (LO), and the midline landmarks, including the crista galli, anterior nasal spine (ANS), upper dental midpoint (UDM), lower dental midpoint (LDM), and menton (Me). For the test, Examiner-1 and Examiner-2 (3-year and 1-year orthodontic residents) and the Cascaded-CNN models marked the landmarks. After point-to-point errors of landmark identification, the successful detection rate (SDR) and distance and direction of the midline landmark deviation from the midsagittal line (ANS-mid, UDM-mid, LDM-mid, and Me-mid) were measured, and statistical analysis was performed. Results: The cascaded-CNN algorithm showed a clinically acceptable level of point-to-point error (1.26 mm vs. 1.57 mm in Examiner-1 and 1.75 mm in Examiner-2). The average SDR within the 2 mm range was 83.2%, with high accuracy at the LO (right, 96.9%; left, 97.1%), and UDM (96.9%). The absolute measurement errors were less than 1 mm for ANS-mid, UDM-mid, and LDM-mid compared with the gold standard. Conclusions: The cascaded-CNN model may be considered an effective tool for the auto-identification of midline landmarks and quantification of midline deviation in PA cephalograms of adult patients, regardless of variations in the image acquisition method.

Prognostic Value of Sarcopenia and Myosteatosis in Patients with Resectable Pancreatic Ductal Adenocarcinoma

  • Dong Wook Kim;Hyemin Ahn;Kyung Won Kim;Seung Soo Lee;Hwa Jung Kim;Yousun Ko;Taeyong Park;Jeongjin Lee
    • Korean Journal of Radiology
    • /
    • 제23권11호
    • /
    • pp.1055-1066
    • /
    • 2022
  • Objective: The clinical relevance of myosteatosis has not been well evaluated in patients with pancreatic ductal adenocarcinoma (PDAC), although sarcopenia has been extensively researched. Therefore, we evaluated the prognostic value of muscle quality, including myosteatosis, in patients with resectable PDAC treated surgically. Materials and Methods: We retrospectively evaluated 347 patients with resectable PDAC who underwent curative surgery (mean age ± standard deviation, 63.6 ± 9.6 years; 202 male). Automatic muscle segmentation was performed on preoperative computed tomography (CT) images using an artificial intelligence program. A single axial image of the portal phase at the inferior endplate level of the L3 vertebra was used for analysis in each patient. Sarcopenia was evaluated using the skeletal muscle index, calculated as the skeletal muscle area (SMA) divided by the height squared. The mean SMA attenuation was used to evaluate myosteatosis. Diagnostic cutoff values for sarcopenia and myosteatosis were devised using the Contal and O'Quigley methods, and patients were classified according to normal (nMT), sarcopenic (sMT), myosteatotic (mMT), or combined (cMT) muscle quality types. Multivariable Cox regression analyses were conducted to assess the effects of muscle type on the overall survival (OS) and recurrence-free survival (RFS) after surgery. Results: Eighty-four (24.2%), 73 (21.0%), 75 (21.6%), and 115 (33.1%) patients were classified as having nMT, sMT, mMT, and cMT, respectively. Compared to nMT, mMT and cMT were significantly associated with poorer OS, with hazard ratios (HRs) of 1.49 (95% confidence interval, 1.00-2.22) and 1.68 (1.16-2.43), respectively, while sMT was not (HR of 1.40 [0.94-2.10]). Only mMT was significantly associated with poorer RFS, with an HR of 1.59 (1.07-2.35), while sMT and cMT were not. Conclusion: Myosteatosis was associated with poor OS and RFS in patients with resectable PDAC who underwent curative surgery.

재난약자 및 취약시설에 대한 APC실증에 관한 연구 (Research on APC Verification for Disaster Victims and Vulnerable Facilities)

  • 김승용;황인철;김동식;신정재;용승갑
    • 한국재난정보학회 논문집
    • /
    • 제20권1호
    • /
    • pp.199-205
    • /
    • 2024
  • 연구목적: 본 연구는 요양병원 등 재난취약시설에 재난이 발생할 경우 잔류한 요구조자를 정확하게 파악하여 소방 등 대응기관에 제공하는 APC(Auto People Counting)의 인식률 개선에 목적이 있다. 연구방법: 본 연구에서는 실제 재난취약시설에 설치되어 운영 중인 APC를 대상으로 카메라를 통해 출입 인원의 이미지를 인식하는 알고리즘을 개선하기 위해 CNN모델을 활용하여 베이스라인 모델링을 하였다. 다양한 알고리즘의 성능을 분석하여 상위 7개의 후보군을 선정하고 전이학습 모델을 활용하여 성능이 가장 우수한 최적의 알고리즘을 선정하는 방법으로 연구를 수행하였다. 연구결과: 실험결과 시간과 성능이 가장 좋은 Densenet201, Resnet152v2 모델의 정밀도와 재현율을 확인한 결과 모든 라벨에 대해서 정확도 100%를 나타내는 것을 확인할 수 있었다. 이 중 Densenet201 모델이 더 높은 성능을 보여주었다. 결론: 다양한 인공지능 알고리즘 중 APC에 적용할 수 있는 최적의 알고리즘을 선정하였다. 향후 연무 등 다양한 재난상황에서 재난취약시설 내 출입인원을 정확하게 파악할 수 있도록 알고리즘 분석 및 학습에 대한 추가 연구가 요구된다.

무인기 자율임무를 위한 모델 기반 지능형 프레임워크 인터페이스 (Model-Based Intelligent Framework Interface for UAV Autonomous Mission)

  • 손건준;이재호
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.111-121
    • /
    • 2024
  • 최근 영상 인식 등의 인공지능 기술 발전에 힘입어 무인기 자율화에 관한 연구가 활발히 이루어지고 있다. 특히 전문 조종 인력 육성에 큰 비용이 들어가는 군용 무인기 분야에서 관련 연구가 늘어나고 있으며, 그중 하나가 정찰용 무인기의 자율적인 임무 수행을 위한 지능형 프레임워크 연구이다. 해당 연구에선 서비스 로봇을 위한 지능형 프레임워크 설계의 방법론을 활용해 무인기용 지능형 프레임워크를 설계하고자 하였다. 무인기의 자율적인 임무 수행 능력을 위해선 지능형 프레임워크와 무인기 모듈의 연동이 원활하게 이루어져야 한다. 하지만 기존 서비스 로봇을 위한 지능형 프레임워크의 모델 기반 인터페이스로는 주기성 메시지 프로토콜을 사용하는 무인기에 대한 연동 제공이 어려웠다. 먼저 주기성 메시지 프로토콜에 대한 메시지 모델의 표현력이 부족했고, 다음으로 주기성 메시지 프로토콜과 지능형 프레임워크의 비동기적 데이터 교환 방식의 상호운용성이 제공되지 않는다는 문제가 있었다. 본 논문에서는 이러한 문제를 해결하기 위해 메시지 주기성 서술을 위한 메시지 모델 확장 방법을 제안하여 주기성 메시지 모델에 대한 모델의 표현력을 확보하고, 확장된 모델을 이용한 주기적 및 비동기적 데이터 교환 방법을 제안하여 서로 다른 데이터 교환 방식의 상호운용성을 제공하고자 한다.