• 제목/요약/키워드: Deep Learning based System

검색결과 1,234건 처리시간 0.03초

인공지능을 활용한 AI 예술 창작도구 사례 연구 (Case study of AI art generator using artificial intelligence)

  • 정지윤
    • 트랜스-
    • /
    • 제13권
    • /
    • pp.117-140
    • /
    • 2022
  • 최근 인공지능 기술은 산업전반에 걸쳐서 활용되고 있다. 현재 예술 창작도구는 NFT 산업에서 사용되고 있으며, 이를 활용한 작품이 전시, 판매되기도 하였다. 미술 분야의 창작도구는 Gerated Photos, Google Deep Dream, Skech-RNN, Auto draw가 있으며, 음악분야의 인공지능 창작도구는 Beat Blender, Google Doodle Bach, AIVA, Duet, Neural Synth 등이 있다. 인공지능 예술 창작도구의 특징은 다음과 같다. 첫째, 예술분야 인공지능 창작도구는 기존의 작품 데이터를 바탕으로 새로운 작품을 창작하는 데에 활용되고 있다. 둘째, 창작 결과물을 빠르고 신속하게 도출하여 창작자에게 아이디어를 제공하거나, 창작 재료를 다양하게 구현해 볼 수 있다. 향후 인공지능 창작물은 인공지능 기술이 미술, 영상, 문학, 음악 등 콘텐츠 기획 및 제작에 많은 영향을 끼칠 것이다.

음성인식과 자연어 처리 딥러닝을 통한 전자의무기록자동 생성 시스템 (Automatic Electronic Medical Record Generation System using Speech Recognition and Natural Language Processing Deep Learning)

  • 손현곤;류기환
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.731-736
    • /
    • 2023
  • 최근 의료 현장은 전자의무기록, 전자건강기록 등의 의료 기록을 전산화하여 저장하고 관리하는 시스템이 의무적으로 적용되거나 전체 의료 현장에 보급되어 환자 개개인의 과거 의료 기록을 추가적인 의료 행위에 활용하고 있다. 그러나 일반적인 의료 문진 및 상담 간 발생하는 의료진과 환자 간의 대화는 별도로 기록되거나 저장되지 않고 있어 추가적인 환자의 주요 정보는 효율적으로 활용되지 못하고 있다. 이에 따라, 의료 문진 현장에서 발생하는 의료진과 환자와의 대화를 저장하고 이를 텍스트 데이터로 변환하여 주요한 문진 내용만 자동으로 추출, 요약하여 정보화하는 음성인식과 자연어 처리 딥러닝을 통한 의료상담 요약문을 자동으로 생성하는 전자의무기록 시스템을 제안한다. 본 시스템은 의료 종사자와 환자의 의료 상담 내용의 인식과정을 거쳐서 텍스트 정보를 획득한다. 이렇게 획득된 텍스트를 복수의 문장으로 구분하고, 생성된 문장에 포함된 복수 키워드의 중요도를 산출한다. 산출된 중요도를 기반으로 복수의 문장에 순위를 매기고, 순위를 기반으로 문장들을 요약하여 최종 전자의무기록 데이터를 생성한다. 제안하는 시스템 성능은 정량적 분석을 통하여 우수함을 확인한다.

실시간 영상이미지 분석을 통한 아스팔트 콘크리트 포장의 노면 상태 인식 및 블랙아이스 예방시스템 (Real-time Road Surface Recognition and Black Ice Prevention System for Asphalt Concrete Pavements using Image Analysis)

  • 정회평;송호민;최영철
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제28권1호
    • /
    • pp.82-89
    • /
    • 2024
  • 블랙 아이스는 인지하기가 매우 어렵고 도로 노면의 마찰력이 감소하여 자동차 사고를 유발한다. 도로 노면의 블랙아이스 방지를 위한 다양한 연구가 수행되었으나, 실시간으로 블랙아이스를 식별하고 운전자에게 경고하는 시스템에 대한 연구는 매우 미흡한 실정이다. 본 논문에서는 아스팔트 도로 노면의 상태를 실시간적으로 식별하기 위해 이미지기반 분석 시스템을 개발하였다. 이를 위해 각 아스팔트 도로 노면 이미지에 대해 데이터 세트를 구축한 다음 딥러닝을 통해 노면의 상태를 건조, 젖음, 블랙아이스, 눈 노면 상태로 식별하였다. 또한, 이미지 분석결과와 더불어 도로 노면 상태의 최종판별을 위해 실제 노면에서 측정된 온도와 습도 데이터를 사용하였다. 도로 노면의 특성이 블랙아이스로 판정이 나면, 도로에 설치된 염수 분사장치가 자동으로 작동하도록 하였다. 본 연구에서 개발된 아스팔트 콘크리트 포장에 대한 노면 상태 식별 시스템과 블랙아이스 자동 예방 시스템은 운전자의 안전운행을 보장하고 교통사고 발생률을 낮출 수 있을 것으로 기대된다.

다양한 크기의 식별자를 적용한 Cycle GAN을 이용한 다목적실용위성 5호 SAR 영상 색상 구현 방법 (The Method for Colorizing SAR Images of Kompsat-5 Using Cycle GAN with Multi-scale Discriminators)

  • 구원회;정대원
    • 대한원격탐사학회지
    • /
    • 제34권6_3호
    • /
    • pp.1415-1425
    • /
    • 2018
  • 다목적실용위성 5호는 국내 최초로 영상레이더(SAR)가 탑재된 지구관측위성이다. SAR 영상은 위성에 부착된 안테나로부터 방사된 마이크로파가 물체로부터 반사된 신호를 수신하여 생성된다. SAR는 대기 중의 입자의 크기에 비해 파장이 긴 마이크로파를 사용하기 때문에 구름이나 안개 등을 투과할 수 있으며, 주야간 구분 없이 고해상도의 영상을 얻을 수 있다. 하지만, SAR 영상에는 색상 정보가 부재하는 제한점이 존재한다. 이러한 SAR 영상의 제한점을 극복하기 위해, 도메인 변환을 위해 개발된 딥러닝 모델인 Cycle GAN을 활용하여 SAR 영상에 색상을 대입하는 연구를 수행하였다. Cycle GAN은 unpaired 데이터셋 기반의 무감독 학습으로 인해 학습이 불안정하다. 따라서 Cycle GAN의 학습 불안정성을 해소하고, 색상 구현의 성능을 향상하기 위해 다중 크기 식별자를 적용한 MS Cycle GAN을 제안하였다. MS Cycle GAN과 Cycle GAN의 색상 구현 성능을 비교하기 위하여 두 모델이 Florida 데이터셋을 학습하여 생성한 영상을 정성적 및 정량적으로 비교하였다. 다양한 크기의 식별자가 도입된 MS Cycle GAN은 기존의 Cycle GAN과 비교하여 학습 결과에서 생성자 및 식별자 손실이 대폭 감소되었고, 나뭇잎, 강, 토지 등의 영역 특성에 부합하는 색상이 구현되는 것을 확인하였다.

Computerized bone age estimation system based on China-05 standard

  • Yin, Chuangao;Zhang, Miao;Wang, Chang;Lin, Huihui;Li, Gengwu;Zhu, Lichun;Fei, Weimin;Wang, Xiaoyu
    • Advances in nano research
    • /
    • 제12권2호
    • /
    • pp.197-212
    • /
    • 2022
  • The purpose of this study is to develop an automatic software system for bone age evaluation and to evaluate its accuracy in testing and feasibility in clinical practice. 20394 left-hand radiographs of healthy children (2-18 years old) were collected from China Skeletal Development Survey data of 1998 and China Skeletal Development Survey data of 2005. Three experienced radiologists and China-05 standard maker jointly evaluate the stages of bone development and the reference bone age was determined by consensus. 1020 from 20394 radiographs were picked randomly as test set and the remaining 19374 radiographs as training set and validation set. Accuracy of the automatic software system for bone age assessment is evaluated in test set and two clinical test sets. Compared with the reference standard, the automatic software system based on RUS-CHN for bone age assessment has a 0.04 years old mean difference, ±0.40 years old in 95% confidence interval by single reading, a 85.6% percentage agreement of ratings, a 93.7% bone age accuracy rate, 0.17 years old of MAD, 0.29 years old of RMS; Compared with the reference standard, the automatic software system based on TW3-C RUS has a 0.04 years old mean difference, a ±0.38 years old in 95% confidence interval by single reading, a 90.9% percentage agreement of ratings, a 93.2% bone age accuracy rate, a 0.16 years of MAD, and a 0.28 years of RMS. Automatic software system, AI-China-05 showed reliably accuracy in bone age estimation and steady determination in different clinical test sets.

인공지능 기반 컨테이너 적재 안전관리 시스템 연구 (Research on Artificial Intelligence Based Shipping Container Loading Safety Management System)

  • 김상우;오세영;서용욱;연정흠;조희정;윤주상
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권9호
    • /
    • pp.273-282
    • /
    • 2023
  • 최근 스마트항만을 구축하기 위해 ICT 기술이 적용된 물류 자동화, 항만 운영 자동화 등 다양한 기술이 개발 중이다. 하지만 항만 안전과 안전사고를 예방하기 위한 기술 개발은 부족한 상황이다. 이에 본 논문에서는 항만 내 컨테이너 적재 공간에서 발생할 수 있는 안전사고를 예방하기 위한 인공지능 기반 컨테이너 적재 안전관리 시스템을 제안한다. 이 시스템은 인공지능 기반 컨테이너 안전사고 위험도 분류 및 저장 기능과 실시간 안전사고 모니터링 기능으로 구성되어 있다. 이 시스템은 실시간으로 현장의 사고 위험도를 모니터링하며 이를 통해 컨테이너 붕괴사고를 예방할 수 있다. 제안된 시스템은 프로토타입으로 개발되어 직접 항만에 적용하여 시스템을 평가하였다.

Improving the Performance of Radiologists Using Artificial Intelligence-Based Detection Support Software for Mammography: A Multi-Reader Study

  • Jeong Hoon Lee;Ki Hwan Kim;Eun Hye Lee;Jong Seok Ahn;Jung Kyu Ryu;Young Mi Park;Gi Won Shin;Young Joong Kim;Hye Young Choi
    • Korean Journal of Radiology
    • /
    • 제23권5호
    • /
    • pp.505-516
    • /
    • 2022
  • Objective: To evaluate whether artificial intelligence (AI) for detecting breast cancer on mammography can improve the performance and time efficiency of radiologists reading mammograms. Materials and Methods: A commercial deep learning-based software for mammography was validated using external data collected from 200 patients, 100 each with and without breast cancer (40 with benign lesions and 60 without lesions) from one hospital. Ten readers, including five breast specialist radiologists (BSRs) and five general radiologists (GRs), assessed all mammography images using a seven-point scale to rate the likelihood of malignancy in two sessions, with and without the aid of the AI-based software, and the reading time was automatically recorded using a web-based reporting system. Two reading sessions were conducted with a two-month washout period in between. Differences in the area under the receiver operating characteristic curve (AUROC), sensitivity, specificity, and reading time between reading with and without AI were analyzed, accounting for data clustering by readers when indicated. Results: The AUROC of the AI alone, BSR (average across five readers), and GR (average across five readers) groups was 0.915 (95% confidence interval, 0.876-0.954), 0.813 (0.756-0.870), and 0.684 (0.616-0.752), respectively. With AI assistance, the AUROC significantly increased to 0.884 (0.840-0.928) and 0.833 (0.779-0.887) in the BSR and GR groups, respectively (p = 0.007 and p < 0.001, respectively). Sensitivity was improved by AI assistance in both groups (74.6% vs. 88.6% in BSR, p < 0.001; 52.1% vs. 79.4% in GR, p < 0.001), but the specificity did not differ significantly (66.6% vs. 66.4% in BSR, p = 0.238; 70.8% vs. 70.0% in GR, p = 0.689). The average reading time pooled across readers was significantly decreased by AI assistance for BSRs (82.73 vs. 73.04 seconds, p < 0.001) but increased in GRs (35.44 vs. 42.52 seconds, p < 0.001). Conclusion: AI-based software improved the performance of radiologists regardless of their experience and affected the reading time.

AI기반 교량설계 프로세스 자동화를 위한 강화학습 알고리즘과 외부 해석프로그램 간 인터페이스 구축 (Interface Establishment between Reinforcement Learning Algorithm and External Analysis Program for AI-based Automation of Bridge Design Process)

  • 김민수;최상현
    • 한국전산구조공학회논문집
    • /
    • 제34권6호
    • /
    • pp.403-408
    • /
    • 2021
  • 현재 교량과 같은 토목구조물의 설계프로세스는 1차 설계 후 구조 검토를 수행하여 기준에 부적합할 경우 재설계하는 과정을 반복하여 최종적인 성과품을 만드는 것이 일반적이다. 이러한 반복 과정은 설계에 소요되는 기간을 연장시키는 원인이 되며, 보다 수준 높은 설계를 위해 투입되어야 할 고급 엔지니어링 인력을 기계적인 단순 반복 작업에 소모하고 있다. 이러한 문제는 설계 과정 자동화를 통하여 해결할 수 있으나, 설계 과정에서 사용되는 해석프로그램은 이러한 자동화에 가장 큰 장애요인이 되어 왔다. 본 연구에서는 기존 설계 과정 중 반복작업을 대체하고자 강화학습 알고리즘과 외부 해석프로그램을 함께 제어할 수 있는 인터페이스를 포함한 교량설계 프로세스에 대한 AI기반 자동화 시스템을 구축하였다. 이 연구를 통하여 구축된 시스템의 프로토타입은 2경간 RC라멘교를 대상으로 제작하였다. 개발된 인터페이스 체계는 향후 최신 AI 및 타 형식의 교량설계 간 연계를 위한 기초기술로써 활용될 수 있을 것으로 판단된다.

CNN-LSTM 기반의 상지 재활운동 실시간 모니터링 시스템 (CNN-LSTM-based Upper Extremity Rehabilitation Exercise Real-time Monitoring System)

  • 김재정;김정현;이솔;서지윤;정도운
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.134-139
    • /
    • 2023
  • 재활환자는 수술 치료 후 신속한 사회복귀를 목적으로 신체적 기능 회복을 위하여 통원치료 및 일상에서 재활운동을 수행한다. 병원에서 전문 치료사의 도움으로 운동을 수행하는 것과 달리 일상에서 환자 스스로 재활운동을 수행하는 것은 많은 어려움이 있다. 본 논문에서는 일상에서 환자 스스로 효율적이고 올바른 자세로 재활운동을 수행할 수 있도록 CNN-LSTM 기반의 상지 재활운동 실시간 모니터링 시스템을 제안한다. 제안한 시스템은 EMG, IMU가 탑재된 어깨 착용형 하드웨어를 통해 생체신호를 계측하고 학습을 위한 전처리 과정과 정규화를 진행하여 학습 데이터세트로 사용하였다. 구현된 모델은 특징 검출을 위한 3개 합성곱 레이어 3개의 폴링 레이어, 분류를 위한 2개의 LSTM 레이어로 구성되어 있으며 검증 데이터에 대한 학습 결과 97.44%를 확인할 수 있었다. 이후 Teachable machine과의 비교평가를 진행하였으며 비교평가 결과 구현된 모델은 93.6%, Teachable machine은 94.4%로 두 모델이 유사한 분류 성능을 나타내는 것을 확인하였다.

대형 사전훈련 모델의 파인튜닝을 통한 강건한 한국어 음성인식 모델 구축 (Building robust Korean speech recognition model by fine-tuning large pretrained model)

  • 오창한;김청빈;박기영
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.75-82
    • /
    • 2023
  • 자동 음성 인식(automatic speech recognition, ASR)은 딥러닝 기반 접근 방식으로 혁신되었으며, 그중에서도 자기 지도 학습 방법이 특히 효과적일 수 있음이 입증되고 있다. 본 연구에서는 다국어 ASR 시스템인 OpenAI의 Whisper 모델의 한국어 성능을 향상시키는 것을 목표하여 다국어 음성인식 시스템에서의 비주류 언어의 성능 문제를 개선하고자 한다. Whisper는 대용량 웹 음성 데이터 코퍼스(약 68만 시간)에서 사전 학습되었으며 주요 언어에 대한 강력한 인식 성능을 입증했다. 그러나 훈련 중 주요 언어가 아닌 한국어와 같은 언어를 인식하는 데 어려움을 겪을 수 있다. 우리는 약 1,000시간의 한국어 음성으로 구성된 추가 데이터 세트로 Whisper 모델을 파인튜닝하여 이 문제를 해결한다. 또한 동일한 데이터 세트를 사용하여 전체 훈련된 Transformer 모델을 베이스 라인으로 선정하여 성능을 비교한다. 실험 결과를 통해 Whisper 모델을 파인튜닝하면 문자 오류율(character error rate, CER) 측면에서 한국어 음성 인식 기능이 크게 향상되었음을 확인할 수 있다. 특히 모델 크기가 증가함에 따라 성능이 향상되는 경향을 포착하였다. 그러나 Whisper 모델의 영어 성능은 파인튜닝 후 성능이 저하됨을 확인하여 강력한 다국어 모델을 개발하기 위한 추가 연구의 필요성을 확인할 수 있었다. 추가적으로 우리의 연구는 한국어 음성인식 애플리케이션에 파인튜닝된 Whisper 모델을 활용할 수 있는 가능성을 확인할 수 있다. 향후 연구는 실시간 추론을 위한 다국어 인식과 최적화에 초점을 맞춰 실용적 연구를 이어갈 수 있겠다.