• 제목/요약/키워드: Deep Learning AI

검색결과 622건 처리시간 0.025초

자동-레이블링 기반 영상 학습데이터 제작 시스템 (An Auto-Labeling based Smart Image Annotation System)

  • 이용;장래영;박민우;이건우;최명석
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.701-715
    • /
    • 2021
  • 최근 딥러닝 기술의 급속한 발전과 함께 학습데이터가 크게 주목을 받고 있다. 일반적으로 딥러닝 방식에서는 모델을 훈련시키기 위해 충분한 학습데이터가 준비되어 있어야 한다. 하지만, 딥러닝 모델 설계 작업과 달리 데이터셋을 제작하는 데 상당한 시간과 노력이 필요하다. 영상 데이터를 주로 다루는 시각지능 분야에서도 학습데이터 제작자들은 전문적인 학습데이터 제작 도구를 사용해 이미지 단위로 레이블링을 수작업으로 하고 있어 여전히 많은 시간과 노력이 필요한 상황이다. 따라서, 다양한 분야에서 필요한 충분한 영상 학습데이터셋을 확보하기 위해 기존의 수작업 방식을 대체할 수 있는 레이블링 기술이 필요하다. 본 논문에서는, 영상 학습데이터셋 동향을 소개하고, 학습데이터 제작 환경에 대해 분석한다 특히, 수작업으로 이루어지는 반복적이고 수고스러운 레이블링 과정을 자동화하여, '확인과 수정'의 단계를 비약적으로 단축시킬 수 있는 '스마트 영상학습데이터 제작 시스템'을 제안한다. 그리고, 실험을 통해 영상 학습데이터 제작 과정에서 이미지에 박스형 및 폴리곤형 객체영역을 지정하여 레이블링하는 데 소요되는 시간을 크게 줄이기 위한 자동레이블링 방식의 효과를 검증한다. 마지막으로, 제안하는 시스템의 실험에서 추가적으로 검증되어야 하는 부분과 함께 이를 개선하기 위한 향후 연구 계획에 대해 논의한다.

공공 다중CCTV 기반에서 재식별 기술을 활용한 특정대상 탐지 및 추적기법 구현 (Implementation of Specific Target Detection and Tracking Technique using Re-identification Technology based on public Multi-CCTV)

  • 황주성;뉴엔탄하이;강수경;김영규;김주용;정명석;이주연
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.49-57
    • /
    • 2022
  • 정부에서는 전국에 설치된 공공 CCTV를 이용하여 실종아동 등 범죄 예방을 위하여 많은 노력을 하고 있다. 하지만, 운용인력의 부족과 장시간 집중에 따른 집중력 약화 그리고 추적의 어려움 등이 나타나고 있다. 또한, 딥러닝 알고리즘을 통하여 실시간 객체 탐색 및 재인식 그리고 추적을 적용하는 것은 복잡한 신경망 분석의 사유로 파라미터가 증가하고 속도감소 메모리 부족이라는 현상을 나타냈다. 본 논문에서는 실시간 객체 인식이 가능한 Yolo의 적용과 Batch 및 TensorRT 기술 적용을 통하여 신경망을 경량화를 통하여 속도 개선 및 메모리 절약이 가능하도록 설계하였다. 이 논문에서는 이러한 발전된 알고리즘의 연구를 바탕으로 K-reciprocal nearest neighbor 알고리즘, Jaccard distance 비유사도 측정 알고리즘, 산출물 알고리즘 등을 개발하여 공공 CCTV 식별추적시스템 구축을 제시하였다. 그 결과, 비교분석을 통한 알고리즘 조합을 통해 공공 다중CCTV환경에서 실시간으로 객체를 인식하고 재식별하여 객체를 추적할 수 있는 한국형 공공 추적시스템을 제안하였다.

멀티모달 맥락정보 융합에 기초한 다중 물체 목표 시각적 탐색 이동 (Multi-Object Goal Visual Navigation Based on Multimodal Context Fusion)

  • 최정현;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.407-418
    • /
    • 2023
  • MultiOn(Multi-Object Goal Visual Navigation)은 에이전트가 미지의 실내 환경 내 임의의 위치에 놓인 다수의 목표 물체들을 미리 정해준 일정한 순서에 따라 찾아가야 하는 매우 어려운 시각적 탐색 이동 작업이다. MultiOn 작업을 위한 기존의 모델들은 행동 선택을 위해 시각적 외관 지도나 목표 지도와 같은 단일 맥락 지도만을 이용할 뿐, 다양한 멀티모달 맥락정보에 관한 종합적인 관점을 활용할 수 없다는 한계성을 가지고 있다. 이와 같은 한계성을 극복하기 위해, 본 논문에서는 MultiOn 작업을 위한 새로운 심층 신경망 기반의 에이전트 모델인 MCFMO(Multimodal Context Fusion for MultiOn tasks)를 제안한다. 제안 모델에서는 입력 영상의 시각적 외관 특징외에 환경 물체의 의미적 특징, 목표 물체 특징도 함께 포함한 멀티모달 맥락 지도를 행동 선택에 이용한다. 또한, 제안 모델은 점-단위 합성곱 신경망 모듈을 이용하여 3가지 서로 이질적인 맥락 특징들을 효과적으로 융합한다. 이 밖에도 제안 모델은 효율적인 이동 정책 학습을 유도하기 위해, 목표 물체의 관측 여부와 방향, 그리고 거리를 예측하는 보조 작업 학습 모듈을 추가로 채용한다. 본 논문에서는 Habitat-Matterport3D 시뮬레이션 환경과 장면 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 모델의 우수성을 확인하였다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.

Deep Learning Algorithm for Simultaneous Noise Reduction and Edge Sharpening in Low-Dose CT Images: A Pilot Study Using Lumbar Spine CT

  • Hyunjung Yeoh;Sung Hwan Hong;Chulkyun Ahn;Ja-Young Choi;Hee-Dong Chae;Hye Jin Yoo;Jong Hyo Kim
    • Korean Journal of Radiology
    • /
    • 제22권11호
    • /
    • pp.1850-1857
    • /
    • 2021
  • Objective: The purpose of this study was to assess whether a deep learning (DL) algorithm could enable simultaneous noise reduction and edge sharpening in low-dose lumbar spine CT. Materials and Methods: This retrospective study included 52 patients (26 male and 26 female; median age, 60.5 years) who had undergone CT-guided lumbar bone biopsy between October 2015 and April 2020. Initial 100-mAs survey images and 50-mAs intraprocedural images were reconstructed by filtered back projection. Denoising was performed using a vendor-agnostic DL model (ClariCT.AITM, ClariPI) for the 50-mAS images, and the 50-mAs, denoised 50-mAs, and 100-mAs CT images were compared. Noise, signal-to-noise ratio (SNR), and edge rise distance (ERD) for image sharpness were measured. The data were summarized as the mean ± standard deviation for these parameters. Two musculoskeletal radiologists assessed the visibility of the normal anatomical structures. Results: Noise was lower in the denoised 50-mAs images (36.38 ± 7.03 Hounsfield unit [HU]) than the 50-mAs (93.33 ± 25.36 HU) and 100-mAs (63.33 ± 16.09 HU) images (p < 0.001). The SNRs for the images in descending order were as follows: denoised 50-mAs (1.46 ± 0.54), 100-mAs (0.99 ± 0.34), and 50-mAs (0.58 ± 0.18) images (p < 0.001). The denoised 50-mAs images had better edge sharpness than the 100-mAs images at the vertebral body (ERD; 0.94 ± 0.2 mm vs. 1.05 ± 0.24 mm, p = 0.036) and the psoas (ERD; 0.42 ± 0.09 mm vs. 0.50 ± 0.12 mm, p = 0.002). The denoised 50-mAs images significantly improved the visualization of the normal anatomical structures (p < 0.001). Conclusion: DL-based reconstruction may enable simultaneous noise reduction and improvement in image quality with the preservation of edge sharpness on low-dose lumbar spine CT. Investigations on further radiation dose reduction and the clinical applicability of this technique are warranted.

RNN을 이용한 제2형 당뇨병 예측모델 개발 (Development of T2DM Prediction Model Using RNN)

  • 장진수;이민준;이태노
    • 디지털융복합연구
    • /
    • 제17권8호
    • /
    • pp.249-255
    • /
    • 2019
  • 제2형 당뇨병은 고혈당이 특징인 대사성 분비 장애로 여러 합병증을 야기하는 질병이며, 장기적인 치료가 필요하기 때문에 매년 많은 의료비를 지출한다. 이를 해결하기 위해 많은 연구들이 있어왔지만, 기존의 연구들은 한 시점에서의 데이터를 학습시켜 예측함으로써 정확도가 높지 않았다. 그래서 본 연구는 제2형 당뇨병 발생 예측에 대한 정확도를 높이기 위하여 RNN을 이용한 모델을 제안하였다. 본 모델을 개발하기 위해 한국인유전체역학조사 지역사회 코호트(안산 안성) 데이터를 이용하였으며, 시간의 흐름에 따른 데이터들을 모두 학습시켜 당뇨병 발생 예측모델을 만들었다. 예측 모델의 성능을 검증하기 위해 기존의 기계 학습 방법인 LR, k-NN, SVM과 정확도를 비교하였다. 비교한 결과 제안한 예측모델의 accuracy는 0.92, AUC는 0.92로 다른 기계 학습 방법보다 높은 정확도를 보였다. 따라서 본 연구에서 제안한 제2형 당뇨병 발생 예측 모델을 활용하여 발병을 조기 예측함으로써 생활습관 개선 및 혈당조절을 통해 당뇨병 발병을 예방하고 늦출 수 있을 것이다.

선형 판별 분석 및 k-means 알고리즘을 이용한 적대적 공격 유형 분류 방안 (An Adversarial Attack Type Classification Method Using Linear Discriminant Analysis and k-means Algorithm)

  • 최석환;김형건;최윤호
    • 정보보호학회논문지
    • /
    • 제31권6호
    • /
    • pp.1215-1225
    • /
    • 2021
  • 인공지능 기술은 우수한 성능을 기반으로 다양한 분야에 적용되고 있지만 입력 데이터에 인간이 감지할 수 없는 적대적 섭동을 추가하여 인공지능 모델의 오작동을 유도하는 적대적 예제에 취약하다. 현재까지 적대적 예제에 대응하기 위한 방법은 세 가지 범주로 분류할 수 있다. (1) 모델 재학습 방법; (2) 입력 변환 방법; (3) 적대적 예제 탐지 방법. 이러한 적대적 예제에 대응하기 위한 방법은 끊임없이 등장하고 있지만 각 적대적 공격 유형을 분류하는 연구는 미비한 실정이다. 따라서, 본 논문에서는 차원 축소와 군집화 알고리즘을 활용한 적대적 공격 유형 분류 방법을 제안한다. 구체적으로, 제안하는 방법은 적대적 예시로부터 적대적 섭동을 추출하고 선형 판별 분석(LDA)를 통해 적대적 섭동의 차원을 축소한 후에 k-means 알고리즘으로 적대적 공격 유형 분류를 수행한다. MNIST 데이터셋과 CIFAR-10 데이터셋을 대상으로 한 실험을 통해, 제안하는 기법은 5개의 적대적 공격(FGSM, BIM, PGD, DeepFool, C&W)을 효율적으로 분류할 수 있으며, 적대적 예제에 대한 정상 입력을 알 수 없는 제한적인 상황에서도 우수한 분류 성능을 나타내는 것을 확인하였다.

인공지능 기반 임상의학 결정 지원 시스템 의료기기의 성능 및 안전성 검증을 위한 간 종양 표준 데이터셋 구축 (Construction of a Standard Dataset for Liver Tumors for Testing the Performance and Safety of Artificial Intelligence-Based Clinical Decision Support Systems)

  • 김승섭;이동호;이민우;김소연;신재승;최진영;최병욱
    • 대한영상의학회지
    • /
    • 제82권5호
    • /
    • pp.1196-1206
    • /
    • 2021
  • 목적 간 종양의 조영증강 컴퓨터단층촬영(이하 CT) 영상에 관한 인공지능 알고리즘의 성능과 안전성을 검증할 수 있는 표준 테스팅 데이터셋을 구축하고자 하였다. 대상과 방법 국내 4개 3차 의료기관의 복부 영상의학 전문가 4인이 모여 간 종양 진단 알고리즘의 성능과 안전성을 검증하기 위해 표준 데이터셋이 갖춰야 할 조건을 논의하였다. 각 기관마다 간세포암 75예, 전이암 75예, 그리고 양성 병변 30-50예씩 수집하여, 총 783명 환자의 CT 영상을 대상으로 하였다. 간세포암과 전이암의 경우 병리학적으로 확진된 경우만을 대상으로 하였다. 각 기관의 복부 영상의학 전문가들이 직접 환자의 임상정보를 추출하고 CT 영상에 관한 데이터 라벨링(labeling)을 수기로 시행하였다. CT 영상은 의료용 디지털 영상 및 통신(Digital Imaging and Communications in Medicine, DICOM) 파일로 저장하였다. 결과 복부 영상의학 전문가들이 수기 데이터 라벨링을 시행한 총 783 증례의 간 종양 조영증강 CT의 표준 데이터셋을 구축하였다. 알고리즘의 성능 및 안전성은 병변의 발견 여부 및 특성화의 정확도에 대해 민감도와 특이도를 계산하여 평가할 수 있다. 결론 본 연구에서 구축한 간 종양 조영증강 CT 영상의 표준 데이터셋은 임상의학 결정 지원시스템을 위한 기계학습 기반 인공지능 알고리즘을 평가하는 데에 활용될 수 있다.

자율주행 차량의 학습 데이터 자동 생성 시스템 개발 (Development of Autonomous Vehicle Learning Data Generation System)

  • 윤승제;정지원;홍준;임경일;김재환;김형주
    • 한국ITS학회 논문지
    • /
    • 제19권5호
    • /
    • pp.162-177
    • /
    • 2020
  • 자율주행시스템에서 다양한 센서를 기반으로 한 외부환경 인지는 주행안전성과 직접적인 관계가 있다. 최근 머신러닝/심층 신경망 기술의 발전으로 심층 신경망 기반의 인지 모델이 사용됨에 따라, 인지 알고리즘의 올바른 학습과 이를 위한 양질의 학습데이터가 필수적으로 요구된다. 그러나 자율주행에 발생할 수 있는 모든 상황을 데이터를 수집하는 것은 현실적인 어려움이 많다. 해외와 국내의 교통 환경의 차이로 인지 모델의 성능이 저하되기도 하며, 센서가 정상동작을 못하는 악천우에 대한 데이터는 수집이 어려우며 질적인 부분을 보장하지 못한다. 때문에, 실제 도로가 아닌 시뮬레이터 내 가상 도로 환경을 구축하여 합성 데이터를 수집하는 접근법이 필요하다. 본 논문에서는 국내 실정에 맞게 국내 도로 상황을 모사한 시뮬레이터 환경 안에 날씨와 조도, 차량의 종류와 대수, 센서의 위치를 다양화하여 학습데이터를 수집하였고, 보다 더 좋은 성능을 위해 적대적 생성 모델을 활용하여 이미지의 도메인을 보다 실사에 가깝게 바꾸고 다양화 하였다. 그리고 위 데이터로 학습한 인지 모델을 실제 도로 환경에서 수집한 시험 데이터에 성능 평가를 진행하여, 실제 환경 데이터만으로 학습한 모델과 비슷한 성능을 내는 것을 보였다.

딥러닝 기반 터널 영상유고감지 시스템 개발 연구 (Development of a deep-learning based tunnel incident detection system on CCTVs)

  • 신휴성;이규범;임민진;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제19권6호
    • /
    • pp.915-936
    • /
    • 2017
  • 본 논문에서는 2016년을 기준으로 강화된 터널 방재시설 설치 및 관리지침과, 점차 강화되고 있는 터널 CCTV설치 터널등급 기준과 터널 영상유고감지 시스템의 설치 운용에 대한 요구의 증가 상황을 정리해 보고하였다. 그럼에도, 가동중인 알고리즘 기반의 터널 영상유고감시 시스템의 정상 인지율은 50%가 채 되지 않는 것으로 파악되었으며, 그에 대한 주원인은 터널 내 낮은 조도, 심한 먼지로 인한 영상 선명도 저하, 낮은 CCTV 설치위치로 인한 이동객체의 겹침현상 등으로 파악되었다. 따라서, 본 연구에서는 이러한 열악한 조건에서도 영상유고 정상 인지율을 확보할 수 있는 딥러닝 기반 영상유고감지 시스템을 개발하였으며, 이에 대한 이론적 배경 제시와 시스템의 타당성 검토 연구가 진행되었다. 개발 시스템의 타당성 검토 연구는 터널 방재시설 및 관리지침 내 영상유고감지 항목중 정지 및 역주행 차량을 감지하는 주요 정보인 차량 객체 인식과 보행자 감지를 중심으로 진행되었다. 또한, (1) 동일 터널 내에서 학습과 추론이 이루어 지는 경우와 (2) 다양한 터널의 영상 정보를 통합 학습하고, 각 터널의 영상유고감지에 투입되는 경우, 두개의 시나리오를 설정하여 타당성 검토를 진행하였다. 두 시나리오 모두 일정 시간의 학습 자료와 유사한 상황에 대해서는 열악한 터널환경과 무관하게 그 감지성능이 80% 이상으로 우수하나, 추가 학습 없이 학습된 시간 구간과 멀어질수록 그 추론 성능은 상대적으로 낮은 40% 수준으로 떨어짐을 알 수 있었다. 그러나, 시간이 지남에 따라 자동으로 누적되어 확장되는 영상유고 빅데이터를 반복적으로 학습함으로써, 설치된 영상유고감지 시스템의 보완이나 보정절차 없이도 자동으로 그 영상유고감지 성능이 향상될 수 있음을 보였다.