• 제목/요약/키워드: 딥러닝 모델

검색결과 2,105건 처리시간 0.03초

치매 환자를 포함한 한국 노인 음성 데이터 딥러닝 기반 음성인식 (Deep learning-based speech recognition for Korean elderly speech data including dementia patients)

  • 문정현;강준서;김기웅;배종빈;이현준;임창원
    • 응용통계연구
    • /
    • 제36권1호
    • /
    • pp.33-48
    • /
    • 2023
  • 본 연구에서는 발화자가 동물이나 채소와 같은 일련의 단어를 무작위로 일 분 동안 말하는 한국어 음성 데이터에 대한 자동 음성 인식(ASR) 문제를 고려하였다. 발화자의 대부분은 60세 이상의 노인이며 치매 환자를 포함하고 있다. 우리의 목표는 이러한 데이터에 대한 딥러닝 기반 자동 음성 인식 모델을 비교하고 성능이 좋은 모델을 찾는 것이다. 자동 음성 인식은 컴퓨터가 사람이 말하는 말을 자동으로 인식하여 음성을 텍스트로 변환할 수 있는 기술이다. 최근 들어 자동 음성 인식 분야에서 성능이 좋은 딥러닝 모델들이 많이 개발되어 왔다. 이러한 딥러닝 모델을 학습시키기 위한 데이터는 대부분 대화나 문장 형식으로 이루어져 있다. 게다가, 발화자들 대부분은 어휘를 정확하게 발음할 수 있어야 한다. 반면에, 우리 데이터의 발화자 대부분은 60세 이상의 노인으로 발음이 부정확한 경우가 많다. 또한, 우리 데이터는 발화자가 1분 동안 문장이 아닌 일련의 단어를 무작위로 말하는 한국어 음성 데이터이다. 따라서 이러한 일반적인 훈련 데이터를 기반으로 한 사전 훈련 모델은 본 논문에서 고려하는 우리 데이터에 적합하지 않을 수 있으므로, 우리는 우리의 데이터를 사용하여 딥러닝 기반 자동 음성 인식 모델을 처음부터 훈련한다. 또한 데이터 크기가 작기 때문에 일부 데이터 증강 방법도 적용한다.

드론 촬영 이미지 데이터를 기반으로 한 도로 균열 탐지 딥러닝 모델 개발 (Development of Deep Learning Model for Detecting Road Cracks Based on Drone Image Data)

  • 권영주;문성호
    • 토지주택연구
    • /
    • 제14권2호
    • /
    • pp.125-135
    • /
    • 2023
  • 드론은 국토조사, 수송, 해양, 환경, 방재, 문화재, 건설 등 다양한 분야에서 활용되고 있다. 또한 사물인터넷(Internet of Things), 인공지능(Artificial Intelligence) 등과 관련하여 4차 산업 혁명의 핵심기술을 검증하고 적용시킬 수 있는 기술로 떠오르고 있다. 본 연구에서는 드론을 활용하여 균열을 자동으로 탐지할 수 있는 딥러닝 모델을 개발하고자 한다. 딥러닝 학습을 위한 이미지 데이터는 Mavic3 드론을 이용하여 수집하였고 촬영고도는 20m, ×7배율로 촬영하였다. 촬영 시 약 2m/s의 속도로 전진하여 영상을 찍고, 프레임을 추출하는 식으로 데이터를 수집하였다. 이런식으로 수집한 데이터를 통해 딥러닝 학습을 진행하였다. 본 연구에서는 딥러닝 학습모델로 Backbone으로는 Swin Transformer, Architecture로 UperNet을 사용하였다. 약 800장의 라벨링 된 데이터를 Augmentation기법으로 데이터 양을 증가시키고 3차에 걸쳐 학습을 진행하였다. 1차와 2차 학습 시 Cross-Entropy loss function을 사용하였고 3차 학습 시 Tversky Loss Function을 사용하였다. 학습결과, 균열 탐지와 균열율을 계산할 수 있는 모델을 개발하였다. 또한, 드론의 위치 정보를 이용해 특정 도로의 한 차선 균열율을 계산할 수 있는 모델을 개발하였다. 향후 추가적인 연구를 통하여 균열탐지모델의 고도화를 사물인터넷(IoT)과의 융합으로 이루었을 때 소파보수(Patching)나 포트홀(Pothole)의 탐지가 가능할 것으로 보인다. 또한 드론의 실시간 탐지 업무수행으로 포장 유지 보수구간에 대한 탐지를 신속하게 확보할 수 있을것으로 기대된다.

Object Detection Performance Analysis between On-GPU and On-Board Analysis for Military Domain Images

  • Du-Hwan Hur;Dae-Hyeon Park;Deok-Woong Kim;Jae-Yong Baek;Jun-Hyeong Bak;Seung-Hwan Bae
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.157-164
    • /
    • 2024
  • 본 논문에서는 제한된 자원을 가진 보드에서 딥러닝 기반 검출기 구축에 대한 실현 가능성에 대해 논의한다. 많은 연구에서 고성능 GPU 환경에서 검출기를 평가하지만, 제한된 연산 자원을 가진 보드에서의 평가는 여전히 미비하다. 따라서 본 연구에서는 검출기를 파싱하고 최적화하는 것으로 보드에 딥러닝 기반 검출기를 구현하고 구축한다. 제한된 자원에서의 딥러닝 기반 검출기의 성능을 확인하기 위해, 여러 검출기를 다양한 하드웨어 자원에서 모니터링하고, COCO 검출 데이터 셋에서 On-Board에서의 검출 모델과 On-GPU의 검출 모델을 mAP, 전력 소모량, 실행 속도(FPS) 관점으로 비교 및 분석한다. 그리고 군사 분야에 검출기를 적용한 효과를 고려하기 위해 항공 전투 시나리오를 고려할 수 있는 열화상 이미지로 구성된 자체 데이터 셋에서 검출기를 평가한다. 결과적으로 우리는 본 연구를 통해 On-Board에서 모델을 실행하는 딥러닝 기반 검출기의 강점을 조사하고, 전장 상황에서 딥러닝 기반 검출기가 기여할 수 있음을 보인다.

다중분광밴드 위성영상의 작물재배지역 추출을 위한 Attention Gated FC-DenseNet (Attention Gated FC-DenseNet for Extracting Crop Cultivation Area by Multispectral Satellite Imagery)

  • 성선경;모준상;나상일;최재완
    • 대한원격탐사학회지
    • /
    • 제37권5_1호
    • /
    • pp.1061-1070
    • /
    • 2021
  • 본 연구에서는 국내 농업지역에 대한 작물재배지역의 분류를 위하여 FC-DenseNet 모델에 attention gate를 적용하여 딥러닝 모델의 성능을 향상시키고자 하였다. Attention gate는 특징맵의 공간/분광적 중요도에 따른 가중치를 추가적으로 학습하여 딥러닝 모델의 학습을 용이하게 하고, 모델의 성능을 향상시킬 수 있다. Attention gate를 FC-DenseNet의 스킵 연결 부분에 추가한 딥러닝 모델을 이용하여 양파 및 마늘 지역의 작물분류를 수행하였다. PlanetScope 위성영상을 이용하여 훈련자료를 제작하였으며, 훈련자료의 불균형 문제를 해결하기 위하여 전처리 과정을 적용하였다. 다양한 평가자료를 이용하여 작물재배분류 결과를 평가한 결과, 제안된 딥러닝 모델은 기존의 FC-DenseNet과 비교하여 효과적으로 양파 및 마늘 지역을 분류할 수 있는 것을 확인하였다.

사회적 변수와 개개인의 감정지수를 함께 고려한 딥러닝 기반 행복 지수 모델 설계 (Deep Learning-based Happiness Index Model Considering Social Variables and Individual Emotional Index)

  • 오수민;박민서
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.489-493
    • /
    • 2024
  • 행복 지수는 집단적인 행복 정도를 직관적으로 파악하는데 효과적인 측정 시스템이다. 가치관의 변화에 따라행복 지수에 행동의 가치를 추가한 연구들이 제안되고 있으나, 개인이 느끼는 감정을 활용하여 관계성을 분석한 연구는 부족한 실정이다. 따라서 본 연구는 행동의 가치를 나타내는 사회적 변수와 개개인의 감정지수를 함께 고려해 행복 지수를 예측하는 딥러닝 모델을 설계한다. 첫째, 2005년 1월 ~ 2020년 12월의 사회적, 감정적 변수를 수집한다. 둘째, 데이터 전처리 및 유의변수 탐색을 수행한다. 셋째, 딥러닝 기반의 회귀 모델로 학습하고, 5-Fold 교차 검증(Cross Validation)으로 학습 모델을 평가한다. 본 연구의 제안 모델은 테스트 데이터에서 90.65%의 높은 예측 정확도를 보인다. 향후 이 연구는 국가별 데이터로 확대 적용하여 행복 지수 주요 요인 분석 등의 연구에 활용될 수 있을 것으로 기대된다.

임베디드 환경에서 딥러닝을 이용한 얼굴 검출 (Face Detection using Deep Learning in Embedded Platform)

  • 박명숙;김상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.827-829
    • /
    • 2018
  • 최근 몇 년 동안 딥러닝 기법을 이용한 객체 검출이 뛰어난 성능을 보여주었다. 얼굴 검출은 도전적인 문제로 많은 연구가 되고 있다. 본 논문에서는 임베디드 환경에서 적용할 수 있는 객체 검출을 위한 딥러닝 방법을 살펴보고, 얼굴 데이터 셋을 이용하여 훈련시켜 얼굴 검출에 적용한다. 훈련된 모델의 크기는 임베디드 환경에 적합한 메모리 요구량을 보여준다.

딥러닝 기반 지하공동구 화재 탐지 모델 개발 : 학습데이터 보강 및 편향 최적화 (Development of Fire Detection Model for Underground Utility Facilities Using Deep Learning : Training Data Supplement and Bias Optimization)

  • 김정수;이찬우;박승화;이종현;홍창희
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.320-330
    • /
    • 2020
  • 화재는 높은 비정형성으로 인해 딥러닝 모델을 이용한 영상인식 분야에서도 좋은 성능을 내기가 어려운 대상 중 하나이다. 특히 지하공동구 내 화재는 딥러닝 모델의 학습을 위한 화재 데이터 확보가 어렵고 열약한 영상 조건 및 화재로 오인할 수 있는 객체가 많아 화재 검출이 어렵고 성능이 낮다. 이러한 이유로 본 연구는 딥러닝 기반의 지하공동구 내 화재 탐지 모델을 제안하고, 제안된 모델의 성능을 평가하였다. 기존 합성곱 인공신경망에 GoogleNet의 Inception block과 ResNet의 skip connection을 조합하여 어두운 환경에서 발생되는 화재 탐지를 위한 모델 구조를 제안하였으며, 제안된 모델을 효과적으로 학습시키기 위한 방법도 함께 제시하였다. 제안된 방법의 효과를 평가하기 위해 학습 후 모델을 지하공동구 및 유사환경 조건의 화재 문제와 화재로 오인할 수 있는 객체를 포함한 이미지에 적용해 결과를 분석하였다. 또한 기존 딥러닝 기반 화재 탐지 모델의 정밀도, 검출률 지표와 비교함으로써 모델의 화재 탐지 성능을 정량적으로 평가하였다. 제안된 모델의 결과는 어두운 환경에서 발생되는 화재 문제에 대해 높은 정밀도와 검출률을 나타내었으며, 유사 화재 객체에 대해 낮은 오탐 및 미탐 성능을 가지고 있음을 보여주었다.

이중 딥러닝 기법을 활용한 지하공동구 작업자의 쓰러짐 검출 연구 (A Study on Falling Detection of Workers in the Underground Utility Tunnel using Dual Deep Learning Techniques)

  • 김정수;박상미;홍창희
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.498-509
    • /
    • 2023
  • 연구목적: 본 논문은 CCTV 영상을 활용한 딥러닝 객체 인식 기술을 적용해 지하공동구 내 쓰러진 관리인력의 검출 방법을 제시하고, 제안 방법의 관리인력 모니터링 적용성을 평가한다. 연구방법: 사람 검출 목적으로 사전 훈련된 YOLOv5와 OpenPose 모델의 추론 결과로부터 쓰러짐을 판별할 수 있는 규칙을 제안하고, 각 모델의 결과를 통합해 지하공동구 내 작업자 쓰러짐 검출에 적용하였다. 연구결과: 제안된 모델로 작업인력의 감지 및 쓰러짐을 판단할 수 있었으나, CCTV와 작업자 간격 및 작업자가 쓰러진 방향에 의존해 검출성능이 영향을 받았다. 또한 지하공동구 작업자에 대해 YOLOv5 기반 쓰러짐 판별 규칙 적용 모델이 거리 및 쓰러짐 방향 의존성이 낮아 OpenPose 기반 모델에 비해 우수한 성능을 보였다. 그 결과 통합된 이중 딥러닝 모델의 쓰러짐 검출 결과는 YOLOv5 결과에 종속되었다. 결론: 제안 모델을 통해 지하공동구 작업자의 이상상황 검출이 가능함을 보였으나, 개별 딥러닝 모델별 사람 감지 성능 차이로 인해 YOLOv5 기반 모델 대비 통합 모델의 쓰러짐 검출 성능 개선은 미미하였다.

A Study on the Efficacy of Edge-Based Adversarial Example Detection Model: Across Various Adversarial Algorithms

  • Jaesung Shim;Kyuri Jo
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.31-41
    • /
    • 2024
  • 딥러닝 모델(Deep Learning Model)은 컴퓨터 비전(Computer Vision) 분야의 이미지(Image) 분류 및 객체 탐지와 같은 작업에서 뛰어난 성과를 보이며, 실제 산업 현장에서 다양하게 활용되고 있다. 최근 다양한 알고리즘(Algorithm)의 적대적 예제를 이용하여 딥러닝 모델의 취약성을 지적하며, 강건성 향상 방안을 제시하는 연구들이 활발하게 진행되고 있다. 적대적 예제는 오분류를 유도하기 위해 작은 노이즈(Noise)가 추가된 이미지로서, 딥러닝 모델을 실제 환경에 적용 시 중대한 위협이 될 수 있다. 본 논문에서는 다양한 알고리즘의 적대적 예제를 대상으로 에지 학습 분류 모델의 강건성 및 이를 이용한 적대적 예제 탐지 모델의 성능을 확인하고자 하였다. 강건성 실험 결과, FGSM(Fast Gradient Sign Method) 알고리즘에 대하여 기본 분류 모델이 약 17%의 정확도를 보였으나, 에지(Edge) 학습 모델들은 60~70%대의 정확도를 유지하였고, PGD(projected gradient descent)/DeepFool/CW(Carlini-Wagner) 알고리즘에 대해서는 기본 분류 모델이 0~1%의 정확도를 보였으나, 에지 학습 모델들은 80~90%의 정확도를 유지하였다. 적대적 예제 탐지 실험 결과, FGSM/PGD/DeepFool/CW의 모든 알고리즘에 대해서 91~95%의 높은 탐지율을 확인할 수 있었다. 본 연구를 통하여 다양한 적대적 알고리즘에 대한 방어 가능성을 제시함으로써, 컴퓨터 비전을 활용하는 여러 산업 분야에서 딥러닝 모델의 안전성 및 신뢰성 제고를 기대한다.

콘크리트 교량 상태평가를 위한 딥러닝 기반 손상 탐지 프로토타입 개발 (Development of Deep Learning-Based Damage Detection Prototype for Concrete Bridge Condition Evaluation)

  • 남우석;정현준;박경한;김철민;김규선
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.107-116
    • /
    • 2022
  • 최근 안전점검자가 접근성 문제로 점검이 어려운 교량 부재의 상태평가를 위해 영상분석 기반의 시설물 점검 기법연구가 활발히 진행 중이다. 본 논문은 교량을 대상으로 딥러닝 기반 영상정보에 대해서 상태평가 연구를 진행하였고 이에 대한 평가 프로그램(프로토타입)을 개발하였다. 딥러닝 기반 교량 손상탐지 프로토타입을 개발하기 위해 딥러닝 모델 중 손상 검출 및 정량화가 가능한 의미론적 분할 모델인 Mask-RCNN를 적용하였고 학습데이터 6,540장(오픈 데이터 포함)과 손상유형에 적합한 레이블링을 구성하였다. 모델링에 대한 성능검증한 결과, 콘크리트 균열, 박리/박락, 철근노출과 도장 박리에 대한 정밀도(precision)는 95.2 %, 재현율(recall)은 93.8 % 나타내었다. 또한, 교량 콘크리트 부재 손상율을 이용하여 콘크리트 균열 실 데이터를 2차 성능검증 하였다.