• 제목/요약/키워드: AI 영상인식

검색결과 100건 처리시간 0.022초

인공지능 학습용 토공 건설장비 영상 데이터셋 구축 및 타당성 검토 (Building-up and Feasibility Study of Image Dataset of Field Construction Equipments for AI Training)

  • 나종호;신휴성;이재강;윤일동
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.99-107
    • /
    • 2023
  • 최근 건설 현장의 안전사고 비율은 전체 산업에서 가장 높은 비중을 차지한다. 인공지능 기술을 건설 현장에 접목하기 위해서는 기초 학습 자료로 활용될 수 있는 데이터셋 확보가 필수적이다. 본 논문에서는 실제 현장 확보를 통해 원천 데이터를 수집하였으며, 토목 현장에서 주로 운용되고 있는 주요 건설장비 객체를 선정하고 약 9만장의 정지영상 데이터셋 가공을 통해 최적의 학습 데이터셋 구축을 완료하였다. 또한, 객체 인식분야의 대표적인 모델인 YOLO를 활용하여 구축된 데이터의 검증 작업을 수행하였고 90 % 근접한 검출 성능을 확인해 데이터 신뢰성을 확보하였다. 본 연구에서 사용되는 학습 데이터셋은 공공데이터포털에서 활용 가능하도록 공개를 완료하였다. 본 데이터셋은 향후 건설안전 분야의 객체 인식 기술의 건설현장 적용을 위한 기반 데이터로 활용 가능하리라 판단된다.

재난지역에서의 신속한 건물 피해 정도 감지를 위한 딥러닝 모델의 정량 평가 (Quantitative Evaluations of Deep Learning Models for Rapid Building Damage Detection in Disaster Areas)

  • 서준호;양병윤
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.381-391
    • /
    • 2022
  • 본 연구는 AI 기법 중에 최근 널리 사용되고 있는 딥러닝 모델들을 비교하여 재난으로 인해 손상된 건물의 신속한 감지에 가장 적합한 모델을 선정하는 데 목적이 있다. 먼저, 신속한 객체감지에 적합한 1단계 기반 검출기 중 주요 딥러닝 모델인 SSD-512, RetinaNet, YOLOv3를 후보 모델로 선정하였다. 이 방법들은 1단계 기반 검출기 방식을 적용한 모델로서 객체 인식 분야에 널리 이용되고 있다. 이 모델들은 객체 인식 처리방식의 구조와 빠른 연산의 장점으로 인해 객체 인식 분야에 널리 사용되고 있으나 재난관리에서의 적용은 초기 단계에 머물러 있다. 본 연구에서는 피해감지에 가장 적합한 모델을 찾기 위해 다음과 같은 과정을 거쳤다. 먼저, 재난에 의한 건물의 피해 정도 감지를 위해 재난에 의해 손상된 건물로 구성된 xBD 데이터셋을 활용하여 초고해상도 위성영상을 훈련시켰다. 다음으로 모델 간의 성능을 비교·평가하기 위하여 모델의 감지 정확도와 이미지 처리속도를 정량적으로 분석하였다. 학습 결과, YOLOv3는 34.39%의 감지 정확도와 초당 46개의 이미지 처리속도를 기록하였다. RetinaNet은 YOLOv3보다 1.67% 높은 36.06%의 감지 정확도를 기록하였으나, 이미지 처리속도는 YOLOv3의 3분의 1에 그쳤다. SSD-512는 두 지표에서 모두 YOLOv3보다 낮은 수치를 보였다. 대규모 재난에 의해 발생한 피해 정보에 대한 신속하고 정밀한 수집은 재난 대응에 필수적이다. 따라서 본 연구를 통해 얻은 결과는 신속한 지리정보 취득이 요구되는 재난관리에 효과적으로 활용될 수 있을 것이라 기대한다.

Building Living Lab for Acquiring Behavioral Data for Early Screening of Developmental Disorders

  • Kim, Jung-Jun;Kwon, Yong-Seop;Kim, Min-Gyu;Kim, Eun-Soo;Kim, Kyung-Ho;Sohn, Dong-Seop
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.47-54
    • /
    • 2020
  • 발달장애는 영유아 기부터 시작하는 뇌 신경계 발달장애들의 집합으로 언어 및 의사소통, 인지력, 사회성 등의 측면에서 이루어져야 할 발달이 심하게 지체되거나 성취되지 않은 장애를 의미한다. 이러한 발달장애 진단에는 아동의 얼굴 표정과 같은 감정표현의 의미와 맥락 등 비언어적 반응에 대한 관찰로 이루어진다. 이를 사람이 측정기에는 상당히 주관적인 판단이 개입하게 되어 객관적인 기술이 필요하다. 따라서 본 연구에서는 영유아/아동의 언어, 비언어적 행동 반응을 관찰하는 ADOS(Autism Diagnostic Observation Schedule)와 BeDevel(Behavior Development Screening for Toddler) 검사에서 검사자와 피검사자간의 상호작용이 녹화된 영상을 리빙랩 환경에서 획득하여 인공지능 기반의 비정상적/상동적 행동 인지 기술 개발에 필요한 영상 및 음성 데이터 확보를 목표로 한다.

인공지능 학습용 데이터의 개인정보 비식별화 자동화 도구 개발 연구 - 영상데이터기반 - (Research on the development of automated tools to de-identify personal information of data for AI learning - Based on video data -)

  • 이현주;이승엽;전병훈
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.56-67
    • /
    • 2023
  • 최근 데이터 기반 산업계의 오랜 숙원이었던 개인정보 비식별화가 2020년 8월 데이터3법[1]이 개정되어 명시화 되었다. 4차 산업시대의 원유[2]라 불리는 데이터를 산업 분야에서 활성화할 수 있는 기틀이 되었다. 하지만, 일각에서는 비식별개인정보(personally non-identifiable information)가 정보주체의 기본권 침해를 우려하고 있는 실정이다[3]. 이에 개인정보 비식별화 자동화 도구인 Batch De-Identification Tool을 개발 연구를 수행하였다. 본 연구에서는 첫 번째로, 학습용 데이터 구축을 위해 사람 얼굴(눈, 코, 입) 및 다양한 해상도의 자동차 번호판 등을 라벨링하는 이미지 라벨링 도구를 개발하였다. 두 번째로, 객체 인식 모델을 학습하여 객체 인식 모듈을 실행함으로써 개인정보 비식별화를 수행할 수 있도록 하였다. 본 연구의 결과로 개발된 개인정보 비식별화 자동화 도구는 온라인 서비스를 통해 개인정보 침해 요소를 사전에 제거할 수 있는 가능성을 보여주었다. 이러한 결과는 데이터 기반 산업계에서 개인정보 보호와 활용의 균형을 유지하면서도 데이터의 가치를 극대화할 수 있는 가능성을 제시하고 있다

  • PDF

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

객체 식별 및 추적을 위한 히스토그램 기반 특이값 분해 (Histogram-Based Singular Value Decomposition for Object Identification and Tracking)

  • 강예연;박정민;고훈준;정경용
    • 인터넷정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.29-35
    • /
    • 2023
  • CCTV는 범죄 예방, 공공 안전 강화, 교통 관리 등 다양한 목적으로 사용된다. 그러나 카메라의 범위와 해상도가 향상됨에 따라 영상에서 개인의 신상정보가 노출되는 위험성이 있다. 따라서 영상에서 개인 정보를 보호함과 동시에 개인을 식별할 수 있는 새로운 기술의 필요성이 존재한다. 본 논문에서는 객체 식별 및 추적을 위한 히스토그램 기반 특이값 분해를 제안한다. 제안하는 방법은 객체의 색상 정보를 이용하여 영상에 존재하는 서로 다른 객체를 구분한다. 객체 인식을 위하여 YOLO와 DeepSORT를 이용해 영상에 존재하는 사람을 탐지 및 추출한다. 탐지된 사람의 위치 정보를 이용해 흑백 히스토그램으로 색상 값을 추출한다. 추출한 색상 값 중 유의미한 정보만을 추출하여 사용하기 위해 특이값 분해를 이용한다. 특이값 분해를 이용할 때 결과에서 상위 특이값의 평균을 이용함으로 객체 색상 추출의 정확도를 높인다. 특이값 분해를 이용해 추출한 색상 정보를 다른 영상에 존재하는 색상과 비교하며 서로 다른 영상에 존재하는 동일 인물을 탐지한다. 색상 정보 비교를 위해 유클리드 거리를 이용하며 정확도 평가는 Top-N을 이용한다. 평가 결과 흑백 히스토그램과 특이값 분해를 사용하여 동일 인물을 탐지할 때 최대 100%에서 최소 74%를 기록하였다.

방사 투영 프로파일을 이용한 회전각 추정 방법 (Rotation Angle Estimation Method using Radial Projection Profile)

  • 최민석
    • 융합정보논문지
    • /
    • 제11권10호
    • /
    • pp.20-26
    • /
    • 2021
  • 본 논문에서는 영상 인식 환경에서 영상 정렬에 필요한 회전각 추정 방법 중 낮은 사양의 임베디드 기반 환경에 적용 가능한 방법을 제안하고 기존의 복소 모멘트를 이용하는 방법과 비교하였다. 제안된 방법은 영상을 극좌표로 변환한 후 거리축 방향으로 투영된 1차원 프로파일의 유사도 매칭을 통하여 회전각을 추정한다. 추가로 연산을 더 단순화시킨 투영 프로파일의 벡터합을 이용하는 방법을 선택할 수도 있다. 이진 패턴 영상과 흑백 명암영상을 대상으로 진행한 실험을 통하여 제안된 방법의 추정 오차가 기존의 복소 모멘트를 이용하는 방법과 큰 차이가 없으며 보다 적은 연산과 낮은 시스템 자원이 요구됨을 보였다. 추후 확장을 위하여 흑백 명암영상에서 회전 중심을 일치시키는 방법에 관한 연구가 필요할 것이다.

비대면(이러닝) 교육 성취도 향상을 위한 패턴인식 및 AI교육 시스템 설계 (Pattern recognition and AI education system design for improving achievement of non-face-to-face (e-learning) education)

  • 이해인;김의정;정종인;김창석;강신천
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.329-332
    • /
    • 2022
  • 본 연구는 기존 이러닝 컨텐츠 및 비대면 수업방식에 대한 문제점을 파악하고 학생들의 집중도 향상 및 수업 성취도 및 교육 효과를 높이고 웹 서버를 활용해 인공지능 수업 시스템을 설계를 제안 하고자 한다. OpenCV를 이용한 얼굴과 눈동자 추적의 기능을 사용하여 출석 및 집중도 파악하고 수업 중간에 교수자가 질문하는 문제에 음성 또는 메시지로 피드백을 유도함으로써 학습자가 온라인 수업으로 인한 지루함을 해소하고 주자별 테스트를 통해 기준 점수에 도달하지 못했을 경우 틀린 문제에 대한 교육자료 및 영상을 제공하여 학업 격차를 해소하고 학업에 대한 성취도를 향상을 높일 수 있는 인공지능 교육 프로그램 시스템 설계를 제안한다.

  • PDF

비대면(이러닝) 교육 성취도 향상을 위한 패턴인식 및 AI교육 시스템 설계 구축 (Pattern Recognition and AI Education System Design Proposal for Improving the Achievement of Non-face-to-face (E-Learning) Education)

  • 이해인;김의정;정종인;김창석;강신천
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.280-283
    • /
    • 2022
  • 본 연구는 기존 이러닝 컨텐츠 및 비대면 수업방식에 대한 문제점을 파악하고 학생들의 집중도 향상 및 수업 성취도 및 교육 효과를 높이고 웹 서버를 활용해 인공지능 수업 시스템을 설계를 제안 하고자 한다. OpenCV를 이용한 얼굴과 눈동자 추적의 기능을 사용하여 출석 및 집중도 파악하고 수업 중간에 교수자가 질문하는 문제에 음성 또는 메시지로 피드백을 유도함으로써 학습자가 온라인 수업으로 인한 지루함을 해소하고 주자별 테스트를 통해 기준 점수에 도달하지 못했을 경우 틀린 문제에 대한 교육 자료 및 영상을 제공하여 학업 격차를 해소하고 학업에 대한 성취도를 향상을 높일 수 있는 인공지능 교육 프로그램 시스템 설계를 구축하였다.

  • PDF

딥 러닝 프레임워크의 비교 및 분석 (A Comparison and Analysis of Deep Learning Framework)

  • 이요섭;문필주
    • 한국전자통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.115-122
    • /
    • 2017
  • 딥 러닝은 사람이 가르치지 않아도 컴퓨터가 스스로 사람처럼 학습할 수 있는 인공지능 기술이다. 딥 러닝은 세상을 이해하고 감지하는 인공지능을 개발하는데 가장 촉망받는 기술이 되고 있으며, 구글, 바이두, 페이스북 등이 가장 앞서서 개발을 하고 있다. 본 논문에서는 딥 러닝을 구현하는 딥 러닝 프레임워크의 종류에 대해 논의하고, 딥 러닝 프레임워크의 영상과 음성 인식 분야의 효율성에 대해 비교, 분석하고자 한다.