• 제목/요약/키워드: Dataset for AI

검색결과 215건 처리시간 0.031초

객체 탐지를 활용한 근로자 충돌 안전관리 시스템 (Worker Collision Safety Management System using Object Detection)

  • 이태준;김성재;황철현;정회경
    • 한국정보통신학회논문지
    • /
    • 제26권9호
    • /
    • pp.1259-1265
    • /
    • 2022
  • 최근 인공지능, 빅데이터, 사물인터넷 기술이 안전사고 예방을 위한 화재 감지, 가스나 유해 물질 감지 등 다양한 솔루션에서 활용되고 있다. 2021년 고용노동부에서 발간한 산업 재해 발생 현황에 따르면, 2020년과 비교해 재해율, 재해자 수, 사망자 수가 증가하였으며 최근에는 중대재해 처벌 등에 관한 법률과 같은 안전조치를 강화하는 등 제도적, 사회적 관심이 높아지고 있다. 본 논문에서는 한국지능정보사회진흥원(NIA)에서 제공한 데이터셋 구축 가이드라인을 참고하여 현장에서 직접 수집해 데이터셋을 직접 구축하고 YOLOv4로 학습하여 객체 탐지를 통해 충돌위험 객체 탐지 시스템을 제안하고자 한다. 위험 상황 규칙 위반에 대한 정확도는 실내 88%, 실외 92%의 탐지 성능을 보였다. 이러한 시스템을 통해 산업 현장에서 발생하는 안전사고를 사전에 분석해 지능형 플랫폼 연구에 활용이 가능할 것으로 사료된다.

엣지 디바이스와 카메라 센서 퓨전을 활용한 사람 자세 데이터 자동 수집 시스템 (An Automatic Data Collection System for Human Pose using Edge Devices and Camera-Based Sensor Fusion)

  • 김영근;김승현;김정곤;김원중
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.189-196
    • /
    • 2024
  • 지능형 선별 관제 시스템의 잦은 오탐지로 인해 관제 요원들의 업무 능률 및 시장 신뢰도 저하 문제가 꾸준히 보고되고 있다. 오탐지 문제 개선을 위해 새 AI 모델을 개발하거나 교체하는 것은 기회비용이 크므로, 훈련 데이터 세트 품질을 향상하여 문제를 개선하는 것이 현실적이다. 그러나 소규모 조직은 데이터 세트 수집 및 정제 역량이 부족한 실정이다. 이에 본 논문에서는 사람 자세 추정 모델을 중심으로 엣지 디바이스와 카메라 센서 퓨전을 활용한 사람 자세 데이터 자동 수집 시스템을 제안한다. 이 시스템은 네트워크 말단에서 현장 데이터를 직접 수집하고 레이블링하는 과정을 실시간으로 처리하도록 만들어, 중앙으로 집중되는 연산 부하를 분산시킨다. 또한 현장 데이터를 직접 레이블링하므로 새로운 훈련 데이터 구축에 도움을 준다.

딥러닝의 파일 입출력을 위한 버퍼캐시 성능 개선 연구 (A Study on Improvement of Buffer Cache Performance for File I/O in Deep Learning)

  • 이정하;반효경
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.93-98
    • /
    • 2024
  • 인공지능과 고성능 컴퓨팅 기술이 급속히 발전하면서 다양한 분야에 딥러닝 기술이 활용되고 있다. 딥러닝은 학습 과정에서 대량의 데이터를 무작위로 읽어 학습을 진행하고, 이 과정을 반복한다. 많은 수의 파일들이 무작위로 반복 참조되는 딥러닝의 파일 입출력은 시간적 지역성을 지닌 일반적인 응용과는 다른 특징을 보인다. 이로 인한 캐싱의 어려움을 극복하기 위해 본 연구에서는 딥러닝 데이터셋 읽기의 무작위성을 줄이고 기존의 버퍼 캐시 알고리즘에 적응적으로 동작하는 새로운 데이터 읽기 방안을 제안한다. 본 논문에서는 실험을 통해 제안하는 방식이 버퍼 캐시의 미스율을 기존의 방식에 비해 평균 16%, 최대 33% 감소시키고, 수행시간을 24%까지 개선함을 보인다.

버추얼 아이돌에 대한 유튜브 시청자 특성과 반응 분석 (Analysis of YouTube Viewers' Characteristics and Responses to Virtual Idols)

  • 강정윤;신춘성;정희용
    • 한국IT서비스학회지
    • /
    • 제23권3호
    • /
    • pp.103-118
    • /
    • 2024
  • Due to the advancement of virtual reality technology, virtual idols are widely used in industrial and cultural content industries. However, it is difficult to utilize virtual idols' social perceptions because they are not properly understood. Therefore, this paper collected and analyzed YouTube comments to identify differences about social perception through comparative analysis between virtual idols and general idols. The dataset was constructed by crawling comments from music videos with more than 10 million views of virtual idols and more than 10,000 comments. Keyword frequency and TF-IDF values were derived from the collected dataset, and the connection centrality CONCOR cluster was analyzed with a semantic network using the UCINET program. As a result of the analysis, it was found that virtual idols frequently used keywords such as "person," "quality," "character," "reality," "animation," while reactions and perceptions were derived from general idols. Based on the results of this analysis, it was found that while general idols are mainly evaluated with their appearance and cultural factors, social perceptions of virtual idols' values are mixed with evaluations of cultural factors such as "song," "voice," and "choreography," focusing on technical factors such as "people," "quality," "character," and "animation." However, keywords such as "song," "voice," "choreography," and "music" are included in the top 30 like regular idols and appear in the same cluster, suggesting that virtual idols are gradually shifting away from minority tastes to mainstream culture. This study aims to provide academic and practical implications for the future expansion of the industry and cultural content industry of virtual idols by grasping the social perception of virtual idols.

데이터 증강 학습 이용한 딥러닝 기반 실시간 화재경보 시스템 구현 (Implementation of a Deep Learning based Realtime Fire Alarm System using a Data Augmentation)

  • 김치용;이현수;이광엽
    • 전기전자학회논문지
    • /
    • 제26권3호
    • /
    • pp.468-474
    • /
    • 2022
  • 본 논문에서는 딥러닝을 이용하여 실시간 화재경보 시스템을 구현하는 방법을 제안한다. 화재경보를 위한 딥러닝 학습 이미지 데이터셋은 인터넷을 통하여 1500장을 취득하였다. 일상적인 환경에서 취득된 다양한 이미지를 그대로 학습하게 되면 학습 정확도가 높지 않은 단점이 있다. 본 논문에서는 학습 정확도 향상을 위해 화재 이미지 데이터 확장 방법을 제안한다. 데이터증강 방법은 밝기 조절, 블러링, 불꽃사진 합성을 이용해 학습 데이터 600장을 추가해 총 2100장을 학습했다. 불꽃 이미지 합성방법을 이용하여 확장된 데이터는 정확도 향상에 큰 영향을 주었다. 실시간 화재탐지 시스템은 영상 데이터에 딥러닝을 적용하여 화재를 탐지하고 사용자에게 알림을 전송하는 시스템이다. Edge AI시스템에 적합한 YOLO V4 TINY 모델을 custom 학습한 모델을 이용해 실시간으로 영상을 분석해 화재를 탐지하고 그 결과를 사용자에게 알리는 웹을 개발하였다. 제안한 데이터를 사용하였을 때 기존 방법에 비하여 약 10%의 정확도 향상을 얻을 수 있다.

LH-FAS v2: 머리 자세 추정 기반 경량 얼굴 위조 방지 기술 (LH-FAS v2: Head Pose Estimation-Based Lightweight Face Anti-Spoofing)

  • 허현범;양혜리;정성욱;이경재
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.309-316
    • /
    • 2024
  • 얼굴 인식 기술은 다양한 분야에서 활용되고 있지만, 이는 사진 스푸핑과 같은 위조 공격에 취약하다는 문제를 가지고 있다. 이를 극복하기 위한 여러 연구가 진행되고 있지만, 대부분은 멀티모달 카메라와 같은 특별한 장비를 장착하거나 고성능 환경에서 동작하는 것을 전제로 하고 있다. 본 연구는 얼굴 인식 위조 공격 문제를 해결하기 위해, 특별한 장비 없이 일반적인 웹캠에서 동작할 수 있는 LH-FAS v2를 제안한다. 제안된 방법에서는, 머리 자세 추정에는 FSA-Net을, 얼굴 식별에는 ArcFace를 활용하여 사진 스푸핑 여부를 판별한다. 실험을 위해, 사진 스푸핑 공격 비디오로 구성된 VD4PS 데이터셋을 제시하였으며, 이를 통해 LH-FAS v2의 균형 잡힌 정확도와 속도를 확인하였다. 본 방법은 향후 사진 스푸핑 방어에 효과적일 것으로 기대한다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

캐글 플랫폼 활용한 태양광 데이터셋 형태 구축: 머신 러닝의 적용 가능성 (On Building the Solar Dataset Form using the Kaggle Platform: The applicability of Machine Learning)

  • 고주원;박정진;박진우;오도희;김민철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.255-258
    • /
    • 2022
  • 최근 환경 오염이 지속되면서 신재생 에너지에 대한 사람들의 관심이 높아지고 있다. 제주 지역은 태양광, 태양열, 바이오, 풍력 발전 등 신재생 에너지 발전이 많이 이루어지고 있지만, 그에 비하여 관련 데이터의 개방과 분석 사례는 부족한 상황이다. 이에 본 연구에서는 전 세계 데이터 사이언티스트(Data Scientists)들이 활동하고 있는 캐글(Kaggle) 플랫폼을 활용하여 태양광 생산량과 관련된 변수를 추출하고, 데이터에 적용할 수 있는 머신러닝(Machine Learning) 기법을 탐구하여 머신 러닝 설계를 위한 제주 지역의 태양광 발전 데이터셋(Dataset) 형태(Form)를 제시하고자 한다. 구체적으로는 캐글 데이터 플랫폼을 활용하여 태양광 에너지 분석을 진행한 후 제주 지역 태양광 데이터 수집에 대한 보완점을 제안할 수 있다. 이러한 시도는 제주 지역의 태양광 산업의 발전을 위한 데이터 분석에 활용이 가능할 것으로 기대할 수 있다. 즉, 현재 개방되어 있는 제주 지역의 태양광 발전 데이터셋 형태를 인공지능(Artificial Intelligent) 분석을 위한 머신러닝에 적합한 형태로 구축이 될 수 있도록 제안할 수 있다. 이를 통하여 제주 지역 태양광 산업의 발전의 효율을 높이는 방안을 마련하는데 기반 연구가 될 것이다.

  • PDF

Sentinel-1 SAR 영상을 활용한 국내 내륙 수체 학습 데이터셋 구축 및 알고리즘 적용 연구 (A Study of Development and Application of an Inland Water Body Training Dataset Using Sentinel-1 SAR Images in Korea)

  • 이어루;정형섭
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1371-1388
    • /
    • 2023
  • 지구온난화로 인해 촉발된 기후변화가 홍수와 같은 수재해의 빈도와 규모를 증가시키며 국내 또한 장마와 집중호우로 인한 수재해가 증가하는 추세를 보인다. 이에 광범위한 수재해에 대해 효과적인 대응 및 기후 변화에 따른 선제적 대처가 필수적이며 이는 위성레이더 영상을 통해 가능하다. 본 연구에서는 Sentinel-1 위성 레이더 영상으로부터 국내 수체의 특성을 반영하기 위해 한강권역과 낙동강 권역의 일부 수체 영역에 대해 수체 학습 데이터셋 1,423장을 구축하였다. 정밀한 데이터 어노테이션(Annotation)을 위해 다양한 상황에 따른 구축 기준 문서를 작성한 뒤 진행하였다. 구축이 완료된 데이터셋을 딥러닝 모델 중 U-Net에 적용하여 수체 탐지 결과를 분석하였다. 최종적으로 학습된 모델을 학습과에 활용되지 않은 수체 영역에 적용하여 결과를 분석함으로써 전 국토 수체 모니터링의 가능성을 확인하였다. 분석 결과 구축된 수체 영역의 대해서는 F1-Score 0.987, Intersection over Union (IoU) 0.955의 높은 정확도로 수체를 탐지할 수 있었으며, 학습 및 평가에 활용되지 않은 다른 국내 수체 영역에 대해서도 동일하게 F1-Score 0.941, IoU 0.89의 높은 수체 탐지 결과를 나타냈다. 두 결과 모두 전반적으로 일부 그림자 영역과 폭이 좁은 하천에서 오류가 관찰되었으나, 그 외에는 정밀하게 수체를 탐지하였다. 이러한 연구 결과는 수재해 피해 규모 및 수자원 변화 모니터링에 중요한 기여를 할 것으로 기대된다. 추후 연구에서는 보다 다양한 수체 특성을 가진 데이터셋을 추가 구축한다면 오분류한 영역을 개선할 수 있을 것으로 기대되며, 전 국토의 수체를 효율적으로 관리 및 모니터링하는데 활용될 것으로 사료된다.

위성영상 이미지를 활용한 연구 동향 및 데이터셋 리뷰 (Research Trends and Datasets Review using Satellite Image)

  • 김세형;채정우;강주영
    • 스마트미디어저널
    • /
    • 제11권1호
    • /
    • pp.17-30
    • /
    • 2022
  • 기존 컴퓨터 비전의 연구 동향과 마찬가지로, 위성영상을 이용한 연구도 GPU 기반의 컴퓨터 연산능력과 이미지 처리와 관련된 딥러닝 방법론의 발전으로 많이 이루어지고 있다. 그로 인해 다양한 분야에 위성영상이 활용되고 있고, 위성 영상을 활용에 관한 연구도 증가하고 있다. 본 연구에서는 위성영상의 연구 활용 분야와 위성영상을 활용한 연구에 이용할 수 있는 데이터셋에 대해 소개하도록 한다. 먼저, 위성영상을 활용한 연구를 수집하여 연구 방법에 따라 분류하였다. 크게 분류 기반 연구와 회귀 기반 연구로 분류하였고, 그 이외의 방법으로 활용한 논문들을 정리하였다. 다음으로 위성영상을 활용한 연구들에서 이용한 데이터셋을 정리하였다. 본 연구에서는 데이터셋의 정보와 연구에서의 활용 방법에 대해 제안한다. 이와 함께 최근 AI hub에서 개방한 국내 위성영상 데이터셋의 정리와 활용 방안에 대해 소개한다. 마지막으로, 위성 이미지 관련 연구의 한계점과 앞으로의 동향을 간략하게 제시하였다.