• 제목/요약/키워드: Object-detection

검색결과 2,473건 처리시간 0.027초

객체 감지 데이터 셋 기반 인체 자세 인식시스템 연구 (Research on Human Posture Recognition System Based on The Object Detection Dataset)

  • 유암;리라이춘;루징쉬엔;쉬멍;정양권
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.111-118
    • /
    • 2022
  • 컴퓨터 비전 연구에서 2차원 인체 자세는 매우 광범위한 연구 방향으로 특히 자세 추적과 행동 인식에서 유의미한 분야다. 인체 자세 표적 획득은 이미지에서 인체 목표를 정확히 찾는 방법을 연구하는 것이 핵심이며 인체 자세 인식은 인공지능(AI)에 적용하는 한편 일상생활에 활용되고 있어서 매우 중요한 연구의의가 있다. 인체 자세 인식 효과의 우수성의 기준은 인식 과정의 성공률과 정확도에 의해 결정된다. 본 연구의 인체 자세 인식에서는 딥러닝 전용 데이터셋인 MS COCO를 기반하여 인체를 17개의 키 포인트로 구분하였다. 다음으로 주요 특징에 대한 세분화 마스크(segmentation mask) 방법을 사용하여 인식률을 개선하였다. 최종적으로 신경망 모델을 설계하고 간단한 단계별 학습부터 효율적인 학습에 이르기까지 많은 수의 표본을 학습시키는 알고리즘을 제안하여 정확도를 향상할 수 있었다.

국지성 집중호우 감시를 위한 천리안위성 2A호 대류운 전조 탐지 알고리즘 개발 (Development of GK2A Convective Initiation Algorithm for Localized Torrential Rainfall Monitoring)

  • 박혜인;정성래;박기홍;문재인
    • 대기
    • /
    • 제31권5호
    • /
    • pp.489-510
    • /
    • 2021
  • In this paper, we propose an algorithm for detecting convective initiation (CI) using GEO-KOMPSAT-2A/advanced meteorological imager data. The algorithm identifies clouds that are likely to grow into convective clouds with radar reflectivity greater than 35 dBZ within the next two hours. This algorithm is developed using statistical and qualitative analysis of cloud characteristics, such as atmospheric instability, cloud top height, and phase, for convective clouds that occurred on the Korean Peninsula from June to September 2019. The CI algorithm consists of four steps: 1) convective cloud mask, 2) cloud object clustering and tracking, 3) interest field tests, and 4) post-processing tests to remove non-convective objects. Validation, performed using 14 CI events that occurred in the summer of 2020 in Korean Peninsula, shows a total probability of detection of 0.89, false-alarm ratio of 0.46, and mean lead-time of 39 minutes. This algorithm can be useful warnings of rapidly developing convective clouds in future by providing information about CI that is otherwise difficult to predict from radar or a numerical prediction model. This CI information will be provided in short-term forecasts to help predict severe weather events such as localized torrential rainfall and hail.

재활 의료 보조를 위한 딥러닝 기반 무인 의료 시스템의 설계 및 성능평가 (Design and performance evaluation of deep learning-based unmanned medical systems for rehabilitation medical assistance)

  • 최동규;장종욱
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1949-1955
    • /
    • 2021
  • 최근 코로나 상황을 겪으면서 국가들은 의료인력과 그 기술에 대한 필요성을 심각하게 느끼고 있다. 고령화되고 있는 사회에 따라 실제로 의료진의 수는 줄고 있으며, 이러한 문제점을 해결하기 위해서 실제 의사가 하는 의료 행위 중고도의 전문성을 요구하지 않는 부분을 대체 할 수 있는 연구가 필요하다. 본 논문에서는 존재하는 다양한 딥러닝 영상처리 기반 기술을 활용하여 의료진이 직접 환자를 대면해야 하는 재활 분야에 적용할 수 있는 회복 상태를 확인하는 업무에 관한 무인 의료 시스템과 관련한 실제 연구 방법들을 서술하고 제안한다. 제안하는 방법은 실제 동작 비교에 사용했던 방법인 각도계나 사진에 선을 긋는 방법과 같은 수동적인 계산을 대체한다. 실시간으로 수행하므로 빠른 진단에 도움을 주며, 동작 수행 일치도에 대한 데이터를 확인할 수 있기에 의료진이 필요한 정보를 쉽게 제공한다.

YOLOv5에서 가상 번호판 생성을 통한 차량 번호판 인식 시스템에 관한 연구 (A Study on Vehicle License Plate Recognition System through Fake License Plate Generator in YOLOv5)

  • 하상현;정석찬;전영준;장문석
    • 한국산업융합학회 논문집
    • /
    • 제24권6_2호
    • /
    • pp.699-706
    • /
    • 2021
  • Existing license plate recognition system is used as an optical character recognition method, but a method of using deep learning has been proposed in recent studies because it has problems with image quality and Korean misrecognition. This requires a lot of data collection, but the collection of license plates is not easy to collect due to the problem of the Personal Information Protection Act, and labeling work to designate the location of individual license plates is required, but it also requires a lot of time. Therefore, in this paper, to solve this problem, five types of license plates were created using a virtual Korean license plate generation program according to the notice of the Ministry of Land, Infrastructure and Transport. And the generated license plate is synthesized in the license plate part of collectable vehicle images to construct 10,147 learning data to be used in deep learning. The learning data classifies license plates, Korean, and numbers into individual classes and learn using YOLOv5. Since the proposed method recognizes letters and numbers individually, if the font does not change, it can be recognized even if the license plate standard changes or the number of characters increases. As a result of the experiment, an accuracy of 96.82% was obtained, and it can be applied not only to the learned license plate but also to new types of license plates such as new license plates and eco-friendly license plates.

A Robust Real-Time License Plate Recognition System Using Anchor-Free Method and Convolutional Neural Network

  • Kim, Dae-Hoon;Kim, Do-Hyeon;Lee, Dong-Hoon;Kim, Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.19-26
    • /
    • 2022
  • 최근 지능형 교통 체계의 발전에 따라 자동차 번호판 인식 시스템이 다양한 분야에서 활용되고 있다. 주행 중인 자동차의 번호판을 인식하기 위해서는 실시간성이 보장되어야 하며, 영상이 왜곡되어 뚜렷하지 않거나 번호판의 크기가 작은 저해상도 영상에서도 높은 인식률이 유지되어야 한다. 본 논문에서는 자유 앵커 방식 기반의 객체 탐지 알고리즘과 합성곱 신경망(CNN) 기반의 문자 인식 알고리즘을 이용하여 처리 속도를 향상한 실시간 자동차 번호판 인식 시스템을 제안한다. 더불어 공간 변형 네트워크를 이용하여 저해상도 및 왜곡된 영상에서의 인식률을 높였다. 제안하는 시스템의 인식률은 93.769%, 이미지 당 처리 속도는 약 0.006초로 기존 자동차 번호판 인식 시스템보다 빠른 속도로 자동차 번호판을 인식하며, 다양한 환경 및 품질의 영상에 대해 높은 인식률을 유지하는 것을 확인할 수 있다.

UAV 기반 외래거북 탐지를 위한 광학문자 인식(OCR)의 가능성 평가 (Feasibility of Optical Character Recognition (OCR) for Non-native Turtle Detection)

  • 임태양;김지윤;김휘문;강완모;송원경
    • 한국환경복원기술학회지
    • /
    • 제25권5호
    • /
    • pp.29-41
    • /
    • 2022
  • Alien species cause problems in various ecosystems, reduce biodiversity, and destroy ecosystems. Due to these problems, the problem of a management plan is increasing, and it is difficult to accurately identify each individual and calculate the number of individuals, especially when researching alien turtle species such as GPS and PIT based on capture. this study intends to conduct an individual recognition study using a UAV. Recently, UAVs can take various sensor-based photos and easily obtain high-definition image data at low altitudes. Therefore, based on previous studies, this study investigated five variables to be considered in UAV flights and produced a test paper using them. OCR was used to monitor the displayed turtles using the manufactured test paper, and this confirmed the recognition rate. As a result, the use of yellow numbers showed the highest recognition rate. In addition, the minimum threat distance was confirmed to be 3 to 6m, and turtles with a shell size of 6 to 8cm were also identified during the flight. Therefore, we tried to propose an object recognition methodology for turtle display text using OCR, and it is expected to be used as a new turtle monitoring technique.

딥러닝 기반 Wi-Fi 센싱 시스템의 효율적인 구축을 위한 지능형 데이터 수집 기법 (CALS: Channel State Information Auto-Labeling System for Large-scale Deep Learning-based Wi-Fi Sensing)

  • 장정익;최재혁
    • 전기전자학회논문지
    • /
    • 제26권3호
    • /
    • pp.341-348
    • /
    • 2022
  • Wi-Fi가 거의 모든 곳에서 사용이 가능한 환경이 도래하면서 Wi-Fi 기반의 센싱 시스템의 활용가능성에 대한 학계의 주목과 함께 활발한 연구가 진행되고 있다. 최근에는 채널 상태 정보(CSI)를 활용한 딥러닝 기술의 비약적 발달로 높은 감지 성능을 달성하고 있다. 하지만, 새로운 대상 도메인에 적용하기 위해서는 명시적인 데이터 수집 및 모델 재학습 과정의 값비싼 적응 노력 없이는 여전히 실질적으로는 사용하기가 어렵다. 본 연구에서는 딥러닝 기반의 Wi-Fi 센싱 시스템을 위한 훈련데이터 수집 및 레이블링을 자동으로 진행하는 CSI 자동 레이블링 시스템(CALS)를 제안한다. 제안 시스템은 CSI 데이터 수집 과정에서 컴퓨터 비전 기술을 함께 활용하여, 지도학습용으로 수집된 CSI 데이터에 대한 레이블링을 자동으로 수행토록 하였다. CALS의 효율성을 보이기 위해 라즈베리파이를 이용하여 프로토타입 시스템을 구현하고, 실내 환경에서의 사람 존재 감지를 수행하는 3가지 모델에 대해 학습과 평가를 진행하였다. 자동 수집된 데이터를 진행하여 학습을 활용하는 방식으로 실시간 데이터에 대해 평가를 진행했을 때 90% 이상의 높은 정확도를 달성하였다.

OLE File Analysis and Malware Detection using Machine Learning

  • Choi, Hyeong Kyu;Kang, Ah Reum
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.149-156
    • /
    • 2022
  • 최근 전 세계적으로 사용되는 Microsoft Office 파일에 악성코드를 삽입하는 문서형 악성코드 사례가 증가하고 있다. 문서형 악성코드는 문서 내에 악성코드를 인코딩하여 숨기는 경우가 많기 때문에 백신 프로그램을 쉽게 우회할 수 있다. 이러한 문서형 악성코드를 탐지하기 위해 먼저 Microsoft Office 파일의 형식인 OLE(Object Linking and Embedding) 파일의 구조를 분석했다. Microsoft Office에서 지원하는 기능인 VBA(Visual Basic for Applications) 매크로에 외부 프로그램을 실행시키는 쉘코드, 외부 URL에서 파일을 다운받는 URL 관련 코드 등 다수의 악성코드가 삽입된 것을 확인했다. 문서형 악성코드에서 반복적으로 등장하는 키워드 354개를 선정하였고, 각 키워드가 본문에 등장하는 횟수를 feature 로 정의했다. SVM, naïve Bayes, logistic regression, random forest 알고리즘으로 머신러닝을 수행하였으며, 각각 0.994, 0.659, 0.995, 0.998의 정확도를 보였다.

영상분석 기술을 활용한 시니어용 동영상 편집 시스템 (Video Content Editing System for Senior Video Creator based on Video Analysis Techniques)

  • 장달원;이재원;이종설
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.499-510
    • /
    • 2022
  • 본 논문에서는 영상 편집이 익숙하지 않은 시니어 동영상 크리에이터를 위한 동영상 편집 시스템을 설명한다. 영상분석 기술을 이용하여 편집소스 동영상을 분석하여 각종 정보를 제공하고, 자동으로 일부 장면을 삭제한다. 사용자가 다수의 소스 콘텐츠를 입력하였을 때, RNN(Recurrent Neural Network) 기술을 기반으로 샷 단위로 분할하고, 이 중 동영상 편집에서 배제할 부분을 구분한다. 각 샷 별로 중요도를 계산하여 샷 단위로 자동 삭제가 가능하도록 한다. 중요도 계산을 위해서 동영상 초점 정보를 추출하여 활용하는데, 이는 초점이 맞지 않는 영상 또는 흔들린 영상을 배제할 수 있도록 한다. 이후 시스템은 객체 인식을 수행하고, 얼굴이 나온 영상에 대해서 감정, 나이, 성별 등의 정보를 추출하여 사용자에게 제공한다. 사용자는 이런 정보를 활용하여 동영상을 제작한다. 동영상에 자막을 삽입하는 등 동영상을 꾸미기 위한 기능들도 포함되어 있으며, 이런 기능들을 활용할 시, 사용자의 과거 정보를 이용해서 선호 디자인을 쉽게 찾을 수 있도록 앞서 배치하고 있다. 시니어 동영상 크리에이터들이 본 시스템을 통해서 쉽고 빠르게 동영상 콘텐츠를 제작할 수 있다.

Frontal Face Video Analysis for Detecting Fatigue States

  • Cha, Simyeong;Ha, Jongwoo;Yoon, Soungwoong;Ahn, Chang-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.43-52
    • /
    • 2022
  • 사람이 느끼는 피로는 다양한 생체신호로부터 측정이 가능한 것으로 알려져 있으며, 기존 연구는 질병과 관련된 심각한 피로수준을 산정하는데 주된 목적을 두고 있다. 본 연구에서는 피실험자의 영상을 이용하여 딥러닝 기반의 영상 분석 기술을 적용, 피로 여부를 판단하기 위한 모델을 제안한다. 특히 화상 분석에서 통상적으로 사용되는 객체 인식, 요소 추출과 함께 영상 데이터의 시계열적 특성을 고려하여 방법론을 교차한 3개 분석모델을 제시했다. 다양한 피로상황에서 수집된 정면 얼굴 영상 데이터를 이용하여 제시된 모델을 실험하였으며, CNN 모델의 경우 0.67의 정확도로 피로 상태를 분류할 수 있어 영상 분석 기반의 피로 상태 분류가 유의미하다고 판단된다. 또한 모델별 학습 및 검증 절차 분석을 통해 영상 데이터 특성에 따른 모델 적용방안을 제시했다.