• 제목/요약/키워드: Vision Detection

검색결과 1,283건 처리시간 0.028초

딥러닝 기반 영상처리 기법 및 표준 운동 프로그램을 활용한 비대면 온라인 홈트레이닝 어플리케이션 연구 (Non-face-to-face online home training application study using deep learning-based image processing technique and standard exercise program)

  • 신윤지;이현주;김준희;권다영;이선애;추윤진;박지혜;정자현;이형석;김준호
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.577-582
    • /
    • 2021
  • 최근 AR, VR 및 스마트 디바이스 기술의 발전에 따라 피트니스 산업에서도 비대면 환경을 기반으로 한 서비스 수요가 증가하고 있다. 비대면 온라인 홈트레이닝 서비스는 기존의 오프라인 서비스에 비해 시간과 장소의 제약이 없다는 장점이 있으나 운동 기구의 부재 및 사용자의 정확한 운동 자세 유지여부, 운동량의 측정이 어려운 단점이 존재한다. 본 연구에서는 이러한 단점을 보완할 수 있는 표준 운동 프로그램을 개발하고 딥러닝 기반 신체 자세 추정 영상처리를 통하여 새로운 비대면 홈트레이닝 어플리케이션 알고리즘을 제안한다. 본 연구의 알고리즘 기반 어플리케이션을 활용한다면 표준 운동 프로그램 영상의 트레이너를 사용자가 직접 보고 따라하면서 사용자 스스로 자세를 교정하며 정확한 운동이 가능하다. 나아가 본 연구의 알고리즘을 용도에 맞게 커스터마이징 한다면 공연, 영화, 동아리 활동, 컨퍼런스 분야로의 적용도 가능할 것이다.

Counting and Localizing Occupants using IR-UWB Radar and Machine Learning

  • Ji, Geonwoo;Lee, Changwon;Yun, Jaeseok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.1-9
    • /
    • 2022
  • 사람이나 사물 등의 위치를 알아낼 수 있는 측위기술은 사람의 유동량 측정, 보안, 인원 구조 등 다양한 환경에서 요구되고 사용될 수 있다. 측위를 위해 카메라와 같은 시각 센서기술을 사용하기도 하지만 이는 빛, 온도 등 주변 환경에 민감하며 사생활 노출 문제가 발생할 수 있다. 본 논문에서는 앞서 말한 문제들이 없는 초광대역 (UWB, ultra wideband) 레이더 기술과 머신러닝을 이용하여 벽 뒤 다른 실내공간에 있는 점유자의 수와 위치를 인식하는 연구를 수행하였다. 네 가지 상황 (강의실 내 몇 명이 있는지, 28가지의 위치를 정하고 어느 위치에 있는지, 28가지의 위치 중 한 위치에서 더 세부적인 16가지 위치 중 어느 위치에 있는지, 두 명이 동시에 있는 상황에서 어느 위치에 있는지)에 대해 극단적 랜덤 트리 등 네 가지 알고리즘 별로 모델을 생성하고 그 결과를 비교하였다. 전체적으로 네 가지 알고리즘 모두 좋은 결과를 보여주었으며 머신러닝을 이용해 위치인식 및 위치측정이 가능함을 검증하였다. 또한 oneM2M 표준 플랫폼을 활용하여 서비스 확장 가능성을 고려하였으며 이 기술을 여러 분야에서 활용한다면 더욱 많은 서비스나 제품을 창출할 수 있을 것으로 기대한다.

SAAnnot-C3Pap: 반자동 주석화 방법을 적용한 연주 자세의 그라운드 트루스 수집 기법 (SAAnnot-C3Pap: Ground Truth Collection Technique of Playing Posture Using Semi Automatic Annotation Method)

  • 박소현;김서연;박영호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권10호
    • /
    • pp.409-418
    • /
    • 2022
  • 본 논문에서는 연주자 자세의 그라운드 트루스 획득을 위한 반자동 주석 방법인 SAAnnot-C3Pap를 제안한다. 기존 음악 도메인에서 2차원 관절 위치에 대한 그라운드 트루스를 획득하기 위하여 2차원 자세 추정 방법인 오픈포즈를 활용하거나 수작업으로 라벨링 하였다. 하지만 기존의 오픈포즈와 같은 자동 주석 방법은 빠르지만 부정확한 결과를 보인다는 단점이 있고, 사용자가 직접 주석을 생성하는 수작업 주석화의 경우 많은 노동력이 필요하다는 한계점이 있다. 따라서 본 논문에서는 그 둘의 절충 방안인 반자동 주석화 방법인 SAAnnot-C3Pap을 제안한다. 제안하는 SAAnnot-C3Pap은 크게 3가지 과정으로 오픈포즈를 사용하여 자세를 추출하고, 추출된 부분 중 오류가 있는 부분을 슈퍼바이즐리를 사용하여 수정한 뒤, 오픈포즈와 슈퍼바이즐리의 결과값을 동기화하는 과정을 수행한다. 제안하는 방법을 통하여 오픈포즈에서 발생하는 잘못된 2차원 관절 위치 검출 결과를 교정할 수 있었고, 2명 이상의 사람을 검출하는 문제를 해결하였으며, 연주 자세 그라운드 트루스 획득이 가능하였다. 실험에서는 반자동 주석 방법인 오픈포즈와 본 논문에서 제안하는 SAAnnot-C3Pap의 결과를 비교·분석한다. 비교 결과, 제안하는 SAAnnot-C3Pap는 오픈포즈로 잘못 수집된 자세 정보를 개선한 결과를 보였다.

위조번호판 부착 차량 출입 방지를 위한 인공지능 기반의 주차관제시스템 개선 방안 (A study on the improvement of artificial intelligence-based Parking control system to prevent vehicle access with fake license plates)

  • 장성민;이정우;박종혁
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.57-74
    • /
    • 2022
  • 최근 인공지능 주차관제시스템은 딥러닝을 활용해 차량 번호판에 대한 인식률을 높이고 있지만 위조번호판 부착 차량을 판별하지 못한다는 문제점이 있다. 이러한 보안상의 문제점이 있음에도 불구하고 현재까지 여러 기관에서 기존의 시스템을 그대로 사용하고 있는 상황이다. 실례로 위조번호판을 이용한 실험에서 정부의 주요 기관을 대상으로 진입에 성공한 사례도 있다. 본 논문에서는 이러한 위조번호판을 부착한 차량의 출입을 방지하기 위해서 기존 인공지능 주차관제시스템의 개선 방안을 제시한다. 이를 위해 제안하는 방법은 기존 시스템이 차량의 번호판의 일치여부를 통과기준으로 사용하듯이 이미지에서 특징이 되는 특징점의 정보를 추출해내는 ORB 알고리즘을 활용하여 추출한 차량 앞면 특징점들의 매칭 정도를 통과기준으로 사용하는 방법이다. 또한 내부에 차량이 존재하는지 여부를 확인하는 절차를 제안 시스템에 포함시켜 위조번호판을 부착한 동일 차종 차량의 진입도 방지하였다. 실험 결과, 위조번호판을 부착한 차량들의 진입을 막아내며 기존시스템에 비해 위조번호판을 막아내는 개선된 성능을 보였다. 이러한 결과를 통해 기존 인공지능 주차관제시스템의 체계를 유지하면서 본 논문에서 제안하는 방법들을 기존의 주차관제시스템에 적용하여 위조번호판을 부착한 차량의 출입을 방지할 수 있음을 확인할 수 있었다.

계층적 학습 기반 다중 콘크리트 손상에 대한 의미론적 분할 (Semantic Segmentation for Multiple Concrete Damage Based on Hierarchical Learning)

  • 심승보;민지영
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제26권6호
    • /
    • pp.175-181
    • /
    • 2022
  • 구조물의 공용연수가 증가함에 따라 각종 성능 저하가 발생한다. 특히 국내 인프라 구조물은 대부분 경제가 성장하는 시기에 집중적으로 건설되었기 때문에 노후 인프라 비율 급증이 최근 주요 이슈가 되고 있다. 인프라의 노후화는 자칫 안전사고로 이어질 수 있으며 인명 피해까지 유발할 수 있다. 이러한 문제를 사전에 예방하기 위하여 주기적이고 정확한 점검 및 유지관리가 필수적이다. 이 같은 이유로 최근 컴퓨터 비전과 딥러닝을 활용하여 다양한 손상을 탐지하는 연구에 대한 수요가 원격점검 혹은 점검자동화 분야에서 증가하고 있다. 따라서 본 논문에서는 콘크리트 손상의 종류를 세 가지로 구분하여 이를 탐지할 수 있는 신경망 구조를 제안했다. 특히 계층적 학습 기법을 통해 보다 정확하게 다양한 손상을 탐지할 수 있는 신경망을 개발하였다. 이 신경망은 2,026장의 손상 영상으로 학습되었고, 508장의 손상 영상으로 실험하였다. 그 결과 67.04%의 평균 중첩 정확도와 52.65%의 F1 점수를 갖는 알고리즘을 완성하였다. 이 같은 손상 탐지 알고리즘은 향후 구조물의 정확한 상태 진단에 활용될 수 있으리라 기대한다.

Opening New Horizons with the L4 Mission: Vision and Plan

  • Kyung-Suk Cho;Junga Hwang;Jeong-Yeol Han;Seong-Hwan Choi;Sung-Hong Park;Eun-Kyung Lim;Rok-Soon Kim;Jungjoon Seough;Jong-Dae Sohn;Donguk Song;Jae-Young Kwak;Yukinaga Miyashita;Ji-Hye Baek;Jaejin Lee;Jinsung Lee;Kwangsun Ryu;Jongho Seon;Ho Jin;Sung-Jun Ye;Yong-Jae, Moon;Dae-Young Lee;Peter H. Yoon;Thiem Hoang;Veerle Sterken;Bhuwan Joshi;Chang-Han Lee;Jongjin Jang;Jae-Hwee Doh;Hwayeong Kim;Hyeon-Jeong Park;Natchimuthuk Gopalswamy;Talaat Elsayed;John Lee
    • 천문학회지
    • /
    • 제56권2호
    • /
    • pp.263-275
    • /
    • 2023
  • The Sun-Earth Lagrange point L4 is considered as one of the unique places where the solar activity and heliospheric environment can be observed in a continuous and comprehensive manner. The L4 mission affords a clear and wide-angle view of the Sun-Earth line for the study of the Sun-Earth and Sun-Moon connections from he perspective of remote-sensing observations. In-situ measurements of the solar radiation, solar wind, and heliospheric magnetic field are critical components necessary for monitoring and forecasting the radiation environment as it relates to the issue of safe human exploration of the Moon and Mars. A dust detector on the ram side of the spacecraft allows for an unprecedented detection of local dust and its interactions with the heliosphere. The purpose of the present paper is to emphasize the importance of L4 observations as well as to outline a strategy for the planned L4 mission with remote and in-situ payloads onboard a Korean spacecraft. It is expected that the Korean L4 mission can significantly contribute to improving the space weather forecasting capability by enhancing the understanding of heliosphere through comprehensive and coordinated observations of the heliosphere at multi-points with other existing or planned L1 and L5 missions.

그래프 컨벌루션 네트워크 기반 주거지역 감시시스템의 얼굴인식 알고리즘 개선 (Improvement of Face Recognition Algorithm for Residential Area Surveillance System Based on Graph Convolution Network)

  • 담하의;민병원
    • 사물인터넷융복합논문지
    • /
    • 제10권2호
    • /
    • pp.1-15
    • /
    • 2024
  • 스마트 지역사회의 구축은 지역사회의 안전을 보장하는 새로운 방법이자 중요한 조치이다. 촬영 각도로 인한 얼굴 기형 및 기타 외부 요인의 영향으로 인한 신원 인식 정확도 문제를 해결하기 위해 이 논문에서는 네트워크 모델을 구축할 때 전체 그래프 컨벌루션 모델을 설계하고, 그래프 컨벌루션 모델에 협력하여 얼굴의 핵심을 추출한다. 또한 얼굴의 핵심을 특정 규칙에 따라 핵심 포인트를 구축하며 이미지 컨벌루션 구조를 구축한 후 이미지 컨벌루션 모델을 추가하여 이미지 특징의 핵심을 개선한다. 마지막으로 두 사람의 얼굴의 이미지 특징 텐서를 계산하고 전체 연결 레이어를 사용하여 집계된 특징을 추출하고 판별하여 인원의 신원이 동일한지 여부를 결정한다. 최종적으로 다양한 실험과 테스트를 거쳐 이 글에서 설계한 네트워크의 얼굴 핵심 포인트에 대한 위치 정확도 AUC 지표는 300W 오픈 소스 데이터 세트에서 85.65%에 도달했다. 자체 구축 데이터 세트에서 88.92% 증가했다. 얼굴 인식 정확도 측면에서 이 글에서 제안한 IBUG 오픈 소스 데이터 세트에서 네트워크의 인식 정확도는 83.41% 증가했으며 자체 구축 데이터 세트의 인식 정확도는 96.74% 증가했다. 실험 결과는 이 글에서 설계된 네트워크가 얼굴을 모니터링하는 데 더 높은 탐지 및 인식 정확도를 가지고 있음을 보여준다.

딥러닝 효율화를 위한 다중 객체 데이터 분할 학습 기법 (A Study on Multi-Object Data Split Technique for Deep Learning Model Efficiency)

  • 나종호;공준호;신휴성;윤일동
    • 터널과지하공간
    • /
    • 제34권3호
    • /
    • pp.218-230
    • /
    • 2024
  • 최근 건설현장의 안전사고 문제를 해결하기 위해 컴퓨터 비전 기술을 활용한 안전관리에 관한 연구를 많이 수행하고 있다. 최근 딥러닝 기반 객체 인식 및 영역 분할 연구에서 앵커 박스 파라미터를 사용하고 있다. 일관적인 정확도를 확보하기 위하여 학습 과정에서 앵커 박스 파라미터의 최적화가 중요하다. 앵커 박스 관련 파라미터는 일반적으로 학습자의 휴리스틱 방법으로 모양과 크기를 고정하여 학습을 수행하고 있고, 파라미터는 단일로 구성된다. 하지만 파라미터는 객체 종류와 객체 크기에 따라 민감하고 수가 증가하면 단일 파라미터로 데이터의 모든 특성을 반영하는데 한계가 발생한다. 따라서 본 논문은 분할 학습을 통해 최적화된 다중 파라미터를 적용하는 방법을 제안하여 단일 파라미터로 모든 객체의 특성을 반영하기 어려운 문제를 해결하고자 한다. 통합 데이터를 객체 크기, 객체 수, 객체의 형상에 따라 효율적으로 분할하는 기준을 정립하였으며, 최종으로 통합 학습과 분할 학습 방법의 성능 비교를 통해 제안한 학습 방법의 효과를 검증하였다.

수체 추출을 위한 Geo-SAM 기법의 응용: 국토위성영상 적용 실험 (Application of Geo-Segment Anything Model (SAM) Scheme to Water Body Segmentation: An Experiment Study Using CAS500-1 Images)

  • 이하영;김광섭;이기원
    • 대한원격탐사학회지
    • /
    • 제40권4호
    • /
    • pp.343-350
    • /
    • 2024
  • Meta에서 신속한 영상 분할 기능을 제공하는 대규모 컴퓨터 비전 생성 모델을 발표한 이후, 여러 활용 분야에서 이를 적용하려는 연구가 이루어지고 있다. 이 연구에서는 위성 영상 자료에 Segment Anything Model (SAM)을 사용할 수 있는 QGIS 플러그인 Geo-SAM을 사용하여 수체 객체 탐지와 추출에 대한 SAM의 적용성을 조사해 보고자 하였다. 실험 대상 자료는 국토위성(Compact Advanced Satellite 500, CAS500-1) 영상을 사용하였다. 이 자료를 가지고 SAM을 적용하여 얻은 결과는 같은 입력 영상으로부터 수작업으로 제작한 수체 객체 자료, Open Street Map (OSM)의 수체 자료, 국토지리정보원의 수계 수치지도와 비교하였다. SAM 처리 결과와 비교 대상 자료를 이용하여 추출된 모든 객체를 대상으로 계산한 경계사각형의 교집합/합집합의 평균값을 나타내는 mean Intersection over Union (mIoU)은 각각 0.7490, 0.5905, 0.4921로 나타났고, 각 자료에서 공통으로 나타나거나 추출된 객체에 대해 계산한 결과는 차례대로 0.9189, 0.8779, 0.7715로 나타났다. SAM을 적용한 결과와 다른 비교 자료와의 공간적 일치도를 분석한 결과, SAM에서는 한 개의 수체 객체를 여러 개의 분할 요소로 나타내므로 수체 객체 분류를 지원하는 의미 있는 결과를 보이고 있음을 알 수 있다.

장애물 인식 지능을 갖춘 자율 이동로봇의 구현 (Implementation of a Self Controlled Mobile Robot with Intelligence to Recognize Obstacles)

  • 류한성;최중경
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.312-321
    • /
    • 2003
  • 본 논문은 장애물을 인식하고 회피하면서 목적지까지 자율적으로 이동할 수 있는 로봇을 구현한 논문이다. 우리는 본 논문에서 영상처리보드의 구현이라는 하드웨어적인 부분과 자율 이동로봇을 위한 영상궤환 제어라는 소프트웨어의 두 가지 결과를 나타내었다. 첫 번째 부분에서, 영상처리를 수행하는 제어보드로부터 명령을 받는 로봇을 나타내었다. 우리는 오랫동안 CCD카메라를 탑재한 자율 이동로봇에 대하여 연구해왔다. 로봇의 구성은 DSP칩을 탑재한 영상보드와 스텝모터 그리고 CCD카메라로 구성된다. 시스템 구성은 이동로봇의 영상처리 보드에서 영상을 획득하고 영상처리 알고리즘을 수행하고 로봇의 이동경로를 계산한다. 이동로봇에 탑재된 CCD카메라에서 획득한 영상 정보는 매 샘플링 시간마다 캡쳐한다. 화면에서 장애물의 유무를 판별한 후 좌 혹은 우로 회전하여 장애물을 회피하고 이동한 거리를 Feedback하는 시스템을 구현하여 초기에 지정한 목표지점가지 로봇이 갈 수 있도록 간략한 경로를 계획하여 절대좌표를 추적해 나가는 알고리즘을 구현한다. 이러한 영상을 획득하고 알고리즘을 처리하는 영상처리 보드의 구성은 DSP (TMS320VC33), ADV611, SAA7111, ADV7176A, CPLD(EPM7256ATC144), SRAM 메모리로 구성되어 있다. 두 번째 부분에서는 장애물을 인식하고 회피하기 위하여 두 가지의 영상궤환 제어 알고리즘을 나타낸다. 첫 번째 알고리즘은 필터링, 경계검출 NOR변환, 경계치 설정 등의 영상 전처리 과정을 거친 영상을 분할하는 기법이다. 여기에서는 Labeling과 Segmentation을 통한 pixel의 밀도 계산이 도입된다. 두 번째 알고리즘은 위와 같이 전처리된 영상에 웨이브렛 변환을 이용하여 수직방향(y축 성분)으로 히스토그램 분포를 20 Pixel 간격으로 스캔한다. 파형 변화에 의하여 장애물이 있는 부분의 히스토그램 분포는 거의 변동이 없이 나타난다. 이러한 특성을 분석하여 장애물이 있는 곳을 찾아내고 이것을 회피하기 위한 알고리즘을 세웠다. 본 논문은 로봇에 장착된 한 개의 CCD 카메라를 이용하여 장애물을 회피하면서 초기에 설정해둔 목적지가지 도달하기 위한 알고리즘을 제안하였으며, 영상처리 보드를 설계 및 제작하였다. 영상처리 보드는 일반적인 보드보다 빠른 속도(30frame/sec)와 해상도를 지원하며 압축 알고리즘을 탑재하고 있어서 영상을 전송하는 데에 있어서도 탁월한 성능을 보인다.