• 제목/요약/키워드: image processing

검색결과 9,933건 처리시간 0.05초

AI 엣지 디바이스를 이용한 스마트 팩토리 시스템 설계 (The Design of Smart Factory System using AI Edge Device)

  • 한성일;이대식;한지환;신한재
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권4호
    • /
    • pp.257-270
    • /
    • 2022
  • 본 논문에서는 AI 엣지 디바이스를 이용한 스마트 팩토리 위험도 개선시스템 및 위험도 개선방법을 설계한다. 스마트 팩토리 위험도 개선시스템은 AI 엣지 디바이스를 이용하여 스마트 팩토리에서 작업자의 작업수행 과정을 수집, 분석, 예방 및 신속 대처하고, 작업자의 작업 수행시 불량률을 개선하면서 작업시 발생 가능한 위험을 저감할 수 있다. 특히 작업자 이미지 정보, 작업자 생체정보, 장비 구동 정보 및 제조된 제품의 품질정보에 기초하여 위험도 이상 조건을 설정할 수 있고, 효율적이고 정확도 높은 작업이 되도록 위험도 개선이 가능하다. 또한 스마트 팩토리 내부의 카메라 및 IoT 센서 등에서 수집된 데이터는 모두 클라우드로 보내지 않고 AI 엣지 디바이스에서 처리하고, 필요한 데이터만 클라우드 등으로 전송할 수 있으므로 처리 속도가 빠르고, 보안에 관한 문제가 적다는 장점이 있다. 추가적으로 AI 엣지 디바이스를 사용함으로써 클라우드로 데이터 전송량이 감소하여 데이터 통신비 및 데이터 전송 대역폭을 확보하는 비용이 절감되는 장점이 있다.

대한민국 정부의 코로나 19 브리핑을 기반으로 구축된 수어 데이터셋 연구 (Sign Language Dataset Built from S. Korean Government Briefing on COVID-19)

  • 심호현;성호렬;이승재;조현중
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권8호
    • /
    • pp.325-330
    • /
    • 2022
  • 본 논문은 한국 수어에 대하여 수어 인식, 수어 번역, 수어 영상 시분할과 같은 수어에 관한 딥러닝 연구를 위한 데이터셋의 수집 및 실험을 진행하였다. 수어 연구를 위한 어려움은 2가지로 볼 수 있다. 첫째, 손의 움직임과 손의 방향, 표정 등의 종합적인 정보를 가지는 수어의 특성에 따른 인식의 어려움이 있다. 둘째, 딥러닝 연구를 진행하기 위한 학습데이터의 절대적 부재이다. 현재 알려진 문장 단위의 한국 수어 데이터셋은 KETI 데이터셋이 유일하다. 해외의 수어 딥러닝 연구를 위한 데이터셋은 Isolated 수어와 Continuous 수어 두 가지로 분류되어 수집되며 시간이 지날수록 더 많은 양의 수어 데이터가 수집되고 있다. 하지만 이러한 해외의 수어 데이터셋도 방대한 데이터셋을 필요로 하는 딥러닝 연구를 위해서는 부족한 상황이다. 본 연구에서는 한국 수어 딥러닝 연구를 진행하기 위한 대규모의 한국어-수어 데이터셋을 수집을 시도하였으며 베이스라인 모델을 이용하여 수어 번역 모델의 성능 평가 실험을 진행하였다. 본 논문을 위해 수집된 데이터셋은 총 11,402개의 영상과 텍스트로 구성되었다. 이를 이용하여 학습을 진행할 베이스라인 모델로는 수어 번역 분야에서 SOTA의 성능을 가지고 있는 TSPNet 모델을 이용하였다. 본 논문의 실험에서 수집된 데이터셋에 대한 특성을 정량적으로 보이고, 베이스라인 모델의 실험 결과로는 BLEU-4 score 3.63을 보였다. 또한, 향후 연구에서 보다 정확하게 데이터셋을 수집할 수 있도록, 한국어-수어 데이터셋 수집에 있어서 고려할 점을 평가 결과에 대한 고찰로 제시한다.

햅틱 피드백 장치를 이용한 치과 수술 시뮬레이션 (Dental Surgery Simulation Using Haptic Feedback Device)

  • 윤상연;성수경;신병석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.275-284
    • /
    • 2023
  • 가상 현실 시뮬레이션은 다양한 분야에서의 교육과 훈련에 활용이 되며, 특히 최근에는 의료 분야에서 많이 사용되고 있다. 교육/훈련용 시뮬레이터는 의사가 실제 수술 도구를 이용하여 실제 환자에 대해 처치를 하는 것과 같은 느낌이 나게 하는 촉감/역감 생성 및 영상/음향 출력 하드웨어와 여기에 실감 나는 영상과 촉감을 생성해주는 소프트웨어로 이루어진다. 기존의 시뮬레이터들은 수술 시에 사용되는 다양한 수술 도구들을 모사하기 위해 다양한 형태의 하드웨어들을 사용해야 하므로 복잡하고 비용이 많이 소요되는 문제가 있다. 이 논문에서는 포스 피드백 장치와 변형 가능한 햅틱 컨트롤러를 이용한 치과 수술 시뮬레이션 시스템을 제안한다. 햅틱 하드웨어들은 수술 도구와 수술 부위의 충돌 여부를 파악하고 그에 따른 저항감과 진동감을 제공한다. 특히 길이 변화, 굽힘과 같은 변형이 가능한 햅틱 컨트롤러는 여러 수술 도구들의 형태에 따라 느껴지는 다양한 감각을 표현할 수 있다. 사용자가 햅틱 피드백 장치를 조작하면 햅틱 피드백 장치의 움직임이나 버튼 클릭 등의 이벤트가 시뮬레이션 시스템에 전달되어 치과용 수술 도구와 구강 내부 모델들 사이의 상호작용이 발생하고 이에 따른 햅틱 피드백이 햅틱 피드백 장치로 전달된다. 이러한 기반 기술들을 활용하여 정교한 3차원 모델로 표현된 가상 환경에서 대표적인 치과 수술기법인 매복 사랑니 발치 수술의 현실적인 훈련 경험을 제공한다.

임베디드 기기를 위한 딥러닝 점자블록 인식 방법 (Deep Learning Braille Block Recognition Method for Embedded Devices)

  • 김희진;윤재혁;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.1-9
    • /
    • 2023
  • 본 논문은 딥러닝을 통해 실시간으로 임베디드 기기에서 점자 블록을 인식하는 방법을 제안한다. 먼저 고성능 컴퓨터에서 점자 블록 인식을 위한 딥러닝 모델을 학습시키고, 임베디드 기기에 적용하기 위하여 학습 모델을 경량화 도구에 적용한다. 점자 블록의 보행 정보를 인식하기 위해 영상에서 점자블록과의 거리를 이용하여 경로를 판별하는 알고리즘을 사용한다. 임베디드 기기를 통해 촬영한 영상에서 YOLOv8 모델을 통해 점자 블록, 볼라드, 횡단보도를 검출한 후 점자블록 경로 판별 알고리즘을 거쳐 보행정보를 인식한다. 실시간으로 점자 블록을 검출하기 위해 모델 경량화 도구를 YOLOv8에 적용한다. YOLOv8 모델 가중치의 정밀도를 기존 32비트에서 8비트로 낮추고, TensorRT 최적화 엔진을 적용하여 모델의 최적화를 진행한다. 제안된 방법을 통해 경량화 된 모델을 기존 모델과 비교한 결과, 경로 인식 정확도는 99.05%로 기존 모델과 거의 차이가 없지만, 인식 속도는 기존 모델 대비 59% 단축되어 1초에 약 15개의 프레임을 처리할 수 있다.

대상객체 맥락 기반 생체정보 분석방법 (Method of Biological Information Analysis Based-on Object Contextual)

  • 김경준;김주연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.41-43
    • /
    • 2022
  • 최근 코로나-19의 유행에 따른 전염병 예방 및 차단을 위해 비접촉 생체 정보 취득 및 분석 기술이 주목을 받고 있다. 습식 및 부착형 생체정보 취득 방법은 정확하게 생체정보를 측정 할 수 있는 장점이 있지 만 밀 접촉에 따른 전염이 높아지는 위험성을 내포하고 있다. 이러한 문제점을 해결하기 위해 사람의 지문, 얼굴, 홍채, 정맥, 음성, 서명 등의 생체 정보를 자동화된 장치로 추출하는 비접촉 방식은 빅데이터와 AI 기술 적용으로 데이터 처리 속도가 빨라지고 인식 정확도가 높아지면서 다양한 산업에서 활용이 증가하고 있다. 그러나, 비접촉식 생체 데이터 취득 기술의 정확도가 개선되었지만, 비접촉 방법은 측정 대상 객체를 둘러싸고 있는 외부 온도, 습도, 조도 등의 주위 환경에 많은 영향을 받아 측정정보가 왜곡되는 현상이 발생하고 또한 정확도가 떨어지는 단점이 있다. 본 논문에서는 생체정보 분석을 위한 개인화 정보(이미지, 신호 등)의 해석을 위한 맥락기반 생체신호 모델링 기법을 제안 한다. 맥락기반 생체정보 모델링 기법은 성능 개선을 위해 생체정보 측정의 정황 정보와 사용자 정보를 복합적으로 고려하는 모델을 제시한다. 제안 모델은 예측 값 확률을 최대화할 수 있는 맥락기반 신호 해석을 통한 특징 확률분포를 기반으로 신호 정보를 분석한다.

  • PDF

AWS 기반 행위와 객체 인식을 통한 위협 상황 판단 시스템 (Threat Situation Determination System Through AWS-Based Behavior and Object Recognition)

  • 김예영;정수현;박소현;박영호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.189-198
    • /
    • 2023
  • 길거리에서 묻지마 범죄가 자주 발생함에 따라 CCTV의 보급이 증가하고 있다. 그러나 수동적으로 작동되는 CCTV의 단점 때문에 지능형 CCTV의 필요성이 주목 받고 있다. 이러한 지능형 CCTV의 무거운 시스템 때문에, 높은 성능의 기기들이 필요해 일반 CCTV를 대체하는데 비용적 측면에서 부담이 발생한다. 이 문제를 해결하기 위해 낮은 품질의 영상도 인식하며 높지 않은 성능의 기기에서도 시스템이 구동되는 지능형 CCTV 시스템이 필요하다. 따라서 본 논문은 AWS 기반 플랫폼을 활용하여 시스템을 경량화하고 영상을 텍스트화하여 실시간으로 위협을 감지할 수 있는 Saying CCTV 시스템을 제안한다. 이는 YOLO v4와 OpenPose를 사용해 추출한 데이터를 바탕으로 위험 객체와 위협 행동 그리고 위협 상황을 판단하며, 위험도를 머신러닝으로 계산하도록 구현하였다. 이를 통해, 언제 어디서나 네트워크만 연결되면 시스템을 동작시킬 수 있으며, 영상 촬영과 이미지 업로드가 최소한의 성능의 기기에서도 시스템 사용이 가능하다. 나아가 영상을 분석하여 텍스트로 저장되는 데이터들로 하여금 범죄의 유의미한 통계를 자동화하여 신속한 범죄 예방이 가능하다.

증강현실 시각화를 위해 K-최근접 이웃을 사용한 BIM 메쉬 경량화 알고리즘 (BIM Mesh Optimization Algorithm Using K-Nearest Neighbors for Augmented Reality Visualization)

  • 빠 빠 윈 아웅;이동환;박주영;조민건;박승희
    • 대한토목학회논문집
    • /
    • 제42권2호
    • /
    • pp.249-256
    • /
    • 2022
  • 최근 BIM (Building Information Modeling)과 AR (Augmented Reality)을 결합한 실시간 시각화 기술이 건설관리 의사 결정 및 처리 효율성을 높이는 데 도움이 된다는 것을 보여주기 위한 다양한 연구가 활발히 진행되고 있다. 그러나, 대용량 BIM 데이터는 AR에 적용할 경우 데이터 전송 문제, 이미지 단절, 영상 끊김 등과 같은 다양한 문제가 발생함으로 3차원(3D) 모델의 메쉬 최적화를 통해 시각화의 효율성을 향상시켜야 한다. 대부분의 기존 메쉬 경량화 방법은 복잡하고 경계가 많은 3D 모델의 메쉬를 적절하게 처리할 수 없다. 이에 본 연구에서는 고성능 AR 시각화를 위해 BIM 데이터를 재구성하기 위한 k-최근접이웃(KNN) 분류 프레임워크 기반 메쉬 경량화 알고리즘을 제안하였다. 제안 알고리즘은 선정된 BIM 모델을 삼각형 중심 개념 기반의 Unity C# 코드로 경량화하였고 모델의 데이터 세트를 활용하여 정점 사이의 거리를 정의할 수 있는 KNN로 분류되었다. 그 결과 전체 모델과 각 구조의 경량화 메쉬 점 및 삼각형 개수가 각각 약 56 % 및 약 42 % 감소됨을 확인할 수 있었다. 결과적으로, 원본 모델과 비교했을 때 경량화한 모델은 시각적인 요소 및 정보 손실이 없었고, 따라서, AR 기기 활용 시 고성능 시각화를 향상시킬 수 있을 것으로 기대된다.

인물 개체 분할을 위한 맥락-의존적 비디오 데이터 보강 (Context-Dependent Video Data Augmentation for Human Instance Segmentation)

  • 전현진;이종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권5호
    • /
    • pp.217-228
    • /
    • 2023
  • 비디오 개체 분할은 비디오를 구성하는 영상 프레임 각각에 대해 관심 개체 분할을 수행해야 할 뿐만 아니라, 해당 비디오를 구성하는 프레임 시퀀스 전체에 걸쳐 개체들에 대한 정확한 트래킹을 요구하기 때문에 난이도가 높은 기술이다. 특히 드라마 비디오에서 인물 개체 분할은 다양한 장소와 시간대에서 상호 작용하는 복수의 주요 등장인물들에 대한 정확한 트래킹을 요구하는 특징을 가지고 있다. 또한, 드라마 비디오 인물 개체분할은 주연 인물들과 조연 혹은 보조 출연 인물들 간의 등장 빈도에 상당한 차이가 있어 일종의 클래스 불균형 문제도 있다. 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오들의 시-공간적 맥락을 충분히 고려해서 목표 인물이 삽입되어야 할 배경 클립 내의 위치를 결정함으로써, 보다 더 현실적인 보강 비디오들을 생성한다. 따라서 본 논문에서 제안하는 새로운 비디오 데이터 보강 기법인 CDVA는 비디오 개체 분할을 위한 심층 신경망 모델의 성능을 효과적으로 향상시킬 수 있다. 본 논문에서는 MHIS 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 유용성과 효과를 입증한다.

Faster R-CNN을 이용한 갓길 차로 위반 차량 검출 (Detecting Vehicles That Are Illegally Driving on Road Shoulders Using Faster R-CNN)

  • 고명진;박민주;여지호
    • 한국ITS학회 논문지
    • /
    • 제21권1호
    • /
    • pp.105-122
    • /
    • 2022
  • 최근 5년간 고속도로에서 발생한 사망 사고의 통계를 살펴보면, 고속도로 전체 사망자 중 갓길에서 발생한 사망자의 사망률이 약 3배 높은 것으로 나타났다. 이는 갓길 사고 발생 시 사고의 심각도가 매우 높다는 것을 보여주며, 갓길 차로 위반 차량을 단속하여 사고를 미연에 방지하는 것이 중요하다는 것을 시시한다. 이에 본 연구는 Faster R-CNN 기법을 활용하여 갓길 차로 위반 차량을 검출할 수 있는 방법을 제안하였다. Faster R-CNN 기법을 기반으로 차량을 탐지하고, 추가적인 판독 모듈을 구성하여 갓길 위반 여부를 판단하였다. 실험 및 평가를 위해 현실세계와 유사하게 상황을 재현할 수 있는 시뮬레이션 게임인 GTAV를 활용하였다. 이미지 형태의 학습데이터 1,800장과 평가데이터 800장을 가공 및 생성하였으며, ZFNet과 VGG16에서 Threshold 값의 변화에 따른 성능을 측정하였다. 그 결과 Threshold 0.8 기준 ZFNet 99.2%, Threshold 0.7 기준 VGG16 93.9%의 검출율을 보였고, 모델 별 평균 검출 속도는 ZFNet 0.0468초, VGG16 0.16초를 기록하여 ZFNet의 검출율이 약 7% 정도 높았으며, 검출 속도 또한 약 3.4배 빠름을 확인하였다. 이는 비교적 복잡하지 않은 네트워크에서도 입력 영상의 전처리 없이 빠른 속도로 갓길 차로 위반 차량의 검출이 가능함을 보여주며, 실제 영상자료 기반의 학습데이터셋을 충분히 확보한다면 지정 차로 위반 검출에 본 알고리즘을 활용할 수 있다는 것을 시사한다.

다중 객체 추적 알고리즘을 이용한 가공품 흐름 정보 기반 생산 실적 데이터 자동 수집 (Automatic Collection of Production Performance Data Based on Multi-Object Tracking Algorithms)

  • 임현아;오서정;손형준;오요셉
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.205-218
    • /
    • 2022
  • 최근 제조업에서의 디지털 전환이 가속화되고 있다. 이에 따라 사물인터넷(internet of things: IoT) 기반으로 현장 데이터를 수집하는 기술의 중요성이 증대되고 있다. 이러한 접근법들은 주로 각종 센서와 통신 기술을 활용하여 특정 제조 데이터를 확보하는 것에 초점을 맞춘다. 현장 데이터 수집의 채널을 확장하기 위해 본 연구는 비전(vision) 인공지능 기반으로 제조 데이터를 자동 수집하는 방법을 제안한다. 이는 실시간 영상 정보를 객체 탐지 및 추적 기술로 분석하고, 필요한 제조 데이터를 확보하는 것이다. 연구진은 객체 탐지 및 추적 알고리즘으로 YOLO(You Only Look Once)와 딥소트(DeepSORT)를 적용하여 프레임별 객체의 움직임 정보를 수집한다. 이후, 움직임 정보는 후보정을 통해 두 가지 제조 데이터(생산 실적, 생산 시간)로 변환된다. 딥러닝을 위한 학습 데이터를 확보하기 위해 동적으로 움직이는 공장 모형이 제작되었다. 또한, 실시간 영상 정보가 제조 데이터로 자동 변환되어 데이터베이스에 저장되는 상황을 재현하기 위해 운영 시나리오를 수립하였다. 운영 시나리오는 6개의 설비로 구성된 흐름 생산 공정(flow-shop)을 가정한다. 운영 시나리오에 따른 제조 데이터를 수집한 결과 96.3%의 정확도를 보였다.