• 제목/요약/키워드: 영상 처리 소프트웨어

검색결과 719건 처리시간 0.026초

표면분할을 이용한 시차공간상에서의 모델 기반 평면검출 (Model-Based Plane Detection in Disparity Space Using Surface Partitioning)

  • 하홍준;이창훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.465-472
    • /
    • 2015
  • 본 논문에서는 시차공간상의 평면검출 방법을 제안하고 그 성능을 평가한다. 다양한 표면을 평면으로 근사하고 검출함으로써 시차공간에 나타난 장면을 간소화하고 수식화하여 다루기 쉽도록 한다. 또한 시차공간에서 근사적으로 구한 평면은 3차원 공간상에서 실측 크기로 표현 가능하고 장애물 검출 및 카메라 위치 추정에 활용할 수 있다. 먼저 스테레오 매칭 기술을 이용해 두 개의 영상으로부터 2차원 공간상에 좌표쌍마다 시차값을 가지는 시차공간을 생성한다. x 또는 y축의 전체적인 추이를 반영하도록 돕는 선 단순화 기법을 이용하여 시차값의 접선 기울기를 추정한다. 기울기 쌍의 조합에 따라 10개의 라벨을 시차공간의 좌표쌍에 부여한다. 상하좌우 방향으로 인접하고 동일한 라벨을 가지는 좌표쌍을 연결하여 군집을 생성하고 최소자승법을 이용해 각 군집에 대한 평면식을 추정한다. 시차공간 내에서 평면식을 만족하는 점들이 가장 많은 평면을 검출하고 이를 시차공간을 가장 잘 간소화한 N개의 평면으로 선택한다. 평면검출의 성능을 정량적으로 평가하였고 그 결과는 3차원 원뿔과 원통에서 각각 97.9%, 86.6% 품질을 보였다. 스테레오 비전 알고리즘의 성능을 평가하기 위해 대표적으로 이용되는 Middlebury와 KITTI 실험데이터로부터 제안된 평면검출 방법은 훌륭하게 평면을 검출하였다.

Stereo Vision과 AlphaPose를 이용한 다중 객체 거리 추정 방법에 관한 연구 (A Study on the Estimation of Multi-Object Social Distancing Using Stereo Vision and AlphaPose)

  • 이주민;배현재;장규진;김진평
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권7호
    • /
    • pp.279-286
    • /
    • 2021
  • 최근 COVID-19 확산 방지를 위한 공공장소에서는 최소 1m 이상을 유지하는 물리적 거리두기 정책을 실행하고 있다. 본 논문에서는 드론과 CCTV가 취득한 스테레오 영상에서 실시간으로 사람들 간의 거리를 추정하는 방법과 추정된 거리에서 1m 이내의 객체를 인식하는 자동화 시스템을 제안한다. 기존의 CCTV를 이용하여 다중 객체 간의 거리 추정에 사용되었던 방법의 문제점으로는 한 대의 CCTV만을 이용하여 객체의 3차원 정보를 얻지 못한다는 것이다. 선, 후행하거나 겹쳐진 사람 간의 거리를 구하기 위해서는 3차원 정보가 필요하기 때문이다. 또한, 일반적인 Detected Bounding Box를 사용하여 영역 안에서 사람이 존재하는 정확한 좌표를 얻지 못한다. 따라서 사람이 존재하는 정확한 위치 정보를 얻기 위해 스켈레톤 추출하여 관절 키포인트의 2차원 좌표를 획득한 후, Stereo Vision을 이용한 카메라 캘리브레이션을 적용하여 3차원 좌표로 변환한다. 3차원으로 변환된 관절 키포인트의 중심좌표를 계산하고 객체 간 사이의 거리를 추정한다. 3차원 좌표의 정확성과 객체(사람) 간의 거리 추정 실험을 수행한 결과, 1m 이내에 존재하는 다수의 사람 간의 거리 추정에서 0.098m 이내 평균오차를 보였다.

공공 빅데이터를 이용한 UAV 위험구역검출 및 회피방법 (Detecting and Avoiding Dangerous Area for UAVs Using Public Big Data)

  • 박경석;김민준;김승호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권6호
    • /
    • pp.243-250
    • /
    • 2019
  • 움직이는 UAV는 많은 위치에너지와 운동에너지를 가지므로 지상으로 추락하는 경우 많은 충격량을 가질 수 있다. 이는 인명피해로 연결될 수 있기 때문에 본 논문에서는 UAV 비행경로 상의 인구밀집지역을 위험구역으로 정의하였다. 기존의 UAV 경로비행은 사용자에 의해 미리 설정된 경로만을 운행하는 수동적인 형태였다. 일부 UAV는 경로비행 중 장애물을 회피하는 시스템 등 안전기능을 포함하고 있지만, 실시간 비행환경변화에 대응하기에는 부족하다. UAV 경로비행에 공공 빅데이터를 활용할 경우, 위험구역을 검출하고 회피비행을 수행할 수 있어서 실시간 비행환경변화에 대한 대응이 향상될 수 있다. 따라서 본 논문에서는 실시간으로 수집된 빅데이터를 활용하여 위험구역을 회피하는 최적경로 비행 방안을 제안한다. 실험 결과, 제안하는 자동경로비행에서 목적지와 목적지에 따른 경로를 지정할 경우, 실시간으로 위험지역을 판단하여 최적 우회경로로 비행하는 것을 확인하였다. 추후 회피방안에 따라 비행하여 획득하는 영상의 질적 만족도를 높일 수 있는 방안을 연구할 예정이다.

RGB-D 환경인식 시각 지능, 목표 사물 경로 탐색 및 심층 강화학습에 기반한 사람형 로봇손의 목표 사물 파지 (Grasping a Target Object in Clutter with an Anthropomorphic Robot Hand via RGB-D Vision Intelligence, Target Path Planning and Deep Reinforcement Learning)

  • 류가현;오지헌;정진균;정환석;이진혁;;김태성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권9호
    • /
    • pp.363-370
    • /
    • 2022
  • 다중 사물 환경에서 목표 사물만의 정밀한 파지를 위해서는 장애물과의 충돌 회피 지능과 정교한 파지 지능이 필요하다. 이 작업을 위해선 다중 사물 환경 인지, 목표 사물 인식, 경로 설정, 로봇손의 사물 파지 지능이 필요하다. 본 연구에서는 RGB-D 영상 센서를 이용하여 다중 사물 환경과 사물을 인지하고 3D 공간을 매핑한 후, 충돌 회피 경로 탐색 알고리즘을 활용하여 목표 사물까지의 경로를 탐색 및 설정하고, 강화학습을 통해 학습된 사람형 로봇손의 목표 사물 파지 지능을 활용해 최종적으로 시뮬레이션 및 하드웨어 사물 파지 시스템을 구현하고 검증하였다. 사람형 로봇손을 구현한 시뮬레이션 환경에서 5개의 사물 중 목표 사물을 지정하고 파지한 결과 경로 탐색 없는 파지 시스템이 평균 78.8%의 성공률과 34%의 충돌률을 보일 때, 경로 탐색 지능과 결합된 시스템은 평균 94%의 성공률과 평균 20%의 충돌률을 보였다. UR3와 QB-Soft Hand를 사용한 하드웨어 환경에서는 3개의 사물 중 목표 사물을 지정하고 파지한 결과 경로 탐색 없는 파지 시스템이 평균 30%의 성공률과 97%의 충돌률을 보일 때, 경로 탐색 지능과 결합된 시스템은 평균 90%의 성공률과 평균 23%의 충돌률을 보였다. 본 연구에서는 RGB-D 시각 지능, 충돌 회피 경로 탐색, 사물 파지 심층 강화학습 지능의 결합을 통하여, 사람형 로봇손의 목표 사물 파지가 가능함을 제시하였다.

멀티모달 맥락정보 융합에 기초한 다중 물체 목표 시각적 탐색 이동 (Multi-Object Goal Visual Navigation Based on Multimodal Context Fusion)

  • 최정현;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.407-418
    • /
    • 2023
  • MultiOn(Multi-Object Goal Visual Navigation)은 에이전트가 미지의 실내 환경 내 임의의 위치에 놓인 다수의 목표 물체들을 미리 정해준 일정한 순서에 따라 찾아가야 하는 매우 어려운 시각적 탐색 이동 작업이다. MultiOn 작업을 위한 기존의 모델들은 행동 선택을 위해 시각적 외관 지도나 목표 지도와 같은 단일 맥락 지도만을 이용할 뿐, 다양한 멀티모달 맥락정보에 관한 종합적인 관점을 활용할 수 없다는 한계성을 가지고 있다. 이와 같은 한계성을 극복하기 위해, 본 논문에서는 MultiOn 작업을 위한 새로운 심층 신경망 기반의 에이전트 모델인 MCFMO(Multimodal Context Fusion for MultiOn tasks)를 제안한다. 제안 모델에서는 입력 영상의 시각적 외관 특징외에 환경 물체의 의미적 특징, 목표 물체 특징도 함께 포함한 멀티모달 맥락 지도를 행동 선택에 이용한다. 또한, 제안 모델은 점-단위 합성곱 신경망 모듈을 이용하여 3가지 서로 이질적인 맥락 특징들을 효과적으로 융합한다. 이 밖에도 제안 모델은 효율적인 이동 정책 학습을 유도하기 위해, 목표 물체의 관측 여부와 방향, 그리고 거리를 예측하는 보조 작업 학습 모듈을 추가로 채용한다. 본 논문에서는 Habitat-Matterport3D 시뮬레이션 환경과 장면 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 모델의 우수성을 확인하였다.

인물 개체 분할을 위한 맥락-의존적 비디오 데이터 보강 (Context-Dependent Video Data Augmentation for Human Instance Segmentation)

  • 전현진;이종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권5호
    • /
    • pp.217-228
    • /
    • 2023
  • 비디오 개체 분할은 비디오를 구성하는 영상 프레임 각각에 대해 관심 개체 분할을 수행해야 할 뿐만 아니라, 해당 비디오를 구성하는 프레임 시퀀스 전체에 걸쳐 개체들에 대한 정확한 트래킹을 요구하기 때문에 난이도가 높은 기술이다. 특히 드라마 비디오에서 인물 개체 분할은 다양한 장소와 시간대에서 상호 작용하는 복수의 주요 등장인물들에 대한 정확한 트래킹을 요구하는 특징을 가지고 있다. 또한, 드라마 비디오 인물 개체분할은 주연 인물들과 조연 혹은 보조 출연 인물들 간의 등장 빈도에 상당한 차이가 있어 일종의 클래스 불균형 문제도 있다. 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오들의 시-공간적 맥락을 충분히 고려해서 목표 인물이 삽입되어야 할 배경 클립 내의 위치를 결정함으로써, 보다 더 현실적인 보강 비디오들을 생성한다. 따라서 본 논문에서 제안하는 새로운 비디오 데이터 보강 기법인 CDVA는 비디오 개체 분할을 위한 심층 신경망 모델의 성능을 효과적으로 향상시킬 수 있다. 본 논문에서는 MHIS 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 유용성과 효과를 입증한다.

생성형 대규모 언어 모델과 프롬프트 엔지니어링을 통한 한국어 텍스트 기반 정보 추출 데이터셋 구축 방법 (A Study on Dataset Generation Method for Korean Language Information Extraction from Generative Large Language Model and Prompt Engineering)

  • 정영상;지승현;권다롱새
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.481-492
    • /
    • 2023
  • 본 연구는 생성형 대규모 언어 모델을 활용하여 텍스트에서 정보를 추출하기 위한 한글 데이터셋 구축 방법을 탐구한다. 현대 사회에서는 혼합된 정보가 빠르게 유포되며, 이를 효과적으로 분류하고 추출하는 것은 의사결정 과정에 중요하다. 그러나 이에 대한 학습용 한국어 데이터셋은 아직 부족하다. 이를 극복하기 위해, 본 연구는 생성형 대규모 언어 모델을 사용하여 텍스트 기반 제로샷 학습(zero-shot learning)을 이용한 정보 추출을 시도하며, 이를 통해 목적에 맞는 한국어 데이터셋을 구축한다. 본 연구에서는 시스템-지침-소스입력-출력형식의 프롬프트 엔지니어링을 통해 언어 모델이 원하는 결과를 출력하도록 지시하며, 입력 문장을 통해 언어 모델의 In-Context Learning 특성을 활용하여 데이터셋을 구축한다. 생성된 데이터셋을 기존 데이터셋과 비교하여 본 연구 방법론을 검증하며, 관계 정보 추출 작업의 경우 KLUE-RoBERTa-large 모델 대비 25.47% 더 높은 성능을 달성했다. 이 연구 결과는 한국어 텍스트에서 지식 요소를 추출하는 가능성을 제시함으로써 인공지능 연구에 도움을 줄 것으로 기대된다. 더욱이, 이 방법론은 다양한 분야나 목적에 맞게 활용될 수 있어, 다양한 한국어 데이터셋 구축에 잠재력을 가진다고 볼 수 있다.

QPS 프로그램에서 Myocardial extract 적용에 따른 임상적 유용성 평가 (The Evaluation of Clinical Usefulness on Application of Myocardial Extract in Quantitative Perfusion SPECT)

  • 윤종준;임영현;이무석;송현석;정지욱;박세윤;김재환;김정욱
    • 핵의학기술
    • /
    • 제15권2호
    • /
    • pp.88-93
    • /
    • 2011
  • 게이트 심근관류 SPECT의 정량적 평가를 위해 사용되는 자동화된 정량화 소프트웨어(AutoQUANT)는 획득 자료 처리과정에 따라 측정치 오차가 발생할 것으로 예상된다. 동일한 환자를 대상으로 다른 조건의 변화 없이 QPS (Quantitative Perfusion SPECT) 프로그램에서 Myocardial extract 전후에 따른 정량적 지표를 구하여 평가하고자 한다. 2010년 6월부터 2010년 12월까지 부산대학교병원 핵의학과에서 Tc-99m MIBI 게이트 심근관류 SPECT를 시행한 환자 중 51명(남:여=34:17, 평균나이 $66.45{\pm}9.92$)을 대상으로 하였다. 심근의 단축단면상을 이용하여 원형 관심영역은 배후영역을 제외한 심근영역에서 설정한 자료를 획득하였다. AutoQUANT를 이용한 QPS 프로그램에서 일과성허혈확장(Transient Ischemic Dilation, TID), 부하기 관류결손 범위율의 합(Extent of Stress Defect, ESD)과 부하기 관류점수 합(Summed Stress Score, SSS)을 구하여 비교 분석하였다. QPS 프로그램에서 Myocardial extract 적용 전과 적용 후 정량적 지표의 상관계수는 TID (r=0.98), ESD (r=0.99), SSS (r=0.99) 모두 좋은 상관관계를 보였다. 95% 신뢰수준에서 TID (p=0.78), ESD (p=0.31), SSS (p=0.19) 모두 통계적으로 유의한 차이가 없었다. 육안분석에서는 판독에 영향을 줄 수 있을 만한 영상의 차이는 발견할 수 없었다. QPS 프로그램에서 Myocardial extract 적용 전과 적용 후 정량적 지표(TID, ESD, SSS)는 모두 좋은 상관관계가 있다는 것을 확인할 수 있었고, 통계적으로 유의한 차이를 보이지 않았다. Myocardial extract 영상처리기법이 비교적 간단하여 심근관류 SPECT 영상의 질을 올릴 수 있을 것으로 사료된다.

  • PDF

활성함수 변화에 따른 초해상화 모델 성능 비교 (A Performance Comparison of Super Resolution Model with Different Activation Functions)

  • 유영준;김대희;이재구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권10호
    • /
    • pp.303-308
    • /
    • 2020
  • ReLU(Rectified Linear Unit) 함수는 제안된 이후로 대부분의 깊은 인공신경망 모델들에서 표준 활성함수로써 지배적으로 사용되었다. 이후에 ReLU를 대체하기 위해 Leaky ReLU, Swish, Mish 활성함수가 제시되었는데, 이들은 영상 분류 과업에서 기존 ReLU 함수 보다 향상된 성능을 보였다. 따라서 초해상화(Super Resolution) 과업에서도 ReLU를 다른 활성함수들로 대체하여 성능 향상을 얻을 수 있는지 실험해볼 필요성을 인지하였다. 본 연구에서는 초해상화 과업에서 안정적인 성능을 보이는 EDSR(Enhanced Deep Super-Resolution Network) 모델에 활성함수들을 변경하면서 성능을 비교하였다. 결과적으로 EDSR의 활성함수를 변경하면서 진행한 실험에서 해상도를 2배로 변환하는 경우, 기존 활성함수인 ReLU가 실험에 사용된 다른 활성함수들 보다 비슷하거나 높은 성능을 보였다. 해상도를 4배로 변환하는 경우에서는 Leaky ReLU와 Swish 함수가 기존 ReLU 함수 대비 다소 향상된 성능을 보임을 확인하였다. Leaky ReLU를 사용했을 때 기존 ReLU보다 영상의 품질을 정량적으로 평가할 수 있는 PSNR과 SSIM 평가지표가 평균 0.06%, 0.05%, Swish를 사용했을 때는 평균 0.06%, 0.03%의 성능 향상을 확인할 수 있었다. 또한 해상도를 8배로 변환하는 경우에서는 Mish 함수가 기존 ReLU 함수 대비 다소 향상된 성능을 보임을 확인하였다. Mish를 사용했을 때 기존 ReLU보다 PSNR과 SSIM 평가지표가 평균 0.06%, 0.02%의 성능 향상을 확인할 수 있었다. 결론적으로 해상도를 4배로 변환하는 초해상화의 경우는 Leaky ReLU와 Swish가, 해상도를 8배로 변환하는 초해상화의 경우는 Mish가 ReLU 대비 향상된 성능을 보였다. 향후 연구에서는 다른 초해상화 모델에서도 성능 향상을 위해 활성함수를 Leaky ReLU, Swish, Mish로 대체하는 비교실험을 수행하는 것도 필요하다고 판단된다.

피부색소 흡수 스펙트럼을 이용한 카메라 RGB 신호의 피부색 성분 분석 (Analysis of Skin Color Pigments from Camera RGB Signal Using Skin Pigment Absorption Spectrum)

  • 김정엽
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.41-50
    • /
    • 2022
  • 본 논문에서는 멜라닌과 헤모글로빈 등의 피부 색상을 구성하는 주요한 요소들을 카메라의 RGB 신호로부터 직접 계산하는 방법을 제안한다. 피부 색상의 주요한 요소들은 통상적으로 특정한 장비를 이용하여 분광 반사도를 측정하고, 측정된 빛의 일부 파장에서의 값들을 중심으로 재구성하는 방법을 사용한다. 이와 같은 방법으로 산출된 값들은 멜라닌 지수, 홍반 지수와 같은 것들이 있으며, 분광반사도 측정 장치나 다중스펙트럼 카메라 등의 특수한 장비를 필요로 한다. 일반적인 디지털 카메라로부터 이와 같은 성분요소들에 대한 직접적인 계산방법은 찾아보기 어려우며, 독립성분 분석(Independent Component Analysis)을 이용하여 멜라닌과 헤모글로빈의 농도를 간접적으로 계산하는 방법은 제안되어 있다. 이 방법은 일정한 RGB 영상의 영역을 대상으로 하여, 주성분 분석(Principal Component Analysis)과 유사한 방식으로 멜라닌과 헤모글로빈의 특성벡터를 추출하고, 농도를 계산할 수 있다. 이 방법의 단점은 일정한 영역의 화소 그룹을 입력으로 이용하기 때문에 화소단위의 직접적인 계산이 어렵고, 추출된 특성벡터는 최적화 방식으로 구현하기 때문에 실행할 때마다 다른 값으로 계산되는 경향이 있다. 최종적인 계산은 특성벡터 자체를 활용하지 않고, RGB 좌표계로 다시 변환하여 멜라닌과 헤모글로빈의 성분을 나타내는 영상 형태로 결정된다. 이 방법의 단점을 개선하기 위하여 제안하는 방법은 특성벡터를 활용하여 RGB 좌표계가 아닌 특징 공간에서 멜라닌과 헤모글로빈의 성분 값을 계산하는 것과, 일반적인 디지털 카메라를 이용하여 피부색에 해당하는 분광 반사도를 계산하는 방법, 분광 반사도를 이용하여 멜라닌과 옥시헤모글로빈, 디옥시헤모글로빈, 카로티노이드 등의 피부색소를 구성하는 세부 성분들의 계산방법 등이다. 제안한 방법은 분광 반사도 측정 장치나 다중 스펙트럼 카메라 등의 특수한 장비를 필요로 하지 않으며, 기존 방법과는 달리 화소단위의 직접적인 계산이 가능하고, 반복 실행에도 동일한 특성을 얻을 수 있다. 제안한 방법은 기존에 비하여 성능의 안정성을 나타내는 표준편차가 15% 수준으로 낮게 나타나 6배 정도의 안정적인 성능을 가진 것으로 추정된다.