• 제목/요약/키워드: Computer vision technology

검색결과 666건 처리시간 0.024초

템플릿 매칭과 부분 워핑을 이용한 효율적인 원근 영상 워핑 기법 (Efficient Image Warping Mechanism Using Template Matching and Partial Warping)

  • 정대헌;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.339-342
    • /
    • 2017
  • 이미지의 기하학적 변형은 이미지 보정을 위해 사용되며 컴퓨터 비전 분야에서 강체 변환, 유사변환 등 많은 방법이 존재한다. 그 중에서도 워핑은 원근감이 있는 이미지에서 많이 활용되는 이미지 보정 방법이다. 일반적으로 워핑을 수행하기 위해서는 워핑할 위치에 대한 특징 점 4개를 추출해 워핑을 수행한다. 그러나 워핑 지점을 정확한 추출이 어려우며, 추출된 4개의 점을 이용해 원근 영상 보정을 할 경우 원본 이미지와 보정 후 영상과의 특정 부분 픽셀이 3~4픽셀 이상으로 오차가 나타나게 된다. 그렇기 때문에 본 논문에서는 정확한 워핑 결과를 가져오기 위해 템플릿 매칭을 이용해 워핑 할 부분의 4개점을 보다 정확하게 추출하고, 추출된 4개점들 중 2개의 점 각각에 대해 주변 3 by 3 영역으로 점을 이동 시켜 총 81번의 반복을 워핑 통해 이미지 보정하는 형태이다. 이와 같이 2개의 점을 주변 3 by 3 위치로 이동 시키면서 오차 픽셀이 1픽셀 이하로 나는 최적의 위치 즉, 최적 결과를 가져오는 4개의 점을 선정한 후 그 점들로 이미지 보정을 진행하여 최적의 결과를 가져올 수 있다.

  • PDF

피로 검출을 위한 능동적 얼굴 추적 (Active Facial Tracking for Fatigue Detection)

  • 박호식;정연숙;손동주;나상동;배철수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.603-607
    • /
    • 2004
  • 본 논문에서는 얼굴 특징을 추출하는 새로운 능동적 방식을 제안하고자 한다. 운전자의 피로 상태를 검출하기 위한 얼굴 표정 인식을 위해 얼굴 특징을 추적하고자 하였다. 그러나 대다수의 얼굴 특징 추적 방법은 다양한 조명 조건과 얼굴 움직임, 회전등으로 얼굴의 특징점이 검출하지 못하는 경우가 발생한다. 그러므로 본 논문에서는 얼굴 특징을 추출하는 새로운 능동적 방식을 제안하고자 한다. 제안된 방법은 우선, 능동적 적외선 감지기를 사용하여 다양한 조명 조건 하에서 동공을 검출하고, 검출된 동공은 얼굴 움직임을 예측하는데 사용되어진다. 얼굴 움직임에 따라 특징이 국부적으로 부드럽게 변화한다고 할 때, 칼만 필터로 얼굴 특징을 추적할 수 있다. 제한된 동공 위치와 칼만 필터를 동시에 사용함으로 각각의 특징 지점을 정확하게 예상 할 수 있었고, Gabor 공간에서 예측 지점에 인접한 지점을 특징으로 추적할 수 있다. 패턴은 검출된 특징에서 공간적 연관성에서 추출한 특징들로 구성된다. 실험을 통하여 다양한 조명과 얼굴 방향, 표정 하에서 제안된 능동적 방법의 얼굴 추적의 실효성을 입증하였다.

  • PDF

경량화된 딥러닝 구조를 이용한 실시간 초고해상도 영상 생성 기술 (Deep Learning-based Real-Time Super-Resolution Architecture Design)

  • 안세현;강석주
    • 방송공학회논문지
    • /
    • 제26권2호
    • /
    • pp.167-174
    • /
    • 2021
  • 초고해상도 변환 문제에서 최근 딥러닝을 사용하면서 큰 성능 개선을 얻고 있다. 빠른 초고해상도 합성곱 신경망 (FSRCNN)은 딥러닝 기반 초고해상도 알고리즘으로 잘 알려져 있으며, 여러 개의 합성곱 층로 추출한 저 해상도의 입력 특징을 활용하여 역합성곱 층에서 초고해상도의 영상을 출력하는 알고리즘이다. 본 논문에서는 병렬 연산 효율성을 고려한 FPGA 기반 합성곱 신경망 가속기를 제안한다. 특히 역합성곱 층을 합성곱 층으로 변환하는 방법을 통해서 에너지 효율적인 가속기를 설계했다. 또한 제안한 방법은 FPGA 리소스를 고려하여 FSRCNN의 구조를 변형한 Optimal-FSRCNN을 제안한다. 사용하는 곱셈기의 개수를 FSRCNN 대비 3.47배 압축하였고, 초고해상도 변환 성능을 평가하는 지표인 PSNR은 FSRCNN과 비슷한 성능을 내고 있다. 이를 통해서 FPGA에 최적화된 네트워크를 구현하여 FHD 입력 영상을 UHD 영상으로 출력하는 실시간 영상처리 기술을 개발했다.

딥러닝 기반의 객체 탐지 모델을 활용한 과수 생육 단계 판별 시스템 (A System for Determining the Growth Stage of Fruit Tree Using a Deep Learning-Based Object Detection Model)

  • 방지현;박준;박성욱;김준영;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2022
  • 인공지능 기술의 발전으로 다양한 분야에서 AI가 접목된 시스템에 대한 관심이 급증하고 있다. 농업에서도 정보통신 기술을 적용한 스마트팜이 활용되고 있으며, 자율주행, 인공위성, 빅데이터 등의 다양한 첨단 기술을 접목하여 데이터 기반의 정밀 농업이 상용화되고 있다. 국내의 경우 시설농업 분야 스마트농업의 상용화 사례가 증가하고 있으나 시설원예 분야에 투자 편증이 심하여, 시설농업과 노지 농업의 투자 격차가 지속해서 벌어지고 있다. 특히, 과수, 식물공장 분야는 투자 규모가 작다. 또한, 빅데이터 수집, 활용 체계가 미흡하다는 문제점이 있다. 이에 본 논문에서는 농업의 빅데이터를 활용하는 방안으로 딥러닝 기반의 객체 탐지 모델을 활용한 과수 생육 단계 판별 시스템을 제안한다. 해당 시스템은 농업 현장에서 사용할 수 있도록 하이브리드 앱을 설계 및 구현하며 과수 생육단계 판별을 위한 객체 탐지 기능을 제공한다.

터널의 비접촉 이동식 상태점검 장비: 리뷰 (Non-contact mobile inspection system for tunnels: a review)

  • 이철희;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제25권3호
    • /
    • pp.245-259
    • /
    • 2023
  • 본 논문의 목적은 국내외 터널 스캐닝 시스템들을 분석하여 비접촉 이동식 상태점검 장비 개발에 대한 시사점을 도출하기 위한 것이다. 국내외 터널 스캐닝 시스템은 레이저 스캔과 이미지 스캔의 두 가지 기술로 개발되고 있다. 레이저 스캐닝 장비는 포인트 클라우드로부터 터널 라이닝의 기하하적 특성을 재현하는데 장점이 있다. 이미지 스캐닝 장비는 컴퓨터 비전을 활용하여 터널 라이닝 표면의 미세한 균열, 누수 등 손상 검출이 용이하다. 터널 라이닝의 손상 검출을 위해서는 이미지 스캐닝 장비가 더 적합할 것으로 분석되었다. 향후 개발 예정인 카메라 기반의 터널 스캐닝 시스템은 조명, 저장장치, 전원 공급 장치 및 차량 주행 속도 동기화 제어 장치로 구성되어야 할 것이다.

실시간 온라인 수업 및 시험 태도 데이터 세트 설계 및 구현 (Real-time Online Study and Exam Attitude Dataset Design and Implementation)

  • 김준식;이찬휘;송혁;권순철
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.124-132
    • /
    • 2022
  • 최근 코로나바이러스감염증-19(COVID-19)로 인해 온라인 원격 수업과 비대면 시험으로 인해 수업 태도 및 시험 부정행위에 대한 관리가 어려움을 겪고 있다. 따라서 온라인으로 학생들의 행동을 자동으로 인식하고 검출하는 시스템이 필요하다. 사람의 행동을 인식하는 행동 인식의 경우 컴퓨터 비전에서 많이 연구되는 기술 중 하나이다. 이러한 시스템을 개발하기 위해서는 온라인 수업 및 시험에서 주요 정보가 될 수 있는 사람의 팔 움직임 정보와 주변 물체에 대한 정보를 포함하는 데이터가 필요하다. 기존 데이터 세트는 여러 분야에 대해 분류를 하거나 일상생활 행동으로 구성되어 있어 본 시스템에 적용시키기에 어려움이 있다. 본 논문에서는 실시간으로 진행되는 온라인 시험 및 수업에서 태도를 분류할 수 있는 데이터 세트를 제시한다. 또한, 기존의 행동 인식 데이터 세트와의 비교를 통해 제안된 데이터 세트가 올바르게 구성되었는지를 보여준다.

의상 특징 기반의 동일인 식별 (Person Identification based on Clothing Feature)

  • 최유주;박선미;조위덕;김구진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-7
    • /
    • 2010
  • 비전 기반의 감시 시스템에서 동일인의 식별은 매우 중요하다. 감시 시스템에서 주로 사용되는 CCTV 카메라의 영상은 상대적으로 낮은 해상도를 가지므로 얼굴 인식 기법을 이용하여 동일인을 식별하기는 어렵다. 본 논문에서는 CCTV 카메라 영상에서 의상 특징을 이용하여 동일인을 식별하는 알고리즘을 제안한다. 건물의 주출입구에서 출입자가 인증을 받을 때, 의상 특징이 데이터베이스에 저장된다. 그 후, 건물 내에서 촬영한 영상에 대해 배경 차감 및 피부색 발견 기법을 이용하여 의상 영역을 발견한다. 의상의 특징 벡터는 텍스처와 색상 특징을 이용하여 구성한다. 텍스처 특징은 지역적 에지 히스토그램을 이용하여 추출된다. 색상 특징은 색상 지도의 옥트리 기반 양자화(octree-based quantization)를 이용하여 추출된다. 건물 내의 촬영 영상이 주어질 때, 데이터베이스에서 의상 특징이 가장 유사한 사람을 발견함으로써 동일인을 식별하며, 의상 특징 벡터 간의 유사도 측정을 위해서는 유클리디안 거리(Euclidean distance)를 사용한다. 실험 결과, 얼굴인식 기법이 최대 43%의 성공률을 보인 데 비해, 의상 특징을 이용하여 80%의 성공률로 동일인을 식별하였다.

원적외선용 반사식 전방위 비전 시스템의 광학 설계 (Optical Design of a Reflecting Omnidirectional Vision System for Long-wavelength Infrared Light)

  • 주윤재;조재흥;유재명
    • 한국광학회지
    • /
    • 제30권2호
    • /
    • pp.37-47
    • /
    • 2019
  • 야간 감시를 위해 원적외선에서 사용하는 4개의 구면 및 비구면 거울을 갖는 반사식 전방위 비전 시스템 광학계를 제안한다. 이 반사식 전방위 비전 시스템은 유사 카세그레인식 수광부 반사경 시스템과 역 유사 카세그레인식 결상부 반사경 시스템으로 설계되었으며, 그에 따른 설계 과정과 성능 분석을 상세히 제시한다. 이 비전 시스템의 반화각과 F-수는 각각 $40{\sim}110^{\circ}$와 1.56으로 설정하였다. 그리고 원적외선 파장 영역에서 비전 시스템을 사용하기 위해서 상의 크기가 원적외선용 마이크로 볼로미터의 크기와 가능한 같아야 하므로 상의 크기를 $5.9mm{\times}5.9mm$에 맞추어 설계를 진행하였다. 최적화 설계 후 $40{\sim}110^{\circ}$의 반화각 범위에서의 상 크기의 비율은 48.86%이며, 나이퀴스트 주파수인 20 lp/mm의 공간주파수에서 원적외선의 변조전달함수 값이 0.381에 도달하였다. 또한 20 lp/mm의 공간주파수에서 원적외선 영역에 대한 공차의 누적 확률은 99.75%였다. 또한 역 유사 카세그레인식 구조의 결상부 부경을 온도 변화에 따른 변조전달함수 값을 개선시키는 보상자로 선택하여 반사식 전방위 비전 시스템의 운용 온도 범위인 $-32^{\circ}C$에서 $+55^{\circ}C$의 온도 범위에서 비열화 해석 및 보상화 과정을 진행하였다.

3차원 입체영상에서 시지각(時知覺) 요인의 상관관계 (A Study on the Correlation of Factors in 3-D Stereoscopic Visual-perception)

  • 조용근
    • 만화애니메이션 연구
    • /
    • 통권19호
    • /
    • pp.161-181
    • /
    • 2010
  • 인간이 외부세계를 지각하는데 70%이상을 의존하고 시각을 통한 지각경험은 3차원 입체 영상기술의 발전으로 실재감 재현의 주축이 되고 있으며 다양한 연구 분야의 접목을 통해 발전하고 있다. 3차원 입체지각 기술은 양안시차의 지각요인의 원리를 경험적 지각요인과 결합하여 실재감을 재현하는 기술로, 인간이 지닌 시각의 생리적 특징을 메카니즘으로 한 것이다. 하지만 인간의 지각요인은 생리적인 요인으로만 설명하기엔 부족함이 많다. 대상을 지각하는데 있어 일정하게 지각하는 것이 아니라 인간의 심리적인 요인이나 물리적인 상태에 따라 다양하게 인지된다는 특성이 있기 때문이다. 따라서 시지각 요인간의 상관관계가 3차원 입체지각에 영향을 미치는지를 프로토타입을 제작하여 검증하고자 한다. 특히 3차원 입체를 지각하는 경험적, 생리적 요인과 형태를 지각하는 물리적, 심리적 요인을 중심으로, 게슈탈트의 집단화 및 단순화 현상과 3차원 입체지각 간의 관계를 실험을 통해 살펴볼 것이다. 본 연구를 통해 3차원 입체의 지각특성을 을 일부 파악하고 이는 실재감 재현을 위한 3차원 입체 콘텐츠제작에 기초연구가 될 것으로 본다.

  • PDF

손 동작 인식을 통한 인간 - 컴퓨터 인터페이스용 저가형 비주얼 모션 데이터 글러브 (Inexpensive Visual Motion Data Glove for Human-Computer Interface Via Hand Gesture Recognition)

  • 한영모
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.341-346
    • /
    • 2009
  • 모션 데이터 글러브는 손의 움직임을 측정하여 컴퓨터에 입력하는 대표적인 인간과 컴퓨터간의 인터페이스 도구로서, 홈 오토에이션, 가상 현실, biometrics, 모션 캡쳐 등의 컴퓨터 신기술에 사용되는 필수 장비이다. 본 논문에서는 대중화를 위하여, 별도의 특수 장비 없이 사용 가능한 저가형 비주얼 모션 데이터 글러브를 개발하고자 한다. 본 방식의 특징은 기존의 모션 데이터 글러브에 사용되었던, 고가의 모션 센싱 섬유를 사용하지 않음으로써, 저가형으로 개발이 가능하다는 것이다. 따라서 제작이 용이하고 대중화에 크게 기여할 수 있다는 장점을 가진다. 본 방식에서는 모션 센싱 섬유를 사용하는 기계적인 방식대신 광학적 모션 캡쳐 기술을 개량한 비주얼 방식을 채택한다. 기존의 비주얼 방식에 비해 본 방식은 다음과 같은 장점과 독창성을 가진다. 첫째, 기존의 비주얼 방식은 가려짐 현상을 제거하고 3차원 자세 복원을 위해 많은 수의 카메라와 장비를 사용하는 데 비해, 본 방식은 모노비전 방식을 채택하여 장비가 간소하고 저가형 개발이 가능하다. 둘째, 기존의 모노비전방삭은 가려짐 현상에 취약하여 영상에서 가려진 부분은 3차원 자세 복원이 어려웠다. 하지만 본 논문은 독창적으로 설계된 막대 모양의 지시자를 사용하여, 영상에서 가려진 부분도 3차원 자세 복원이 가능하다. 셋째, 기존의 모노 비전 방식은 비선형 수치해석 형태의 영상 해석 알고리즘을 사용하는 경우가 많아서 초기화나 계산시간 면에서 불편하였다. 하지만, 본 논문에서는 독창적인 공식화 방법을 사용하여 닫힌 형태의 영상해석 알고리즘을 도출함으로써 이와 같은 불편을 개선하였다. 넷째, 기존의 닫힌 형태의 알고리즘은 공식화 과정에서 근사화 방법을 도입하는 경우가 많아서 정확도가 떨어지고 특이점에 의한 응용분야에 제한이 있었다. 하지만 본 방식은 오일러 각과 같은 국부적인 매개화나 근사화 등을 사용하는 대신 지수형태의 트위스트좌표계를 사용하는 독창적인 공식화 방법을 사용하여, 공식화 단계에서의 근사화 방법 없이 닫힌 형태의 알고리즘을 도출함으로써 이 문제들을 개선하였다.