• 제목/요약/키워드: 영상 특징추출

검색결과 2,333건 처리시간 0.03초

심층 신경망을 이용한 자연어 지시의 실시간 시각적 접지 (Real-Time Visual Grounding for Natural Language Instructions with Deep Neural Network)

  • 황지수;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.487-490
    • /
    • 2019
  • 시각과 언어 기반의 이동(VLN)은 3차원 실내 환경에서 실시간 입력 영상과 자연어 지시들을 이해함으로써, 에이전트 스스로 목적지까지 이동해야 하는 인공지능 문제이다. 이 문제는 에이전트의 영상 및 자연어 이해 능력뿐만 아니라, 상황 추론과 행동 계획 능력도 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각과 언어 기반의 이동(VLN) 작업을 위한 새로운 심층 신경망 모델을 제안한다. 제안모델에서는 입력 영상에서 합성곱 신경망을 통해 추출하는 시각적 특징과 자연어 지시에서 순환 신경망을 통해 추출하는 언어적 특징 외에, 자연어 지시에서 언급하는 장소와 랜드마크 물체들을 영상에서 별도로 탐지해내고 이들을 추가적으로 행동 선택을 위한 특징들로 이용한다. 다양한 3차원 실내 환경들을 제공하는 Matterport3D 시뮬레이터와 Room-to-Room(R2R) 벤치마크 데이터 집합을 이용한 실험들을 통해, 본 논문에서 제안하는 모델의 높은 성능과 효과를 확인할 수 있었다.

동적 환경에 강인한 단안 카메라의 실시간 자세 추정 기법 (Real-Time Monocular Camera Pose Estimation which is Robust to Dynamic Environment)

  • 박준형;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.322-323
    • /
    • 2021
  • 증강현실이나 자율 주행, 드론 등의 기술에서 현재 위치와 시점을 파악하기 위해서는 실시간 카메라 자세 추정이 필요하다. 이를 위해 가장 일반적인 방식인 연속적인 단안 영상으로부터 카메라 자세를 추정하는 방식은 두 영상의 정적 객체 간에 견고한 특징점 매칭이 이루어져야한다. 하지만 일반적인 영상들은 다양한 이동 객체가 존재하는 동적 환경이므로 정적 객체만의 매칭을 보장하기 어렵다는 문제가 있다. 본 논문은 이 같은 동적 환경 문제를 해결하기 위해, 신경망 기반의 객체 분할 기법으로 영상 속 객체를 추출하고, 객체별 특징점 매칭 및 자세 추정 결과로 정적 객체를 특정해 매칭하는 방법을 제안한다. 또한, 제안하는 정적 객체 특정 방식에 적합한 신경망 기반 특징점 추출 방법을 사용하면 동적 환경에 보다 강인한 카메라 자세 추정이 가능함을 실험을 통해 확인한다.

  • PDF

DBSCAN과 FCM 기반 2-Layer 클러스터링을 이용한 초음파 영상에서의 결절종 추출 (Extracting Ganglion in Ultrasound Image using DBSCAN and FCM based 2-layer Clustering)

  • 박태언;송재욱;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.186-188
    • /
    • 2021
  • 본 논문에서는 초음파 영상에서 DBSCAN(Density-based spatial clustering of applications with noise)과 FCM 클러스터링 기반 양자화 기법을 적용하여 결절종을 추출하는 방법을 제안한다. 본 논문에서는 초음파 영상 촬영 시 좌우 상단의 지방층 영역과 하단 영역의 명암도가 어두운 영역을 잡음 영역으로 설정한다. 그리고 초음파 영상에 퍼지스트레칭 기법을 적용하여 잡음 영역을 최대한 제거 한 후에 ROI 영역을 추출한다. 추출된 ROI 영역에서 밀도 분포를 분석하기 위하여 히스토그램을 분석한 후에 DBSCAN을 적용하여 초음파 영상에서 결절종 후보에 해당되는 명암도를 추출한다. 추출한 후보 명암도를 대상으로 FCM 클러스터링 기법을 적용한다. FCM을 적용하는 단계에서 결절종의 저에코 혹은 무에코의 특징을 이용하여 클러스터 중심 값이 가장 낮은 클러스터를 양자화 한 후에 라벨링 기법을 적용시켜 결절종의 후보 객체를 추출한다. 제안된 결절종 추출 방법의 성능을 분석하기 위해 전문의가 결절종 영역을 표기한 초음파 영상과 표기되지 않은 초음파 영상 120쌍을 대상으로 DBSCAN, FCM, 그리고 제안된 방법 간의 성능을 비교 분석하였다. 제안된 방법에서는 120개의 초음파 영상에서 106개 결절종 영역이 추출되었고 FCM 기법에서는 80개가 추출되었고 DBSCAN에서는 36개가 추출되었다. 따라서 제안된 방법이 결절종 추출에 효율적인 것을 확인하였다.

  • PDF

가우시안 가중치 거리지도를 이용한 PET-CT 뇌 영상정합 (Co-registration of PET-CT Brain Images using a Gaussian Weighted Distance Map)

  • 이호;홍헬렌;신영길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.612-624
    • /
    • 2005
  • 본 논문에서는 PET-CT 뇌 영상융합을 위해 가우시안 가중치 거리지도를 이용한 표면기반 영상정합을 제안한다. 제안방법은 중요 세 단계로 표면 특징점 추출, 가우시안 가중치 거리지도 생성, 가중치기반 유사도 평가로 구성된다. 첫째, PET 영상과 CT 영상에서 삼차원 역 영역성장법을 이용하여 머리영역을 분할하고 머리 영역과 같이 분할된 잡음 영역을 영역성장법기반 레이블링을 이용한 영역 크기 비교를 통해 제거한 후 선명화 처리 필터를 적용하여 머리 표면 특징점을 추출한다. 둘째, CT 영상에서 추출한 표면 특징점에 가우시안 가중치 거리지도를 생성하여 큰 변위에서도 최적의 위치로 견고하게 수렴하도록 한다. 셋째, 가중치기반 상호상관관계는 PET 영상에서 추출한 표면 특징점과 대응되는 CT 영상의 가우시안 가중치 거리지도를 이용하여 최적 위치를 탐색한다. 본 논문에서는 제안방법의 정확성과 견고성 검사를 위해 인공데이타를 이용하고, 수행시간과 육안평가를 위해 임상데이타를 이용한다. 정확성 검사는 임의로 변환된 인공데이타에 제안방법을 적용한 후 추출된 최적화 변환벡터와의 오차를 제곱근평균제곱오차를 이용하여 평가한다. 견고성 검사는 큰 변위와 잡음을 가지는 인공데이타에서 가중치기반 상호상관관계가 최적의 위치에서 최대를 이루는지를 평가한다 실험 결과 제안한 표면기반 영상정합이 기존 표면기반 영상정합보다 정확하고 견고하게 수렴됨을 알 수 있다.

다중 접근 메모리 시스템을 이용한 고속 지문인식 특징추출 시스템 (Feature Extraction System for High-Speed Fingerprint Recognition using the Multi-Access Memory System)

  • 박종선;김재희;고경식;박종원
    • 한국멀티미디어학회논문지
    • /
    • 제16권8호
    • /
    • pp.914-926
    • /
    • 2013
  • 최근 보안 시스템 중에서 지문인식을 이용한 보안 시스템은 다른 보안 시스템에 비해 유일성과 편의성 등의 장점을 가짐으로써 많은 사람들이 관심을 갖는 분야이다. 지문인식 시스템에 있어서 가장 중요한 사항은 실제 지문과 영상을 통해 얻어진 지문간의 정합에서의 정확성과 지문 인식을 위해 사용하는 영상처리 알고리즘들을 신속하게 처리하는 데 있다. 기존의 지문인식 시스템은 특징 추출을 위해 사용하는 알고리즘들의 처리 시간을 줄이기 위해 전체 처리과정 중 일부 과정들을 생략함으로써 처리시간을 단축한다. 하지만 이 방식은 처리시간을 단축시킬 수 있는 반면 특징 추출에 대한 정확도가 떨어진다. 따라서 본 논문에서는 특징 추출에 대한 정확도를 높이기 위해 전체 처리 과정을 사용하면서 동시에 처리시간도 단축시킬 수 있는 다중 접근 메모리 시스템을 이용한 지문인식 특징 추출 알고리즘을 구현하였고, 구현된 시스템을 사용하였을때 다중접근 메모리 시스템과 시리얼 프로세서의 결과에 대해 correlation을 이용한 검증을 통해 제안된 방법의 신뢰도를 확인하였으며, 시리얼 프로세서에 비해 MAMS-PP64를 이용한 방법은 수행시간에서 약 1.56배 향상되었음을 확인하였다.

Homography와 영상 분할을 미용한 실내 영상으로부터의 기하정보와 카메라 정보의 추출 (Geometry and Camera Recovery for Indoor Images using Homographies and Image Segmentation)

  • 박태준;권대현;오광만
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.143-146
    • /
    • 2000
  • 본 논문에서는 다수의 실내 영상으로부터 영상을 촬영한 카메라의 속성정보와 실내 환경에 대한 기하정보를 추출하는 방법을 제안한다. BSP-Tree를 이용하여 주어진 실영상을 각각의 부분 영역이 실제로도 평면 영역에 해당되도록 분할하였으며, 특징점 대응을 통해 각 분할된 영역의 영상간 대응을 찾고 이로부터 각 분할 영역의 homography를 계산하였다 또한 간단한 가정을 통해 계산된 homography로부터 각 분할영역에 대응된 평면의 방정식과 각 영상을 촬영한 카메라의 속성을 찾아낼 수 있믐을 보였다. 본 논문에서 제안한 방법은 현재 본 연구팀이 구현 중인 영상기반 모델링 시스템에서 핵심적인 기능을 수행하리라 기대된다.

  • PDF

영상신호 특성 및 Human 특징을 이용한 실시간 영상 분류 (Video Segmentation Using Image signal and Human characteristic)

  • 김민준;김원하
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.284-287
    • /
    • 2016
  • 영상에서 배경으로부터 객체를 분류하는 영상 분류 알고리즘은 물체 인식 및 추적 등 다양한 응용분야에서 중요하다. 본 논문에서는 고정된 카메라에서 다수의 초기 프레임을 참조하여 실시간 영상 분류 방법을 제안한다. 먼저 전경과 배경을 구분하는 확률모델을 제안하였으며 초기 프레임 동안에 카메라의 특성을 추출하여 카메라에 적응적으로 영상을 분류한다. 또한 분류된 영상에서 human의 특징을 이용하여 분류된 결과를 보정하는 방법을 제안한다. 마지막으로 제안한 알고리즘의 실시간 분류 처리를 위하여 복잡도를 최소화 하였다.

  • PDF

잡영 영상에서의 선택적 주의 기반 목표물 탐지 시스템 (A Selective Attention Based Target Detection System in Noisy Images)

  • 최경주;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.622-624
    • /
    • 2002
  • 본 논문에서는 선택적 주의에 기반한 잡영 영상에서의 목표물 탐지 방법에 대해 기술한다. 특히 제안하는 방법은 목표물에 대한 아무런 지식을 사용하지 않고, 단지 입력되는 영상의 상향식 단서만을 사용하여 목표물을 탐지해냄으로써 여러 다양한 분야에 일반적으로 사용될 수 있다. 제안하는 시스템에서는 몇 가지 기본 특징들이 입력된 영상에서 바로 추출되며, 이러한 특징들이 서로 통합되어 가는 과정에서 목표물 탐지에 유용하지 않은 정보는 자연스럽게 걸러지며, 유용한 정보는 추가되고 부각되어진다. 간단한 영상부터 복잡한 자연영상에 이르는 다양한 잡영 영상을 대상으로 실험하여 제안하는 시스템의 성능을 평가하였다.

  • PDF

논리 연산을 이용한 주행차량 분할 및 추적에 관한 연구 (A Study on Moving Vehicles Segmentation and Tracking using Logic Operations)

  • 조경민;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.211-214
    • /
    • 2004
  • 본 논문은 논리 연산을 이용한 실시간 주행 차량 분할 및 추적에 관한 알고리즘을 제안하였다. 연속된 프레임 간에 논리연산을 이용하여 영상을 분할하고, 배경과 잡음을 제거하였으며 영상에서 주행차량의 이동 영역을 추출하였다. 주행차량들을 논리 연산을 이용하여 영상분할 함으로써 기존 방법에 비해 평활화 및 에지추출 단계에서 나타날 수 있는 문제점들을 제거하였고, 전처리 단계를 줄였으며, 알고리즘을 단순화 하였다. 또한 추적되는 영상으로부터 위치와 컬러등의 주행 차량의 특징을 직접 추출 가능하도륵 하였다.

  • PDF

다중의 특징 분석을 통한 비 유사 영역의 자동적인 검출 (Automatic Detection of Dissimilar Regions through Multiple Feature Analysis)

  • 장석우;정명희
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.160-166
    • /
    • 2020
  • 모바일 기반의 하드웨어 기술이 발전함에 따라 많은 종류의 응용 프로그램들이 개발되고 있다. 그리고 이런 응용프로그램들의 인터페이스가 올바르게 동작하는지를 자동으로 검사하려는 수요가 증가하고 있다. 본 논문에서는 입력되는 여러 가지 유형의 영상으로부터 주요한 특징의 비교 분석을 통해서 응용 프로그램의 실행 오류 화면을 강인하게 검출하는 접근 방법을 제시한다. 본 논문에서 제시된 방법에서는 먼저 입력되는 영상으로부터 영상을 대표하는 주요한 다중의 특징을 추출한다. 그런 다음, 추출된 다중의 특징의 차이를 비교함으로써 입력된 영상이 목표 영상과 동일한 정상적인 영상인지, 아니면 목표 영상과 유사하지만 서로 다른 오류 영상인지를 효과적으로 판단한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 종류의 영상으로부터 주요한 다중의 특징 비교를 통해서 정상적인 영상과 오류가 발생한 영상을 정확하게 검출한다는 것을 보여준다. 본 논문에서 제안된 접근 방법은 비디오 색인, 객체 검출 및 추적, 영상 감시 등과 같은 컴퓨터 비전과 관련된 많은 실제 응용 분야에서 유용하게 사용될 것으로 기대된다.