• 제목/요약/키워드: 영상데이터

검색결과 6,507건 처리시간 0.03초

동영상 내용기반 검색을 위한 고차원 벡터 데이터 색인 구조의 성능 분석 (Performance Analysis of High-Dimensional Index Structure for Vector Data in Content-Based Video Retrieval)

  • 이현조;장재우;박순영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.211-214
    • /
    • 2007
  • 최근 멀티미디어 데이터, 특히 UCC를 중심으로 동영상 데이터가 급증하고 있다. 그러나 현재 대부분의 검색 시스템은 키워드 기반의 동영상 데이터 검색만을 지원하고 있으며, 따라서 사용자가 원하는 동영상 데이터를 효율적으로 검색하지 못하는 실정이다. 동영상 데이터에 대한 효율적인 검색을 지원하기 위해서는, 동영상의 내용(이미지, 색, 모양 등)을 고차원의 특징 벡터 데이터로 표현하여 유사한 동영상을 검색하는 내용-기반 검색이 요구된다. 본 논문에서는 내용-기반 검색을 위해 제안된 기존의 고차원 벡터 데이터 색인 구조를 실험을 통하여 성능을 비교하며, 이를 통해 동영상 내용-기반 검색에 가장 효율적인 색인 기법을 제시한다. 아울러 보다 효율적인 내용-기반 검색을 위한, 근사 k-NN 질의 탐색 기법의 유용성을 검증한다.

원격조종헬기를 이용한 영상획득시스템 구축 (Development of Image Acquisition System based on a R/C helicopter)

  • 오태완;김성준;이임평;안흥규
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2009년도 춘계학술대회 논문집
    • /
    • pp.305-308
    • /
    • 2009
  • 최근 카메라와 같은 센서가 장착된 UAV(Unmanned Aerial Vehicle, 무인항공기)를 이용하는 분야는 방재, 농업, 군사 분야 등 매우 다양해지고 있다. 그러나 고품질의 영상데이터를 취득하기 위해서는 가벼우면서도 우수한 성능을 지닌 고가의 MEMS 센서 그리고 센서가 안정적으로 데이터를 획득할 수 있도록 안정적인 비행이 가능한 대형 UAV플랫폼으로 구성된 시스템이 필요하기 때문에 시스템 구축비용이 클 수밖에 없다. 본 연구에서는 저비용으로 영상 데이터를 취득할 수 있는 UAV시스템을 구축하여 취득된 영상데이터의 처리를 통해 얻어지는 영상의 품질을 살펴보고 그 효용성을 시험해보았다. 이를 위해서 고가인 UAV를 대신해 비교적 가격이 저렴한 R/C헬기(Remote Control, 원격조종 헬기)를 플랫폼으로 선정하고, 영상데이터를 수집하는 카메라센서를 탑재하였다. 그리고 탑재된 센서가 안정적으로 데이터를 취득할 수 있도록, 센서와 플랫폼 사이에 Gimbal을 장착하였다. 이렇게 구축된 시스템을 이용하여 시험비행을 해보았으며, 그 결과 플랫폼에 탑재된 센서로부터 비교적 안정적이고 양질의 이미지를 획득할 수 있었다. 본 연구에서 구축한 R/C 헬리콥터 시스템을 통하여 저비용/고효율의 영상데이터를 취득할 수 있음을 확인하였다. 구축된 시스템은 근접한 거리에서 대상물의 영상을 취득하기 때문에 고품질의 3차원 모델데이터 생성에 매우 도움이 될 것으로 생각한다.

  • PDF

GAN 기반 관절 데이터 생성을 통한 행동 인식 방법 설계 (A Design of Behavior Recognition method through GAN-based skeleton data generation)

  • 김진아;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.592-593
    • /
    • 2022
  • 다중 데이터 기반의 행동 인식 과정에서 데이터 수집 반경이 비교적 제한되는 영상 데이터의 결측에 대한 보완이 요구된다. 본 논문에서는 6축 센서 데이터를 이용하여 결측된 영상 데이터를 생성함으로써 행동 인식의 성능을 개선하는 방법을 제안한다. 가속도와 자이로 센서로부터 수집된 행동 데이터를 이용하여 GAN(Generative Adversarial Network)을 통해 영상에서의 관절(Skeleton) 움직임에 대한 데이터를 생성하고자 한다. 이를 위해 DeepLabCut 기반 모델 학습을 통해 관절 좌표를 추출하며, 전처리된 센서 시퀀스 데이터를 가지고 GRU 기반 GAN 모델을 통해 관절 좌표에 대한 영상 시퀀스 데이터를 생성한다. 생성된 영상 시퀀스 데이터는 영상 데이터의 결측이 발생했을 때 대신 행동 인식 모델의 입력값으로 활용될 수 있어 성능 향상을 기대할 수 있다.

초고속 자기 공명 영상 기법 - Echo Planar 영상 및 Spiral Scan 영상

  • 안창범
    • Investigative Magnetic Resonance Imaging
    • /
    • 제3권1호
    • /
    • pp.6-12
    • /
    • 1999
  • Echo Planar Imaging (EPI) Spiral Scan 영상을 초고속 자기공명영상 기법으로서 전체 k-space의 데이터를 한번 scan에 다 받을 수 있기 때문에 데이터 측정시간을 100ms 이내로 단축시킬 수 있다. 이러한 초고속 영상 기법은 최근 활발히 연구되고 있는 뇌기능 영상과 관련하여 중요도가 더욱 커지고 있다. EPI는 직각좌표계에서 데이터를 받기 때문에 재구성은 비교적 쉬우나 eddy current를 많이 야기시키는 단점을 가지고 있다. 반면에 Spiral Scan 영상은 먼저 데이터를 원 또는 직각좌표계로 interpolation을 한 후 재구성하여야 하는 단점이 있으나, 상대적으로 eddy current가 작고, 방향과 무관하게 균일한 point spread function을 가지며, 혈류와 관련한 위상이 스스로 rephasing 되어 심장 영상 등에 유리한 장점이 있다.

  • PDF

레이저 데이터와 CCD영상의 합성을 통한 3차원 도로형상 생성기법 (3D Road Shape Production Technique Using Composition of Laser Data and CCD Image)

  • 이수암;김태정;정동훈;성정곤
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.15-18
    • /
    • 2006
  • 도로의 정보를 취득하기 위하여 제작된 도로 안정성 조사 분석 차량(RoSSAV)은 도로의 3차원 정보를 취득하는 한 방법으로 레이저 스캐너를 사용한다. 레이저 스캐너로부터 취득된 도로의 3차원 정보는 많은 목적으로 활용할 수 있는 매우 유용한 정보이나, 도로의 3차원 정보를 사용자가 육안으로 확인할 수 있도록 영상으로 편집을 하게 되면, 현실감 있는 영상이 생성되기는 어렵다. 이를 보완하기 위하여 본 연구에서는 레이저 스캐너로부터 얻은 정보와는 별도로 CCD 카메라로 도로 전방 영상을 촬영하였고, 이 두 가지 데이터를 합성하여 현실감 있는 3차원 도로영상을 생성하는 기법을 연구 개발하였다. 레이더 영상과 CCD 영상의 합성은 레이저 데이터가 가지고 있는 3차원의 위치에 해당하는 CCD영상에서의 영상점을 찾아 이 점에서의 RGB 밴드의 밝기값을 찾아내어 이를 레이저 데이터에 기록, 적용시키는 것을 의미한다. 이 방법을 사용하기 위해서는 영상간의 관계모델을 수립할 필요가 있으며, 본 연구에서는 직접선형변환(DLT) 모델을 사용하였다. 이 모델을 이용하기 위해 레이저 데이터를 영상으로 편집하였고 이 영상과 CCD영상과 일치하는 지점을 육안으로 찾아 각 영상별로 DLT센서모델에 필요한 개수의 기준점을 제작하여 실행하였다. 실험 결과 영상은 기준점의 정확도에 따라 약간의 차이는 있으나 합성 전의 레이저 데이터 영상에 비해 실세계에 가까운 색깔을 나타냄이 확인되었다.

  • PDF

깊이정보 영상을 위한 암호화 기술 (Encryption Technique for Depth-map Image)

  • 김보라;최현준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 추계학술대회
    • /
    • pp.110-111
    • /
    • 2012
  • 본 논문에서는 깊이정보(depth-map)의 저작권 보호를 위한 영상암호화 알고리즘을 제안한다. 이 기술은 일반적인 자연영상과 유사한 화소분포로 표현이 되는 깊이정보 영상의 데이터 일부분을 암호화하여 전체 영상데이터의 시각적인 보안을 확보한다. 실험결과 제안한 영상암호화 알고리즘은 깊이정보 데이터의 일부분만을 암호화하여 전체 깊이정보 영상의 데이터를 효과적으로 은닉하는 것을 확인하였다.

  • PDF

반복적 2D 워핑을 이용한 효율적인 스테레오 비디오 데이터 압축 및 복원 (Efficient Data Compression and Decompression of Stereo Video by using Interative 2D Warping)

  • 박일권;변혜란
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.117-120
    • /
    • 2008
  • 본 논문은 스테레오 비디오 데이터 압축 및 복원을 위한 그리드(Grid) 기반 2D 워핑 방법을 제안한다. 스테레오 비디오에 대한 데이터 표현 방법으로 깊이지도 및 매쉬(mesh)를 이용한 방법이 주로 사용되어 왔으며 매쉬를 이용한 방법은 두 영상간의 매칭되는 노드를 이용하여 데이터 압축 효율을 높일 수 있다. 그러나, 두 영상에서 매칭되는 노드의 위치를 찾는 것은 매우 어려운 일일 뿐만 아니라 매쉬에 의해서 워핑된 영상과 목적이 되는 스테레오 영상의 좌측 또는 우측 영상간의 왜곡이 불가피하다. 따라서 이러한 왜곡을 보정하기 위하여 잔여영상(Residual image) 정보를 추가로 요구하게 된다.제안된 논문은 이러한 잔여영상 정보를 최소화 하기 위하여 반복적으로 2D워핑을 수행하며 최적화된 워핑 영상을 생성함으로써 목적영상과의 오차를 최소로 유지하여 추가정보인 잔여 영상의 데이터 용량을 최소화 한다. 전체영상에 대하여 2D워핑을 수행하며 각각의 노드를 변경하는 것은 많은 비용을 감수해야 하기 때문에 오차영역에 대하여 지역단위로 분할하고 단계적으로 최적화를 이루는 분할정복 방법을 사용하였다. 본 논문의 실험에서는 스테레오 영상에 대하여 각각의 신호대 잡음비(PSNR)를 통해 제안한 방법의 품질을 평가하였을 뿐만 아니라 기존의 메쉬 기반한 방법과 깊이지도를 이용한 방법과의 데이터량을 비교하였다. 실험결과를 통하여 제안한 방법의 데이터 압축의 효율성 및 품질의 우수성을 확인하였다.

  • PDF

내용, 감성, 메타데이터의 결합을 이용한 텍스타일 영상 검색 (Textile image retrieval integrating contents, emotion and metadata)

  • 이경미;박우창;이은옥;권혜영;차은미
    • 인터넷정보학회논문지
    • /
    • 제9권5호
    • /
    • pp.99-108
    • /
    • 2008
  • 본 논문에서는 텍스타일 영상의 내용 데이터, 감성 데이터, 메타데이터를 결합시킨 영상 검색 시스템을 제안한다. 섬유 패션의 정보를 가지고 있는 메타데이터와 영상의 색상 및 감성 색상을 이용한 내용의 결합은 그 동안의 섬유 패션산업과 관련된 영상 검색 시스템에서 진일보된 것이다. 우선 메타데이터의 정보를 통해서 영상을 검색하게 된다 검색된 영상 안에서 색상히스토그램과 색상스케치, 감성 히스토그램을 통하여 주어진 영상과 비슷한 영상들을 검색하게 된다. 본 논문에서는 텍스타일 영상으로부터 감성 특성을 추출하기 위해서, H, Nagumo의 배색이미지차트에서 제안하는 160개 감성어에 대한 감성 색상을 이용하였다. 본 논문에서 제안된 텍스타일 영상 검색 시스템에서 부가적인 기능인 돋보기 기능, 색상 히스토그램 기능, 색상 스케치 기능, 반복 패턴 보기 기능을 통해 검색된 텍스타일 영상들의 정보를 효과적으로 제공함으로써 사용자의 편의를 강화하였다.

  • PDF

UHD 영상/음향 데이터의 실시간 획득/재생 시스템에서의 SDI 내장 음향 데이터의 추출 및 합성을 위한 하드웨어 플랫폼 개발 (Development of Hardware Platform for Extracting & Composing of SDI Embedded Audio Data at Real-time Capture/Playback System of UHD Video/Audio)

  • 이상설;장성준;최정민;김제우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.258-259
    • /
    • 2016
  • 일반적으로 UHD 방송 편집 시스템에서 UHD 영상의 데이터양이 막대하기 때문에 실시간 전송을 위해 코덱과 함께 압축하여 편집 서버로 혹은 편집 서버로부터 스트림 형태로 전송한다. BT.1120 형태로 전송 송출된 SDI (Serial Digital Interface) 내장 음향 데이터는 영상과 달리 보조 데이터 영역에 다른 메타 데이터들과 함께 합성되어 전송 송출되기 때문에 추출 및 합성이 상대적으로 어렵다. 특히 재생을 위해서는 영상 코덱으로부터의 출력 영상과의 동기를 고려해야 하고 음향 데이터를 BT.1120 표준에 맞춰 보조 데이터 영역에 합성해야하기 때문에 개발에 어려움이 있다. 이에 본 논문은 UHD 영상/음향 데이터의 실시간 획득/재생 시스템에서의 SDI 내장 음향 데이터의 추출 및 합성을 위한 FPGA (Field Programmable Gate Array) 기반 하드웨어 플랫폼을 제안하였다. 또한, 이를 위한 음향 데이터 추출 로직과 합성 로직을 HDL(Hardware Design Language) 설계하여 FPGA 내에 탑재하고 카메라/디스플레이/편집 서버와 통합하였다. 시험 결과 4K 60fps 데이터에서 정상적으로 영상과 음향을 분리/획득 및 합성/재생하였다.

  • PDF

BLE 비콘을 활용한 영상 기반 비승인자 감지 시스템 (Image-based Unauthorised person detection system using BLE beacons)

  • 김형주;박찬;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.470-473
    • /
    • 2021
  • 외부인들이 시설을 무단으로 이용하는 등의 범죄가 계속해서 발생하고 있다. 본 논문은 기존의 시설물에서 사용하고 있는 단순 인증 절차가 아닌 BLE 비콘과 영상데이터를 활용한 비승인자 감지 시스템이다. 이 시스템은 스마트폰 어플리케이션에서 BLE 비콘의 데이터를 받은 후 UUID 값과 RSSI 값을 서버로 전송한다. 이후 전송된 데이터들로 핑거프린팅 기반 RadioMap을 구성하고 RNN 기반 딥러닝 학습을 진행하여 사용자 위치 데이터를 도출한다. CCTV를 통해 수집된 영상데이터는 서버로 전송되며, YOLOv4를 이용하여 객체탐지를 위한 프로세스를 진행한 후 Person 클래스를 추출한다. 이후 승인된 사용자의 위치 데이터에 실시간 영상데이터를 더하여 인증 과정 절차가 진행되지 않은 비승인자들을 추적한다. 본 논문은 COVID-19로 인해 시설물 인증 절차에 사용이 증가하고 있는 QR코드를 이용해 인증 과정 절차의 진행 방식으로 시스템에 대한 확장성까지 기대할 수 있다.