• 제목/요약/키워드: 비디오 영상

검색결과 2,126건 처리시간 0.036초

피사체 인식을 이용한 비디오 카메라용 자동 초점 및 자동 노출 알고리즘 (Advanced Auto-Focus and Auto-Exposure Algorithm Detecting Object for Video Camera)

  • 이광현;이상훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 동계학술대회
    • /
    • pp.147-150
    • /
    • 2008
  • 현재의 비디오 카메라는 인간의 눈으로 볼 수 있는 것과 동일한 화질의 비디오 영상을 얻을 수 없다. 인간의 눈은 움직이는 물체에 중점을 두고 초점을 맞추는 시각적 특성을 가진다. 하지만 현재의 비디오 카메라 시스템은 영상에 대한 인간의 눈의 시각적 특성에 대한 고려 없이 조리개와 렌즈의 조절 작업이 이루어진다. 본 논문은 이러한 비디오 카메라 시스템의 개선을 위해 인간의 눈의 시각적 특성에 기반을 둔 실시간 피사체 적응 비디오 카메라 시스템을 제안한다. 제안하는 알고리즘은 영상내에서 움직임을 가진 물체를 찾아낸 뒤, 이것에 가중치를 두고 조리개와 초점제어 작업의 순서로 이루어진다. 움직이는 물체는 영상 코덱의 움직임 정보를 파악하여 찾아내었다. 제안된 알고리즘은 프로그램언어로 구현되었으며, 초점거리와 조리개제어가 가능한 카메라와 PC를 사용하여 영상을 분석, 검증하였다.

  • PDF

문자정보 기반 비디오 분할에서 성능 향상을 위한 음성신호처리 (Speech Signal Processing for Performance Improvement of Text-Based Video Segmentation)

  • 이용주;손종목;강경옥;배건성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.187-191
    • /
    • 1999
  • 비디오 프로그램에서 영상 내에 포함되어 있는 문자정보는 동영상의 내용 검색 및 색인을 위한 비디오 분할에 사용될 수 있다. 일반적으로 장면 내에 포함되어 있는 문자들은 해상도가 낮고 글자 크기와 형태가 다양하기 때문에 추출과 인식이 어려울 뿐만 아니라 의도하지 않은 배경화면의 문자인 경우도 많기 때문에 내용기반 검색에는 사용되기가 어렵다. 그러나 비디오 내에 포함된 문자정보가 나타나는 시작 프레임과 끝나는 프레임을 검출하여 비디오 프로그램을 분할함으로써 내용기반요약정보를 만들 수 있으며, 동영상의 내용 검색 및 색인에 사용할 수 있다. 일반적으로 문자정보의 추출에 의해서 비디오를 분할할 때 음성정보는 전혀 고려되지 않으므로 분할된 비디오 정보를 재생할 경우음성신호가 단어 또는 어절/음절의 임의의 점에서 시작되고 끝나게 되어 듣기에 부자연스럽게 된다 따라서 본 논문에서는 뉴스방송의 비디오 프로그램에서 문자정보가 포함되어 는 비디오의 시작 프레임과 끝 프레임을 중심으로 그에 대응되는 구간의 음성신호를 검출한 후 이를 적절히 처리하여 분할 된 비디오를 재생할 때 음성신호가 보다 자연스럽게 들릴 수 있도록 하는 방법에 대해 연구하였다.

  • PDF

증강 비디오 시스템을 위한 AR 영상 Registration 알고리즘 연구 (A Study of AR Image Registration Algorithm For Augmentation Video System)

  • 김혜경;오해석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.454-456
    • /
    • 2001
  • 본 논문에서는 비디오 영상열 내에 컴퓨터가 생성한 가상의 3D 영상을 이음새 없이 추가하기 위한 문제에 초점을 맞추고 있다. 2단계의 견고한 통계적인 메소드는 추적된 커브들의 모델-영상 대응점으로부터 보다 정확한 자세를 평가하기 위하여 자세 계산을 위해 사용되었다. 또한, 관점의 정확성 향상을 위하여 두 개의 연속하는 영상들간에 매치될 수 있는 핵심점을 카메라 움직임에 대한 상관관계 함수로 사용하여 매칭 에러와 reprojection 에러를 포함한 비용함수를 최소화함에 의해 관점을 향상시킨다. 비디오 영상내 객체 영상과 가상의 3D 영상간에 발생하는 폐색 공간문제를 해결하기 위하여 반 자동 알고리즘을 제안하였다.

  • PDF

지상파 DMB 비실시간 3D 비디오 서비스 (Non-Real-Time 3D Video Services for Terrestrial DMB)

  • 김용한;박민규;오창열;윤국진;이봉호;허남호;이수인
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.83-85
    • /
    • 2010
  • 최근 소형 무안경식 스테레오스코픽 디스플레이가 저가에 양산될 수 있게 되어 이를 장착한 휴대형 기기를 통한 스테레오스코픽 서비스에 대한 관심이 고조되고 있다. 지상파 DMB 수신 겸용 휴대폰의 경우에도 이러한 3D 디스플레이를 장착할 수 있으므로, 지상파 DMB를 통해 3D 비디오 서비스를 제공하는 데에도 관심이 고조되고 있다. 그러한 현재 지상파 DMB 채널은 가용 전송률이 거의 남아 있지 못한 상태이므로, 실시간으로 이러한 서비스를 제공할 수 없다. 본 논문에서는 기존 지상파 DMB 비디오 서비스를 위해 전송되는 비디오 압축 데이터를 3D 영상의 좌우 영상 중 한 영상으로 사용하고, 다른쪽 영상은 비실시간적인 방법으로 수신기로 전송함으로써 기존 지상파 DMB 비디오 서비스와 호환적으로 3D 비디오 서비스를 제공할 수 있는 방법 2 가지를 제안한다. 첫 번째 방법은 지상파 DMB의 파일 다운로드 프로토콜인 MOT(Multimedia Object Transfer)를 이용하여 3D 영상에 필요한 한 쪽 영상을 파일 형태로 미리 수신기로 다운로드해 준 후, 실시간으로 전송되어 오는 2D 비디오 데이터와 함께 디스플레이하는 MOT/스트림 모드 비실시간 3D 비디오 서비스이며, 두 번째 방법은 광고 영상과 같이 일정 기간 중에 반복적으로 전송되는 콘텐트에 대해 추가로 필요한 전송률이 거의 없이 3D 비디오로 제공할 수 있는 반복 콘텐트 비실시간 3D 비디오 서비스이다.

  • PDF

Triplet CNN과 학습 데이터 합성 기반 비디오 안정화기 연구 (Study on the Video Stabilizer based on a Triplet CNN and Training Dataset Synthesis)

  • 양병호;이명진
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.428-438
    • /
    • 2020
  • 영상 내 흔들림은 비디오의 가시성을 떨어뜨리고 영상처리나 영상압축의 효율을 저하시킨다. 최근 디지털 영상처리 분야에 딥러닝이 본격 적용되고 있으나, 비디오 안정화 분야에 딥러닝 적용은 아직 초기 단계이다. 본 논문에서는 Wobbling 왜곡 경감을 위한 triplet 형태의 CNN 기반 비디오 안정화기 구조를 제안하고, 비디오 안정화기 학습을 위한 학습데이터 합성 방법을 제안한다. 제안한 CNN 기반 비디오 안정화기는 기존 딥러닝 기반 비디오 안정화기와 비교되었으며, Wobbling 왜곡은 감소하고 더 안정적인 학습이 이루어지는 결과를 얻었다.

단안 비디오로부터의 5D 라이트필드 비디오 합성 프레임워크 (Deep Learning Framework for 5D Light Field Synthesis from Single Video)

  • 배규호;;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.150-152
    • /
    • 2019
  • 본 논문에서는 기존의 연구를 극복하여 단일 영상이 아닌 단안 비디오로부터 5D 라이트필드 영상을 합성하는 딥러닝 프레임워크를 제안한다. 현재 일반적으로 사용 가능한 Lytro Illum 카메라 등은 초당 3프레임의 비디오만을 취득할 수 있기 때문에 학습용 데이터로 사용하기에 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 가상 환경 데이터를 구성하며 이를 위해 UnrealCV를 활용하여 사실적 그래픽 렌더링에 의한 데이터를 취득하고 이를 학습에 사용한다. 제안하는 딥러닝 프레임워크는 두 개의 입력 단안 비디오에서 $5{\times}5$의 각 SAI(sub-aperture image)를 갖는 라이트필드 비디오를 합성한다. 제안하는 네트워크는 luminance 영상으로 변환된 입력 영상으로부터 appearance flow를 추측하는 플로우 추측 네트워크(flow estimation network), appearance flow로부터 얻어진 두 개의 라이트필드 비디오 프레임 간의 optical flow를 추측하는 광학 플로우 추측 네트워크(optical flow estimation network)로 구성되어있다.

  • PDF

영상과 음성 정보를 이용한 비디오 편집 및 검색 시스템 (Video Editing and Retrieval System Using Speech Recognition Technique)

  • 조현철;윤인구;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.228-230
    • /
    • 1998
  • 동영상 데이터가 갖는 복잡하고 다양한 관계성 때문에 기존의 키워드 기반 정보 검색 방법에는 한계가 있으면 비디오 내용에 기반해 검색을 하는 내용기반 검색기법이 요구된다. 현재 MPEG-7에서도 비디오 내용 표현 방식에 관한 국제 표준화 작업이 시작되고 있다. 본 논문에서는 영상정보와 음성정보를 사용해 비디오의 원하는 부분을 내용에 기반해 검색할 수 있는 비디오 편집 및 검색 시스템을 개발하였다.

  • PDF

칼라 히스토그램을 이용한 비디오 영상에서 얼굴 영역의 고속 추적 (Fast Tracking of Face Region In Video Images using Color Histogram)

  • 유태웅;오일석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1995년도 제4회 멀티미디어 산업기술 학술대회 논문집
    • /
    • pp.165-168
    • /
    • 1995
  • 본 논문은 비디오 연속 영상에서 얼굴의 위치를 추적하는 알고리즘에 관하여 기술한다. 컴퓨터 비젼에서 대량의 비디오 연속 영상내 물체 추적은 실시간에 처리되는 빠른 알고리즘이 요구된다. 기존의 방법은 형태에 기반한 알고리즘으로 물체의 회전, 크기 변화, 겹침 등에 대한 문제에 민감하여 여러 가지 어려움이 발생한다. 그러나 칼라를 이용한 알고리즘은 이러한 문제에 대하여 둔감하여 훨씬 효과적이다. 본 논문은 칼라 3D 히스토그램을 이용한 Swain과 Ballard의 역 투사(backprojection) 방법을 적용하여 비디오 연속 영상에서 얼굴의 위치를 빠르고 정확히 추적하는 알고리즘을 제안한다.

  • PDF

이종 해상도 스테레오 비디오 코딩 시스템 (Heterogeneous Resolution Stereo Video Coding System)

  • 박시내;심동규
    • 방송공학회논문지
    • /
    • 제13권1호
    • /
    • pp.162-173
    • /
    • 2008
  • 본 논문에서는 스테레오 시점 및 디스플레이 특성을 고려한 효율적인 스테레오 비디오 코딩 방법을 제안한다. 현재 많은 스테레오 비디오 디스플레이 장치는 기존의 단일 시점 비디오 출력과 스테레오 비디오 출력이 모두 가능하다. 이러한 장치에서 스테레오를 비디오 출력 시에는 스테레오 디스플레이 패널의 특성으로 인하여, 두 개 시점 비디오 각각을 수평축으로 1/2 다운 샘플링된 비디오를 입력받는다. 본 논문에서는 기존의 단일 비디오와 스테레오 비디오 시스템을 동시에 고려하기 위하여, 좌측영상은 원래의 해상도로 코딩하고, 우측영상은 가로 방향으로 1/2 다운 샘플링 하여 코딩하는 방법을 제안한다. 우측 영상의 코딩 시 좌측영상을 참조하는 경우 참조 영상과 원 영상사이의 해상도가 일치하지 않아 시점 간 예측이 불가능하므로, 본 논문에서는 이를 위해 시점간 예측방법을 변경하여 부호화하는 방법을 제안한다. 실험결과 제안된 방법은 기존의 스테레오 비디오 부호화 방법에 비하여 $0.5{\sim}0.8\;dB$ 이상의 코딩 이득을 얻을 수 있었다.

H.264/AVC 복호화기에서 복호된 인트라 모드 정보를 이용한 화면 해상도 변환 방법 (Image scaling scheme using the intra mode information in H.264/AVC decoder)

  • 채진기;한종기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.296-299
    • /
    • 2013
  • 디스플레이 기술이 발전함에 따라 다양한 크기의 디스플레이를 탑재한 장치들이 등장하게 되었고, 다양한 디스플레이 크기만큼 다양한 해상도를 사용하고 있다. 때문에 비디오 코덱과 scaler는 보편적으로 함께 사용된다. 그러나 기존의 scaler는 비디오 코덱의 복호화기와 화면 해상도 변환 모듈이 독립적으로 구성되고, 서로 간에 정보를 이용하지 않으므로 시스템의 성능 개선에 한계가 존재하였다. 즉, 비디오 코덱의 복호화기는 비트스트림으로부터 복호한 정보를 바탕으로 영상을 복원하고, 복원영상은 up/down scaler에서 확대/축소를 수행한다. 하지만 비디오 코덱의 비트스트림에 존재하는 정보는 영상의 특성을 반영하기 때문에 up/down scaler에서 비디오 코덱의 복호화기에서 복호된 정보를 이용하면 복잡도의 증가 없이 효율적인 확대/축소를 수행할 수 있다. 이에 본 논문에서는 비디오 코덱 중 차세대 비디오 코덱인 H.264/AVC 복호화기에서 생성된 복원 영상에 대해서 별도로 영상의 특성을 계산하는 모듈 없이 H.264/AVC 복호화기에서 복원된 정보 중 인트라 모드 정보를 바탕으로 영상의 특성에 맞는 up/down scaler를 구현하는 방법을 제안한다. 이 방법은 기존의 scaler들보다 물체의 경계영역을 더 선명하게 확대하는 효과를 보인다.

  • PDF