• 제목/요약/키워드: 이미지 프레임 수

검색결과 333건 처리시간 0.031초

비디오 자막 추출 및 이미지 향상에 관한 연구 (Video Caption Extraction and Image Enhancement)

  • 김소명;최영우;정규식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.359-361
    • /
    • 2000
  • 본 논문에서는 비디오 자막 이미지를 인식하기 위해 필요한 영상 향상의 단계로서 다중 결합을 적용한다. 또한 다중 결합을 위한 동일한 자막의 판단 및 결합된 결과를 재평가하기 위한 방법을 제안한다. 입력된 칼라 이미지로부터 RLS(Run Length Smearing)가 적용된 에지 이미지를 얻고, 수직 및 수평 히스토그램 분포를 이용하여 자막과 자막 영역에 대한 정보를 추출한다. 프레임 내의 자막 영역의 중첩 정도를 이용하여 동일 자막을 판단하고, 동일한 자막을 갖는 프레임들끼리 다중 결합을 수행함으로써 향상된 이미지를 얻는다. 끝으로 결합된 영상에 대한 평가를 수행하여 잘못 결합된 이미지들로 인한 오류를 해결하고 재평가한다. 제안한 방법을 통해, 배경 부분의 잡영이 완화된 자막 이미지를 추출하여 인식의 정확성과 신뢰성을 높일 수 있었다. 또한 동일한 자막의 시작 프레임과 끝 프레임의 위치 파악은 디지털 비디오의 색인 및 검색에 효과적으로 이용될 수 있을 것이다.

  • PDF

이미지 학습을 위한 딥러닝 프레임워크 비교분석 (A Comparative Analysis of Deep Learning Frameworks for Image Learning)

  • 김종민;이동휘
    • 융합보안논문지
    • /
    • 제22권4호
    • /
    • pp.129-133
    • /
    • 2022
  • 딥러닝 프레임워크는 현재에도 계속해서 발전되어 가고 있으며, 다양한 프레임워크들이 존재한다. 딥러닝의 대표적인 프레임워크는 TensorFlow, PyTorch, Keras 등이 있다. 딥러님 프레임워크는 이미지 학습을 통해 이미지 분류에서의 최적화 모델을 이용한다. 본 논문에서는 딥러닝 이미지 인식 분야에서 가장 많이 사용하고 있는 TensorFlow와 PyTorch 프레임워크를 활용하여 이미지 학습을 진행하였으며, 이 과정에서 도출한 결과를 비교 분석하여 최적화된 프레임워크을 알 수 있었다.

멀티 에이젼트를 이용한 임베디드 리눅스 기반의 디지털 이미지 프레임 n:m 서버 연동기법 (The Interlock Techniques of A Digital Image Frame n:m Server based on Embedded Linux Utilizing Multi Agent)

  • 정구학;김홍규;구용완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.808-811
    • /
    • 2006
  • 디지털 액자 또는 디지털 앨범은 여러장의 디지털 이미지를 저장 장치에 저장하여 LCD를 통해 디지털 이미지를 감상할 수 있는 임베디드 장치로 저장 장치에 기록되어 있는 이미지나 네트워크와 통신이 된다면 이미지 서버와 1:1 통신으로 지정된 이미지를 다운받을 수 있다. 이러한 1:1 통신의 이미지 다운로드 방법은 액자에서 액자로 이미지를 전송하거나 다운받을 수 없으므로 원격지의 디지털 액자로 자신이 원하는 이미지를 전송할 수 없는 불편함이 있다. 이에 본 논문에서는 자신의 디지털 액자에서 원격지의 디지털 액자 또는 원격지의 디지털 액자에서 자신의 디지털 액자로 선택한 이미지, 또는 전송받는 이미지를 송수신 할 수 있는 디지털 전자액자의 n:m 연동 방법을 제안한다. 본 논문에서 제안한 방법은 범용 이미지 서버와 디지털 전자액자에 에이젼트를 사용하여 디지털 전자액자와 원격지 디지털 전자액자의 이미지 공유가 가능할 수 있다.

  • PDF

계층형 정적/동적 모자이크 (A Hierarchical Static/Dynamic Mosaicing)

  • 신성윤;고경철;이양원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.282-285
    • /
    • 2001
  • 이미지 모자이크 시스템이란 이미지 내의 객체나 배경을 하나의 이미지 크기에 전체적으로 표현할 수 없거나 부분적으로 보이지 않는 영역을 갖는 일련의 여러 이미지와 동영상의 프레임 이미지를 하나로 정합하여 확장된 이미지를 나타내는 시스템이다. 본 논문에서는 보다 효율적인 검색과 표현을 위하여 트리 형태의 계층형 이미지 모자이크 시스템을 구축하는 방법을 제시하며, 정적인 이미지 모자이크와 동적 이미지 모자이크를 모두 구축하는 방법에 대해서 제시한다.

  • PDF

온라인게임: 정보통신기술이 매개하는 시-공간 프레임과 실재성 (Online Game: Its Time-Space Frame and Realities)

  • 김지연
    • 과학기술학연구
    • /
    • 제12권1호
    • /
    • pp.79-106
    • /
    • 2012
  • 온라인게임은 인간과 기계의 상호작용적 실행을 연결하여 서사적 구조를 완성해가는 프로그램이다. 실재성이 발생할 수 있는 상황-맥락과 그 맥락적 관계를 생산하는 실행들게임 참가자들은 사소한 여가활동으로 게임을 시작하지만 곧 진지해지곤 한다. 게임이용자들은 그 세계에서 일종의 실재성을 경험하는 것이다. 이 논문은 "무엇이 실재인가?"라는 전통적인 물음을 하는 대신 "어떻게 실재가 발생하는가?"라는 새로운 물음을 전개해나갈 것이다. 특히 과학기술학의 이론적 개념을 정보통신기술 위에서 작동하는 이미지(표상)에 적용하여, 에 초점을 둔다. 이용자들과 게임시스템은 상호적 실행을 통하여 서로의 관계를 자기-참조적으로 강화해가며 고유한 시-공간 프레임(space-time frame)을 구성할 수 있다. 그러한 프레임은 기술적 텍스트적 표상적 역사적 문화적 경제적 사회적인 차원의 이질적인 실행들이 뒤엉킨 물질-기호적 장(material-semiotic field)이다. 그 안에서 게임이미지는 자신의 위치를 가지게 되고, 그 순간 두께를 가진 실재로서 간주된다. 이로써 정보통신기술이 매개하는 전자적 표상(텍스트나 이미지)에 대한 우리의 경험은 우리가 참여하는 시-공간 프레임에 의존한다는 함축을 확인할 수 있다.

  • PDF

강의 동영상에서 슬라이드 추출을 통한 동영상 브라우징 기법 (A Method for Lecture Video Browsing by Extracting Presentation Slides)

  • 김탁은;임선규;김명호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.119-122
    • /
    • 2011
  • 동영상 플레이어에서 제공되는 브라우징 기법은 동영상의 주요 장면을 이미지로 보여줌으로써, 사용자가 주요 장면에 쉽게 접근할 수 있도록 해준다. 강의 동영상은 일반 동영상과는 달리 매우 정적이므로, 기존 동영상 브라우징 기법은 강의 동영상에 적용하기에 알맞지 않다. 본 연구에서는 강의 동영상에 주로 슬라이드가 함께 나온다는 점에 착안하여, 영상에서 슬라이드 이미지를 추출하여 이를 대표 프레임으로 지정하는 방법에 대해 연구하고, 브라우징 인터페이스를 구현하였다. 슬라이드 이미지가 대표 프레임으로 사용되므로 학습자는 대표 프레임들만을 보고 동영상을 시청하지 않고도 원하는 정보를 신속하고 정확하게 찾을 수 있다.

모자이크 배경이미지 추출과 적응적 신경망을 이용한 다중 보행자 추적 시스템에 관한 연구 (A Study on Multiple Target Tracking Using Adaptive Neural Network and Mosaic Background Extraction)

  • 서창진;양황규
    • 한국정보통신학회논문지
    • /
    • 제7권8호
    • /
    • pp.1802-1808
    • /
    • 2003
  • 본 논문은 자동 보행자 추적 시스템에 필요한 배경 이미지를 추출하는 방법과 추출되어진 배경 이미지를 이용하여 보행자를 탐지하고 적응적 신경망을 이용하여 보행자의 이동 궤적을 추적하는 시스템을 구현하였다. 본 논문은 고스트(ghost) 현상을 극복하기 위하여 모자이크 배경 이미지 추출 법으로 배경 이미지를 추출하였으며, 보행자의 탐지에 차영상 분석법을 기반으로 하여 보행자를 탐지하였다. ART2 네트워크는 프레임에 존재하는 이동 물체의 중심점을 탐지할 수 있다. 그리고, 이전 프레임에서 탐지되어진 물체의 정보를 이용하여 물체의 이동궤적을 추적할 수 있다. 제안하는 방법으로 실험한 결과 비강체(non­rigid)형태 운동을 하는 보행자를 탐지하고 그 궤적 추적에 대한 실시간 시스템 구성의 가능성에 대하여 알 수 있었다.

하이브리드 카메라를 이용한 고해상도 비디오 합성 (High Resolution Video Synthesis with a Hybrid Camera)

  • 김종원;경민호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제13권4호
    • /
    • pp.7-12
    • /
    • 2007
  • 최근들어 디지털 영상 기술의 발달로 많은 영화들이 디지털화되어 제작되고 있고, 이러한 디지털 영화를 직접 상영할 수 있는 디지털 시네마로의 전환이 빠르게 진행되고 있다. 하지만 아직 까지 디지털시네마에서 요구하는 2K이상의 고해상도를 지원하는 촬영 장비는 매우 고가이기 때문에 디지털 영화의 제작에 걸림돌이 되고 있다. 본 논문에서는 이러한 문제를 저가의 일반 비디오 카메라와 디지털 스틸 카메라의 조합을 통해 해결할 수 있는 방법을 제시한다. 즉, 비디오 카메라로 촬영한 저해상도 비디오 영상과 동시에 일정한 간격의 키프레임마다 함께 촬영된 고해상도 이미지들을 이용하여 새로운 고해상도 비디오 영상을 합성하는 것이다. 비디오 합성은 프레임 단위로 이루어지는데, 먼저 현재 프레임의 픽셀마다 대응되는 점의 위치를 앞뒤 키프레임들에서 찾는다. 대응점은 현재 프레임과 키프레임 간의 광흐름(optical flow)을 계산하여 찾게 된다. 대응점이 구해지면 키프레임의 고해상도 이미지에서 대응점 위치의 이미지 블럭을 가져와 현재 프레임의 해당 픽셀 위치에 복사한다. 만일 키프레임에서의 대응점을 찾을 수 없는 경우에는 현재 저해상도 비디오 프레임의 확대 이미지를 빈곳 채움에 이용하여 이미지를 완성한다. 본 연구의 결과는 고해상도 비디오 합성 외에 비사실적 비디오 렌더링 등과 같은 영상 효과의 구현에도 적용할 수 있다.

  • PDF

의료영상에서 특징점 추출을 이용한 영역추출 (Region Detection Using the Feature Point Extraction from Medical Image)

  • 김엄준;성미영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.429-431
    • /
    • 1998
  • 본 논문에서는 의료 영상 중에서 성대 운동의 불규칙적인 움직임을 판단하여 자동으로 진단 파라미터를 구하는 비디오스트로보키모그래피(Videostrobokymography) 시스템에서 관심 영역을 추출하는 방법을 소개하고자 한다. CCD카메라에 의해 촬영된 영상은 비디오 테이프에 저장된 후 이미지 캡쳐 보드에서 그레이 이미지(gray-level)로 변환되어 저장된다. 입력된 영상은 움직이는 영상을 촬영한 것이므로 관심 영역의 위치가 각 프레임마다 다르다. 또한 실제로 입력된 성대영상들이 점진적인 농도 변화를 보이기 때문에 에지에 의해 영역을 추출하는 일반적인 영역 추출방법은 사용하기 어렵다. 본 논문에서는 두 번의 단계를 통하여 관심 영역을 추출하고 있다. 첫 번째는 입력된 영상에서 노이즈를 제거한 후 각 프레임에서 영상의 최소 에너지를 구한다. 두 번째로 농도 변화 값을 특징 값으로 이용하는 분할-합병 알고리즘(Split-merge Algorithm)을 적용하여 관심 영역을 추출하였다. 제안한 알고리즘을 19명의 성대 영상에 적용하여 분석한 결과 성대의 관심 영역을 추출할 수 있었다. 그리고, 영상의 에너지 값을 이용하는 스네이크 알고리즘(Snake Algorithm)에 적용하여 비교해본 결과 본 연구에서 제안하는 스네이크 알고리즘보다 좋은 성능을 보임을 확인할 수 있었다. 본 연구에서 제안하는 관심 영역 추출 방법은 동적인 변화를 보이는 영상에서 관심 영역을 추출할 수 있을 뿐 아니라 계산 량이 적어 200x280크기의 이미지를 초당 약 40프레임에 대한 관심 영역을 추출할 수 있는 장점이 있다.

  • PDF

거리 학습과 재서열화를 이용한 방송 콘텐츠에 대한 블로그 포스팅 태깅 (Distance Learning and Re-Ranking based Broadcasting Contents Tagging with Blog Postings)

  • 손정우;김선중;김화숙;조기성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.882-885
    • /
    • 2014
  • 이미지 혹은 영상에 대한 자동 태깅은 해당 콘텐츠에 대한 추가적인 정보를 자동으로 시스템에 제공하는 기술로써 영상 인식, 콘텐츠 매시업, 정보 검색 등 다양한 기술/서비스 분야에서 여러 목적으로 활용되고 있다. 특히, 방송 콘텐츠는 많은 양의 정보를 제한된 영역 및 시간에 축약하여 담고 있기 때문에 영상 처리 기술을 통한 객체 인식이나, 콘텐츠 매시업, 추천 서비스 등의 성능 향상을 위해 자동 혹은 수동 태깅을 통한 정보 제공이 요구된다. 본 논문에서는 블로그를 이용한 프레임 단위의 방송 콘텐츠 태깅 기술을 제안한다. 제안하는 기술은 기존의 콘텐츠 단위의 정보 제공이나, 수동 태깅 된 정보를 제공하는 기술들과 달리, 영상의 각 프레임에 대한 자동 태깅을 목표로 한다. 제안하는 방법은 거리 학습을 통해 영상의 각 프레임이 가지는 특성을 고려한 모델을 구축한 후, 이를 토대로 영상의 프레임들과 블로그의 이미지를 매칭한다. 매칭된 결과를 기반으로 특정 블로그는 영상 내 특정 프레임 구간에 태깅 된다. 제안한 방법은 이미지 매칭 성능을 측정하여 평가하였다. 블로그 이미지에 대해 Top 1 매칭 프레임을 살펴본 결과, 70%의 정확률을 보였다. 소프트 매칭(Top n)의 경우, 최대 90%의 성능을 얻을 수 있음을 실험을 통해 알 수 있었다.