• Title/Summary/Keyword: 시각장면

Search Result 184, Processing Time 0.027 seconds

Frame Rate Up-Conversion Using Pyramid Structure and Quadtree (피라미드 구조와 쿼드트리를 이용한 프레임율 증가 변환)

  • Lee, Jichan;Kim, Jun-Geon;Lee, Junho;Kim, Kisun;Lee, Daeho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.11a
    • /
    • pp.90-92
    • /
    • 2014
  • 본 논문에서는 피라미드 구조와 쿼드트리를 이용하는 움직임 보상 프레임 보간(motion compensated frame interpolation, MCFI)의 새로운 방법을 제안한다. 일반적인 MCFI 방법에서는 고정된 크기의 프레임과 블록에서 움직임 벡터(motion vector, MV)를 이용하여 두 프레임 사이의 프레임 영상을 추정한다. 그러나 이와 같은 방법은, 큰다양한 방향으로 움직이는 물체들의 MV 나 큰 움직임을 추정하기 어렵다. 이러한 문제점을 해결하기 위해서 본 논문에서는 블록 크기와 정합 영역이 가변적으로 적용될 수 있는 피라미드 구조와 쿼드트리를 이용한 프레임 보간 기법(pyramid structure and quadtree motion compensated frame interpolation, PQ-MCFI)를 제안한다. 제안하는 기법은 물체들이 빠르게 움직이는 장면과 다양한 방향으로 움직이는 장면에서 이전의 기법에 비해서 높은 PSNR 을 보이며, 실제 인간의 시각적인 측면에서는 더욱 정밀한 결과를 보인다.

  • PDF

Detecting Visual Attributes and Spatial Relationships with Deep Neural Networks (심층 신경망을 이용한 영상 기반 물체 속성 및 공간 관계 탐지)

  • Lee, Jae-Yun;Lee, Gi-Ho;Kim, In-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.424-427
    • /
    • 2018
  • 영상이나 비디오에 담긴 장면을 이해하는 것은 컴퓨터 비전의 궁극적인 목표 중 하나이다. 본 논문에서는 입력 영상으로부터 장면을 구성하는 각 물체들과 그들 간의 공간 관계, 개별 물체들의 다양한 속성들을 탐지해, 지식 그래프를 생성해주는 심층 신경망 기반의 물체 속성 및 공간 관계 탐지 모델을 제안한다. 본 논문에서는 이러한 다양한 복합 시각 인식 작업을 동시에 수행하는 탐지 모델의 구성에 대해 설명하고, 대규모 벤치마크 데이터 집합인 CLEVR을 이용한 탐지 모델의 성능 분석 실험 결과를 소개한다.

Scene Graph Generation with Graph Neural Network and Multimodal Context (그래프 신경망과 멀티 모달 맥락 정보를 이용한 장면 그래프 생성)

  • Jung, Ga-Young;Kim, In-cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.555-558
    • /
    • 2020
  • 본 논문에서는 입력 영상에 담긴 다양한 물체들과 그들 간의 관계를 효과적으로 탐지하여, 하나의 장면 그래프로 표현해내는 새로운 심층 신경망 모델을 제안한다. 제안 모델에서는 물체와 관계의 효과적인 탐지를 위해, 합성 곱 신경망 기반의 시각 맥락 특징들뿐만 아니라 언어 맥락 특징들을 포함하는 다양한 멀티 모달 맥락 정보들을 활용한다. 또한, 제안 모델에서는 관계를 맺는 두 물체 간의 상호 의존성이 그래프 노드 특징값들에 충분히 반영되도록, 그래프 신경망을 이용해 맥락 정보를 임베딩한다. 본 논문에서는 Visual Genome 벤치마크 데이터 집합을 이용한 비교 실험들을 통해, 제안 모델의 효과와 성능을 입증한다.

A Case Study of Fluid Simulation in the Film 'Sector 7' (사례연구: 영화 '7광구'의 유체 시뮬레이션)

  • Kim, Sun-Tae;Lee, Jeong-Hyun;Kim, Dae-yeong;Park, Yeong-Su;Jang, Seong-Ho;Hong, Jeong-Mo
    • Journal of the Korea Computer Graphics Society
    • /
    • v.18 no.3
    • /
    • pp.17-27
    • /
    • 2012
  • In this paper, we describe a case study of the film 'Sector 7' which was produced by technologies applied fluid simulation. For the CG scenes in the movie which include highly detailed fluid motions, we used smoothed particle hydrodynamics(SPH) technique to express subtle movements of seawater from a crashed huge tank, and used hybrid simulation method of particles and levelsets to describe bursting water from a submarine's broken canopy. We also used detonation shock dynamics(DSD) technique for detailed flame simulations to produce a burning monster, the film"s main character. At this point, the divergence-free vortex particle method was applied to conserve the incompressible property of fluids. In addition, we used an upsampling method to achieve more efficient video production. Consequently, we could produce the high-quality visual effects by using the domestic technologies.

A Contribution Culling Method for Fast Rendering of Complex Urban Scenes (복잡한 도시장면의 고속 렌더링을 위한 기여도 컬링 기법)

  • Lee, Bum-Jong;Park, Jong-Seung
    • Journal of Korea Game Society
    • /
    • v.7 no.1
    • /
    • pp.43-52
    • /
    • 2007
  • This article describes a new contribution culling method for fast rendering of complex huge urban scenes. A view frustum culling technique is used for fast rendering of complex scenes. To support the levels-of-detail, we subdivide the image regions and construct a weighted quadtree. Only visible objects at the current camera position contributes the current quadtree and the weight is assigned to each object in the quadtree. The weight is proportional to the image area of the projected object, so large buildings in the far distance are less likely to be culled out than small buildings in the near distance. The rendering time is nearly constant not depending on the number of visible objects. The proposed method has applied to a new metropolitan region which is currently under development. Experimental results showed that the rendering quality of the proposed method is barely distinguishable from the rendering quality of the original method, while the proposed method reduces the number of polygons by about 9%. Experimental results showed that the proposed rendering method is appropriate for real-time rendering applications of complex huge scenes.

  • PDF

3DTV 방송기술 개발 동향

  • 안충현
    • The Magazine of the IEIE
    • /
    • v.31 no.5
    • /
    • pp.82-95
    • /
    • 2004
  • 3차원 TV 방송 기술(3D Tele-vision), 이 중에서도 스테레오스코픽3DTV기술은 다시점 스테레오스코픽(stereoscopic) 비전 기술을 적용하여 2차원 영상에 깊이 정보를 부가하고, 이 깊이 정보로 인하여 시청자가 마치 영상이 제작되고 있는 현장에 있는 것 같은 생동감 및 현실감을 느낄 수 있게 하는 방송 기술로서 HDTV의 뒤를 이을 차세대 방송기술의 하나로서 기대되고 있다. 현재, 세계적인 규모의 박람회나 전시장 등의 이벤트 행사장에서는 반드시라고 해도 될만큼 3D 디스플레이를 사용한 전시 시설이 설치되어 있으며, 생동감 있는 3D 영상을 즐길 수 있다. 3차원 영상은 눈앞에 펼쳐진 장면을 잡으려고 손을 내밀어 버리거나, 전방에서 다가오는 영상을 엉겁결에 피하거나 할 만큼, 종래의 2D 영상과는 전혀 다른 시각적 효과를 가지고 있다.(중략)

  • PDF

Real-time highlight indexing of live broadcast soccer game (축구 경기의 실시간 하이라이트 색인기법)

  • 김명훈;김혁만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.199-201
    • /
    • 2004
  • 디지털 방송 환경의 메타데이타 서비스 중에서도 가장 혁신적인 것이 하이라이트(highlight)메타데이타 서비스이다. 하이라이트 메타데이타를 생성하기 위해서 시각율동을 이용한 샷경계 검출 알고리즘을 사용해 스포츠 경기의 하이라이트 시간구간을 결정하고, 하이라이트 표시기에서 하이라이트를 설명하는 간단한 주제어를 부가한다. 그리고 하이라이트 템플릿을 이용해 계층구조를 생성하고 하이라이트에 부가된 하이라이트 주제어에 따라 계층 구조의 적절한 위치에 삽입하고. 하이라이트 계층구조는 MPEG-7 표준 스키마에 따라 xml로 서술한다 하이라이트 메타데이타 서비스를 받는 시청자들은 매우 짧은 시간에 이미 방영된 스포츠 경기의 중요 장면들을 모두 볼 수 있다.

  • PDF

Neural correlates of visual mean representation (시각적 평균 표상의 신경기제)

  • Chong, Sang-Chul;Shin, Kil-Ho;Cho, Shin-Ho
    • Korean Journal of Cognitive Science
    • /
    • v.19 no.1
    • /
    • pp.75-88
    • /
    • 2008
  • Visual scene contains lots of redundant information. To process this redundant information without increasing brain's volume, human visual system may summarize incoming information. If similar but different information are given to visual system, visual system extracts statistical properties of the information. One example of the statistical representation is representation of mean size. The mean representation is accurate and durable. The process of mean representation is suggested to be parallel. However, previous studies on the mean representation mostly used behavioral methods. The purpose of this study was to investigate which neural regions extracted the mean size of a set of circles using fMRI method. According to previous studies, BOLD signal of certain areas that were in charge of cousin stimuli decreased when the same stimuli presented repetitively. We used this paradigm and found that BOLD signal of right occipital area was decreased when same mean site was presented repeatedly. This results suggest that right occipital area is the locus of mean representation of visual stimuli.

  • PDF

Video Watermarking Using Bit plane and Key (비트플레인과 Key를 이용한 비디오 워터마킹)

  • Choi Yong-soo;Kim Jeong-Yeop;Hyun Ki-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.867-870
    • /
    • 2004
  • 본 논문은 비디오 워터마킹에 관한 연구로서 기존의 DCT변환을 한 후 동영상에 워터마크를 삽입하는 방법과는 달리, 압축과정이나 다른 다양한 공격에 대한 강인성에 초점을 두었다. 이 기법은 DWT 기반의 블라인드 비디오 워터마킹으로서 인간 시각적 특성에서 비지각성을 유지하기 위한 방법이다. 칼라영상을 LUV 좌표계로 변환하여 인간 시각에 둔감한 U영역에 서로 다른 장면의 I-프레임에 대해서 웨이블릿 영역 안에 8bit-plane을 한 후, 1단계 웨일블릿 변환을 거친 부호화된 워터마크에 랜덤한 키를 이용하여 삽입한다. 이 기법은 독립적인 워터마크를 HH1를 제외한 나머지 고주파 부대역 영역에 워터마크를 삽입하고 추출 시에는 삽입된 키를 이용하여 추출하였다. 그리고, 제안한 비디오 워터마킹 알고리즘은 효과적으로 풀리지 않았던 프레임 드로핑과 같은 공격들에 대한 강인함을 기존의 방법과 비교 실험하였다. 이는 최초의 영상 없이 삽입된 워터마크 정보를 실시간으로 검색하여 추출할 수 있다.

  • PDF

Analysis on Pataphysics of the Metamorphosis in Film 'X-Men' (영화 '엑스맨(X-Men)'의 변신모티브에 나타난 파타피직스 분석)

  • Chang, Seyoung;Chung, Jeanhun
    • Journal of Digital Convergence
    • /
    • v.14 no.10
    • /
    • pp.407-414
    • /
    • 2016
  • The movie, X-men, develops the narrative with metamorphosis as the main motif making visual effects of characters and background. The objective of this study is to suggest that the metamorphosis motif can be materialized based on the virtuality of "pataphysics" as one of the genre characteristics of superhero movies and the newly materialized virtuality can be aesthetic characteristics of metamorphosis motif movies. With the virtuality that has its own characteristics with metaphorical symbols such as satire on an absurd society out of existing traditions, pataphysics started in mid-twentieth century and has had an impact on art movements of dadaism, surrealism, pop art, and postmodernism. Analyzing the characteristics of pataphysics which were shown in these artworks, we applied it to metamorphosis scenes of the movie. As a result, we found out that it visualized the shape and aspect of inner and outer strength of a superhero with aesthetic characteristics of metamorphosis scenes and it realized the presence, hybridity, and ex-formal properties of pataphysics consisting of overlapped virtual and physical reality, with technical virtuality.