• 제목/요약/키워드: 영상 표현

검색결과 2,308건 처리시간 0.034초

참조 표현 이해를 위한 물체간의 관계 모델링 (Modeling Relationships between Objects for Referring Expression Comprehension)

  • 신동협;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.869-872
    • /
    • 2017
  • 참조 표현이란 영상 내의 특정 물체를 가리키는 자연어 문장을 의미한다. 그리고 이러한 자연어 참조 표현을 기초로, 한 영상에서 실제로 대상 물체의 영역을 찾아내는 일을 참조 표현 이해라고 한다. 본 논문은 참조 표현 이해를 위한 새로운 심층 신경망 모델과 학습 방법을 제안한다. 본 논문에서 제안하는 모델은 효과적인 참조 표현 이래를 위해, 참조 표현에서 언급하는 대상 물체와 보조 물체를 모두 고려할 뿐만 아니라, 두 물체간의 관계정보도 활용한다. 또한, 본 논문에서 제안하는 모델은 이러한 다양한 맥락 정보들을 참조 표현 의존적인 방식으로 가중 결합함으로써, 참조 표현에 부합하는 대상 물체 영역을 보다 정확히 탐지해낼 수 있도록 설계하였다. 본 논문에서는 대규모 참조 표현 데이터 집합인 Google RefExp를 이용한 성능 비교 실험들을 통해, 제안하는 모델의 우수성을 확인하였다.

2차원 평면 이미지를 이용한 3차원 동영상 제작 기법의 고찰 (Investigation of 3D Moving Picture Production Technique Using 2D Plat Image)

  • 김종성;서영상;송승헌;김응곤
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.840-844
    • /
    • 2006
  • 2차원 이미지는 오래전부터 발전되어온 훌륭한 표현 방법 중 한가지 이다. 하지만 단순한 2차원 이미지만을 가지고 보정과 편집을 통해 다양한 효과를 표현하는데 있어 여러 가지 한계가 있다. 본 논문에서는 2차원의 평면 이미지인 나비와 춘란의 이미지를 사용하여 나비의 날개짓과 춘란의 생장을 표현함으로써 단순한 2차원 평면 이미지를 사용하여 3차원 공간상에서 움직임과 동적인 느낌을 강조한 3차원 영상 제작기법을 구현하고자 한다. 이러한 영상제작기법은 동적인 효과를 가진 고품질의 영상을 쉽게 제작할 수 있기 때문에 개인 뿐만 아니라 전문 방송과 영상 매체에 효율적으로 적용할 수 있다는 장점을 가지고 있다.

  • PDF

분광정보를 이용한 영상 렌더링에 관한 연구 (A Study on Image Rendering by use of Spectral Data)

  • 김진서;강병호;조맹섭;최병태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.567-570
    • /
    • 2003
  • 디지털 영상이나 물체의 컬러 정보를 표시하는 일반적인 방법은 컬러를 Red(R), Green(G), Blue(B)의 삼색 정보로 표현하는 것이다. 디지털 영상이나 물체의 컬러 정보는 380nm-780nm의 가시광선 영역에 걸쳐 분포하는 분광 특성에 의해 결정지어지며, Red, Green, Blue의 특정 세 채널의 정보만 이용하여 영상을 렌더링 하는 경우, 다른 분광 정보에 포함된 특성에 의해 나타날 수 있는 조명 정보의 변화에 따른 영상의 컬러 변화를 인지할 수 없는 경우가 발생한다. 본 논문에서는 이러한 R, G, B 삼색 정보를 이용한 영상 렌더링과 분광 정보를 이용한 렌더링 방법에 대해 설명하며, R,G,B 삼색 정보를 이용하여 표현할 수 없는 Metamerism 효과를 분광 정보를 이용하여 표현하는 방법을 설명한다.

  • PDF

바이섹슈얼 라이팅(Bisexual Lighting)의 영상 표현 연구 (A Study on Image Representation of Bisexual Lighting)

  • 교이나
    • 트랜스-
    • /
    • 제11권
    • /
    • pp.119-142
    • /
    • 2021
  • 영상은 이미지를 전제로 하는 문화적 실천이다. 영상이미지를 통해 관객은 일상이 아닌 새로운 것을 체험하기를 갈망한다. 영상이미지의 구성 요소는 많지만 그중에 시각적 표현인 색채가 큰 역할을 담당하고 있다. 컬러영화가 등장하기 시작하면서부터 색채는 영상예술의 중요한 구성요소로서 끊임없이 발전하고 혁신적인 영상미술 디자인에서 중요한 역할을 하였다. 영화인들은 1895년 영화가 흑백으로 탄생할 때부터 색채에 대한 관심이 있었다. 이 두 가지 색채로 더 이상 시청자를 만족시키지 못했기 때문에 필름에 색채를 입히는 등 더 많은 색채를 영화 속에서 표현하려고 노력했다. 영상에서의 색채는 표현의 기법이면서도 정신과 사상으로 이해할 수 있다. 색채가 단순히 그냥 존재하는 것이 아니라 인간심리에 강하게 작용하고 있음에 일러주는 것이기도 하다. 색채는 영화 언어의 일부로, 색채언어는 영화 속에서 영화의 사상적 주제를 표현하거나 선명한 캐릭터를 묘사할 수 있으며, 사람들에게 더 직관적으로 메시지를 전달할 수 있다. 본 연구는 색 조명 방식 혹은 배색 방안인 바이섹슈얼 라이팅을 대상으로, 그의 기본적인 색채 구성요소, 즉 핑크색, 파란색 및 보라색이 갖고 있는 색채 특성을 이해해 색채를 통해 인간심리가 어떤 영향을 받고 있는 지에 대해 분석하고 바이섹슈얼 라이팅이 영상에서 나오는 장면들을 결합해 구체적인 사례분석을 했다. 이를 통해 바이섹슈얼 라이팅이 영상에서 색채 속성을 이용해 표현한 색채 언어가 무엇이고 바이섹슈얼 라이팅이 어떻게 색채를 통해 인간심리와 상호 작용하는지를 탐색하였다.

GWT 계수 에너지와 원영상 결합을 이용한 얼굴 인식 (Face recognition in conjunction between GWT coefficients' energy and original image)

  • 한정훈;홍소범;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.304-306
    • /
    • 2006
  • 본 논문에서는 GWT(Gabor Wavelet Transform) 계수 에너지와 원 영상간의 영상 결합을 수행한 영상을 주성분 분석법(Principal Component Analysis)에 적용하여 얼굴 인식을 하는 방법을 제안한다. GWT는 가버 함수의 크기 변화와 방향 변화에 의해 생성된다. 따라서 GWT는 다양한 크기 변화와 방향 변화를 가지는 변환으로 특정 주파수 성분과 방향성을 가지는 영상 구조가 어디에 있는지의 지역적 정보를 효과적으로 표현할 수 있는 변환으로 알려져 있다. GWT를 통해 나온 계수 에너지를 추출하고 원 영상에 더하여 지역적 특성을 크게 만든 후에 통계적 방법 중 가장 많이 사용되어지고 검증을 받은 PCA를 사용하여 인식한다. GWT 계수의 에너지는 얼굴 윤곽선, 눈과 입, 얼굴과 머리의 경계 등 색감의 급격한 변화를 나타내는 곳의 정보를 표현을 해주기 때문에 특징점 추출에 사용되고 있지만 이를 전역적으로 이용하여 인식하는 방법에 관한 연구가 이루어지지 않고 있다. 본 논문에서는 에너지 값만으로 전체 얼굴 영상의 세부적 표현을 할 수 없기 때문에 원 영상과의 l:l 비율의 영상 결항을 한 후 얼굴 인식 처리에 사용한다. 이 영상을 얼굴인식에 사용하였을 때원본 영상을 사용하였을 때보다 오인식이 줄었다.

  • PDF

부품 기반의 superquadric 모델을 이용한 거리 영상으로부터 3차원 물체 표현 (3-D Object Representation Using Part-based Superquadric Model from Range Image)

  • 이선호;김태은;최종수
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.201-207
    • /
    • 2001
  • 3차원 물체표현은 컴퓨터 비젼 분야에서 중요한 역할을 차지하고 있다. 본 논문에서는 체적 표현법의 일종인 부품기반의 superquadric 모델을 통하여 3차원 기계 부품 물체를 표현하는 기법을 제안하였다. 이러한 부품기반의 superquadric 모델은 크기, 이동, 회전, 그리고 변형 등의 유한개의 계수들만을 가지고 다양한 3차원 체적소의 형상 표현이 가능하다는 장점이 있다. 따라서, superquadric 형상복구 과정을 통해서 이들 superquadric 계수들을 추출함으로써 3차원 단일 체적소 표현이 가능하다. 이때, 형상복구 과정의 입력은 3차원 거리 데이터로, 형상복구 과정은 3차원 nfcp를 이루는 각 체적소에 속하는 거리 데이터들을 입력으로하는 적합도 측정함수의 최소 자승법(LSM)에 의해 이루어진다. 이후에 3차원 물체 각 체적소에 해당하는 superquadric 계수들을 얻는다. 결과적으로 3차원 전체 물체에 해당하는 superquadric 모델은 이들 각 체적소에 해당하는 계수들의 집합으로 표현된다. 컴퓨터에서 합성한 합성영상과 실제 거리영상에 대한 실험을 통해 제안한 방법의 유용성을 입증하였다.

  • PDF

모션 트레킹의 센싱화 작업을 이용한 인터랙티브 아트 (Interactive Art using a Sensing task of Motion Tracking)

  • 이준의;배성준;김형기
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.442-449
    • /
    • 2006
  • 탈 장르화와 영상의 다양화로 예술에서의 표현의 한계는 극대화 되고 있으며, 디지털 매체를 통한 인터랙션 역시 디지털 아트에서의 보편적인 표현 방법으로 전환 되었다. 예술에서의 상호작용은 보여주는 것에서 참여하는 것으로의 전환을 꿰 하고 있고, 디지털을 기반으로 한 다매체, 다중화가 이를 뒷받침 한다. 상호작용을 위한 디지털 아트 작품을 위해서는 센서를 이용한 표현방법들이 있으나, 기타의 센서도구를 사용치 않고, 단지 카메라로부터 입력된 신호만을 기반으로 영상과 관객의 상호작용을 끌어 낼 수 있다. 이를 위해서는 모션트레킹을 위한 알고리즘을 응용함으로써 사물의 밝기 값에 충족한 데이터를 만들어 낼 수 있고 그에 해당하는 밝기의 변환 값을 이용해 미세한 사물의 변화를 감지 할 수 있는 것이다. 이런 일련의 영상작업을 위해서는 사물의 움직임과 반복성을 얼마만큼 인지하고 감지 해내느냐고 관건인데, 다시 말해 한번 측정한 움직임이 있는 사물의 데이터도 프로그램상에서 계속하여 인지가 되어야 하고, 그 데이터 값을 영상으로 반환하여야 하는데, 이는 영상의 지속적인 변화를 가져 올 수 있다는 걸 의미한다. 따라서 본 논문에서는 모션 트래킹의 기본 알고리즘을 제시하고 영상작품과 인턱래션작품의 변환를 위해 사용된, 센서 대체도구인 웹 캠의 데이터 즉, 색상 값과 밝기 값을 적절하게 활용함으로써 표현의 다양성을 이끌어 내고 디지털 인터랙티브 작품으로써의 제작을 꾀하고자 한다.

  • PDF

볼륨 렌더링에서 다중 광원 표현을 위한 템플릿 조합 (Template Combination for Multiple Lighting in Volume Rendering)

  • 이병준;신병석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.987-989
    • /
    • 2017
  • 사실적이고 정확한 영상 표현을 위해서는 조명 효과가 필수적이다. 사실적인 조명처리를 위해서는 전역 조명을 계산해야 하는데 특히 볼륨 데이터는 더 많은 연산을 필요로 한다. 하나의 광원만으로는 볼륨 전체에 조명을 표현하여 뚜렷한 영상을 만들 수 없다. 여러 개의 광원을 통해 조명효과를 주게 되면 더 사실적인 영상을 얻을 수 있지만 광원의 수가 많아 질수록 연산량이 증가하게 된다. 본 논문에서는 광자 분포를 표현한 템플릿을 특정 방향에 대해 생성하고, 생성된 템플릿 조각들의 조합을 통해 여러 개의 광원에 대해 볼륨 조명을 표현하고자 한다. 조합된 템플릿을 이용하면 여러 개의 조명을 사용해도 단일 광원을 사용하는 정도의 연산량과 자원만을 사용해도 동일한 결과를 얻을 수 있다.

선형 사진트리로 표현된 이진 영상의 면적과 둘레 길이를 계산하기 위한 상수시간 RMESH 알고리즘 (Constant Time RMESH Algorithm for Computing Area and Perimeter of Binary Image Represented by Linear Quadtrees)

  • 김기원;우진운
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1746-1758
    • /
    • 1998
  • 계층적 자료구조인 사진트리는 이진 영상을 표현하는데 매우 중요한 자료구조이다. 사진트리를 메모리에 저장하는 방법중 선형 사진트리 표현 방법은 다른 표현 방법과 비교할 때 저장 공간을 매우 효율적으로 절약할 수 있는 이점이 있기 때문에 사진트리와 관련된 연산의 수행을 위해 선형 사진트리를 사용하는 효율적인 알고리즘 개발에 많은 연구가 진행되어 왔다. 본 논문에서는 REMSH(Reconfigurable MESH) 구조에서 3-차원 n$\times$n$\times$n 프로세서를 사용하여 선형 사진트리로 표현된 이진 영상의 면적과 둘레 길이를 계산하는 알고리즘을 제안한다. 이 알고리즘은 0(1) 시간 복잡도를 갖는다.

  • PDF

3차원 데이터를 이용한 실내 공간 표현 기법 (An Indoor Space Representation Method Using 3D Environmental Data)

  • 이세호;정성균;정태영;김창수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.417-418
    • /
    • 2012
  • 본 논문에서는 3차원 데이터를 이용한 효율적인 실내 공간 표현 기법을 제안한다. 제안하는 기법은 3차원 데이터의 획득과 실내 구조 및 영상 정보를 표현하기 위한 표현 복원으로 구성된다. 3차원 데이터는 레이저 거리 측정기(laser range finder, LRF)와 전방향(omni) 카메라를 통해 획득한 포인트 클라우드 공간 정보와 전방향 텍스쳐 영상으로 구성된다. 실내 구조를 복원하기 위해, 획득한 포인트 클라우드를 복셀 격자 기반의 샘플링 기법을 통해 균일화하고 포아송 표면 재구성(Poisson surface rocoostruction) 기법을 통해 3차원 메쉬를 생성한다. 그리고 전방향 텍스쳐 영상과 3차원 메쉬외 기하학적 관계를 이용한 텍스쳐 매핑 기법을 통해 최종적으로 3차원 메쉬 표면을 복원한다. 실험 결과를 통해 제안하는 기법이 실내 공간을 효과적으로 표현함을 확인한다.

  • PDF