• 제목/요약/키워드: 영상표현

검색결과 2,308건 처리시간 0.025초

효율적인 비디오 데이터베이스 구축을 위해 카메라와 객체 파라미터를 이용한 계층형 영상 모자이크 (A Hierarchical Image Mosaicing using Camera and Object Parameters for Efficient Video Database Construction)

  • 신성윤;이양원
    • 한국멀티미디어학회논문지
    • /
    • 제5권2호
    • /
    • pp.167-175
    • /
    • 2002
  • 모자이크 영상은 연관성 있는 비디오 프레임이나 정지 영상들을 합성하여 하나의 새로운 영상을 생성하는 것으로서 영상의 정렬, 통합 그리고 중복성에 대한 분석으로 수행된다. 본 논문에서는 효율적인 비디오 데이터 베이스 구축을 위하여 카메라와 객체 파라미터를 이용한 계층형 영상 모자이크 시스템을 제시한다. 모자이크 영상 생성의 빠른 계산 시간과 정적 및 동적 영상 모자이크 구축을 위하여 트리 기반 영상 모자이크 시스템을 구축한다. 카메라 파라미터를 측정하기 위하여 최소사각형 오류기법과 어파인 모델을 이용하였다. 객체의 추출을 위하여 차영상, 매크로 블록, 영역 분할과 4분할 탐색 기법들을 제시하여 사용하였다. 또한, 동적 객체 표현을 위하여 동적 궤도 표현 방법을 제시하였고, 완만한 모자이크 영상 생성을 위하여 블러링을 이용하였다.

  • PDF

MPEG-7 디스크립터들의 조합을 이용한 영상 검색 (Image Retrieval Using a Composite of MPEG-7 Visual Descriptors)

  • 강희범;원치선
    • 방송공학회논문지
    • /
    • 제8권1호
    • /
    • pp.91-100
    • /
    • 2003
  • 본 논문에서는 MPEG-7 영상 디스크립터 중 에지 히스토그램 디스크립터(EHD), 컬러 레이아웃 디스크립터(CLD), 그리고 호모니어스 텍스쳐 디스크립터(HTD)로 구성된 각각의 영상 데이터베이스를 조합하여 렐러번스 피드백을 적용한 영상 검색 방법을 제안한다. 본 논문에서 사용한 에지 히스토그램 디스크립터는 영상의 국부적인 방향성 에지 분포를 표현한 것으로서 영상에 대하여 그 내용물의 형태를 잘 표현하는 디스크립터이다. 컬러 레이아웃 디스크립터는 구조적인 단순함과 빠른 동작 속도에 의해 영상 검색에 넓게 사용되어지며 컬러의 공간적 분포로 표현된다. 호모지니어스 텍스쳐 디스크립터는 영상의 질감에 대하여 정밀한 통계상의 분할로 서술된다. 앞에서 언급한 디스크립터들은 각각의 특징을 반영한 영상 검색에 적용되어 진다. 렐러번스 피드백은 영상 검색에 있어 사용자가 요구하는 정보를 반영할 수 있어 영상의 검색 효율을 높일 수 있다. 제안한 방법은 사용자가 렐러번스 피드백으로 결정한 영상의 특징 정보가 각각의 디스크립터들에 새로운 가중치를 부여한다. 따라서, 사용자의 선택적 요구가 반영된 특징 정보 갱신을 통해 검색 효율을 높인다. 자연 영상에 대한 실험 결과로 제안한 방법이 검색 성능을 향상시켜주는 것을 확인할 수 있다.

영상 콘텐츠에 나타나는 만화적 표현에 관한 연구 (A Study on the Cartoon Style in Image Contents)

  • 이영숙;이헌우
    • 만화애니메이션 연구
    • /
    • 통권24호
    • /
    • pp.65-82
    • /
    • 2011
  • 인터넷이 공급된 이후로 수많은 창의적 콘텐츠산업이 활발하다. 특히 e-북에 관한 높은 관심과 열기와 출판만화의 온라인 진출로 인하여 부가적인 산업이 활발하게 양성되고 있다. 그러나 영화에 대한 영상 문법적 연구는 활발하나 다양한 콘텐츠에서 표현된 만화적 연출에 대한 연구가 부족하다. 본 연구는 애니메이션 및 회화에서 표현되어지는 만화의 기법적 사례를 통해 만화적 연출의 가능성 제시에 목적이 있다. 또한 만화산업은 원소스멀티유즈(one source multi use)로 연관 산업과의 부가가치산업의 핵심요소라 할 수 있다. 그러므로 타 매체에서 표현된 만화의 기법에 대한 연구는 다양한 영상콘텐츠의 핵심적 요소로서 작용하리라 본다.

에러 분포의 예측을 이용한 비트 심도 확장 기술 (Bit Depth Expansion using Error Distribution)

  • 우지환;심우성
    • 방송공학회논문지
    • /
    • 제22권1호
    • /
    • pp.42-50
    • /
    • 2017
  • 비트의 심도 확장은 영상을 표현하는 비트 수를 확장하는 방법이다. HDR(High Dynamic Range) 디스플레이의 발전과 디스플레이의 해상도가 높아짐에 따라서, 디스플레이에서 영상을 표현하는 휘도가 증가하고 표현력도 상승한다. 이러한 디스플레이에 대응하기 위해서는 영상을 표현하는 비트수도 확장되어야 하기 때문에 비트의 심도 확장의 중요성은 높아지고 있다. 본 논문에서는, 높은 비트 심도(10bit)를 가지는 디스플레이에 기존의 영상(8bit)을 자연스럽게 표현하기 위한 비트 심도 확장 방법을 소개한다. 정량적인 결과와 정성적인 결과 및 연산량의 비교를 통해서 제안된 알고리즘이 기존의 비트 심도 확장 방법과 비교해서 우수함을 검증하였다. 제안된 방법은 기존의 최신 비트 심도 확장 방법과 비교해서, 40배 더 빠른 연산속도와 평균 1db이상 높은 성능 향상 결과를 보여준다.

영상 패치 기반 그래프 신경망을 이용한 수동소나 신호분류 (Passive sonar signal classification using graph neural network based on image patch)

  • 고건혁;이기배;이종현
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.234-242
    • /
    • 2024
  • 본 논문에서는 그래프 신경망을 이용한 수동소나 신호 분류 알고리즘을 제안한다. 제안하는 알고리즘은 스펙트로그램을 영상 패치로 분할하고, 인접 거리의 영상 패치 간 연결을 통해 그래프를 표현한다. 이후, 표현된 그래프를 이용하여 그래프 합성곱 신경망을 학습하고 신호를 분류한다. 공개된 수중 음향 데이터를 이용한 실험에서 제안된 알고리즘은 스펙트로그램의 선 주파수 특징을 그래프 형태로 표현하며, 92.50 %의 우수한 분류 정확도를 갖는다. 이러한 결과는 기존의 합성곱 신경망과 비교하여 8.15 %의 높은 분류 정확도를 갖는다.

그림의 명암과 그림자 표현을 위한 아트로봇 기술 설계 (A Design of Art-Robot Technique for Drawing Shade and Shadow of a Picture)

  • 송명진;김바울;이근주;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1027-1030
    • /
    • 2011
  • 휴머노이드 로봇 중 초상화를 그리는 로봇이 있지만 다양한 영상을 입력받아 명암 및 그림자까지 그림을 그리는 로봇은 흔하지 않다. 기존의 화가로봇들은 사용자의 얼굴을 영상으로 입력받아 윤곽선만 추출하여 그리는 방식으로, 입력된 영상으로부터 로봇 암을 제어하는 과정에서 제대로 동기화가 이뤄지지 못해 드로잉 속도가 느리고 원본 영상과 비교 시 차이가 많이 난다. 본 연구에서는 입력된 영상으로부터 명암과 그림자를 인식하여 표현해 줌으로써 입체감 있는 그림의 드로잉이 가능하다. 또한, 로봇 암의 미세한 컨트롤을 통해 드로잉 선 두께를 제어함으로써 자연스러운 그림을 그리고, 드로잉 속도가 향상되어 정확도를 높일 수 있게 하는 휴리스틱 암 제어 기술을 제안한다. 이를 구현하기 위해서는 영상으로부터 명암, 그림자의 농도에 따라 레벨을 결정하고, 레벨을 바탕으로 주변 명암 픽셀들을 평활화 하여 좌표 집합을 추출한다. 좌표 값들로 부터 유효 궤적을 분석하여 로봇 암이 이동할 경로를 추출하고, 효율적인 드로잉 기법을 통해 명암을 표현하여 드로잉하려 한다.

입체영상 가시화를 위한 자동 피사계 심도 조절기법 (Automatic Depth-of-Field Control for Stereoscopic Visualization)

  • 강동수;김양욱;박준;신병석
    • 한국멀티미디어학회논문지
    • /
    • 제12권4호
    • /
    • pp.502-511
    • /
    • 2009
  • 컴퓨터그래픽스에서 실세계의 피사계 심도를 표현하기 위해 많은 연구가 진행되어왔다. 피사계 심도는 초점이 맺히는 초점평면을 기준으로 초점거리보다 가깝거나 멀 경우 렌즈와 조리개의 특성에 따라 해당부분이 흐리게 표현되는 현상이다. 이것을 이용하면 사람의 눈처럼 수정체에 의한 아웃 포커스 현상을 표현할 수 있기 때문에 현실감 있는 영상 표현이 가능하다. 본 논문에서는 eye-tracking 기술을 이용하여 사용자의 착안점을 계산하고 이를 바탕으로 GPU기반의 피사계 심도 조절방법을 구현함으로써 입체영상을 볼 때 발생하는 부작용을 줄이는 방법을 제안한다. 일반적으로 입체영상은 사용자의 초점을 강제로 조정하기 때문에 장시간 입체영상을 보면 어지럼증 등 부작용이 나타난다. 제안하는 기법은 눈동자의 움직임을 실시간으로 추적하여 입체영상의 피사계 심도를 자동으로 조절할 수 있기 때문에 부작용 저감이 가능하며 몰입감을 향상시킬 수 있다.

  • PDF

스테레오 기반 비디오 압축/전송 시스템을 위한 시차영상 추정 및 표현에 관한 연구 (Study on the estimation and representation of disparity map for stereo-based video compression/transmission systems)

  • 박성철;남궁재찬
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.576-586
    • /
    • 2005
  • 본 논문에서는 스테레오 기반 비디오 압축 전송 시스템을 위하여 시차영상을 추정하고 표현하는 방법에 대하여 연구를 수행하였다. 기존에는 스테레오 영상 전송을 위하여 시차영상을 화소 단위나 블록단위로 구하는 방법이 사용되었다. 화소 단위 시차추정은 정확도는 높으나 전송시 많은 비트를 발생시키는 반면, 블록단위 시차 추정은 정보량을 줄일 수 있으나 정확도가 떨어지는 단점을 가지고 있다. 본 논문에서는 영상의 경계부분을 두 개의 영역으로 나누고 시차정보를 주변 것으로 대치함으로써 블록단위의 방법과 거의 같은 정보량을 갖으면서 경계부분에서 보다 정확한 시차정보를 표현하는 방법을 제안하였다. 본 방법은 블록의 형태를 분류하기 위하여 누적 히스토그램을 특징으로 하는 신경망을 사용하였다. 본 논문에서는 제안한 알고리즘이 경계블록을 다수 포함한 영상에서는 블록단위의 시차표현 방법보다 효과적임을 실제 영상 분석을 통하여 증명하였다.

대화 참여자 결정을 통한 Character-net의 개선 (Improvement of Character-net via Detection of Conversation Participant)

  • 김원택;박승보;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.241-249
    • /
    • 2009
  • 동영상 검색이나 축약과 같은 동영상 분석을 위해 동영상 어노테이션 기술이나 동영상 정보 표현에 대한 다양한 연구가 있어왔다. 이를 위해 본 논문은 대화 참여자 결점을 위한 영상적 요소와 이러한 요소를 이용하여 Character-net 표현을 개선하는 방법을 제안한다. 기존 Character-net이 자막이 뜨는 시간에 나타나는 등장인물들만을 대화참여자로 고려하므로 일부의 청자를 제외시키는 문제점이 있다. 대화 참여자는 대화상황 파악의 극히 중요한 요소로 동영상 검색 시에 기준이 될 수 있으며 동영상의 이야기 전개를 이끌어 나간다. 대화 참여자를 결정하기 위한 영상적 요소에는 자막의 유무, 장면, 인물 등장순서, 시선방향, 패턴, 입의 움직임 등이 있다. 본 논문에서는 이러한 영상적 요소에 근거하여 대화 참여자를 판단하고 동영상 표현방법인 Character-net을 개선하고자 한다. 제안한 여러 요소들이 결합되고 일정한 조건이 만족되었을 때 대화참여자를 정확히 검출할 수 있다. 따라서 본 논문에서는 대화참여자를 결정하기 위한 영상적 요소들을 제안하고 이를 통해 Character-net의 표현성능을 개선하고 실험을 통하여 제안된 방법론이 대화 참여자 판단의 정확성과 Character-net의 표현성능을 제고함을 증명하였다.

ORMN: 참조 표현 이해를 위한 심층 신경망 모델 (ORMN: A Deep Neural Network Model for Referring Expression Comprehension)

  • 신동협;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.69-76
    • /
    • 2018
  • 참조 표현이란 장면 영상 내의 특정 물체를 가리키는 자연어 문장들을 의미한다. 본 논문에서는 참조 표현 이해를 위한 새로운 심층 신경망 모델을 제안한다. 본 논문에서 제안하는 모델은 장면 영상 내 대상 물체의 영역을 찾아내기 위해, 참조 표현에서 언급하는 대상 물체뿐만 아니라 보조 물체, 그리고 대상 물체와 보조 물체 사이의 관계까지 풍부한 정보를 활용한다. 또한 제안 모델에서는 영상 내 각 후보 영역의 적합도 계산을 위해 물체 적합도와 관계 적합도를 참조 표현의 문장 구조에 따라 결합한다. 따라서, 본 모델은 크게 총 네 가지 서브 네트워크들로 구성된다: 언어 표현 네트워크(LRN), 물체 정합 네트워크(OMN), 관계 정합 네트워크(RMN), 그리고 가중 결합 네트워크(WCN). 본 논문에서는 세 가지 서로 다른 참조 표현 데이터집합들을 이용한 실험을 통해, 제안 모델이 현존 최고 수준의 참조 표현 이해 성능을 보인다는 것을 입증하였다.