• 제목/요약/키워드: 시각정보 인코딩

검색결과 14건 처리시간 0.023초

부분적 시각화와 수정을 위한 TIN 압축 (TIN Compression for Partial Visualization and Modification)

  • 박동규;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.601-603
    • /
    • 1999
  • 대부분의 다면체 모델 데이터의 표면과 지리 정보 시스템을 위한 지형 데이터는 삼각 분할을 통하여 만들어진 불규칙 삼각형 네트웍(Triangulated Irregular Network:TIN) 구조를 가지고 있다. 대용량 TIN 데이터를 그래픽스 시스템에서 빠르게 시각화 하는데는 많은 어려움이 있으므로, 일반적으로 TIN 데이터의 특징을 이용하여 압축된 데이터를 이용한다. 그러나 압축한 TIN 데이터는 부분적인 수정과 같은 연산을 수행하기 위하여 전체 데이터를 디코딩하고 다시 인코딩하는 과정을 반복하여 수행하므로 이같은 연산이 자주 발생하는 응용분야에는 부적합하다. 본 논문은 이러한 문제의 해결방안으로 삼각형 메쉬를 삼각형 스트립으로 재구성 한 후에 이 삼각형 스트립을 정점 체인과 각 정점의 차수 정보를 이용하는 저장하는 압축 알고리즘과 함께 이 알고리즘이 부분적인 불규칙 삼각망 수정에 유용하게 적용될 수 있음을 제시한다. 제안된 알고리즘은 각각의 정점 체인이 독립적으로 인코딩 가능하므로 불규칙 삼각망 정보를 수정할 경우 최소한의 인코딩과 디코딩으로 불규칙 삼각망을 수정할 수 있다.

  • PDF

시트콤 동영상에서 MPEG-7 시각 기술자를 이용한 Scene 배경의 자동 분류 방법 (An Automatic Scene Background Classification Scheme for Sitcom Videos Using MPEG-7 Visual)

  • 전재욱;손대온;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.505-507
    • /
    • 2004
  • 시트콤 동염상은 고정된 배경을 갖는 중 아웃에 연이어 오는 줌 인으로 구성되어 있고, 또한 활영되는 배경의 수는 한정되어 있는 특성이 때문에, 이러한 배경의 시각적 특성을 사용하여 배경들을 학습시키고 자동으로 분리시킬 수 있다. 본 논문에서는 신경망의 일종인 LVQ[1]를 사용하여 이러한 증류의 비디오 동영상에 대한 자동 배경 분류 방법을 제안한다. 우선, MPEG-7 시각 기술자를 이용하여 신(scene) 배경의 시각적인 특성을 추출하고 이러한 시각적 특성을 미리 제작자에 의해서 주어진 배경 점보로서 LVQ를 학습시킨다. 학습이 진행되면서 특정 배경의 시각적 특성은 LVQ의 가중치로서 표현되며, 다른 배경을 자동으로 분류하는데 사용된다 제안된 LVQ기반의 분류 방법을 사용한 두 종류의 시트콤 동영상에 대한 실험 결과는 분류에 대한 어떠한 하드코딩 없이 80-90%의 정확도로 시트콤 동영상의 배경을 자동으로 분류한다.

  • PDF

다중 시각 객체 전송을 위한 최적화 적응 프래임워크 (An Optimal Adaptation Framework for Transmission of Multiple Visual Objects)

  • 임정연;김문철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.207-218
    • /
    • 2008
  • 인터넷의 발달과 함께 멀티미디어 스트리밍은 비디오 콘텐츠를 전달하는데 중요한 수단이 되었으며 스트리밍 되는 데이타의 양도 점점 증가하고 있다. 하지만 스트리밍의 양이 증가함에 따라 가변적 네트워크 대역폭을 갖는 IP 네트워크 환경 상에서 실시간 QoS를 보장하기 어려워진다. 본 논문에서는 한정된 가용 대역폭과 트랜스코딩 코스트를 고려하면서 동시에 다중 앵글 콘텐츠의 인지적 화질을 최대화하는 최적화 적응 프레임워크를 제안한다. 제안된 다중 앵글 서비스 프래임워크에서 사용자는 같은 이벤트에 대해 다른 뷰 앵글로 캡쳐된 다중 비디오 스트림들 중에 사용자가 원하는 뷰를 선택할 수 있다. 이러한 향상된 서비스는 시간에 따른 네트워크 대역폭 변화와 같은 네트워크의 스트리밍 문제를 수반한다. 이를 위해 본 논문에서는 제안된 비디오 적응 프래임워크에서 다중 앵글 비디오 콘텐츠는 주어진 대역폭에 맞게 전달하기 위해 다른 비트율로 인코딩되며 적절한 비디오 스트림이 선택되거나 트랜스코딩 될 수 있다고 가정한다. 각 사용자의 선호도에 따른 다양한 위치에서 캡쳐된 콘텐츠의 선택적 소비를 위해, 각 앵글에 제공되는 비트스트림은 다양한 비트율로 인코딩될 수 있고, 제약된 대역폭 환경에서 실시간으로 변하는 비트율에 최적화된 콘텐츠를 전송하기 위해 콘텐츠를 트랜스 코딩되거나 서브 비트스트림이 선택되도록 한다. 이러한 가정을 기반으로 제안된 최적화 적응 프래임워크에서 트랜스 코딩하는데 걸리는 시간을 트랜스코딩 코스트로 정의하고 주어진 트랜스코딩 코스트와 제한된 네트워크 대역폭을 만족하며 동시에 인지적 화질을 최대화하는 방법을 수식화 한다. 또한 제안된 방법의 효율성을 증명하기 위한 다양한 실험 결과를 보인다.

HDTV 영상의 원본비참조 화질평가 방법에 관한 연구 (A Study on No-reference Video Quality Assessment of High Definition Television)

  • 김민기;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.410-413
    • /
    • 2011
  • 2012년 12월 31일을 기점으로 지상파 아날로그 방송이 종료되고 디지털 방송으로 전환되게 되어, 아날로그 방송에서는 크게 느껴지지 못했던, HDTV 영상 화질에 대한 문제가 대두되고 있다. 방송에서 쓰이는 영상의 경우 대부분 원본은 Tape형식이고, 이를 디지털방송에 맞는 형식으로 압축하여 인코딩한 이후 방송에 적합한 형태로 가공하여 서비스하게 되는데, 이때 MPEG압축 방식에 의해 발생하는 블로킹과 같은 새로운 증상에 대한 문제점이 나타나게 된다. 본 논문에서는, HDTV 영상 화질에서의 일반적으로 인간의 시각이 민감하게 반응하는 블록형 잡음에 대하여, 원본비참조 방법으로, 블록들에 대한 객관적인 점수화 방법에 대하여 연구한다. 본 연구를 통해 HDTV의 고품질화와 정보통신 영상 발전에 기여 할 것이다.

  • PDF

메타데이터의 분할 및 갱신을 위한 TeM 코덱 설계 (TeM Codec Design for Metadata Fragmentation and Update)

  • 양승준;장현성;김영태;강경옥
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2002년도 정기총회 및 학술대회
    • /
    • pp.251-255
    • /
    • 2002
  • MPEG-7 은 멀티미디어 데이터를 XML로 기술한 새로운 표준이다. MPEG-7은 구조 및 의미 정보, 미디어 형식 정보 등과 같은 유용한 기술 및 기술구조들을 제공하며, MPEG-7 시스템에서는 메타데이터의 텍스트인코딩 포맷인 TeM은 기술의 동적 흑은 점진적인 전송을 지원한다. XML 문서의 본래의 기술을 추가적인 XML 헤더가 덧씌워져 여러 개로 나누어질 수 있으며, 이러한 결과로 나온 AU들은 각기 전송을 하여 터미널에서 수신된 AU를 이용한 갱신이 가능하다. 본 논문에서는 이러한 MPEG-7 시스템의 갱신 메커니즘을 이용한 TeM 코덱을 설계 및 구현하였다. 구현된 TeM 코덱의 인코더는 AU 생성에 있어서 시각화된 편집 도구를 제공하며, 디코더는 XSLT 기반의 갱신 기법을 기반으로 하여 구현하였다.

  • PDF

PDA환경에서의 MPEG-4 컨텐츠 저작도구 (A Special MPEG-4 Authoring Tool for PDA)

  • 이송록;임영순;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.517-519
    • /
    • 2004
  • MPEG-4는 이미지, 비디오. 오디오와 다양한 기하객체 및 텍스트객체 등 설러 가지 멀티미디어 데이터를 각 객체 단위로 합성하여 멀티미디어 컨텐츠를 구성함으로써 멀티미디어 데이터에 대한 재사용성과 효율성을 높이며, 사용자와의 상호작용이 가능한 시청각 장면을 생성하고 전송을 가능하게 한다. 유비쿼터스 컴퓨팅에 대한 연구가 개발하게 전개되고 있는 이때, PC에서뿐만 아니라 언제 어디서나 가능한 모바일 환경에서 다양한 사용자 인터랙션에 중점을 두고 카드메일, 간단 게임 저작 등을 가능하게 함으로써 poA환경에서 전문적인 저작도구를 개발하는 것이 필요하다. 본 논문은 poA환경에서 기하객체와 텍스트, 이미지 등의 객체들을 이용하여 MPEG-4 컨텐츠 저작을 위한 씬 트리를 생성하고 이에 대한 인코딩을 통하여 BIFS 파일 포맷을 형성하고 멀티플렉서를 통하여 MPEG-4 파일을 생성함으로써 PDA환경에서 직접적이고도 시각적인 저작이 가능한 MPEG-4 건텐츠 저작시스템을 제안하고 그 개발 결과를 보인다.

  • PDF

PIM과 2D 바코드를 이용한 워터마킹 알고리즘 (A Digital Watermarking Algorithm Using PIM and 2D Barcode)

  • 한수영;김홍렬;이기희
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.103-108
    • /
    • 2005
  • 본 논문에서는 PIM과 2D 바코드를 이용한 강인한 워터마킹 방법을 제안한다. 인간의 시각 특성은 복잡한 영역에서는 변화에 둔감하므로 복잡도를 나타내는 PIM에 의해 선택된 계수에 워터마크를 삽입하여 비가시성을 높인다. 워터마크로는 저작권 정보를 2차원 바코드로 인코딩하여 삽입한다. 2차원 바코드는 1차원 바코드에 비해 많은 정보를 포함시킬 수 있고, 에러 보정 능력을 내재하고 있어 워터마킹 알고리즘의 견고함을 높일 수 있다. 실험결과는 제안된 알고리즘을 이용한 워터마킹이 JPEG, SPIHT와 같은 손실영상 압축에도 견고함을 보여준다.

  • PDF

이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템 (Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features)

  • 임정우;장윤나;손준영;이승윤;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

주성분분석을 이용한 토끼 망막 신경절세포의 활동전위 파형 분류 (PCA­based Waveform Classification of Rabbit Retinal Ganglion Cell Activity)

  • 진계환;조현숙;이태수;구용숙
    • 한국의학물리학회지:의학물리
    • /
    • 제14권4호
    • /
    • pp.211-217
    • /
    • 2003
  • 주성분분석은 잘 알려진 데이터 분석 방법으로써 높은 차원의 데이터를 낮은 차원의 데이터로 표현하는데 효과적이어서 얼굴인식, 데이터 압축 등에 이용되고 있다. 주성분분석을 하게 되면 원 데이터의 공분산 행렬로부터 정규직교한 고유벡터와 해당하는 고유치를 얻게 되고 그 중 큰 값을 가지는 고유벡터 들을 선택하여 선형 변환함으로써 데이터의 차원을 줄일 수 있게 된다. 망막에 빛 자극이 인가되면 시세포 층에서 전기신호로 변환된 후 복잡한 신경회로를 거쳐 최종적으로 신경절세포 층에서 활동전위의 형태로 출력되게 된다. 본 연구에서는 다채널전극을 사용하여 여러 개 망막 신경절세포로부터 유래되는 활동전위를 기록한 후 개개의 신호를 구분하는 과정을 거치고, 이어서 그 신호를 만들어 내는 각 뉴론들끼리의 시간적, 공간적 흥분발사 패턴을 이해함으로써 궁극적으로 시각정보 인코딩 기전을 밝히려는 연구 목표하에 그 첫 단계로서 망막 신경절세포의 활동전위를 기록한 후 분류하는 과정을 성공적으로 수행하였기에 그 내용을 서술하고자 한다. 망막에서 기록되는 신경절세포 활동전위는 불규칙하고 확률적이기 때문에 주성분분석을 통하여 그 유형을 분류할 수 있었다. 토끼 눈으로부터 망막을 박리하여 망막조각을 얻은 후 신경절세포 층이 전극표면을 향하도록 전극에 부착하였다. 8${\times}$8의 microelectrode array (MEA)를 전극으로 사용하였고, 증폭기는 MEA 60 system을 사용하여 신경절세포 활동전위를 기록하였다. 활동전위 기록 후 파형 분류를 하였다. 잡음이 섞여있는 기록으로부터 신호를 검출하기 위하여, 잡음역치($\pm$3$\sigma$)를 설정하였다. 역치를 넘는 파형 만을 획득한 후 주성분분석을 통해 각 파형의 첫 번째 주성분, 두 번째 주성분을 계산하여 2차원 평면에 투사함으로써 몇 개의 의미있는 클러스터를 얻었다. 이 클러스터는 곧 각 신경절세포에서 유래되는 파형을 반영하므로 주성분분석을 통하여 망막 신경절세포의 활동전위를 각 세포별로 분류할 수 있음을 확인하였다.

  • PDF

변형을 갖는 멀티미디어 콘텐트에 대한 북마크 (Bookmark for Multimedia Content Having Multiple Variations)

  • 염지현;김명훈;설상훈;김혁만
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권7호
    • /
    • pp.489-494
    • /
    • 2009
  • 멀티미디어 콘텐트는 다양한 대역폭, 해상도, 압축형식으로 독립적으로 인코딩되므로, 동일한 비디오 부분이 다양한 형식의 변형 파일 안에서 다른 시간적 위치에 저장될 수 있다. 이 논문에서는 멀티미디어 콘텐트를 재생 중이거나 혹은 재생 전에, 콘텐트 시청의 끊김이나 중복 없이 임의의 다양한 형식의 변형 파일들 사이에 같은 비디오 부분을 정확히 접근 할 수 있는 견고한 멀티미디어 북마크 메커니즘을 제안한다. 또한 직관적이고 시각적인 인터페이스를 통하여 사용자가 북마크를 관리할 수 있는 새로운 멀티미디어 북마크 재생기를 제안한다.