• 제목/요약/키워드: 장면 텍스트

검색결과 70건 처리시간 0.026초

에지 이미지를 사용한 컷 검출의 구현 (An Implementation of Cut Detection using Edge Image)

  • 김설호;최형일;김계영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.51-53
    • /
    • 2011
  • 최근에는 텍스트정보 보다 동영상정보를 다루는 일이 많아졌고 그에 따라 동영상 데이터의 분할, 색인, 검색 등을 위해 장면 전환 검출이 필요하게 되었다. 장면 전환 검출 기술은 비디오 데이터의 장면 변화가 발생하는 경계를 검출하는 기술이다. 본 논문에서는 에지 이미지를 이용한 장면전환 검출과 이를 위한 임계값 설정, 그리고 결과에서 중복된 이미지와 오 검출 된 이미지를 줄여줄 수 있는 구현에 대하여 실험결과를 바탕으로 설명한다.

  • PDF

XML기반 멀티미디어 검색시스템의 설계 (Design of Multimedia Retrieval System based on XML)

  • 윤미희;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.59-62
    • /
    • 2003
  • 컴퓨팅 기술의 발달 밍 보편화로 인해 사용자들의 멀티미디어에 대한 요구가 증가하였고, 이러한 요구를 만족시키기 위해서는 단순한 텍스트 형식의 데이터가 아닌 멀티미디어 데이터, 특히 비디오 데이터에 대한 저장, 관리, 검색하는 기능이 필수적이다. 본 논문에서는 비디오데이터에 대한 효율적인 의미검색을 위해 주석기반 검색뿐만 아니라 특징기반 검색을 지원한다. 특히 사용자가 원하는 객체나 장면의 유사성 검색이 가능하며, 장면의 검색 결과로 제시된 장면을 선택한 후 선택된 장면을 기반으로 사용자가 원하는 좀 더 정확한 장면의 검색을 위한 SQBE(scene-query-by-example) 질의가 가능한 XML 기반 멀티미디어 검색시스템을 제안한다.

  • PDF

음악이 흐르는 텍스트 애니메이션 (Text Animation with Music)

  • 박두진;박종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.526-528
    • /
    • 2005
  • 음악은 스토리텔링에서 이야기의 분위기와 흐름을 전달하는데 중요한 역할을 한다. 최근 컴퓨터 애니메이션에 자동으로 알맞은 음악을 삽입하기 위하여 많은 연구가 진행되고 있지만 이야기가 있는 애니메이션보다는 주로 영상물의 동기화를 위한 연구가 대부분이었다. 텍스트 애니메이션은 동화를 자동으로 분석하여 애니메이션을 만들어 주는 연구이다. 본 논문에서는 동화의 이야기 구조에 근거하여 각 장면의 분위기에 맞는 음악 자질을 자동으로 추출하는 과정을 보이고 이를 이용하여 텍스트 애니메이션에 음악이 삽입될 수 있는 방법에 대하여 논의한다.

  • PDF

딥러닝 기반의 회전에 강인한 텍스트 검출 기법 (Rotation-robust text localization technique using deep learning)

  • 최인규;김제우;송혁;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.80-81
    • /
    • 2019
  • 본 논문에서는 자연스러운 장면 영상에서 임의의 방향성을 가진 텍스트를 검출하기 위한 기법을 제안한다. 텍스트 검출을 위한 기본적인 프레임 워크는 Faster R-CNN[1]을 기반으로 한다. 먼저 RPN(Region Proposal Network)을 통해 다른 방향성을 가진 텍스트를 포함하는 bounding box를 생성한다. 이어서 RPN에서 생성한 각각의 bounding box에 대해 세 가지의 서로 다른 크기로 pooling된 특징지도를 추출하고 병합한다. 병합한 특징지도에서 텍스트와 텍스트가 아닌 대상에 대한 score, 정렬된 bounding box 좌표, 기울어진 bounding box 좌표를 모두 예측한다. 마지막으로 NMS(Non-Maximum Suppression)을 이용하여 검출 결과를 획득한다. COCO Text 2017 dataset[2]을 이용하여 학습 및 테스트를 진행하였으며 주관적으로 평가한 결과 기울어진 텍스트에 적합하게 회전된 영역을 얻을 수 있음을 확인하였다.

  • PDF

다양한 단말에 맞춤형 서비스를 위한 적응적 장면 기술 방법 연구 (Adaptive Scene Description Method for Heterogeneous Devices)

  • 김병철;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 추계학술대회
    • /
    • pp.248-251
    • /
    • 2010
  • 현재의 멀티미디어 서비스는 기존의 텍스트 위주의 사용자 환경에서 벗어나 오디오, 비디오뿐만 아닌 이미지, 그래픽, 텍스트 및 미디어 관련 정보 등의 다양한 데이터를 포함하는 멀티미디어 서비스 환경으로 변화하고 있다. 이러한 멀티미디어 서비스는 과거 TV와 컴퓨터 등 한정된 기기에서만 제공되었지만, 최근 휴대폰, MP3 플레이어, PMP 등 미디어 기기의 발전에 따라, 다양한 단말을 대상으로 서비스를 확장하고 있다. 이러한 멀티미디어 서비스를 다양한 단말을 대상으로 제공하기 위하여, 기존의 기술에서는 동일한 콘텐츠를 각각의 단말의 환경에 따라 서로 다른 서비스를 통해 제공하였다. 그러나 IPTV와 홈 네트워크 시스템 등 방송과 통신이 융합되고, 유선과 무선 간에 자유롭게 데이터를 주고받는 환경에서 단말 마다 서로 다른 서비스를 제공하는 것은 서비스 시나리오의 복잡도를 높이고, 다양한 단말을 사용하는 사용자에게 통합되지 않은 서비스를 제공 받게 되는 결과를 가져오게 된다. 이에 본 논문에서는 콘텐츠의 메타데이터를 활용하여 동일한 멀티미디어 서비스를 단말기의 다양한 환경에 따라 맞춤형 서비스를 제공할 수 있는 방법인 적응적 장면 기술을 제시하고, 그 효율성에 관하여 검증한다.

  • PDF

토픽 모델을 이용한 방송 대본 분석 사례 연구 (A case study of a broadcast script by using topic model)

  • 노윤석;곽창욱;김선중;박성배;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.228-230
    • /
    • 2015
  • 방송 대본은 방송 콘텐츠에 대해 얻을 수 있는 가장 주요한 텍스트 데이터 중에 하나이다. 본 논문에서는 토픽 모델을 통해 방송 대본 분석을 수행하고 그 결과를 제시한다. 방송 대본을 토픽 모델로 학습하기 위해 대본의 장면 단위로 문서를 구성하여 학습하여 대본의 장면을 분석하고 등장인물 단위로 문서를 구성하여 등장인물을 분석하여 그 특징을 살펴본다. 토픽 모델을 사용하여 방송 대본을 분석하는 과정에서 방송 대본이 가지는 특징을 분석하고 그로부터 향후 연구방향에 대해 논의한다.

  • PDF

장면전환으로서 '글 없는 만화연출'의 활용 연구 (A Study of the Direction on Wordless Comics Inflection as The Transition)

  • 이원석;윤기헌
    • 만화애니메이션 연구
    • /
    • 통권12호
    • /
    • pp.13-26
    • /
    • 2007
  • 이 연구는 만화에서 장면전환 기법으로 사용되는 글이 없는 만화 연출의 활용을 고찰하고 분석한다. 소재와 장면, 주제와 내러티브 등에 따라 '글 없는 만화'가 어떻게 연출되는지 살펴보는 것이 연구의 대상이고, 이러한 '글 없는 만화의 활용'이 텍스트 즉 글자를 제거한 결과, 어떠한 연출 효과를 주는지 밝힌다.

  • PDF

계층적 특징 결합 및 검증을 이용한 자연이미지에서의 장면 텍스트 추출 (Scene Text Extraction in Natural Images using Hierarchical Feature Combination and Verification)

  • 최영우;김길천;송영자;배경숙;조연희;노명철;이성환;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.420-438
    • /
    • 2004
  • 이미지에 인위적 또는 자연적으로 포함된 텍스트는 이미지의 내용을 함축적이고 구체적으로 표현하는 중요한 정의이다. 이러한 정보를 실시간에 추출하여 정확히 인식할 수 있다면 다양한 분야에서 활용될 수 있다. 본 논문에서는 자연이미지에 포함된 장면 텍스트를 추출하는 방법으로서 텍스트의 색 연속성, 자기 변화 및 색 변화와 같은 낮은 수준의 이미지 특징으로 텍스트 후보 영역을 찾고, 다해상도 (Multi-resolution) 웨이블릿(Wavelet) 변환을 이용하여 높은 수준의 텍스트 특징인 획의 구성 여부로 검증하는 계층적인 구조를 제안한다. 색 연속성 특징은 대부분의 텍스트는 동일한 색으로 구성된다는 특징을 이용하는 것이고, 밝기 변화 특징은 텍스트 영역은 주변과의 밝기 변화가 존재하며 에지 밀도가 높은 특징을 이용한다. 또한, 색 변화 특징은 텍스트 영역은 주변 배경과의 색 변화가 존재하며, 밝기 변화보다 민감한 색 분산 값으로 표현할 수 있다는 장점을 이용한다. 높은 수준의 텍스트 특징으로서 다해상도 웨이블릿 변환을 이용하여 텍스트 획의 방향성 정보를 추출하고, 추출된 정보를 SVM(Support Vector Machine) 분류기로 검증하여 최종 영역을 확정한다. 제안한 방법을 다양한 종류의 이미지에 적용한 결과 배경이 복잡해도 비교적 안정적으로 텍스트 영역을 추출하는 것을 확인할 수 있었다.

DOM update를 이용한 효율적인 멀티미디어 장면 구성 정보 변경 방안 (Effective Method to Change Multimedia Scene Configuration Information Using DOM Update)

  • 김규헌;박정욱;김병철
    • 방송공학회논문지
    • /
    • 제18권1호
    • /
    • pp.43-58
    • /
    • 2013
  • 리치미디어 서비스는 비디오, 오디오, 텍스트와 같은 다수의 멀티미디어 요소들을 동시에 소비할 수 있으며 시청자의 요구사항을 수용하여 개인화된 데이터에 대한 이용이 가능한 대화형 미디어 서비스를 뜻한다. MPEG(Moving Picture Expert Group)에서는 BIFS(Binary Format for Scenes)와 LASeR(Light Application Scene Representation)를 제정함으로써 리치미디어 서비스를 위한 방안을 제시하였다. 상기 두 표준은 다수의 미디어 콘텐츠간의 시간적, 공간적 배치에 대한 정보와 콘텐츠 간 상호작용을 기술한 장면 구성 정보를 이용함으로써 리치미디어 서비스를 가능하게 하였다. 그러나 기존의 리치미디어 서비스에서는 사용자 및 서비스에 의해서 장면 구성 정보가 변경될 때마다 매번 단말이 가진 기존의 장면 구성 정보를 삭제하고 새로운 장면 구성 정보를 생성 및 분석해야하는 비효율적인 방법으로 장면 전환이 이루어진다. 따라서 본 논문에서는 DOM(Document Object Model) update라는 웹문서 데이터 인터페이스 규격을 사용하여 보다 효율적이고 동적인 장면 구성 변경 방안을 제시하여 장면 전환의 시간적 단축 효과와 장면전환에 따른 화면의 정지 등의 불연속성을 제거하는 효과를 검증하였다.

방송 자막을 이용한 인터넷 기반 주요장면 보기 서비스 (Internet based highlight scene viewing service using DTV closed-caption data)

  • 김규석;윤정현;김천석;지미경
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.247-250
    • /
    • 2009
  • VOD(Video On Demand) 서비스는 통 방 융합 환경에서의 킬러서비스로, 지상파 방송사에서는 인터넷을 통해 '다시 보기', 'TV VOD' 등의 서비스를 제공하고 있다. 이러한 기존의 방송 VOD 서비스는 콘텐트를 실제 재생하기 전에는 사용자가 원하는 장면을 찾기가 쉽지 않으며, 또한 콘텐트를 실제 재생하더라도 대사 내용이 텍스트로 제공되지 않으므로 청각 장애자의 경우 내용을 파악하기가 어렵다. 본 논문에서는 이와 같은 기존의 방송 VOD 서비스의 단점을 보완하기 위해 디지털 방송 프로그램으로부터 자막 데이터를 추출하고 이를 기반으로 방송 콘텐트의 구간 정보를 생성하기 위한 연구 내용과 이를 적용하여 웹사이트를 통해 제공되고 있는 '주요장면 보기' 서비스의 실 구축 사례를 소개한다.

  • PDF