• 제목/요약/키워드: 장면 텍스트

검색결과 70건 처리시간 0.021초

비디오에서 프로젝션을 이용한 문자 인식 (Identification of Korea Traditional Color Harmony)

  • 백정욱;신성윤;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.196-197
    • /
    • 2009
  • 비디오에서 우선 장면 전환 검출을 통해 생성된 키 프레임을 대상으로 프로젝션을 통하여 문자 인식을 수행하도록 한다. 텍스트의 자간 분리를 수직 프로젝션에 의해 분리 한다. 자소는 초성, 중성, 종성으로 분리하고 6가지 유형으로 분리한다. 자소 패턴 분리는 수평 프로젝션을 통하여 6가지 유형에 맞도록 분리한다. 자소는 수평, 수직, 사선, 역사선 방향으로 분리한다. 자소의 인식은 4-방향 프로젝션과 위치정보를 이용하여 인식하도록 한다.

  • PDF

제한적 키 입력을 갖는 휴대 단말에서의 BIFS 콘텐츠 제어방법 (Control Method of BIFS Contents for Mobile Devices with Restricted Input Key)

  • 김종연;문남미;박주경
    • 방송공학회논문지
    • /
    • 제15권3호
    • /
    • pp.346-354
    • /
    • 2010
  • 지상파 DMB에서는 양방�� 데이터 서비스를 위하여 MPEG-4 BIFS 규격을 사용하고 있다. BIFS는 콘텐츠의 장면을 구성하는 AV, 이미지, 그래픽, 텍스트 등의 다양한 멀티미디어 객체를 장면상에 표현하고, 사용자로부터 입력을 받아 표현된 객체를 조작하도록 하는 것이 가능하다. 그러나 BIFS가 다양한 형태의 입력장치를 갖는 멀티미디어 시스템에 부합되도록 설계되었지만, 오늘날과 같이 제한적 입력장치를 갖는 휴대 단말에 대한 고려가 결여되어 있다. 문제는 DMB 단말들이 제한적 입력을 가질 수밖에 없기 때문에 사용자가 양방향 데이터 콘텐츠를 조작하는 방법이 일관적이지 못하다는 것이다. 본 논문에서는 이러한 문제를 해결하기 위하여 콘텐츠 제공자와 사용자간의 통일되고 효율적인 콘텐츠 조작을 위해 현재의 BIFS 규격에 KeyNavigator 노드를 추가로 정의하였다. KeyNavigator 노드는 BIFS 콘텐츠에서 휴대 단말의 방향키를 이용하여 BIFS 객체간의 이동이나 BIFS 객체를 선택하는 방법을 제공한다. KeyNavigator 노드를 사용함으로써 BIFS 콘텐츠 제공자는 의도하는 바에 따라 콘텐츠를 저작할 수 있고 휴대 단말 사용자에게도 통일되고 효율적인 BIFS 콘텐츠 제어 방법을 제시하는 우수한 효과가 있다.

<적벽가> 창극화의 전략과 한계 (Strategies and difficulties of making Jeokbyeok-ga into Changguk)

  • 이진주
    • 공연문화연구
    • /
    • 제39호
    • /
    • pp.31-67
    • /
    • 2019
  • 본고는 판소리 <적벽가>를 창극으로 만드는 작업의 어려움을 판소리와 창극의 장르상 차이에 있다고 보고 판소리의 서사와 음악이 창극에 그대로 활용되기 어렵다는 점을 밝혀내었다. 전승 5가를 창극으로 만든 작품들은 대부분 판소리의 서사와 소리를 그대로 공연한다. 그러나 판소리 <적벽가>의 원본 서사는 전반부와 후반부의 생성이 따로 이루어졌기 때문에 눈에 띄게 이원적 구조를 가지고 있다. 판소리와는 달리, 이야기를 무대화하여 시각적으로 보여주는 드라마 장르에서는 행동의 일치가 중요하게 때문에, 원본 서사의 이원성은 행동의 불일치라는 결함으로 드러날 수 있다. 또한 판소리 원작의 소리들은 극적이기보다는 설명적인 대목이 많으며, 극적 클라이맥스인 적벽대전 장면도 설명적이고 해학적인 사설로 되어 있어서 창극에서 극적인 장면으로 연출하기에 어려움이 있다. 다만 소설 원작에는 없는 군사들의 목소리는 창극에서 연출되었을 때, 이면적 주제를 효과적으로 드러내는 역할을 한다. 그러나 군사들의 목소리마저도 서사적인 측면에서는 핍진성을 결여하고 있기에, 판소리 원본 텍스트를 그대로 창극에 이식하기에는 무리가 있다. 창극 <적벽가>는 능동적으로 판소리 <적벽가>를 연구하고 해체해야만, 창극만의 독자적인 새로운 작품으로 거듭날 수 있을 것이다.

초소형 버추얼 프로덕션 환경에서 디지털 휴먼을 이용한 촬영 사례 (Case Study : Cinematography using Digital Human in Tiny Virtual Production)

  • 임재호;장민정;전상욱;이수빈;박민수;김유진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.21-31
    • /
    • 2023
  • 본 논문에서는 디지털 휴먼을 활용한 버추얼 프로덕션에서의 촬영 사례를 소개한다. 본 촬영 사례는 LED를 활용한 버추얼 프로덕션의 시스템 구성과 디지털 휴먼을 활용한 효율적인 촬영 파이프라인을 다루고 있다. LED를 이용한 버추얼 프로덕션은 주로 LED에 배경을 투사하여 촬영하는 것과 달리 본 사례는 디지털 휴먼을 가상 배우로 사용하여 실제 배우와 소통하는 장면을 촬영하였다. 또한, 실제 배우와 디지털 휴먼의 대화 장면을 실시간 엔진을 이용하여 촬영하기 위해 음성과 텍스트 기반 한국어 립싱크 모션 자동 생성 기술을 적용하여 디지털 휴먼의 발화 애니메이션을 사전에 제작해 사용하였다. 우리는 실시간 엔진을 활용하여 LED 기반의 버추얼 프로덕션 환경에서 실제 배우와 디지털 휴먼을 이용한 짧은 드라마 콘텐츠를 제작함으로써 본 촬영 사례에 대하여 검증하였다.

맞춤형 여행 콘텐츠 개발을 위한 OCR 기법을 활용한 영화 속 촬영지 정보 추출 방안 제시 (Study on Extracting Filming Location Information in Movies Using OCR for Developing Customized Travel Content)

  • 박은비;신유빈;강주영
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.29-39
    • /
    • 2020
  • 목적 사회 전반적으로 퍼진 개인의 취향에 대해 존중하는 분위기는 소비 트렌드를 바꾸었다. 그에 따라 여행 산업에서도 소비자 개인의 취향을 반영하는 맞춤형 여행이 새로운 트렌드로 주목받고 있다. 특히 여행 산업 분야 중 하나인 '영화 관광'에 대한 관심이 커지고 있음에 주목하였다. 영화를 시청하며 발생하는 개인의 여행 동기를 맞춤형 여행 제안으로 충족시키고자 하며, 이는 '영화 관광 산업'의 지속적 발전의 촉진제가 될 것으로 기대한다. 설계/방법론/접근 본 연구에서는 시청자가 실제로 방문하고 싶은 영화 속 촬영지 정보를 'OCR'을 통해 추출, 제안하는 방법론을 구현하였다. 먼저, 실시간 이미지 프로세싱 라이브러리인 'OpenCV'를 활용하여 사용자가 선택한 영화 속 장면을 추출 받는다. 또한, 딥러닝 기반의 텍스트 영역 탐지모델인 'EAST 모델'을 활용하여 해당 장면 이미지에서 문자가 위치한 곳을 탐지하여 검출한다. 검출한 이미지는 'OpenCV 내장 함수'를 사용해 전처리하여 인식의 정확도를 높인다. 마지막으로 광학 문자 인식 엔진인 'Tesseract'를 사용하여 이미지 속 문자를 인식 가능한 텍스트로 변환한 후, 'Google Map API'를 통해 실제 위치 정보를 반환한다. 의의 본 연구는 기존의 영화 관광에서 나아가, 4차 산업 기술을 활용한 개인 맞춤 관광 콘텐츠를 제공해준다는 점에서 큰 의의가 있다. 이는 앞으로 여행사와 함께 영화 관광 패키지 상품 개발에 활용될 수 있다. 또한 국내에서 해외로의 유입뿐만 아니라, 해외에서 국내로의 유입에 활용될 가능성 역시 내포하고 있다.

실세계 영상에서 적응적 에지 강화 기반의 MSER을 이용한 글자 영역 추출 기법 (An Extracting Text Area Using Adaptive Edge Enhanced MSER in Real World Image)

  • 박영목;박순화;서영건
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권4호
    • /
    • pp.219-226
    • /
    • 2016
  • 일반 생활 속에서 우리 인간의 눈으로 정보를 인식하고 그 정보를 이용하는 것에는 한계가 없을 만큼 다양하고 방대하다. 그러나 인공지능이 발달한 현재의 기술로도, 인간의 시각 처리 능력에 비하면 턱없이 능력이 부족하다. 그럼에도 불구하고 많은 연구자들은 실생활 속에서 정보를 얻고자 하고 있고, 특히 글자로 된 정보를 인식하는데 많은 노력을 기울이고 있다. 글자를 인식하는 분야에서 일반적인 문서에서 글자를 추출하는 것은 일부 정보처리 분야에서 이용되고 있지만, 실영상에서 문자를 추출하고 인식하는 부분은 아직도 많이 부족하다. 그 이유는 실영상에서는 색깔, 크기, 방향, 공통점 등에서 다양한 특징을 갖고 있기 때문이다. 본 논문에서는 이런 다양한 환경에서 문자 영역을 추출하기 위하여 적응적 에지 강화 기반의 MSER을 적용하여 장면 텍스트 추출을 시도하고, 비교적 좋은 방법임을 실험으로 보인다.

스토리보드 이미지 구성 분석 (The configuration analysis for the storyboard image)

  • 임운주
    • 디지털융복합연구
    • /
    • 제11권4호
    • /
    • pp.403-408
    • /
    • 2013
  • 시나리오를 이미지로 바꾸는 첫 단계인 스토리보드에서 나타난 이미지 구성 분석은 문자 해석에서 출발하여 시각적 현상 의미를 표현한다. 즉 텍스트가 가지고 있는 의미의 속성, 그리고 각 이미지의 상징성, 장면들의 관계에 새로운 의미를 부여하는 것이 스토리보드이다. 스토리보드의 의미작용을 파악하고자 이미지 해석과 내적 발화를 통해 분석하였다. 서술 담론의 해석적 차원에서 담론의 동시성은 다양한 정보를 동시다발적으로 묘사할 수 있고, 이러한 많은 정보들이 하나의 에피소드로 엮어지면서 관계성이 제시되었다. 서술 담론의 사건 시간은 주로 객관적이면서도 설명적으로 묘사되어지는 장면으로 등장인물이나 사건에 대한 정확한 정보를 제시하는 데 유용하게 사용되었다. 서술 담론의 시간 연속은 시간에 따른 흐름의 연속성 아래 다양한 공간들이나 이미지를 나타냄으로 하나의 에피소드로 나타났다. 내적 발화 측면에서 본 충돌 이미지는 각각의 파편화된 이미지들이 나타내는 상징적 효과들이 서로 충돌되거나 연결되어 의미를 생성하는 역할을 하였고, 공간의 연속성은 전혀 다른 공간들의 이미지들을 하나의 맥락으로 이어질 때 다른 상징을 나타내는 역할을 하며, 시간의 연속성 또한 각각의 이미지들이 나타내는 상징들을 시간의 흐름 속에서 해석하여 다른 상징성을 만들어 낸다. 이러한 연구 분석 결과를 보면 서술 담론 측면에서는 내러티브 구조에 따른 서술 담론을 표현하지만 내적 발화는 어떠한 서술적 구조가 아닌 관객이 가지고 있는 경험과 정보력을 바탕으로 그 시대에 널리 알려져 있는 문화적 시대적 배경을 통해 해석되어진다. 내적 발화에서 나타난 이미지들은 서로 연관성이 없는 장면들을 충돌시켜 증폭시키고, 다시 재해석하게 하여 총체적 상징성을 드러내는 것으로 나타났다.

MPEG-4 LASeR PMSI 기술에 기반한 리치미디어 프레임워크 설계 및 구현 (Rich Media Framework based on MPEG-4 LASeR PMSI Technique)

  • 이인재;송승원;이한규;차지훈
    • 방송공학회논문지
    • /
    • 제15권2호
    • /
    • pp.248-264
    • /
    • 2010
  • 본 논문은 MPEG-4 LASeR (Lightweight Application Scene Representation)의 PMSI (Presentation & Modification Structured Information) 표준 기술에 기반을 둔 효율적인 리치미디어 프레임워크를 제안한다. 리치미디어 서비스란, 기존 AV 중심의 단순시청형 미디어 서비스를 넘어서 이용자에게 동적인 업데이트나 대화형 기능을 추가로 제공하고 텍스트, 오디오, 동영상등의 다양한 미디어를 포함하는 복합적인 형태의 미디어 서비스를 의미한다. 국제표준 규격인 MPEG-4에는 리치미디어 서비스를 제공 할 수 있는 LASeR를 포함하고 있다. 근래에 MPEG에서는 LASeR표준에 구조화된 정보의 표현 및 수정 방법인 PMSI 기술을 추가하였다. 이 기술은 장면서술정보에서 구조화된 정보의 일부분을 참조하여 장면에 효과적으로 표현해주는 기술이다. 구현된 리치미디어 애플리케이션에서는 MPEG-4 LASeR표준의 PMSI기술을 이용하여 이용자들에게 '위젯'과 같은 서비스를 제공한다. 제안된 애플리케이션은 PMSI 기술을 이용하여 PI(Presentation Information) 에서 SI (Structured Information)를 참조하고, SI를 장면에 표현해준다. 본 논문에서는 제안된 프레임워크에 활용된 기술적 구성요소들을 서술하고, 실험결과를 통하여 애플리케이션 프레임워크의 구조를 제시하며, 적용 가능한 서비스를 제안한다.

객체 기반 MPEG-4 재생 기술의 PDA 적응 기법 (Adaptation Techniques of an Object-based MPEG-4 Player to PDA)

  • 김남영;김상욱
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권2호
    • /
    • pp.220-230
    • /
    • 2006
  • 컴퓨팅 기술과 다양한 모바일 디바이스의 발전에 따라 모바일 환경에서의 멀티미디어 콘텐츠에 대한 이용도가 증가하고 있다. 현재 PDA에서 제공되는 멀티미디어 콘텐츠는 비디오, 오디오로 이루어진 콘텐츠로 제한되어 있다. MPEG-4는 비디오, 오디오, 이미지, 텍스트, 2차원 객체 등의 멀티미디어 데이타를 효율적으로 저장, 전송 및 표현하기 위한 국제 표준으로 다양한 사용자 상호 작용과 여러 종류의 객체들로 장면을 구성할 수 있다. 또한 현재 대부분의 MPEG-4 콘텐츠는 대부분 데스크 탑 용으로 저작되었기 때문에 PDA 환경에서 제한된 메모리, GUI 등에서 정상적으로 재생할 수 없다. 따라서 본 논문에서는 객체 기반의 MPEG-4 표준을 이용하여 제한된 리소스를 가진 PDA 환경에서 다수의 객체로 장면을 구성하고 사용자 상호 작용이 가능한 MPEG-4 콘텐츠를 재생하기 위한 PDA 적응 기법에 관하여 기술한다. 제안하는 기법은 크게 3가지로 물리적 적응 기법, 리소스 적응 기법, 이벤트 적응 기법으로 나누어진다. 물리적 적응은 재생기 프리젠터에서 이루어지는 부분으로 콘텐츠 저작 환경과 재생 환경의 물리적 차이에 대한 적응 기법이고, 이벤트 적응은 PDA에서 지원하지 않는 이벤트에 대하여 PDA에 적합하게 변형하는 부분이다. 또한 리소스 적응은 제한적인 리소스를 제공하는 PDA에서 MPEG-4 콘텐츠 재생률을 높이기 위한 기법이다. PDA에서의 MPEG-4 재생기는 제안하는 PDA 적응 기법을 이용하여 객체 기반의 MPEG-4 콘텐츠를 정상적으로 재생할 수 있다.

영화 ≪신과 함께-죄와 벌≫속 공간의 구현양상과 그 의미 (The space implementation of movie With gods and the meaning)

  • 이향애;김신정
    • 기호학연구
    • /
    • 제54호
    • /
    • pp.177-203
    • /
    • 2018
  • 영화 ${\ll}$신과 함께-죄와 벌${\gg}$을 대상으로 관객이 영화의 메시지를 효과적으로 전달받을 수 있는 일종의 구성 원리가 있음을 밝히고자 했다. 논의를 위해 '공간'을 메타언어로 하여 서사구조를 분석했다. 구체적으로, 시간을 중심으로 구성되는 서사를 해체하여 공간의 구성으로 전환해 살폈고, 공간에서 벌어지는 사건 양상과 인물의 공간 이동 양상에 주목했다. 사건들은 등장인물들이 일곱 개의 지옥을 이동하는 가운데 벌어지며, 이 일곱 개의 지옥은 서로 연속되기보다는 독립적으로 존재하고 있다. 개별적인 지옥에서 벌어지는 개별적인 사건들은 반복되는 양상을 드러냈다. 이러한 반복적인 형식과 반복적인 내용은 하나의 패턴이 되어 수용자에게 '외부 자극'으로 작용하고 수용자 내부에서 '자기커뮤니케이션'을 발생시키게 된다. 예술텍스트로 인한 감동은 텍스트가 전달하는 맥락과 메시지를 수용자가 적극적으로 받아들이는 상황에서 발생한다. 즉, 감동의 원리는 수용자가 적극적으로 메시지를 받아들이게 하는 '설득'을 기반으로 한다. 반복되는 정보는 수용자의 심상에서 자기커뮤니케이션을 일으켜 '또 다른 정보'가 된다. 달리 말해, 영화가 직접적으로 전달하는 메시지 뿐 아니라 '반복성' 그 자체도 수용자에게 자극이 되어 영화 속 장면을 통해 스스로의 삶을 성찰하게 만든다. 요컨대, 텍스트적 세계가 구현해내는 공간의 분할과 인물의 이동, 이로 인한 반복성은 반복적인 자극이 되어 관객에게 개인적 성찰의 시간을 만들어내고, 바로 이것이 이 영화로부터 메시지가 전달되는 원리라고 할 수 있다.