• 제목/요약/키워드: Image Caption

검색결과 51건 처리시간 0.027초

확장적 블록 정합 방법과 영역 보상법을 이용한 비디오 문자 영역 복원 방법 (A Method for Recovering Text Regions in Video using Extended Block Matching and Region Compensation)

  • 전병태;배영래
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.767-774
    • /
    • 2002
  • 기존의 원영상 복원 기술은 주로 신호 처리 분야에서 영상의 형성(formation), 저장 및 통신상에서 발생되는 왜곡 현상을 복원하는 연구가 많이 이루어 졌다. 원 영상 복원과 관련된 기존의 연구는 블록 정합(block matching algorithm)을 이용한 원영상 복원 방법이 있다. 이 방법은 오 정합(incorrect matching)이 발생하기 쉽고, 오 정합 시 에러가 전파되는 문제점이 있다. 그리고 장면 전환이 2회 이상 발생될 경우 장면 전환 지점과 지점 사이의 복원이 불가능하다는 문제점이 있다. 본 논문에서는 기존의 문제점들을 해결하기 위하여 확장적 블록 정합 방법(EBMA: Extended Block Matching Algorithm)과 영역 보상법(Region compensation method)을 이용한 원영상 복원 방법을 제안하고자 한다. 원영상 복원에 사용하기 위하여 비디오 사전 정보(장면 전환 정보, 카메라 모션 정보, 캡션 영역 정보)를 추출한다. 추출된 캡션 영역 정보를 이용하여 캡션 문자의 구성 요소 정보를 추출한다. 추출된 비디오 사전 정보를 이용하여 복원의 방향성을 결정하고, 복원의 방향성에 따라 문자의 구성 요소 단위로 확장적 블록 정합 방법과 영역 보상법을 이용하여 원영상 복원을 수행한다. 실험결과 확장적 블록 정합 방법은 빠른 물체의 움직임이나 복잡한 배경에 영향을 받지 않고 복원이 잘 되는 것을 알 수 있었다. 참조할 원영상이 없이 원영상 복원을 수행하는 영역 보상법의 복원 결과 또한 좋음을 볼 수 있었다.

비디오 자막 영역 원영상 복원 후 자막 교환 방법 (A Method for Recovering Image Data for Caption Regions and Replacing Caption Text)

  • 전병태;한규서;배영래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.743-746
    • /
    • 2001
  • 멀티미디어 정보 중 비디오 데이터는 정보량이 많기 때문에 자동화된 비디오 영상 처리 기술이 필요하다. 시청자의 이해와 시청의 편의성을 제공하기 위하여 대부분 비디오에 자막을 삽입하게 된다. 외국 방송물 및 영화에 삽입된 다른 언어 자막을 편집 과정에서 자막으로 교환 할 필요성이 종종 있게 된다. 기존의 방법들은 자막 부분을 충분히 포함하는 일정 영역에 특정 색상을 채운 후 새로운 자막을 삽입하게 된다. 기존 방법의 문제점은 많은 영역에 대해 비디오 영상 정보를 손실 시킴으로써 시청자에게 시청의 불편을 초래하고 자막 교환의 비 효율성과 부 자연스러움을 발생시킨다. 본 논문에서는 기존 방법의 문제점을 극복하기 위하여 자막 영역을 원영상으로 복원한 후 다른 자막으로 교환하는 방법을 제안하고자 한다. 원영상 복원을 위하여 비디오 정보와 BMA(Block Matching Algorithm)를 이용한 원영상 복원 방법을 제안하고, 복원된 영역에 다른 자막으로 교환함으로써 효과적인 자막 교환 방법을 제안하고자 한다. 실험 결과 원영상 복원을 이용한 자막 교환 방법은 기존 방법에 비해 자연스럽고 효과적인 교환 방법임을 볼 수 있었다.

  • PDF

포토저널리즘 사진과 캡션의 의미작용에 대한 연구 (The Signification of Words and Photography in Photojournalism)

  • 정홍기
    • 한국언론정보학보
    • /
    • 제18권
    • /
    • pp.231-268
    • /
    • 2002
  • 본 연구는 하나의 주제를 다룬 다섯 장의 사진과 캡션을 통해, 포토저널리즘의 구성단위인 사진과 글에 대한 수용자의 해독양상을 분석한 것이다. 본 논문의 연구방법은 민속지학적 방법과 의미분별법을 사용하였다. 분석은 기호의 의미작용과 해독의 의미작용을 분리시켜, 기호와 해독의 관계를 고찰할 수 있는 기호학적 방법론을 채택하였다. 위와 같은 방법을 통해 연구자는 다음과 같은 결과를 얻을 수 있었다. 첫번째, 하나의 의미로 고정되지 않고 다의성을 띤 사진이미지에 캡션이 첨가됨으로 수용자의 해독에 변화가 있었다. 두번째, 해독에있어 수용자의 문화적 배경이 중요한 변수로 작용했다. 세번째, 포토저널리즘 영역에서 사진만으로는 사실을 재현하기 어렵다는 것을 알 수 있었다. 즉 수용자의 문화적 코드를 바탕으로 한글이 들어감으로써, 포토저널리스트와 수용지간의 보다 성공적인 커뮤니케이션이 이루어졌다. 본 논문에서 연구자는 포토저널리스트가 재현한 현실과 그것을 해독하는 수용자간의 커뮤니케이션의 과정을 보여주고자 했고 이것이 성공적인 커뮤니케이션을 위한 기본 전제에 대한 고찰이 되었으면 하는 바램이다.

  • PDF

내용 기반 검색을 위한 뉴스 비디오 키 프레임의 특징 정보 추출 (Extraction of Features in key frames of News Video for Content-based Retrieval)

  • 정영은;이동섭;전근환;이양원
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2294-2301
    • /
    • 1998
  • 본 논문은 방송사별 각 장면의 중요한 내용의 성격을 갖고 있는 특징을 방송사별 뉴스 비디오에서 추출하기 위한 것이다. 추출하고자 하는 특징의 요소는 방송사 구별을 위한 방송사 아이콘과 각 장면의 대표적 성격을 갖고 있는 아이콘, 각 장면내의 주요 내용을 대표하는 정보인 자막의 문장 추출이다. 본 논문에서 제안하는 방법은, 비디오 프레임으로 입력되는 영상을 YIQ칼라 공간으로 전환한 뒤 히스토그램 평활화 방법을 이용하여 입력 영상의 영역 구분을 명확하게 한 후에, 영상의 에지를 추출하고 수직과 수평선에 기반한 에지 히스토그램의 비교에 의하여 원하는 특징을 추출하는 것이다. 또한 히스토그램 차이값에 의해서 선택된 키 프레임들 중에서 뉴스 아이콘을 추출하고 아이콘에 의하여 각 장면을 분할 할 수 있는 방법을 제안하였다. 본 논문에서는 칼라 히스토그램이나 웨이블릿, 또는 객체의 움직임에 기반한 복잡한 방법대신 에지 히스토그램 비교 방법을 사용하여, 알고리즘을 간소화함으로써 계산 시간을 단축하였으며 특징 추출에도 좋은 결과를 나타냈다.

  • PDF

뉴스 비디오 자막 추출 및 인식 기법에 관한 연구 (Study on News Video Character Extraction and Recognition)

  • 김종열;김성섭;문영식
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.10-19
    • /
    • 2003
  • 비디오 영상에 포함되어 있는 자막은 비디오의 내용을 함축적으로 표현하고 있기 때문에 비디오 색인 및 검색에 중요하게 사용될 수 시다. 본 논문에서는 뉴스 비디오로부터 폰트, 색상, 자막의 크기 등과 같은 사전 지식 없이도 자막을 효율적으로 추출하여 인식하는 방법을 제안한다. 문자 영역의 추출과정에서 문자영역은 뉴스 비디오의 여러 프레임에 걸쳐나 나오기 때문에 인길 프레임의 차영상을 통해서 동일한 자막 영역이 존재하는 프레임을 자동적으로 추출한 후, 이들의 시간적 평균영상을 만들어 인식에 사용함으로써 인식률을 향상한다. 또한, 평균 영상의 외각선 영상을 수평, 수직방향으로 투영한 값을 통해 문자 영역을 찾아 Region filling, K-means clustering을 적용하여 배경들을 완벽하게 제거함으로써 최종적인 자막 영상을 추출한다. 자막 인식과정에서는 문사 영역 추출과정에서 추출된 글자영상을 사용하여 white run, zero-one transition과 같은 비교적 간단한 특징 값을 추출하여 이를 비교함으로써 인식과정을 수행한다. 제한된 방법을 다양한 뉴스 비디오에 적용하여 문자영역 추출 능력과 인식률을 측정한 결과 우수함을 확인하였다.

원 영상 복원을 위한 TV 자막 특성 분석에 관한 연구 (A Study on Analyzing Caption Characteristic for Recovering Original Images of Caption Region in TV Scene)

  • 전병태
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.177-182
    • /
    • 2010
  • 자막의 원영상 복원은 동영상 재 사용성이란 측면에서 많은 연구가 진행되어 왔다. 외국에서 수입된 동영상의 경우 외국어 자막이 삽입된 경우가 종종 발생하며 자막에 삽입된 외국어를 자국어로 대치할 필요가 종종 발생한다. 원영상 손실없이 자연스런 자막교환을 위해서는 자막 부분의 원영상 복원이 필요하며, 자막의 원영상 복원은 동영상 재 사용성이란 측면에서 많은 연구가 진행되어 왔다. 이러한 원영상 복원의 중요성에 불구하고 복원의 대상이 되는 자막 특성에 대한 체계적인 분석이 이루어 지지 않는 문제점이 있다고 볼 수 있다. 본 논문에서는 TV 프로그램 장르별 구분 방법을 학계, 방송사, 방송기구별로 분류 조사하고, 각 장르별 자막의 출현 빈도, 자막 내용의 중요도 및 복원의 필요성에 대하여 분석한다. 복원의 필요성이 크게 인식되는 자막에 대한 특성을 분석하고 그 정보를 복원 정보로 사용한다.

2009 개정 과학교육과정에 따른 초등학교 과학 교과서의 읽기자료 분석 (Analysis of the Reading Materials in Elementary School Science Textbooks developed under the 2009 Revised National Science Curriculum)

  • 고한중;석종임;강석진
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제36권2호
    • /
    • pp.129-142
    • /
    • 2017
  • In this study, the characteristics of the reading materials in elementary school science textbooks developed under the 2009 revised National Science Curriculum were investigated. The criteria for classifying the reading materials were the types of topic, purpose, students' activity, and presentation. The visual images in the reading materials were also analyzed from the viewpoint of type, role, caption type, and proximity type. The results indicated that the number of the reading materials in the 2009 revised science textbooks decreased compared to that of the 2007 revised science textbooks. It was also found that the frequencies of the reading materials expanding concepts of the text and/or requiring corresponding students' inquiry increased. More visual images were used in the reading materials of the 2009 revised science textbooks. However, several limitations were still found to exist; most visual images were illustration and/or picture; many visual images were presented without a caption; there was a problem in the proximity of visual image to text.

MST를 이용한 문자 영역 분할 방법 (A Method for Character Segmentation using MST(Minimum Spanning Tree))

  • 전병태;김영인
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.73-78
    • /
    • 2006
  • 기존의 문자 영역 추출 방법은 전체 영상으로부터 컬러 영역 분할이나 프레임 차 방법을 이용하였다. 이들 방법은 휴리스틱에 많이 의존하므로 추출하려는 문자의 사전 정보를 가지고 있어야한다는 점과 구현에 많은 어려움이 존재한다. 본 논문에서는 휴리스틱한 부분을 줄이고 알고리즘을 단순화한 방법을 제안하고자 한다 문자의 지형학적 특징점을 추출하고 이 점들을 MST(Minimum Spanning Tree)를 형성하여 문자의 후보 영역을 추출한다. 문자 영역을 후보 영역의 검증을 통하여 추출한다. 실험 결과 문자의 후보 영역 추출율은 100%이었으며 최종 문자 영역 추출율은 98.2%이었다. 또한 복잡한 영상에서 존재하는 문자 영역도 잘 추출됨을 볼 수 있다.

  • PDF

패션디자인 DB 개발

  • 김정회
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.358-375
    • /
    • 1997
  • 가. 패션 디자인 기초 정보 수집/분석 - 국내외에 산재하는 패션디자인 정보의 기초자료를 입수 - 디자이너별/ 컬렉션별/주제별로 분류 - 가공 나- 패션디자인정보의 멀티미디어 DATA BASE개발 - 화상(IMAGE)/해설(TEXT)/ SOUND의 복합 DATA BASE SYSTEM - PC통신망 서비스를 위한 DATA개발 다. 패션디자인 관련자료의 DB화 - 패션디자인 이론서 - 패션디자인 컨테스트 / 이벤트 정보 - 패션디자인 교육기관 정보 - 패션브랜드 정보 (내셔널 / 디자이너 / 수입) 라. DATA BASE 공급 서비스 - PC통신망을 통한 서비스(DOWN LOAD 가능) - 디자인작품 IMAGE 및 CONCEPT/ DETAILS/ CAPTION - PC통신을 이용 디자인 인력 구인/구직정보 활용 - 패션디자인 해외유학 정보 마. Inter-NET 서비스 - Inter-NET을 이용 국내디자이너작품 해외 소개(중략)

  • PDF

Caption Extraction in News Video Sequence using Frequency Characteristic

  • Youglae Bae;Chun, Byung-Tae;Seyoon Jeong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.835-838
    • /
    • 2000
  • Popular methods for extracting a text region in video images are in general based on analysis of a whole image such as merge and split method, and comparison of two frames. Thus, they take long computing time due to the use of a whole image. Therefore, this paper suggests the faster method of extracting a text region without processing a whole image. The proposed method uses line sampling methods, FFT and neural networks in order to extract texts in real time. In general, text areas are found in the higher frequency domain, thus, can be characterized using FFT The candidate text areas can be thus found by applying the higher frequency characteristics to neural network. Therefore, the final text area is extracted by verifying the candidate areas. Experimental results show a perfect candidate extraction rate and about 92% text extraction rate. The strength of the proposed algorithm is its simplicity, real-time processing by not processing the entire image, and fast skipping of the images that do not contain a text.

  • PDF