• 제목/요약/키워드: 자막 탐지

검색결과 10건 처리시간 0.025초

I 프레임에 기반한 MPEG 압축영상에서의 자막 탐지 (Localization of captions in MPEG compression images based on I frame)

  • 유태웅
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권11호
    • /
    • pp.1465-1476
    • /
    • 2001
  • 실시간 자막 탐지는 비디오 인덱싱, 텍스트의 이해, 자동 자막 탐지시스템 등 수많은 응용 분야에서 요구된다. 본 논문은 I 프레임을 기반으로 MPEG 압축 동영상에서 자막을 탐지하는 알고리즘을 제안한다. 제안한 알고리즘은 자막 텍스춰 정보와 색체 정보를 사용하여 배경 영상으로부터 자막을 정확히 분리한다. 기존 알고리즘들은 압축 동영상으로부터 텍스트 영역을 추출하기 전에 압축을 먼저 해제하는데 제안한 알고리즘은 DCT 압축 도메인에서 직접 자막 텍스트 영역을 탐지한다.

  • PDF

디지털 비디오를 위한 획기반 자막 추출 알고리즘 (A Stroke-Based Text Extraction Algorithm for Digital Videos)

  • 정종면;차지훈;김규헌
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.297-303
    • /
    • 2007
  • 본 논문에서는 디지털 비디오를 위한 획기반 자막 추출 알고리즘을 제안한다. 제안된 알고리즘은 자막 탐지, 자막 위치 찾기 자막 분리 단계와 분리된 자막에 대한 기하학적 검증 과정으로 구성된다. 자막 탐지 단계는 연속적으로 입력되는 프레임 중 자막이 존재하는 프레임을 찾는 단계로써, 주어진 프레임으로부터 자막이 될 가능성이 높은 점, 즉 씨앗점을 추출한 다음 씨앗점에 대하여 모폴로지 연산을 수행한다. 자막 위치 찾기 단계는 자막이 존재하는 프레임에서 자막의 위치를 찾는 단계로써, 씨앗점을 포함하는 에지에 대한 모폴로지 연산과 프로젝션을 통해 수행된다. 자막 분리 단계에서는 자막과 배경의 색상 분포와 복잡한 배경을 고려하여 자막을 강건하게 분리한다. 마지막으로 자막에 대한 사전 정보를 이용하여 분리된 자막에 대한 기하학적 검증 과정을 수행하여 최종 결과를 얻는다.

시공간 정보를 이용한 자막 탐지 및 향상 기법 (A Method for Text Detection and Enhancement using Spatio-Temporal Information)

  • 정종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.43-50
    • /
    • 2009
  • 디지털 비디오에서 텍스트 정보는 비디오 데이터의 시청각적인 정보를 보강하고 부가 정보를 제공하기 때문에 방대한 멀티미디어의 내용을 예측할 수 있는 중요한 단서를 제공한다. 본 논문에서 제안된 방법은 주어진 영상열로부터 자막의 획 특징을 이용하여 자막을 탐지하고, 프로젝션을 이용하여 자막의 위치를 찾는다. 찾아진 자막을 포함하는 바운딩박스에 대한 기하학적인 검증을 거친 후, 서로 인접하는 프레임에 있는 바운딩박스 중 공간적으로 동일한 위치의 바운딩박스에 대한 MAD를 이용하여 바운딩박스를 추적하고, 시간적 중복성을 이용하여 바운딩박스 영역의 화질을 향상시킨다. 다양한 비디오에 대한 실험 결과는 제안된 방법의 타당성을 보인다.

Sentence-BERT를 활용한 YouTube 가짜뉴스 탐지 시스템 연구 (A Study On YouTube Fake News Detection System Using Sentence-BERT)

  • 김범중;허지혜;이협건;김영운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.667-668
    • /
    • 2023
  • IT 기술의 발달로 인해 뉴스를 제공하는 플랫폼들이 다양해 졌고 최근 해외 인터뷰 영상, 해외 뉴스를 Youtube Shorts형태로 제작하여 화자의 의도와는 다른 자막을 달며 가짜 뉴스가 생성되는 문제가 대두되고 있다. 이에 본 논문에서는 Sentence-BERT를 활용한 YouTube 가짜 뉴스 탐지 시스템을 제안한다. 제안하는 시스템은 Python 라이브러리를 사용해 유튜브 영상에서 음성과 영상 데이터를 분류하고 분류된 영상 데이터는 EasyOCR을 사용해 자막 데이터를 텍스트로 추출 후 Sentence-BERT를 활용해 문자 유사도를 분석한다. 분석결과 음성 데이터와 영상 자막 데이터가 일치한 경우 일치하지 않은 경우보다 약 62% 더 높은 문장 유사도를 보였다.

DCT계수와 천이지도 분석을 이용한 개선된 영상 내 자막영역 검출방법 (An Improved Method for Detecting Caption in image using DCT-coefficient and Transition-map Analysis)

  • 안권재;주성일;김계영;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.61-71
    • /
    • 2011
  • 본 논문은 DCT계수와 천이지도 분석을 이용하여 영상 내 자막영역을 검출하는 방법에 대해 제안한다. 기존 DCT계수 분석방법을 이용한 문자영역탐지 방법은 검출률은 높으나 오검출률이 매우 높은 단점이 있고, 천이지도를 이용한문자영역 탐지 방법은 임계값이 정적이기때문에 문자영역 검증단계에서 실제문자영역이 기각되는 일이 빈번히 발생한다. 이러한 문제점을 해결하기 위해 DCT계수 분석방법을 이용하여 유망문자영역맵을 작성하고 이를 천이지도를 이용한 문자영역탐지 방법에 적용하여 임계값을 단계별로 정한다. 그 결과로서 DCT계수 분석을 이용한 문자영역검출방법에 비해 오검출률이 크게 감소하였으며, 기존 천이지도를 이용한 문자영역검출 방법보다 검출률이 크게 향상되었다.

전문용어 탐지와 해석 모델: 한국어 의학용어 중심으로 (Detecting and Interpreting Terms: Focusing Korean Medical Terms)

  • 염하람;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.407-411
    • /
    • 2022
  • 최근 COVID-19로 인해 대중의 의학 분야 관심이 증가하고 있다. 대부분의 의학문서는 전문용어인 의학용어로 구성되어 있어 대중이 이를 보고 이해하기에 어려움이 있다. 의학용어를 쉬운 뜻으로 풀이하는 모델을 이용한다면 대중이 의학 문서를 쉽게 이해할 수 있을 것이다. 이런 문제를 완화하기 위해서 본 논문에서는 Transformer 기반 번역 모델을 이용한 의학용어 탐지 및 해석 모델을 제안한다. 번역 모델에 적용하기 위해 병렬말뭉치가 필요하다. 본 논문에서는 다음과 같은 방법으로 병렬말뭉치를 구축한다: 1) 의학용어 사전을 구축한다. 2) 의학 드라마의 자막으로부터 의학용어를 찾아서 그 뜻풀이로 대체한다. 3) 원자막과 뜻풀이가 포함된 자막을 나란히 배열한다. 구축된 병렬말뭉치를 이용해서 Transformer 번역모델에 적용하여 전문용어를 찾아서 해석하는 모델을 구축한다. 각 문장은 음절 단위로 나뉘어 사전학습 된 KoCharELECTRA를 이용해서 임베딩한다. 제안된 모델은 약 69.3%의 어절단위 BLEU 점수를 보였다. 제안된 의학용어 해석기를 통해 대중이 의학문서를 좀 더 쉽게 접근할 수 있을 것이다.

  • PDF

이중구조 무기형광 함침막 제조 및 방사성핵종 탐지능력의 분석 (Preparation and Radionuclide Detection Analysis of Inorganic Fluor Impregnated Double-layered Membranes)

  • 이근우;서범경;박진호;남석태;한명진
    • 멤브레인
    • /
    • 제12권4호
    • /
    • pp.240-246
    • /
    • 2002
  • 방사선과의 상호작용에 의하여 섬광이 발생하는 무기형광체(inorganic fluor)인 cerium activated yttrium silicate(CAYS)를 폴리설폰 고분자막에 함침시킴으로써, 형광 용액의 도움 없이 방사능 오염도를 측정할 수 있는 새로운 측정막을 제조하였다. 막의 제조는 두 가지 공정으로 나누어진다. 우선 고분자와 용매의 균일한 1차 제막용액을 유리판 위에 제막 후 용매증발을 통해 폴리설폰 고분자막이 생성되도록 하였다. 고형화된 폴리설폰 필름 표면에 CAYS가 분산된 고분자 제막용액을 2차로 도포시킨 후, 비용매 욕조에 침지시키는 상전환 공정을 이용하거나 용매의 증발을 통한 유리화에 의해 2차 용액의 고형화를 유도함으로써 함침막을 제조하였다. 이렇게 제조된 막의 형상은 치밀한 구조를 지니는 고분자 지지체와 이에 완전히 고착된 CAYS함침막의 이중구조를 지니게되며, 지지체 부분은 막의 안정성을 2차 제막에서 생성된 부분은 기능성의 향상을 이룰 수 있는 구조적 특성을 지닌다. 제조된 함침막에 방사성핵종을 직접 도포하여 방사성핵종의 탐지 특성을 측정하였을 때 효율적인 탐지 특성을 지니는 것으로 확인되었다.

저해상도 하수관거의 균열 탐지를 위한 영상처리 알고리즘 (Image Processing Algorithm for Crack Detection of Sewer with low resolution)

  • 손병직;전준용;허광희
    • 한국산학기술학회논문지
    • /
    • 제18권2호
    • /
    • pp.590-599
    • /
    • 2017
  • 국내에서 하수관로 탐사장치는 200만 화소 이상의 고해상도 디지털 카메라를 이용한 제품이 개발되어 있으나 30만 화소 이하의 장치가 대부분 사용되고 있다. 특히, 10만화소 이하의 장치가 아직도 많이 사용되고 있어, 영상처리를 위한 환경이 매우 열악하다. 본 연구에서 다루는 하수관 영상은 매우 저해상도($240{\times}320$ = 76,800화소)로 균열탐지가 매우 어렵다. 국내에서 이러한 저해상도 하수관거 영상이 대부분이기 때문에, 이를 연구대상으로 선택하였다. 이러한 저해상도 영상으로 하수 관거의 균열을 자동으로 탐지하는 기법을 디지털 영상처리 기술을 이용하여 연구하였다. 총8단계를 거쳐 균열을 자동으로 탐지하는 프로그램을 개발하였으며, 기본적으로 Matlab 프로그램의 함수를 이용하였다. 2단계에서 최적의 임계값을 찾는 알고리즘과 5단계에서 균열을 판단하는 알고리즘을 개발하였다. 2단계는 자막이 흰색이기 때문에 자막이 없는 원래 영상보다 Otsu's 임계값(threshold)이 높게 계산이 되는 점에 착안하여 Otsu 임계값을 시작으로 0.01씩 감소시키면서 최적의 임계값을 찾는 방법 알고리즘이며, 5단계는 길이가 10mm(40픽셀) 이상이고 폭이 1mm(4픽셀) 이상으로 판단하여, 균열을 탐지하는 알고리즘이다. 해석 결과 매우 저해상도 영상임에도 불구하고 균열 탐지 결과가 우수한 것으로 판단된다.

방사능탐지용 CAYS 함침 이중구조 폴리설폰막의 형상 및 특성에 제막공정의 습도가 미치는 영향 (Vapor Exposure Effect of a Casting Solution on the Embedding and Radioactive Detection of CAYS in Double-layered Polysulffne Film)

  • 한명진;남석태;이근우;서범경
    • 멤브레인
    • /
    • 제15권3호
    • /
    • pp.198-205
    • /
    • 2005
  • 방사능 오염도 측정에 사용하기 위한 이중구조 고분자막이 폴리설폰과 세륨활성화된 이트륨실리케이트(CAYS)를 이용하여 제조되었다. 제조된 막은 순수 고밀도 고분자 지지층과 이에 제막된 고분자 용액의 상전환 공정에 의해 고형화된 CAYS 함침 활성층의 이중구조로 구성된다. 제막공정에서 대기방치 공정이 생략되었을 때 CAYS를 포함하는 활성층은 전형적인 비대칭 구조를 지니며, CAYS 입자들이 고분자 구조 사이에 박혀있는 형상을 지닌다. 제막공정에서 대기에 방치하는 시간이 증가할수록 막의 형상은 스폰지 구조를 띠며 CAYS는 고분자 구조로부터 분리되어 막 내부에 셀 같은 공간에 밀집되어 존재함을 보였다. 한편, 두 충 사의 계면형상은 고분자 고형화 과정에서의 상전환 속도와 밀접한 관련되었으며, 대기방치 시간의 증가에 따라 계면의 구분이 뚜렷하게 나타나지 않았다. 방사능 탐지 특성에서 스폰지 구조를 지니는 막의 고분자 구조는 방사성핵종이 통과할 수 없는 밀집된 형상을 지니면서 탐지효율의 감소를 초래하는 것으로 나타났다.

저해상도 인쇄체 한글 영상 인식을 위한 자소 분할 방법 (Grapheme Segmentation Method for Low Quality Printed Hangul Text Recognition)

  • 이성훈;조규태;김진식;김진형;정철곤;김상균;문영수;김지연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.382-384
    • /
    • 2006
  • 본 논문에서는 저해상도 한글 영상을 자소 단위로 분리하는 방법을 제안한다. 비디오 자막이나 저해상도 스캔 영상의 경우 자소간 획이 접촉되거나 잡영이 많이 포함되어 기존의 자소 분할 방법으로는 한계가 있다. 한자 문자열을 문자 단위로 분할하는데 사용된 비선형 분할 경로 알고리즘을 한글 낱자 영상에 적용하여 자소 단위로 분할한다. 기존의 분할 경로 알고리즘을 한글 자소 분할에 효과적으로 적용하기 위해서 우세점 탐지 알고리즘을 이용하여 자소간 접촉점을 찾고 이를 바탕으로 생성된 분할 경로에 따라 여러 개의 자소 후보 영상이 생성된다. 자소 영상을 자소 인식기로 인식한 결과 높은 인식률을 보이는 것을 실험을 통하여 확인하였다.

  • PDF