• 제목/요약/키워드: Caption

검색결과 167건 처리시간 0.025초

골프 동영상에서의 강건한 선수명 인식 (Robust Recognition of a Player Name in Golf Videos)

  • 정철곤;김중규
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.659-662
    • /
    • 2008
  • 스포츠의 경기에서 비디오 문자는 득점이나 선수명과 같은 중요한 정보를 제공한다. 본 논문에서는 골프 동영상에서 선수명 정보를 강건하게 인식하는 방법을 제안한다. 골프 경기의 경우, 원하는 선수의 플레이 장면을 검색하고자 하는 요구가 많은 스포츠 종목이다. 이러한 기능을 구현하기 위해 골프 동영상에 포함된 문자 정보를 이용한다. OCR 에 의해 검출된 문자 정보를 인식한 후, 사전 등록된 선수명 DB 를 이용해 선수명 정보를 인식한다. 이렇게 획득된 선수명 정보를 이용해 원하는 선수의 플레이 장면을 검색할 수 있도록 하였다. 다양한 골프 동영상에 대하여 실험을 수행한 결과, 본 논문에서 제안한 방법이 강건하게 선수명을 인식하는 것을 확인하였다.

  • PDF

의사결정 트리를 이용한 한글 자막 추출 (Korean Caption Extraction with Decision Tree)

  • 정제희;이승훈;김재광;이지형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.527-532
    • /
    • 2008
  • 자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.

  • PDF

PVS 유도체에 대한 L-Cysteine의 친핵성 첨가반응에 관한 연구 (A Study on the Nucleophilic Addition Reaction of L-cysteine for PVS)

  • 이기창;이광일;윤철훈;황성규;공승대
    • 한국응용과학기술학회지
    • /
    • 제12권2호
    • /
    • pp.99-105
    • /
    • 1995
  • Phenylvinylsulfone derivatives were synthesized by Kirners condition. The structure of these compounds were ascertained by means of ultraviolet, melting point, IR and $^1H-NMR$ spectra. The nucleophilic addtion reaction kinetics of L-cysteiene for phenylvinylsulfone was investigated by ultraviolet spectrophotometery in 40% $EtOH-H_2O$ at $25^{\circ}C$. The rate equations which were applied over a wide pH $1.0{\sim}13.0$ range. On the basis of general base catalysis and confirmation of addtion reaction product, the nucleophilic addtion reaction kinetics of L-cysteiene for phenylvinylsulfone were measured by the pH change. From the result of the above caption, a plausible nucleophilic addtion reaction mechanism of L-cysteiene for phenylvinylsulfone was proposed. These compounds may by used ad the starting materials for the preparation of the engineering plastics or the germicide.

소장데이터용 MARC 포맷에 관한 연구 (A Study on the MARC Format for Holdings Data)

  • 오동근
    • 한국문헌정보학회지
    • /
    • 제33권3호
    • /
    • pp.63-86
    • /
    • 1999
  • 본고는 소장데이터용 MARC 포맷의 일반적 특성과 개발현황에 대해 살펴보고, 아울러 MARC 포맷의 3요소로 일컬어지는 구조와, 내용표지법, 레코드의 내용을 이미 개발된 USMARC과 KORMARC 포맷을 중심으로 분석하였다. 레코드의 구조와 내용표지법은 서지용 및 전거용포맷과 대부분 동일하다. 데이터필드는 기본적으로 기능별블록으로 구분되어 있으나, 현재는 0XX, 5XX, 8XX 필드만이 사용되고 있다. 008 필드의 레코드 내용에는 수서와 보유정책 등 자료의 소장에 관련된 요소들이 추가되어 있다. 가변길이필드의 내용은 번호와 코드, 주기, 소재와 접근, 소장데이터 필드 등으로 구성되며, 특히 소장데이터필드는 다시 캡션과 패턴, 권호와 연대, 문장형식소장정보 자료정보 등의 필드로 구성된다. 본고에서는 각 필드별로 그 내용을 구체적으로 분석하고 있다.

  • PDF

재방송 편성/송출 워크플로우를 위한 파일기반 자막송출시스템 (Reliable File-based Caption Server System for Playout Workflow of Rerun Programs)

  • 김윤형;최성우;정병희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.84-85
    • /
    • 2015
  • 자막방송은 지상파 방송 수신을 통해 시청 가능한 자막 서비스를 의미하며, 현재 모든 지상파 방송 프로그램에 대해 자막방송이 제공되고 있다. 자막방송을 위한 자막 데이터는 일반적으로 속기를 통해 입력되며, 방송에서 속기를 통해 작성된 자막 데이터는 파일로 저장되어 해당 방송 프로그램에 대한 메타데이터로 활용되거나, 동일한 프로그램이 재방송으로 편성될 경우의 자막방송에 활용될 수 있다. 하지만 재방송의 경우 편집으로 인해 본방송과 내용상의 차이가 발생할 수 있으므로 편집이 발생한 부분을 포착하여 자막 데이터에도 동일한 편집을 적용한 후에 자막방송으로 활용되어야 한다. 따라서 재방송 송출에 기존 자막파일이 활용될 경우 반드시 전처리를 통해 자막과 영상의 내용을 일치시키는 과정이 필요하다. 그러나 방송 현장의 재방송 편성/송출 워크플로우에서는 자막 전처리를 위해 필요한 정보들이 갖춰지지 않는 예외적인 경우가 종종 발생하기 때문에 이를 해결하기 위한 방법이 필요하다. 이에 본 논문에서는 방송 현업의 재방송 편성/송출 워크플로우에서 파일기반 자막송출 기능을 안정적으로 사용하기 위해 자막 전처리 과정에서 발생할 수 있는 오류들에 대한 대처방법을 설명하고, 그 방법을 구현한 시스템을 소개한다.

  • PDF

텍스트 정보와 시각 특징 정보를 이용한 효과적인 웹 이미지 캡션 추출 방법 (An Efficient Web Image Caption Extraction Method based on Textual and Visual Information)

  • 황지익;박주현;낭종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.346-348
    • /
    • 2006
  • 기존의 웹 이미지 검색 시스템들은 웹 페이지에 포함된 텍스트들의 출현빈도, 태그유형 등을 고려해 각 키워드들의 중요도를 평가하고 이를 이용해 이미지의 캡션을 결정한다. 하지만 텍스트 정보만으로 캡션을 결정할 경우, 키워드와 이미지 사이의 관련성을 평가할 수 없어 부적절한 캡션의 배제가 어렵고, 사람의 인지와 맞지 않는 캡션이 추출되는 문제점이 있다. 본 논문에서는 기존의 웹 이미지 마이닝 방법을 통해 웹 페이지로부터 캡션 후보 키워드를 추출하고, 자동 이미지 주석 방법을 통해 이미지의 개념 부류 키워드를 결정한 후, 두 종류의 키워드를 결할하여 캡션을 선택한다. 가능한 결합 방법으로는 키워드 병합 방법, 공통 키워드 추출 방법, 개념 부류 필터링 방범 캡션 후보 필터링 방법 등이 있다. 실험에 의하면 키워드 병합 방법은 높은 재현율을 가져 이미지에 대한 다양한 주석이 가능하고 공통 키워드 추출 방법과 개넘 부류 키워드 필터링 방법은 정확률이 높아 이미지에 대한 정확한 기술이 가능하다. 특히, 캡션 후보 키워드 필터링 방법은 기존의 방법에 비해 우수한 재현율과 정확률을 가지므로 기존의 방법에 비해 적은 개수의 캡션으로도 이미지를 정확하게 기술할 수 있으며 일반적인 웹 이미지 검색 시스템에 적용할 경우 효과적인 방법이다.

  • PDF

XMARS : XML 기반 멀티미디어 주석 및 검색 시스템 (XMARS : XML-based Multimedia Annotation and Retrieval System)

  • 남윤영;황인준
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.541-548
    • /
    • 2002
  • 본 논문에서는 XML을 이용하여 멀티미디어 데이터를 구조적으로 표현하고 효율적으로 추출하기 위한 XML 기반 멀티미디어 주석 및 검색 시스템을 제안한다. 이 시스템은 멀티미디어 데이터에 대한 주석이나 검색, 브라우징을 위한 그래픽 인터페이스를 제공하며 멀티미디어 정보를 표현하기 위해 계층적 메타데이터 모델을 기반으로 하여 구현되었다. 비디오에 대한 메타데이터는 MPEG-7 표준에 정의되어 있는 멀티미디어 서술 스키마를 기반으로 XML 스키마를 사용하여 작성하였다. 또한, 멀티미디어 데이터의 효율적인 인덱싱과 추출을 위하여 자막과 주석을 바탕으로 한 카테고라이징 기법을 사용한다.

2-Fluorenylidene chalcone유도체에 대한 Thioglycolic acid의 친핵성 첨가 반응에 관한 연구 (Nucleophilic Addition Reaction of Thioglycolic acid to 2-Fluorenylidene chalcone Derivatives)

  • 이기창;이광일;황용현;류정욱;윤철훈
    • 한국응용과학기술학회지
    • /
    • 제13권1호
    • /
    • pp.107-113
    • /
    • 1996
  • Fluorenylidene chalcone derivatives were synthesized by condensation. The structure of these compounds were ascertained by means of UV, melting point, IR and $^1H-NMR$ spectra. The nucleophilic addition reaction kinetics of Thioglycolic acid to fluorenylidene chalcone was investigate by UV in 20% $dioxane-H_2O$ at $25^{\circ}C$. The rate equation which were applied over a wide $pH1.0{\sim}13.0$ range. On the basis of general base catalysis and confirmation of addition reaction product, the nucleophilic addtion reaction kinetics of thioglycolic acid to fluorenylidene chalcone were measured by the pH change. From the result of the above caption, a plausible nucleophilic addition reaction mechanism of thioglycolic acid to fluorenylidene chalcone was proposed. These compounds may be used as the starting materials for the preparation of the engineering plastics or the germicide.

청각장애인의 이스포츠 중계방송 및 게임 스트리머 콘텐츠 시청 편의성 증대를 위한 자막 동기화 보정 연구 (A Study on subtitle synchronization calibration to enhance hearing-impaired persons' viewing convenience of e-sports contents or game streamer contents)

  • 신동환;김정수;김창원
    • 한국게임학회 논문지
    • /
    • 제19권1호
    • /
    • pp.73-84
    • /
    • 2019
  • 본 연구는 e-sports 중계 콘텐츠 및 게임 스트리머 콘텐츠에 대한 청각장애인들의 시청 편의성을 위해 제공되는 자막의 서비스의 품질을 높이는 방안을 제시하기 위한 연구이다. 일반적으로 방송 콘텐츠의 자막 파일은 속기사에 의해 방송 중에 수동 작성되므로 원본 콘텐츠 대비 3~5초의 자막표시 지연이 필연적이다. 이에, 본 연구에서는, 음성인식 기술을 활용한 동기화 자동 보정 시스템의 구성을 제안하였다. 또한 이 시스템을 활용한 콘텐츠 적용실험을 진행하였으며 최종 결과로 자막 데이터의 동기화 오차 시간을 1초 이내로 줄일 수 있음을 확인 하였다.

Show, Attend and Tell 모델을 이용한 한국어 캡션 생성 (Korean Image Caption Generator Based on Show, Attend and Tell Model)

  • 김다솔;이계민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.258-261
    • /
    • 2022
  • 최근 딥러닝 기술이 발전하면서 이미지를 설명하는 캡션을 생성하는 모델 또한 발전하였다. 하지만 기존 이미지 캡션 모델은 대다수 영어로 구현되어있어 영어로 캡션을 생성하게 된다. 따라서 한국어 캡션을 생성하기 위해서는 영어 이미지 캡션 결과를 한국어로 번역하는 과정이 필요하다는 문제가 있다. 이에 본 연구에서는 기존의 이미지 캡션 모델을 이용하여 한국어 캡션을 직접 생성하는 모델을 만들고자 한다. 이를 위해 이미지 캡션 모델 중 잘 알려진 Show, Attend and Tell 모델을 이용하였다. 학습에는 MS-COCO 데이터의 한국어 캡션 데이터셋을 이용하였다. 한국어 형태소 분석기를 이용하여 토큰을 만들고 캡션 모델을 재학습하여 한국어 캡션을 생성할 수 있었다. 만들어진 한국어 이미지 캡션 모델은 BLEU 스코어를 사용하여 평가하였다. 이때 BLEU 스코어를 사용하여 생성된 한국어 캡션과 영어 캡션의 성능을 평가함에 있어서 언어의 차이에 인한 결과 차이가 발생할 수 있으므로, 영어 이미지 캡션 생성 모델의 출력을 한국어로 번역하여 같은 언어로 모델을 평가한 후 최종 성능을 비교하였다. 평가 결과 한국어 이미지 캡션 생성 모델이 영어 이미지 캡션 생성 모델을 한국어로 번역한 결과보다 좋은 BLEU 스코어를 갖는 것을 확인할 수 있었다.

  • PDF