• 제목/요약/키워드: 자막방송

검색결과 94건 처리시간 0.027초

시각장애인의 미디어접근권 향상을 위한 음성자막 저작기술 (Audio Subtitles Authoring Technique for Improving the Blind People's Media Accessibility)

  • 장인선;안충현;서정일;장윤선
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.137-138
    • /
    • 2015
  • 본 논문에서는 시각장애인이 외국어로 된 미디어 콘텐츠를 이해하는데 필수적인 음성자막 서비스용 콘텐츠 저작방법을 제안하고 그 구현 예를 제시한다. 제안하는 방법은 저작 단계별로 편의 기술을 제공하여 저작자로 하여금 편리하고 경제적으로 음성자막 콘텐츠를 제작할 수 있도록 한다.

  • PDF

중요도 맵과 최댓값 필터를 이용한 영상 자막 영역 추출 (Image Caption Area extraction using Saliency Map and Max Filter)

  • 김영진;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.63-64
    • /
    • 2014
  • 본 논문에서는 Saliency map과 Max Filter를 이용한 영상의 자막영역을 추출 한다. Saliency map은 눈에 띄는 영역, 즉 영상에서 주변영역에 비해 밝기 차이가 심한 영역과 윤곽선에 대한 특징이 강한 영역을 돌출하는 것을 말하며, MaxFilter는 중심 픽셀을 최대 윈도우 값을 사용하는 것으로 극단적인 Impulse Noise를 제거하는데 효과적이며 특히 어두운 스파이크를 제거하는데 유용하게 사용된다. 이 두 가지의 특징들을 이용하여 영상의 자막 영역을 추출한다.

  • PDF

RNN-LSTM 기반 장면 자막 메타데이터 생성 방법 (A method for creating the Scene closed-caption metadata based on RNN-LSTM)

  • 곽창욱;김선중
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.153-155
    • /
    • 2018
  • 정확한 영상 검색을 지원하기 위해 다양한 데이터와 방법들을 통한 메타데이터 생성 연구들이 이루어지고 있다. 자막 데이터를 기존의 키워드 기반의 메타데이터 생성 방법을 이용했을 경우, 구어체, 불완전 문장의 특징을 가진 특징을 반영하는데 어려움이 있었다. 또한, 단순히 키워드 매칭에 의존하기 때문에 문장에 중의적 단어가 포함되어 있을 경우에 검색 정확도가 떨어진다는 한계점이 있다. 따라서, 본 논문에서는 이러한 문제를 해결하기 위해 문장 전체를 특정 단위로 표현한 메타데이터를 생성한다. 이를 위해 비지도 학습인 RNN-LSTM 기반 네트워크를 이용하여 자막을 인코딩하고 장면 지식으로 생성하는 방법을 제안한다. 실험에서는 본 시스템을 통해 임의의 자막을 입력하고 유사도 기반의 결과 비교를 통해 자막 메타데이터의 정성적 평가를 수행하였다.

  • PDF

청각장애인을 위한 음성-자막 자동 변환 시스템 개발 및 음성 인식률 고도화 (Development and Enhancement of Automatic Caption Generation System based on Speech-to-Text for the Hearing Impaired)

  • 최미애;김승현;조민애;박동영;김용호;윤종후
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.465-468
    • /
    • 2020
  • 인터넷 미디어, OTT, VOD 등 신규미디어가 비장애인의 정보제공 매체로 널리 확대되나, 자막 서비스를 제공하지 않아 청각장애인의 정보 격차가 더욱 심화되고 있다. 청각장애인의 미디어 접근성 제고를 위해 음성인식 서버 및 스마트 폰·태블릿 앱 간 연계를 통해 음성을 인식하여 자동으로 자막을 생성하고 표시하는 음성-자막 자동 변환 시스템을 개발하였고 음성인식률을 높이기 위해 뉴스/시사/다큐 장르 영상 콘텐츠의 음성에 대해 학습용 데이터를 제작하여 음성인식 성능을 고도화 시켰다. 본 논문에서는 청각장애인을 위한 음성-자막 자동 변환시스템 구성과 음성인식률 비교 평가 결과를 보여준다.

  • PDF

시청각 장애 보조 방송 서비스 시험환경 개발 (Development of Test Environment for Assistive Services for Visual and Hearing Impaired)

  • 김승현;최미애;이은향
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.134-137
    • /
    • 2013
  • 방송통신위원회 "장애인방송 편성 및 제공 등 장애인 방송접근권 보장에 관한 고시"[1] 8조3항에서는 장애인방송물을 제작 송신 재송신할 경우에 대하여, 한국정보통신기술협회(이하 "TTA")에서 제정한 시청각장애보조방송서비스 기술표준의 준수를 의무화 하고 있다. 이에 TTA에서는 시청각 장애 보조 방송 서비스 관련 모든 방송매체 공통의 시청각 장애 보조 방송 서비스 표준의 기술을 검증하고 장애인방송 의무 적용에 대한 정부 정책 및 방송사업자 업체 대상 상용화 적용 시험을 지원하고자 장애인방송 수신기 시험환경과 장애인방송을 송신 및 재송신하는 방송매체의 송출스트림의 표준적합성을 검증할 수 있는 시험환경을 개발하였다. 본 논문에서는 "시청각 장애 보조 방송 서비스"[2]표준의 자막방송 및 화면해설방송을 시험하기 위한 시험환경 및 시험도구 개발 내용을 소개한다.

  • PDF

수화방송 모니터링 기술 연구 (A Study on the monitoring technology of sign language broadcasting)

  • 최지훈;안충현;서정일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.172-173
    • /
    • 2017
  • 본 논문에서는 지상파 방송사업자의 장애인방송 편성비율 목표치 만족여부를 검증하기 위한 상시 수화방송 모니터링 기술을 제안한다. 이를 위해서 방송프로그램 안내정보와 방송 시그널링 정보를 기반으로 채널별로 방송스트림을 저장하는 수집장치의 구조와 기능에 대해서 설명하고, 수집장치를 통해서 획득된 방송스트림에서 수화방송 서비스 유무를 판단하기 위한 분석방법을 제안한다. 마지막으로, 수화방송 모니터링 기술을 이용한 분석 결과를 기술한다. 향후, 전국의 지역별/채널별 장애인방송(자막방송, 화면해설방송, 수화방송) 상시 모니터링 시스템 구축을 통해 장애인방송 활성화에 기여하고자 한다.

  • PDF

청각장애인용 자막방송 서비스를 위한 연쇄잔차 신경망 기반 음향 사건 분류 기법 (Sound Event Classification Based on Concatenated Residual Network Applicable to Closed Captioning Services for the Hearing Impaired)

  • 김남균;박동건;김준호;김홍국;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.472-475
    • /
    • 2020
  • 본 논문에서는 청각장애인에게 자막방송을 제공하기 위하여 오디오 콘텐츠에 등장하는 음향 사건을 분류하는 기법을 제안한다. 제안된 기법은 복수의 잔차 신경망(ResNet)을 연결하는 연쇄잔차(concatenated residual) 신경망 구조를 갖는다. 신경망의 입력 특징을 위해 음성의 멜-주파수 켑스트럼 벡터를 다수의 프레임으로 결합하여 형성한 2 차원 이미지와 전체 프레임에 대한 멜-주파수 켑스트럼 벡터들로부터 얻은 1 차원의 통계 특징벡터를 얻는다. 각각의 입력은 2 차원 잔차 신경망과 1 차원 잔차 신경망으로 모델링되고, 두 개의 잔차 신경망을 연쇄연결(concatenation)하는 구조를 가진 연쇄잔차 신경망으로 구성된다. 성능평가를 위해 수집된 데이터셋으로부터 6-fold 교차검증을 통해 평가한 결과, 85.48%의 분류 정확도를 얻을 수 있었다.

  • PDF

수화방송 모니터링을 위한 수화영역 검출 방법 연구 (A Study on sign-language object detection for sign language broadcasting monitoring)

  • 최지훈;안충현;서정일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.99-100
    • /
    • 2018
  • 청각장애인을 위한 수화방송 서비스는 지상파 기준으로 100% 제공하는 자막방송 서비스와 달리 콘텐츠 제작비용과 시스템 운영비용 등으로 인해 5% 수준의 편성에 그치고 있다. 이러한 편성 비율조차도 명확한 편성기준과 검증기준이 없어서 실제 청각장애인이 실제 체감하는 수준은 훨씬 낮은 상황이다. 본 논문에서는 지상파 방송사업자의 장애인방송 편성비율을 검증하기 위해서 방송프로그램 안내정보와 방송 시그널링 정보를 기반으로 채널별로 방송스트림을 수집 및 관리하는 장애인방송 모니터링 서버를 활용하여 수화방송 모니터링 기술 고도화를 위한 자동화된 수화영역 검출 방법을 제안한다. 마지막으로, 자동화된 수화영역 검출 방법을 활용한 수화방송 모니터링 결과를 보여준다.

  • PDF

의사결정 트리를 이용한 한글 자막 추출 (Korean Caption Extraction with Decision Tree)

  • 정제희;이승훈;김재광;이지형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.527-532
    • /
    • 2008
  • 자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.

  • PDF