Search | Korea Science

High-speed caption processing technology using CUDA (CUDA 를 이용한 고속 자막 처리 기술)

Kim, Hyun soo;Kim, Dae yeol;Kwon, Seung-Cheol;Sohn, Chae-Bong
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2015.07a
- /
- pp.102-105
- /
- 2015
본 논문에서는 멀티미디어 및 수학 관련 알고리즘 분야에서 각광 받고 있는 CUDA(Compute Unified Device Architecture) 기법을 실시간 동영상 자막 처리에 이용 한다. 실시간 고화질 동영상 자막 처리의 낮은 속도를 개선하기 위한 방법 제안으로 써, 이의 함수 구성을 제안한다. 기존의 자막 처리 방식에서는 하나의 코어만을 이용하였다. 이 방법 대신에 CUDA 를 적용 함으로써, 더 많은 코어를 이용해 실시간 자막 처리의 지각적인 성능을 향상하였다. 삽입하고자 하는 자막에 대해 비트맵 이미지를 형성하고, 이의 정보를 처리한다. Intel $Core^{TM}$ i7-4710 MQ, GTX870 환경에서 실험하였으며, 실험 결과 C code 만으로 연산을 한 것 보다 CUDA code 가 약 88% 정도의 속도 향상이 있음을 보였다.
PDF

A Hangeul Recognition Method Using Directional Edges in Open Captions

Jun, Seung-Chul;Kang, Myeong-Gyu;Park, Sung-Han
- Proceedings of the IEEK Conference
- /
- 2002.07b
- /
- pp.1157-1160
- /
- 2002
This paper proposes an efficient method to recognize Hangeul in video open captions. The open captions in news video can play an important role in the video indexing. The strokes of Korean character have a very strong horizontal and vertical directionality and some strokes appear repeatedly in each character. Based on this characteristics, in this paper, we propose an efficient algorithm to extract the character regions in open caption and recognize the characters based on these characteristics of Korean character. The simulation results demonstrate the efficiency of our algorithm in terms of computation time and recognition accuracy.
PDF

Extraction text-region's pixel on caption of video (동영상에 삽입된 자막 내 문자영역화소추출)

An, Kwon-Jae;Kim, Gye-Young
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2011.01a
- /
- pp.43-45
- /
- 2011
본 논문은 동영상 내 삽입된 자막을 문자인식이 가능하도록 문자영역을 이루는 화소를 추출하는 방법을 제안한다. 최초 자막영상을 통계학적 방법을 이용하여 색상극성을 결정한다. 이 후 색상극성에 따른 잡음제거 방법을 명암값기반과 형태학적기반으로 달리한다. 제안된 방법은 각 색상결정에 따른 적합한 잡음제거를 수행함으로서 추출된 화소들이 이루는 문자영역의 영상을 이용하여 문자인식을 수행하였을 때 기존방법보다 높은 문자인식률을 보였다.
PDF

A Study on the Emotional Caption System for Auditory Disabled Person (청각장애인을 위한 감성자막에 관한 연구)

Jang, Seung-Mo;Bae, Young-Rim;An, Young-Ki;Lee, Sang-Moon
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2011.01a
- /
- pp.195-198
- /
- 2011
현재 출시되어 있는 대부분의 콘텐츠들은 일반인들의 감각, 감성 욕구를 채워주고 있다. 하지만 사회의 소외계층인 장애인들을 위한 콘텐츠는 그리 많지 않으며 배제되어 왔다. 이 논문에서는 시각 장애인들을 위한 감성 전달 서비스 기법을 제시하였다. 기존의 콘텐츠는 자막 단순화로 인해 소리를 들을 수 없는 청각장애인들에게 매우 불편함을 주고 있다. 따라서 이 논문에서는 청각 장애인은 물론 일반인들에게도 소리를 들을 수 없는 환경에서 최적의 감성 전달 서비스를 제공할 수 있는 감성 지원 캡션시스템을 구현하여 제시한다.
PDF

Caption Processing for MPEG Video Stream in MC-DCT Domain (MPEG 비디오 스트림에 대한 MC-DCT 영역에서의 자막 처리 방법)

권오형;낭종호
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.04b
- /
- pp.444-446
- /
- 2000
MPEG은 동영상 압축 규약의 하나로서 고화질을 유지하면서 높은 압축율을 제공하기 때문에 그 사용 범위가 점차로 넓어지고 있으며, 또한 이러한 이유로 인해서 MPEG 데이터에 대한 편집 시스템의 요구도 점차 증가되고 있다. 그러나 MPEG 스트림에 대한 편집은 대부분 공간 영역에서 수행되기 때문에 수행 시간이 오래 걸리고 화질이 저하된다는 단점을 안고 있다. 본 논문에서는 DC 이미지를 이용한 MC-DCT 영역에서의 자막 처리 방법을 제안함으로써 기존의 자막 처리 방법이 안고 있는 단점을 극복하도록 하였다. 제안한 방법에서는 MC-DCT 영역에서의 워터마크 삽입 방법[1]을 응용하여 화면 상태에 따라 자막의 세기를 조절함으로써 P, B 프레임의 처리 과정에서 발생하게 되는 화질 저하를 최소화하도록 하였다. 이러한 MC-DCT 영역에서의 자막 방법을 사용함으로써 기존의 자막 처리 방법 보다 약 4.9배 빠른 수행 속도를 얻을 수 있었으며, 화질 보존의 측면에서도 기존의 자막 처리 방법이 화면 전체에 대해서 화질 저하가 발생하는 반면 제안한 방법은 자막이 들어가는 부분에 대해서만 화질 저하가 발생하는 반면 제안한 방법은 자막이 들어가는 부분에 대해서만 화질 저하가 발생하였다. 이러한 방법을 MPEG 스트림에 대해서 사용하게 된다면, 소프트웨어만을 이용한 저가의 데스크 탑 환경에서도 효율적인 자막 처리가 가능하게 될 것이다.
PDF

Automatic Summarization of Basketball Video Using the Score Information (스코어 정보를 이용한 농구 비디오의 자동요약)

Jung, Cheol-Kon;Kim, Eui-Jin;Lee, Gwang-Gook;Kim, Whoi-Yul
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.32 no.8C
- /
- pp.738-744
- /
- 2007
In this paper, we proposed a method for content based automatic summarization of basketball game videos. For meaningful summary, we used the score information in basketball videos. And the score information is obtained by recognizing the digits on the score caption and analyzing the variation of the score. Generally, important events of basketball are the 3-point shot, one-sided runs, the lead changes, and so on. We have detected these events using score information and made summaries and highlights of basketball video games.
PDF KSCI

A Study on the Two Transport Streams Synchronization for Left and Right Videos (좌우영상 전송스트림의 동기화 방법에 관한 연구)

Cho, Sukhee;Kim, Jongho;Choo, Hyon-Gon;Choi, Jin Soo
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2012.07a
- /
- pp.222-224
- /
- 2012
본 논문에서는 듀얼 스트림 기반의 지상파 양안식 3DTV 서비스를 위하여, 상용제품의 MPEG-2 인코더와 AVC/H.264 인코더를 이용하여 부호화할 경우, 두 개의 인코더에서 출력되는 MPEG-2 전송스트림을 입력받아 좌우 영상의 스트림을 프레임단위로 동기화하는 방법을 제안한다. 제안하는 동기화 방법은 좌우 HD-SDI 신호의 수직 보조 데이터 공간(VANC-Vertical ANCillary data space)에 동기정보를 삽입하고, 이 동기정보를 바탕으로 2 개의 DTV 인코더에서 출력되는 좌우영상의 전송스트림을 동기화할 수 있도록 한다. 따라서, 본 논문에서 동기정보는 기존의 상용 DTV 인코더에서 프레임 단위로 부호화를 지원하는 폐쇄자막(Closed caption) 구문에 따라 VANC 에 삽입하는 방법을 제안한다.
PDF

Determing intensity value of characters and backgrounds on caption (캡션 내 문자와 배경의 명암값 결정)

An, Kwon-Jae;Kim, Gye-Young
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2010.07a
- /
- pp.125-127
- /
- 2010
본 논문에서는 동영상에서 비교적 단일 색상의 배경과 문자를 갖는 캡션을 문자인식을 위하여 문자와 배경간의 명암값 결정에 관한 내용이다. 먼저 캡션에 대해 그레이 스케일로 전환을 한 후, Otsu 방법[1]을 이용하여 이진화를 수행한다. 이 후 이진화 영상에서 흰색영역 검은색영역에 대해 각각 최대 내접 정사각형을 산출한다. 다음으로 각각의 영역에서 산출된 최대 내접 정사각형의 분산의 대소를 비교하여 문자영역과 배경영역을 결정한다. 이후 전역적인 잡음을 제거하기 문자영역에 대해 Otsu 방법을 이용하여 최종 문자영역을 결정한다. 제안된 방법의 문자영역의 명암값 결정 정확도는 약 99%로 매우 우수한 성능을 보였다.
PDF

Electron Caption Dissociation of Proteins Initiated by Photoelectrons Generated from 266 nm UV Laser Radiation on an ICR Cell Wall

Lee, Sun-Young;Park, Soo-Jin;Lee, Ye-Won;Oh, Han-Bin;Kang, Hyuk;Cho, Ki-Ho;Ahn, Wha-Keun;Rhee, Bum-Ku
- Bulletin of the Korean Chemical Society
- /
- v.29 no.9
- /
- pp.1673-1677
- /
- 2008
https://doi.org/10.5012/bkcs.2008.29.9.1673 인용 PDF KSCI

Video Caption Extraction and Image Enhancement (비디오 자막 추출 및 이미지 향상에 관한 연구)

김소명;최영우;정규식
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10b
- /
- pp.359-361
- /
- 2000
본 논문에서는 비디오 자막 이미지를 인식하기 위해 필요한 영상 향상의 단계로서 다중 결합을 적용한다. 또한 다중 결합을 위한 동일한 자막의 판단 및 결합된 결과를 재평가하기 위한 방법을 제안한다. 입력된 칼라 이미지로부터 RLS(Run Length Smearing)가 적용된 에지 이미지를 얻고, 수직 및 수평 히스토그램 분포를 이용하여 자막과 자막 영역에 대한 정보를 추출한다. 프레임 내의 자막 영역의 중첩 정도를 이용하여 동일 자막을 판단하고, 동일한 자막을 갖는 프레임들끼리 다중 결합을 수행함으로써 향상된 이미지를 얻는다. 끝으로 결합된 영상에 대한 평가를 수행하여 잘못 결합된 이미지들로 인한 오류를 해결하고 재평가한다. 제안한 방법을 통해, 배경 부분의 잡영이 완화된 자막 이미지를 추출하여 인식의 정확성과 신뢰성을 높일 수 있었다. 또한 동일한 자막의 시작 프레임과 끝 프레임의 위치 파악은 디지털 비디오의 색인 및 검색에 효과적으로 이용될 수 있을 것이다.
PDF

Search Result 87, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)