DOI QR코드

DOI QR Code

Timeline Synchronization of Multiple Videos Based on Waveform

소리 파형을 이용한 다수 동영상간 시간축 동기화 기법

  • Kim, Shin (Department of Computer Science Engineering, Konkuk University) ;
  • Yoon, Kyoungro (Department of Computer Science Engineering, Konkuk University)
  • 김신 (건국대학교 컴퓨터공학과) ;
  • 윤경로 (건국대학교 컴퓨터공학과)
  • Received : 2017.12.26
  • Accepted : 2017.03.20
  • Published : 2018.03.30

Abstract

Panoramic image is one of the technologies that are commonly used today. However, technical difficulties still exist in panoramic video production. Without a special camera such as a 360-degree camera, making panoramic video becomes more difficult. In order to make a panoramic video, it is necessary to synchronize the timeline of multiple videos shot at multiple locations. However, the timeline synchronization method using the internal clock of the camera may cause an error due to the difference of the internal hardware. In order to solve this problem, timeline synchronization between multiple videos using visual information or auditory information has been studied. However, there is a problem in accuracy and processing time when using video information, and there is a problem in that, when using audio information, there is no synchronization when there is sensitivity to noise or there is no melody. Therefore, in this paper, we propose a timeline synchronization method between multiple video using audio waveform. It shows higher synchronization accuracy and temporal efficiency than the video information based time synchronization method.

파노라마 이미지는 현재 흔하게 사용되는 기술 중 하나이다. 하지만, 아직까지 파노라마 비디오 제작은 기술적 어려움이 존재한다. 360도 카메라와 같은 특수 카메라가 없을 경우, 파노라마 비디오 제작은 더욱 어려워진다. 파노라마 비디오를 제작하기 위해서는 여러 지점에서 촬영한 다수의 동영상의 시간축을 동기화할 필요가 있다. 하지만 카메라 내부 시계를 통한 시간축 동기화 기법은 내부 하드웨어 차이로 인해 오차가 발생할 수 있다. 이러한 문제를 해결하기 위해 영상 정보 또는 소리 정보를 이용한 다수 비디오 간 시간축 동기화 연구가 진행되었다. 하지만 영상 정보를 이용하는 경우 정확도와 프로세싱 시간에 문제가 있으며 소리 정보를 이용하는 경우 노이즈에 민감하거나 멜로디가 없으면 동기화가 없다는 문제점이 있다. 따라서 본 논문에서는 소리 파형을 이용한 다수 비디오 간 시간축 동기화 기법을 제안한다. 영상 정보 기반 시간축 동기화 기법보다 높은 동기화 정확도를 보여주며 시간적 효율성을 보여준다.

Keywords

References

  1. Shrestha Prarthana, et al. "Synchronization of multiple video recordings based on still camera flashes." Proceedings of the 14th ACM international conference on Multimedia. ACM, 2006.
  2. Lei, Cheng, and Yee-Hong Yang. "Tri-focal tensor-based multiple video synchronization with subframe optimization." IEEE Transactions on Image Processing 15.9 , pp. 2473-2480, 2006. https://doi.org/10.1109/TIP.2006.877438
  3. M. Ko and K. Yoon. "Timeline synchronization of video clips based on image matching.", Conference on Korean Society of Broadcast Engineers, pp.144-145, November, 2016
  4. S. Kim and K. Yoon. "Optimization technique for timeline synchronization of video clips." Conference on Korean Society of Broadcast Engineers, pp.109-110, June, 2017.
  5. Shrstha Prarthana, Mauro Barbieri, and Hans Weda. "Synchronization of multi-camera video recordings based on audio." Proceedings of the 15th ACM international conference on Multimedia. ACM, 2007.
  6. Shrestha Prarthana, et al. "Synchronization of multiple camera videos using audio-visual features." IEEE Transactions on Multimedia 12.1, pp. 79-92, 2010. https://doi.org/10.1109/TMM.2009.2036285
  7. Herbert Bay, Tinne Tuytelaars, and Luc Van Gool. "Surf: Speeded up robust features." Computer vision-ECCV 2006, pp 404-417. 2006.
  8. Jaap Haitsma, and Ton Kalker. "A highly robust audio fingerprinting system." Ismir. Vol. 2002.