Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2014.06a
-
본 논문에서는 hidden Markov model (HMM) 기반의 스테레오 신호로부터 서라운드 오디오 신호를 생성하는 기법을 제안한다. 먼저 5.1 채널 오디오 훈련 데이터베이스로부터 MDCT 영역에서 전방/서라운드 채널의 서브밴드 에너지를 프레임 단위로 계산하고, 이를 특징 벡터로 하여 좌측과 우측 채널 두 개의 HMM 이 구성된다. 다음으로, 입력된 스테레오 신호에 대해 HMM decoding 을 통해 서라운드 채널의 MDCT 영역의 서브밴드 에너지가 예측된다. 이 예측된 서브밴드 에너지로부터 역 MDCT 를 통해 서라운드 오디오 신호가 생성된다. 제안된 방법의 성능평가를 위해 MUSHRA 청취 실험을 수행한 결과, 제안된 HMM 기반의 방식으로 생성된 서라운드 오디오 신호가 기존의 패시브 서라운드 디코딩 기반으로 생성된 서라운드 신호에 비해 높은 선호도를 보였다.
-
음악 장르 분류 분야에서는 다양한 특징을 모아서 특징 벡터를 만들고 이를 support vector machine (SVM)와 같은 분류기에 입력하는 시스템이 주로 사용되고 있다. 이 논문에서는 거리 함수 학습를 음악 장르 분류를 위한 특징 벡터의 간소화에 적용하였다. 여러 거리 함수 학습 방법 중 하나의 방법을 선택하고, 기존의 논문들에서 사용되었던 특징 셋을 활용하여 기존 특징 셋에 대해서 성능을 떨어뜨리지 않으면서 특징 셋의 길이를 줄일 수 있는지 살펴본다. 우리의 실험에서는 168차원의 특징 셋을 10차원까지 줄였는데, 이 경우 분류 정확도가 2% 이내로 저하되었다.
-
본 논문에서는 비음수 행렬 분해 (NMF) 기법을 이용하여 단일 채널에서 배경음 성분을 추출하는 알고리즘에 대해 서술한다. 이러한 배경음 성분 추출은 오디오 업믹싱 시스템을 고려하여 개발되었으며, 기존의 연구를 통하여 분리된 배경음 신호가 서라운드 채널 혹은 상방향 채널에 적용될 경우 청취자의 공간감을 향상시킬 수 있다는 사실이 이미 확인된 바 있다. 다만 기존의 기법은 음향 신호를 모두 축적하여 일괄적으로 처리해야 한다는 단점이 있어, 스트리밍 시스템이나 디지털 신호 프로세서 등을 이용한 시스템에서 사용될 수 없는 단점이 있다. 본 논문에서는 이를 해소하기 위하여 실시간 비음수 행렬 분해 기법을 이용한 배경음 추출 시스템을 고안하여 실험하였다. 실험 결과 실시간 배경음 추출 기법이 신호의 후반부에서는 원하는 대로 동작하나, 초중반에 기저가 과도하게 설정되는 문제점이 있음을 확인할 수 있었으며, 이에 대한 해결이 향후 연구 과제가 될 것이다.
-
본 논문에서는 오디오 신호의 특성 표현에 유용한 nonnegative matrix factorization(NMF)에 대해 설명하였으며, expectation maximization (EM)을 이용한 NMF 파라미터 추출 및 EM-NMF 기반한 오디오 소스 분리 기술에 대해서 설명했다. 또한, 다중 단계 NMF-EM 구조의 객체 분리를 통해서 객체 분리 성능을 향상시키기 위한 알고리즘을 제안하며, 제안된 알고리즘은 K-pop 음원과 SDR(source distortion ratio)를 통해서 객체 분리 성능을 평가한다. 성능 평가 결과 제안된 알고리즘은 다중 단계를 통해 약 3dB 의 보컬 분리 성능이 향상되며, 상업적 음원 제작에서 사용되는 가상 오디오 효과가 많이 적용된 음원에서 약 5dB 의 분리 성능을 향상시켰다. 그러므로 제안된 방식은 오디오 객체 분리에 유용한 방법이 될 것으로 생각된다.
-
본 논문에서는 시각장애인들의 TV 시청시 리모콘이나 별도의 기기의 착용없이 TV 조작이 가능한 제스처 명령의 설계를 소개한다. 시각장애인들의 TV 시청 및 조작 현황 및 수요를 알아보기 위해 저시력 및 전맹 장애인들을 대상으로 설문조사와 그룹 인터뷰를 수행하였으며 현재 시중에 적용된 좌표 포인팅 방식 제스처에 대한 평가 또한 이루어졌다. 이 결과를 바탕으로 현재 시판중인 동작인식 시스템에서 인식가능하며 시각장애인들의 사용성을 고려한 TV 조작 맨손 제스처를 제안한다.
-
인터넷 미디어 기술이 발달하고 개인형 스마트기기(스마트폰, 태블릿PC 등)가 확대 보급됨에 따라 TV 시청행태가 변하고 있다. TV를 시청하면서 개인형 스마트기기를 이용하여 타매체를 동시 이용하는 시청행태가 증가하고 있다. 이러한 시청행태에 대응하여 세컨드스크린 서비스 기술이 주목 받고 있다. KBS는 콘텐츠 사업자 친화적인 세컨드스크린 서비스 기술에 대해 연구하고 TV 친구라는 의미의 세컨드스크린 서비스 플랫폼인 티벗(TVUT) 플랫폼을 개발하였다. 티벗 플랫폼은 이용자 증가에 따른 시스템 확장성과 서비스의 안정성을 고려하여 클라우드 기반 서비스 플랫폼으로 구축하였다. 본 논문에서는 방송 콘텐츠 관련 부가정보를 쉽게 제공할 수 있는 시스템과 서비스 기술을 제시한다.
-
본 논문은 한국정보통신기술협회(TTA)에서 제정된 "HTML5 기반 스마트 TV 플랫폼 수신기 적합성 시험" 표준(TTAK.KO-07.0119)에 따라 구축한 표준 적합성 시험환경에서 시험 도구의 테스트 케이스 개발에 활용되는 스마트 TV 테스트 프레임워크 설계와 구현에 대한 내용을 소개한다. 표준으로부터 도출된 많은 개수의 테스트 항목에 대한 테스트 케이스를 효율적으로 개발하기 위해 테스트 내용 외의 공통적으로 수행되는 코드부분(테스트 케이스의 정의, 기본 UI, 서버와의 통신 등)을 추상화하고, 테스트 케이스 개발 자체의 난이도를 줄이기 위해 사용하기 쉬운 API 를 제공하는 프레임워크가 필요하다. 본 논문에서는 스마트 TV 테스트 프레임워크의 소프트웨어 구조를 소개하고, 테스트 케이스 개발에 활용하는 테스트 서술 API, 테스트 결과를 사용자에게 일관되게 보여주는 테스트 프레임워크 UI, 그리고 테스트 결과를 수집하고 서버에 전송하는 테스트 리포터의 설계와 구현 내용에 대해 소개한다.
-
UHDTV방송을 준비하면서 대용량 영상데이터의 전송이 중요시 되고 있다. 그러나 이용자의 미디어 이용행태는 언제 어디서나 쉽게 이용할 수 있는 매체를 더 선호하고 있다. 본 연구에서는 수신능률을 높이고, 향후 8K UHDTV 등 초고화질 서비스도 가능하도록 TV채널 폭의 확장에 의한 UHDTV방송의 효과를 제시하고자 한다.
-
This paper presents an adaptive interpolation filtering scheme for the High Efficiency Video Coding (HEVC) standard. In regards to interpolation for motion estimation and compensation, the conventional HEVC employs 8-tap and 4-tap filters for luma and chroma samples, respectively. Coefficients in such filters are determined by discrete cosine transform (DCT). In the proposed scheme, boundary strength values are stored after the execution of the deblocking filter. For each block, the sum of boundary strength values is calculated to indicate whether its region is complex or simple. Consequently, based on the region classification, 12-tap and 8-tap interpolation filters are used for complex and simple regions, respectively. This process is applied to luma sample interpolation only. Simulation results show 1.8% average BD-rate reduction compared to the conventional method.
-
본 논문에서는 블랙박스 혹은 운전석에 장착된 카메라로부터 얻어진 차량 영상에 대한 영역별 수직 히스토그램 매칭 및 선형 회귀분석 모델(linear regression model)을 활용한 강건한 차량 운행 동영상의 안정화(video stabilization) 기법을 제안한다. 동영상 안정화 기법은 영상의 흔들림 보정뿐 아니라 동영상 내 강건한 특징점 추적 및 매칭을 위한 이전의 전처리 과정으로 적용된다. 일반적으로 촬영 과정에서 많은 떨림이 포함될 수 있는 야외 CCTV 영상이나 손으로 들고(hand-held) 촬영된 동영상에 대한 흔들림 보정 등에 적용되고 있으나 영상 내 특징점이 지속적으로 변하고 영상의 변화 정도가 매우 심한 차량 운행 동영상에서는 적용된 사례가 드물다. 본 연구에서는 일반적인 비디오 안정화 기술이 적용되기 어려운 차량 운행 동영상에 대하여 수직 투영 히스토그램 매칭 및 선형 회귀분석 모델 기반의 안정화 기법을 제안한다. 제안된 기법은 입력영상에 대한 영역별 수직 투영 히스토그램 매칭을 수행하고 선형 회귀모델을 통해 영상에 나타나는 수직 및 회전이동 변환을 선형 근사하여 시간 영역 상의 입력 영상에 대한 안정화를 달성한다. 제안 방법의 검증을 위해 블랙박스로 촬영된 실제 동영상에 동영상 안정화 기술을 적용하였으며, 운행 중 불규칙한 노면으로 인한 영상의 흔들림이 효과적으로 제거되는 것을 확인할 수 있었다.
-
본 논문에서는 깊이 영상 카메라를 이용하여 손 영역을 효과적으로 검출하기 위한 방법을 제시한다. 컬러영상 카메라를 통해 손 영역 검출 방법은 주변 환경의 영향에 따라 낮은 인식률을 나타낸다. 또한 고화질의 컬러영상을 획득 하지 못한 경우 손 영역 검출의 인식률이 현저히 떨어지는 결과가 나타난다. 이러한 결점을 보완하기 위해서 본 논문에서는 깊이 영상 카메라를 통해 획득한 깊이 영상 정보를 이용하여 객체들을 검출하고 빠르고 안정적으로 객체들 중에서 손 영역을 검출하는 방법을 제시하고자 한다.
-
본 논문에서는 손가락 제스처 인식을 위해서 깊이 영상 카메라를 이용하여 손 영역을 추적하고 손가락 끝점을 찾는 방법을 제시하고자 한다. 실시간 영역 추적을 위해 적은 연산량으로 손 영역의 중심점을 검출하고 추적이 가능하여야 하며, 다양한 제스처를 효과적으로 인식하기 위해서는 손 모양에서 손가락을 인식하여야 하기 때문에 손가락 끝점을 찾는 방법도 함꼐 제시하고자 한다. 또한 손가락이 정확히 검출되었는지를 확인하기 위해서 손가락의 이동과 손가락의 클릭 제스처를 마우스에 연동하여 검출 결과를 테스트 하였다.
-
기존에 영상 내에 원형 검출 방법으로 가장 널리 사용되는 방법은 허프 변환에 기초한다. 허프 변환은 해석적 곡선의 각 점을 원의 중심 좌표와 반지름으로 매핑 시키는 과정을 포함한다. 이러한 과정은 실행시간을 매우 많이 필요로 하고 또한 응용에 따라서 최적인 원 근사화 방법을 찾는데 문제점을 야기하기도 한다. 본 논문에서는 원형 모양인 광 연결 소자 장치로 제한된 응용환경에 대해 원 검출을 빠른 속도로 탐색하는 방법과 최적인 원 근사화 방법을 제안한다. 제안한 방법은 에지 검출과 검출된 에지를 이용한 중심좌표 및 반지름 탐색 그리고 최적화된 원 근사화 방법으로 구성된다. 모의실험을 통하여 제안한 방법은 기존의 오픈라이브러리로 제공되는 OpenCV의 허프 변환에 의한 방법에 비해 원 검출 및 근사화 방법에 있어 성능을 개선할 수 있음을 보인다.
-
본 논문에서는 필기 문서 영상을 분석하여 단어 단위로 요소들을 분할하는 방법을 제안한다. 일반적으로 인쇄 문서에 비하여 필기 문서에서는 글자 간 간격이 일정하지 않을 뿐만 아니라 필기자 또는 작성된 언어에 따라 특성이 매우 다르게 나타나기 때문에 단어를 분리하는 것은 어려운 문제로 간주되었고 많은 연구가 진행되었다. 제안하는 방법은 이 문제를 해결하기 위하여 글자 획의 두께를 고려하여 정규화시킨 각 연결 요소간 간격과 간격 안에 존재하는 글자 픽셀의 수로 구성된 2 차원의 특징값을 추출하였다. 이 특징값을 바탕으로, 제안하는 방법은 k-평균 클러스터링을 이용하여 각 텍스트라인을 구성하는 연결 요소간 간격을 단어 사이의 간격과 단어 내부 글자간의 간격으로 분류하였다. ICDAR 2013 Handwriting Segmentation Contest 데이터베이스에 대한 실험 결과 제안하는 방법은 가장 우수한 성능을 나타내었다.
-
Shin, Saim;Lee, Jong-Seol;Jang, Sei-Jin;Kim, Moo-Young;Downie, J.Stephen;Choi, Kahyun;Lee, Jin-Ha 42
본 논문은 K-Pop 디지털 음원 서비스에 활용 가능한 음악 정보 (Music Information)를 기술하기 위한 Music Description 중 K-Pop Genre Description에 대한 연구이다. 본 연구는 K-Pop 상용화 서비스에 활용하기 위한 음악 장르 분류를 제안하였다. 기존에 서비스되고 있는 K-Pop 디지털 음원 포털의 음원 분류를 체계적으로 분석한 결과를 통하여, 상용화에 가장 적합한 K-Pop 음악 분류 서비스를 위한 장르 체계를 제안하고 있다. 또한, TV-anytime 등 국제적 상용화 및 표준화에 적용된 기존의 장르 분류들과의 매핑을 통하여 확장 및 공유가 가능한 형태의 새로운 장르 분류체계 관리를 위한 메타데이터 규격을 제안하고 있다. -
본 논문에서는 4개의 스피커를 이용한 음향 재생 환경에서 청취자의 위치에 따라 최적의 sweet spot을 제공하도록 스피커를 구동하는 방법을 제안한다. 먼저 청취자 위치에 대하여 대칭 구조를 가지는 스피커 쌍(pair) 후보들을 선택한다. 다음, ringing 현상을 감소시키기 위하여 앞에서 선택한 스피커 쌍 후보 중에서 스피커 간 간격이 가장 먼 스피커 쌍과 이 스피커 쌍 사이에 있는 모든 스피커를 구동 스피커로 결정한다. 마지막으로, cross-talk cancellation 행렬의 크기를 제한하여 ringing 현상을 감소시킨다. 모의실험을 통해, 청취자 위치가 변할 때 제안하는 스피커 구동 방법을 사용하여 sweet spot 면적이 일정한 수준으로 유지되어 기존 방법에 비하여 성능이 향상된 것을 확인하였다.
-
Myeong, Chang-Ho;Yoo, Byeong-Hyeon;Park, Han-Byeol;Kwon, Yong-Up;Noh, Young-Joo;Chung, Su-Jee;Kim, Ki-Jun;Park, Ho-Chong 50
본 논문에서는 여러 대의 스마트폰을 이용한 입체 음향 시스템에 대하여 제안한다. 기존의 스마트폰을 이용한 입체음향 시스템은 같은 음원을 여러 기기에서 재생하는 방식이기 때문에 품질 높은 입체감을 제공하기 어렵다. 이를 해결하기 위하여 본 논문에서는 기기 별로 서로 다른 음원을 재생하는 방법을 제안한다. 또한, 패닝 기법을 사용하여 가상 음원을 생성하는 방법을 제안한다. 제안한 방법을 사용하면 기존의 방법보다 우수한 입체감을 제공할 수 있으며, 청취자의 설정에 따라 자유롭게 새로운 느낌의 음악을 재생할 수 있다. -
본 논문에서는 멀티채널 오디오 재생시스템을 구성하는 라우드스피커들이 표준위치와 상이한 위치에 존재할 경우 입력된 멀티채널 오디오 신호가 표현하는 음장감을 최대한 유지하면서 주어진 라우드스피커 배치환경에 최적으로 가상음원과 멀티채널 오디오 신호를 재생하는 방법을 제안한다. 능동잡음제어 기술에 이용되는 LSM 기술을 활용하여 원음장과 스피커를 통해 재생되는 복원음장 사이의 오차를 최소화하는 음향공간필터를 설계하여 적용하였으며, 청취평가를 통하여 음장감이 유지됨을 확인하였다.
-
방송 제작 환경은 고품질의 콘텐츠를 빠르고 효율적으로 서비스하기 위하여 IT 기반 시스템으로의 전환을 진행하여 완성 단계에 이르렀으며, 대부분의 방송 콘텐츠는 파일 기반으로 제작 및 보관되고 있다. 과거 테이프 기반에서 파일 기반 콘텐츠로 전환되면서 신호 레벨로 진행되던 전통적인 품질 관리에 대한 새로운 방안이 요구되었으며, 이를 위하여 파일 기반 콘텐츠에 최적화된 콘텐츠 품질검사 시스템 개발이 진행되어 왔다. 이미지 처리에 기반하는 오류 검출 알고리듬의 복잡성으로 인하여 실시간 검사를 지원하지 못하여 HD 실시간 시스템에의 적용에 어려움이 있었으며, 대용량의 아카이브 시스템에서는 품질검사 시간에 대한 단축이 지속적으로 요구되고 있다. 이에 본 논문에서는 방송 환경에서 발생하는 블록 오류 등 다양한 A/V 오류를 고속으로 검출하기 위하여 최근에 급부상하고 있는 GPU 기반의 병렬처리를 이용하는 품질검사 실시간 고속화 시스템의 구현에 대하여 기술하고자 한다.
-
최근 미디어 간 컨버전스가 가속화되면서 그 사이를 흐르는 콘텐츠 유형이 방송과 인터넷 양쪽을 충족시키고 또한 모바일 환경에 최적화된 서비스를 위해 클립화 되어 가고 있다. 다수의 미디어 콘텐츠를 공급하는 방송사의 입장에서는 콘텐츠서비스를 위한 콘텐츠 관리방안이 중요한 이슈가 되고 있으며 ID, 메타데이터 등 관리를 위한 체계를 잡는 것의 중요성도 증대되고 있으며 또한 분절된 동영상을 어떻게 만들고 어떻게 서비스 할것인가도 중요한 이슈이다. 이번연구는 대표적인 방송용 콘텐츠 메타데이터 표준인 EBU Core, PB Core와 우리나라 KBS 메타데이터의 분절형동영상 관련하여 메타데이터 구조를 파악하고 어떻게 구성되어 있는지 비교분석하여 보았다. 분석결과 메타데이터가 근간을 이루는 기본구조는 거의 유사하였고 각각 관점의 차이에 따라 추가되는 항목이 존재함을 발견할 수 있었다. 그리고 최근 미디어 환경변화에 따라 분절형동영상을 표현하는 메타데이터 항목에 대한 개선방향을 몇가지 제안하였다.
-
본 논문에서는 케이블 TV 콘텐트를 대용량의 Wi-Fi 통신을 이용하여 전송하고, 집 안에 배치된 여러 가지의 수신기를 이용하여 콘텐트를 편하게 즐길 수 있는 서비스에 적합한 SM(spatial modulation) 전송기법의 수신 성능을 분석한다. 케이블 채널의 개수는 100가지가 넘으며 HD 이상의 화질을 가진다. 이러한 수십 개의 대용량 콘텐트를 무선으로 한정된 대역폭에 전송하기 위해서는 공간다중화 방식의 MIMO 기법이 필요하다. 그 중에서도 채널 간의 간섭이 많은 집 안 환경에 적합한 SM 전송기법은 수신 신호간의 간섭이 없으며 수신기가 간단하다는 장점을 가지고 있다. 또한 기존 SM의 낮은 대역효율을 증가시키기 위한 golden-SM 방식도 제안되었다. 그러나 실제 채널 환경에서의 기존 SM 전송기법들의 수신 성능은 비교된 것이 거의 없으므로 본 논문에서는 WiMAX(IEEE802.16a)에서 사용되고 있는 SUI 채널 모델을 고려하여 기존 SM 기법들의 수신 성능을 비교분석하였다.
-
본 논문은 TTA 에서 제정된 "HTML5 기반 스마트 TV 플랫폼" 표준(TTAK.KO-07.0111/R1)에 따라 개발된 스마트 TV 수신기가 표준의 기술 요구사항을 준수하여 적합하게 구현되었는지를 검증하기 위한 표준 적합성 시험환경을 소개한다. 적합성 시험을 위한 시험 기준과 수행절차, 판정 기준 등을 정의하고 있는 "HTML5 기반 스마트 TV 플랫폼 수신기 적합성 시험" 표준(TTAK.KO-07.0119)에 따라 200 여개의 테스트 케이스가 개발되었으며 이들은 스마트 TV 수신기에서 직접 동작하면서 수신기의 기능을 검증하고 결과를 판단하게 된다. 테스트 케이스를 실제 방송환경과 유사한 조건에서 실행하기 위하여 지상파, 케이블, IPTV, 위성 등 다양한 방송 헤드앤드를 활용한 방송 송출 서버를 구현하였으며, 시험에 관련된 정보를 처리하고 실제 시험의 수행 및 그 결과를 관리하는 적합성 시험 관리 시스템을 개발하였다. 그리고 테스트 케이스 앱을 호스팅하는 웹서버, VOD 콘텐츠를 위한 스트리밍 서버 등의 장비를 운용하여 적합성 시험을 위한 전반적인 환경을 구축하였다. 또한 본 논문에서는 구축된 시험 환경에서 표준 기반으로 개발된 참조 수신기를 대상으로 적합성 시험을 수행한 사례를 통해 시험환경의 유효성을 확인하고 향후 적합성 시험환경의 추진 방향을 제시한다.
-
최근 들어 드라마나 영화 속 인물 들의 얼굴을 다른 얼굴로 교체하고자 하는 시도들이 주목을 받고 있고, 사용자들의 관심 또한 증가하고 있다. 이러한 연구는 오래 전부터 많이 연구되어 왔으나, 조명 변화에 강인한 피부 톤 변환 문제는 여전히 주요 이슈로 자리하고 있다. 본 논문에서는 히스토그램 명세화 기법을 응용하여 피부 톤을 자연스럽게 변환 시켜줄 수 있는 기법을 제안한다. 두 얼굴 영상의 R, G, B 채널에 대한 히스토그램을 각각 생성하고 이들을 누적분포함수로 각각 변환한다. 변환된 누적분포함수들을 이용하여 두 얼굴 영상의 히스토그램을 근사 시킬 수 있는 변환 표를 생성하고 이를 이용하여 얼굴 영상의 피부 톤을 변환시킨다. 조명 변화로 인해 발생하는 전반사 영역은 선형 보간 법을 사용하여 제거한다. 실험 결과, 제안하는 방법이 조명 변화에 적응적으로 대처하면서 자연스럽게 피부 톤을 변환 시켜줄 수 있음을 확인하였다.
-
최근 들어 얼굴 교체와 같은 영상 합성 기술들이 많은 관심을 받고 있다. 일반적으로 영상을 합성할 때, 영상간 뚜렷한 명암 차이로 인해 부자연스러운 경계가 발생하는데 이를 자연스럽게 제거하는 블렌딩 기술이 필요하다. 본 논문에서는 이러한 문제를 해결하기 위해 적응적 가중치 기반의 영상 블렌딩 방법을 제안한다. 실험 결과, 본 논문에서 제안하는 방법이 얼굴 합성시 발생하는 뚜렷한 경계 부분을 자연스럽게 제거하고, 합성하고자 하는 얼굴의 눈, 코, 입과 같은 주요 부위를 잘 보존하는 것을 확인할 수 있었다.
-
증강 현실(Augmented Reality)은 현실 세계에 어떤 부가 정보가 덧붙여진 현실이다. 증강 현실 응용은 주로 스마트폰에 내장된 카메라를 통해 실시간으로 입력받은 이미지 정보를 분석하거나, GPS 정보, 전자 나침반 정보 등을 이용해서 증강 현실응용에 맞는 부가 정보를 입력받은 영상 위에 덧붙여서 구현한다. 하지만 다양한 회사에서 각자의 방식대로 증강 현실 응용을 구현하기 때문에, 개별적으로 구현된 증강 현실 시스템은 서로 호환이 되지 않고 이는 증강 현실 산업의 발전을 막는 걸림돌이 되고 있다. 이러한 문제점을 해결하고 관련 산업의 활성화를 꾀하고자 JPEG 기반 증강 현실 시스템을 제안하였고, 이 제안은 최근 ISO/IEC JTC1 SC29 WG1(JPEG) 표준화 단체에서 받아들여져 ISO/IEC 19710(JPEG AR) 표준화가 시작되었다.
-
A new MCMC method for optimization is presented in this paper, which is called the scanline block Gibbs sampler. Due to its slow convergence speed, traditional Markov chain Monte Carlo (MCMC) is not widely used. In contrast to the conventional MCMC method, it is more convenient to parallelize the scanline block Gibbs sampler. Since The main part of the scanline block Gibbs sampler is to calculate message between each edge, in order to accelerate the calculation of messages passing in scanline sampler, it is parallelized in GPU. It is proved that the implementation on GPU is faster than on CPU based on the experiments on the OpenGM2 benchmark.
-
본 논문에서는 다방향 패턴을 이용한 구조광(structured light)방식의 3차원 스캔 기법을 적용하여 3차원 스캐너의 3차원 형상 취득의 정밀도를 높이는 방법을 제안한다. 기존의 단방향 패턴을 이용한 3차원 구조광 방식의 스캔 기법으로 3차원 형상을 취득하는 경우, 스캔 대상 표면의 법선벡터가 패턴의 방향과 수평 할수록 부정확한 형상이 복원된다. 본 논문에서는 스캔 대상의 경사면에 따른 법선 벡터(normal vector) 검출 및 검출된 벡터를 통한 최적의 패턴 방향 선출(quantization), 그리고 각 화소의 최적의 패턴방향을 이용한 선별적인 구조광 방식의 3차원 스캔 기법을 통하여 3차원 형상 취득의 정확성을 높이는 기법을 제안한다.
-
본 논문에서는 3 차원 영상시스템의 성능향상을 위한 깊이영상의 여러 후처리 필터들의 성능을 비교 실험한다. 성능비교를 위해 현재 3D-ATM 에 쓰이고 있는 dilation 필터와, 경계값 보존에 탁월한 성능을 보이는 bilateral 필터, 그리고 깊이영상의 특성을 이용한 depth boundary reconstruction 필터를 선정하였다. 본 논문에서는 위 제시한 필터들의 특징에 대하여 소개하고, 이들 필터들이 3 차원 영상 시스템의 깊이영상에 적용되었을 때 어느정도 성능향상을 보이는지 비교 분석한다.
-
국내에서는 지상파 디지털 모바일 방송 표준을 T-DMB(Terrestrial-Digital Multimedia Broadcasting)로 채택하여 상용화 하였다. 현재 재난 발생 시 T-DMB 시스템에서는 Fast Information Channel(FIC)를 이용한 재난 경보 방송을 방송 영역의 가입자들에게 동시에 전달한다. 하지만 일본의 대지진과 같은 긴급한 상황에서 가입자가 재난 경보의 수신을 실패할 때는 큰 피해를 입을 수 있다. 본 논문에서는 기존의 DMB와 재난정보의 다중 전송 기법을 이용하여 가입자의 수신 효율을 높일 수 있는 방법을 제시 한다.
-
세월호 사고를 계기로 재난 관리 체계에 대한 우려가 커지고 있다. 자연재난, 사회적 재난이 발생했을 때, 대응 과정에서 선행되어야 하는 것이 신속하고 정확한 재난 경보 전달이다. 경보발령권자가 경보를 발령하여, 이 메시지가 유관기관과 대상 지역의 경보시스템에 동시에 전달될 수 있는 표준화된 방법이 필요하다. 이 방법을 위해 Common Alerting Protocol 이라는 메시지 형식을 도입하여 재난 경보 시스템을 표준화할 수 있다. 본 논문에서는 CAP 이 무엇인지 설명하고, 이 메시지 형식을 사용하여 경보를 발령하기 위한 화면 구성을 제안한다.
-
Koh, WooJong;Kwak, CheonSeob;Kwon, DaeBok;Park, SeonKyu;Park, Taeyoung;Chae, YoungSeok;Lee, SeungHyung 90
국내에서 DMB 방송은 대부분의 국민이 휴대하는 휴대폰에 수신기능이 구현되어 있고, 차량 네비게이션에서도 DMB 수신이 가능하여 상당히 보편적 미디어 창구이다. 본 연구에서는 DMB기반의 국지적 재난방송은 국지적 재난의 빈번한 발생과 휴대 기기가 갖는 고유의 개인 중심성과 이동성은 국지적 재난 미디어로 활용할 기술 개발은 큰 의미를 가진다. 국지적 재난방송을 위한 DMB 재난방송 서비스 모델과 방송 시스템 상위 설계 및 기술요구사항 도출 등의 연구를 연차별로 진행 하였다. DMB방송 시스템을 운영한 KBS의 경험을 반영하고, 국지적 방송을 위한 저비용의 시스템을 목표로 국지적 재난 정보 전달에 적합한 방송 시스템 상위 설계와 시스템 간 인터페스 및 기술 개발에 필요한 상세 요구사항을 분석하였다. 이러한 연구의 정확성과 실제 상용화 가능성을 높이기 위해 DMB 방송 차량을 이용한 필드 테스트를 추진하였다. 필드 테스트 에서는 KBS 재난방송시스템과 실시간 연동을 통해 향후 실제 재난방송에 활용 될 수 있는 방송 시스템 운용에 필요한 사항 들을 점검하였다. -
2014년 4월 16일 세월호 참사는 수백 명의 생명을 앗아간 대형 인재로 재난 관리뿐만 아니라 재난 방송과 같은 공적 미디어의 역할과 기능에 대한 반성의 계기와 종합적 재난 미디어 체계의 필요성을 보여주고 있다. 본 연구는 재난 상황에서 우리 국민들이 여러 가지 유형의 미디어에 대한 이용 행태를 파악하고 미디어들이 가지고 있는 재난 정보 속성을 분석하고자 하였다. 또한 일반인을 대상으로 하는 재난방송과 차별적으로 재난 현장에서 정보를 제공하는 재난 미디어의 요구사항을 도출하고자 한다.
-
최근 초고화질 해상도(UHD) 영상 서비스에 따른 기존의 비디오 압축 기술인 H.264/AVC 대비 두 배 이상의 압축 성능을 가지는 HEVC(High-Efficiency Video Codec)의 표준화가 완료되었다. 그러나 높은 압축 효과를 얻기 위하여 복잡한 연산이 필요한 기법들이 많이 도입되어 HEVC의 부호화 복잡도는 H.264/AVC보다 크게 증가되었다. 예로써 HEVC의 화면내 예측 부호화는 예측 방향를 최대 35개까지 확장함으로써 기존 H.264/AVC에 비해서 향상된 부호화 효율을 갖지만 화면내 부호화의 복잡도는 크게 증가되어 복잡도 감소 기법이 필요하다. 본 논문은 화면내 예측 부호화에 사용되는 예측 방향 35가지를 비디오 해상도와 양자화 파라미터 크기를 고려하여 4가지 모드로 나누고 비디오 해상도의 따른 PU(Prediction Unit)의 크기의 점유율에 따라 예측 방향 개수를 변경함으로써 계산 복잡도를 감소시키는 기법을 제안한다. 실험 결과를 통해 제안된 기법을 적용함으로써 대략 2%의 BD-rate 증가로 부호화 시간을 4% 감소시킬 수 있었다.
-
3차원 영상 제작을 위해서는 장면의 색상 영상과 함께 깊이 정보가 필요하다. 일반적으로 깊이를 측정하는 TOF 카메라에 의해 획득된 깊이 영상은 컬러 영상에 비해 매우 작은 해상도의 영상을 갖게 되는 문제가 있다. 따라서 색상 영상과 함께 3차원 영상 제작에 깊이 영상을 사용하기 위해서는 저해상도 깊이 영상의 업샘플링 방법이 필요하다. 특히 컬러 영상에서 사물 간의 경계에 해당하는 부분에서 색상 차이를 인지하지 못하여 깊이 맵을 부적절하게 처리하게 되는 경우가 발생한다. 본 논문에서는 색상 영상에서 경계부분에 해당하는 영역을 이용하여 저해상도 깊이 영상을 업샘플링 하는 방법을 제안한다. 깊이 영상을 업샘플링 할 때 중요하게 다루어야 할 경계 부분을, 고해상도 색상 영상과 저해상도 깊이 영상을 이용하여 찾아낸다. 색상 경계 부분을 고려하여 깊이 영상 업샘플링을 위한 에너지 함수를 MRF를 이용하여 모델링하고, 신뢰 확산(belief propagation)방법을 이용하여 에너지 함수 최적화를 수행한다. 제안한 방법은 기존의 다른 에너지 함수나 필터 기반 업샘플링 방법보다 우수한 성능을 나타내었다.
-
본 논문에서는 중요도 지도를 사용한 화소값 사이 척력 기반 영상 대조비 향상 기법을 제안한다. 공간상에서 인접한 화소들 사이에 자주 발생하는 화소값들의 차이를 크게 하면 효과적으로 영상의 디테일을 두드러지게 할 수 있다. 대조비 증가를 위해 화소값 사이 척력을 정의하고, 유효 화소값 사이 척력들의 합을 사용하여 대조비의 증가 정도를 조절한다. 중요도 지도는 영상의 화소마다 사람의 시선이 머무르는 정도를 상대적인 수치로 나타낸 것이다. 따라서 영상 화질을 개선할 때 중요도 지도를 사용하면 사람의 시선을 끄는 화소값들의 대조비를 선택적으로 높일 수 있다. 실험 결과를 통하여 제안 기법이 우수한 화질개선 영상을 생성함을 확인한다.
-
부화소 기반 영상 축소기법은 각각의 부화소를 조절함으로써 픽셀 기반 영상 축소기법보다 해상도를 향상시킬 수 있는 방법이다. 그러나 부화소에 의한 해상도의 증가는 종종 색상정보의 왜곡을 발생시킨다. 부화소 랜더링의 주요과제는 선명도를 유지함과 동시에 색조왜곡현상을 억제하는 것이다. 선행연구들은 부화소랜더링을 위해 1 차원 혹은 2 차원 필터를 최적화 하였지만, 지역적인 특성을 고려하지 않았기 때문에 출력영상의 화질이 저하되는 현상이 발생한다. 본 논문은 위와 같은 문제를 해결하기 위해 내용적응형 2D FIR 필터를 제작방법을 제안한다. 제안필터는 충분한 수의 저해상도 패치와 고해상도 패치 쌍을 이용하여 임의의 고해상도 패치로부터 고화질의 저해상도 패치를 만들기 위한 최적의 내용적응형 2D FIR 필터를 학습한다. 학습된 필터에 의한 실험결과 제안하는 필터가 종례기법들 보다 색조왜곡현상이 현저히 줄어들고, 출력영상의 선명도를 유지함을 보여준다.
-
본 논문에서는 비접촉 동작 인식 기기를 활용한 동영상 콘텐츠 검색 시스템을 소개한다. 제안하는 시스템은 스마트 TV와 같은 인터넷이 가능한 디스플레이의 동영상 콘텐츠를 대상으로 하며, 콘텐츠 자체 또는 콘텐츠 내의 객체에 대한 정보를 검색 결과로 제공한다. 시스템 구현에 앞서 영상 콘텐츠의 검색 요구 사항에 따라 시나리오 및 기능을 수립하고, 각각의 기능은 비접촉 동작 인식 기기인 립모션을 기반으로 손 동작을 지정하였다. 따라서, 제안하는 시스템은 사용자의 손가락 동작에 의해 선택된 영역을 모바일 비주얼 검색 서버에 전송하게 되고, 검색 결과는 모바일 기기를 통해 최종적으로 전달된다. 본 논문에서는 시스템을 실제로 구현하고 다양한 콘텐츠에 대하여 실험하였다. 개발된 시스템을 통해서 사용자는 손을 이용한 간단한 동작에 의해 콘텐츠 정보, 콘텐츠 내 객체의 정보를 실시간으로 모바일을 통해 제공받을 수 있다.
-
KBS는 디지털방송 수신환경정보를 제공하여 시청자가 지상파 직접수신에 필요한 정보를 안내받을 수 있도록 '디지털방송 직접수신정보 안내시스템'을 개발하였다. 이 시스템은 방송망을 구성하는 송신시설 정보와 지도정보를 기반으로 전파분석기법을 적용하여 동작하도록 구성되었으며, 시청자 위치에서 안정적인 방송수신이 가능한 최적의 송신시설을 추천하고 수신안테나 설치방향 및 채널정보를 제공하도록 제작되었다. 본 논문에서는 지상파방송 직접수신정보 안내시스템 개발결과를 설명하고 실제 구현 내용에 대하여 정보 공유하고자 한다.
-
최근 한류(韓流) 콘텐츠의 글로벌화로 인해 콘텐츠가 전 세계로 수출됨에 따라 글로벌 환경에 적합한 콘텐츠에서의 단어 선택이 매우 중요하게 되었다. 멀티미디어 콘텐츠에서의 글로벌 단어 선택을 위해서는 각 나라의 비속어나 욕설 단어를 회피하고 오해하지 않을 말과 단어를 선택하는 것이 매우 중요하다. 이에 본 논문에서는 글로벌 콘텐츠를 위한 금기 언어 검색 시스템을 개발한다. 이를 위하여 한국어를 영어로 변환하기 위한 음소 변환 모델을 개발하고, 변환된 음소와 금기 언어 검색 데이터베이스를 개발하였다.
-
본 논문에서는 실시간으로 변하는 사용자의 컨텍스트를 고려하여 재구성되는 사용자 인터페이스를 제공하기 위한 인터페이스 제공 시스템 및 저작 도구에 관한 기술을 소개한다. 차별적 서비스를 제공하기 위해서 사용자가 컨텐츠를 소비하고 있는 시점에서의 컨텍스트를 해석하고 이를 반영한 유기적이고 적응적인 사용자 인터페이스를 제공할 수 있어야 한다. 사용자 인터페이스를 반응적으로 구성하고 이를 저작하는 도구에 대한 연구는 웹 기술의 발전과 함께 오랜 기간에 걸쳐 연구되었지만 단순 서비스 조합이나 물리적 GUI 생성에 관한 연구가 주를 이루고 있고 표준화된 컨텍스트와의 유기적 연결성을 고려한 연구는 사례 연구 정도에 머물러 있다. 본 논문에서는 웹을 기반하여 세부 기술에 대한 이해 없이 컨텍스트 기반 사용자 인터페이스를 구성하고 서비스 할 수 있는 시스템과 저작 도구에 대해 소개하고 향후 연구 방향에 대해 논의한다.
-
본 논문은 TTA 에서 제정된 "HTML5 기반 스마트 TV 플랫폼" 표준(TTAK.KO-07.0111/R1)에 따라 개발되는 스마트 TV 수신기 앱이 표준의 기술 요구사항을 준수하여 적합하게 구현되고 있는지 검증할 수 있는 앱 검증 도구를 소개한다. 이 도구는 개발자에게 제공되는 통합개발환경에 포함되는 개발 툴의 하나로, 표준기반 스마트 TV 앱의 소스코드를 해석하고 의미를 분석하여, 표준의 기술 요구사항에 따라 정의된 검증 규격(Rule)을 준수하는지 검증해주는 역할을 한다. 도구의 기능범위는 JSLint, JSHint, ESLint 와 같은 기존 Open Source 기반 툴의 문법 검사 기능을 수용하고, 스마트 TV 플랫폼 특성에 따른 미지원 API, 확장 API 사용 및 웹 브라우저에서 지원되지 않는 기능에 대한 검증을 추가하였다. 스마트 TV 앱 개발자들은 이 도구를 사용하여 개발 비용이 적게 드는 초기 단계에 표준을 준수하는 앱을 구현 함으로서 TV 정합 시간을 줄일 수 있으며, 다른 디바이스나 플랫폼으로 앱을 이식하는 작업을 효율적, 경제적으로 할 수 있다.
-
세계적으로 아날로그 방송에서 디지털 방송으로의 전환이 마무리되고 있는 가운데, 앞으로 다가올 UHDTV 등 실감의 대용량 방송 및 방송 통신 융합 환경에 대비하기 위한 새로운 차기 방송 표준에 관한 연구의 필요성이 날로 높아져 가고 있다. 특히, 저해상도 서비스에 머물러 있던 이동 방송에서는 기존 HD급의 서비스 제공이 가능한 이동 실감방송으로 진화하기 때문에 고정/이동 방송 서비스가 동시에 가능한 고효율 전송 원천 기술 개발이 이루어질 필요가 있다. 이에 최근 지상파 단일 채널을 통해 4K & HD 방송 서비스를 동시에 제공하는 융합방송 시스템 개발에 대해서 연구가 진행되고 있다. 본 논문에서는 지상파 단일 채널을 통해 4K & HD 융합방송 서비스를 제공하기 위해 필요한 전송 요구 사항들에 대해서 분석하고, 효율적인 데이터 전송을 위해 필요한 전송 시스템 및 다중화 기술에 관해서 알아보았다. 또한 분석한 데이터 전송률을 달성하기 위한 최적의 시스템 파라메터를 도출하고 분석하였다.
-
디지털 방송기술의 비약적인 발전으로 기존 HD(High Definition) 화질의 4~16배까지 지원 가능한 UHD(Ultra High Definition) 방송 서비스가 제공되는 새로운 시대를 맞이하게 되었다. UHD 방송은 초고선명 비디오와 22.2 채널 오디오 서비스가 가능한 차세대 실감방송 기술이다. 이러한 UHD 서비스를 제공하기 위해서는 고압축 영상 코덱 기술인 HEVC(High Efficiency Video Coding), OFDM(Othogonal Frequency Division Multiplexing) 기반 대용량 전송기술과 다양한 멀티미디어 부가서비스 가능한 전송 프로토콜이 필수적으로 요구된다. 최근 UHD 방송 전송 프로토콜로 표준화 추진 중인 MMT(MPEG Media Transport)는 이기종망에서 적용할 수 있으며, 양방향 전환이 가능하여 시청자의 요구사항을 실시간으로 반영할 수 있다는 장점을 지닌다. 한편, 지상파 UHD 방송 서비스를 빠르고 효과적으로 수신하기 위해 필요한 정보인 NIT(Network Information Table), RRT(Rating Region Table) 및 SDT(Service Description Table)가 MMT 시그널링 프로토콜에서는 포함되어 있지 않다. 따라서 본 논문에서는 지상파 UHD 방송 서비스의 효과적 수신이 가능한 MMT 기반 지상파 UHD 방송을 위해 NIT, RRT 및 SDT 정보가 포함된 서비스 시그널링 구조을 제안한다.
-
최근 높은 품질의 비디오 서비스에 대한 사용자 요구 증가로 UHD(Ultra High-Definition) 서비스가 등장하였고 여러 방송사에서 UHD 서비스를 제공하기 위해 노력하고 있다. 하지만 아날로그에서 디지털로의 전환이 이루어진지 얼마 지나지 않았고 사용자 대부분은 HD(High-Definition)급 수상기를 가지고 있기 때문에 현재로서는 HD 서비스와 UHD 서비스가 공존해야 하는 상황에 있다. 이를 위해 스케일러블 영상 기술과 차세대 멀티미디어 다중화 전송 표준인 MMT(MPEG Media Transport)가 대두되었다. 사용자 인터페이스로 정의된 MMT CI(Composition Information)를 이용해 계층 부호화 비디오 서비스하려고 하지만 계층 간의 의존성이 높기 때문에 구현상에 어려움이 있다. 이러한 문제점을 해결하기위한 방법으로 본 논문에서는 사용자가 계층 부호화된 비디오 서비스를 제공 받을 수 있는 독립적인 사용자 인터페이스 설계 기법을 제안한다.
-
방송 환경은 방송을 소비하는 시청자의 요구를 충족하기 위해 과거 흑백 TV를 거쳐 컬러 TV, HD, 3D, UHDTV에 이르기까지 다양한 형태로 기술의 발전이 이루어졌다. 시청자의 요구는 고화질의 방송 서비스에서 멈추지 않고, 고정형 방송뿐만이 아닌 이동형 방송에서도 동일한 품질의 방송을 요구하기에 이르렀다. 본 논문에서는 이러한 시청자들의 요구를 충족할 수 있도록 현재 개발된 방송 표준 중 UHDTV를 서비스할 수 있는 전송 규격을 포함하는 유럽의 차세대 방송을 기반으로 고정 및 이동 환경에서 UHD 서비스를 제공받을 수 있는 융합형 방송 시스템을 위한 다중화기의 구조를 제안한다.
-
Conventional stereo matching algorithms fail when they deal with anaglyph image as its input because anaglyph image does not have similar intensity on both view images. To ameliorate such problems, we propose a robust method to obtain accurate disparity maps. The novel Absolute Adaptive Normalized Cross Correlation (AANCC) for anaglyph data cost is introduced in this paper. Then, it is followed by occlusion detection and segmentation-based plane fitting to achieve accurate depth map acquisition. Experimental results confirm that the proposed anaglyph data cost is robust and gives accurate disparity maps.
-
본 논문에서는 2대의 Kinect 카메라를 이용하여 실세계의 3차원 객체에 대한 복원을 수행하는 방법을 제안한다. 먼저 깊이 가중치가 추가된 계층적 결합형 양방향 필터를 이용하여 Kinect로부터 얻은 원본 깊이 영상을 보정한다. 그리고 카메라 캘리브레이션을 이용하여 카메라의 내부 파라미터와 외부 파라미터를 획득한다. 이를 이용해 3차원 워핑을 수행하여 각 시점의 데이터를 3차원 공간에 점군 모델로 복원하고 표면 모델링 방법을 이용하여 3차원 객체의 매끄러운 표면 모델을 생성한다. 실시간에 가까운 속도를 내기 위해서 계층적 결합형 양방향 필터와 3차원 워핑을 병렬 처리 프레임워크인 CUDA로 구현하여 고속화하였다. 실험을 통해 분리된 각 시점에서의 깊이 정보를 하나의 통합된 3차원 공간에 복원할 수 있었고 초당 5 fps의 속도로 동작하는 것을 확인하였다.
-
지능형 차량 시스템에 있어서 교통 표지판 검출/인식은 매우 중요한 요소들 중의 하나이다. 따라서 주행 중인 차량에서 카메라로부터 취득한 영상을 이용하여 교통 표지판을 인식하는 여러 가지 영상인식 알고리즘들이 개발되고 있다. 하지만 이러한 알고리즘은 표지판의 색상 값이 날씨와 시간에 따른 조도와 컬러의 변화에 따라 성능이 크게 변한다는 점에서 어려움을 겪고 있다. 따라서 본 논문은 환경 변화에 강인한 교통 표지판 검출 및 인식 알고리즘을 제안한다. 구체적으로, 표지판 검출을 위하여 제안하는 알고리즘에서는 색상과 형태 정보를 이용하여 교통 표지판 후보군을 찾는다. 여러 색상 임계값에 대하여 영상 피라미드 형태를 만들고, 모든 피라미드 영상들에 대해서 인식 알고리즘을 수행함으로써 실외 빛에 변화에 강인하게 한다. 교통 표지판 후보군을 찾은 후, 후보군들을 Linear SVM을 통해 학습함으로써 교통 표지판인지 아닌지 분류해낸다. 실험 결과는 제안하는 알고리즘이 정확하게 교통 표지판을 인식하고, 동시에 실외 빛의 변화에 상관없이 강인하게 표지판을 인식함을 보여준다.
-
본 논문에서는 전면 카메라가 탑재된 모바일 기기를 이용한 페이스로그(facelog) 시스템을 제안한다. 우선 사용자의 모바일 기기 사용 여부를 확인하고, 사용 시 전면 카메라로 사진을 촬영한다. 촬영된 사진에 얼굴 탐지 알고리즘을 적용하여 얼굴이 탐지되었을 경우 얼굴의 종횡비를 계산하여 페이스로그에 적합한 영상인지 판단한다. 영상에 각종 상태를 판단할 수 있는 얼굴이 포함되어 있을 경우 해당 영상을 페이스로그 영상으로 수집한다. 안드로이드 기반의 스마트폰을 사용하여 제안하는 시스템을 실험하고, 실험 결과를 통해 제안 시스템이 페이스로그에 적합한 얼굴 영상을 효과적으로 수집함을 보인다.
-
기존 디지털 방송은 제한된 데이터 전송율로 인하여 시청자가 요구하는 다양한 데이터 서비스, 고해상도를 가지는 비디오 서비스와 같은 리치 멀티미디어 서비스를 제공하는 것이 현실적으로 어렵다. 그러나, 최근 들어 유무선 인터넷의 속도가 향상되고 소셜 서비스 등 다양한 인터넷 서비스 모델이 등장함에 따라서 통신망을 활용한 하이브리드 멀티미디어 방송 서비스가 제시되어, 방송 서비스가 가지는 특성을 유지하면서 다양한 시청자의 요구를 만족시키는 것이 가능해 졌다. 본 논문에서는 하이브리드 방송 서비스의 일종인 동적 계획 기반 하이브리드 방송 서비스 모델과 이를 가능하게 하는 송신 시스템 구성을 제안한다. 제안된 시스템은 새롭게 추가된 스케줄링 서버를 포함하고 있으며, 이 스케줄링 서버에 의해서 방송 콘텐츠의 비디오 해상도, 제공 시간, 전송 경로 등을 결정하는 것을 특징으로 한다.
-
최근 ATSC는 방송망 기반의 서비스호환 3DTV 방송서비스 표준완료 이후 이종망 환경에서 하이브리드 3DTV 방송서비스에 대한 표준화를 진행 중에 있다. 본 논문에서는 기존의 디지털방송 화질열화 없이 Full HD 3D 화질을 보장하기 위한 방송망 및 IP 망 연동형 3D 비디오 방송시스템을 제안한다. 특히, ISO/IEC 23009-1 DASH를 활용한 3D 부가 영상 전송, 이종망 환경하에서 안정적인 3D 비디오 동기화 및 하이브리드 3DTV 수신기 개발을 위한 시스템 타켓 디코더 모델을 기술한다. 실험결과, 제안된 기술은 하이브리드 3DTV 방송 표준화에 직접적으로 적용될 수 있으며, 하이브리드 3DTV 인코더 및 수신기 개발에 있어서 참조 모델로 활용될 수 있음을 확인하였다.
-
디지털 평판 LCD TV의 영상신호 전송에 LVDS가 사용되어 왔으나 케이블간의 타이밍 문제가 대두되고 초고해상도의 컬러 Depth 확장으로 인해 보다 빠른 전송속도가 요구되어진다. V-by-One HS는 초고해상도 영상처리 IC 및 TCON 간의 새로운 인터페이스 기술로서 최대 3840*2160@240Hz의 해상도 영상구현이 가능하다. 동작 주파수 대역의 공진모드 전압 분포와 V-by-One HS IBIS(Input/Output Buffer Information Specification) 모델 시뮬레이션을 통하여 PCB 설계 방법을 제안한다. 본 논문에서는 V-by-One HS 인터페이스 기술을 사용하여 초고해상도 영상패턴 제어 신호발생기의 시스템 구성을 제안하고 고속영상 신호에 대한 신호 무결성을 검증하고자 한다.
-
DMB 시스템은 직교주파수분할 (OFDM : Orthogonal Frequency Division Multiplexing) 기반의 전송방식을 사용하기 때문에, 단일 주파수 네트워크 (SFN : Single Frequency Network) 기반 방송망 구축이 가능하다. 이러한 SFN 방송망은 인접 송신기의 시간 및 주파수 동기, 송신소 사이의 거리, 송신 전력의 크기를 고려하여야 하며, 이를 위해서는 먼저 특정 수신점에서 채널 임펄스 응답 (CIR : Channel Impulse Response) 을 분석하여 간섭을 최소화되도록 설계하는 것이 중요하다. 본 논문에서는 DMB 시스템에서 다중경로에 의한 간섭을 효율적으로 측정하는 기법을 제안하고, 모의실험을 통해 제안된 기법의 성능을 검증하고자 한다.
-
최근 이슈화되고 있는 국가직무능력표준(NCS : National Competency Standard)에 관하여 "방송통신직종"에 대한 직무분석과 "자격검정"에 관하여 알아보고자 한다. 국가직무능력표준은 학벌 중심의 사회에서 능력 중심의 사회로 전환하기 위한 정부의 정책방향에 따라 856종의 표준을 14년도까지 완료하고, 이를 현장성 있게 학교교육(전문대학) 직업훈련 및 자격제도 개편을 하고자 시행되고 있다. 방송통신직종은 대분류가 정보통신이고, 중분류가 방송기술, 소분류가 방송제작기술, 방송플랫폼기술, 방송서비스로 세 분류가 있다. 또한 일부 콘텐츠적인 방송은 대분류 중에 문화 예술 디자인 방송에 속하여 있다. 결과적으로 "방송통신직종"의 자격검정 제도는 정보통신분야에 속하며, 국가직무능력표준에 따라 직무분석을 별도로 하기 보다는 현재의 검정제도를 순차적으로 변경토록 요구하도록 하여야 하며, 업무능력에 따른 경력자 관리도 이루어져야 할 것이다.
-
Kwon, Kiseok;Ahn, Minwook;Jo, Seokhwan;Lee, Yeonbok;Lee, Seungwon;Park, Young-Hwan;Kim, Sukjin;Kim, Do-Hyung;Kim, Jaehyun 157
In this paper, we introduce SlimSRP, an ultra-low-power digital signal processor (DSP) solution for mobile audio and voice applications. So far, application processors (APs) have taken charge of all the tasks in mobile devices. However, they have suffered from short battery life problems to deal with complex usage scenarios, such as always-on voice trigger with continuous audio playback. From extensive analysis of audio and voice application characteristics, SlimSRP is designed to relive the performance and power burden of APs. It employs three-issue VLIW architecture, and the major low-power and high-performance techniques include: (1) an optimized register-file architecture friendly for constants generation, (2) a powerful instruction set to reduce the number of register file accesses and (3) a unique instruction compression scheme that contributes to saved memory size and reduced cache miss. An implementation of SlimSRP runs at up to 200MHz and the logic occupies 95K NAND2 gates in Samsung 28LPP process. The experimental results demonstrate that a MP3 decoder application with a 128kbps 44.1kHz input can run at 5.1MHz and the logic consumes only 22uW/MHz. -
A programmable video decoding system with multi-core DSP and co-processors is presented. This system is adopted by Digital TV SoC (System on Chip) and is used for FHD HEVC (High Efficiency Video Coding) decoder. Using the DSP based programmable solution, we can reduce commercialization period by one year because we can parallelize algorithm development, software optimization and hardware design. In addition to the HEVC decoding, the proposed system can be used for other application such as other video decoding standard for multi-format decoder or video quality enhancement.
-
In this paper, we propose a world's first programmable video processing platform for video quality enhancement of 8K (
$7680{\times}4320$ ) UHD (Ultra High Definition) TV at 60 frames per second. To support huge computation and memory bandwidth of video quality enhancement for 8K resolution, the proposed platform has unique features like symmetric multi-cluster architecture for data partitioning, ring data-path between clusters to support data pipelining, on-the-fly processing architecture to reduce DDR bandwidth, flexible hardware to accelerating common kernel in video enhancement algorithms. In addition to those features, general programmability of SRP (Samsung reconfigurable processor) as main core of the proposed platform makes it possible to upgrade continuously video enhancement algorithm even after the platform is fixed. This ability is very important because algorithms for 8K DTV is under development. The proposed sub-system has been embedded into SoC (System on Chip) and new 8K UHD TV using the programmable SoC is expected at CES2015 for the first time in the world. -
Coarse-grained reconfigurable architectures (CGRAs) present a potential of high compute throughput with energy efficiency. A CGRA consists of an array of functional units (FU), which communicate with each other through an interconnect network containing transmission nodes and register files. To achieve high performance from the software solutions mapped onto CGRAs, modulo scheduling of loops is generally employed. One of the key challenges in modulo scheduling for CGRAs is to explicitly handle routings of operands from a source to a destination operations through various routing resources. Existing modulo schedulers for CGRAs are slow because finding a valid routing is generally a searching problem over a large space, even with the guidance of well-defined cost metrics. Applications in traditional embedded multimedia domains are regarded relatively tolerant to a slow compile time in exchange of a high quality solution. However, many rapidly growing domains of applications, such as 3D graphics, require a fast compilation. Entrances of CGRAs to these domains have been blocked mainly due to its long compile time. We attack this problem by utilizing patternized routes, for which resources and time slots for a success can be estimated in advance when a source operation is placed. By conservatively reserving predefined resources at predefined time slots, future routings originated from the source operation are guaranteed. Experiments on a real-world 3D graphics benchmark suite show that our scheduler improves the compile time up to 6000 times while achieving average 70% throughputs of the state-of-art CGRA modulo scheduler, edge-centric modulo scheduler (EMS).
-
일반적으로 격행주사(interlace) 된 Side by Side (SbS) 영상의 경우 화면 재생 시, 전송 받은 영상을 먼저 디인터레이싱(de-interlacing) 한 후에 좌우 영상을 분리하여 수평 해상도를 보간 하는데, 이때 한번 가공된 디인터레이싱 값을 참조하여 보간 값을 결정하게 되는 관계로 수평 해상도의 정확성이 크게 떨어지게 된다. 이러한 문제점을 해결하기 위해 격행주사 방식의 SbS 3D 영상의 수평 해상도 보간 방법을 제안한다. 수평 해상도 보간 시에 격행주사 방식으로 전송 받은 라인과 디인터레이싱 기법을 이용해 보간한 라인의 특성에 따라 각 라인에서 활용할 수 있는 전송 받은 값을 가지고 각각 다른 보간 방법을 적용함으로써 정확도를 향상하는 방법을 제안한다. 제안된 방법의 실험 결과는 기존의 보간 기법들보다 주관적, 객관적 화질에서 더욱 우수한 성능을 보여준다.
-
본 논문에서는 지상파 클라우드 방송 시스템 (cloud transmission system)의 수신 성능 비교를 위한 선행연구로서 채널 추정을 고려한 수신기 비트 오율 (bit error rate) 성능을 비교한다. 클라우드 방송 시스템은 2 개 이상의 동일채널간섭이 존재하는 환경에서 동작해야 하므로 negative SNR (signal-to-noise ratio) 영역에서 동작해야 한다.
-
최근 멀티미디어 트래픽의 증가로 인해 효율적인 전송방법이 대두되고 있다. 분할된 인코딩 영상의 Intra frame의 주기와 GOP 사이즈와 같게 하되, Intra frame의 시작시간을 달리하여 영상 bit rate의 fluctuation을 감쇄 및 평탄화 한다. 이를 활용해 같은 대역폭 상황에서 기존의 기술보다 원활한 Conversation Service가 효율적으로 이루어지도록 하는 방법을 제안한다.
-
The main goal of this paper is to present an adaptive filter system using NLMS(Normalized Least mean square) adaptive algorithm for noise cancellation. The proposed algorithm has less computational complexity and better convergence property than the former algorithms like spectral subtraction algorithm, etc. We use TIMIT criterion voice and Noisex-92 for the experiment. The experimental result shows the feasibility of our algorithm for filtering noise from voice effectively.
-
본 논문에서는 어파인(affine) 변환에 불변하는 지역 검출기에 대하여 다양한 기술자의 성능을 비교하였다. 지난 수 년간 다양한 특징 기술자들이 연구되어 왔고, 이러한 특징 기술자들은 각각의 목적에 따라 상이한 특성을 갖고 있기 때문에 동일한 조건에서 다양한 기술자들의 성능을 비교하는 연구가 필요하다. 그러나 어파인 변환에 불변하는 지역 검출기에 대해 최적의 특징 기술자를 찾는 연구는 미흡한 실정이다. 따라서 본 논문에서는 지역적인 패치 기반의 특징 기술자뿐만 아니라 바이너리 기술자와 최근에 제안된 기술자들의 성능을 비교하였다. 제안하는 실험에서는 MSER (maximally stable extremal regions) 검출기를 이용하여 어파인 변환에 불변하는 지역을 검출하였고, 영상 확대 및 축소, 회전, 시점 변환 및 변형 가능한 물체에 대하여 각각 기술자의 성능을 비교하였다.
-
최근 스마트 폰 가입자 수 증가와 함께 모바일 기기의 보급이 대중화 되었다. 모바일 기기 대중화로 다양한 형태의 멀티미디어 콘텐츠 소비가 많아지면서 새로운 콘텐츠를 요구하는 사용자들 늘어나고 있다. 다양한 소비 계층에서 콘텐츠의 수요가 늘어나고 있지만, 현재 시장에서는 공급량이 수요에 미치지 못하고 있다. 모바일 기기중 하나인 디지털 앱북 콘텐츠 또한 시장에서 더 많은 콘텐츠가 필요하다. 본 논문에서는 디지털 앱북의 콘텐츠 증가를 위해 디지털 앱북 제작에 있어 코드 재사용성 증가로 인한 체계적인 개발과 유지지보수의 용이함을 높이기 위해 사용자와의 다양한 상호작용 기능들을 라이브러리로 구현하고 검증하였다. 라이브러리는 사용자 동작부와 기기 동작부로 구성하고 각 동작부의 명령들을 조합하여 상호작용 메소드 형태로 존재하도록 설계하였다. 구현된 라이브러리는 코드 사용량을 크게 줄여 개발 시간 단축에 영향을 주어 디지털 앱북 콘텐츠 제작에 있어 효율을 높여준다.
-
디지털 방송 서비스가 널리 보급되고 확대 되면서 사용자는 프로그램 제작자가 만든 순서대로 시청하는 방송이 아닌 개인이 원하는 장면을 원하는 시간대에 시청하는 맞춤형 방송 서비스에 대한 요구가 생겨나게 되었다. 이러한 맞춤형 방송 서비스에서는 프로그램의 정보를 미리 저장하고 사용자가 입력한 데이터를 바탕으로 검색하기 위하기 위한 메타데이터 정보가 중요하다. 기존의 맞춤형 방송 서비스는 사용자가 원하는 장면 별로 시청할 수 있는 반면에 본 연구는 원하는 장면뿐만 아니라 사용자가 보고 싶은 객체를 원하는 카메라 시점에서 시청할 수 있는 객체중심의 맞춤형 영상 미디어 서비스를 위한 메타데이터 구조에 대한 연구이다. 본 연구를 통하여 사용자에게 기존의 맞춤형 방송 서비스에 없었던 객체에 대한 세그먼트 정보를 제공해 줌으로써 시청의 폭을 넓혀 사용자의 방송 시청 만족도를 높일 수 있다.
-
Kim, C.M.;Oh, K.C.;Yoon, H.S.;Oh, K.H.;WHang, B.T.;Kang, M.G.;Seo, J.W.;Kim, H.S.;Park, Y.S. 188
본 논문에서는 와이파이 802.11ac기반의 비디오 브리지(Video bridge)는 액세스 포인트 인 모바일 라우터와 비디오 브리지를 결합한 모바일 AP라우터가 보안이슈와 파일공유 방안을 제안하고자 한다. -
본 논문에서는 안드로이드 기반의 스마트 셋톱박스인 OTT(Over The Top)가 3D 게임용 유니티 엔진을 위한 인터페이스를 제공하는 유니티 런처의 설계를 기반으로 LS(HTTP Live Streaming) 스트리밍 서버 및 스트리밍 동영상용 3D 텍스쳐를 설계한다.
-
증강방송(Augmented Broadcasting) 서비스 기술은 모바일 증강현실(Augmented Reality) 서비스를 TV 방송 환경에 접목하여 스마트미디어 시대의 새로운 방송통신 융합 서비스를 제공할 수 있는 서비스 기술로서, TV 시청자에게 기존 방송프로그램을 시청함에 있어서 좀 더 현실감과 몰입감을 높이기 위한 환경을 제공하고자 하는 것이다. 본 논문에서는 증강방송 시스템을 기반으로 이용자가 상대방에게 작성한 타깃팅 메시지를 수신자가 실시간 방송 시청 중에 소비할 수 있도록 하는 새로운 응용 서비스 기술에 대한 소개와 관련 응용 서버의 설계 및 구현에 관해 설명한다.
-
본 논문에서는 오디오기반 CCTV에서 비명 구간을 효과적으로 검출하기 위한 가중치 값을 실험을 통해 결정 하고자 한다. 경계값은 학습구간의 평균값에 가중치 값을 곱해주어 계산되며, 이 때 가중치 값에 의해 비명 구간 검출 성능이 결정된다. 따라서 본 논문에서는 가장 좋은 성능을 보이는 가중치 값을 결정하기 위해 가중치 값을 변화시키며 실험을 하였다. 그 결과 w값이 3일 때 검출률과 오인식률에서 가장 좋은 성능을 보였다.
-
고효율 비디오 부호화/복호화 표준인 HEVC(High Efficiency Video Coding)는 ITU-T(VCEG)와 ISO-IEC(MPEG)이 JCT-VC라는 팀을 이루어 공동으로 표준화를 진행 하였다. 이 표준에서는 동영상 압축의 대표적 기술인 인트라 예측 방법을 사용하며, 기존 H.264/AVC 보다 더욱 다양한 방향의 예측을 통한 부호화 및 복호화의 효율을 가져온다. 제안하는 방법은 다양한 방향의 화소 예측에 사용되는 율-왜곡 최적화 방법의 계산량을 개선하는 방법으로, 주변 화소의 변화량을 이용하여 선택적인 모드를 사용하는 고속화 알고리즘을 통해 기존 방법보다 약 20%의 부호화 속도 향상을 가져오는 방법이다.
-
본 논문에서는 HEVC 기반 비디오 부호화에 있어 CTU 단위의 시각 민감도에 따라 CTU 별로 QP 를 조절하여 주관적 화질을 향상시키는 방법을 제안한다. 시각 민감도를 측정하는 방법으로서 화소 영역에서의 최소가지차(JND, just noticeable distortion)를 계산하여 이용하였고, 이를 HM 12.0 참조 소프트웨어에서 이용되는
$R-{\lambda}$ 모델 기반의 율 제어 모듈에 결합하여 시각 민감도에 따라 QP 를 제어할 수 있도록 하였다. 시각 민감도가 큰 영상의 영역에 대해서는 상대적으로 작은 QP 값을, 시각민감도가 작은 영역에 대해서는 큰 QP 값을 양자화 과정에 적용함으로써, 시각 민감도가 작은 영역에 대해서는 사용 비트양을 절약하고, 절약된 비트를 상대적으로 시각 민감도가 큰 영역을 위해 사용함으로써 비디오의 주관적 화질을 향상시킬 수 있었다. 뿐만 아니라 이를 하드웨어에 적용 가능하게 하기 위해 HM 12.0 기반 하드웨어 구현을 위한 소프트웨어 플랫폼에 구현하여 실험한 결과,$R-{\lambda}$ 모델 율 제어 알고리즘으로 율 제어 하여 부호화 한 경우 Y-PSPNR(peak signal to perceptual noise ratio)에 대한 BD-rate 는 평균 9.4%의 이득이 있었음을 확인하였다. -
본 논문에서는 HEVC (High Efficiency Video Coding)의 IDCT (Inverse Discrete Cosine Transform) 모듈을 AVX2 (Advanced Vector Extensions 2) 명령어 셋을 사용하여 고속화하는 방법을 제안한다. 제안하는 방법은 4 개의
$4{\times}4$ 블록을 AVX2 레지스터에 로드 한 후, 동시에 AVX2 명령어 셋을 통해 한 번에 IDCT 를 수행한다. 제안하는 방법은$4{\times}4$ 블록 단위로 순차적으로 SIMD(Single Instruction Multiple Data) 명령어 셋을 통해 IDCT 를 수행하는 방법에 비해 명령어 단위의 병렬화 성능을 극대화한다. 실험 결과, HEVC 디코더의$4{\times}4$ IDCT 에 SIMD 명령어 셋을 적용한 경우 기존의 HM-12.1 에 비해 평균 3.35 배 수행 속도를 향상 시킨 반면, 제안하는 방법은 HM12.1에 비해 평균 9.50 배 수행 속도를 향상 시켰다. -
최근 인터넷 상에서 제공되는 영상 서비스에 대한 요구가 증가하고 있다. 하지만 네트워크 환경에서 전송되는 데이터는 오류로 인하여 쉽게 손실될 수 있다. 특히 HEVC(High Efficiency Video Coding)와 같이 높은 압축률로 압축된 정보에 대한 전송 오류는 영상 복원에 심각한 영향을 끼친다. 따라서 네트워크 환경에서 일정한 화질을 유지하기 위한 오류 은닉(Error Concealment : EC) 방법이 필요하다. 본 논문은 HEVC EC 를 위한 PU(Prediction Unit) 기반 움직임 벡터 외삽법(Motion Vector Extrapolation : MVE) 모델을 제안한다. PU 는 예측의 기본 단위로써 PU 내에 동일한 물체가 포함될 확률이 높다. 따라서, 이 모델은 손실된 프레임의 이전 프레임이 갖는 PU 정보를 이용하여 PU 단위로 외삽(extrapolation)을 실시한다. 또한, 손실된 블록과 외삽 블록간의 관계를 고려하여 겹쳐진(overlapped) 외삽 블록 중 가장 작은 PU 크기를 EC 기본 단위로 결정한다. 이 방법은 PU 정보를 반영함으로써 블록 경계 오류(block artifact)를 감소시킨다.
-
본 논문에서는 정보통신미디어계열 학과로서 서울 소재 고등학교 2 학년 학생들을 대상으로 고교-대학 연계 프로그램을 진행한 경험을 분석하였다. 1 차와 2 차로 나누어 진행하였고, 1 차에서는 이론특강과 실습을 통해 최신이론을 학습하고, 기초적인 실습을 하였으며, 2 차에서는 심화실습을 통해 학생들의 문제해결능력과 발전가능성을 가늠해보았다. 1 차에서 학생들은 이론과 실습을 흥미로워 하였으나 난이도에 대한 체감이 달랐고, 2 차에서는 협업하여 결과물을 도출하였고 전체적인 만족도가 높게 나타났다. 결과적으로 직접 하는 실습을 선호하였고, 진로와 전공 탐색에 도움이 되었다고 평가하였으며, 관련 분야로의 학습 의욕이 있음을 나타냈다. 본 경험을 통해 학생들이 이러한 연계프로그램에서 만족하는 것과 원하는 것이 무엇인지를 분석하여 지속적이고 체계적인 고교-대학 연계 프로그램 개발에 도움이 되고자 하는데 의의가 있다.
-
본 연구는 <아빠!, 어디가>(MBC), <슈퍼맨이 돌아왔다>(KBS2) 두 육아 리얼리티 프로그램의 시청동기를 '흥미로움', '출연아동들의 매력', '외로움 해소', '일상정서표현' 등 4가지로 밝혀내고, 이러한 시청동기와 시청시간간의 관계를 살펴보았다. 그 결과 '흥미로움', '출연아동들의 매력', '외로움 해소' 3가지 요인과 육아 프로그램 시청시간에 따라 차이는 유의미한 차이를 보였으며, 시청시간이 증가할수록 평균값은 높게 나타났다. 그리고 흥미로움과 일상정서표현 요인은 시청만족에 유의미한 결과를, 프로그램 시청시간과 흥미로움, 출연아동들의 매력, 일상정서표현의 요인은 재시청에 유의미한 영향을 미치는 것으로 나타났다. 본 연구 결과를 바탕으로 육아 리얼리티 프로그램의 만족감과 충성도를 높일 수 있도록 프로그램을 기획하고 프로그램 자원을 활용할 수 있을 것이라 기대한다.
-
스마트폰과 같은 모바일 기기의 사용이 확대되면서, 보다 쉽게 다양한 멀티미디어 콘텐츠를 획득하고 유통할 수 있게 되었다. 하지만, 획득 과정에서 이미지는 디포커스 및 움직임에 의해 블러해질 수 있다. 이와 같은 블러를 측정하기 위해, 다양한 선명도 평가 기법들이 제안되었다. 하지만, 대부분의 기존 기법들은 디포커스 블러의 특성에 따라 설계되어졌다. 따라서, 본 고에서는 주파수 분석에 기반하여 움직임 블러 이미지의 선명도를 평가하기 위한 알고리즘을 제안한다.
-
병원이 가깝지 못해서 혹은 사정이 넉넉하지 못해서, 혹은 병원에 갈 상황이 되지 못해서 병원에 가지 못하는 많은 사람들을 위해서는 보다, 환자의 입장에서 편리한 방법으로 진료를 하거나, 혹은 자가 치료, 자가 진단을 할 수 있는 교육이 필요하다. 그와 같은 원격의료를 하기 위해서는 의료가 실시 되는 기기의 수용의도가 중요하다고 판단된다. 본 연구에서는 원격의료를 위한 사용자(환자) 수용의도를 높이기 위해 요인관계를 분석하기 위하여 실시하였다. 총 299명에 설문에 참여하였으며, 15세~20세: 58명, 30대:86명, 40대:96명, 50대:59명이 참석하였으며 기술수용모델을 적용하였다. 연구는 원격의료에 사용되어지는 것이 가능한 양방향서비스기기 -IPTV, PC, 스마트폰(패드포함)-을 대상으로 진행되었으며, 연령 및 성별에 따라 사용의도가 크게 차이가 남을 확인할 수 있었다. 또한 매체자체에 대한 사용의도가 원격의료 수용의도에 큰 영향을 줌을 확인할 수 있었다.
-
본 논문에서는 단일주파수망에서 다수의 송신기로부터 전송되는 방송신호 간의 주파수를 일치시키기 위한 방법을 제안한다. 다수의 송신기로 동일한 송신채널을 통해 콘텐츠를 전송하는 경우 신호가 중첩되는 지역에서 주파수를 정확히 일치시키지 않으면 도플러효과가 야기되어 수신성능이 현저히 저하된다. 일반적으로 GPS 기준신호를 송신시스템의 참조주파수로 사용함으로써 방송신호 간의 주파수를 일치시킨다. 이 경우 GPS 기준신호로부터 복원된 참조주파수를 주파수 상하향 변환에 사용하면 위상지터가 증폭되어 방송신호 간의 순간적인 주파수 차이가 크게 발생할 수 있다. 이를 해결하기 위해 본 논문에서는 GPS 참조주파수보다 위상지터가 작은 송신기 자체의 국부발진기 주파수를 주파수 상하향 변환에 사용하는 한편 국부발진기 자체의 주파수 오차를 상쇄함으로써 방송신호 간의 주파수를 일치시킨다.
-
본 논문은 효과적인 열화영상의 복원을 위해 Multiresolution Bilateral Filter (MBF) 기반의 구간적 노이즈 분석을 제안한다. 기존의 MBF 알고리즘은 최적화되지 않은 노이즈 추정 값을 중첩적으로 사용하다보니 over smoothing 현상이 발생되는 결과가 도출되기도 하였다. 이에 따른 보완점으로 열화영상 내 전체 화소를 일정한 블록 단위의 영역으로 나누어, 영상특성을 최대한 보존하며 노이즈제거를 진행하기 위해 블록 단위의 영역 내에서 노이즈 추정을 위한 파라미터를 추가한다. 실험을 통해 제안된 알고리즘이 노이즈 추정을 수행하여 얻어진 노이즈의 분산 값을 보다 정확히 추정하였고, 이로 인하여 향상된 노이즈 제거 영상 획득이 가능함을 확인할 수 있었다.
-
Compressive sensing is a new sampling technique, which allows to sample a signal under the Nyquist-Shannon sampling rate. For block-based compressive sensing, a hybrid sensing matrix which contains low-frequency patterns in addition to the random Gaussian numbers is good for exploiting typical property of natural images. By noting that MH-BCS-SPL is well known for its good recovery performance, this paper investigates effect of the hybrid sensing matrix on MH-BCS-SPL in the sense of how large portion of low-frequency patterns can provide performance improvement.
-
TV홈쇼핑은 CATV, 위성TV, IPTV, DMB, 스마트폰 모바일로 생방송이 송출되고 있다. 여러 송출 매체 중 스마트폰 모바일 송출부분에서 방송 중 쇼호스트가 제품에 대해 설명하는 부분인 디테일부분에서 카메라의 워킹(Standard, Jimmy jib, Hand held, Dolly)에 따라 화질이 깨지는 현상(블록 현상)이 발생하고 소비자가 제품을 제대로 인식하지 못하는 불편이 있다. 본 논문에서는 카메라의 워킹에 따라 제품의 설명 중 화질의 변화하는 현상을 파악해 보고자 한다.
-
본 논문은 기존의 T-DMB(Terrestrial Digital Multimedia Broadcasting) 재난 정보 신호를 Wi-Fi(Wireless Fidelity)를 이용하여 재전송하는 기법을 제시한다. 각종 재난이 발생하는 지역의 T-DMB 난시청 구간에 대해서 Wi-Fi 를 이용하여 재난 정보 신호를 재전송함으로써 재난 정보 신호를 받지 못하는 시청자에게 신속한 재난 정보 서비스를 가능하게 해준다. 재난이 발생한 지역에서 T-DMB 재난 정보를 수신할 수 없는 시청자에게 AP(Access Point)를 이용하여 재난 정보를 재전송하는 것이 목적이다. 이에 본 논문에서 제안하는 Wi-Fi 를 이용한 재전송 기법은 T-DMB 신호를 수신하지 못한 시청자에게 재난정보를 효율적으로 재전송함으로써 해당 지역에 더 높은 재난 정보 수신률을 제공할 뿐만 아니라 국민의 생명과 안전을 도모할 수 있다.
-
최근 들어, 전세계적으로 재난의 빈도와 규모가 커지고 있다. 예상치 못한 재난이 발생하였을 경우, 재난관리의 소홀은 국가적 위기를 가져올 수도 있다. 따라서 효율적이고 통합되어있는 재난관리 시스템의 운영이 필수적이며 이를 위하여 모든 경보시스템에서 통용 가능한 공통된 프로토콜이 필요하다. 국제표준인 공통경보프로토콜(CAP: Common Alerting Protocol)이 그 대안이다. 공통경보프로토콜은 미국뿐 아니라 캐나다와 호주에서 사용 중이며, 각 나라의 상황에 맞는 요구사항을 추가한 프로파일을 작성하여 재난관리 시스템에 적용하고 있다. 우리나라 역시 국내 실정에 맞는 요구사항이 반영된 "통합경보시스템을 위한 공통경보프로토콜 프로파일"이 표준으로 제정되어 있다. 본 논문에서는 국내 "통합경보시스템을 위한 공통경보프로토콜 프로파일"과 공통경보프로토콜을 도입한 해외 각국의 프로파일을 비교한다.
-
최근 게릴라성 폭우등 지구 환경의 변화로 인하여 국지적 재난이 빈번히 발생하고 있는 상황이다. 국지적 재난 상황을 일반 국민에게 신속히 전파하는 방법으로 방송매체를 많이 이용하고 있으며 특히 디지털 방송과 같은 매체는 이동중이나 정전 그리고 데이터망이 유실된 상태에서도, 방송망을 활용한 재난방송 시스템이 필요한 상태이다. 이러한 점을 고려하여 DMB가 재난 방송에 적합한 매체로 인식이 되고 있다. 그러나 현재 DMB재난방송시스템은 광역 단위의 재난 상황시에만 DMB를 이용하여 상황전파가 이루어 지고 있으므로 국지적 재난상황과 같이 지역 맞춤형 재난방송을 통하여 재난방송의 신뢰성을 높이고 광범위한 정보가 아니라 지역단위의 필요한 정보를 제공하여 국민의 재산과 생명을 보호하는데 국지적 DMB 방송망이 적극 활용 되도록 재난경보방송시스템을 연구하였다.
-
본 논문에서는 OFDM(Orthogonal Frequency Division Multiplexing)시스템에서 OFDM 심벌 타이밍 옵셋에 따른 4096QAM 의 uncoded-BER(Bit Error Rate) 및 성상도를 측정하였다. uncoded-BER 은 수신기의 FEC(Forward Error Correction) 복호기 이전에서 측정된 BER 을 의미한다. 측정을 위해, OFDM 을 사용하는 DVB-C2(Digital Video Broadcasting for Cable Systems 2) 송수신기를 FPGA(Field Programmable Gate Array)를 이용하여 구현하였으며, OFDM 심벌의 CP(Cyclic Prefix)를 이용하여 OFDM 심벌 동기를 수행하였다. 일반적으로, OFDM 심벌 동기는 OFDM 심벌에서 CP 가 반복된다는 특성을 이용한 상관기를 사용한다. 또한, ISI(Inter Symbol Interference) 및 ICI(Inter Channel Interference)를 최소화하기 위해, 채널의 최대 지연시간을 고려하여 CP 내에서 OFDM 심벌 동기가 획득된다. 이럴 경우 수신기에서는 각 부반송파에 할당된 QAM 심벌들의 위상 회전이 발생하지만, 등화기에서 이러한 위상 회전이 보상된다. 부반송파에 할당된 파일롯 심벌들을 이용하여 채널 추정 및 보상을 하는 등화기에서, 파일롯 심볼들도 OFDM 심벌 타이밍 옵셋에 의해 위상회전이 발생하기 때문에 채널 추정 값에 영향을 미친다. 따라서, 본 논문에서는 4096QAM 과 ZF-LE(Zero Forcing Linear Equalizer)를 사용한 경우, OFDM 심벌 타이밍 옵셋에 따른 uncoded-BER 및 성상도의 측정 결과를 제시하였다.
-
케이블 방송망에서 최대 10Gbps 테이터 전송을 위해 최근 북미에서 표준화된 DOCSIS 3.1(Data over Cable Service Interface Specifications Version 3.1)에서는 고차 혼합 변조(Mixed Modulation) 방식을 제시하였다. DOCSIS 3.1 은 하향 데이터 전송을 위해 최대 192MHz 의 대역에서 4K 또는 8K 다중 직교 반송파를 사용한다. 특히 채널 오류 정정을 위한 채널 부호화 방법으로 유럽의 차세대 케이블 방송 표준인 DVB-C2(Digital Video Broadcasting - Cable Version 2)에 정의된 BCH(Bose, Chaudhuri, and Hocquenghem)와 LDPC(Low Density Parity Check) 연접부호를 사용한다. 단, DOCSIS 3.1 에서는 DVB-C2 와 달리 부호율 8/9 의 Short Mode 부호만을 사용하며 최대 16384-QAM 까지 사용한다. 하나의 부호율을 사용하기 때문에 QAM 차수에 따른 요구 SNR 의 차가 크게 된다. 주어진 채널 상황에서 최적의 전송용량을 얻기 위해 QAM 차수에 따른 요구 SNR 의 차를 줄일 수 있는 방법으로 혼합 변조가 도입되었으며, 본 논문에서는 혼합 변조에 따른 수신 성능을 제시한다.
-
기존 연구에서 무선 인지 네트워크의 성능 분석에 관한 연구는 많았지만 다중 사용자가 존재하는 무선 인지 네트워크에 차량 통신을 접목시킨 무선 인지 차량 네트워크의 성능 분석에 관한 연구는 많지 않았다. 또한 최근 실질적인 채널환경을 고려하기 위해 지연된 채널 상태 정보를 가진 시스템에서의 성능 분석에 대한 연구가 많이 진행되고 있는데, 다중 중계기가 존재하는 무선 인지 차량 네트워크에서 지연된 채널 상태 정보의 영향에 대한 연구는 아직 진행되지 않았다. 본 논문에서는 다중 중계기가 존재하는 무선 인지 차량 네트워크에서 지연된 채널 상태 정보의 영향을 분석한다. 본 논문에서는 스펙트럼 공유(spectrum sharing) 무선 인지 네트워크를 가정하고 차량간 통신이 일어나는 2차 사용자 네트워크의 채널들을 double Rayleigh fading으로 모델링 한다. 성능 분석의 지표로 불능 확률을 사용하고 컴퓨터 모의실험을 통해 지연된 채널 상태 정보의 영향을 확인한다.
-
방송 서비스를 안정적으로 제공하기 위해서는 가시청시간율을 안정적으로 확보하는 것이 중요하다. 이를 위해서는 수신단에서 ToV SNR 부근에서의 추가적인 margin을 확보하는 기술이 요구된다. 기존 방송 시스템은 안테나를 하나만 사용하는 수신 환경을 가정하고 있으므로, 본 논문에서는 하나의 안테나로부터 수신된 신호를 서로 다른 equalizer 기법 2가지를 동시에 적용하여 마치 2개의 수신 안테나부터 신호를 수신한 효과를 얻었고, 그 출력을 weight combining 하여 최종 SNR 이득을 높이는 기술을 제안하였다. 특히, equalizer 기법은 기존에 성능이 우수하다고 알려져 있는 MMSE-DFE 기술과 최근 큰 주목을 받고 있는 compressed Sensing 기반 sparse-DFE 기술을 동시에 사용하였다. Simulation을 통해서 MMSE-DFE 또는 sparse-DFE를 단독으로 사용하는 것보다 두 기법을 가중치 결합을 통해서 사용함으로써 가시청시간율이 크게 향상되는 것을 확인하였다.
-
최근 얼굴 인식 기술과 하드웨어의 빠른 발전으로 인해 실시간 얼굴 검출이 가능한 다양한 어플리케이션이 제시되고 있다. 특히 네트워크의 발달과 영상 장비의 저 비용화로 IP 기반의 네트워크 감시 카메라와 얼굴 검출 기술을 이용한 스마트 감시 카메라의 요구와 저장된 감시카메라의 영상에서 얼굴 검출을 할 수 있는 스마트 감시 시스템의 요구가 증대되고 있다. 그러나 대부분의 감시 시스템은 네트워크 대역폭과 저장 용량을 감소시키기 위하여 영상을 압축하고 있다. 압축된 영상을 전부 디코딩 하고 모든 프레임에서 얼굴 검출을 하는 것은 시스템 성능 요구사항을 증대시키므로 압축된 영상을 이용한 빠른 얼굴 검출기법이 요구되고 있다. 본 논문은 기존의 Haar like features와 adaboost 학습기 등의 고속화된 얼굴 검출 알고리즘과 모션정보를 이용한 프레임 저감기법을 이용하여 압축된 프레임에서 고속으로 얼굴검출을 하는 방법을 제시하고 방송 응용분야에 대해 논의 하고자 한다.
-
UHD 디스플레이의 보급과 UHD 케이블 시험방송이 송출되면서 HD를 넘어선 고화질 실감방송의 시대가 다가오고 있다. 하지만 방송 송출과 제작 시스템에서는 UHD의 많은 요구 대역폭과 용량으로 인하여 원활한 UHD 방송에 차질을 빚고 있는 실정이다. 위의 문제를 해결하기 위하여 2배 이상 압축율이 좋은 HEVC(High Efficiency Video Codec)이 등장과 클라우드 기반 편집 시스템의 등장으로 인해 문제가 해결될 전망이다. 또한 원활한 UHD영상, 색인 및 검색을 위해서는 영상의 장면전환 정보를 빠르게 검출하는 것이 필요하다. 따라서 본 논문에서는 고효율 코덱으로 압축된 UHD 대용량 영상 색인과 검색을 위한 장면전환 정보를 빠르게 얻을 수 있는 방법을 제시한다. 제시한 이 알고리즘을 사용하여 다양한 UHD영상에서 빠른 장면전환 정보 검출을 하여 편집등 다양한 어플리케이션에 관한 응용에 대해서 고찰해 보고자 한다.
-
현재 MPEG 에서 Royalty-Free 비디오 코덱인 Type-1 표준으로 진행중인 IVC(Internet Video Coding)에서는 저지연 모드(LD: Low-Delay) 부호화 구조에서 비참조 P 프레임 부호화 기법을 적응적으로 사용하여 부호화 이득을 얻고 있다. 비참조 P 프레임 기법은 P 프레임의 타입을 지정하여 고정된 부호화 구조의 비참조 P 프레임을 적용하고 있으나, ITM(IVC Test Model) 9.0 에 구현된 부호화 구조는 다중참조 프레임(MRF: Multiple Reference Frame)을 사용할 때 시간적 예측 거리가 먼 참조 프레임을 먼저 예측하는 단점이 있다. 본 논문에서는 다중참조 프레임에서 기존의 P 프레임 타입 설정을 변경하여 비참조 P 프레임의 부호화 구조를 개선하였다. 실험결과 제안 기법은 시퀀스에 따른 큰 성능 저하 없이 기존 기법 대비 0.6% 정도의 추가적인 비트율 감소로 얻음으로써 비참조 P 프레임 기법이 ITM 9.0 대비 7.9% 정도의 비트율 감소를 얻음을 확인하였다.
-
본 논문에서는 High Efficiency Video Coding (HEVC)의 확장 버전에 적용된 바 있는 화면 내 블록 복사 (Intra Block Copy; IntraBC) 기술에 대해 개선 알고리듬을 제안하고 있다. IntraBC 는 화면 내 부호화 진행 시, 예측 유닛 (prediction unit; PU)단위로 현재 부호화하고 있는 코딩 트리 유닛 (coding tree unit; CTU)의 왼쪽에 위치하는 CTU 를 탐색하는 기법이다. 이때, 왼쪽 CTU 에서 가장 비슷한 블록을 찾아 그 움직임 벡터 (motion vector)를 저장 및 전송하게 된다. 제안하는 알고리듬은 움직임 벡터를 찾기 전, 왼쪽의 복원된 CTU 에 대해 특정 필터를 적용하여 블록킹 열화 (blocking artifact)를 완화시키고, 더욱 정확하고 섬세한 움직임 벡터를 찾도록 하였고, 이는 자연영상보다 스크린 콘텐츠에 더욱 적합함을 확인할 수 있었다.
-
본 논문은 FME (Fractional Motion Estimation)의 선택적 수행을 통한 HEVC (High Efficiency Video Coding)의 부호화 고속화 방법을 제안한다. HEVC 는 H.264/AVC 에 비해 약 2 배의 압축 효율을 보이지만, 쿼드트리 구조의 재귀적 호출은 복잡도를 크게 증가시켰다. 이러한 이유로 인하여 HEVC 부호화기의 고속 모드 결정 및 고속화 연구가 활발히 진행되고 있다. 본 논문에서는 HEVC 부호화기 중 가장 높은 복잡도를 갖는 화면 간 예측 모드의 부화소 움직임 추정 (FME: Fractional Motion Estimation)의 선택적 수행을 통하여 부호화기를 고속화하는 방법을 제안한다. 제안하는 방법을 HEVC 레퍼런스 소프트웨어인 HM-12.0 에 적용하여 평균 2.0%의 BD-BR 가 증가하였으나, 평균 36.0%의 부호화 시간 감소 효과를 얻을 수 있었다.