Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2014.11a
-
본 논문에서는 하드웨어 HEVC 인코더의 화면간 예측의 구조를 제안한다. 제안된 화면간 예측은 정수화소 움직임 예측을 통해 코딩 트리 유닛 내 코딩 유닛 분할과 각 코딩 유닛의 분할모드를 결정한다. 그리고, 부화소 움직임 예측, Merge모드 판단을 통해 예측 유닛의 움직임 벡터를 확정하고 움직임 보상을 수행한다. 이 과정에서 율-왜곡 비용계산 및 보간 필터 등의 하드웨어 자원이 효율적으로 공유된다. 또한, 전력소모를 줄이기 위하여 코딩 유닛의 skip 여부의 조기 판단을 통해 부화소 움직임 예측 및 화면내-화면간 최종 예측모드 결정과정의 전부 또는 일부를 생략하는 방법을 제공한다. 제안된 화면간 예측을 포함한 하드웨어 HEVC 인코더를 구현하여 실험한 결과, 250 MHz 의 동작 주파수에서 초당 124 Mpixel 의 처리성능을 보였으며, HM-14.0 대비 PSNR 0.5~0.8 dB 수준의 화질열화를 나타냈다.
-
본 논문에서는 하드웨어 HEVC 디코더의 움직임 보상 모듈의 구조를 제안한다. 제안된 구조를 갖는 움직임 보상 모듈은 하드웨어 처리 싸이클 수와 내부메모리 크기를 감소시키기 위해 하나의 코딩 유닛을 그보다 작은 여러 개의 블록으로 분할하여 처리할 수 있다. 제안된 움직임 보상 구조는 캐시를 통해 외부 메모리에 접근하여 참조 픽쳐를 로딩하는 단계와 보간 필터를 거쳐 예측 샘플을 생성하는 단계로 내부-파이프라인을 구성하며 코딩 유닛의 크기에 따라 내부-파이프라인에서 처리할 블록의 크기를 결정한다. 본 논문에서는 코딩 유닛 분할의 기준이 되는 블록 크기를 결정하기 위한 절충사항에 대해서도 논의한다. 제안된 구조의 효율성을 판단하기 위해 구현된 움직임 보상 모듈을 RTL 시뮬레이션 및 FPGA 보드 검증을 통해 테스트 하였으며, SoC 로 제작될 경우 초당 249 Mpixel 을 처리하여 4K-UHD 시퀀스의 실시간 디코딩이 가능한 것으로 판단되었다.
-
본 논문에서는 하드웨어 기반의 Sample Adaptive Offset (SAO) 부호화기에서 전체 면적 중 상당히 큰 비중을 차지하는 통계값 테이블의 면적을 개선하는 방법을 제안한다. 파이프라인으로 동작하는 통계 계산과 최적 모드 결정 모듈의 통계값 테이블 접근 분석을 통하여 Luma 테이블을 재사용함으로써 Cr 테이블을 제거할 수 있다. 또한 테이블의 bit width 를 가능한 값의 최대 범위가 아닌, 충분히 큰 범위로 제한함으로써 면적을 감소시킬 수 있다. 제안한 방법을 적용했을 때 합성을 통해 예측된 면적이 46% 가량 감소하는 것을 확인하였다.
-
In a 2-dimensional (2D) Discrete Cosine Transform (DCT) hardware, a significant fraction of the total hardware area is contributed by the combinational logic used to perform 1-dimensional (2D) transform. The size of the non-combinational logic i.e. the transpose memory is dictated by the size of the largest transform supported. Hence, the optimization of hardware area is performed mainly for 1D-transform combinational logic. This paper demonstrates the use of Multiple Constant Multiplication (MCM) algorithm to reduce the combinational logic area. Partial optimizations are also described for the cases where the direct use of MCM algorithm doesn't meet the timing constraint. Experimental results show that 46% improvement in gate count is achieved for 32 point 1D DCT transform logic after using MCM optimization.
-
본 논문에서는 AZB (All-Zero Block) 검출을 이용한 조기 부호화 단위(Coding Unit, CU) 결정 방법을 제안한다. HEVC 영상 코덱의 하드웨어 구현에서 이산여현변환(DCT)는 많은 부호화 자원을 필요로 하는 과정으로 DCT 수행 이전에 블록 내의 모든 양자화 계수가 0 이 되는 영블록(All-zero Block)을 미리 검출하여 DCT 및 양자화 과정을 생략하고 CU 의 부호화 과정을 조기에 종료함으로써 부호화 복잡도를 크게 감소시키는 방법을 제안한다. 기존의 SAD (Sum of Absolute Difference) 또는 SATD (Sum of Absolute Transform Difference)에 기반하는 AZB 검출 방법은 HEVC 에서 새롭게 추가된 큰 크기의
$16{\times}16$ 와$32{\times}32$ DCT 에서 AZB 을 효율적으로 검출할 수 없는 한계가 존재한다. 본 논문에서는 DCT 변환 커널이 하다마드 변환 커널과 또 다른 정규 직교 변환 커널로 분할하여 표현할 수 있는 성질을 이용하여, 부화소 움직임벡터 추정 과정을 통해 생성된 하드마드 변환 계수에 DCT 를 생성하는 변환 커널을 곱하여 DCT 변환 커널을 생성한 후 양자화 계수를 이용하여 CU 단위의 AZB 을 검출하는 방법을 제안한다. 또한 AZB 검출과 움직임 벡터의 크기를 이용하여 현재 CU 의 부호화 과정을 조기에 종료하는 방법을 제안한다. 제안하는 AZB 검출과 CU 조기 종료 부호화 방법을 사용하면 평균적으로 34.7%의 부호화 시간을 감소시켜 부호화 복잡도를 크게 줄일 수 있다. -
본 논문에서는 하드웨어의 제한된 자원을 이용하여 HEVC 코덱을 구현할 때 DCT 와 엔트로피 부호화를 사용하지 않고 율 및 왜곡값을 예측하여 고효율의 부호화를 수행하는 방법에 대하여 제안한다. HEVC 는 기존의 부호화기에 비하여 계층적 부호화 구조와 함께 큰 블록 크기를 갖는 DCT 와 엔트로피 부호화를 반복적으로 수행하기 때문에 하드웨어 구현 시 그 복잡도가 매우 크게 증가한다. 먼저 DCT 는 하다마드변환 행렬과 또 다른 정규 직교 변환 행렬의 곱으로 표현될 수 있는 성질을 이용하여 부호화 변환 시 생성된 하드마드변환 행렬에 저복잡도의 정규 직교 변환 행렬을 곱하여 DCT 변환 계수를 생성한 후 변환 및 양자화를 수행한다. 왜곡값의 경우, 이 때 생성된 양자화 계수와 변환 계수 간의 차이를 변환도메인에서 제곱합을 이용하여 계산하여 역변환을 생략함으로써 복잡도를 감소시킬 수 있다. 또한 텍스처에 대한 비트율 예측은 각 CU 블록내의 양자화 계수의 수를 더하여 계산하여 엔트로피를 수행하지 않고 예측할 수 있다. 그리고 비 텍스처에 대한 비트율 예측의 경우 움직임벡터의 비트에 대한 Pseudo CABAC 코드를 수행하여 예측할 수 있다. 이러한 저 복잡도의 텍스처 및 비텍스처 비트와 왜곡을 예측함으로써 하다마드변환만을 이용하여 부호화하였을 때에 비해 최대 33%의 비트율 감소를 얻을 수 있었다.
-
본 논문에서는 스크린 컨텐츠 동영상의 효율적인 압축을 위한 부호화 기법을 제안한다. 제안 부호화 기법은 RGB 색 요소 간의 신호의 통계적 중복성을 줄이기 위한 적응적 색 변환 기법에 기반한다. 기존의 색 변환 기법들은 스크린 컨텐츠 동영상이 포함하는 신호의 급격히 변화하는 ?계적 특성에 적용하기 어려운 반면 제안 방식에서는 부호화 블록의 시간적/공간적 주위 픽셀의 정보를 이용한 성분 분석을 통해 색 공간 변환 행렬식을 유도하여 부호화에 사용한다. 주위 픽셀 정보는 부호화 블록의 예측 방식에 따라 결정하며 움직임 벡터를 이용한 시간/변위 예측 부호 방식에서는 참조 블록의 정보를 이용하고 공간적 예측 방식에서는 블록의 인접 픽셀를 이용한다. 부호기 측에서는 비트율-왜곡 최적화를 통하여 예측 후 잔여신호의 부호화를 원래의 RGB 공간에서 수행할지 또는 색 변환한 공간에서 수행할지를 결정하고 관련 정보를 표시하여 블록 단위로 전송함으로써 부호화 효율을 증대한다. 실험에 의하면 제안 기법은 기존 압축 방식 대비 탁월한 부호화 성능을 제공함을 보인다.
-
3D 방송서비스를 위해 다양한 방식이 제안되어 왔으며 최근에는 주파수 효율성을 극대화한 방식인 고정 및 이동 방송 융합형 3DTV 방송 방식이 북미 표준으로 채택되었다. 고정 및 이동 방송 융합형 3DTV 방송 방식은 기존의 고정 방송 및 이동 방송망을 활용하여 좌안 영상과 우안 영상 스트림을 전송하는 방식이며, 3D 방송서비스 제공을 위해 별도의 주파수 할당을 할 필요가 없으므로 높은 주파수 효율성을 제공할 수 있다. 본 논문에서는 ATSC의 고정 및 이동 방송 규격과 DVB T2의 고정 및 이동 방송 규격의 차이를 시그널링 정보 전송 관점에서 분석하고 고정 및 이동 방송 융합형 3DTV 서비스를 DVB T2 방송환경에서 제공하기 위한 시그널링 방식을 제안한다.
-
에너지 하베스팅 기술은 외부의 지속적인 에너지 공급 없이 통신 시스템의 수명을 오랫동안 유지할 수 있는 수단의 하나로 각광받고 있다. 최근에는 수신한 신호에서 에너지를 얻는 전력 분배의 기법이 제안되었다. 본 논문에서는 인지 무선 통신 시스템에서 이차 사용자가 에너지 하베스팅을 사용하는 중계기를 사용할 때 중계기들 중 하나를 선택하는 기법의 불능 확률을 분석한다. 중계기는 전력 분배의 기법을 사용하여 에너지를 저장하며 선택된 중계기는 수신한 신호를 복호 후 전송한다. 컴퓨터 시뮬레이션을 통해 간섭 제약 조건과 이차 사용자의 중계기 수가 달라질 때의 불능 확률을 살펴본다.
-
현재 소방방재청에서 2009년에 설치 운영중인 DMB재난방송시스템은 지역단위의 재난방송으로 활용을 하지 못하고 광역단위의 재난방송에 활용되고 있는 실정이다. 게릴라성 폭우등 지구 환경의 변화로 인하여 국지적 재난이 빈번히 발생하고 있는 상황에서 광역적인 재난방송 보다는 국지적 재난 상황을 일반 국민에게 신속히 전파하며, 지역에 맞는 대피 방법등을 지역맞춤 재난방송을 전달함으로 재난에 대한 국민의 신뢰도를 높이는 것이 필요하다. 국민들이 가지고 있는 DMB 수신기를 최대한 활용하여 신속하고 정확한 멀티미디어 재난정보 전달체계를 구축하려면 많은 예산과 인력이 필요하다. 이런 문제점을 R&D를 통해 지역에 적합한 정보를 수집하고 방송하면서 중앙재난상황실에 설치된 DMB재난방송시스템을 활용한 지역 재난방송이 가능하도록 전략을 연구하였다.
-
스트리밍 전송을 위한 P2P 구조는 크게 메쉬구조와 트리 구조로 구분된다. 실시간 스트리밍에 유리한 트리 구조의 단점을 보완하기 위해 많은 연구가 진행되고 있다. 대표적으로 두개 이상의 트리 구조를 유지하는 다중 트리구조와 사용자들 중에서 안정적인 사용자를 트리의 중심에 위치시키는 백본 트리 구조가 있다. 다중 트리 구조는 단일트리의 단점을 극복하기 위해 트리와 메쉬 구조를 혼용한 구조로 안정적인 반면, 사용자들의 출입이 잦아지면 구조를 유지하기가 어려워지는 단점이 있다. 백본 트리 구조는 안정적인 사용자들로 트리의 중심 빼대를 구축한 후 나머지 사용자를 뼈대의 가지에 위치시키는 방법이다. 본 논문에서는 새롭게 설계한 분산형 스트리밍 전송기술을 위한 프로토콜의 구조에 대해서 설명하고, 제안된 프로토콜을 시뮬레이션을 통해 P2P 기반의 스트리밍 서비스의 가능성을 본다.
-
본 연구는 N스크린 서비스의 유료이용자와 무료이용자 간의 이용행태와 삶의 만족도를 비교 분석하였다. 그 결과, 두 집단간 방송 프로그램을 시청할 때 다양한 디바이스를 통해 연계 이용하는 행위는 통계적으로 유의미한 결과를 나타냈으며, 무료이용자가 더 많은 디바이스를 통해 연계이용을 하고 있음을 밝혀냈다. 또한, 개인적 만족도는 유료이용자가 더 높게 나타났으며 통계적으로 유의미한 결과를 나타내었다. 마지막으로 동영상 콘텐츠를 유료로 지출하는 행위는 개인적 삶의 만족도에 부정적인 영향을 미쳤으며, 방송 콘텐츠를 유료로 지출하는 행위는 관계적, 집단적 삶의 만족도에 정적인 영향을 미치는 것으로 나타났다. 본 연구를 통해 N스크린 서비스 이용자의 이용행태에 맞춤형 서비스를 제공, 사업자의 비즈니스 모델을 모색하는데 도움이 될 것이라 판단된다.
-
디지털 케이블 방송 시스템은 기존의 아날로그 케이블방송과 달리 하나의 6MHz 주파수 대역에 여러 방송채널들을 전송하고 있다. 즉, MPEG2 또는 H.264/AVC 등 비디오 압축 방식으로 인코딩된 여러 방송채널들과 각 채널의 대한 정보를 제공하기 위한 PSI 정보를 생성하여 멀티플렉싱하여 6MHz 주파수 대역으로 전송하는 방식으로 서비스를 제공한다. 하지만, 근본적으로 디지털 케이블 방송에서는 방송채널 변경 시 QAM Tuner의 주파수 Locking 및 디멀티플레싱, PSI 정보 파싱을 통한 채널 정보 획득, 비디오 및 오디오 디코딩을 위한 RAP(Random Access Point) 획득, 스크램블채널을 위한 ECM 획득 등의 시간 지연이 발생함에 따라 아날로그 케이블방송과 비교하여 상당한 채널 변경 지연이 발생한다. 이러한 이유로 디지털 케이블 방송 서비스의 품질 향상을 위해서는 채널 변경 시간 지연을 최소화하기 위한 연구가 필요하다. 따라서, 본 논문에서는 채널 변경 지연 요소들을 분석하고, 채널 변경 지연을 최소화하기 위한 기법을 제안한다.
-
카메라를 갖춘 모바일 기기가 보편화되면서 모바일 환경에서 영상처리를 이용한 다양한 응용이 확산되고 있다. 영상은 다른 정보에 비해 데이터의 양이 비교적 방대하기 때문에 모바일 환경에서 영상처리를 수행하기 위해서는 처리속도, 전력, 발열 등의 물리적 제약조건이 존재할 수 있다. 본 논문에서는 이러한 문제를 극복하기 위해 모바일 기기에서 코프로세서인 임베디드 GPU(Graphic Processing Unit)를 이용한 영상처리의 고속화 방법을 제시한다. 실험에서는 보편적으로 활용되는 영상처리 알고리즘에 대해 CPU(Central Processing Unit) 및 GPU 각각에서의 성능을 비교함으로써 고속화 방법의 우수성을 검증하고 특징을 분석하였다.
-
본 논문은 안드로이드 스마트 폰 환경에서 정중앙 블록과 주변 블록들 간의 블록 대비도를 이용해 눈썹을 검출한 후, 눈썹과 눈 간의 기하학적 특성을 이용해 눈의 위치를 찾는 눈 검출 방법에 관한 것이다. 제안된 방법은 Haar-like 특징과 AdaBoost 알고리즘 그리고 적응형 템플릿 정합을 이용해 입력 영상에서 얼굴 영역을 검출한 후, 이를 이용해 좌측 및 우측 눈썹과 눈 탐색 영역을 산정한다. 눈썹 영역의 Integral Image에서 눈썹에 해당하는 부분이 주변 블록들에 비해 상대적으로 어둡다는 특성을 이용해 눈썹을 추출한다. 이와 동시에 각 눈 탐색 영역의 Integral Image에서 동공 블록이 나머지 주변 블록들에 비해 상대적으로 어둡고 대칭성이 양호하다는 특성을 이용해 눈 후보 영역들을 추출한 후 최대 블록 대비도를 갖는 블록의 중심화소를 동공 후보점으로 삼는다. 이후 눈의 위치는 항상 눈썹 하단에 위치하며 그 떨어진 정도가 사람마다 크게 다르지 않다는 기하학적 특성을 이용해 눈 후보 영역에서 나온 동공 후보 점들을 검증한다. 제안된 방법은 거리 및 조명 변화 그리고 안경 착용에 강인한 것이 장점이다. 눈썹을 먼저 찾은 후 기하학적 특성을 이용해 좌우 동공 후보점 쌍의 적합성을 검증함으로써 안경과 눈을 효과적으로 구분할 수 있고 눈이 감겨 동공이 가려진 상태에도 감긴 눈의 위치를 검출할 수 있다.
-
최근 국내외에서 모든 사물이 인터넷에 연결되는 초(超)연결혁명이 진행 중이며, 앞으로 사물인터넷 기반의 다양한 혁신과 사업기회가 창출될 것으로 전망되고 있다. 하지만 국내의 경우 세계 최고 수준의 광대역 방송통신 인프라 및 IoT 기기 제조역량 등을 갖추고 있으나, 표준 기반의 개방형 IoT 플랫폼의 부재로 국내 기업의 시장 진입이 어려운 상황이다. 대기업은 개별적으로 플랫폼을 개발중이나 글로벌 시장에 대한 주도력이 부족하고, 중소기업은 플랫폼 부재로 시장진입이 어려워 향후 스마트 폰 산업에 이어 IoT 산업마저 글로벌 기업에 종속될 우려가 있다. 이에 본 논문에서는 국내외 다양한 분야의 기업들이 참여하여 다양한 홈 IoT 제품과 서비스를 개발할 수 있도록 특정 플랫폼이나 솔루션에 제약 없이 다양한 IoT 기기를 연결, 제어가 가능한 표준 기반의 개방형 홈 IoT 서비스 제공 방안을 연구하였다. 실험 결과에서는 제안된 개방형 홈 IoT 플랫폼을 통해 Z-Wave, IP, ZigBee, IrDA 등 다양한 통신 방식을 사용하는 홈 IoT 기기를 제어하고 정보 수집하여 사용이 가능함을 보여주었고, 이를 기반으로 플랫폼을 빅데이터 기술 및 기계학습 기능을 추가적으로 고도화하면 다양한 사물로부터 수집된 정보와 방송 정보, 웹 정보 등을 융합한 서비스 제공 등 소비자 중심의 창의적인 신규 방송통신 융합서비스 제공이 가능할 것으로 기대가 된다.
-
본 논문에서는 비문(鼻紋)을 이용한 개의 개체인식 시스템을 제안하고자 한다. 기존의 비문을 기반으로 한신원 확인 시스템에서는 종이에 비문을 찍어내어 일반화(generalization)된 데이터를 만드는 과정을 거치거나, 기계학습을 위해 한 개체에 대한 여러 장의 사진을 요구하는 문제점을 가지고 있다. 본 논문에서는 한 개체에 대한 두 장의 사진과 SURF(Speeded-Up Robust Features) 알고리듬을 이용한 특징점 추출(feature detection), FREAK(Fast Retina Keypoint) 특징 기술자(feature descriptor)를 사용한 개체인식 시스템을 제안한다. 비문 이미지에는 개 코의 특성상 반사로 인한 다수의 노이즈가 생기게 되는데 이를 극복하기 위한 전처리 과정이 제안 알고리듬에 포함되어 있다. 실험결과 두 장의 사진으로도 비문 기반의 개체인식을 할 수 있다는 것을 알 수 있다.
-
본 논문에서는 deconvolution 알고리즘 중에 하나인 Richardson-Lucy deconvolution 의 개선된 알고리즘을 제시한다. Richardson-Lucy deconvolution 의 단점인 반복횟수가 증가할수록 노이즈도 같이 증폭되는 현상을 소개하고 이를 개선하기 위해 기존 알고리즘에 전, 후처리 필터를 이용하여 노이즈 증폭을 억제한다. 또한 다른 노이즈 증폭을 억제하는 알고리즘과 제안된 알고리즘의 비교를 통해서 제안된 알고리즘의 성능을 보여준다.
-
wu, Xiangjian;Kim, Youngwoong;Ahn, Yong-Jo;Kim, Yong-sung;Kim, Seung-Hwan;Cho, Hyung-Jun;Sim, Donggyu 56
본 논문에서는 압축 도메인에서 고속으로 움직임을 검출하고 해당 구간을 저장 하는 알고리즘을 제안한다. 제안하는 알고리즘은 H.264/AVC 기반의 압축 비트스트림에서 움직임 벡터와 참조프레임을 이용하여 움직임이 있는 프레임을 검출하고 움직임 유무에 따라 GOP 단위로 저장하는 과정을 수행한다. 압축도메인에서 움직임 검출과 구간 저장을 수행함으로써 복잡도를 낮추고 비디오 저장을 위한 공간을 절약해 실시간 다채널 영상 처리에 최적화 된 성능을 제공한다. 제안하는 움직임 검출 및 저장 시스템은 single thread 환경에서 실시간으로 평균 2957 프레임을 처리 가능하며, Multi thread의 경우 30 fps 영상 98개 채널을 실시간으로 처리 가능하다. -
다양한 센서를 내장한 스마트기기가 보급되면서 개인의 활동부터 환경 상태까지 광범위한 미시 데이터의 수집이 가능해졌고, 또한 데이터 저장매체의 가격과 통신비용이 급격히 하락하고 있으며, 컴퓨터의 연산능력과 데이터 분석 방법론도 눈부시게 성장하는 중이다. 이러한 데이터 처리 기술의 발전과 함께 빅데이터에 대한 사회적 인식의 제고가 맞물리며 빅데이터 시장이 빠르게 성숙하고 있다. 이에 따라 국내 외 대다수의 기업들이 빅데이터 기술을 도입 검토 중에 있으며, 특히 글로벌 콘텐츠(방송, 음악, 도서 등) 기업들의 맞춤형 추천 서비스 성공 사례들로 인해 빅데이터 기술이 콘텐츠 산업 업계의 차세대 먹거리로 주목을 받고 있다. 이에 본 논문은 국내 케이블 방송 사업자들이 빅데이터 기술을 접목한 차별화된 서비스 제공을 통해 고객에게 새롭고 차별화된 가치를 제공할 수 있는 서비스 방안에 대해서 연구하였다.
-
본 논문에서는 Saliency map과 Max Filter를 이용한 영상의 자막영역을 추출 한다. Saliency map은 눈에 띄는 영역, 즉 영상에서 주변영역에 비해 밝기 차이가 심한 영역과 윤곽선에 대한 특징이 강한 영역을 돌출하는 것을 말하며, MaxFilter는 중심 픽셀을 최대 윈도우 값을 사용하는 것으로 극단적인 Impulse Noise를 제거하는데 효과적이며 특히 어두운 스파이크를 제거하는데 유용하게 사용된다. 이 두 가지의 특징들을 이용하여 영상의 자막 영역을 추출한다.
-
방송사와 프로덱션 등에서 제작한 전문 방송용 콘텐츠뿐만 아니라, 개인이 온라인상에서 생성한 다양한 콘텐츠가 인터넷을 기반으로 스마트TV, 모바일 기기 등 다양한 단말을 통해 소비되고 있다. 이러한 콘텐츠가 언제, 어디서나, 서비스될 수 있도록 하기 위해서는 콘텐츠의 일관된 메타데이터 규격을 기반으로 상호운영성과 공유성을 가지도록 하는 것이 요구된다. 본 논문에서는 방송 콘텐츠 유통 메타데이터 구성 요소 및 형식에 대한 국내 표준을 기반으로 개인이 온라인상의 저작 도구를 이용하여 생성한 다양한 미디어 콘텐츠를 방송 콘텐츠 유통 메타데이터 규격에 맞도록 변환하는 동시에, 방송 콘텐츠 저작 도구에서 저작된 콘텐츠의 메타데이터를 표준 규격에 맞도록 생성하는 메타데이터 빌더를 설계하고, 이를 실제 서비스 환경에서 구현하였다.
-
본 논문은 EBME(Extended Bilateral Motion Estimation)알고리듬에서 가중치수를 개선시켜 알고리듬을 제안하였다. 제안된 알고리듬은 EBME(Extended Bilateral Motion Estimation) MCI(Motion Compensated Interpolation)에서 고정된 확장블록을 대신하여 확장블록이 주변근처를 이동하면서 SOAD(Sum of Overlapped area Absolute Difference)를 통하여 향상된 가중치수를 찾는 알고리듬이다. 이 논문은 EBME알고리듬에 비해 PSNR(Peak Signal to Noise Ratio)이 향상된 성능을 보였다.
-
최근 통신 분야에서는 새로운 수익을 창출하기 위해 다양한 융합 서비스 개발이 이루어지고 있다. 이와 같은 융합서비스 개발은 통신 망이 갖고 있는 다양한 기능을 API 형태로 개방한 Open API 기술을 기반으로 이루어지고 있으며, API의 특징상 통신망의 프로토콜을 모르더라도 인터넷을 기반으로 다양한 융합 서비스를 쉽고 빠르게 제작할 수 있다. 최근에는 통신 뿐만 아니라, 통신과 방송이 융합된 서비스 개발을 위해 통신 분야의 Open API와, 방송 분야의 Open API를 융합하는 추세를 보이고 있다. 하지만, 국내에서는 이러한 Open API를 체계적으로 지원 해주는 플랫폼이 존재 하지 않기 때문에, 개발자들이 손쉽게 Open API를 사용하기 힘든 실정이다. 따라서 본 논문에서는 방송통신 융합서비스 플랫폼을 구축하기 위한 사전 연구로써, 현재 제공되고 있는 Open API들의 정보들을 공통적으로 정의하기 위해 메타데이터를 이용하여 정의하는 방법을 연구하였다.
-
모바일 단말, 웨어러블 디바이스 등 개인용 단말의 이용이 확대되면서 사용자 및 사용자 그룹의 다양한 미디어 소비정보, 이용 패턴 정보 기반으로 하는 다양한 서비스가 확대되고 있다. 이러한 개인 혹은 사용자 그룹을 대상으로 하는 대표적이면서 가장 서비스 효율을 높일수 있는 서비스 가운데 하나가 타겟팅 광고 서비스이다. 이러한 타겟팅 광고 서비스는 단순한 개인의 선호도 정보만을 반영하는 것에서 개인의 미디어 소비이력, 미디어 이용패턴 정보 등 사용자가 직접적으로 정보를 입력없이 추천이 가능하도록 연구가 계속되고 있다. 본 논문에서는 고정형 및 모바일 단말에서 사용자의 미디어 콘텐츠 선호 정보 및 소비이력 정보를 통합적으로 반영하여 타겟팅 광고 콘텐츠를 자동적으로 선정하고 추천하는 엔진을 설계 구현하였다. 제안한 추천엔진은 콘텐츠 특성에 대한 선호도와 사용자의 콘텐츠 소비 패턴에서 취득된 정보를 기반으로 예측된 선호도를 결합하여 사용자의 최종 선호도를 추정하고, 이를 기반으로 광고 콘텐츠에 대한 추천을 수행한다. 사용자 메타데이터 및 콘텐츠 메타데이터는 TV-Anytime 표준을 기반으로 하였다.
-
멀티미디어 기술의 보급 확산 및 급속한 발전으로 새로운 영상 압축 기술인 HEVC(High Efficiency Video Coding) 고화질 영상 압축 표준을 탄생시켰으며, 사용자 또한 대형 화면에 대한 선호도가 높아지고 있다. 그 결과 기존의 HD급 영상보다 4배 이상, 16배까지 선명한 초고화질 UHD(Ultra High Definition) 영상 서비스가 차세대 방송기술로 새롭게 주목받고 있다. 또한 JPEG 2000 압축도 기존 처리된
$4096{\times}4096$ 픽셀 이미지를 넘어 초고화질 해상도 이미지(8K :$7680{\times}4320$ 혹은$8192{\times}4320$ 픽셀)를 처리 지원을 하고 있다. 따라서 초고화질 이미지의 획득 및 저장을 위해서는 고속의 처리 기술이 필요하다. 이에 본 논문은 초고화질 해상도 이미지의 고속 처리를 위한 병렬처리 기술에 대해 단계적 연구를 실행하며, 이를 위하여 1차적으로. JPEG 2000의 처리 과정을 살펴보고 전처리 단계인 색공간 변환 알고리즘 적용을 위하여 사용자 정의의 쓰레드 기반 고속처리를 수행하였다. 실험 결과 기존의 처리보다 사용자 정의 기반 쓰레드 고속처리가 초고화질 해상도 이미지(UHD 8K :$7680{\times}4320$ )를 기준으로 최대 15배의 성능 향상의 결과를 보여주었다. -
본 논문은 HD 해상도의 고화질 방송카메라(회전과 줌이 가능한)와 '키넥트' 같은 범용 모션인식 카메라를 연동하여 방송용 모션기반 증강현실 어플리케이션을 구현하기 위해서, 연기자의 위치를 가상 월드 좌표로 자동 변환시키는 방법을 제안한다. 방송환경에서 키넥트와 같은 모션인식카메라(RGB-D 카메라)를 사용하기 위해서는 거리와 조명의 영향을 많이 받아 연기자와 가까운 천장이나 카메라 밑처럼 그 설치 위치가 제약되곤 한다. 이때, 연기자와 그래픽의 정확한 합성을 위해, 모션인식 카메라로부터의 연기자 추적 정보를 월드 좌표계로 변환해야 하며, 이것을 수작업으로 하기에는 변환의 정확도가 많이 떨어지고 시간도 많이 소요된다. 본 논문에서는 체크박스 패턴 기반의 스테레오 카메라보정 알고리즘을 사용하여 모션인식카메라와 방송용 카메라간의 상관관계(이동, 회전)를 찾고, 이 값과 월드 좌표계 상의 방송 카메라(하드웨어 센서에 의해서 추적됨)정보(이동, 회전)를 이용하여 임의 위치에 설치한 모션인식 카메라로부터 추적된 연기자 위치정보를 월드 좌표계 상의 위치 값으로 자동 변환시키는 방법을 제안한다.
-
실제적인 객체를 컴퓨터로 재구성하여 실제 공간에서의 경험 대상을 가상 세계의 경험 대상으로 변환하여 실제 세계와의 혼합된 세계를 제공하는 증강현실 실제 세상과 정보 전달에 필요한 증강현실 객체를 혼합하여 제공한다. 이러한 가상객체가 존재하는 환경은 컴퓨터를 이용하여 실제 객체를 인식하여 표현할 뿐만 아니라 제공된 입력 자료에 상응하는 서비스를 제공하게 된다. 본 논문에서는 증강현실 시스템을 지원하기 위한 정보를 체계적으로 표현하고 전달체계에 이용되는 메타데이터를 구성하기 위한 구조적 모델을 제시한다.
-
JPEG 표준화 기구에서 표준화 중인 JPEG AR 표준은 증강 현실 응용을 구성하는 요소간의 인터페이스를 표준화하고 있다. 본 논문에서는 증강 현실 기술을 기반으로 기존 미디어에 새롭게 가상 정보를 추가한 증강 미디어 서비스(개인화 서비스, 증강 방송, 사물 인터넷과 결합한 증강 미디어 서비스)를 JPEG AR 표준 측면에서 고찰하고, 이들 서비스를 위한 JPEG AR 표준의 추가 요소를 살펴본다. 세 가지 서비스를 구체적으로 살펴본바, JPEG AR 표준은 기존의 증강 현실 표준보다 유연한 시스템 구조를 갖고 있어 다른 분야 또는 시스템과의 연결이 용이하고, 이에 따라 증강 미디어 서비스뿐 아니라 새로운 융 복합 기술을 창출하는데 일조할 것으로 기대된다.
-
본 논문에서는 미리 모델링된 실객체에 대한 3차원 모델을 변형하면서 애니메이션을 정의하고, 실사 객체를 추적하면서 카메라 뷰 상의 실사 객체에 애니메이션을 적용하는 방법을 제안한다. 애니메이션 정의는 라플라시안 기반 메쉬 변형 방법으로 3차원 모델을 변형시키며 키프레임을 지정함으로써 이루어진다. 정의된 애니메이션은 실제 환경에서 추적된 실사 객체의 영상으로부터 모델에 텍스처를 입힌 뒤, 카메라 포즈를 이용하여 객체 위치에 객체 모델을 렌더링할 때 적용된다. 제안된 방법을 통해 사용자가 원하는 대로 실제 환경에 대한 카메라 뷰 상에서 실사 객체가 변형되는 모습을 용이하게 보여줄 수 있다.
-
본 논문에서는 피라미드 구조와 쿼드트리를 이용하는 움직임 보상 프레임 보간(motion compensated frame interpolation, MCFI)의 새로운 방법을 제안한다. 일반적인 MCFI 방법에서는 고정된 크기의 프레임과 블록에서 움직임 벡터(motion vector, MV)를 이용하여 두 프레임 사이의 프레임 영상을 추정한다. 그러나 이와 같은 방법은, 큰다양한 방향으로 움직이는 물체들의 MV 나 큰 움직임을 추정하기 어렵다. 이러한 문제점을 해결하기 위해서 본 논문에서는 블록 크기와 정합 영역이 가변적으로 적용될 수 있는 피라미드 구조와 쿼드트리를 이용한 프레임 보간 기법(pyramid structure and quadtree motion compensated frame interpolation, PQ-MCFI)를 제안한다. 제안하는 기법은 물체들이 빠르게 움직이는 장면과 다양한 방향으로 움직이는 장면에서 이전의 기법에 비해서 높은 PSNR 을 보이며, 실제 인간의 시각적인 측면에서는 더욱 정밀한 결과를 보인다.
-
본 논문에서는 가상시점 영상을 생성할 때 발생하는 홀 영역을 효율적으로 채우는 방법을 제안한다. 가상시점 영상을 생성하려면 우선 깊이 영상에 대해 3차원 워핑을 수행한 뒤, 이때 발생하는 작은 홀을 미디언 필터를 이용하여 적절히 채워야 한다. 홀이 채워진 깊이 영상을 기반으로 하여 입력받은 참조 컬러 영상에 대해 3차원 워핑을 수행하여 가상 위치에 새로운 시점 영상을 생성하게 된다. 이때 또한 마찬가지로 3차원 워핑을 수행하기 때문에 홀 영역이 발생하게 된다. 텍스쳐 영상을 워핑하여 새로운 좌표계로 옮긴 영상은 주변 컬러 화소들과의 관계들을 가지고 있다. 텍스쳐 영상을 워핑한 결과 영상에서 발생하는 홀 영역을 채우기 위해 방향성을 고려한 홀 채움 방법을 사용한다. 홀 주변 화소 영역의 값들을 홀을 채우게 될 후보 화소 값으로 설정한 뒤, 각각의 화소값에 대해 비용값을 계산한다. 이때 가장 적은 비용값을 갖게 하는 주변 화소 값을 해당 영역의 홀 채움 값으로 사용하게 된다. 좌영상과 우영상을 워핑할 때 발생하는 홀 영역의 위치가 각각 다르게 나타난다. 홀 영역은 배경화소 값을 이용해 채울 경우 자연스러운 결과를 보인다. 배경화소 값을 이용하기 위해 좌영상과 우영상에 따른 새로운 홀 스캔 방향 또한 제안한다. 능동적으로 홀 스캔 방향을 선택하여 홀 주변 화소값들을 스캔해가며 워핑 결과 발생하는 홀 영역을 효율적으로 채우게 된다. 결과적으로 제안한 방법을 통하여 생성된 가상시점 영상의 화질이 좋아지는 결과를 확인할 수 있었다.
-
다양한 동영상 콘텐츠를 이용하는 사용자들의 단말기 성능이나 네트워크 상황, 또는 단말기의 해상도 등에 실시간으로 대응할 수 있는 영상 압축 방법으로 스케일러블 영상 코딩 (Scalable Video Coding, SVC)[1]을 사용하고 있다. 최근 JCT-VC(Joint Joint Collaborative Team on Video Coding)에서는 초고해상도를 타겟으로 하는 동영상 압축기술인 HEVC(Efficiency Video Coding)를 기반으로한 Scaleable HEVC(SHVC)[3]를 표준화 중에 있다. SHVC는 공간적(Spatial), 시간적(Temporal), 화질적(SNR) 스케일러빌러티를 제공을 하며, HEVC v.1에 비해 높은 복잡도를 가진다. 본 논문에서는 SHVC의 공간적 스케일러빌러티의 부호화 속도 개선을 위한 알고리즘 개발에 앞서 제한적 실험을 통한 통계적 분석을 하였다.
-
실감형 디스플레이 장치들을 지원하기 위해 다시점 영상을 효율적으로 코딩하는 방법은 다시점 비디오 코딩 방법과 다양한 전송 환경과 다양한 종류의 단말들을 통합적으로 지원할 수 있는 스케일러블 비디오 코딩 방법은 존재하지만, 현재 유비쿼터스 환경에서 실감형 서비스를 지원하면서 동시에 다양한 환경을 지원할 수 있는 통합된 동영상 정보를 생성하는 방법은 존재하지 않는다. 따라서 본 논문에서는 통합된 동영상 정보를 생성하는 다중 확장 비디오 코딩의 개념과 동작에 대해 설명하고 최적의 inter layer 참조 영상 선택 방법에 대해 분석한다.
-
본 논문에서는, 움직임이 존재하는 영역과 존재하지 않는 영역을 구분하여 영역마다 다른 가중치 계수 세트 w와 o를 사용하는 알고리즘이 제안된다. 제안된 기술의 실험 결과는 BD-rate기준으로 최대 -5.4%의 효율을 가져오며 인코더 복잡도는 약 110%, 디코더 복잡도는 거의 변화가 없다.
-
방통융합시대가 도래함에 따라 방송망뿐만 아니라 IP망을 통해 콘텐츠를 소비할 수 있는 스마트TV의 보급이 급속히 확산되고 있다. 또한 영상과 음악 및 광고와 같은 멀티미디어 콘텐츠의 소비 환경이 한 화면에 한 가지의 미디어 서비스만 제공받는 환경에서 다양한 정보를 동시에 소비할 수 있는 환경으로 확대되면서 다양한 정보를 하나의 화면에서 혼용적으로 전달하기 위한 장면구성정보가 필요하게 되었다. 장면구성정보는 미디어가 소비되는 특정 시간과 해당 공간의 정보를 기술하므로써 다수의 미디어를 복합적으로 소비하는 방법으로, IP 기반에서도 여러 개의 화면을 통해 여러 소스의 콘텐츠를 소비하여 다양한 사용자 경험(User Experience)를 제공하고자 ISO/IEC JTC1/SC29/WG11(별칭 MPEG)에서는 방송서비스에서 방송망 및 IP망을 활용하여 멀티미디어 데이터를 전송할 때 사용하는 MPEG Media Transport(MMT)를 기반으로 장면구성정보를 제공하기 위한 MMT-Composition Information(MMT-CI)를 기술표준화하였다. 본 논문에서는 MMT-CI의 표준문서에 따라 W3C의 웹언어인 HTML5와 확장성 언어인 XML을 이용하여 멀티소스를 활용한 장면구성정보를 기술하는 것을 제안하고 장면구성서비스에 적용을 위한 플레이어를 구현 및 검증한다.
-
본 논문에서는 다양한 스테레오 환경에서도 정확한 음원 위치 추정이 가능한 방법을 제안한다. 기존의 음원 위치 추정 방법은 방향성을 가지고 있는 주성분 신호와 방향성이 없는 주변 성분으로 구성된 스테레오 환경에서만 음원의 위치 추정이 가능했다. 그러나 현재 제공되고 있는 스테레오 신호는 방향성을 가지는 다수의 음원으로 구성되어있고, 기존의 음원 위치 추정 방법으로는 정확한 음원 위치 추정이 어렵다. 이와 같은 문제 때문에 다수의 음원을 분리한 뒤, 음원의 위치를 추정하는 방법이 제안되었다. 그러나 음원의 분리 과정에서 생기는 분리 오차가 커서 음원 위치 추정이 정확하지 않다. 이에 본 논문에서는 정확한 음원 위치 추정을 위하여 음원 분리와 음원 위치 추정이 통합된 새로운 알고리즘을 제안한다. 제안한 알고리즘은 음원 위치를 기존의 방법보다 정확하게 추정하는 것을 확인할 수 있었다.
-
본 논문에서는 MPEG 표준인 DASH 서비스를 DASH 표준이 나오기 이전에 출시된 기존 단말들에게 무선 랜 환경에서 DASH를 위한 비디오 스트리밍 서비스를 제공해 주기 위한 무선 스마트 에이전트의 적응적 비디오 품질 조절 방법을 제안한다. 기존 연구는 스마트 에이전트가 클라이언트의 네트워크 상황을 파악하기 위해 전송 계층의 정보를 이용하기 때문에 무선 랜 환경에서 페이딩이나 간섭 등과 같은 이유로 적합하지 않다. 본 논문에서 제안하는 방법은 802.11 MAC 부계층에서 얻을 수 있는 정보를 이용하여 급격히 변하는 각 클라이언트의 상황을 빠르게 파악하여 무선 채널의 상태를 적응적으로 비디오 스트리밍하여 전달하도록 한다. 제안하는 방법의 실험을 통하여 DASH 표준 서비스를 제공 받는 클라이언트처럼 네트워크 상황에 적응적으로 비디오 스트리밍 되는 것을 확인하였다. 또한, 클라이언트의 이동성과 무선 채널의 에러를 추가함으로써 급격히 변하는 네트워크의 상황에도 적응적으로 클라이언트에게 비디오 스트리밍을 제공하는 것을 확인하였다.
-
최근 UHD급 디스플레이 장치가 등장하면서 이에 대한 코덱 및 영상 처리 기술들이 개발되고 있다. 그 중 UHD급 콘텐츠 부재에 따른 비디오 스케일러의 역할은 더욱 중요해졌다. 기존에 연구되어 시중에서 사용되고 있는 1차, 3차 보간법들과 함께 좀 더 향상된 효과를 보이는 스케일러 방법, 하드웨어 스케일러 구현을 고려하여 제안된 스케일러 방법들을 다양한 기준으로 분석하였다.
-
보간 기법은 영상의 해상도를 변경하는 것이다. 멀티미디어 기기의 해상도가 다양하기 때문에 원 영상은 각각에 맞는 해상도로 변경되어야 한다. 해상도 변경은 존재하지 않는 값을 임의로 만들어 채우는 것이기 때문에 왜곡이 발생한다. 대부분의 scaler에서는 수평과 수직 방향으로 해상도 변경을 하는데, 이 때문에 edge 영역에서는 왜곡이 더 많이 발생하며 쉽게 눈에 띈다. 본 논문에서는 edge 방향에서 발생하는 왜곡을 극복하기 위해 영상의 edge 정보와 Cubic Convolution을 이용해 임의의 배율로 해상도를 변경하는 방법을 제안한다.
-
안개 제거 알고리즘은 single image에서 대기값(Airlight)와 대기의 빛 전달량(Transmission)을 추정하여 안개로 인한 빛의 산란에 의해 생긴 Contrast 감소 및 채도의 왜곡과 같은 영상 왜곡을 보정해줌으로써 안개 영상에서 안개를 효과적으로 제거해준다. 하지만 기존의 안개 제거 알고리즘은 안개 영상에 특화되었기 때문에 안개가 없는 영상에 알고리즘을 시행 할 경우 색상과 명암에 왜곡을 불러 일으킬 수 있다. 이에 따라 알고리즘을 수행하기 앞서 안개 량을 측정하고 그 결과에 따라 안개 제거 알고리즘에 제거 정도 가중치나 알고리즘 수행 여부를 판단할 필요가 있다. 본 논문은 기존 안개 제거 알고리즘들이 영상의 patch를 사용하여 빛 전달량(Transmission)을 추정한다는 것을 이용하여 빛 전달량을 구함과 동시에 안개 량을 판단하는 알고리즘을 개발하였다. 안개량을 측정하기 위해 각 patch의 pixel 분포 특성과 patch의 빛 전달량(Transmission)을 구하기 위한 특정 값과 실제 pixel의 명암(Intensity)을 비교하여 안개 량을 측정한다.
-
In image dehazing, the existing transmission estimators bring out the halo artifact at boundaries unless they adopt a refinement process with the high computational complexity. We analyze how the existing transmission estimation methods suffer from the halo artifact at the boundaries and observed that the elaborate, high computational refinement processes to remove the halo effect are excessive for dehazing. On the basis of the analysis and observation, we embed a simple segmentation logic in an existing transmission estimator, which is sufficiently accurate for dehazing. The experiment verifies that the proposed method significantly reduces the halo artifact without requiring any refinement process.
-
본 논문은 Laplacian of Gaussians (LoG)에 캐니 에지 검출 기법을 접목한 새로운 색상 보간 알고리듬을 제안한다. 캐니 에지 검출 기법은 영상 스무딩, 기울기 크기와 각도 계산, 세션화, 이중 문턱치 처리 과정으로 이루어진다. 이때 앞의 두 과정을 LoG를 이용하여 처리함으로써 기존의 캐니 애지 검출법보다 정확한 방향 정보를 얻을 수 있다. 실험결과를 통해 기존의 색상 보간 알고리듬에 비해 Peak Signal to Noise Ratio (CPSNR)이 상승함을 확인하였으며, 에지 영역 주변에서 발생하였던 무지개 에러가 현저히 감소하였음을 확인할 수 있었다.
-
화질의 개선을 위해 잡음을 제거하는 기술이 많이 개발되고 있으며 그 기술들 중에 효과적으로 사용되고 있는 것 하나가 양방향 필터이다. 양방향 필터는 거리에 대한 가중치와 화소 값에 대한 가중치를 모두 고려하기 때문에 경계 부분을 보존하면서 잡음을 제거하는 것이 가능하다. 필터를 적용함으로 잡음이 제거되지만 본 논문에서는 그보다 나은 결과를 위해서 경계 부분을 캐니 에지 검출기로 검출하고 강조함으로써 양방향 필터의 장점을 전보다 부각시켜 이전보다 효과적인 화질개선 방법을 제시하고자 하였다.
-
본 논문에서는 색상 정보를 이용하여 배경 영역이 포함된 자동차의 전,후면 사진에서의 자동차 번호판 영역(녹색, 흰색) 추출과 추출된 번호판에서 글자를 분리해내는 방법을 제안한다. 기존의 색상 정보를 이용하여 번호판을 추출하는 방법은 흰색 번호판(신형 번호판)의 경우에는 배경 영역에서 흰색인 영역도 많고 국내 차량 중에 흰색 차량이 많기 때문에 번호판 영역과 배경 영역 사이의 명확한 구분에 어려움이 있었다. 따라서 행별 Red값 변화도를 조사하여 배경 영역과 번호판 영역 사이의 명확한 구분을 하게 하며, 흰색 번호판의 경우에 추출이 안되면 흰색의 기준을 더 낮추어서 다시 영역 추출을 할 수 있는 재추출 알고리즘을 추가해서 비교적 어두운 사진에서도 번호판영역을 추출할 수 있도록 한다. 추출된 번호판에서 글자를 추출해내는 과정에서도 이진화를 거치면 노이즈가 많이 생기기 때문에 이를 줄이고자 행별 Red값 변화도를 조사하여 번호판 영역에서 위아래 부분의 노이즈를 줄일 수 있도록 하였다.
-
동영상에서의 객체 추적 알고리즘에 대한 활발한 연구가 진행되고 있음에도 불구하고 실시간 객체추적을 위해서는 여전히 정확도, 복잡도 등에서의 성능향상이 필요하다. 압축영역 기반 방식에서는 전역 움직임 보상(GMC : Global Motion Compensation)과정을 거쳐 추적하려는 객체와 배경을 구분한다. 전역 움직임 보상방법은 프레임 전 영역을 대상으로 하는 연산으로 전체 추적 시스템에서 차지하는 복잡도가 높다. 본 논문은 관심영역(ROI : Region Of Interest) 기반 전역 움직임 보상방법을 이용한 ST-MRF(Spatio-Temporal Markov Random Field)기반 추적기 고속화 방법을 제안한다. 관심영역을 기반으로 전역 움직임 보상을 적용함으로써 객체와 배경을 분리할 뿐만 아니라 알고리즘의 복잡도를 효과적으로 줄일 수 있다. 제안하는 방법의 추적성능은 평균 precision 87.29%, recall 82.58%, F-measure 83.78%로 기존방법과 비교하여 약 1%의 차이를 유지하였으며 전체 시스템의 수행시간은 평균 29.95ms로 기존방법과 비교하여 1.74배의 속도향상을 보였다.
-
최근 자동차 산업과 IT 기술의 융합이 활발해지면서 스마트카, 자율주행 자동차(무인 자동차)와 같은 지능형 자동차 개발이 활발히 진행되고 지능형 자동차의 비전 기반 기술개발도 활발히 진행되고 있다. 고속도로와 같이 포장된 도로나 자갈길과 같은 비포장 도로에서도 운전자의 승차감을 고려한 능동적 안전시스템과 안정적인 자율주행 자동차의 주행능력을 보장하는 기술들 중 도로 유형을 판단하는 것이 중요 요소 중 하나이다. 따라서 본 논문에서는 가중치 기반 클러스터링 기술을 이용하여 도로표면 유형을 분류하는 알고리즘을 제안한다. 아스팔트, 자갈길, 흙길, 눈길의 도로표면 영상 데이터를 히스토그램의 분포도와 최고점 위치, 에지 영상의 에지량, 채도성분을 이용하여 특징값을 추출하고 클러스터를 구성한다. 분류할 입력 도로표면 영상에 대해 특징값을 분석한 후 탐색범위 내 선택된 각 클러스터의 벡터와의 거리를 측정하여 가중치를 계산하고 가중치가 높은 클러스터를 분류하여 입력 영상에 대한 도로표면을 결정한다. 실험결과 제안하는 방법이 각 도로표면 영상의 특징값과 이를 이용한 가중치만을 이용하여 약 91.25%의 정확도로 도로의 표면을 분류해 내는 것을 볼 수 있었다.
-
영상 표시 장치에서 대조 이미지의 왜곡 현상을 보완하기 위해 히스토그램 평활화(Histogram Equalization)와 플래토 평활화(Plateau Equalization)가 사용된다. 히스토그램 평활화(Histogram Equalization)를 이용하여 명암대비를 증가 시킬 경우 과도한 이미지의 밝기 변화에 따른 과포화 현상이 발생하며 실시간 시스템에서는 물체 추적에 왜곡 현상이 발생한다. 특히, 적외선 영상(infrared image)과 같이 명암비가 한쪽으로 치우쳐 있는 영상들을 명암비를 개선하기 위해서는 플래토 평활화(Plateau Equalization)와 같은 영상 개선 방법이 필수적이다. 플래토 평활화에서는 임계값을 사용하는 방법이 제시되고 있지만 실험에 의한 최적 임계값을 찾아내는 방식이며, 이 방법은 입력되는 새로운 영상마다 임계값을 실험에 의해 매번 반복해서 도출해야 문제점이 있다. 본 논문에서 제안하는 방법은 과포화 되는 이미지 영역의 문제를 해결하기 위해 제시하는 방법으로 히스토그램 평활화(Histogram Equalization)의 동적 분할하는 알고리즘에 근거하되, 입력 영상에따라 적응적으로 임계값을 설정하는 기법을 제안한다. 실험을 통해 제안하는 방법이 실시간 영상에서 기존의 동적분할 히스토그램에 비해 자연스럽게 명암비를 개선하여 과포화 되거나 중요한 정보를 누락하여 왜곡 되지 않게 자연스러운 화면을 재생하는 방법을 제안한다.
-
본 논문에서는 TV 시청환경에서의 실내소음의 스트레스 평가를 위한 소음 데이터베이스(database, DB) 설계 방법을 제안한다. 제안된 DB 는 TV 시청공간을 포함하는 실제 주거환경 내에서 binaural recording을 위한 1 개의 dummy head 와 multi-channel recording 을 위한 2 개의 다채널 마이크 배열을 활용하여 TV 콘텐츠 및 실내소음의 음향 정보를 취득한다. 설계된 DB는 TV 시청자의 청각정보에 해당하는 binaural recording 신호와 실내소음의 위치 및 종류 추정을 위한 multi-channel recording 신호를 모두 포함하기 때문에 TV 시청환경에서 실내소음이 시청자에게 유발하는 스트레스의 분석 및 평가 관련 연구에 적합하게 설계되었다. 본 DB 는 5 가지 종류의 TV 콘텐츠 10 시간 분량, 30 가지 종류의 실내소음 2 시간 분량으로 구성되었다.
-
본 논문에서는 깊이맵 업샘플링을 이용하여 객관적 메트릭과 3D 주관적 평가 사이의 관계를 조사한다. 전자의 경우, 다양한 참조(full-reference) 및 무참조(no-reference) 평가도구가 깊이맵의 품질을 측정하기위해 적용되고, 3D평가는 주관적 평가로 얻는다. 이 두 개의 결과는 세 가지의 상관계수를 이용하여 상호 관련성을 찾은 후에, 최적으로 주관평가에 근접한 객관적 메트릭을 얻는다.
-
본 논문에서는 대표 히스토그램을 이용한 효율적인 저전력 화질 개선 기법을 제안한다. 제안하는 기법은 우선 히스토그램으로 이미지를 분류하고, 각 분류된 이미지를 대표하는 히스토그램들을 저전력 화질 개선 기법이 적용된 전달 함수(transformation function)를 통해 미리 구한다. 따라서 매번 이미지마다 처리되어야 하는 복잡한 계산과정을 대표 히스토그램을 이용하여 미리 구함으로써, 기존 기법 대비 빠르고 효율적인 시스템을 구현할 수 있다. 실험을 통하여 제안 기법이 기존 기법에 비하여 낮은 전력 소모와 빠른 처리 속도를 보임을 확인한다.
-
본 논문에서는 프레임 내 전체 배경 모델을 도입하여 기존 배경 분리 알고리즘에서의 오검출을 줄여 정확도를 개선하고자 한다. 기존의 알고리즘은 프레임 간의 정보만을 이용하여 배경 확률 모델을 만들고 배경을 제외한 전경만을 검출한다. 제안하는 알고리즘에서는 먼저 기존의 알고리즘을 통해 프레임 간의 정보를 이용하여 간단하게 배경과 전경을 분리한다. 그 후 프레임 내 정보를 통해 전체 배경 모델을 만들고, 앞의 결과에서 한번 더 배경을 제외함으로써 검출 정확도를 개선하고자 한다. 실험결과에서 Change Detection Workshop dataset에 대해 실험을 한 후 결과 영상 비교 및 F-measure 를 통해 개선된 결과를 확인할 수 있다.
-
본 논문에서는 HOG 기반 보행자 검출 및 추적에서, HOG feature의 슬라이딩 윈도우의 수와 피라미드 층 수가 알고리즘의 수행속도와 직접적인 관계가 있다는 것을 확인한다. 그리고 이 결과를 바탕으로 윈도우의 수와 피라마드 층 수를 줄이는 방법을 제안하여 전체적인 보행자 검출 및 추적 속도를 증가시키고자 한다. 구체적으로, 제안하는 알고리즘은 검출 단계에서 색상의 선명도를 이용하여 관심 영역을 프레임 내에 지정함으로써 슬라이딩 윈도우의 수를 줄이고, 부가적으로 피라미드 층 수 또한 줄어들어서 보행자 검출 속도를 향상시킨다. 그리고 추적 단계에서는 보행자로 검출된 윈도우의 색상 정보를 이용하여 검출된 보행자를 빠르고 정확하게 추적하는 하는 방법을 제시한다.
-
이동 방송 환경에서 사용자가 특정 프로그램 또는 특정 서비스를 편리하게 수신할 수 있도록 하기 위해서는 고정 환경과 달리 적합한 사용자 상호작용이 고려되어야 한다. 본 논문에서는 디지털 라디오 환경에서 청취자에게 서비스를 편리하고 효과적으로 접근하고 수신할 수 있도록 하는 멀티모달 기반의 사용자 상호작용 기술에 대해서 소개하고자 한다. 이를 위해 디지털 라디오 환경 및 서비스 구조를 분석하고 이를 기반으로 사용자 상호작용이 필요한 사항을 도출하였다. 사용자 상호작용 엔진은 XML 마크업 언어를 기반으로 서비스, 프로그램 및 콘텐츠 수준의 상호작용이 가능하도록 구성하였다.
-
본 논문은 방송콘텐츠 영향력 도출을 위해 고려되어야 할 요소들에 대해 다뤄보았다. 기존에 방송콘텐츠의 영향력을 나타내는 측정지표로 시청률과 청취율 같은 설문조사 방식의 조사자의 개입을 통한 방식이 활용되었다면, 최근 소셜미디어를 통해 수많은 정보가 교환되는 환경에서는 새로운 측정방식의 제안이 가능할 것으로 보았다. 이에, 본 연구에서는 소셜미디어상 대용량의 텍스트 데이터인 이른바 '소셜텍스트 빅데이터'를 활용해 방송콘텐츠의 영향력을 분석하는 방식을 제안하였다. 또한 이러한 빅데이터 분석을 위해 일반적으로 발생할 수 있는 문제들과 이 과정에서 유의하여야 사항들에 대해 다뤄보았다.
-
본 논문에서는 시각장애인의 TV 시청 보조기술인 화면해설방송(Descriptive Video Service)에 있어 다양한 편의 기술을 적용하여 저작자로 하여금 편리하고 경제적으로 화면해설방송물을 제작할 수 있도록 하는 저작 기술을 제안한다. 제안하는 방법은 화면해설 대본 작성의 편의를 위한 화면해설 삽입 추천 기술과 성우 음성 더빙을 대체할 수 있는 TTS 기반의 합성음성 기술, 또한 마스터 오디오와 합성음성 화면해설을 믹싱하기 위한 오디오 믹싱 기술을 포함한다. 마지막으로, 제안하는 기술의 구현 예를 제시한다.
-
컴퓨터 그래픽의 발달 및 다양한 멀티미디어 기기들의 보급이 증가함에 따라 스크린 콘텐츠 영상에 대한 수요가 증가하고 있다. 자연영상과 다른 특성을 지닌 스크린 콘텐츠 영상의 효율적인 압축을 위하여, 기존의 High Efficiency Video Coding (HEVC)의 SCC (screen content coding) 에서는 스크린 콘텐츠 영상을 위한 새로운 예측 기술이 추가되었다, 추가된 대표적인 예측 기술로 화면 내 블록 카피 (IBC: intra block copy) 기술과 팔레트 모드 등이 있다. 본 논문에서는 스크린 콘텐츠 코딩의 부호화 효율 향상 연구에 앞서, 스크린 콘텐츠 코딩에서 높은 부호화 효율을 보이는 화면 내 블록 카피 기술에 대하여 소개하고 화면 내 블록 카피 기술의 부호화 특성 및 블록 벡터 예측 기법에 대한 분석을 수행한다. 또한, 이러한 분석 결과를 토대로 화면 내 블록 카피 기술의 성능 향상을 위한 방법을 제시한다.
-
현재 HEVC의 AMVP(Adaptive Motion Vector Prediction) 모드에서는 공간적, 시간적 후보를 고려하여 최종 후보 2개를 결정 한 후 어떤 후보를 사용하였는지 MVP flag를 이용하여 디코더로 알려준다. 이때, 최종 2개의 후보가 동일하다면 AMVP의 성능이 저하 될 수 있다. 따라서 본 논문에서는 그러한 경우를 고려하여 개선된 알고리즘을 제안한다. 실험결과는 휘도 기준 최대 -0.5%의 성능이 나오며 제안된 알고리즘이 효율적임을 보여준다.
-
현재를 '빅데이터' 시대라 부른다. '빅데이터', 그 용어가 주는 의미대로 우리가 처리해야 할 데이터가 많다는 것을 의미하며, 과거의 데이터 정제 기술로는 유의미한 정보로 가공하기에는 상당한 노력이 필요하다는 것을 암시하고 있다. 현재 장비의 고성능화 등으로 가능성이 검증되고 있고 일부 비즈니스에 활용되는 단계이나, 여전히 혼돈의 문제가 존재하며, 이러한 문제의 해결책으로 제시되는 것 중의 하나가 바로 '소셜 큐레이션'이라 할 수 있다. 본 'TVzzik' 서비스는 시청자들이 방송 콘텐츠를 소유하고 공유하고자 하는 욕구를 반영하여, 실시간으로 TV를 보면서 방송 프로그램을 캡처하고 공유할 수 있게 한다. 방송콘텐츠에 관한 '소셜 큐레이션' 서비스이며, 이는 각 사용자들이 캡처하여 생성한 수많은 콘텐츠 중에서 사용자들이 원하는 콘텐츠를 사용자들의 사회적인 관계를 이용하여 선별적으로 제공할 수 있도록 구성한 것이다. 본 논문에서는 'TVzzik' 서비스의 개발 방향과 시스템 구성 등을 설명한다.
-
그 동안 오디오 기술은 채널 개수, 해상도, 매체의 특징에 따라 구분되어 발전해 왔다. 그러나 채널 개수에 있어서는 5.1 채널을 정점으로 가정에서의 설치 및 유지의 어려움으로 인해 시장에서의 고전을 면치 못하고 있다. 최근 영화 사운드 시장에서 돌비 ATMOS, IOSONO, AURO3D 등 잇단 객체기반 오디오 기술이 도입되면서, 방송 오디오 시장에서도 도입이 검토되고 있는 실정이다. 이러한 오디오 기술의 변화는 유연성이 결여된 채널기반 오디오의 기술 발전 및 시장 성장의 활로를 개척하는 기회가 될 것으로 전망된다. 따라서, 본 논문에서는 UHDTV, 무안경 3DTV, 파노라마 영상, 홀로그램 영상 등 차세대 TV 방송 매체에 활용할 수 있는 UHD 오디오 기술의 콘텐츠 포맷 및 재현 기술에 대해서 논하고 향후 전망을 고찰해 보고자 한다.
-
본 논문에서는 4K UHD (Ultra High Definiation) 디스플레이 기기들의 품질 측정을 위해 TTA 4K 방송용 비디오 모니터 테스트 항목과 내용을 소개한다. 이를 통해서 테스트 패턴 설계에 대한 요구사항을 정리하여 4K 디스플레이에 적용 가능한 계측용 테스트 패턴과 육안확인용 테스트 패턴을 제안한다. 본 논문에서 제안하는 테스트 패턴을 통해 4K UHD 디스플레이 기기들의 적절한 평가와 성능 측정이 가능해지며 아울러 관련 장비를 개발하는 입장에서 객관적 측정 평가뿐만 아니라 육안평가도 손쉽게 할 수 있을 것으로 기대된다.
-
HEVC(High Efficiency Video Coding)는 재귀적 쿼드트리 분할 구조의 부호화단위(CU: Coding Unit)와 각 CU에서 다양한 예측단위(PU: Prediction Unit)를 제공하고, 율-왜곡 기반으로 최적의 CU와 PU를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 부호화 복잡도 또한 크게 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위해 상위깊이의 부호화 정보를 이용한 고속 부호화 기법을 제안한다. 제안기법은 상위깊이 CU의 Sub-CBF(coded block flag)를 이용하여 현재깊이 CU에서의 PU를 조기 결정하여 PU 탐색을 고속화 한다. 또한 화면내(Intra) 예측 고속화를 위하여 현재 CU의 sub-CBF를 함께 사용하여 하위깊이에서의 화면내 예측을 생략한다. 실험결과 제안기법은 HM 14.0 대비 1.2%의 BD-rate 증가에 31.4%의 부호화 시간 감소 효과를 얻을 수 있었다.
-
현재 MPEG에서 표준화 중인 IVC(Internet Video Coding)에서는 기존의 비디오 부호화 표준과 같이 Lagrange 계수 기반의 율-왜곡 최적화(RDO: Rate-Distortion Optimization)를 사용하여 최적의 부호화 모드를 결정하고 있다. RDO를 위하여 픽쳐 타입과 부호화 구조에 따라 미리 결정된 Lagrange 계수가 선택적으로 사용되고 있다. 한편 IVC에서는 저지연 모드 부호화 구조에서 비참조 P 프레임 부호화 기법을 선택적으로 사용하여 상당한 부호화 성능을 얻고 있다. 하지만 Lagrange 계수 선택에서 기존의 P 프레임과는 다른 비참조 P 프레임의 RD 특성이 반영되고 있지 않다. 본 논문에서는 비참조 P 프레임의 RD 특성을 고려하여 기존의 기법을 확장한 새로운 Lagrange 계수 선택 기법을 제안한다. 실험결과 제안기법은 IVC 시험모델 ITM 10.0에서 기존 기법 대비 0.4%의 비트율 감소를 얻을 수 있음을 확인하였다.
-
본 논문은 High bit-depth 를 위한 SIMD (Single Instruction, Multiple Data) 명령어 기반 보간 필터 고속화 방법을 제안한다. 픽셀 연산을 기반으로 하는 보간 필터링은 HEVC 복호화기에서 높은 복잡도를 차지하고 있지만 반복적인 산술연산을 수행하기 때문에 SIMD 를 이용한 고속화에 적합한 구조를 가지고 있다. 이러한 이유로 본 논문에서는 보간 필터 연산에 대하여 SIMD 명령어를 이용하여 메모리를 효율적으로 사용하여 고속화하는 방법을 제안한다. 제안하는 기술은 HEVC 참조 소프트웨어 HM 12.0-RExt 4.1 에 기반을 둔 ANSI C 기반 자체 개발 HEVC RExt 복호화기 소프트웨어에서 평균 8.5%의 복호화 속도향상을 보였으며, 보간 필터의 수행 시간을 평균 24.8% 향상시켰다.
-
UHD 영상 콘텐츠는 FHD 영상에 비해 생생하고 더 좋은 고화질의 영상을 제공하지만 영상정보의 데이터 양은 4K UHD 경우 4 배 이상이다. 이러한 초대용량의 UHD 영상을 기존의 병렬/분산 처리를 이용하여 비디오 코딩 한다면 UHD 의 초대용량 특성으로 인하여 연산량 부하가 발생하게 된다. 따라서 UHD 영상은 기존의 분산처리 방식이 아닌 초대용량 데이터를 빠르게 처리 할 수 있는 새로운 분산 처리기술이 필요하다. 본 논문은 UHD 콘텐츠를 빠르게 트랜스코딩 할 수 있는 클라우드 기반 UHD 영상 트랜스코딩 시스템을 제안한다. 본 논문에서 제안하는 UHD 영상 트랜스코딩 시스템은 다음 3 가지 패킷 분석기, 분산 트랜스코더, 스트림 합성기로 구성된다. 패킷 분석기는 입력 영상을 분석하여 오디오와 비디오 스트림을 분할하고 비디오 스트림은 분산처리를 할 수 있도록 영상 패킷을 분할한다. 분산 트랜스코더는 클라우드 환경을 이용하여 분할된 영상 패킷들을 분산 디코드 및 인코드 처리한다. 스트림 합성기는 트랜스코딩이 완료된 비디오 스트림과 패킷 분석기에서 획득하였던 오디오 스트림을 합성하는 기능을 한다. 제시하는 방안을 적용하여 클라우드 기반 영상 트랜스 코딩 시스템을 구현하였으며, 구현된 시스템은 대용량의 UHD 영상을 빠른 속도로 트랜스코딩이 가능하다.
-
본 논문에서는 HEVC의 인트라 프레임을 대상으로 디지털 워터마킹 방법을 목표로 하여 인트라 예측 시 첫 번째 인코딩과 두 번째 인코딩에서 변화하는 PU의 경향성 중 특이한 케이스를 선별하는 방법을 제안하고자 한다. 코덱에서 워터마킹시 문제가 되는 것이 재인코딩시 예측모드의 변화이다. 그렇기에 HEVC를 기반으로 예측모드는 같으나 PU의 크기가 달라지는 경우가 있는데, 이를 선별하는 것을 통해 HEVC기반 디지털 워터마킹을 새로운 방향으로 이끌 수 있을 것으로 판단된다.
-
본 논문에서는 HEVC 동영상 표준 부호화 방식의 Intra 압축 모드를 이용해 영상을 압축할 때 잡음이 압축 알고리즘에 미치는 영향에 대해 논하고, 이를 분리하여 영상 압축의 성능을 높이는 방안을 제안한다. 먼저, 인공적으로 발생시킨 잡음을 영상에 추가한 후 이를 제거했을 때 압축 성능의 변화를 살펴본다. 그리고, 실제로 카메라를 사용해 취득한 영상에서 같은 결과가 나타나는지 확인하고, 이 결과를 바탕으로 가능한 한 화질을 유지하면서 압축 성능을 제고하는 방안을 제시하고자 한다.
-
최근 4K 이상의 초고해상도 동영상 콘텐츠가 제작되고 있고 그에 따라 많은 기업이 UHD TV 제품을 제작 판매 하고 있다. 따라서 이에 대응할 수 있는 새로운 코덱이 필요하고 그를 위해 HEVC가 개발되었다. 그러나 아직 HEVC의 부호화 효율을 위한 scalable 부호화 방식이 개발 중이다. 초고해상도 비디오 콘텐츠를 다양한 단말기에서 사용할 수 있도록 하기 위해서는 scalable 부호화 방식이 연구개발 되어야 한다. 본 논문에서는 HEVC 이전 버전 코덱인 H.264/AVC를 기반으로 한 scalable 부호화 방식 중 공간적 scalability에 대해 설명하고 여러 방법으로 간단하게 적용시켜 scalable 부호화 방식의 효율의 성능을 예측 평가해 본다. 이 방식은 dowm-sampling한 영상을 HEVC로 부호화하고 이를 up-sampling한 영상과 원영상의 차영상을 HEVC로 부호화하여 전송하는 방식이다. 여기서는 이 방식의 결과를 토대로 이 방식의 문제점을 지적하고 이를 토대로 한 향후의 연구방향을 제시한다.
-
3차원 비디오 부호화를 위한 표준안을 제정하기 위해 국제 표준화 기구인 JCT-3V(Joint Collaborative Team on 3D Video Coding Extension Development)에서는 3차원 비디오 부호화기술에 대한 표준화가 진행되고 있다. 본 논문은 현재 JCT-3V에서 HEVC(High Efficiency Video Coding) 기반으로 표준화가 진행 중인 3D-HEVC 부호화 기술들에 대해 살펴보고 그 부호화 및 복잡도 성능을 분석하였다. 이러한 성능 분석은 향후 3D-HEVC 기술에 대한 알고리즘 개발을 위한 기술 선별 및 조정에 유용할 것으로 판단된다.
-
고효율 비디오 부호화/복호화 표준인 HEVC(High Efficiency Video Coding)는 ITU-T(VCEG)와 ISO-IEC(MPEG)이 JCT-VC라는 팀을 이루어 공동으로 표준화를 진행 하였다. 이 표준화에서는 기존 표준기술 보다 다양한 예측 방향을 통한 인트라 예측 방법을 사용하며, 이로 인해 부호기의 계산량이 매우 높은 단점을 가진다. 제안하는 방법은 예측단위인 PU의 서브샘플링 값을 구하고 이의 경사도를 이용해 율-왜곡 최적화 방법(Rate-Distortion Optimization)의 계산에 사용되는 후보 모드를 줄이는 방법으로 부호기의 속도를 개선하는 방법이다. 이 방법은 기존 방법보다 적은 비트 손실에도 불구하고 약 19%의 부호화 속도 향상을 가진다.
-
기존의 지역기반 스테레오 정합 방법은 정합에 사용하는 정합창 크기에 따라 다양한 결과를 갖게 된다. 특히 사용하는 정합창의 크기가 커질수록 영상의 잡음에 강인하지만 객체의 경계부분이 모호해지는 단점을 갖고 있다. 본 논문은 고정된 크기의 정합창을 사용하는 지역기반 스테레오 정합 방법과 다른 방법을 제안한다. 제안한 방법은 영상의 경계를 검출하는 알고리즘을 이용하여 경계부분에는 작은 크기의 정합창을 사용한 변이값을 적용하고 경계가 없는 부분은 큰 크기의 정합창을 사용하여 얻은 변이값을 적용하도록 하였다. 경계를 검출하는 과정에서 본 논문은 AND 연산을 사용하여 최대한 객체의 테두리만을 나타내는 경계값을 구하도록 하였다. 또한 두 가지 크기의 정합창을 이용함으로써 발생하는 복잡도 증가를 감소시키기 위해 기존의 SAD 연산 알고리즘을 수정하여 복잡도를 감소시켰다. 본 논문에서 사용한 정합창의 크기는
$5{\times}5$ 와$15{\times}15$ 이며 실험결과 제안한 방법은$15{\times}15$ 정합창을 사용한 결과와 비교하여 변이지도에서 객체의 경계부분은 더 잘 살리면서 수행시간을 줄여 효율적인 정합결과를 얻어냈다. -
본 논문에서는 HEVC의 화면내 모드에서 예측을 수행할 블록의 주변적 특성을 이용한 고속 모드 결정 알고리즘을 제안한다. 기존의 화면내 예측 방법으로는 33가지 방향성 예측방법과 두 가지의 무 방향성 방법을 이용하게 된다. 이때 최적의 예측 모드를 선택하기 위하여 RD cost 계산을 하게 된다. 본 논문에서는 모드 선택의 복잡성을 줄이고 고속 모드를 결정하기 위하여 예측 할 블록의 주변 중 가장 자리와 가중치 특성을 고려하였다.
-
본 논문에서는 양자 통신을 실제적인 환경에서 구현하고자 하는 노력의 일환으로 개발된 연속 변수 양자 통신 기법에 대해 소개한다. 연속 변수 양자 통신 전반에 대한 설명에 이어 이를 이용한 최신 응용 기술들을 소개한다. 연속 변수 환경에서 구현된 다중 접속 채널, 최소 제곱 예측법, 그리고 다중 반송파 기법을 소개하고 그 효과와 한계를 서술한다.
-
We demonstrate nanoscale local anodic oxidation (LAO) patterning on few layer graphene using atomic force microscope (AFM) at room temperature and normal atmosphere. We focus on the humidity dependency in nanoscale oxidation of graphene. The relationship between the oxidation size and the AFM setting values, such as set point, tip speed, and humidity are observed. By changing these values, proper parameters were found to produce features on demand size. This technique provides an easy way to form graphene oxide lithography without any chemical resists. We have obtained oxidation size down to 50-nm with 6-nm-height oxide barrier line with
$0.1{\mu}m/s$ tip scanning speed and micrometer size symbols on a graphene flake. We attribute the bumps to local anodic oxidation on graphene surface and combination of oxygen ions into the graphene lattice. -
양자 키 분배는 안정한 통신을 위해 고안된 암호 체계이다. 양자 키 분배의 후처리 과정 중 정보 보정은 두 적법한 사용자 간의 연관 관계가 있는 정보를 일치시키는 과정이다. 고전 오류 정정 과정과 비슷하며 이 과정을 위해 추가 정보를 주고받기 때문에 도청자에게 일정량의 정보가 노출된다. 따라서 정보 보정 프로토콜에서 노출된 정보량은 프로토콜의 성능을 결정하는 중요한 요인이 된다. 본 논문에서는 Winnow 프로토콜과 LDPC 부호를 이용한 프로토콜을 노출된 정보량과 평균 통신 횟수 측면에서 비교한다. 그 결과로 Winnow 프로토콜에 비해 LDPC 부호를 이용한 프로토콜이 현재 양자 키 분배 시스템에서 더 좋은 기술이 될 수 있음을 보인다. 또한 LDPC 부호를 이용한 프로토콜이 가지는 단점을 극복할 수 있는 향후 연구 방향을 제시한다.
-
현재 다양한 통신 표준에서 채택되고 있는 OFDM 시스템에 비해 주파수를 더욱 효율적으로 이용해야 하는 요구가 증가함에 따라 FBMC/OQAM 시스템이 주목을 받고 있다. 수신단에서 알고 있는 파일럿 심볼을 이용한다는 관점에서 FBMC/OQAM 시스템에서의 채널 추정 방식은 OFDM의 채널 추정 방식과 유사하지만 FBMC/OQAM 시스템의 고유한 간섭으로 인해 OFDM 시스템의 채널 추정 방식에 비해 추가적인 기법이 필요하다. 이러한 간섭에 대처할 수 있는 방법으로 보조 파일럿을 사용하는 방법에 대해 알아보고, 연속적인 파일럿 패턴에 적용하는 데 제한이 있는 보조 파일럿 방식에 대해 간섭을 상쇄할 수 있는 기법을 적용한 후 성능을 측정하였다.
-
연속 변수란 불연속 변수와 다르게 빛의 진폭 및 위상과 같이 연속적인 값을 가지는 양자 정보를 말하며 연속 변수 선형 양자 오류 정정 부호는 이러한 연속 변수에서 발생하는 오류를 수정할 수 있는 선형 부호이다. 본 논문에서는 불연속 변수에서 연구된 stabilizer 부호를 기반으로 연속 변수 선형 양자 오류 정정 부호를 구성하는 방법을 살펴본다.
-
3차원 영상을 제작하기 위해서는 여러 시점의 색상 영상과 함께 깊이 정보를 필요로 한다. 하지만 깊이 정보를 얻을 때 사용하는 ToF 카메라는 해상도가 낮으며 적외선 신호의 주파수 문제 때문에 최대 3대까지 사용할 수 있다. 따라서 깊이 정보를 색상 영상과 함께 사용하기 위해서 깊이 정보의 업샘플링이 필수적이다. 업샘플링은 깊이 정보를 색상 카메라 위치로 3차원 워핑하고 결합형 양방향 필터(joint bilateral filter, JBF)를 사용하여 빈 영역을 채우는 방법으로 진행된다. 업샘플링은 오랜 시간이 소요되지만 그래픽스 프로세싱 유닛(graphics processing units, GPU)를 이용하여 빠르게 수행될 수 있다. 본 논문에서는 다중 GPU의 병렬 수행을 통하여 빠르게 다시점 깊이맵을 생성할 수 있는 방법을 제안한다. 다중 GPU 병렬 수행은 범용 목적 GPU(general purpose computing on GPU, GPGPU) 중의 하나인 CUDA를 이용하였으며, 본 논문에서 제안된 방법을 이용하여 3개의 GPU 사용한 실험 결과 초당 35 프레임의 다시점 깊이맵을 생성했다.
-
3D 입체영상 변환 기술은 콘텐츠 확보의 측면에서 그 중요성이 대두되고 있다. 하지만 입체변환 기술은 매 프레임마다 모두 수작업을 거치기 때문에 다수의 인력과 오랜 작업 시간이 필요하여 생산성 문제가 발생하고 있다. 그 중 깊이영상의 외곽선을 벡터 곡선으로 그리는 작업이 수작업을 통해 이루어지고 있으며 오랜 작업시간이 걸리게 한다. 본 논문에서는 기존의 입체영상 변환 과정의 자동화율을 높이기 위한 깊이영상 양자화 및 베지어 곡선 생성 방법을 제안한다. 연속적인 깊이값을 갖는 깊이영상을 입력으로 받아 선형 또는 비선형 기반의 양자화 방법을 이용하여 깊이영상을 양자화 한다. 이 때 경계부분에 발생하는 페더를 제거하여 양자화 깊이영상의 경계를 보정한다. 양자화 깊이영상에서 같은 깊이를 잇는 등심선을 생성하고 방향 변화가 큰 지점인 굴곡점들을 추출하여 등심선을 다수의 곡선으로 구분한다. 각 곡선의 양 끝의 굴곡점과 그 사이의 중간점을 이용하여 3차 베지어 곡선의 제어 포인트를 계산한다. 같은 수행 단계를 모든 등심선에 적용하여 사용자가 미세보정하기 쉬운 3차 베지어 곡선들을 생성한다. 실험 결과를 통해 제안하는 기법의 우수성을 확인하였다.
-
파노라마 영상은 하나의 영상이 가지는 제한된 시점의 한계를 극복하고 폭넓은 시야를 가질 수 있다는 점에서 최근 여러 분야에서 활용되고 있는 기술이다. 본 논문에서는 자연스러운 파노라마 영상 생성을 위해 SURF(speed up robust feature)를 이용한 특징점 기반의 파노라마 영상 생성 기법을 제안한다. SURF 알고리즘을 사용하면 정합할 두 영상에서 특징점들을 추출할 수 있다. 추출된 특징점들을 RANSAC(random sample consensus) 알고리즘을 통해 특징점 간 정합시 오차율을 최소화한다. 또한, 이미지 왜곡을 최소화하기 위해 실린더 투영을 이용하여 영상을 보정한다. 최종적으로, 서로 다른 두 영상을 합성할 때 발생하는 경계 주변의 이질감을 보완하기 위해 블렌딩 기법을 사용함으로써 자연스러운 파노라마 영상을 생성한다.
-
본 논문은 human visual system(HVS)에 따른 주파수 민감도와 공간에서 다양한 특성들을 구현하기 위한 신호처리 방법을 개발하였다. 인간의 눈은 주파수 성분에 따라 민감도가 다르며 초점에서 멀수록 인지 가능한 해상도가 떨어진다. 주파수 민감도를 구현하기 위해서 본 논문은 영상 신호의 에너지 스펙트럼 모양이 contrast sensitivity function(CSF)의 모양이 되도록하여 영상 신호의 에너지를 증가시켰으며 신호 방향에 적응적인 multiband energy scaling 방법을 개발하였다. 기존의 시스템에서 능률만을 향상시키는 기존의 분석 모델과 비교하면 개발한 방법은 HVS에 좀 더 적절하고 선호되게 영상 신호를 처리할 수 있다.
-
We develop the signal processing method for implementing the human perceptual variant on frequency and space. The human visual perceptual sensitivity varies as frequency components and the human perceivable resolution diminishes as the distances further from the eye-focused point. For realizing the frequency sensitivity, we developed the signal direction adaptive multiband energy scaling method to weight the frequency components. The low-pass filtering is designed on the developed energy scaling method for diminishing perceivable resolutions as the deviated distance from the eye-focused point. The developed method not only enhances the frequency components of image signals at the eye-focused region but also smoothes non-perceivable detailed image signals at non-focused regions. The proposed method is verified by the subjective and objective evaluations that it can improve human perceptual visual quality.
-
최근 채널 효율을 향상시키기 위하여 다중안테나(MIMO, multi-input multi-output) 기술이 연구되고 있다. 다중안테나 기술은 송 수신 안테나 개수를 증가시켜 수신 성능을 향상시키고 대역 효율을 향상시키지만 송신 안테나 개수를 늘려야만 대역 효율을 증가시킬 수 있으므로 기존 방송 시스템에 적용하기에는 비용이 많이 드는 단점이 있다. 이에 본 논문은 방송 시스템에 적합한 SIMO(single-input multi-output) 시스템에 FTN(faster than Nyquist)을 적용하여 대역 효율을 증가시키고 수신 성능을 향상시키고자 한다. 또한 MRC(maximum ratio combining) 및 경판정(hard decision)을 적용하여 수신 안테나 개수에 따른 수신 성능을 컴퓨터 실험을 통하여 알아본다.
-
본 논문에서는 중요도 지도에 기반한 관심 영역 동영상 압축 방법에 대해 고찰한다. 동영상 압축은 손실 프로세스이기 때문에 관심 영역에서의 정보 손실 최소화가 필요하며, 이를 위해 중요도 감지 과정에서 추출되는 중요도 지도의 신뢰도가 중요하다. 따라서 다양한 다른 기법의 중요도 지도 적용 결과를 비교함으로써 중요도 지도 추출 알고리즘의 요건에 대해 추론하고, 추출된 중요도 지도를 이용하여 적절하게 동영상을 부호화하는 방법에 대해 제안한다. 마지막으로 실험결과를 통해 보완되어야 할 부분을 제시한다.
-
현재 우리나라 무대조명 업계내의 시장은 시간이 흐르면서, 조명개발이 더욱 화려하고 실용적인 장비들로 개발되고 있다. 다양한 개발에 앞서 무대조명 등기구의 광학적, 상용적 그리고 구체적인 테스트 방법의 기준이 전무한 상태이다. 업체별로 많은 기준들을 선보이고 있지만, 선택하는 이용자에게 혼란만 야기되므로 통일되고 규범화 시킬 필요성이 있다고 생각한다. 그래서 무대 등기구 가운데 무빙라이트에 대하여 국내외적인 등기구 측정방법과 시스템 구조기술에 대한 내용 중 광학적 성능, 소음제어, 온도제한의 조건 등 대하여 간략하게 제시하고자 하며, 이를 바탕으로 무대조명 장비의 표준화 형성에 도움이 될 수 있도록 제안하였다.
-
본 논문에서는 영상에 존재하는 운동정보를 이용하여 관심맵을 얻는 방법을 제안한다. 운동의 크기, 방향, 그리고 영상의 색을 이용한다. 이를 이용함으로써 기존의 static image에서 구하는 관심맵보다 향상된 결과를 얻을 수 있다. 실험에서는 다양한 모션이 존재하는 영상을 이용하여 제안방법의 우수성을 증명하였다.
-
최근 영화 <아바타>를 필두로 영화, 방송 등 영상매체에서 다양하게 3 차원 영상기술을 적용하고 있는 추세이다. 본 논문에서는 여러 가지 3 차원 영상 기술 중에서 가장 현실감이 높은 기술인 홀로그래피 (Holography)기술에 대하여 다루고자 한다. 우선 간략하게 홀로그래피 기술에 대하여 소개하고 홀로그램(Hologram)의 기록 및 복원 원리와 컴퓨터를 이용하여 홀로그래피 이미지를 만드는 컴퓨터 홀로그램 (Computer-generated hologram)에 대하여 기술하였으며, 범용 컴퓨터와 GPU(Graphics processing units)통해 컴퓨터 홀로그램 패턴을 기록 및 복원하는 실험을 진행해 보고, 시간 복잡도를 측정, 비교해 본다.
-
Lee, Sang-Hoon;Kim, Doeyoung;Vasant, Jadhav Sagar;Ryu, Justin Daegull;Kang, Hogab;Lee, Sanghoon 264
불법적으로 생성된 디지털 콘텐츠의 저작권의 보호를 위하여 콘텐츠 식별 작업이 필요하다. 스캔된 불법 만화 도서의 경우 콘텐츠 식별을 위하여 이를 위해 특별히 제작된 핑거프린트가 필요하다. 핑거프린트를 통한 저작물의 식별률을 높이기 위해서 는 스캔 만화 이미지의 전처리 과정이 필요하다. 본 논문에서는 종이 만화도서가 스캐너를 통해 이미지로 전환되는 과정에서 스캐너에 의해 일어나는 광도 왜곡을 최소화하여 만화 도서의 식별률을 높이고자 하였다. 실험을 통해 약 27%의 식별율의 개선을 얻었다. -
Kim, Doeyoung;Lee, Sang-Hoon;Vasant, Jadhav Sagar;Ryu, Justin Daegull;Kang, Hogab;Lee, Sanghoon 266
최근 웹하드를 통하여 허가 받지 않고 불법적으로 생성된 디지털 콘텐츠에 대한 저작권 보호에 대한 문제가 대두되고 있다. 불법 만화 도서를 검색하고 식별하는 알고리즘 또한 만화 도서의 특성에 맞게 제작되어 만화 도서 이미지 간의 식별률을 높이고 있다. 특히 불법적으로 스캔된 만화 도서의 경우 식별을 위해 만화 도서 핑거프린트가 쓰이게 되는데, 스캔 과정에서 상하좌우가 정확히 맞지 않아 스캔본의 기하학적 특성이 만화의 원본과 달라지는 왜곡을 최대한 제거하여 만화 도서의 식별률을 높이고자 했다. -
Object extraction problem is one of the most important topics in the research area of computer vision, this type of technique can be widely used in practical, such as image processing, robot vision, automatically traffic guide and so on. In this paper, we propose a different way to estimate the background and foreground without any previous training procedure, this approach can be used for automatic object extraction in the future. A simple experiment result shows that our approach has a good potential for the further more practical application.
-
첨단 정보통신과 모바일 산업의 성장으로 블로그, 소설네트워크 서비스와 같은 사람과 사람, 또는 사람과 정보를 연결, 공유하고 상호 작용할 수 있는 웹 기반의 소셜미디어 산업이 성장하고 있다. 이에 따라 활발히 공유되고 있는 콘텐츠들의 형식도 단순 텍스트에서 위주에서 이미지나 동영상과 같은 멀티미디어 콘텐츠로 변화되고 있다. 이전에는 멀티미디어 콘텐츠 제작이 전문가만의 영역으로 간주되었지만, 최근에는 방대한 양의 콘텐츠들이 UCC 형태로 제작되어 일반 사용자들의 강한 창조적 열의를 느낄 수 있다. 하지만 일반 사용자가 멀티미디어 콘텐츠를 제작하기 위해서는 여전히 콘텐츠 제작 도구 기술 습득 및 제작에 많은 시간이 필요하다. 또한 제작된 콘텐츠들의 품질도 전문가들의 결과물에 비해 만족스럽지 않은 것이 사실이다. 그래서 본 논문에서는 언제 어디에서 누구나 쉽게 멀티미디어 콘텐츠를 제작할 수 있고 그 콘텐츠의 품질도 고려한 웹 기반 자동 영상 제작 시스템을 개발하였다.
-
일반적으로 래스터 그래픽스 기반으로 구성된 사용자 인터페이스는 등심선을 원하는 형태로 생성 및 편집하는 저작도구 인터페이스를 제공함에 있어 그래픽 모델의 확장성과 생산성에 대한 제약으로 인해 자유로운 그래픽 표현에 많은 어려움을 나타내고 있다. 본 논문에서는 이러한 문제를 해결하기 위해 객체 지향 그래픽스 기술인 WPF 사용자 인터페이스를 통해 벡터 곡선을 독립적인 콘텐츠로 모델링하여 등심선 생성 및 편집도구에 독창적이고 유연한 그래픽 표현이 가능하도록 사용자 인터페이스를 제공하는 방법을 제안한다. 이를 위해 등심선의 그래픽 레이아웃은 조절점과 곡선으로 분할하여 벡터 곡선에 대한 컨테이너 요소를 제공하였고, 최종적으로 프로토 타입의 저작도구를 이용해 등심선의 모의 편집 실험을 실시하여 제안하는 방법의 우수성을 확인하였다.
-
본 논문에서는 웹 기반 디지털 사이니지 가상화를 위한 부하 분산 시스템을 다룬다. 웹 기반 콘텐트는 개발하기 쉽고 관리하기 쉽다고 평가되고 있다. 이런 이유로 디지털 사이니지 콘텐트를 웹 기반으로 개발하는 사례가 늘어나고 있다. 웹 기반 디지털 사이니지 콘텐트를 재생하기 위해서 디지털 사이니지 단말은 특정 사양 이상의 연산 능력을 가지고 있어야 한다. 이때 가상화 기술을 사용하여 디지털 사이니지 단말을 씬 클라이언트로 대체하면 단말 가격, 관리 비용, 전력 비용 등이 절감되는 장점이 있다. 가상화 기술을 사용하여 디지털 사이니지 콘텐트를 다수의 씬 클라이언트에게 스트리밍하기 위해서는 다수의 서버와 부하 분산 시스템이 필요하다. 본 연구에서 개발된 부하 분산 시스템은 서버 부하에 기반하여 요청을 분배하며, 고가용성을 지원한다.
-
본 논문에서는 상황 적응적 디지털 사이니지 시스템을 다룬다. 디지털 사이니지 디스플레이는 정보 및 광고 제공에 효과적인 매체이다. 시청자, 장소, 날씨와 같은 환경적 상황에 콘텐트를 적응시킨다면 디지털 사이니지는 더욱 효과적일 수 있다. 본 논문에서 제안하는 상황 적응적 디지털 사이니지 시스템은 다양한 환경 상황에 적응하여 콘텐트를 제공한다. 상황을 인지하기 위해 카메라, 온도계 등 다양한 센서들이 사용된다. 이 시스템에서는 다수의 상황들이 모델링되며, 해당 상황들에 대한 콘텐트가 체계적으로 저장되고 제공된다.
-
X-ray 영상의 경우 검은 배경으로 인해 기존의 히스토그램 평활화를 사용하여 대비비를 향상 시킬 경우 문제가 발생한다. 전역 히스토그램 평활화의 경우 영상의 특징을 고려하지 않은 채 전체적으로 히스토그램 평활화가 이루어지기 때문에 부분적인 명암값을 개선시키기 어렵다. BBHE(Bright Preserving Bi-Histogram Equalization)과 DSIHE(Dualistic Sub-Image Histogram Equalization)과 같은 영역별 히스토그램 평활화의 경우 X-ray 사진특성상 검은 배경으로 인하여 히스토그램 평활화를 적용해도 원하는 대비비를 얻기 힘들며 부분적으로 왜곡이 발생한다. 이러한 문제를 해결하기 위해 본 논문에서는 영상의 히스토그램을 통해 배경 정보를 파악하여 밝기 영역을 나눈 후 히스토그램 평활화를 진행함으로써 X-ray 사진의 대비비를 효율적으로 향상시킨다.