Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2008.11a
-
본 논문에서는 국내에서 DTV 전환에 대비한 DTV 방송프로그램의 기술적 보호조치 방안 마련을 위하여 기술적 보호조치의 의의 및 분류, 해외의 기술조치 방안에 대하여 살펴보고 이를 바탕으로 기술적 보호조치에 필요한 요구사항을 도출하여 보았다. 무엇보다 기술적 보호조치는 사용자의 사용권한을 제한하지 말아야 하며 (공정이용 보장), 기술혁신을 저해하지 말아야 할 것이고, 또한 합리적인 비즈니스 모델을 제시하는 것이 중요하다. 또한 국내 지상파 방송은 무료 보면적 서비스라는 일반 시청자들의 인식으로 인하여, 지상파 DTV 방송프로그램의 기술적 보호조치 도입에 대한 시청자의 심리적 거부감이 강하므로 이를 해소하면서 합리적인 기술적 보호조치 방안을 마련하는 것이 중요한 과제이다.
-
Oh, Moon-Kyun;Ahn, Sang-Woo;Cheong, Won-Sik;Choo, Hyon-Gon;Lee, Joo-Young;Shin, Sang-Kwon;Nam, Je-Jo 7
본 논문에서는 국내에서 DTV 전환에 대비한 기술적 보호조치 방안 마련을 위하여 기술적 보호조치의 방법들에 대하여 간략히 살펴보고 이를 바탕으로 유통활성화를 도모하기 위한 기술적 보호조치 방법을 제안하였다. 디지털 방송프로그램을 보호하기 위한 기술적 보호조치는 인터넷을 통한 불법유통을 방지하여 저작권자의 이익을 도모하려는 목적이나, 이로 인하여 방송프로그램 유통의 지나친 억제는 저작권자의 권익보호를 위하여 바람직하지 않다. 따라서 사용자가 보다 편리하고 저렴한 비용으로 방송프로그램을 재시청 및 재활용할 수 있도록 방송프로그램의 기술적 보호조치를 마련하는 것이 저작권자의 권익을 극대화 할 수 있다. 이러한 방법의 하나로 방송프로그램에 콘텐츠 보호선호 및 콘텐츠의 이용을 위한 연결정보를 포함하여 송출하고 방송수선단말에서 사적이용범위 내에서는 방송프로그램을 자유롭게 녹화 및 복사하여 시청할 수 있지만, 사적이용범위 밖으로 복사/전송 시에는 콘텐츠 연결정보만을 복사하고, 이를 재생할 때는 콘텐츠 연결정보를 이용하여 방송프로그램 유통서버로 연결하며, 유통서버와의 통신을 통하여 저렴하고 편리하게 방송프로그램을 사용할 수 있는 기술적 보호조치의 한 방법을 제안하였다. -
Kim, Joo-Sub;Choo, Hyon-Gon;Kim, Byung-Sun;Lee, Sang-Gyou;Kim, Sung-Hwan;Song, Joo-Ho;Nam, Je-Ho 11
본 논문에서는 ATSC 기반 국내 지상파 DTV 방송신호를 대상으로 ATSC A/65c(Program and System Information Protocol; PSIP) 및 A/57b(Content Identification and Labeling for ATSC Transport) 표준규격 기반의 방송프로그램ID 규격을 제안한다. 특히, 현재 방송사 내부적으로 운영되고 있는 콘텐츠 식별관리 방식의 독자성을 유지하고, 지상파방송 서비스 환경의 특수성을 반영한 지상파 방송프로그램 식별정보인 방송프로그램ID 구조를 제시한다. 또한 방송프로그램ID 삽입/추출기의 구현 및 실험과정을 통하여, 국내 지상파 DTV 방송 송수신규격과의 정합 및 방송프로그램ID의 기능 검증을 수행한다. -
Image hash는 영상에서 유사성을 찾는 방법으로 사용될 수 있는 기술자(Descriptor)로 특징지을 수 있다. 많은 image hash 방법중에 Histogram-based image hash는 Histogram equalization을 제외한 보통 잡음 및 다양한 기하학적 변조를 주어도 같은 그림을 찾아내는데 강력한 기능을 수행한다. 본 논문에서는 Histogram-Based Hash를 생성함에 있어 서로 다른 3개의 bin의 관계를 이용하여 Hash를 생성하였다. 본 논문은 이를 통해 영상의 유사성을 찾아내는데 있어 원본영상에 대해 기하학적 변조뿐만 아니라 상대적으로 성능이 약했던 Histogram equalization을 이용한 변조에 대해서도 성능이 개선되었다. 또한 가우시안 필터링의 알파 값을 다르게 지정함으로 인하여 생성되는 두 히스토그램을 이용하여 기존의 방법보다 성능이 개선되었다.
-
본 논문에서는 T-DMB 시스템의 단일 주파수 망 구성을 위해 궤환신호 제거기를 가지는 등화형 OCR (Equalization On-Channel Repeater, E-OCR)을 제안한다. 제안된 OCR은 송/수신 안테나의 충분치 못한 분리도로 인해 야기된 궤환신호를 궤환간섭 제거기를 통해 제거하여 송신출력을 높일 뿐만 아니라, 송신기와 중계기 사이의 다중경로 신호를 등화기를 통해 제거하여 우수한 출력신호 품질을 보장한다. 또한, 본 논문에서는 전산실험을 통해 제안된 OCR의 성능을 살펴보고 실험실 테스트를 통해 실제 구현된 OCR의 성능을 검증한다.
-
본 논문에서는 지상파DTV 방송프로그램 보호를 위한 하드웨어 PPI 전송서버를 제안한다. 제안한 하드웨어 PPI 전송서버는 방송환경에서의 안정성을 보장하기 위하여 소프트웨어의 PPI 스케줄러와 하드웨어의 PPI MUX로 구성하였다. PPI 스케줄러는 EPG를 PPI 보호신호와 프로그램 ID와 함께 편성하여 시간순서로 스케줄링하는 기능을 제공하며, PPI MUX는 EPG, PPI 보호신호, 프로그램 ID를 PSIP로 부호화한 후, 이를 MPEG-2 TS로 패킷화하여 실시간 출력하는 기능을 제공한다. 또한 하드웨어 PPI 전송서버는 기존의 방송 송출 시스템의 변경 없이 유연하게 연동시킬 수 있는 장점이 있다. 본 논문에서 제안한 하드웨어 PPI 전송서버는 PPI 보호신호를 방송프로그램에 삽입하여 송출함으로써, 지상파DTV 방송프로그램의 무단복제, 불법배포를 제한하는 기능을 제공한다.
-
양방향 중계 채널(two-way relay channel)은 2명의 사용자가 중계기(relay)의 도움을 받아 서로 정보를 주고받는 통신 채널이다. 중계기에서는 각각의 사용자로부터 독립적으로 수신한 두 데이터 패킷에 네트워크 코딩 기법을 적용하고, 이를 통해 만든 패킷을 두 사용자에게 동시에 전송한다. 따라서 양방향 중계 채널에서는 기존의 협력 통신에 비해 보다 효율적인 자원의 사용이 가능하다. 한편, 다중 중계기 환경에서의 중계기 선택 기반 전송 방식은 시스템의 전력 제한(power constraint), 전송 패킷의 동기화(synchronization) 문제 등을 고려할 때 다중 중계기 기반 전송 방식보다 우수한 성능을 얻을 수 있다. 본 논문에서는 양방향 다중 중계기 채널에서 중계기 선택 기법을 제안한다. 양방향 중계 채널에서는 수신한 두 신호의 결합을 위해 중계기에서 네트워크 코딩 기법을 적용함으로써 중계기의 부담이 보다 증가하는 특징이 있다. 또한, 중계기는 신호 전송 시 두 사용자 모두에게 전송하게 되고 이로 인해 두 수신지와의 채널 조건을 모두 고려하여야 한다. 따라서 중계기 선택은 데이터 패킷의 전송이 시작되기 전에 분산된 방식(distributed method)으로 이루어지며, 각각의 사용자와 중계기 간 일시적(instantaneous) 채널 이득을 바탕으로 사용자-사용자 간(end-to-end) 경로 조건의 최대값을 계산하는 메트릭(metric)을 중계기 선택 기준으로 사용한다. 모의실험을 통해 제안된 중계기 선택 기법이 중계기의 개수에 해당하는 다이버시티 이득을 얻을수 있음을 보여준다.
-
지상파DTV 방송프로그램에 대한 보호에 대한 요구가 커짐에 따라, 지상파 방송프로그램에 대한 보호를 위한 여러 가지조치가 시도되고 있다. 최근 ATSC의 RC 기술자를 기반으로 방송프로그램의 저작권 보호를 위한 방송프로그램 보호 기술규격이 표준화가 진행 중이다. 본 논문에서는 방송프로그램 보호신호(Program Protection Information:PPI)에 기반한 지상파방송프로그램 보호 셋탑 장치를 제안한다. 제안하는 보호 셋탑 장치는 PSIP/PSI 신호를 해석하여 ATSC의 RC 서술자에 포함 된 PPI 신호를 추출, 해석한다. PPI 신호에 정의된 정보를 기반으로 저작권 정보가 표시된 방송프로그램은 A/V 정보가 암호화 되어 저장되며, 다른 장치와의 호환성을 유지하기 위해, 암복호화 정보는 파일과 함께 패키징되어 저장된다. 본 논문에서 제안한 지상파 방송프로그램 보호셋탑은 방송프로그램 보호신호에 따라, 방송프로그램을 보호할 뿐 아니라, 사용자의 사적이용을 지원하기 위한 제한적인 배포 기능을 제공한다.
-
디지털 컨버전스와 유비쿼터스 시대의 시작은 디지털 미디어 기술의 발전과 방송 통신 사업의 컨버전스를 가속화 시켰으며, 그 결과로DMB, WCDMA, Wibro, IP-TV, HSDPA 등의 새로운 형태의 차세대 제품과 서비스들이 뉴미디어 매체의 핵심으로 등장하고 있다. 국내에서 방송 통신의 컨버전스의 빠른 진행은 세계 최초로 디지털 멀티미디어 방송(DMB) 서비스 시작을 가능하게 하였다. DMB 서비스는 멀티미디어 서비스가 핵심이다. DMB 데이터 서비스인 Broadcasting Website Service(BWS)는 현재 지상파 DMB방송 사업자인 KBS, MBC, SBS, YTNDMB가 본방송 준비 막바지 단계이며, 삼성전자와 LG전자를 비롯한 단말기 개발사들도 데이터 서비스를 위한 제품 출시에 서두르고 있는 등 DMB 산업의 활성화의 주역이 될 것으로 예상된다. DMB의 데이터 서비스는 뉴스, 날씨, 프로그램 정보 등의 단순 정보보기 수준에 그치지 않고, 리턴 채널을 이용한 양방향 서비스와, SMS, 전화걸기 등 휴대전화 단말의 고유기능과의 연계를 통한 다양한 서비스도 선보일 것이다. 더 나아가 향후 T-Commerce와 개인 광고 등 새로운 비즈니스 모델과 사업영역으로 확산시켜 나갈 수 있을 것이다. 그러나, 아직까지 DMB와 데이터 서비스는 초기단계로서, 표준 기술의 규격 작업, 이론적 논의들, 관련 사업자들의 비즈니스 준비 등에서 검토되어, 실제 사용자들을 대상으로한 연구 분석이 이루어 지지 않았다는 연구의 한계를 가지고 있다. 본격적으로 방송, 통신 컨버전스 데이터 서비스가 시작되면서, 사용자들에 초점을 맞춘 많은 연구가 이루어지길 바라며, 이러한 연구의 분석을 통해 또 다른 새로운 서비스와 비즈니스 기회의 창출을 기대해 본다.
-
본 연구는 TV광고음향의 사운드디자인에 대한 수용자 감성반응에 관한 연구이다. 연구방법으로 영상구조에서 음향이 없는 상태와, 음악설계사운드디자인을 제시 하였을 때 수용자가 받아들이는 음향감성반응을 뇌파측정을 통한 뇌 지수(BQT) 비교 방법으로 분석하였다. 본 연구를 통하여 영상에 있어 사운드의 시청각적 감성효과가 사운드디자인설계에 의하여 달라질 수 있음을 정량적 방법으로 확인할 수 있었다.
-
Digital TV와 IPTV 환경에서의 단말 어플리케이션은 디지털 콘텐츠에 대한 사용자 인터페이스를 제공하고 고부가가치의 복합 방송 서비스의 구현을 가능하게 하는 핵심 요소이며 이러한 단말 어플리케이션의 호환성을 확보하기 위해 방송 단말용 미들웨어 기술이 도입되었다. 방송 기술을 위한 단말 미들웨어는 크게 XHTML 브라우저 기반 플랫폼과 가상 머신 기반 플랫폼으로 양분되며 각각 독자적인 어플리케이션 모델을 제공한다. 이러한 두 가지 플랫폼의 통합을 위해 방송용 단말을 위한 미들웨어 국제 표준 기술 규격에서는 초기부터 브라우저와 가상 머신 플랫폼의 상호 운영성에 대해 정의하였다. 본 논문에서는 현재까지 다양한 플랫폼에서 연구 개발이 진행된 브라우저와 가상 머신 기반 미들웨어의 특성을 살펴보고 통합된 어플리케이션 모델과 이를 지원하는 미들웨어 아키텍처를 미들웨어 구현 관점에서 제시한다. 또한 국제 표준 규격들에서 제시하는 기술 방식을 검토하여 최근 변화한 기술 요소에 대한 적용점을 살펴본다. 마지막으로 TV 환경에서의 통합된 미들웨어 플랫폼 기술의 발전 전망과 방송용 단말 미들웨어 플랫폼에 대한 향후 연구에 관련된 주요한 기술적 변화들을 정리한다.
-
IPTV 기반의 이러닝 마켓플레이스는 IPTV를 통한 이러닝 서비스 제공을 하기 위한 교육 콘텐츠 공급자와 수요자간의 마켓플레이스로써, 이는 양방향 매체 하에서의 이러닝 서비스로써 많은 관심의 대상이 되고 있으며, 방송통신융합의 초기 단계에서 IPTV는 다양한 콘텐츠와 서비스 모델의 개발을 통하여 그 효용성을 높이는데 기여를 할 수 있을 것이다. 본 논문에서는 IPTV기반의 이러닝 마켓플레이스에서 핵심적인 프레임워크를 구성하기 위하여 이러닝, e-마켓플레이스, IPTV에서의 특징과 기존의 이러닝 마켓플레이스들의 기능을 매트릭스를 통한 비교분석으로 기본요소를 추출하고, 이를 통하여 프레임워크를 구성한다. 또한 비즈니스모델 개발을 위하여 비즈니스모델설정, 참여자/역할, 제품/서비스 커버리지, 운영시나리오, 수익모델을 작성하고 이를 통하여 실제적으로 비즈니스모델의 구현이 가능한지를 검증한다.
-
뉴미디어로서의 가능성을 가지는 새로운 비즈니스 모델을 본논문에서 제시하였다. 이논문은산학프로젝트개발(2006-2008년)로 개발되어 현제 적용중으로, 주변에서 흔하게 볼 수 있는 아파트단지를 대상으로 아파트 내부의 방송통신설비와 유휴채널을 활용, IPTV 등의 기술을 응용하여 아파트자치방송이라는 새로운 개념의 비즈니스모델을 제안하고 이러한 올드미디어와 뉴미디어의 결합을 통해 유비쿼터스 시대의 목적에 부합됨은 물론 소중한 설비자원과 전파자원에 대한 새로운 시각을 제시하였다.
-
휴대방송에서 방송통신융합서비스가 진행되면서 시청자들의 초점을 맞춘 연구가 심화되어 또 다른 융합서비스와 양방향 서비스가 한 단계 더 발전하는 계기가 마련되어야 할 것으로 본다. 이러한 퍼스널 사회로의 진입과정에서 휴대방송 발달의 이론적 배경을 이해하고 진단을 통해 추진과제와 다양한 선행 과제들이 무엇인지 살펴보고자 하였다.
-
본 논문에서는 PSNR 이 다른 어떤 척도보다도 화질의 평가에 있어서 중요하다는 전제하에 비쥬얼리듬 (VR) 정보를 이용하여 원본영상이 가용하지 않은 일반 시청자들의 STB 재생영상으로부터 PSNR 을 추정하는 방법을 제안하였다. VR 로부터 추정한 PSNR 값이 매 프레임 별로 2 차원 재생영상으로부터 구한 PSNR 과 같지는 않으나 시청자들이 평균적으로 어느 정도의 화질로 시청하고 있는지 비교적 정확하게 모니터링이 가능하다. 제안된 방법은 감소기준법(RR) 영상품질 측정방법으로 사용될 수 있다. STB 은 단순히 재생영상으로부터 VR 정보만 추출해서 서버로 전송하는 역할만 수행하면 되고, 나머지 연산은 품질관리 서버에서 수행하므로 자원이 부족한 STB 의 부담을 경감하면서도 효율적으로 품질을 모니터링할 수 있는 장점이 있다.
-
Mobile devices are being widely used to access Internet contents. However, most available web pages are designed for desktop computers and consequently it is inconvenient to browse large web pages on mobile devices with small screen. Text identification is a process to extract texts from the body of a web page, which are then displayed in a comfortable way for reading. In this paper, we propose a text extraction scheme and discuss its implementation.
-
영상매체를 통한 다양한 정보가 지식을 습득하는 보편화된 수단으로써 자리를 잡아가고 있다. 방송자막은 불과 10여 년 전만 해도 영상의 효과적 전달을 위한 하나의 보조적 수단에 불과했지만 이제는 프로그램의 가치를 높여주는 중요한 정보 중 하나로 꼽을 수 있다. 현재의 방송자막은 SDTV의 가이드라인을 기준 삼아 타 매체에도 그대로 사용되고 있고 수신기 역시 점차 화면이 대형화, 소형화되고 있어 정보전달 면에서 문자의 가독성에 여러 가지 문제점을 지니고 있다. 본 논문에서는 2차의 설문을 통해 전문가 그룹을 대상으로 한 델파이조사를 기반으로 영상화면의 자막크기, 글꼴, 문자속성, 표출효과 등의 시각적 요소와 인지도가 어떤 연관을 가지고 있는지를 고찰하고 OSMU 환경에서의 각 매체별 특성을 고려한 가이드라인을 제안한다.
-
최근 센서네트워크와 같은 에너지 제한 환경을 위한 경량화 부호화 기술의 필요성이 대두됨에 따라 분산 소스 부호화 기술(Distributed Source Coding)의 응용기술로 비디오 부호화 복잡도의 대부분을 차지하는 움직임 예측/보상과정을 부호화기가 아닌 복호화기에서 수행하는 분산 비디오 부호화 기술(Distributed Video Coding)에 대한 연구가 활발히 이루어져 왔다. 이에 가장 대표적인 기술인 Wyner-Ziv 코딩 기술은 채널 코드를 이용하여 원본 프레임과 이에 대한 복호화기의 예측영상인 보조정보 사이의 잡음을 제거하여 영상을 복원한다. 일반적으로 보조정보는 원본영상에 유사한 키 프레임간의 프레임 보간을 통하여 생성되며 채널 코드는 Shannon limit에 근접한 성능을 보이는 Turbo 코드나 LDPC 코드가 사용된다. 이와 같은 채널 코드의 복호화는 채널 잡음 모델에 기반하여 수행되어지며 Wyner-Ziv 코딩 기술에서는 이 채널 잡음 모델을 '상관 잡음 모델' (Correlation Noise Modeling)이라 하고 일반적으로 Laplacian이나 Gaussian으로 모델화 한다. 하지만 복호화기에는 원본 영상에 대한 정보가 없기 때문에 정확한 상관 잡음 모델을 알 수 없으며 잡음 모델에 대한 예측의 부정확성은 잡음 제거를 위한 패리티 비트의 증가를 야기해 부호화 기술의 압축 성능 저하를 가져온다. 이에 본 논문은 원본 프레임과 보조정보 사이의 잡음을 정확하게 예측하여 잡음을 정정할 수 있는 향상된 상관 잡음 모델을 제안한다. 제안 방법은 잘못된 잡음 예측에 의해 Laplacian 계수가 너무 커지는 것을 방지하면서 영상내의 잡음의 유무에 별다른 영향을 받지 않는 새로운 문턱값을 사용한다. 다양한 영상에 대한 제안 방법의 실험 결과는 평균적으로 약 0.35dB에 해당하는 율-왜곡 성능 향상을 보여주었다.
-
예비 슬라이스(Redundant picture)는 에러가 발생하기 쉬운 환경에서 비디오가 전송될 때 에러를 보상하기 위한 H.264/AVC 부호화 표준의 도구들 중에 하나이다. 본 논문에서는 예비 슬라이스의 삽입으로 인해 발생하는 오버헤드 비트와 손실률을 고려한 LA-RDO(Loss-aware rate-distortion optimization) 모델을 제시하며 제안하는 모델에 기초해서 예비 슬라이스의 삽입 여부를 결정한다. 실험결과는 제안하는 방법이 참조 소프트웨어(JM: Joint Model)에 있는 HRP(Hierarchical redundant picture)와 비교했을 때 평균 0.5dB의 PSNR이 증가함을 보였다. 특별히 낮은 비트율에서 상대적으로 높은 성능을 보이므로 비디오 화상 회의와 같이 낮은 비트의 영상을 요구하는 무선 전송 환경에 적합할 것으로 보인다.
-
본 논문에서는 준 정적(quasi-static) 레일레이 페이딩(Rayleigh fading) 채널에서 상향링크 다중 사용자 MIMO-OFDM 시스템을 위한 최소평균제곱오차-순차간섭제거(MMSE-SIC: Minimum mean square error-successive interference cancellation) 수신기에 대해 연구한다. 송신 안테나가 하나인 사용자와 수신 안테나가 다수인 기지국에서 MMSE-SIC 수신기를 기반으로 신호를 검출하는 시스템에서는 하나의 부대역 내에서 동시에 전송 가능한 사용자의 수가 기지국에서의 수신안테나 수보다 작아야 하는 제한 조건을 가지고 있다. 따라서 사용자간 공정성을 보장하고 시스템의 효율성을 높이기 위해 낮은 복잡도를 가지는 비례 공정(Proportional fair) 스케줄링 알고리즘을 제안한다. 제안된 비례 공정 스케줄링 알고리즘에서는 부대역 내에서 다중 사용자 채널 행렬을 기반으로 동시에 전송하는 사용자들의 집합을 찾는다. 평균 채널 이득이 사용자마다 다른 환경에서의 모의실험을 통해 제안된 비례 공정 스케줄링 기법의 성능을 알아본다. 제안된 비례 공정 스케줄링 기법은 기존의 공정성을 기반으로 하는 스케줄링 알고리즘보다 더 큰 일반 비례 공정(General proportional fair) 기준과 더 높은 셀 수율(Cell throughput)을 가지는 것을 보이고 있다.
-
국내외적인 이동멀티미디어 방송 시장의 급속한 성장과 더불어 동일한 주파수 대역에서 기존 T-DMB 시스템에 비해 더 많은 데이터 전송률을 얻기 위해, T-DMB 시스템에 계층변조를 적용하여 전송률을 높이는 연구가 국내외적으로 추진되고 있다. 기존 T-DMB 시스템의 DQPSK 신호에 새로운 변조방식으로 변조된 신호를 더하여 계층변조 하는 경우에, 새로 추가되는 신호에는 한 개 이상의 변조방식이 적용될 수 있다. 이러한 경우의 일례는 DQPSK-BPSK 및 DQPSK-QPSK 변조가 있을 수 있다. 이와 같이 새로 추가되는 신호에 한 개 이상의 변조방식이 적용된 경우에, 수신단에서 새로 추가된 신호에 적용된 변조방식을 용이하게 검출하기 위한 수단이 필요하다. 이것을 위하여 PRS 신호에 PN 시퀀스를 계층변조 형태로 추가하여 수신단에서 PN 시퀀스의 상관을 취하여 새로 추가되는 신호의 변조방식을 검출하는 방법을 제안하고, 실험 결과를 제시한다.
-
OFDM 시스템에서는 수신단의 샘플링 주파수가 정확하지 않을 경우 샘플링 주파수 옵셋으로 인한 ICI(Inter-Carrier Interference) 현상이 발생하여 수신 성능의 열화를 초래한다. 일반적으로 샘플링 주파수 옵셋의 추정은 연속된 2개의 OFDM 심볼의 파일럿 신호 또는 약속된 신호간의 상관을 통하여 수행된다. 본 논문에서는 주파수 영역에서 연속된 심볼들 간의 다양한 조합을 이용하여 샘플링 주파수 옵셋을 추정하고 그 성능을 비교한다. 이를 위해 각 방식을 DVB-T 시스템에 적용하여 모의실험을 수행한 결과와 기존 기법과의 성능을 비교 분석하였으며, 그 결과 AWGN 채널 환경에서 샘플링 주파수 옵셋 추정 성능을 향상시킬 수 있음을 확인하였다.
-
차세대 양방향데이터방송 (BIFS: BInary Format for Scenes) 서비스에서는 하향링크(downlink) 데이터 전송률에 상응하는 높은 상향링크(uplink) 데이터 전송률이 요구되고 있다. 이에 무선 전송 채널의 한정된 자원 환경 속에서 상향링크 전송용량 증대를 위한 주파수 효율성 제고 기술의 필요성이 대두되고 있다. 본 논문에서는 차세대 양방향데이터방송을 위한 다중 모바일(mobile) 사용자의 클러스터(cluster) 기반 상향링크 협동 다이버시티(cooperative diversity) 기법을 제안한다. 제안된 기법은 하나의 단일 안테나(single antenna) 방송 기지국과 다수의 단일 안테나 모바일 사용자가 있는 상향링크 시분할다중접속 (TDMA: Time Division Multiple Access) 시스템에서 데이터 지연허용(delay-tolerant)에 따라 클러스터를 구성하고 제곱 다이버시티 차수(square diversity order)의 협동 프로토콜(cooperative protocol)을 통해 높은 공간다이버시티 이득(spatial diversity gain)을 얻는다. 또한, 비대칭(asymmetric) 무선 채널 환경에서 공정성(fairness)을 보장한다.
-
최근 MPEG(moving picture experts group)에서 표준화를 진행하고 있는 3차원 비디오 시스템은 다시점 영상과 깊이영상을 동시에 이용하여 사용자가 임의의 시점을 선택하거나 스테레오스코픽 장치와 같은 3차원 영상 재생장 치를 동해 3차원 영상을 제공하는 차세대 방송 시스템이다 제한된 시점수를 이용하여 보다 많은 시점의 영상을 제공하려면 중간시점의 영상을 보간하는 장치가 필수적이다. 이 시스템의 입력정보인 깊이값을 이용하면 시점이동을 쉽게 할 수 있는데, 보간한 영상의 화질은 이 깊이값의 정확도에 따라 결정된다. 깊이맵은 대개 컴퓨터 비전을 기반으로 한 스테레오 정합기술을 이용 획득하는데, 객체의 경계와 같은 깊이값 불연속 영역에서 주로 깊이값 오류가 발생하게 된다. 이런 오류는 생성한 중간영상의 배경에 원치 않는 잡음을 발생시킨다. 기존의 방법에서는 측정한 깊이법의 객체 경계와 영상의 객체 경계가 일치한다는 가정으로 중간영상을 합성했다. 그러나 실제로는 깊이값 측정 과정에서 두 가지 경계가 일치하지 않아 전경의 일부분이 배경으로 합성되어 잡음을 발생하는 것이다. 본 논문에서는 깊이맵을 기반으로 중간시점의 영상을 보간할 때 발생하는 경계 잡음을 처리하는 방법을 제안한다. 중간영상을 합성할 때 비폐색 영역을 합성한 후 경계 잡음이 발생할 수 있는 영역을 비폐색 영역을 따라 구별한 다음, 잡음이 없는 참조 영상을 이용함으로써 경계 잡음을 처리할 수 있다. 실험 결과를 통해 배경 잡음이 사라진 자연스러운 합성영상을 생성했다.
-
본 논문에서는 다시점 비디오(multi-view video)에서 보다 다양한 시점을 제공하기 위한 가상 시점 비디오 생성 기법을 제안한다. 제안하는 가상 시점 비디오 생성 기법은 우선적으로 대칭적 신뢰 전파 기법(symmetric belief propagation)을 기반으로, 각 시점의 깊이 정보 및 폐색 영역(occlusion region)을 추출하기 위해서 에너지를 최소화한다. 추출된 깊이 정보 및 에너지를 이용하여 참조하는 시점 간의 가중치를 적용하여, 새로운 가상 시점의 비디오를 생성하고, 추출된 폐색 영역의 값을 이용하여, 가상 시점의 비디오를 보정하는 가상 시점 비디오 생성 기법을 제안한다. 또한 제안하는 알고리즘을 한정된 중간 시점 영상에서 임의의 가상 시점으로 확장하여, 임의의 두 시점 간의 자유로운 시점(free-view point)을 제공함을 확인한다. 실험을 통하여 제안하는 기법이 다시점 비디오에서 높은 화질의 가상 시점 비디오를 제공함을 확인한다.
-
본 논문은 스테레오 비디오 데이터 압축 및 복원을 위한 그리드(Grid) 기반 2D 워핑 방법을 제안한다. 스테레오 비디오에 대한 데이터 표현 방법으로 깊이지도 및 매쉬(mesh)를 이용한 방법이 주로 사용되어 왔으며 매쉬를 이용한 방법은 두 영상간의 매칭되는 노드를 이용하여 데이터 압축 효율을 높일 수 있다. 그러나, 두 영상에서 매칭되는 노드의 위치를 찾는 것은 매우 어려운 일일 뿐만 아니라 매쉬에 의해서 워핑된 영상과 목적이 되는 스테레오 영상의 좌측 또는 우측 영상간의 왜곡이 불가피하다. 따라서 이러한 왜곡을 보정하기 위하여 잔여영상(Residual image) 정보를 추가로 요구하게 된다.제안된 논문은 이러한 잔여영상 정보를 최소화 하기 위하여 반복적으로 2D워핑을 수행하며 최적화된 워핑 영상을 생성함으로써 목적영상과의 오차를 최소로 유지하여 추가정보인 잔여 영상의 데이터 용량을 최소화 한다. 전체영상에 대하여 2D워핑을 수행하며 각각의 노드를 변경하는 것은 많은 비용을 감수해야 하기 때문에 오차영역에 대하여 지역단위로 분할하고 단계적으로 최적화를 이루는 분할정복 방법을 사용하였다. 본 논문의 실험에서는 스테레오 영상에 대하여 각각의 신호대 잡음비(PSNR)를 통해 제안한 방법의 품질을 평가하였을 뿐만 아니라 기존의 메쉬 기반한 방법과 깊이지도를 이용한 방법과의 데이터량을 비교하였다. 실험결과를 통하여 제안한 방법의 데이터 압축의 효율성 및 품질의 우수성을 확인하였다.
-
최근에는 인터넷 환경에서 여러 형태의 압축된 파일이 이용되고 있으며 통신량의 감소, 통신시간의 절약 등 많은 장점을 가지고 있다. 그래서 많은 압축 기법 그리고 압축 기법에서 동작하는 영상처리기법들이 개발되어 지고 있다. 정보 은닉에서도 JPEG과 같은 압축파일에서 동작하는 알고리즘이 개발되어 지고 있다. 이와 같은 알고리즘들은 주파수변환이나 양자화의 기본적인 룰을 이해하고 있으며 그들의 프로그램에 그러한 룰들을 적용하여 개발에 이용하고 있다. 하지만 정보은닉 알고리즘에 있어, 많은 경우에 데이터 변경 후에 정보은닉의 영향을 평가하였다. 우리는 이 논문에서 정보은닉 처리과정에서 생겨나는 데이터 변경의 영향을 예측하기 위한 방법을 제안하였다. JPEG과 같은 압축 환경에서 정보 은닉 시 적용 가능한 몇 가지 중요한 사실을 여러 경우의 실험을 통하여 얻어냈다. 이러한 사실들은 현재 존재하는(Matrix Encoding, Modified Matrix Encoding 등을 포함한 F3, F4 and F5 알고리즘 등 [1],[5],[6]) 정보은닉 프로그램의 성능향상, 알고리즘 처리시간의 감소와 같은 긍정적인 효과를 거둘 수 있다.
-
본 논문에서는 아날로그 TV에서 사용되는 인터레이스 영상을 디지털 디바이스에서 보다 우수하게 출력하기 위해 새로운 디인터레이싱 알고리듬을 제안 한다. 기존의 에지 기반의 라인 평균 방법의 경우 제한된 방향의 화소단위 상관도를 이용하기 때문에 잡음과 계조도 변화에 취약하였다. 또한 공간적 방향 벡터를 사용한 DOI방법은 영상 내 수평 에지가 강한 영역을 보간하는데 우수하지만 좌우 넓은 검색 영역으로 인한 잡음에 취약한 단점이 있었다. ED4D는 에지기반 라인 평균 방법과 공간적 방향 벡터를 적절히 사용하여 규칙적 에지 특성을 갖는 영역에 대한 에지 방향의 정확도를 높였다. 하지만, 참조 방향 및 화소 보간의 판별 기준이
$3{\times}2$ 윈도우로 고정되어 있기 때문에 초기 방향성 판단 기준과 수평 방향 에지 검출에 있어 정밀도가 떨어지는 문제점을 안고 있다. 제안하는 방법은 기존에 사용하던$3{\times}2$ 윈도우에$5{\times}2$ 윈도우를 추가적으로 적용하여 초기 방향성 판단 기준을 더 섬세하게 하였으며, 변형된 공간적 방향 벡터를 사용하여 넓은 검색영역으로 인한 잡음의 간섭을 줄였다. 실험결과를 통하여 제안한 방법이 기존의 방법에 비해 주관적 화질뿐만 아니라 객관적인 성능도 우수함을 알 수 있다. -
H.264/AVC 부호화 표준은 움직임 벡터를 부호화하기 위해 인접 블록이 가지는 다수의 움직임 벡터 중에서 확률적으로 해당 움직임 벡터와 가장 유사한 중간값을 예측 움직임 벡터로 사용한다. 이러한 방법은 다수의 움직임 벡터 중에서 어떤 움직임 벡터가 예측값으로 사용되었는지에 대한 추가 정보 없이 비트량을 효과적으로 감소시킬 수 있는 장점이 있으나, 중간값을 이용한 예측 움직임 벡터는 해당 움직임 벡터를 부호화하는데 소요되는 비트량을 항상 최소로 만드는 최적 예측값이 아니라는 단점이 있다. 이러한 문제를 해결하기 위해 다수의 인접 블록이 가지는 움직임 벡터 중에서 특정 움직임 벡터가 예측값으로 사용되었는지 표현하는 정보를 복호화기에 알려주도록 하여 항상 최적의 예측 움직임 벡터를 선택함으로써 부호화 효율을 향상시킬 수 있으나, 이에 대한 추가 정보를 부호화해야 하는 문제점이 발생하게 된다. 본 논문에서는 부호화기가 부호화 효율 측면에서 가장 우수한 움직임 벡터를 예측값으로 선택하고, 이를 복호화기가 스스로 예측함으로써 인접 블록이 가지는 다수의 움직임 벡터 중에서 특정 움직임 벡터가 예측값으로 사용되었는지에 대한 정보없이 움직임 벡터 부호화에 소요되는 비트량을 효과적으로 감소시키는 움직임 벡터 부호화 방법을 제안한다. 제안한 부호화기는 율-왜곡 측면에서 가장 우수한 예측 움직임 벡터를 선택하고, 복호화기는 부호화기가 선택한 예측 움직임 벡터를 정합 기술을 사용하여 스스로 예측한다. 실험 결과는 제안 방법이 QCIF 및 CIF 영상에서 약 2.2%의 전체 비트량을 감소시킬 수 있음을 보여준다.
-
본 논문에서는 휴대폰이나 UMPC 등의 모바일 기기에 내장된 카메라를 이용하여 입력 영상을 통해 전역적인 움직임 벡터를 취득하고 이를 이용해서 모바일 인터페이스를 제어하는 기법을 제안한다. 카메라로부터 입력되는 영상에서 특징점을 추출하고 광흐름을 기반으로 각각의 특징점에 대한 움직임을 추정한다. 그 과정을 통해서 생성된 움직임 벡터의 집합으로부터 affine 행렬을 계산하여 전체 화상의 움직임을 표현하는 파라미터를 도출할 수 있다. 움직임 파라미터 값은 다시 인터페이스를 제어하는 신호를 생성하며 이 움직임 신호는 메뉴 네비게이션, 슬라이드 쇼 및 문서 스크롤과 같은 모바일 인터페이스의 제어에 이용될 수 있다. 모의 실험을 통하여 인터페이스 제어를 위한 화상의 움직임 정보가 적절히 획득됨을 확인한다.
-
본 논문에서는 근사 인코딩 기법을 이용한 H.264/AVC 비디오 코덱에서의 비트율 제어 알고리즘을 제안한다. H.264는 기존의 동영상 압축 표준보다 월등한 압축 성능을 나타내지만, 구조적 복잡성으로 인해 비트율 제어 측면에서는 과거에 제안된 H.264를 위한 비트율 제어 알고리즘들의 성능은 기대에 미치지 못하였다. 제안된 알고리즘은 근사 인코딩 기법을 사용하여 실제 H.264 인코딩이 이루어지기 이전에 향후 발생될 인코딩 비트를 미리 예측할 수 있고, 비트율 제어에서 매우 높은 중요성을 차지하는 프레임의 복잡도 예측에서 우수한 성능을 나타낸다. 알고리즘의 연산량 측면에서도 제안된 근사 인코딩 기법은 간단한 구조로 이루어져 있어 장점을 나타낸다. 본 논문에서는 DCT 영역에서의 각 프레임의 zero의 개수를 분석하여 얻어낸 영상의 특성을 비트율 제어에 활용한다. 실험결과는 제안된 알고리즘이 H.264 레퍼런스 소프트웨어의 가장 최신 버전인 JM12.2 환경에서 기존의 알고리즘에 비해 우수한 성능을 나타낸다는 것을 알 수 있다.
-
방송에서의 광고의 비중이 높아짐에 따라 광고 수익을 극대화하기 위한 기술의 발전이 활발히 이루어지고 있다. 최근의 이러한 광고 관련 기술들을 일반적으로 Advanced Advertising 이라고 하며 그 중 시청자의 선호에 맞는 광고만을 시청자에게 제공하는 타깃광고(Targeted Advertising) 방식 등 수신기별로 특화된 광고를 제공하는 기술을 클라이언트 기반 광고 삽입 방식이라고 한다. 북미의 인터랙티브 케이블방송 규격인 OCAP(OpenCable Application Platform)은 OCAP DPI(Digital Program Insertion) 라는 명칭의 클라이언트 기반 광고 삽입 방식에 대한 북미 일부 지역에서의 시험 방송의 성공한 후 관련 규격을 OCAP1.1-I01 에 발표하기에 이르렀다. 조만간 상용화되면 OCAP DPI 를 통해 북미 케이블방송 사업자들의 광고 수익 향상에 기여할 것은 물론이고 시청자들의 만족도를 향상시킬 것이다. 이런 움직임은 케이블 진영뿐만 아니라 Open IPTV Forum, ATSC 등 IPTV 나 지상파 TV 진영에서도 이 기술에 대한 타당성 검증 및 표준화가 논의가 활발히 진행되고 있는 실정이다. 본 논문은 클라이언트 기반 광고 삽입 기술에 대해 OCAP DPI 를 구현한 경험을 바탕으로 그 원리 및 동작을 설명하고, DVR(Digital Video Recorder) 또는 PVR(Personal Video Recorder)의 주요 기능인 스토리지에 방송스트림을 저장하고 재생하는 기능을 이용하는 광고 삽입 방법에 대해 제안하며, Cable-IPTV Hybrid 의 웹 접근성을 이용하여 웹 서버에 저장되어 관리 및 운용되는 광고컨텐츠의 스트리밍을 통한 광고 삽입 방법에 대한 제안하고, 마지막으로 실제 이러한 광고 삽입 기술을 적용하는 데에 있어 발생되는 문제점들을 언급하고 그 해결에 대한 의견을 제시한다.
-
본 논문에서는 디지털화된 형태로 취득 및 저장된 홀로그램 신호를 압축하는 새로운 알고리즘을 제안한다. 제안한 알고리즘은 취득한 디지털 홀로그램을 일정한 영역으로 분리하여 다수의 세그먼트로 만든다. 광학적인 특성상 각각의 세그먼트들은 각각의 공간적인 위치에서 객체를 촬영한 것과 같은 성분을 포함한다. 다음으로, 이 세그먼트들에 대해서 Fresnel 변환의 기저함수와 유사한 코사인 변환(Discrete Cosine Transform)을 적용하면 원 객체와 유사한 정보를 얻게 된다. 시각적으로 유사한 특성을 갖는, 즉 상관성을 갖는 세그먼트들을 하나의 비디오 스트림으로 구성하고 MCTF(Motion Compensated Temporal Filtering)을 적용한다. MCTF를 통해 얻어진 두 개의 스트림은 MCTF 과정 동안 움직임 보상 과정을 거치면서 재구성되므로 상당히 높은 압축 효율을 보일 수 있다. 마지막으로 이러한 과정을 통해 얻어진 두 개의 스트림은 각각 H.264를 통해 압축된다. 실험결과를 살펴보면 기존의 연구에 비해서 약 11%의 압축 효율이 증가한 것을 확인할 수 있었다. 따라서 제안한 기술은 디지털 홀로그램의 부호화를 위한 좋은 연구 사례가 될 것으로 사료된다.
-
본 논문에서는 IEEE 802.11x 에서처럼 비실시간 데이터의 전송에 기반을 둔 전송 방식 대신 실시간 서비스를 하기 위한 방법을 보여준다. 비디오 전송과 같은 실시간 서비스에서는 지연을 발생시키지 않으며 전송 채널의 손실율을 높이더라도 전송 대역폭을 더 많이 사용하는 것이 좋다. 이를 위하여, 물리계층의 변조방식을 다르게 설정하고, 달라진 대역폭과 손실율에 대하여 비디오 데이터의 우선순위를 이용하여 처리할 수 있다. 단지 제안하는 패러티 추가 방법을 통하여 실시간 서비스에서 비실시간 서비스에서와 같은 품질을 보장할 수 있음을 보여준다.
-
본 논문에서는 Raptor 코드를 이용하여 계층화 비디오를 적응적으로 전송하는 방법을 보여 준다. 클라이언트는 정보를 수신 할 뿐만 아니라 수신한 정보를 다른 클라이언트와 교환함으로서 서버 의존도를 줄여 손실 상황에 대한 강인함을 지니게 된다. Raptor code의 특징을 이용하여 peer-to-peer 환경에서 효율적인 비디오 전송이 가능하다. 이러한 방법을 이용하여 실시간 UCC 비디오와 같은 콘텐츠를 자원이 제한적인 환경에서도 효율적으로 전송 할 수 있는 방법을 보인다.
-
현재 지상파 DMB 재난경보방송 표준은 MATE 또는 BWS에서 정의한 URL 문법을 사용하여 추가적인 멀티미디어 자료를 참조할 수 있는 방법을 제시한다. 하지만, 현재 우리나라에서 활발하게 사용 중인 TPEG 메시지를 참조하는 방법은 정의되어 있지 않다. 본 고에서는 지상파 DMB 재난경보방송의 메시지가 TPEG 메시지를 참조하는 방법을 제안한다. 이를 위해 우선 AEAS와 TPEG에 대한 분석을 진행한다. 이러한 분석을 기반으로 하여 생성자 링크 방법과 전송자 링크방법의 두 가지 링크 방법을 제안한다. 두 방법 중 방송 지역의 넓이와 TPEG 서비스를 제공하는 전송자의 수에 따라 한 가지를 선택할 수 있다.
-
이 연구는 HDTV 방송 서비스를 제공하기 위해 새로이 주목받고 있는 Ka대역에서의 강우로 인한 위성신호의 감쇠량을 추정하였다. 강우 자료는 서비스 가입자 수를 고려하여 최대 인구 밀집 지역인 서울지역을 기준으로 서울대학교 AWS에서 측정한 2003년부터 2007년까지의 최근 5년간의 10분 강우강도를 ITU-R 기준인 분 강우강도로 변환하였고, 이를 ITU-RP. 618-9의 강우 추정 모델에 적용하여 감쇠 량을 도출하였다. 또한 도출된 감쇠 값을 최근 우리나라 기후변화의 추이를 반영하여 기상청에서 획득한 자료로부터 도출된 1990년부터 1999년의 서울지역의 감쇠 량과 비교 분석하였다. 본 연구를 바탕으로 우리나라 전 지역을 하나의 강우 단위로 일괄 적용하는 ITU-R P.837-5의 단점을 극복할 수 있으며, 강우의 지역적 편이가 매우 높은 우리나라의 강수 특성을 유연하게 반영할 수 있다.
-
집안의 TV 수신기로 접수되는 TV 프로그램 신호를 끊임없이 외부의 라우터로 중계하여 집밖의 어디에서든 인터넷만 연결되어 있으면 집안의 TV, PVR 또는 DVD 플레이어를 원격 작동하여 집밖에서 집안의 기기들의 컨텐츠를 감상할 수 있다. 이 때 홈 서버용 개인형 방송 미디어 플레이어를 제안함으로써 집 밖의 원거리에 있는 내 PC상에서 집 안의 기기들의 컨텐츠 데이터를 실제 리모콘을 조작하듯이 TV를 켜고, 끄고, 채널을 변경하고, 외부입력(PVR 또는 DVD 플레이어 등)을 전환하는 등 가상의 리모콘을 통해 사용자 마음대로 전송받고 제어할 수 있는 홈 서버용 개인형 방송 미디어 플레이어를 제안한다.
-
본 논문에서는 한 장의 기준 영상과 그에 상응하는 참 깊이 맵을 이용하여 가상의 다중 시점 영상 생성 시 발생하는 가려짐 영역 보간 방법을 제안한다. 이 방법은 영상 인페인팅 기술과 각각의 깊이 정도에 따른 층별 보간 기술을 이용한다. 우선, 기준영상을 깊이 정보에 따라 여러 개의 층으로 분할한다. 각각의 층에 대해 가려짐 영역 내의 화소들은 영상 인페인팅 기술을 이용하여 보간한다. 마지막 단계 에서 개별적으로 보간 된 층 영상들은 하나로 합성되어 가상 시점의 영상을 이룬다. 영상을 깊이 정보에 따라 분할함으로써, 각 깊이 정도에 대한 텍스쳐의 연관성을 보존하며 보간 할 수 있으므로 기존의 방법에 비하여 보다 정확하고 세밀한 가려짐 영역 보간이 가능하다. 본 논문에서는 여러 가지 실험 결과를 통하여 제안한 방법의 효율성을 입증하였다.
-
A Study of Scalable Video Delivery of Heterogeneous Using IEEE 802.21 MIH Services in Mobile Network최근 유/무선 통신망과 접속 기술의 발달로 사용자들은 다양한 네트워크로의 접근이 가능하게 되었다. 하지만 이러한 여러 종류의 접속 기술은 접속 기술간 서비스 이동에 따른 이동성 보장이 서로 독립적이기 때문에 핸드오버 시 부가적인 지연이 발생하는 문제가 있다. 또한 다른 접속 서비스로의 비디오 전송 시 QoS 보장이 어려운 문제점이 있다. 따라서 본 논문에서 IEEE 802.21 Media Independent Handover 정보 서비스를 이용하여 네트워크 접속망에서 스케일러블 비디오 코딩 전송 방법을 제안한다. 이는 MIH Function에서 각 단말기에 대한 데이터 전송률과 QoS 정보를 MIH 정보 서버로부터 얻어 비디오 스케일링 레이어를 결정한다. 이렇게 결정된 스케일링 레이어를 이용하여 스케일러블 비디오 코딩을 수행한 후, 각각의 단말기에게 비디오를 전송하게 된다. 이러한 새로운 스케일러블 비디오 전송 모델은 서로 다른 여러 종류의 해상도, 화질, 프레임 전송률을 갖는 영상을 다양한 네트워크의 다양한 디바이스로 적응적인 비디오 전송이 가능하다.
-
The paper describes a Layered Modulation using the SVC signals and studies the properties of the modulation with respect to several parameters by the computer simulation. The SVC signals will include a base layer signal and an enhancement signal, and the base layer signal is the more important one in its channel robustness. The parameters will include a carrier frequency, a bandwidth, power level, modulation type and code rate. We analyze the demodulating and decoding process of the Layered Modulation system through several scatter plots. And then we discuss the affect of the layer signal power difference to the BER performance, which also proves the base layer signal is more important than the enhancement layer signal.
-
영상의 화질을 평가하는 방법은 어떤 정보를 기준으로 평가하느냐에 따라서 전체 기준법 (Full Reference), 부분기준법 (Reduced Reference) 그리고 무기준법 (No Reference)으로 나눌 수 있다. 이중 무기준법은 수신 영상만을 가지고 측정하기 때문에, 다른 방법보다 활용범위가 넓다. 또한, 최근 사람의 눈의 특성을 고려한 인지적(Perceptual)화질평가 방법이 많이 논의되어, 사람이 실제 보고 느끼는 바를 객관화 시키는 방법이 개발되어 왔다. 이들 화질평가 방법들에 대해 많은 연구가 수행되고 있으며, 국제기구들을 통하여 이들 지표들에 대한 표준화가 진행되고 있다. 본 논문에서는 휘도, 색차의 분포도를 분석하여 원본의 화질을 예측하는 방법을 통해서, 기존 무기준법의 정확도를 높이고자 한다. 영상신호의 양자화나 부호화로 인해 임계값을 벗어나는 값들이 생기게 되며, 이 값을 휘도, 색차의 분포도 분석으로 예측하여 화질평가를 수행하게 된다. 실험 결과 제안된 방법의 상관도는 다른 방법보다 높은 것으로 나타났다.
-
Modern broadcasting/multicasting networks has the heterogeneous nature in terms of terminals and available bandwidth. Such heterogeneity could be coped by scalable video coding (SVC) standard developed recently. More specifically, spatial layers of an SVC bitstream can be consumed by different terminals and SNR (and temporal) scalability can be used to cope with bandwidth heterogeneity. In this work, we tackle the problem of SVC adaptation for different user groups receiving the same broadcast/multicast video, so as to provide a flexible tradeoff between the groups while also maximizing the overall quality of the users. The adaptation process to truncate an SVC bitstream is first formulated as an optimization problem. Then the problem is represented by MPEG-21 DIA description tools, which can be solved by a universal processing. The results show that MPEG-21 DIA is useful to enable automatic and interoperable adaptation in our scenario.
-
지상파 DMB 동일 채널 중계기에서는 송신 안테나로부터 수신 안테나로 재입력되는 궤환 신호가 존재한다. 이 궤환 신호는 적절히 제거되지 않을 경우 수신 신호에 간섭으로 작용하게 되어 중계기 시스템의 안정성이 크게 떨어지게 된다. 과거에 진행된 연구에서는 궤환 채널을 추정하여 간섭을 제거시키는 궤환 신호 제거기(feedback canceller) 를 사용하여 이와 같은 문제를 해결하였다. 하지만 기존의 추정 알고리즘은 간단한 구현에 비해 수렴 성능과 속도 면에서 만족할만한 성능을 얻을 수 없었으며, 신호 간 상관도 제거를 위해 충분한 시간 지연을 해야 하는 단점이 있다. 본 논문은 궤환 채널 추정에 적합한 PNLMS (Proportionate Normalized Least Mean Squares) 적응형 알고리즘을 적용해 새로운 궤환 신호 제거 기법을 제안하였으며, 전산 모의 실험을 통해 이와 같은 문제를 효과적으로 해결할 수 있음을 보여준다.
-
고객의 통신 니즈가 다양해지고 통신 인프라가 대용량, 고속화 되고 단말이 지능화됨에 따라 이를 기반으로 IPTV의 셋탑, 컴퓨터 모니터, 이동통신 핸드폰이 이르기 까지 다양한 화면 사이즈의 단말을 통하여 서비스를 제공하고 있다. 이를 위해 원영상을 화면의 크기에 적합하게 크기를 변환하는 영상 리사이징 기술을 이용하게 되며, 그 방식은 DCT 방식과 공간 방식으로 나눌 수 있다. DCT방식은 원영상의 고주파 영역의 조정하여 크기를 변화하는 방식으로 열화는 최소화되나 DCT 변환을 위한 계산량이 많고 고정 크기 블록을 사용하므로 유연성이 떨어진다. 공간영역은 객관적인 평가에서 품질이 열화되더라도 시각적으로 눈에 민감한 영역의 변화를 최소화하는 것이다. 본 논문은 인간시각시스템을 기반으로 눈의 민간도가 높은 망막 이심율이 작은 영역에서는 DCT블록의 크기를 변화를 최소화시키고 망막이심율이 큰 영역에서는 블록의 변화를 크게 하는 가변 블록방식을 제안한다. 이를 통해 우수한 영상 품질을 확보하면서도 시각적으로 뛰어난 리사이징 영상을 얻을 수 있다.
-
본 논문에서는 JPEG2000의 연산 시간을 줄일 수 있는 방법을 제안하였다. JPEG2000의 EBCOT(Embedded Block Coding with Optimized Truncation)는 전체 연산시간의 70%이상을 차지하여 실제 구현 시 많은 문제점으로 지적되고 있다. 본 논문에서는 EBCOT의 연산 시간을 줄이기 위해 웨이블릿 변환 영역에서 구성되는 부대역간의 트리구조(Tree structure) 이용하여 하위 부대역의 스캔 횟수를 줄이는 알고리즘을 제안하였다. 제안한 알고리즘을 적용하였을 경우 표준에 비해 스캔 횟수가 35% 이상 감소함을 확인하였다.
-
채색화는 흑백 영상에 색 정보를 추가하거나 영상의 색을 변환하는 영상 개선 기법이다. 본 연구는 최소한의 사용자 개입을 통해 흑백 영상을 자연스러운 칼라 (color) 영상으로 전환하는 채색화 기법을 제안한다. 우리는 우선 자연스러운 채색 결과를 위한 채색화 함수를 정의한다. 제안하는 채색화 함수는 유사한 밝기 정보를 가지는 이웃 픽셀들은 비슷한 색 정보를 가질 확률이 높다는 간단한 가정 하에 MRF (Markov Random Field)에 기반하여 모델링한다. 채색화 함수에 의해 색이 전체적으로 자연스럽게 분포될 수 있도록, 확산 신뢰도를 정의한 후 신뢰도에 따라 채색 순서를 결정한다. 이후, 채색 순서에 따라 각 픽셀에 채색화 함수를 적용하여 자연스러운 채색 결과를 도출한다. 실험 결과에서 보듯이, 제안 기법은 적은 색상 정보의 입력을 통해 효과적으로 채색화 하며, 기존 기법에 비해 자연스러운 결과를 제시한다.
-
본 논문에서는 카메라로부터 획득된 영상을 이용하여 손을 인식하고 이를 통해 실시간으로 마우스 포인터를 제어하는 알고리즘을 제안한다. 기존의 상호 작용 멀티미디어 시스템은 펜이나 마우스등과 같은 특정 외부 입력장치들에 의존하였기 때문에 사용자에게 불편함을 주었다. 따라서 본 논문에서는 외부 입력장치가 필요 없는 손 인식 알고리즘을 이용하여 이러한 단점을 보완하였다. 제안하는 알고리즘은 카메라로부터 획득된 영상에 저주파 필터를 통과시킨 후 색 정보를 이용하여 손 영역과 배경을 분리하고, 분리된 손 영역의 중심 좌표를 이용하여 모니터 상의 마우스 포인터 좌표를 결정한다. 또한 손의 중심을 원점으로 하는 가변적인 크기의 원과 손가락과의 교차점을 이용하여 손가락의 개수를 계산하고, 이를 통해 마우스의 특정 동작을 결정한다. 제안한 알고리즘은 90% 이상의 높은 손 인식률을 나타내었으며, 스테레오 카메라를 이용한 3차원 실시간 상호작용 멀티미디어 시스템에도 적용이 가능할 것으로 기대된다.
-
본 논문에서는 스테레오 카메라로부터 획득된 좌, 우 영상의 변이를 추정하여 3차원 공간 좌표(x, y, z)를 얻어내고, 거리측정과 가상공간 제어를 통해 사용자에게 현실감을 제공하는 실시간 3차원 공간 인식 시스템을 제안한다. 스테레오 카메라로 부터 획득된 좌, 우 영상은 시점의 차이 때문에 동일 물체에 대한 좌, 우 영상의 좌표 값의 차이를 발생시키는 데 이를 변이(disparity)라 정의한다. 관심 영역의 변이를 추정할 때 일반적으로 관심 영역의 모든 화소(pixel)의 변이를 추정하지만, 제안한 알고리즘에서는 관심 영역의 2차원 중심 좌표(x, y)의 변이만을 추정하여 계산량을 줄이고 실시간 처리가 가능하도록 하였다. 카메라 파라미터를 이용하여 획득된 변이로부터 깊이 정보(depth)를 얻어내고 3차원 공간 좌표를 획득한다. 손을 관심 영역으로 설정한 시스템에서 3차원 공간 좌표는 실시간으로 사용자의 손의 움직임에 의해 획득되고, 가상공간(virtual space)에 적용되어 사용자가 가상공간을 조작할 수 있는 듯한 느낌을 준다. 실험을 통해 제안한 알고리즘이 1.5m 거리 내에서의 깊이 측정시 평균 0.68cm의 오차를 가짐을 확인 할 수 있었다.
-
본 논문은 공간영역 상에서 다양하게 변형된 복제 영상과 원본 영상간의 통계적 특성을 이용하여 그 유사도를 측정하고 복제 여부를 판단하는 계층적 구조의 불법 비디오 감식 방법을 제안한다. 영상의 대표적 특성인 명암도에 따라 순위를 매김으로써 공간적 변형에 영향을 받지 않도록 하였으며, 데이터베이스에 저장된 방대한 양의 영상들에 대한 검색 시간과 계산량을 줄이기 위해 순위 표본 프레임을 이용하여 유사한 후보 영상군을 추출한다. 이러한 후보 영상군을 대상으로 일반적인 불법복제 비디오의 형태를 감안하여 각 프레임의 중앙 영역을 포함하여 통계 검정을 이용함으로써 복제 여부를 판단한다. 실험 결과 제안하는 방법은 기존 방법과 유사한 정확도를 보이며 동시에 선택된 순위 표본 프레임 수는 약 50% 가량 적게 추출되어 검색 시간과 계산량이 감소하였다. 또한 영상의 화질 열화, 대비 변형, 확대 및 축소, letterbox 등 다양한 공간적 변형에도 포괄적으로 복제 여부를 판단할 수 있음을 실험을 통해 확인하였다.
-
본 논문은 움직임 추정(motion estimation)과정에서 SAD(Sum of Absolute Difference)값을 추출하기 위해 사용되는 SAD 연산기의 게이트 수를 줄이는데 초점을 두고 하드웨어를 구현하였다. 게이트 수(gate count)를 줄이기 위한 방법으로 1의 보수 (one's complement)의 수 체계를 이용하였다. 하드웨어 구현 결과, 게이트 수를 약
$12%{\sim}25%$ 줄일 수 있었다. -
본 논문에서는 조명 변화가 있는 스테레오 이미지에 대하여 레티넥스 알고리즘을 이용하여 효과적으로 3차원 정보를 추출하는 방법을 제안한다. 이미지나 비데오는 영상 취득시 여러 가지 원인에 의하여 조명 변화를 겪게 된다. 이미지나 비데오를 촬영하는 시간 간격 차이, 촬영 각도 차이, 촬영 장치의 변화 등이 그 원인이다. 기존의 스테레오 알고리즘들은 정합하려는 영상들 사이에 컬러 일치성을 가정하고 있으므로, 이러한 조명 변화의 영향을 받는 이미지들에 대해서 3차원 정보를 추출하면 적지 않은 에러가 발생하게 된다. 따라서, 이러한 문제를 해결하기 위하여 레티넥스 기법을 이용하여 이러한 변화에 둔감한 스테레오 정합 기법을 제안한다. 여러 가지 데이터에 대하여 실험을 한 결과, 제안하는 방법이 효과적임을 확인하였다.
-
본 논문에서는 방송프로그램 저작권 식별관리를 위한 방송프로그램의 Video Signature와 국가표준콘텐츠식별 체계인 UCI(Universal & Ubiquitous Content Identifier)와의 연계 방안을 제시한다. Video Signature는 UCI와 같은 식별자의 인위적인 부여 과정이 없더라도 비디오 콘텐츠 자체에서 직접 특징정보를 추출할 수 있기 때문에, 이미 배포 유통된 콘텐츠에 대해서도 식별 확인이 가능하다. 따라서, 본 연구에서는 UCI 표준식별체계와 방송프로그램의 Video Signature와의 지속적인 연계를 위하여, 바이너리로 표현된 Video Signature가 포함된 UCI 응용 메타데이터를 정의한다. 그리고 UCI 표준식별체계 기반의 Video Signature 전송 및 관리 메카니즘에 기반한 방송프로그램의 저작권 식별관리 시나리오를 제시한다.
-
KT는 디지털 홈네트워크 사업의 일환으로 2004년 셋탑 기반의 홈엔VOD서비스를 제공한 바 있으며, IP망을 통한 방송서비스의 기반을 마련하기 위해 가입자단까지 IP-멀티캐스팅이 가능한 장비로 교체하여 BcN시범사업의 일환으로 KT CAST 서비스를 제공한 바 있다. 그리고 2006년에는 IPTV사업자로 선정되어 2007년 7월 VOD및 양방향 데이타 서비스만을 포함한 iCOD 서비스를 서울 지역을 시작으로 전국으로 확대 제공하였으며 실시간 방송에 대한 KT의 다각적인 노력의 결실로 지상파 방송서비스에 대한 정부 규제가 풀려 2008년 11월부터 지상파 실시간 방송을 포함하여 다양한 채널 방송이 가능해졌다. 본 논문에서는 일련의 KT가 준비하고 제공하였던 여러 형태의 디지털 영상서비스의 발전 단계를 소개하고 앞으로 메가TV가 나아가야 할 방향에 대하여 기술하고자 한다.
-
Research of packetizing method for efficient transmission of multichannel audio on T-DMB environment지상파 DMB는 이동 환경에서 QVGA 급의 영상과 스테레오 오디오를 제공하는 방송 서비스로서 2005년 12월부터 본격적으로 서비스되고 있는데, 최근에는 DMB 환경에서 고품질의 영상과 오디오를 제공하려는 기술에 대한 연구가 이루어지고 있다. 지상파 DMB 환경에서 고품질의 영상 또는 오디오를 제공하기 위해서는 기존의 DMB 서비스에 추가적인 데이터들을 전송하는 것이 필요한데, 하나의 지상파 DMB 방송 채널에 할당되는 전송 비트율이 높지 않다는 점을 감안하면, 이러한 추가적인 데이터들을 효율적으로 전송하는 것이 서비스의 상용화 입장에서는 중요한 요소가 될 수 있다. 본 논문에서는 지상파 DMB 환경에서 멀티채널 오디오 서비스를 제공하고자 할 때, 추가적으로 전송되어야 하는 부가정보 스트림의 효율적인 전송을 위한 패킷화 방법을 제안한다. 지상파 DMB 환경에서 멀티채널 오디오 서비스를 제공하기 위한 부가정보 스트림은 일반 오디오 스트림과 마찬가지로 프레임 단위로 생성이 되며, 약 12kbps의 비트율을 가진다. 그러나, 부가정보 스트림을 지상파 DMB 환경에서 전송하기 위하여, MPEG-2 TS로 패킷화하여 전송하게 되면, 부가정보 스트림의 비트율보다 훨씬 높은 약 32kbps의 전송율을 가지게 된다. 본 연구에서는 이와 같은 문제점을 해결하기 위하여, 멀티채널 오디오 서비스를 위해 필요한 부가정보 스트림의 비트율을 분석하고, 이를 바탕으로 하나의 TS 패킷에 하나 이상의 부가정보 프레임을 포함하여 전송하는 방법을 제안한다. 제안한 방법의 성능 검증을 위해 제안한 방법에 따라 하나 이상의 부가정보 프레임을 하나의 TS 패킷에 포함하여 패킷화하는 것을 시뮬레이션하고, 그 결과를 제시하였다.
-
본 논문은 손을 이용하여 가상 객체와 상호작용이 가능한 모바일 증강현실 기술을 소개한다. 제안된 방법은 마커나 센서 없이 손바닥의 특징점만을 이용하여 손바닥 포즈(위치와 방향)를 계산하고, 손바닥 위에 가상 객체를 생성한다. 또한, 손가락 움직임을 추적하여 가상 객체와 자연스러운 상호작용을 가능하게 한다. 본 논문에서는 Ultra-Mobile PC (UMPC)를 이용하여 제안된 방법을 구현하고, 그 유용성을 검증한다.
-
본 논문에서는 다중안테나-직교 주파수 분할 다중화(multiple input multiple output orthogonal frequency division multiplexing, MIMO-OFDM)시스템 중 공간 다중화와 전송 다이버시티 이득을 동시에 얻기 위해 제안된 double space-time block code(D-STBC) OFDM 시스템에 대해 기존 수신 기법인 그룹단위 간섭 제거 기법의 문제점을 보완하는 새로운 간섭 제거 기법을 제안한다. 또한 STBC의 다이버시티 이득을 극대화 할 수 있는 컴포넌트 인터리버 구조를 송수신단에 추가함으로써 수신 성능을 크게 향상시킨다. 이동방송 수신을 고려한 빠른 시변 채널환경에서의 전산 모의 실험을 통해 STBC의 부호직교성 상실로 인한 성능열화 현상이 개선됨을 보이고 다비어시티 이득에 의해 수신 성능 향상을 확인한다.
-
최근 유럽에서 DVB-T HDTV 방송 표준이 정하지면서 오디오 포맷으로 HE-AAC가 채택되었다. HE-AAC는 압축효율은 높지만 연산량이 높아 낮은 성능의 DSP에서 수행하기에는 어려움이 있다. DVB-T에서는 5.1채널을 사용하고 있어 더욱더 많은 연산을 필요로 한다. 본 논문은 ISO/DEC 14496-3 MPEG4 HE(High Efficiency)-AAC의 Level4에 해당하는 Multichannel Decoder를 최적화하여 구현하고. 가장 많은 연산을 필요로 하는 Synthesis Filter Bank에 제안된 알고리즘을 적용하여 연산량을 줄였고 대부분의 연산부를 어셈블리로 코드 최적화를 하여 작은 성능의 DSP를 사용하여 실시간 Multichannel HE-AAC Audio Decoder의 구현이 가능하게 하였다. DVB-T 오디오 시스템에 필수로 필요한 Audio Description, Dynamic Range Control, Downmix 등을 함께 구현하여 실제 수신기에 사용이 가능하도록 하였다. DSP는 Samsung의 CalmRISC16 + MAC24 core 를 사용하였다.
-
본 논문에서는 최근 IT 기술의 발전에 따라 무수히 양산되고 있는 멀티미디어 데이터를 효율적으로 검색하기 위한 방법을 제안한다. 영상 검색 시스템에 사용되는 데이터베이스(DB) 영상들에 존재하는 각 객체들의 존재 영역을 기반으로 질의 영상 (query image)의 객체 영역을 추정해서 검색에 활용하는 것이다. 이는 질의 영상의 전체 영역으로부터 객체를 추정하는 것보다 데이터베이스 영상들로부터 추출한 통계적 객체 분포 범위를 기반으로 추정하기 때문에 빨리 객체 추출이 가능하도록 한다. 따라서 객체를 추출하기 위한 배경 지식이나, 사용자 입력이 전혀 필요 없다. 이렇게 추출된 객체 영역의 영상들로부터 GLCM 알고리즘을 이용해서 객체 영역의 특성이 잘 반영된 질감 특징 값을 바탕으로 검색에 활용 할 경우 원본 영상의 질감 특징을 활용한 경우보다, 객체의 질감 특징을 더 잘 반영한다는 것을 실험을 통해 확인할 수 있었다.
-
본 논문에서는 다시점 비디오와 깊이 정보의 상관도를 이용해서 현재 JVT(joint video team)에서 표준화 된 다시점 비디오 부호화 (multi-view video coding : MVC)의 참조 소프트웨어인 JMVM(joint multi-view video model)을 기반으로 하여 효율적인 다시점 비디오 압축 방법을 제안한다. 기존의 일반적인 비디오 부호화 방식은 단일 시점에 대한 비디오 부호화 기술이기 때문에 다시점 비디오 전송을 위해서는 시점 당 각각 전송 채널에 필요하다. 하지만 다시점 비디오 부호화 기법을 이용하게 되면, 단일 전송 채널을 이용하여 전송이 가능하다. 본 논문에서 제안된 방법은 입력된 다시점 입력 영상과 해당 하는 깊이 정보를 이용하여 시점 간의 예측 방법의 효율성을 높였다. 다시점 입력 영상과 깊이 정보의 전역 변이 벡터 (global disparity vector : GDV)의 상관도를 이용하였으며, 다시점 영상과 깊이 정보를 동시에 전송해야 할 경우 복잡도를 낮출 수 있고, 약
$0.01{\sim}0.1dB$ 의 PSNR 이득을 얻을 수 있다. -
최근 MPEG에서 HD (High Definition) 해상도 이상의 초고해상도 비디오를 위한 HVC 표준화에 대해 논의가 되고 있다. 본 논문에서는 HVC 표준화를 위해 기본적으로 필요한 H.264를 HD 이상의 초고해상도 부호화 적용시 문제점을 분석하기 위해 SVT 4K UHD테스트 시퀀스와 이를 SVC Downsampling 필터를 이용하여 HD, QHD, QQHD로 변환한 시퀀스들을 이용하여 부호화 실험을 수행 하였고, 실험 결과 분석을 통해 개선 방안에 대해 논하였다.
-
H.264|AVC는 인트라 부호화 효율을 높이기 위해 공간 영역에서 주변 화소를 이용하여 다양한 방향에 대한 율-왜곡 최적화 기법을 사용하여 최적의 인트라 예측 모드를 선택한다. 하지만 율-왜곡 최적화 기법을 사용함에 따라 인트라 부호화에 높은 복잡도가 필요하게 되었다. 따라서 본 논문에서는 인트라 예측 모드 결정의 연산 복잡도를 감소시키고자 사전에 인트라 4x4 예측 모드들의 SATD(Sum of Absolute Transform Difference)를 계산하여 조기에 최우선 모드(Most Probable Mode)를 선택하는 방법을 제안하고, SATD의 값에 따라 제한된 후보 모드에 대해서만 율-왜곡 최적화를 수행하여 연산 복잡도를 감소하는 방법을 제안한다. 또한 Vertical, Horizontal 그리고 DC모드는 인트라
$4{\times}4$ 와 인트라$16{\times}16$ 의 공통적인 모드이므로 인트라$4{\times}4$ 에서 계산되어진 SATD값을 이용하여 인트라$16{\times}16$ 에서의 SAD 계산 복잡도를 줄이는 방법을 제안한다. 본 논문에서 제안하는 빠른 인트라 예측 모드 결정 기법은 연산 복잡도는 평균 61.4% 감소 시킨 반면 부호화 손실은 평균 3.09%에 불과하였다.