Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2003.11a
-
방송 서비스상의 교육용 어학 컨텐츠의 증가와 더불어 비디오 컨텐츠의 효율적인 제공, 이용 및 관리를 위한 내용 기반 요약에 대한 연구가 필요하다. 본 논문에서는 교육용 어학 비디오의 내용 기반 요약을 위한 방법을 제안한다. 디지털 비디오로부터 샷 경계를 추출한 후 각 샷을 대표하는 키프레임으로부터 MPEG-7 비주얼 특징 값들을 추출한다. 추출된 특징 값들의 다중 조합을 통해 교육용 어학 비디오의 내용 정보를 세분화하여 요약 결과를 생성한다. 외국어 회화 컨텐츠에 대해 실험하여 알고리즘의 효용성을 검증하였으며. 제안한 방법은 교육용 방송 컨텐츠의 다양한 서비스 제공 및 관리론 위한 비디오 요약 시스템에 효율적으로 이용될 것이다.
-
인터프레임 웨이블렛 부호화(Interframe Wavelet Coding)는 3D 서브밴드(Subband) 부호화라고도 하며, 기존의 DCT기반 Hybrid 동영상 부호화 방식에 비해 압축 효율이 우수하고. 특히 스케일러빌리티 기능이 뛰어난 부호화 방법이다. 인터프레임 웨이블렛 부호화 방법에서 복호화 과정 중 가장 연산 량이 많이 요구되는 역(inverse) 웨이블렛 변환이다 역 웨이블렛 변환의 연산 량은 복호화 과정에서 적용된 웨이블렛 변환과 동일한 연산량을 요구한다. 이는 순방향과 역방향에서 동일 길이의 필터와 분해 레벨을 사용해야 하기 때문이다. 이 웨이블렛 변환의 연산 량을 줄이기 위해 본 논문에서는 기존의 시간 밴드 영상에 대해 동일 한 웨이블렛 필터를 사용하여 공간 웨이블렛 필터를 적용하던 것을. 로우밴드에는 9/7 필터를 적용하고 하이 밴드에는 Haar필터를 사용하는 방법을 제안한다. PSNR 실험에서 기존의 9/7 필터만을 사용하는 경우와 비교한 결과 거의 차이가 없었다.
-
비디오 부호화기에서는 채널의 용량과 같은 주어진 제약 조건을 만족하면서 좋은 화질을 얻기 위해 비디오 부호화 시 적절한 양자화 변수를 결정해야 한다. 본 논문에서는 H.264 비디오 부호화 표준에서 높은 압축 효율을 철기 위해 비트 율 왜곡 모델에 기반 한 새로운 비트 율 제어 알고리즘을 제안한다. 특히. 부호화된 매크로블록의 특성과 이전에 부호화 된 매크로 발생 비트수를 고려하여. 제안한 비트 율 모델을 통해 양자화 변수 값을 결정한다. 본 논문에서 제안한 알고리즘은 목표 비트수에 가깝고. 기존치 방법보다 개선된 화질을 제공한다.
-
동등한 영상의 풀질을 유지하면서 기존의 비디오 압축 표준보다 30퍼센트 이상의 비트 절감효과를 내는 H.264/MPEG-4 Part 10 AVC(Advanced Video Coding) 표준이 최근 확정되었다. AVC는 국내 지상파 DMB(Digital Multimedia Broadcasting) 멀티미디어 서비스의 비디오 표준으로도 채택되어 많은 관심을 불러일으키고 있다. 본 논문에서는 H.264/AVC 부호기를 위한 고정 비트 율 제어 알고리듬을 구현하고 이를 실험을 통하여 검증하였다. 비디오 부호화 과정에서 각 픽처마다 발생하는 비트 량이 같지는 않지만 부호기 출력 비트 율은 일정하게 한 수 있으며 이를 고정 비트 율 제어라 한다 부호기는 입력 영상의 복잡도를 예측하고 실제 버퍼 점유도에 대한 피프백 정보를 이용하여 발생 비트 수글 조절한다. 특히 전송 대역폭 제한사항이 있는 고정 비트 율 채널 환경에서 비디오 부호기의 고정 비트 율 제어는 반드시 필요하다. JVT에서 제공하는 참조 소프트웨어인 JM(Joint Model) 소프트웨어가 아직까지 고정 비트 율 제어 기능을 지원하지 않으므로, MPEG-2 Part 2 Video 표준과 MPEG-4 Part 2 Visual 표준에서 고정 비트 율 제어에 이용되었던 TM5 고정 비트 율 제어 모델을 적용하여 H.264/AVC 부호기의 고정 비트 율 제어를 구현하였다.
-
3차원 Polygonal Mesh는 그래픽스, 에니메이션, 게임에서 3차원 객체에 대한 표현에 사용되고, 이러한 3차원 모델에 대한 IndexedFaceSet 노드에 3차원 정전정보와 연결정보를 압축하는데 MPEG-4 3DMC를 사용한다. 이러한 연결정보는 다각형의 Mesh 형태로 3차원 모델을 구성하는 정보를 갖는데, 이는 Tepological Surgery 라고 하는 방법을 통해서 2차원의 스트립 단위의 데이터로 분해된다. 이러한 3D 데이터는 방송환경과 같은 재전송이 불가능한 네트워크의 환경에서 유무선 네트워크 상에서 채널문제로 인해서 데이터의 손실이 있게 되면, 복호화 된 데이터는 데이터의 손상이 발생하게 된다. 이러한 현상은 3D 모델의 좌표의 연결정보에 손상을 주게 되고, 여기서 복호화 된 데이터는 스트립 단위로 손상이 발생하게 된다. 이러한 현상은 3차원 모델의 좌표의 연결정보에 손상을 주게 된다. 본 논문은 이러한 3차원 정보의 손상을 효과적으로 복원하기 위한 연구에 관한 것이며, Mesh의 면을 이루는 각 꼭지점의 좌표들의 연결 정보가 손실되지 않는 스트립에서는 약간의 차이는 있을 수 있으나, 완벽한 복원을 하였고, 두 개 이상의 스트립이 붙어서 손상된 경우나, 좌표의 연결 정보가 없는 경우에는 조건에 따라 현저히 좋은 격과를 얻을 수 있었다.
-
본 논문에서는 하이브리드 다중 표현(hybrid multiple description) 개념을 이용하여 에러가 발생하기 쉬운 환경에서 사용될 수 있는 강인한 동영상 압축 알고리듬을 제안한다. 다중 표현 압축은 단일 표현 압축(single description coding. SDC) 보다 패킷 손실 율(packet loss rate, PLR)이 높은 환경에서 에러에 더 강인성을 갖는다. 그러나 PLR 이 낮은 환경에서는 과도한 중복량(redundancy) 때문에 성능이 저하되는 문제가 발생한다 이러한 MDC 의 문제를 해결하기 위해서 채널 환경에 따라 SD/MID 를 전환할 수 있는 방법을 제안한다. 좀더 자세히 설명하면, 낮은 PLR 에서는 압축 효율을 위하여 SDC 를 사용하고 높은 PLR 환경에서는 에러에 대한 강인성을 위해 MDC 를 사용한다. SD/MD 전환을 최적화시키기 위해 비트율-왜곡 최적화 프레임웍(rate-distortion optimization framework)을 사용한다. 부호화시에 복호기에서의 왜곡(distortion)을 정확히 예측하기 위해서 ROPE(recursive optimal per-pixel estimate) 방법을 사용한다. 모의 실험 견과 제안된 SD/MD 전환 방법이 기존의 SDC-ROPE 와 MDC-ROPE 보다 모든 에러 환경에서 더 효과적임을 알 수 있다.
-
본 논문에서는 숨겨진 정보를 검출한 후. 정보가 삽입 된 영상으로부터 왜곡 없이 원본 영상을 복원할 수 있는 무손실 정보은닉(lossless information hiding) 알고리즘을 제안한다. 제안된 알고리즘은 차분 영상(difference image)의 히스토그램 특성을 기반으로 화소 값을 수정하여 데이터를 삽입한다. 이 알고리즘은 기존의 무손실 정보은닉 알고리즘들에 비해 정보 삽입으로 인한 왜곡이 적고. 많은 양의 정보를 삽입할 수 있다 이론적인 증명과 실험 견과를 통해 제안된 알고리즘에 의해 정보가 삽입된 영상의 PSNR(peak singal-to-noise ratio) 값은 대략 51dB 이상의 값을 나타내며. 이 값은 다른 무손식 정보은닉 알고리즘들 보다 훨씬 높다. 또한, 제안된 알고리즘은 여러 형태로 변형되어 다양한 응용에 적절히 적용될 수 있다
-
전반사는 물체의 사실적인 모습을 나타내는데 중요한 요소이지만 컴퓨터 비전에서는 처리하기 어려운 장애 요소이다. 본 논문에서는 영상기반 재조명을 위하여 조명 조건이 다른 복수의 영상으로부터 전반사 성분과 난반사 성분을 분리하는 효과적인 알고리즘을 제안한다. 이 알고리즘은 전반사 성분이 존재하는 영상과 난반사 성분만이 존재하는 영상에 대하여 난반사 성분의 RGB 값은 서희 비율을 유지하면서 변한다는 성질을 이용하여 전반사 성분을 분리한다. 그리고 실험을 통하여 이 알고리즘의 유효성을 확인하였다.
-
본 논문에서는 영상의 특성을 이용하여 TM1300 미디어 프로세서에 적합한 효율적인 움직임 탐색방법을 제안한다. 주위 블록간의 공간 상관 관계를 이용해 예측 움직임 벡터를 구하고 이를 기준으로 탐색 영역을 축소하여 전체 연산량을 줄인다. TMI1300의 특성을 활용하여 메모리 사용 효율 증대 및 비교, 분기의 사용을 줄여 최적화에 유리한 움직임 예측 방법을 제안한다. 제안된 방법을 Philips 140 MHz IM1300 상의 MPEG-4 SP@L3 (Simple Profile Level 3) 부호화기에 적용한 결과 화질은 전역 탐색 방법에 근접하며 기존의 고속 움직임 예측 방법에 비해 메모리 접근 및 처리 속도 면에서 향상된 성능을 보였다.
-
본 논문에서는 동영상을 효율적으로 부호화하기 위한 새로운 다중해상도 움직임 보상 방법과 잉여 양자화 방법을 제안한다. 본 논문에서 제안하는 동영상 부호화기는 다단계 이산웨이브렛 분해 움직임 예측 및 움직임 보상 블록 Tree 의 구성 및 블록 분할. 적응적 산술 부호화기로 구성된다 제안된 동영상 부호화기는 단순하면서도 낮은 연산량을 필요로 하며, 임베디드 특성과 SNR 계위 부호화 특성과 같은 좋은 기능을 제공한다. 또한 기존에 제안되었던 이산웨이브렛변환을 이용하는 동영상 부호화 방법과 비교하여 우수한 성능을 제공한다.
-
일반적으로 블럭기반의 동영상 압축방식은 블럭킹 효과를 필연적으로 수반한다. 특히 저비트율의 동영상에서는 블럭킹 효과가 다른 어떤 영상의 왜곡보다 많이 발생한다. 본 논문에서 H.264에서 이러한 블럭킹 효과를 효율적으로 제거함으로서 주관적 화질을 높일 수 있는 후처리 알고리즘을 제안한다. 제안한 알고리즘은 H.264에서
$ 4\times4$ 에 대한 Offset을 구하는데 움직임 벡터를 이용하여 이전 프레임의 QP(Quantization Parameter)를 이용하고 이용된 QP의 평균을$-6\~+6$ 까지의 범위로 normalize 하여 Offset값을 정함으로서 인코더의 성능에 좌우되지 않고 디스플레이 될 수 있게 하는 방법이다. -
3차원 메쉬 영상의 압축 알고리듬들은 예측 부호화 및 엔트로피(entropy) 부호화를 기본 기법으로 이용하므로, 압축된 비트열(bitstream)의 네트워크 전송에서 전송 오류에 매우 민감한 단점을 지닌다. 따라서 본 논문에서는 전송 오류에 강인하고 점진적 부호기를 기본으로 하는 3차원 메쉬 영상의 오류은닉 알고리듬을 제안한다. 전송 오류에 강인한 알고리듬을 개발하기 위해, 3차원 원본 메쉬 영상을 여러 파티션(partition)으로 분할하고, 각각의 파티션을 독립적으로 점진 부호화한다. 복호기에서는 오류가 발생하지 않은 주변 표면 정보를 이용하는 오류 은닉 알고리듬을 오류에 의해 손상 받은 파티션 표면에 적용하여 손상된 파티션의 시각적 손상 정도를 감쇄시킨다. 전산 모의 실험을 통해, 제안하는 알고리듬의 오류에 대한 강인성 및 오류 발생시 손상된 파티션 표면이 제안하는 오류 은닉 알고리듬을 통해 화질이 개선됨을 확인하였다.
-
무손실 이미지 압축은 (Lossless Image Compression)은 손실이미지 압축(Lossy Image Compression)에 비해, 압축률(compression ratio)은 떨어지지만, 반면 원이미지와 복원이미지가 완전히 일치하므로, 원인이미지의 품질을 그대로 유지학 수 있다. 따라서, 이미지의 품질(Quality)과 압축효율(compression ratio)은 서로 상반된 관계에 있으며, 지금도 좀 더 놀은 압축효과를 얻으려는 여러 무손실 압축 방법이 발표되고 있다. 무손실 이미지 압축은 이미지의 정확성과 정밀성이 요구되는, 의료영양분야에서 가장 널리 쓰이고 있으며, 그밖에, 원본이미지를 기본으로 다른 이미지프로세싱이 필요한 경우, 압축 복원을 반복적으로 수행할 필요가 있을 때, 기타 사진 예술분야, 원격 영상 등 정밀성이 요구되는 분양에서 쓰이고 있다. [7]. 무손실 이미지 압축의 가장 대표적인 CALIC[3]과 JPEG_LS[2]를 들 수 있다. CALIC은 비교적 높은 압축률을 나타내지만, 3-PASS의 과정을 거치는 복잡도가 지적되고 있다. 반면 JPEG-LS는 압축률은 CALIC에 미치지 못하지만 빠른 코딩/디코딩 속도를 보인다. 본 논문에서는 여거 가지의 예측 모드를 두어, 블록단위별로 주변 CONTEXT에 따라, 최상의 예측 모드를 판단하여, 이를 적용, 픽셀의 여러 값을 최소화하였다. 그 후 적응산술 부호기(Adaptive arithmetc coder)를 이용하여, 인코딩을 하였다. 이때 최대 에러값은 64를 넘지 않게 했으며, 또한 8*8블록별로 에러의 최대값을 측정하여 그 값을
$0\~7$ 까지의 8개의 대표값으로 양자화하는 방법을 통하여 그에 따라 8개의 보호화 심볼 모델중 알맞은 모델에 적용하였다. 이를 통해, 그 소화값의 확률 구간을 대폭 넓힘으로써, 에러 이미지가 가지고 있는 엔트로피에 좀 근접하게 코딩을 할 수 있게 되었다. 이 방법은 실제로 Arithmetic Coder를 이용하는 다른 압축 방법에 그리고 적용할 수 있다. 실험 결과 압축효율은 JPEG-LS보다 약$5\%$ 의 압축 성능 개선이 있었으며, CALIC과는 대등한 압축률을 보이며, 부호화/복호화 속도는 CALIC보다 우수한 것으로 나타났다. -
블록화 현상은 블록 기반의 부호화와 이에 따른 거친 양자화 계수를 적용할 때 나타날 뿐 아니라 블록화가 나타난 블록을 움직임 보상으로 가져와 적용할 때 이후 영상에 전파되게 된다. 이를 방지하기 위해 H.264/MPEG-4 AVC 표준은 부호화 및 복호화 과정에 동시에 포함된 형태의 루프 필터를 적용하였다. 필터는 블록 경계에서 경계 양쪽의 블록 예측 모드에 기반 한 필터의 세기를 결정하고 양자화 계수를 이용한 한계 값과 화소 값윽 비교하여 블록 경계에 적응적으로 적용한다. 이 때 필터의 특성을 결정하는 편차 값을 부호기에서 전송하게 되는데 이 값은 부호기 구현에 따라 달라질 수 있다. 본 논문은 부호화하는 각 영상의 특성을 정의하고 편차 값을 정함으로써 영상에 적응적인 디블로킹 필터 알고리즘을 구현 및 실험을 통하여 검증한다.
-
Hahm Cheul-Hee;Park Kon-Kyu;Kim Hyoung-Gil;Jung Choon-Sik;Lee Sang-keun;Jang Jae-Young;Park Sung-Uk;Chon Byung-Hoan;Chun Kang-Wook;Jo Jae-Moon;Song Dong-il 69
This paper presents a signal processing IC for digital HDTV, which is designed to operate in bunt-in HDW or in HD-set-top Box. The chip supports de-multiplexing an ISO/IEC 13818-1 MPEG-2 TS stream. It decodes MPEG-2 MP@HL video bitstream, and provides high-quality scaled video for display on HDTV monitor. The chip consists of ARM7TDMI for TS-Demux, PCI interface, Audio interface, MPEG2 MP@HL video decoder Display processor, Graphic processor, Memory controller, Audio int3face, Smart Card interface and UART. It is fabricated using Sam sung's 0.18-um and the package of 492-pin BGA is used. -
MPEG-4 표준은 저작자가 정지영상, 텍스트, 2D/3D 그래픽스, 오디오, 심지어 임의형의 비디오 등과 같이 다양한 형태의 객체들을 개별적으로 구성하고 이들을 시/공간자적으로 다루기 용이하게 해 준다. 이와 같은 객체 기반 코딩 특성에 의해서 대화형 방송 콘텐츠를 제작하는데 가장 유용한 방식으로 고려할 수 있다. 피러나, 콘텐츠의 제작, 전송, 소비 관전에서 고려해 달 때, 콘텐츠 제작자 또는 저작권자의 보호 및 관리가 필요하게 되었다. 이에 따라 최근에는 OPIMA (Open Platform Initiative for Multimedia Access), SDMI (Secure Digital Music Initiative) and MPEG(Moving Picture Expert Group) OPIMATfMr(Intellectual Property Management & Protection)와 같은 국제 표준 단체들이 콘텐츠 보호 및 관리에 대한 관심을 가지게 되었다. 특히, MPEG의 경우에 MPEG-4 IPMP를 표준화하여 디지털 콘텐츠와 저작권에 대한 보호를 체계적이고 효과적으로 다루는 연구를 가장 활발히 해오고 있다. 이 논문에서 우리는 MPEG-4 콘텐츠 저작자가 MPEG-4 규격에 맞게 보호화 된 객체 기반 방송용 콘텐츠를 쉽고 편리하게 제작학 수 있도록 하기 위한 MPEG씨 콘텐츠 및 저자권 보호를 위한 MPEG-4 IPMP 저작 도구를 제안하고자 한다. 제안한 MPEG-4 콘텐츠 및 저작권 보호 저작 도구는 저작자에게 친근한 사용자 인터페이스를 제공하여 편집 및 수정이 용이한 텍스트 포맷인 IPMP회된 XMT(extensible Mpeg-4 Textual format) 파일을 생성한다. 또한, 콘텐츠 전송 및 저장의 효율성을 위해 이진 포멧인 IPMP화된 MP4 파일을 생성할 수 있다.으로써, 에러 이미지가 가지고 있는 엔트로피에 좀 근접하게 코딩을 할 수 있게 되었다. 이 방법은 실제로 Arithmetic Coder를 이용하는 다른 압축 방법에 그리고 적용할 수 있다. 실험 결과 압축효율은 JPEG-LS보다 약
$5\%$ 의 압축 성능 개선이 있었으며, CALIC과는 대등한 압축률을 보이며, 부호화/복호화 속도는 CALIC보다 우수한 것으로 나타났다.우$23.87\%$ ($18.00\~30.91\%$ ), 갑폭$23.99\%$ ($17.82\~30.48\%$ ), 체중$91.51\%$ ($58.86\~129.14\%$ )이였으며 성장율은 사육 온도구간별 차는 없었다.20 km 까지의 지점들(지점 2에서 지점 6)에서 매우 높은 값을 보이며 이는 조석작용으로 해수와 담수가 강제혼합되면서 표층퇴적물이 재부유하기 때문이라고 판단된다. 영양염류는 월별로 다소의 차이는 있으나, 대체적으로 지점 1과 2에서 가장 낮고, 상류로 갈수록 점차 증가하며 지점 7 상류역이 하류역에 비해 높은 농도이다. 월별로는 7월에 규산염, 용존무기태질소 및 암모니아의 농도가 가장 높은 반면에 용존산소포화도는 가장 낮다. 그러나 지점 14 상류역에서는 5월에 측정한 용존무기태질소, 암모니아, 인산염 및 COD 값이 7월보다 다소 높거나 비슷하다. 한편 영양염류와 COD값은 대체적으로 8월에 가장 낮으나 용존산소포화도는 가장 높다.출조건은$100^{\circ}C$ 에서 1분간의 고온단시간 추출이 적합하였다. 증가를 나타내었는데, 저장기간에 따른 물성의 변화는 숭어에 비하여 붕장어가 적었다.양식산은 aspartic acid 및 proline이 많았다. 또한 잉어는 천연산이 -
방송용 콘텐츠가 디지털화되면서 고품질의 서비스가 가능해 졌으며, 통신망과의 융합을 통해 다양한 서비스가 가능해 질 것으로 전망된다. 또한, 시청자의 요구가 단순 시청에서 개인의 요구에 따른 방송을 시청하고 방송에 직접 참여할 수 있는 정보 선택 및 정보 맞춤형 서비스로 발전하고 있다. 이러한 시청자의 요구에 부합하기 위해 다양한 부가콘텐츠의 서비스 기술이 개발되고 있으며, 본 논문에서는 MPEG-4에 기반을 둔 객체기반 대화형 콘텐츠와 M[PEG-7에 기반한 메타데이터. MPEG-2 IPMP 데이터 등의 다양한 부가콘텐츠를 지능형방송 전송서버에서 효율적으로 사용할 수 있도록 제어정보를 생성하고, 부가콘텐츠들의 시공간적인 편집 기능을 수행하는 지능형방송 부가콘텐츠 제어정보 편집기를 설계하고 이의 구현결과를 보인다.
-
With the opening of digital broadcast services and development of wire/wireless Internet, the current multimedia broadcasting is provided for has various services. The user will be provided lots of various content through the various channel and media. Content provider and consumer want the various service using content with the better quality which is fit to user preference. For transmitting this content in the limited transmission channel capacity, it needs to transmit the highly compressed content which user wants. The content of 3D mesh model-based on MPEG-4 enables the various content service that provides the lower capacity and the better quality, and Targeting service enables just provide the contents that user more wants and likes. The adaption of Java application program and 3D program can provide the content service utilizing 3D mesh model, so content provider and consumer can share the more information about the content. This paper has presented the study on the targeting service using compression of 3D mesh model-based on MPEG-4 and the adaptation of Java application program using it
-
디지털 방송의 시작과 함께, TV화면에서 채널이나 프로그램을 직접 검색할 수 있는 EPG(Electronic Program Guide)라는 새로운 방송 서비스가 제공되고 있다. 그러나 아직까지는 시청자 입장을 고려한 EPG의 User Interface에 대한 연구는 미흡한 실정이다. TV는 특정 계층이 아닌 모든 사람이 시청하는 매체이의로 시청자에게 프로그램을 쉽게 찾게 하기 위해서는 단순하고 직관적인 User Interface가 필요하다. 이러한 User Interface를 설계하기 위해서는 많은 채널에서 방송되고 있는 프로그램을 체계적으로 구분학 수 있는 정보구조와 정보구조들을 유연하게 연결시킬 수 있는 Navigation의 설계가 필요하다. 일반적으로 프로그램을 구분하는 방법으로 장르, 시간, 등급, 프로그램의 내용 등과 같은 속성을 이용한다. 하지만 이러한 속성들은 체계적으로 구조화되어 있지 않다. 본 논문에서 제안하는 EPG는 프로그램이 가지는 속성들을 체계적으로 정리해 구조화하고, 이렇게 구조화된 속성들을 시청자들이 쉽게 선택해 원하는 프로그램을 찾을 수 있는 유연한 Navigation을 설계함으로써 기존의 EPG보다 쉽고 빠르게 프로그램을 검색 학 수 있는 User Interface를 제안하고자 한다.
-
디지털방송은 다수의 채널 공급을 가능하게 하는데, 이러한 다채널 환경에서는 각 채널로 일일이 전환하지 않고도 어느 채널에 어떤 정보가 방송되고 있는지를 일목요연하게 파악 할 수 있는 전자 프로그램 가이드(EPG : Electronic Program Guide)가 필연적으로 요구된다. 본 논문은 EPG의 한 구현방법으로서 방송을 통해 TV에 전달되어 실행되는 Downloadable EPG를 설명하고 우리나라 디지털 위성방송 표준인 DVB-MHP규약을 따르는 구현방법과 구현결과를 기술하였다. 본 논문은 데이터 방송과 EPG의 구현에 관련된 참고 기술자료가 미비한 현실에서 디지털 방송의 EPG 개발자들이나 응용프로그램(application) 개발자들이 DVB-MHP 규약에 따라 다양한 종류의 EPG를 개발하는데 도움이 될 것이다.
-
본 논문에서는 디지털TV 데이터방송에 있어 전자상거래용 연통형 데이터방송 컨텐츠를 제작학 수 있는 저작도구를 제안한다. 연통형 데이터방송이란 오디오/비디오 스트림과 데이터 스트림으로 이루어진 컨텐츠로 오디오/비디오와 연동되어 애플리케이션이 실행된다. 본 논문에서 제안하는 저작 시스템은 비디오와 상품정보인 부가데이터의 동기화 작업을 수행하여, 비디오의 특정시간에 상품을 광고하고 구매를 할 수 있는 효과적인 전자상거래 컨텐츠를 제작 학 수 있도록 하여 준다. 애플리케이션 제작에서부터 전송스트림 생성까지 통합적인 데이터방송 컨텐츠 제작환경을 제공함으로서 연통형 데이터방송 실시에 대비하여 매우 적합한 도구이며, 사용자의 편리성과 효율성을 위하여 손쉬운 사용자 인터페이스를 제공하여 활용을 용이하게 하였다.
-
본 논문에서는 Microsoft DirectShow기반의 DSM-CC Object Carousel과 Data Download 프로토콜을 위한 인코더의 설계 및 구현에 대해 기술한다. DirectShow는 Component Object Model (COM) 기술을 기반으로 하고 있다. 따라서, 작성된 코드의 재사용과 유지보수가 용이하고, 멀티미디어(Multimedia) 데이터를 편리하게 처리말 수 있는 기능을 제공한다. 또한, 개발자가 COM component를 쉽게 제작할 수 있는 방법을 제공한다 하지만, 스트리밍 오디오/비디오 등의 디코딩을 위주로 개발된 DirectShow기술이 데이터 방송 서버에서의 실시간 인코딩 작업에 사용할 때에는 문제점이 발생한다 Data Carousel 방식에서는 인로딩 도중에 Update를 지원해야 한다. 즉, Carousel데이터의 Update가 있을 경우, 스트리밍(Streaming) 하는 동안 Update된 데이터를 인코딩 하여야 한다. 이러한 상황은 DirectShow의 기본 상태로는 표현하기 어려우므로 기본 상태를 확장하여 별도의 사용자 정의 상태를 추가하였다. 또한, 두 작업을 동시에 수행하기에 적합한 스레드(thread) 모델과 Push/pull 버퍼 모델을 설계하였다. DirectShow를 이용하여 인코더를 구현함으로써 개발자는 개발시간과 비용을 절약 할 수 있고, 사용자에게는 인코더를 등록하고 실행하기 쉬운 환경과 인로딩 상태의 실시간 모니터링 기능을 제공한다.
-
본 논문에서는 지상과 디지털 멀티미디어 방송(Digital Multimedia Broadcasting, DMB)에서 양방향 서비스를 제공하기 위한 네트워크 독립적인 프로토콜의 설계와 구현에 대해 서술한다. 양방향 서비스는 리턴 채널(return channel)이 가용한 DMB 수신기에서 가능하며 사용될 수 있는 리턴 채널로는 모바일 통신 네트워크, 무선 랜, PSTN 등이 있다. 양방향 서비스를 구성하는 서버와 수신 단말은 모두 PC 환경에서 구현하였고 간단한 양방향 서비스 예를 이용하여 네트워크 독립적인 프로토콜을 테스트하였다. 이 예에서, 수신 단말은 슬라이드 쇼가 포함된 기본 오디오 서비스를 수신하면서 실시간 설문조사와 같은 양방향 서비스를 제공받을 수 있다. 본 논문에서 개발된 프로토콜을 활용하면 DMB 전자상거래(DMB-commerce)와 같은 다양한 양방향 서비스를 구현할 수 있을 것이다.
-
다양한 종류의 사용자 단말과 더불어 이종 망의 도입에 따라, 디지털 영상컨텐츠를 효과적으로 제공하기 위해 트랜스코딩에 대한 연구가 활발히 진행 중에 있다. 특히, FD(Frame Dropping)/CD(Coefficient Dropping) 트랜스코딩기법은 계산량을 줄이고, 손쉽게 구현할 수 있다는 측면에서 주목을 받고 있다. 그러나, 기존의 연구에서는 CD로 인하여 발생되는 왜곡 특성이 GOP내의 다른 복호화 영상 품질에 전파 및 누적되는 성질을 고려하지 않고 있다. 본 논문에서는 CD로 인하여 발생되는 왜곡을 수식적으로 분석하고, CD왜곡이 전파/누적됨을 모의실험을 통하여 분석한다. 또한, 실험적인 견과에 기초하여,0에 의한 전파/누적 왜곡 특성을 지수 감소함수 형태로 모델링 될 수 있음을 보이고, 모의실험을 통하여, 제안된 모델링은 CD로 인해 발생하는 전체 복호화 왜곡 크기를 잘 예측하는데 사용할 수 있음을 보인다.
-
특정한 컨텐츠의 시작과 끝까지의 시간을 표시해주는 NPT는 디지털 방송에서 비데오와 데이터의 동기화된 서비스를 제공하기 위해서 뻐P에서 권고하는 규약이지만 널리 사용되고 있지는 않다 그 이유는 기술적, 문화적, 경제적인 요인 등이 있을 수 있는데 이 글에서는 기술적 원인에 대해서만 다룬다. 현재 사용되고 있는 수신기에 NPT 기능이 구현되어 있지 않다는 점과 구현되더라도 NPT스트림을 추가적으로 인코딩해야 하는 번거로움 그리고 그 와중에 생기는 동기화의 오차등이 NPT 사용을 막는 가장 큰 기술적 원인들이다. 이런 상황에서 MPT를 사용하는 방법을 몇몇 논문에서 제시했지만, 여전히 실제 방송 프로그램에 사용하기엔 미진한 점이 남아 있다. 그 이유는 동기화의 정확성이 검증되지 않은 점 , 추가적인 대역폭 사용이 필요한 점등으로 들 수 있는데 이 글에서는 그 문제점들에 대해서 고찰해본다 또한 그를 통해서 현재 사용하고 있는 방법의 근원적인 결함을 지적하고 새로운 방법인 EIT 테이블을 이용하는 방법과 그 가능성에 대해서 생각해본다.
-
In this paper an adaptive channel estimator is proposed and investigated which improves the receiving performance for the DVB-T system. A conventional estimator for the system consists of a two-dimensional Wiener filter which is implemented as a cascade of one-dimensional filters, and the filter is operating with the filter coefficients set which is selected from the four different sets according to the channel environment. Our proposed estimator uses the filter coefficients which is interpolated by the two closest coefficients sets. The proposed scheme shows an improvement of 5 to 10dB in SNR compared to the conventional scheme.
-
가변길이 부호는 정보원(source)의 통계적인 특성을 이용하여 부호화 효율을 높이지만. 잡음이 심한 전송환경에선 비트에 대한 오류가 발생하면 심각하게 손상되는 단점을 가진다. 이러한 가변길이 부호의 문제를 해결하기 위해 양방향 가변길이 부호가 제안되었다. 양방향 가변길이 부호는 순방향과 역방향으로 복호가 가능하여 전송 오류로 인해 손상된 비디오 비트열에서 데이터를 복구할 수 있다. 부호의 자유거리(free distance)는 부호자체가 전송 오류에 얼마나 강인한지를 보여주는 척도로 사용된다. 양방향 가변길이 부호의 자유거리(free distance)의 최소 값은 1이므로 비디오 비트열 손상 자체를 방지할 수는 없다 본 논문에서는 자유거리(free distancs)의 최소 값을 증가시켜 전송오류에 더욱 강인한 새로운 양방향 가변길이 부호의 선계 기법을 제안한다. 제안된 알고리즘은 주어진 Huffman 부호와 평균부호길이 함수의 특성을 이용하여 자유거리의 조건을 만족하면서 동시에 부호화 효율을 높여 기존의 알고리즘보다 향상된 성능을 보여준다.
-
무선 네트워크에서 멀티미디어 전송을 위해 Delay를 줄이는 방법을 연구하고 이에 대한 실험적 검증을 하였다. 멀티미디어 데이터는 그 특성상 주어진 시간에 도착하지 못하는 데이터는 손실로 간주되므로 Loss에 못지 않게 Delay가 중요한 QoS 파라미터가 된다. 본 연구에서는 IEEE 802.11b를 그 환경으로 하여 멀티미디어 데이터를 트랜스코더를 이용하여 미디어 전환 후 전송 학 때 Delay를 최소화 할 수 있는 방안을 연구하였다. 무선 환경에서의 SNR을 기준으로 다양한 조건에서 패킷 사이즈와 전송 간격을 조절하여 무선 네트워크에서 Delay와 Loss가 적게 발생하는 환경을 찾아내었으며 이전 상태와 현재 상태를 비교하여 미래의 상태를 미리 예측학 수 있는 알고리즘을 개발하여 적용하였다. 이러한 연구 결과는 MPEG-4의 Video racket을 가장 효율적인 크기로 인코딩 할 수 있는 판단 근거를 만들게 해 주며, 예측 된 패킷 사이즈를 통하여 다음 전송이 이루어지기 전에 트랜스코더에게 미리 인코딩 하여 준비학 수 있도록 해서 네트워크에 적응적인 전송 방식으로 구현될 수 있는 장점이 있다.
-
최근 디지털 당송과 이동통신 단말기의 대중화가 이루어짐에 따라 고화질 고해상도의 멀티미디어 컨텐츠의 이동통신 단말기에서의 재생 서비스에 대한 수요가 증가하고 있다 이동통신 단말기에서 멀티미디어 컨텐츠 재생 서비스를 제공하기 위해서는 디지털 방송 컨텐츠를 단말기에 적합한 컨텐츠로 변환할 필요가 있다. 본 논문은 디지털 방송 규격인 MPEG-2 컨텐츠를 이동통신 단말기에서 지원하는 MPEG-4 SP(Simple Profile) 컨텐츠로 실시간으로 변환하는 트랜스 코더에 대한 설계와 구현 기술을 제안한다. 구현된 트래스코더는 화질 유지와 계산량 감소를 위한 적응적 움직임벡터 재구성, 매크로블록 모드 선택, 그리고 움직임벡터 scaling 등의 알고리즘을 포함하고, 인텔사에서 제공하는 SIMD(Single Instruction Multiple Data) 명령어를 이용하여 최적화되었다. 트랜스코더는 30fps, 8Mbps,
$720\times480$ 해상도의 멀티미디어 컨텐츠를 다양한 비트율의 30fps,$352\times240$ 해상도의 MPEG-4 컨텐츠로 실시간 변환할 수 있다. -
기존의 양안식 스테레오 디스플레이 시스템은 장면 내에 매우 큰 변이를 가지는 물체가 존재 할 경우에 시각피로를 유발하여 오랜 시간동안 시청하기가 어렵게 된다. 본 논문에서는 변이 기반 비대칭 필터링 기법을 제안하고, 이 기법의 시각 피로도에 미치는 영향을 주관적 평가를 통하여 고찰하며, 아울러 교차변이(crossed disparity) 및 비교차변이(uncrossed disparity)에 따른 시각 피로도에 미치는 영향의 변화 또한 고찰하였다. 실험 결과, 변이기반 비대칭 필터링은 시각 피로의 측면에서는 비교차변이만 존재하는 영상의 경우에는 원래의 스테레오 영상에 비해 큰 영향이 없거나, 오히려 필터링 수준에 따라 오히려 시각적 피로가 심하게 되는 결과를 나타내었다. 또한 교차변이의 경우에는 시파피로가 필터링 수준을 높임에 따라 조금씩 시각피로가 개선되는 결과를 나타내었다. 따라서, 비대칭 필터링에 의한 시각피로의 개선효과는 스테레오 영상 내 변이 종류와 그 크기, 시청자의 주시전 등 여러 요인에 따라 달라질 수 있음을 앞 수 있었다.
-
As there is a growing tendency to represent the 3D content instead of the 2D content, researches for the stereoscopic image and video are under way in a variety of fields such as acquisition compression, transmission, authoring and display. The authoring technique for stereoscopic contents has given emphasis to virtual stereoscopic contents. Thus the authoring technique for stereoscopic pictures is insufficient. When we compose a stereo scene with stereoscopic pictures, stereoscopic contents may not match the stereo scene because each stereoscopic picture may have different camera condition. To solve this problem, stereoscopic pictures have been modified manually. It is a laborious work and will be spent much time. Also it is difficult for a user who does not have an elementary knowledge of stereopsis. In this paper, we propose the synthesis method to compose a natural stereo scene with stereoscopic still pictures and moving pictures. Experimental results show that the proposed method in this paper allows a user to synthesize stereoscopic contents easily and compose a stereo scene conveniently.
-
한국의 방송은 이제 인터랙티브 TV 서비스를 실시하기 시작했다. 인터랙티브 서비스는 잠재가치가 매우 뛰어나 앞으로의 방송시장에 막대한 부를 안겨줄 수 있을 것으로 예상되고 있다. 그러나 우리나라는 인터랙티브 TV프로그램이 기술적으로는 충분히 가능함에도 불구하고, 그다지 실질적으로 활용하지 못하고 있다. 이는 근본적으로는 인터랙티브 기술이 시청자의 관심과 참여를 이끌어낼 만큼 경쟁력 있는 포맷의 컨텐츠를 발굴해 내지 못하고 있기 때문이다. 따라서 본 논문에서는 우선 TV의 인터랙티브성(Interactivity)을 정의 내리고, 해외 인터랙티브 TV프로그램 제작 성공 사례를 분석한다. 그리고 이들이 어떤 기술을 바탕으로 서비스를 하고 있으며 어떻게 성공할 수 있었는지 알아보도록 한다. 그리고 한국 디지털 방송의 성공을 위한 인터랙티브 방송 모델을 제시한다.
-
본 논문은 디지털방송 환경에서 시청자가 적극적으로 스토리 전개에 개입하여 스토리라인을 바꿀 수 있는 복수의 스토리라인(multi-storyline)을 가지는 인터랙티브 프로그램의 구현을 목적으로 한다. 시청자는 방송을 시청하는 도중 리모콘으로 방송의 스토리전개를 선택할 수 있으며 이는 기존 아날로그방송에서는 불가능한 새로운 유형의 연동형 데이터방송 프로그램(enhanced service)이다. 이는 국내 디지털 위성방송 표준인 DVB-MHP방식으로 세계 최초로 구현한 것으로 이를 응용해 A/V방송제작자와 데이터방송 애플리케이션(application)제작자는 보다 다양한 연동형 데이터방송 프로그램을 기획, 제작할 수 있고 시청자는 기존의 방송에서 보지 못했던 새로운 시각적, 적극적인 시청 경험을 하게 된다.
-
본 논문은 ATSC방식의 지상파 DTV의 이동수신 성능 개선을 위해 적응 어레이 안테나를 사용하여 입사되는 신호의 위상 정보를 통해 원하는 신호원의 방향을 찾고 주신호와 다중경로 신호 사이에 capon알고리즘을 통해 최대의 이득을 얻는 최적의 빔을 형성하며 이동수신채널인 도플러효과가 포함된 다중경로신호득의 영향을 약화시킨다. 빔형성 알고리즘을 통한 채널의 개선이 LMS 알고리즘을 사용한 통화기의 성능을 얼마나 향상시키는지 전산 모의 실험을 통해 확인하였다.
-
본 논문은 기존의 표준 8-VSB 방식의 DTV 수신 성능 개선을 위해 ATSC T3/S9에 제안되었던 기술 중에서 현재 새로운 표준안으로 채택이 유력시되는 Zenith/ATI의 Enhanced 8-VSB 방식과 Philips의 Pseudo 2-VSB 방식에 대해 살펴보고, 다양한 채널 환경에 대해서 전산 모의 실험을 실시하여 자 방식의 수신 성능을 비친, 분석하였다. 이중 스트림 기술을 사용하였을 때, 강인한 트렐리스 부호화를 거친 강인데이터의 성능 개선 정도와 강인데이터가 표준데이터에 미치는 성능 개선 정도를 SNR에 따른 트렐리스 디코더의 바이트 에러율을 통해서 비교, 분석하였다.
-
In this paper, we developed a DTV RF (Radio frequency) capture, analysis, and regeneration system adapting digital signal processing and high speed hard disk interfacing techniques and analyzed characteristics of captured RF signal. This system can be used in the various field of DTV transmission because this system can capture the receiving real DTV signals and analyze captured RF signals that contain the complex characteristics of the real-world RF environments and regenerate it in a laboratory without the performance degradation. The system can capture and replay the DTV RF signals in real-time on hard disk. Therefore, there is no limit for the amount of captured data with in the installed storage capacity. We can expect various possible applications for this system such as a tool for the development of the receiver performance analysis, design, and analysis for the DTV coverage areas, etc. This system can also be used as RF signal analyzer.
-
DMB(Digital Multimedia Broadcasting)는 유럽의 디지털 오디오 방송규격인 Eureka-147 DAB(Digital Audio Broadcasting) 전송시스템을 기반으로 하여 동영상 및 음성, 문자데이터 등을 포함한 멀티미디어 서비스를 제공하기 위한 새로운 방송표준이다 따라서 DMB 시스템은 Eureka-147 DAB 전송부 이외에 영상 및 음성을 압축하는 미디어압축 (복)부호화부, 압축된 미디어 스트림을 다중화 하는 비디오 (역)다중화부가 추가된 구조를 갖는다. 본 논문은 DMB 표준의 비디오 다중화부의 분석을 통하여 확장된 전송기능 및 높은 전송효율을 제공할 수 있는 새로운 비디오 다중화 구조를 제시한다. 또한 표준 비디오 다중화기와 제안된 비디오 다중화기의 성능평가를 위해 기능적으로 분석하고 시뮬레이션을 통해 전송효율을 측정하였다.
-
In this paper, the efficient implementation technique of media processing part in the terrestrial and satellite DMB (Digital Multimedia Broadcasting) receiver is presented. To implement the unified multimedia Processor of DMB receiver, we investigated the characteristic of DMB service and the functionality of each processing part in the DMB receiver. To implement the synchronization between audio and video media, we present the general method to use the reference clock of the stream in the DMB receiver. Also we present the method to handle the bit error of the received bitstream within the wireless net work for robust media processor.
-
최근 국내 여러 형태의 방송국들이 아날로그 전송에서 디지털 전송 방식으로 점차 변경하고 있다. 이러한 디지털 방송은 다양한 장점을 가지고 있으나, 동시에 고품질 콘텐츠의 불법 복제 및 유통이라는 단점을 안고 있다. 따라서 방송국에선 디지털 방송 콘텐츠에 대한 저작권 보호 기술이 필요하게 되고, 현재 연구되고 있는 여러 가지 저작권 보호 기술 중에서 워터마킹 기술이 공중파 방송 환경에서 가장 적합한 기술로 예상된다. 본 논문에서는 방송 환경하의 저작권 보호를 위한 비디오 워터마킹 기술을 제안하고 제안 기술에 대한 실험 견과를 보인다. 제안하는 워터마킹 기술은 MPEG-2 압축 전 비압축 동영상 신호에 저작권 정보를 삽입하고 전송된 동영상 신호에서 원본 동영상 없이 검출한다. 제안하는 기술은 워터마킹 기술의 3가지 기본 요구 사항인 강인성, 비가시성 및 보안성을 충족하도록 설계하였다
-
Sohn Yumi;Park Seongjoon;Hendry Hendry;Jeong Hyun;Qonita Qonita;Kim Jong-Nam;Park Keunsoo;Kim Munchurl 197
MPEG-21은 디지털 객체를 정의하고 이를 네트워크상에서 생성, 변형, 전달, 소비를 위한 통합적 멀티미디어 프레임워크에 대한 국제 표준이다. 디지털 아이템(DI: Digital item)은 MPEG-21 프레임워크 내에서 표준화 된 식별체계, 서술 형식을 따르는 구조화된 디지털 객체이며, 유통, 처리의 최소 단위이다 본 논문에서는 이러한 디지털 아이템을 최종 소비하는 MPEG-21 터미널 구조를 제안하고 이에 대한 설계 및 구현, 그리고 실험 결과를 제시한다 -
본 논문에서는 디지털 데이터 방송에서 동기화 데이터 서비스를 제공하기 위한 전송 시스템과 이를 이용한 동기화 데이터 서비스 방법을 제안한다. 데이터 방송을 통해 전송되는 부가 데이터는 그 특징에 따라 비동기, 동기, 동기화 데이터로 구분된다. 이들 중 동기화 데이터는 사용자의 선택에 의해 데이터 방송 수신기에서 재생되는 비동기 데이터와는 달리 비디오 또는 오디오의 특정 장면에 통기되어 재생될 수 있는 데이터고서, 데이터를 전송하는 단계에서 데이터가 재생되어야 하는 시전의 시간 정보인 재생시각이 함께 전송되는 특징이 있다. 동기화 데이터의 이와 같은 특징으로 인해 현재 대부분의 데이터 방송에 사용되고 있는 비동기 데이터 서비스를 위한 전송 시스템은 동기화 데이터의 전송에는 부적합하며, 동기화 데이터 서비스를 위해서는 새로운 전송 시스템에 대한 연구가 필요하다. 본 논문에서는 데이터 방송을 동해 동기화 데이터 서비스를 제공하기 위해 기존의 비동기 데이터 전송 시스템에 MPEG-2 오디오/비디오 TS(Transport Stream)를 출력하는 장치와 동기화 데이터를 다중화 하는 장치를 추가한 새로운 동기화 데이터 전송 시스템과 이를 이용한 동기화 데이터 서비스 방법을 제안한다
-
디지털 방송의 발달로 인해 현재 방송 환경은 사용자가 단순히 제공되는 콘텐츠를 감상하는 수준에서 사용자가 콘텐츠와 직접 대화하는 대화형 방송이 발달하고 있다 MPEG-4 콘텐츠는 이러한 대화형 방송에 매우 부합되는 콘텐츠이며, 그 사용이 점차 증가하고 있다. 향후 MPEG-4 콘텐츠가 널리 이용될 때, MPEG-4 콘텐츠에 MPEG-7 ES를 하나의 미디어 데이터로 간주하고 MPEG-4 콘텐츠에 포함하여 전송한다면, MPEG-4 콘텐츠의 검색 및 관리가 용이해질 뿐만 아니라 MPEG-7의 다양한 기능과 결합한다면 MPEG-4 콘텐츠의 응용을 더욱 풍부히 할 수 있다. 본 논문에서는 이를 위해 MPEG-4 콘텐츠에 OCI 기술자 또는 MPEG-7 ES를 포함한 MPEG-4 콘텐츠를 재생할 수 있는 MPEG-7 over MPEG-4 시스템디코더와 그 구조에 대해 서술하였다.
-
본 논문에서는 PC 환경에서 지상파 디지털 멀티미디어 방송(Digital Multimedia Broadcasting, DMB)을 수신할 수 있는 PC 기반 지상파 DMB 수신기용 백엔드 시스템 개발에 대해 서술한다. 지상파 DMB는 기존의 지상파 아날로그 또는 디지털 TV에 비해 탁월한 이동 수신 성능을 보인다. 본 논문에서는 국내 지상파 DMB 표준안에 부합하는 수신기의 백엔드 (back-end)를 PC 환경에서 소프트웨어로 구현하였다. 지상파 DMB는 유럽의 디지털 오디오 방송(Digital Audio Broadcasting, DAB) 표준인 EUREKA-147을 기반으로 MPEG-4 표준에 의한 멀티미디어 서비스를 제공한다. 지상파 DMB의 멀티미디어 서비스는 MPEG-4 AVC(Advance Video Coding) 압축 비디오와 BSAC(Bit Slice Arithmetic Coding) 압축 오디오를 MPEG-4 시스템의 SL(Sync Layer) 표준으로 패킷화 후 MPEG-2 TS(Transport Stream)에 실어 DAB의 스티림 모드를 통해 전송하는 방식을 사용한다. 본 논문에서는, 지상파 DMB 수신을 위한 프론트엔드(front-end)는 외장형 기기를 이용하고, 이로부터 USB 인터페이스를 통해 기저대역 다중화 스트림을 PC 상으로 업로드한 뒤, 소프트웨어에 의해 역다중화하고 압축을 푼 후, 오디오와 비디오를 재생하는 지상파 DMB 백엔드 시스템을 구현하고 이를 검증하였다.
-
본 논문에서는 MPEG-7에 정의된 오디오 서술자를 이용한 오디오 특징을 기반으로 한 음악 검색 알고리즘을 제안한다. 특히 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 Query by humming에 이용 될 수 있다. 이러한 연구를 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다 본 논문에서는 방송 시스템에 적용 할 수 있도록 검색 범위를 특정 컨텐츠의 O.S.T 앨범으로 제한하였다. 즉, 사용자가 임의로 선택한 부분적인 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징벡터를 구성하기 위한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능 평가를 수행한 결과 timbral spectral feature들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 Euclidean distance 방식보다 우수한 성능을 보였다.
-
본 논문에서는 멀티모달(multimodal) 특징을 이용한 비디오 장르 식별 방법을 제안한다. 비디오 장르 식별 기술은 방대한 양의 방송 컨텐츠를 보다 효율적으로 분류할 뿐 아니라 자동적인 비디오 요약을 위한 전처리 과정으로 활용될 수 있는 기술이다. 따라서, 그 필요성 및 중요성이 부각되고 있다. 본 논문에서 제안하고 있는 방법은 MPEG-7의 오디오 및 비주얼 서술자들을 적용하여 멀티모달 특징을 추출하고 여러 가지 방송 비디오 장르(genre)들로 구성된 데이터베이스에서 장르 분류를 위해 설계된 인식기(classifier)를 통한 성능을 평가한다.
-
최근, 컴퓨터 환경의 발달로 각 분야에서 AV(Audio-Visual) 콘텐츠의 사용량이 기하급수적으로 증가되었다 또한 컴퓨터, 방송 및 네트워크의 융합으로 이 전 보다 다양한 종류의 어플리케이션에서 다양한 형태로 AV 콘텐츠가 사용되고 있다 이에 따라, 이런 다양한 형태의 AV콘텐츠를 표현하는 방법 및 검색하여 사용하는 방법에 대한 많은 연구들이 이루어지고 있다 이런 연구들의 한 형태로 본 논문에서는 AV 콘텐츠를 표현하는 방법으로 MPEG-4 콘텐츠를 XML에 기반 하여 표현한 XMT(eXtensible MPEG-4 Textual fomat)와 AV 콘텐츠를 검색하는 방법으로 MPEG-7 표준을 사용하여 객체기반 MPEG-4의 콘텐츠 검객 시스템을 제안하였다 다양한 포맷의 미디어 데이터 및 그래픽 객체들을 각각의 하나의 객체로 간주하여 AV콘텐츠를 구성하는 MPEG-4 시스템을 XML을 기반으로 표현한 XMT 포맷으로는 MPEG-4 콘텐츠를 구성하는 미디어 데이터를 바탕으로 검색하는데 한계가 있다. 따라서 미디어 데이터 검색을 위한 메타데이 터의 표준으로 사용되고 있는 MPEG-7 을 사용하여 객체 기반 MPEG-4 콘텐츠 검색이 효과적으로 이루어질 수 있도록 확장된 XMT 포맷을 제안하고, 이를 사용하는 시험 시스템을 구성하였다. 이렇게 함으로써 MPEG-4로 표현된 객체 기반 AV 콘텐츠 검색 시 MPEG-7메타데이터를 사용하여 보다 사용자가 원하는 콘텐츠를 효율적으로 검색하여 제공할 수 있을 것으로 사려된다
-
최근 디지털 방송이 시작됨에 따라 방송 채널이 다변화하고 그 수도 많아지고 있다. 현재 방송되고 있는 디지털 당송에 지상파 방송과 케이블 TV의 그 방송까지 고려한다면 시청자가 접합 수 있는 방송은 다양하다. 기업들은 주요 홍보 매체인 방송을 통해 자신들의 상품을 광고로 내보낸다. 또한 자신들의 광고에 대한 모니터링을 통해 광고가 계약한 시간, 횟수, 광고의 길이에 맞게 방영되는지 알고 식어 한다. 현재 이러한 모니터링은 사람에 의한 수작업으로 이루어지고 있으며, 여러 채널의 방송에 광고를 내보냈을 때에는 이러한 모니터링은 더욱 어려워진다. 본 논문에서는 디지털 방송뿐만 아니라 아날로그 방송에 대해서까지도, 현재 방송의 비주얼 리듬을 실시간으로 추출하고 이를 이용하여 장면 전환을 수행하고 특징 벡터를 추출해서 얻어진 정보들을 이용한 실시간 광고 검출 알고리즘을 제안한다.
-
본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다. 특히 DMB 사용환경에서 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단인 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman Filter를 이용하여 시간상 단구간 정적 잡음을 제거한다. 본 논문의 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다
-
실제공간에서 음원이 존재하는 것처럼 음향을 재현하려 연 스테레오만으로는 완벽한 재현이 어렵다. 본 논문에서는 4채널 오디오 출력을 이용해서 가상환경의 음원이 실제 공간에 존재하는 것처럼 재생하는 방법을 기술한다. 잔향 임펄스 응답을 이용해서 공간감을 구현하였고, 음원과 청자의 거리에 따라 감을 조절하였으며, 4채널에 균일 파워 패닝 기법을 사용해서 방향감을 구현하였다. PC에서 입체음향이 되도록 구현하였으며, 실시간으로 음원과 청자의 위치를 변화시킬 수 있도록 하였다. 본 논문에서는 공간감, 음량감과 방향감을 고려하는 4채널 오디오 출력을 이용한 실시간 입체음향 구현에 대해 기술한다.
-
방송과 통신이 융합된 차세대 정보통신환경에서는 TV 나 휴대폰, PDA등의 이동통신단말기를 이용하여, 언제 어디서나 소비자가 원하는 상품과 서비스를 능동적으로 검색하여 신뢰성 있는 접속망을 통한 즉각적인 구매로 연결되는 유비쿼터스(Ubiquitous) 상거래가 가능하게 된다. 본 논문에서는 향후 도래될 u-커머스 환경에서 MPEG-21 멀티미디어 프레임워크 표준기술을 적용한 '지능형 광고 아이템'의 개념과 기능을 설명하고, MPEG-21 기반 광고 아이템의 기획 제작 시 필요한 기술적 연구방안을 제시한다.
-
MPEG-21의 주요 요소 중 하나인 Digital Item Adaptation(DIA)은 사용자 선호도(User Preferences) 및 터미널 능력(Terminal Capabilities)에 따라 적응 변환된 디지털 아이템(digital item)을 제공한다. 본 논문은 MPEG-21 프레임워크에서 입체 영상 디지털 아이템의 적응을 구현하는 DIA 테스트베드의 구현을 목적으로 한다. 사용자 선호도에는 입체시차 종류, 깊이 범위, 지연 영상 간격 등이 있다. 터미널 능력으로는 코덱, 입체 랜더링 포맷, 디스플레이 타입 등이 있다. 상기 기술자들은 DIA 서버로 전송되어 적응된 입체영상이 생성되머, 또한 변환된 입체영상 DI는 사용자의 요구에 따라 MPEG-2 또는 MPEG-4로 엔코딩되어 전송된다. 클라이언트는 DIA 서버에서 전송되는 입체영상 DI를 받아 디코딩 한 후 디스플레이 하게 된다. 서버의 DIA는 입체 DI의 실시간 전송을 위하여 RTP와 RTSP를 사용하여 전송한다.
-
Pak Seongjoon;Sohn Yumi;Hendry Hendry;Jeong Hyun;Qonita Qonita;Kim Jong-Nam;Park Keunsoo;Kim Munchurl 257
MPEG-21은 사용자가 다양한 멀티미디어 데이터를 네트워크상에서 생성, 변형, 전달, 소비하기 위한 통합적 멀티미디어 프레임워크를 정의한 국제 표준이 다. MPEG-21 DIA(digital item adaptation)는 멀티 미디어 데이터를 사용자의 환경, 단말기 특성, 네트워크 특성에 대한 정보를 기술할 수 있는 표준을 정의하고 있다. 본 논문에서는 DIA에서 정의한 여러 가지 적응 변환 중 사용자의 관심 영역을 중심으로 한 의미론적 변환 엔진을 구현하였으며, 이에 대한 실험결과를 제시한다 기존의 변환 방법이 비디오 프레임의 전체 크기, 해상도 화질을 조정하였다면, 의미론적 변환은 사용자의 관심 영역을 중심으로 변환을 수행함으로써, 사용자의 관심도를 반영할 수 있는 장점이 있다. -
기존치 임베디드 시스템 환경에서 대용량의 멀티미디어 컨텐츠를 검색, 전송 및 재생하는데는 제한된 리소스로 인해 한계전이 있었다. 압축률이 좋고, 전송 및 재생에 효과적인 MPEG-4 시스템의 표준을 따르며. 다양한 대화형 멀티미디어를 프리젠테이션 할 수 있는 기법이 요구된다. 본 논문은 임베디드 시스템에서 DM과 연동하여 비디오/오디오의 재생 제어를 효율적으로 하고, 모듈을 동적으로 로드/언로드하여 저용량의 메모리를 사용하는 MPEG-4 미디어 프리젠테이션 기법을 제안한다.
-
본 논문은 DVB-MHP 규약을 따르는 동기화 된 데이터 방송 애플리케이션을 제작하기 위한 스트림 생성기의 구현을 기술한다. 동기화 된 애플리케이션은 비디오와 공유된 시간기준을 가지며 특정시각에 발생한 이벤트(스케쥴드 스트림 이벤트)를 처리할 수 있는 애플리케이션이다. 동기화 된 애플리케이션을 위해서 스트림 생성기는 다음 작업을 수행한다. (1) NPT(Normal Play Time)를 수신기로 보내기 위해 NPT 참조서술자를 전송 스트림 내에 MPEG2 섹션으로 포장하여 넣는다. (2) 스케쥴드 스트림 이벤트들을 생성하여 전송 스트림내의 적당한 위치에 MPEG2 섹션으로 포장하여 넣는다. (3) 애플리케이션 프로그램과 스트림 이벤트에 대한 참조(reference)를 포함하는 객체 카로셀을 생성한다. DVB-J 애플리케이션은 DVB-MHP API중에 섹션필터 관련 API를 이용하여 전송된 NPT 참조 서술자를 읽어들이고 이로부터 NPT를 재구성하며, 스트림 이벤트 관련 API를 이용하여 스트림 이벤트를 처리하도록 구현한다 스트림 생성기가 생성한 MPEG2 전송 스트림으로 Interactive Game Show 애플리케이션을 제작하여 비디오와 애플리케이션이 사용하는 이미지 디스플레이간의 동기화를 테스트하였다.
-
본 논에서는 In-Process COM Component 기반의 DirectShow를 분산환경에서 적용하기 위해 해결해야 할 문제점을 분석하고, 해결방법을 제시한다. Microsoft사에서 제공하는 DirectShow는 Multimedia 데이터 처리용 라이브러리와 이 라이브러리를 사용하는 응용프로그램을 용이하게 제작하기 위한 Framework이다. DirectShow의 라이브러리는 COM기술을 사용하여 제작되기 때문에 재사용 및 유지보수가 용이하다. 하지만, DirectShow는 주로 멀티미디어 데이터의 재생을 위한 기술로서 멀티미디어 서버와 같이 여러 Encoder와 다중화기와 같은 기능을 구현하는데 많은 문제점이 있다. 특히, multi-Protocol Encoder와 같이 계산양이 많은 작업을 해야 할 경우 분산환경을 사용해야 한 필요가 있다. 본 논문에서는 네트워크의 분리되어 있는 두개의 필터를 연결하기 위해 필터간의 메시지 교환을 대리하는 Proxy 필터를 설계/구현하였다. 이러한 Proxy 필터를 사용하면 기존의 필터를 수정하지 않고 사용할 수 있는 장점을 갖고 있다. 특히 Binary로 배포된 필터와 연동하여 사용할 수 있다. 구현된Proxy 필터를 데이터 방송 서버에 활용함으로써 그 기능을 검증하였다.
-
디지털 콘텐츠의 증가에 따라 이들의 효율적인 검색과 관리를 위하여 내용 기반 검색에 관한 많은 연구가 이루어지고 있다. 이러만 내용 기반 검색의 질의 방법으로는 유사한 영상을 질의의 사용하는 QBE(Query By Example)와 영상을 사용자가 직접 스케치하여 질의에 사용하는 QBS(Query By Sketch)가 대표적이다. 본 논문서는 질의로 용할 정확한 영상이 필요한 QBE 방법의 제약과 질의할 영상 전체를 처음부터 스케치해야 하는 QBS 방법의 문제점을 보완하는 개선된 질의 방법을 제안한다. 제안하는 방법은 입력 영상을 단순화하여 스케치의 근간이 되는 밑그림을 제공하고 사용자치 수정 과정을 거쳐 질의하는 방법으로 정확한 검색 결과와 검색 시 소요되는 시간과 노력을 절감할 수 있는 장점이 있다.