• 제목/요약/키워드: 멀티미디어공학

검색결과 1,024건 처리시간 0.035초

초저복잡도 H.264 부호기의 움직임 추정 및 모드 결정 알고리즘 (Motion Estimation and Mode Decision Algorithm for Very Low-complexity H.264/AVC Video Encoder)

  • 유영일;김용태;이승준;강동욱;김기두
    • 방송공학회논문지
    • /
    • 제10권4호통권29호
    • /
    • pp.528-539
    • /
    • 2005
  • H.264는 우수한 부호화 성능으로 말미암아 DMB 차세대 DVD 등 새로운 멀티미디어 서비스를 위한 비디오 코덱으로 채택되어 왔다. 그러나 이 표준의 표준 코덱인 Joint Model(JM)은 연산 자원이 한정된 임베디드 환경에서 사용되기에는 너무 복잡한 다수의 알고리즘을 포함하고 있다. 본 논문은 임베디드 환경에서 사용할 수 있도록 설계된 초저복잡도 H.264 부호화 알고리즘을 제시한다. 제안하는 알고리즘은 압축 성능의 급격한 악화를 가져오지 않는 범위 내에서 몇 가지 부호화 도구의 사용을 제한하고, 또 움직임 추정과 모드 결정 과정에 몇 가지의 조기 종료 조건과 우회 조건을 추가하는 방법으로 구현하였다. 제안하는 알고리즘을 사용하여 7.5fps QCIF 영상을 64kbps로 부호화하는 경우, 표준 JM에 비해서 평균적으로 0.4 dB 정도의 미약한 PSNR 열화를 나타냄에도 불구하고, 단지 $15\%$의 계산량만을 필요로 할 뿐만 아니라, 필요한 메모리의 양과 전력 사용률을 획기적으로 낮추는 것이 가능하다. 제안하는 알고리즘의 H.264 부호기를 Intel PXA255 Processor를 사용하는 PDA에 이식하는 실험을 통하여 PDA에서 H.264 기반의 MMS(Multimedia Messaging Service)의 실현 가능성을 검증하였다.

통계적 분석 기반 불법 복제 비디오 영상 감식 방법 (A Novel Video Copy Detection Method based on Statistical Analysis)

  • 조혜정;김지은;손채봉;정광수;오승준
    • 방송공학회논문지
    • /
    • 제14권6호
    • /
    • pp.661-675
    • /
    • 2009
  • 인터넷과 멀티미디어 기술이 발달함에 따라 무분별한 불법 콘텐츠들의 유통으로 인한 저작권 침해가 심각한 사회적 문제로 대두되고 있어, 불법 복제 영상을 검출하는 시스템의 개발이 시급하다. 본 논문에서는 공간영역 상에서 다양하게 변형된 복제 영상과 원본 영상간의 통계적 특성을 이용하여 그 유사도를 측정하고 복제 여부를 판단하는 계층적 구조의 불법 비디오 감식 방법을 제안한다. 영상의 대표적 특성인 휘도 성분에 따라 순위를 매김으로써 공간적 변형에 영향을 받지 않도록 하였으며, 데이터베이스에 저장된 방대한 양의 영상들에 대한 검색시간과 계산량을 줄이기 위해 순위 표본 프레임을 이용하여 유사한 후보 영상군을 추출한다. 이러한 후보 영상군을 대상으로 일반적인 불법 복제 비디오의 형태를 감안하여 각 프레임의 가장자리에 위치한 검은색 영역을 제외함과 동시에 영상의 중앙 영역을 포함하여 통계 검정을 이용함으로써 복제 여부를 판단한다. 실험 결과, 제안하는 방법은 이전 방법에 비해 순위 표본 프레임의 정확도가 유사하면서 선택된 순위 표본 프레임 수가 약 61% 가량 적게 추출하여 특징 정보에 저장되는 메모리 양을 절약할 수 있었다. 또한 영상의 화질 열화, 대비 변형, 확대 및 축소, 화면비 변환, 자막 삽입 등 다양한 공간적 변형에도 포괄적으로 복제 여부를 판단할 수 있음을 실험을 통해 확인하였다.

DVB-T2기반으로 지상파 UHDTV방송과 직접수신환경 구축 연구 (A Study on Terrestrial UHDTV Broadcasting and Construction of Direct Reception Environment by DVB-T2)

  • 박성규;조영준;김동우;박구만
    • 방송공학회논문지
    • /
    • 제18권4호
    • /
    • pp.572-588
    • /
    • 2013
  • 본 논문에서는 지상파방송 무선전송 환경에서 4K-UHDTV 혹은 8K-UHDTV 및 UHD-3DTV 등 차세대방송 구현 및 효과적인 수신환경 구축 가능성을 현재 상용화된 전송방식 중 DVB-T2 기술을 중심으로 제안하였다. 특히, 2012년 완료된 지상파방송 디지털전환에 이어 또다시 UHDTV방송을 위한 차세대방송 투자와 전환의 성공조건으로 초고화질 영상 전송 외에도 TV뿐만 아니라 개인형 멀티미디어 단말기에서도 수신이 가능한 직접수신과 실내수신 및 언제 어디서나 자유로운 수신환경 제공도 매우 중요함을 강조하고 있다. 본 논문에서는 UHDTV방송 구현 시 효율적인 주파수 활용과 효과적인 수신환경 구축방안을 찾는데 목적을 두고 있다. 아울러 DVB-T2 전송방식이 가지고 있는 SFN 기능 및 강력한 수신오류정정 능력을 이용하여 VHF대역과 UHF대역 등 2개의 서로 다른 주파수에 의한 SFN 송출망 구성 방법을 제시하고, SFN 소출력중계기 및 가정용 Gap Filler를 활용한 자유로운 무선수신환경 구축 방안을 제안하고 있다. 그 외 10MHz 폭 채널을 이용한 UHDTV방송 효과와 주파수 소요량을 제시한다.

영상 품질 및 전송효율 최적화를 위한 심층신경망 기반 영상전송기법 (Video Transmission Technique based on Deep Neural Networks for Optimizing Image Quality and Transmission Efficiency)

  • 이종만;김기훈;박현;최증원;김경우;배성호
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.609-619
    • /
    • 2020
  • 고품질 비디오 스트리밍 요구에 따라 제한된 대역폭에서 높은 전송률이 필요하고, 트래픽 혼재 상황이 더 발생한다. 특히 실시간 영상 서비스를 제공 시 패킷 손실 및 비트 오류 확률이 더 크게 증가한다. 이러한 문제를 해결하기 위해 실시간 서비스 품질향상을 위한 방법으로 FEC 기술의 한 종류인 랩터 코드가 어플리케이션 영역에서 활발히 사용되고 있다. 본 논문에서는 랩터 코드를 활용하여 유사한 수준의 화질에서 전송 효율을 높이기 위한 다양한 심층 신경망(Deep Neural Network, DNN) 기반 영상전송 파라미터를 결정하는 방법을 제안한다. 제안된 신경망은 패킷 손실율(Packet Loss Rate), 비디오 인코딩 속도 및 전송속도를 입력으로 사용하고 랩터 FEC 파라미터와 패킷 크기를 출력으로 한다. 제안한 방법은 기존 멀티미디어 전송 기법과 유사한 수준의 PSNR(Peak Signal-to-Noise Ratio)에서 전송 효율을 최적화하여 평균 1.2% 높은 스루풋(throughput)을 보였다.

T-DMB 하이브리드 데이터 서비스 Part 1: 하이브리드 BIFS 기술 (T-DMB Hybrid Data Service Part 1: Hybrid BIFS Technology)

  • 임영권;김규헌;정제창
    • 방송공학회논문지
    • /
    • 제16권2호
    • /
    • pp.350-359
    • /
    • 2011
  • 1990년대 이후 방송 기술의 눈부신 발전은 고선명 방송 서비스의 도입으로 가정에서의 고화질 방송 서비스 제공을 가능하게 하였을 뿐만 아니라, 이동 방송 서비스의 등장으로 고속으로 이동하는 차량에서도 방송 서비스를 즐길 수 있도록 하였다. Terrestrial Digital Multimedia Broadcasting (T-DMB) 기술은 이동 방송 서비스 제공을 위해 개발된 기술 중 성공적으로 상용화된 기술 중 하나이다. 고속 이동체에서의 안정적인 방송 수신 기능 외에 T-DMB의 기술적 혁신 중 주목할 만한 것으로는 MPEG-4 표준에 기반 한 시스템 프레임워크를 들 수 있다. 이는 장면 기술(Scene Description) 및 그래픽 객체 표현 언어인 Binary Format for Scene (BIFS)와 객체(object) 개념의 멀티미디어 구성 요소 표현 방식인 Object Descriptor (OD) 프레임워크를 통해 대화형 데이터 서비스를 제공할 수 있다. 그런데, T-DMB 대화형 데이터 서비스에는 두 가지 근본적인 제약 사항이 존재한다. 첫 번째 제약 사항은 대화형 서비스를 위한 그래픽 데이터는 비디오 화면을 벗어날 수 없어 항상 비디오 화면 위에 중첩되어 표현되어야 한다는 것이다. 두 번째 제약 사항은 양방향 서비스를 위한 데이터는 항상 방송망을 통해서만 전송되어야 한다는 것이다. 이러한 제약 사항은 단말의 위치 정보나 사용자의 특성 정보를 반영한 개인 맞춤형 서비스 제공의 제약조건이 되고 있다. 본 논문에서는 이러한 제약 사항을 극복하기 위해 기존방송망 및 무선 인터넷 망을 통해 각각 전송되는 장면 기술 정보 뿐만 아니라, 단말의 저장 장치에 저장된 장면 기술 정보를 활용하는 T-DMB 하이브리드 데이터 서비스 방식을 제안하고 기존 T-DMB 데이터 서비스와의 역호환성을 보장하는 하이브리드 BIFS 기술을 제안한다.

T-DMB/AT-DMB 서비스를 위한 부호화 모드 제한을 갖는 공간 확장성 부호기의 성능 비교 (A Performance Comparison of Spatial Scalable Encoders with the Constrained Coding Modes for T-DMB/AT-DMB Services)

  • 김진수;박종갑;김규석;최성진;서광덕;김재곤
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.501-515
    • /
    • 2008
  • 최근에 고품질 이동 멀티미디어 서비스에 대한 사용자의 요구가 증대되고, 계층 변조 전송 기법을 통하여 추가적인 전송 대역폭을 확보할 수 있게 됨에 따라 스케일러블 비디오 부호화(Scalable Video Coding)를 이용하여 기존의 T-DMB(Terrestrial DMB)의 화질을 개선한 고품질 지상파 DMB(Advanced Terrestrial DMB) 서비스를 제공하기 위한 연구가 활발히 진행되고 있다. 그러나 T-DMB와 AT-DMB의 호환적인 서비스를 지원하는 SVC 계층 부호기는 매우 복잡한 구조를 갖게 되므로, 조기 서비스 도입을 위하여 부호기의 복잡도 감소에 대한 연구가 요구된다. 본 논문에서는 기존의 T-DMB와 호환성을 갖는 공간 확장성 SVC 부호기에서 매크로블록 계층의 부호화 모드 제한을 통한 고속 부호화 모드 결정 기법을 제안한다. 제안된 기법은 매크로블록 계층의 부호화 모드 결정 함수의 구조 분석을 통한 기저 계층과 향상 계층, 그리고 계층 간에 사용되는 부호화 모드의 통계적 특성에 기초한다. 모의실험을 통하여, 제안된 기법이 우수한 성능을 유지하면서, 수행시간을 크게 단축시킬 수 있는 호환적인 부호기를 얻을 수 있음을 보인다.

에듀테인먼트 기반의 어린이 웹사이트 디자인에 관한 연구 (A Study on the Optimization of Edutainment Website design For Juvenile Users)

  • 손은미;임은정;이현주
    • 디자인학연구
    • /
    • 제15권1호
    • /
    • pp.143-152
    • /
    • 2002
  • 인터넷이 보편직인 일상의 도구로 자리잡으면서, 그 이용자의 수도 급격하게 증가하고 있다. 특히 초등학생의 인터넷 이용률의 급심장을 주목할 필요가 있다. 이들은 태어나면서부터 자연스럽게 인터넷을 접하게 된 세대로 앞으로 대두될 새로운 미디어 시대를 이끌어 나갈 주역이다. 또한 이들은 미래의 인터넷의 발전과 변화를 주도할 수 있다는 잠재력을 가지고 있는 세대이기도 하다. 현재 국내에서는 이러한 어린이를 위한 웹사이트에 대한 투자가 미흡하지만, 그 관심도가 높아지는 만큼 인터넷 시장을 주도할 새로운 영역으로 자리 잡아가고 있다. 이러한 관점에서 지금까지의 단순 학습 전달 목적의 사이트 개발보다는 보다는, 흥미 있는 요소를 통해 자연스럽게 학습환경에 몰두할 수 있도록 도와주는 에듀테인먼트 사이트의 개발이 요구된다. 어린이의 인지적인 특성을 고려하여 사이트를 설계함과 동시에, 디자인, 공학, 아동학 등의 다양한 학문 분야들 간의 학제적 접근이 필요하다. 뿐만 아니라 학습자가 보다 쉽게 정보를 인지하고 수용할 수 있는 인터페이스의 설계가 필요하며 이를 위해서는 일관성 있는 레이아웃과 아동의 감성을 고려한 색상과 배색, 내용의 조직화와 더불어, 멀티미디어 요소를 적극 활용하여 학습으로 연결해야 한다. 또한 어린이 스스로가 직접 제어하며 사고하도록 유도하는 상호작용을 통해 학습 효과를 높이고 학습의 참여도와 상상력, 사고력도 더욱 향상시킬 수가 있을 것이다. 어린이 웹사이트가 가진 잠재력을 최대한 발휘하기 위해서는 이러한 시도 외에도 기술적인 지원과 적극적인 투자가 필요하며, 동시에 어린이의 사용성 평가를 통한 관련 연구들의 선행이 필수적이다.

  • PDF

사용자 적응적 방송 수신을 위한 사용자 선호도 정보구조와 프로그램 정보구조의 설계 및 응용 (Design and Application of User Preference Information Structure and Program Information Structure)

  • 윤경로;이진수;이희연
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.94-101
    • /
    • 2000
  • 사용자 적응적 방송 수신이란 많은 방송 채널들이 존재 할 때, 사용자의 선호도에 따라, 관심이 있을 만한 프로그램들 또는 사용자가 지정한 특정한 프로그램만을 전자 프로그램 가이드의 형태로 보여주어 원하는 방송을 쉽게 선택, 시청할 수 있도록 하여 주는 필터링 기능, 짧은 시간에 긴 프로그램을 요약하여 보고자 할 때 사용자의 선호도에 따라 맞춤형 요약을 제공하는 브라우징 기능 등을 포함한다. 또한 디지털 저장 장치를 포함 할 때, 사용자의 시청 습관에 따라 자동으로 사용자 취향의 프로그램을 녹화하여 녹화된 프로그램을 수신중인 프로그램들과 함께 필터링/브라우징 기능을 제공 할 수 있다. 이러한 사용자 적응적 방송 수신을 위하여 몇 가지 기초적인 데이터를 필요로 하게 되는데 크게 사용자 선호도 정보와 프로그램 정보로 나뉘어 질 수 있다. TV Anytime forum은 사용자 적응적 방송수신을 위한 표준 작업으로 사용자가 원하는 프로그램을 원하는 시간에 원하는 방식으로 시청할 수 있도록 하여 주는 것을 그 목표로 하고 있으며 MPEG-7은 이러한 방송 수신을 위한 내용 정보 뿐만 아니라 멀티미디어 프로그램에 대한 많은 내용 정보 구조들을 포함한다. 이 논문에서는 MPEG-7과 TV Anytime forum의 연관성을 알아보고, 사용자 적응적 방송 수신을 위하여 필요한 데이터 구조를 설계하였다. 추가로 설계된 사용자 적응적 방송 수신을 위한 데이터 구조와 MPEG-7 기술 구조의 관계와 그 이용 방법을 알아본다.

  • PDF

채널 기반에서 객체 기반의 오디오 콘텐츠로의 변환을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법 (Non-uniform Linear Microphone Array Based Source Separation for Conversion from Channel-based to Object-based Audio Content)

  • 전찬준;김홍국
    • 방송공학회논문지
    • /
    • 제21권2호
    • /
    • pp.169-179
    • /
    • 2016
  • 오늘날 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화기로 MPEG-H에 대한 표준화가 진행되고 있다. 향후 방송용 오디오 콘텐츠는 채널 기반 오디오 콘텐츠에서 진화하여 객체 기반 오디오 콘텐츠까지도 포함하게 될 예정이다. 이에 따라, 채널 기반 오디오 콘텐츠의 객체 기반 오디오 콘텐츠로의 유기적인 변환이 필요한 실정이다. 본 논문에서는 이러한 유기적인 변환을 실현 가능하게 할 수 있는 비균등 선형 마이크로폰 어레이 기반의 음원분리 기법을 제안한다. 제안된 기법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 분석된 시간차에 따라 주파수별로 특정 방위각에 위치한 입력 오디오 신호의 spectral magnitude를 예측한다. 이후, azimuth와 width 파라메타를 조정함으로써 객체 오디오 생성을 위한 음원을 분리한다. 제안된 음원분리 기법의 성능을 평가하기 위하여 객관적 음원분리 지표 및 분리정확도를 측정하였고, 최소 분산 무손실 응답 빔형성기와 독립 성분 분석 기법 등 기존 음원분리 기법과의 그 성능을 비교하였다. 비교 결과, 제안된 기법이 기존 음원분리 기법들에 비하여 우수한 음원분리 성능을 보이는 것을 알 수 있었다.

웹에서의 감성디자인이 브랜드태도에 미치는 효과와 영향요인 분석 - 패스트푸드 사이트를 중심으로 - (Analysis of the key Factors that Influence Emotional Web Design and its Effects on Brand Attitude - focus on Fastfood WebSites -)

  • 윤다연;이현주
    • 디자인학연구
    • /
    • 제17권1호
    • /
    • pp.153-162
    • /
    • 2004
  • 본 논문은 웹을 멀티미디어시대의 쌍방향 마케팅 미디어로서 재인식하고, 웹에서 감성디자인이 브랜든 태도에 미치는 긍정적 효과를 검증하고자 하였으며, 사용자의 감성에 호소하는 영향요인을 분석하고자 하였다. 본 연구는 1차. 2차의 사용자 조사를 중심으로 진행되었으며, 웹에서의 감성디자인에 대한 기초연구로써 사용자가 웹에서 느낄 수 있는 감성을 감성공학에서의 감성분류와 선행논문에서의 사용자 인터랙션 분류에 기초하여 기능적. 심리적. 감각적. 관계적. 문화적 감성 5가지로 그 유형을 정리하였다. 이중 디자인과 관련이 있는 기능적. 감각적. 심리적 감성요인을 만족시키는 감성디자인이 브랜드태도에 미치는 효과를 검증하기 위하여 1차로 국내 7개 패스트푸드 사이트를 대상으로 온라인 조사를 실시하였다. 1차 조사에서는 웹사이트에서 사용자 감성만족이 \circled1브랜드 선호도와 신뢰도 상승과 \circled2브랜드 이미지 제고 \circled3구매욕구 발생에 직접적인 영향요인으로 작용하는가를 중점적으로 조사하였다. 이 조사의 분석결과를 토대로 2차 조사(FGI)를 실시하였으며, 사용자 심층 인터뷰를 통해 \circled1사용자가 패스트푸드 사이트에서 원하는 주요 감성 \circled2 사용자가 강한 감성적 어필을 느끼는 디자인유형 \circled3감각적 감성에 영향을 미치는 디자인요소에 등에 대해 분석하였다.

  • PDF