Proceedings of the Korean Society of Broadcast Engineers Conference (한국방송∙미디어공학회:학술대회논문집)
The Korean Institute of Broadcast and Media Engineers
- Semi Annual
Domain
- Media/Communication/Library&Information > Media/Consumers
2011.07a
-
얼굴의 각도와 위치는 많은 정보를 포함하고 있어 다양한 분야에서 응용이 가능하다. 본 논문에서는 하나의 2 차원 영상만으로 사람 얼굴의 3 차원 각도와 위치를 파악하는 시스템을 제안한다. 얼굴 특징 점 검출 기술, 포즈 판정 기술, 오류 안정화 기술 등을 단계별로 설명하며, 비디오 데이터베이스를 통한 실험으로 시스템의 성능을 분석하였다. 오류는 5 도 안팎의 적은 수치이며 개인용 컴퓨터에서 실시간 수행이 가능하다.
-
수화는 몸 동작 또는 손가락의 움직임을 통하여 상호 커뮤니케이션을 하는 하나의 언어이며, 이 언어의 디지탈 미디어로의 소통을 위해서는 동작을 하나의 의미 있는 단어, 음절로의 표현이 가능해야 한다. 여기서는 몸 동작, 팔 다리의 움직임 보다는 손가락의 움직임에 초점을 맞추어 지문자 인식에 필요한 센서 시스템에 대하여 고찰한다. 우선 연속적인 지문자, 지숫자의 입력을 인식하기 위해서는 각 문자 절음 인식이 가장 중요한 문제가 된다. 절음 위치를 인식하는 것은 현재 입력된 패턴과 다음 패턴을 구분지어 각각 다른 지문자 혹은 지숫자로 인식할 수 있게 하는 기반이 된다. 손가락 구부러짐의 구분 및 인식을 위한 방법의 개발을 위해, 언어별 수화의 특징 분석을 토대로 다양한 적용 가능한 센서를 탐색하고 수화 장갑을 위한 원천기술을 개발, 수화 장갑 프로토타입을 제작하였다.
-
본 논문에서는 지역적 학습 방법을 활용하는 Average Neighborhood Margin Maximization(ANMM)에 기반하여 피부색과 비피부색 영역을 분리하는 이진 분류의 통계적 접근법을 제안한다. Fisher Linear Discriminant(FLD)와 Average Neighborhood Margin Maximization(ANMM)의 피부색과 비피부색 클래스 내 분산 대비 클래스 간 분산의 비교를 통해 두 클래스 간 분리력 변화를 확인한다. 교사(Supervised) 이진 분류문제에 대하여 Small sample size(SSS) 문제, 가우시안 분포 가정의 문제, 최대 추출 가능 특징 수 제한 문제 등을 해결함과 동시에, 지역적 특성 학습 방법의 도입을 통해 피부색과 비피부색 간 분리력을 향상시킨다.
-
컬러는 영상처리 분야에서 중요한 단서로 사용될 수 있는 정보이다. 하지만 실제로 촬영한 영상의 경우에는 빛과 카메라 특성 등 다양한 요소들의 영향으로 인해 이미지 간 컬러 정보의 불일치가 빈번히 일어난다. 따라서 컬러가 다른 여러 장의 영상을 입력 영상으로 사용하는 경우, 입력 영상간 컬러를 동일하게 맞춰 주어야 한다. 이를 수행함에 있어서, 어떠한 이미지를 레퍼런스 이미지로 결정할 것인가는 매우 중요한 문제이다. 이에 본 논문에서는, 히스토그램 등화(histogram equalization) 기법을 이용하여 입력 이미지들의 비용을 결정해줌으로써, 레퍼런스 이미지를 결정하는 방법을 제시한다. 스테레오 매칭을 통해 다양한 밝기의 입력 영상에서 가장 좋은 결과를 얻을 수 있는 레퍼런스 이미지를 결정할 수 있음을 보였다.
-
양방향 필터 (Bilateral filter)는 에지 보전 평활화 필터로써 디노이징, 반사 제거, 스테레오 매칭 등 다양한 분야에서 사용되고 있다. 이는 기존의 가우시안 필터에 사용되는 공간 도메인 커널 (spatial kernel)이외에 강도 도메인 커널 (range kernel)을 추가로 사용하여 비슷한 강도의 픽셀에 높은 가중치를 부여함으로써 에지를 보전하면서 평활화를 한다. 또한 양방향 필터는 비등방성 확산 필터 (Anisotropic diffusion filter)와 달리 항상 수렴을 보장한다. 따라서 본 논문에서는 고정점 반복 이론을 적용하여 양방향 필터의 수렴을 수학적으로 증명한다.
-
본 논문은 TFT-LCD 디스플레이를 위한 저전력 화질 개선 기법을 제안한다. 제안하는 기법에서는 TFT-LCD 디스플레이의 어두워진 백라이트를 보상하기 위한 기법을 히스토그램 균등화에 기반하여 유도하며, 밝기 보상으로 인하여 손실되는 정보량이 최소가 되게 하는 변환 함수를 구한다. 컴퓨터 모의실험을 통해 제안하는 알고리듬이 전력 소비를 줄이는 동시에 영상의 화질을 개선하는 것을 확인한다.
-
온라인을 통한 이미지 공유는 사용자들이 활발하게 이용하고 있는 분야 중 하나이다. 사용자의 활발한 참여로 거대해진 이미지 데이터 베이스 내에서 효율적으로 이미지 검색을 수행하기 위해서는 이미지를 정확하기 표현하고 있는 태그의 존재가 매우 중요하다. 하지만, 최근 이미지에 등록 태그 중에서 상당 부분이 이미지와는 직접 관련이 없는 노이즈 태그라는 조사결과는 노이즈 태그로 인해서 이미지 검색의 정확성이 저하될 수 있다는 가능성을 암시한다. 그래서 노이즈 태그를 효과적으로 구분하기 위해서는 태그의 종류에 적합한 태그 정제 기술을 도입할 필요가 있다. 본 연구는 이를 위해서 이미지의 시각적 유사도에 기반한 Visually weighted neighbor voting 방법을 제안했다. 이를 통해서 이미지와 태그 사이의 관련성을 효과적으로 측정할 수 있었다. 그리고 기존 기술보다 안정적으로 노이즈 태그를 구분할 수 있음을 실험을 통해서 증명하였다.
-
디지털 홀로그램은 일반적으로 computer generated hologram(CGH)기법에 의해서 생성된다. 하지만 원리적으로 CGH 기법은 많은 연산량과 복잡도를 요구하고 있기 때문에 실시간으로 디지털 홀로그램을 생성하는 것은 매우 어렵다. 본 논문에서는 CGH 고속연산을 위해 graphics processing unit(GPU)의 병렬처리구조인 CUDA를 사용하였고, 추가적으로 다중 GPU 연산처리를 위해 OpenMP를 사용하였다. 더 나아가 이를 최적화하기 위해서 상수화, 벡터화, 루프풀기 등의 기법들을 제안한다. 결과적으로, 본 논문에서 제안된 기법을 통해서 기존 CPU에서의 CGH 연산속도에 비해 약 8,300배 정도의 속도를 개선할 수 있었다.
-
본 논문에서는 3차원 디스플레이 시스템에서 다수의 중간 시점 영상을 실시간으로 생성할 수 있도록 GPU 기반의 고속 영상 합성기법을 제안하였으며 그에 대한 성능을 알아본다. 카메라의 기하 정보 및 참조 영상들의 깊이 정보를 이용하여 중간 시점 영상을 생성하였으며, 영상 합성 방법을 GPU에서 병렬 처리함으로써 고속화할 수 있었다. GPU를 효율적으로 다루기 위해 NVIDIA사의 CUDA(Compute Unified Device Architecture)
$^TM$ 를 이용하였다. 제안한 기법은 CUDA의 SIMD(Single Instruction MUltiple Data) 구조를 사용하여 중간 영상 합성을 처리할 수 있도록 설계하였다. 본 논문은 고속 영상 합성에 중점을 두었고, 제안한 고속화 기법의 결과를 분석함으로써 다시점 3차원 디스플레이 시스템의 적용 가능성을 알아본다. -
본 논문에서는 이미지 블록의 평균 픽셀 값 특성을 양자화 인덱스 변조 기법에 적용하여 이미지 포맷변환에 강인한 정보은닉 기법을 제안한다. 포맷변환에 강인한 이미지 속성은 정규화된 픽셀 히스토그램에 기반하여 분석되며, 그 중 평균 픽셀 값을 통해 정보은닉 알고리즘이 구성된다. 평균 픽셀 값을 양자화 인덱스 변조기법에 적용하기 위한 방안으로 DCT 계수를 정규화 하는 방법이 선택되며, 추출 성공률을 높이기 위해 오류정정부호가 사용된다. 따라서 본 논문의 알고리즘을 통해 결합 이미지가 압축, 사이즈 변화 등의 과정을 거치게 될 경우 발생하는 문제점을 극복할 수 있다.
-
본 논문에서는 특이값 분해(Singular Value Decomposition)을 이용하여 이미지의 주파수 영역 내에 정보를 은닉하는 방법을 제시한다. 이미지를 주파수 영역으로 변환하기 위하여 블록 단위로 이산 코사인 변환(Discrete Cosine Transform)을 수행한다. 이후 인접한 네 블록의 DC 값들로 구성된 행렬의 특이값을 은닉하고자 하는 정보에 따라 변환한다. 원래의 DC 값은 정보에 따라 변환된 DC 값으로 대체되고 역 이산 코사인 변환(Inverse Discrete Cosine Transform)을 수행하여 정보가 은닉된 이미지를 얻는다. 제안하는 알고리즘의 성능을 분석하기 위해 JPEG(Joint Photographic Coding Experts Group), 선명화(Sharpening), 히스토그램 등화(Histogram Equalization)와 같이 다양한 이미지 변화를 거친 후, 은닉된 정보의 신뢰도를 비교한다.
-
본 논문에서는 2D-3D 변환 후, 입체감 수정에 관련한 피드백 시스템과 그에 맞게 적용되는 적응적 관계식을 제안한다. 2D-3D 변환을 통해 우선 깊이 영상을 생성하고 이를 이용하여 깊이 영상 기반 렌더링(DIBR)을 통해 수평방향의 이동을 계산하여 좌영상과 우영상을 생성한다. 그러나 깊이 정보 기반 렌더링 후 사용자 선호에 따라 입체감을 수정할 필요가 있을 때 깊이 영상을 재생성 해야 하는 문제점이 발생하며 이를 극복하고자 피드백 시스템을 통한 두 개의 조절 파라메터를 소개 한다. 즉, 'Pull-in'혹은 'Push-away'의 입체감을 조절 할 수 있는 시차 이동식을 제안한다.
-
최근 3DTV 의 급격한 활성화로 스테레오 영상 콘텐츠 제작이 크게 증가하고 있다. 스테레오 영상은 일반 2D 영상과 달리 깊이(depth)가 존재하므로 자막과 같은 그래픽의 삽입에서 그 깊이를 반드시 고려해야 한다. 또한 시각피로를 줄이기 위해 스테레오 촬영 시 영상의 변이맵(disparity map)을 실시간 관찰할 필요성도 요구되고 있다. 본 논문에서는 최신의 그래픽 하드웨어를 이용하여 듀얼스트림 HD 영상을 실시간으로 스테레오 정합하는 방법을 제안한다.
-
본 논문에서는 깊이 영상의 해상도와 품질을 향상시키는 방법을 제안한다. 일반적으로 2D-plus-Depth 구조의 3D 콘텐츠에서는 깊이 영상의 품질이 매우 중요하다. 최근 들어 Time-of-Flight (TOF) 방식의 깊이 센서가 깊이 영상 획득에 많이 사용되고 있는데 TOF 깊이 센서가 제공하는 깊이 영상은 저해상도이기 때문에 고해상도 3D 콘텐츠를 제작하기 위해서는 깊이 영상의 해상도를 상향 변환하는 것이 필수적이다. 또한 고품질의 깊이 영상을 얻기 위해서는 물체 간의 경계를 정교하게 보존하는 것이 중요하다. 최근에는 깊이 영상의 해상도 상향 변환을 위해서 Joint Bilateral Upsampling(JBU) 방식이 많이 사용되고 있다. 본 논문은 깊이 영상의 해상도를 높임에 있어서 우선 보간법을 수행하여 영상의 상향 변환 시에 생긴 빈 홀들의 값을 채워준 후 Bilateral Filtering을 수행함으로써 성능을 높인다. 일반적으로 영상을 상향 변환을 할 때 다양한 방법들이 있는데 본 논문에서는 Nearest Neighborhood(NN), Gaussian과 경계 보존 보간법, 경계 보존 보간법과 Fast Curvature Based Interpolation(FCBI)를 결합한 보간법을 사용하였다. 실험 결과 제안 방법이 기존 방법보다 우수한 성능을 가짐을 보여준다. 또한 경계 보존 보간법과 FCBI를 결합한 보간법을 이용해서 상향 변환을 수행한 결과가 다른 보간법들에 의한 결과보다 우수하다는 점을 알 수 있다.
-
3차원 영상과 더불어 스테레오 영상의 관심이 늘어남에 따라 좌, 우 영상의 매칭을 통해 변이를 추정하는 연구가 활발하게 진행되고 있다. 본 논문에서는 변이 추정을 위해 많이 사용되는 영역 기반(Block-based)의 전체 탐색 알고리즘보다 효율적이고 계산량이 적은 변이 추정을 할 수 있도록 변이 탐색 범위를 제공해주는 방법을 제안한다. 제안되는 알고리즘은 해리스 코너 포인트 검출기를 이용하여 좌, 우 영상 각각의 특징 점을 추출한 후, 특징 점의 정보를 이용하여 스테레오 매칭을 한다. 스테레오 매칭 시 이를 히스토그램화 하여 좌, 우 영상의 변이 추정을 위한 탐색 범위를 제공한다.
-
최근 진행되고 있는 미디어 융합 환경에서 가장 주목 받고 있는 서비스는 N-스크린 서비스라고 할 수 있다. N-Screen 서비스가 무선 환경뿐만 아니라 이동환경에서도 안정적으로 제공되기 위해서 필요한 핵심 요소기술은 클라우드 컴퓨팅 기술일 것이다. 최근에는 통신 사업자를 비롯한 가전 제조사, 인터넷 및 플랫폼 사업자들이 각자의 강점을 살려서 다양한 클라우드 컴퓨팅 기반의 N-스크린 서비스를 제공하기 시작했고 핵심 서비스로 발전시켜 나가고 있다. 본 논문에서는 클라우드 컴퓨팅과 N-스크린의 관계, 주요사업자들의 서비스 현황 및 발전에 필요한 기술적 요구사항에 대해 알아보겠다.
-
지상파 디지털방송 표준인 미국의 ATSC 서비스가 진화를 하고 있다. 2006년 한국방송협회는 독일 월드컵 방송당시 지상파 다채널방송인 MMS(Multi-Mode-Service) 시험방송을 실시하였다. MMS 시험방송은 화질열화 및 수신기 오동작 논란으로 중단되었고 KBS는 2009년부터 다채널이 가능한 코리아뷰(Korea-View) 방송을 준비하고 있다. 코리아뷰의 압축방식은 MPEG-2와 MPEG-4를 혼합한 방식으로 미국의 모바일방송 표준(A/153)과 동일한 방식이다. 이번 논문에서는 MMS, 코리아 뷰의 지상파 다채널방송 서비스에 대한 기술적 특징과 차이를 분석하고 향후 서비스 도입에 따른 정책적 방향을 제시하였다.
-
최근 3D 입체영상이 핫 이슈로 떠오르면서 관련 업계에서는 여세를 몰아 제품 개발이나 마케팅에 총력을 기울이고 있으며 방송, 영화, 게임 등에 접목하여 차세대 핵심 산업을 견인하고 있다. 특히, Post-HDTV 이후 3DTV 방송은 국내외 표준화 단체를 중심`으로 표준화 및 다양한 3DTV 실험방송 서비스가 활발히 진행되고 있다. 이를 반영하듯, 케이블 및 위성 매체기반의 상용 3DTV 방송이 서비스 중에 있으며 이를 점차 지상파에도 적용하기 위하여 각 지역 방송표준단체는 타 표준단체들과 공조를 통하여 표준화를 진행 중에 있다. 이에, 본 논문에서는 다양한 디지털방송 플랫폼에서 적용이 가능하며 종래의 디지털방송과 호환성을 유지하면서 3DTV 방송서비스를 제공하기 위한 시스템 및 시그널링 방식을 소개한다. 특히, 시그널링 부분은 지상파/케이블/위성 매체에서 스테레오스코픽 비디오를 서비스하기 위하여 공통적으로 적용되는 기술로서 국내에서는 TTA를 중심으로 현재 MPEG 국제 표준화에 참여 중에 있다.
-
본 논문에서는 초고선명 디지털 TV 를 위한 차세대 멀티채널 사운드 시스템의 최적의 라우드스피커 레이아웃을 도출하기 위해 다양한 라우드스피커 배치 환경에서 인지 관점의 오디오 음질 주관평가를 실시하였다. NHK 22.2 채널 시스템, ITU-R BS.775-2 표준의 7.1 채널 시스템과, 실감 음향에 가장 중요한 역할을 하는 Top Layer 라우드스피커에 중점을 두고 다양한 신규 레이아웃 구성들을 비교하였으며, 스튜디오에서 믹싱된 컨텐츠와 B-format 레코딩을 멀티채널로 생성한 컨텐츠를 이용하여 주관 평가를 실시하였다. 주관 평가 결과, Top Layer 에 3 개의 라우드스피커를 가지는 10.2 채널 라우드스피커 레이아웃이 평가에서 사용된 전체적인 오디오 음질의 등급에서 NHK 22.2 채널 시스템과 차이를 인지하기 어렵다는 결과를 도출하였다.
-
본 논문은 휴대폰 상에서 손(손가락) 동작을 이용한 가상 정보(객체)와의 자연스러운 상호작용을 제공하는 비전 기반 인터페이스를 제안한다. 이 인터페이스는 사용자가 한 손에 휴대폰을 들고 휴대폰의 카메라를 통해서 다른 손의 손바닥을 바라보는 상황을 가정한다. 사용자의 손바닥 위에 가상 객체가 증강되고, 사용자는 자신의 손과 손가락의 움직임을 통해서 가상 객체와 상호작용 할 수 있다. 제안하는 인터페이스는 사용자에게 친숙한 손동작 기반으로 동작하며 추가적인 센서나 마커를 요구하지 않기 때문에, 사용자는 별도의 훈련 과정 없이 원하는 시간과 장소에서 자유롭게 가상 객체와 상호작용 할 수 있다. 일부 시간이 많이 걸리는 처리 과정을 모바일 환경에 맞도록 최적화, 고속화함으로써, 제안하는 인터페이스는 상용화된 휴대폰(Galaxy S2)에서 5fps 로 동작한다.
-
본 논문에서는 모바일 증강현실을 실현하기 위한 3차원 모델기반 카메라 추적 기술을 제안한다. 3차원 모델기반 추적 기술은 평면적이지 않은 객체에 적용 가능하며, 특히 텍스처가 없는 환경에서 유용하다. 제안하는 방식은 대상 객체의 3차원 모델정보로부터 영상에서 추출한 에지와의 대응점을 찾고, 대응점의 거리를 최소화하는 카메라 움직임을 추정함으로써 이전 카메라 포즈(위치 및 방향)로부터 현재 포즈가 추적되는 방식이다. 안드로이드 플랫폼의 스마트폰 상에서 제안된 방식으로 카메라 포즈를 추적하고 3차원 가상 콘텐츠를 증강시켜 봄으로써 그 유용성을 확인한다.
-
본 논문에서는 비전 시스템을 기반으로 한 조명변화에 강인한 실시간 차선 검출 알고리즘을 제안한다. 카메라의 기하학적 특성을 이용하여 ROI 를 설정하고, ROI 내에서 검색범위를 설정하여 한 방향에 대한 차선을 검출하고 도로의 지형적 특성을 고려하여 반대편 차선을 추정한다. 히스토그램에서 상위 5%의 밝기 값을 가지는 픽셀에 대해서 이진화를 진행함으로써 일반적인 조명변화에 대해서 강인한 모습을 보이며, ROI 및 검색 범위를 설정함으로써 기존 알고리즘에 비해 빠른 검출이 가능해진 알고리즘이다.
-
최근 IT 기술이 융합된 지능형 자동차 기술에 대한 관심이 높아짐에 따라 이에 대한 연구가 활발히 진행되고 있다. 차선 검출은 지능형 자동차의 주요 과제인 첨단 안전자동차 기술의 핵심적인 부분으로 국내외에서 다양한 방법들에 대한 연구가 진행되었다. 차량의 안전을 향상시키기 위해서는 충분한 제동거리 확보가 가능한 거리까지 정확하고 빠른 차선 검출이 이루어져야 한다. 기존의 경계선 검출기법들은 조명 변화에 따라 그 성능의 변화가 크게 발생하였다. 이는 차선과 도로의 사이의 값의 차이가 조명 조건에 따라 변하기 때문이다. 따라서 본 논문에서는 영상 분석을 통하여 경계선을 판단하는 값을 조절함으로써 환경에 적응적인 경계선 추출 방법을 제안한다. 차량 주행 영상에서 제안한 방법과 기존의 경계선 검출 기법을 적용하여 성능을 비교한다.
-
최근 수년간 방송과 통신의 융합이 지속적으로 진행되고 있으며, 특히 홈 네트워크를 통한 방송 및 통신의 멀티미디어 콘텐츠의 공유 기기 시장이 비약적으로 성장하고 있다. 스마트폰을 비롯한 스마트 기기의 진보를 통하여 사진, 음악, 영상의 멀티미디어 콘텐츠에 대한 공유가 홈 네트워크 상에서 이루어 지고 있으며, 이러한 기술은 업계 표준으로 사용되고 있는 UPnP 및 DLNA에 기반하고 있다. 다만, 이러한 홈 네트워크 표준은 Peer-to-peer 네트워크를 근간으로 하고 있어 홈 네트워크 내에 복수의 서버가 있을 경우 사용자의 편의성이 상대적으로 약하다. 이에 본 논문은 홈 네트워크 내에서 콘텐츠 리스트를 통합 관리할 수 있는 Contents List Aggregation 서비스를 제안한다. 제안되는 서비스는 홈 네트워크 내의 미디어 서버들로부터 Contents List를 전송받아 통합된 형태로 저장 및 관리할 수 있으며, 기존 서비스와 호환성을 유지할 수 있다. 서비스의 제안과 함께 서비스를 지원하는 UPnP Device 및 Control Point의 서비스 시나리오, 그리고 서비스 연동에 대한 운용환경 및 사용예가 함께 제시되었다.
-
대형시스템의 배터리 관리 시스템은 일반적인 운영체제(Operation System)나 실시간 운영체제(Real Time Operation System)를 사용하여 배터리 관리 시스템을 하는 반면 휴대용 전자정보기기와 같은 소형시스템에서는 유한상태머신(Finite State Machine)을 이용한 배터리 관리 시스템을 사용한다. 이러한 대형시스템은 대부분 고성능을 요구하기 때문에 시스템을 유지하기 위해서는 막대한 비용이 들어간다. 이 결과로 상업적 제품의 가격적인 장점을 위하여 특화된 기능만을 지원하는 유한상태머신을 사용하는 배터리 관리 시스템을 많이 이용하고 있다. 최근에는 멀티미디어 기록 및 재생의 많은 전력소모를 요구하는 모바일 시스템이 많아지므로 콘텐츠 기반 배터리 관리 시스템 등 복잡한 배터리 관리 시스템을 소형기기에 적용하기 위하여 많은 연구가 진행되고 있다. 운영체제를 기반으로 하는 배터리 관리 시스템은 모바일 시스템에 사용하기에는 자체 전력소비가 많으며, 유한상태머신을 사용하는 배터리 관리 시스템은 다양한 요구와 복잡한 배터리 관리 시스템의 기능을 수용할 수 없다. 본 논문에서는 상기 두 가지 경우의 장점을 취한 이벤트 드리븐 프로그래밍(Event-Driven Programming) 방식을 사용하여 배터리 관리 시스템을 제안하고 제안된 시스템이 SBS(Smart Battery Data Specification v1.1)[1]를 만족할 수 있음을 보였다.
-
컴포넌트 기반 프로그램은 동시에 여러 컴포넌트간의 상호 협력에 의해서 동작한다. 여러 개의 컴포넌트 기반 프로그램을 기존의 순차적 분석 방법을 이용하여 컴포넌트의 동작을 분석해야 하기 때문에 시간이 많이 소요되고 매우 불편하다. 더욱이 컴포넌트의 수가 많아지면서 각 단계마다 각각의 컴포넌트의 동작을 모두 추적한다는 것은 매우 어렵다. 본 논문에서는 컴포넌트 기반으로 설계된 프로그램의 동작을 나타내는 시퀀스 다이어그램을 자동으로 생성할 수 있는 방법을 제안한다. 컴포넌트 기반 프로그램의 UML 시퀀스 다이어그램을 자동으로 생성하여 시각적으로 보여주어 개발의 편의성과 효율성을 증가시킨다.
-
본 논문에서는 사용자의 개인적 취향에 맞는 음악을 추천할 수 있는 사용자 감성/상황 정보 융합 기반의 협업 필터링의 확장을 이용한 음악추천시스템을 소개한다. 본 논문에서 제안하는 시스템은 확장된 협업 필터링 방식을 사용하여 추천을 해준다. 이를 위해 본 논문에서는 추천의 근거가 되는 감성과 무드를 Thayer 음악 무드 모델을 이용하여 총 12 가지의 감성 정보, 8 cluster 의 무드 정보로 분류했다. 또한 사용자의 상황 정보, 활동 & 날씨 & 시간에 대해서도 분류하였다. 분류된 정보는 음악감상 UI 를 이용하여 사용자 별 감성, 상황 그리고 음원의 무드 정보로 수집이 되었고, 수집된 정보를 기반으로 사용자 감성과 청취 곡 횟수를 퓨전하여 평가치 매트릭스를 만들었으며, 이를 바탕으로 단계적 협업 필터링에 의해 사용자 취향에 맞는 음악을 추천해 주는 방법이다.
-
This paper describes a single channel speech enhancement as the pre-processor of automatic speech recognition system. The improvements are based on using optimally modified log-spectra (OM-LSA) gain function with a non-causal a priori signal-to-noise ratio (SNR) estimation. Experimental results show that the proposed method gives better perceptual evaluation of speech quality score (PESQ) and lower log-spectral distance, and also better word accuracy. In the enhancement system, parameters was turned for automatic speech recognition.
-
In this paper, phrase boundaries in sentence are predicted and a phrase break information is applied to an HMM-based Korean Text-to-Speech synthesis system. Synthesis with phrase break information increases a naturalness of the synthetic speech and an understanding of sentences. To predict these phrase boundaries, context-dependent information like forward/backward POS(Part-of-Speech) of eojeol, a position of eojeol in a sentence, length of eojeol, and presence or absence of punctuation marks are used. The experimental results show that the naturalness of synthetic speech with phrase break information increases.
-
ATSC 지상파 디지털 방송시스템에서 부가데이터 전송을 통해 전송용량을 높이기 위한 연구가 진행 중에 있다. 이러한 방식 중의 하나로 계층변조를 이용한 방식이 많이 연구되고 있다. 계층변조 방식은 기존의 지상파 DTV 방송 신호에 확산대역 형태의 별도의 데이터를 워터마킹(watermarking)하여 전송하며, 추가적으로 전송되는 부가 데이터는 기존의 지상파 DTV의 수신에 영향을 주지 않아야 한다. 본 논문에서는 계층변조를 적용한 ATSC 시스템에서 계층변조의 전송용량에 따른 최대 전송 커버리지를 계산한다.
-
DVB-S2 표준안에서는 다양한 부호화율과 그에 따른 변조 방식을 제공한다. 그리고 비선형 영역에서 동작하기 위하여 특정 성상도를 갖는 고차 변조 방식을 사용한다. 본 논문은 LMS (Land-Mobile-Satellite) 채널 환경에서 DVB-S2 시스템의 수신 성능을 분석한다. 또한 비선형 HPA (Non-liniear High Power Amplifier) 모델을 적용하여 수신 성능도 제시한다. LMS 채널 모델로는 Log-normal, Rician, Rayleigh등 단일 채널 모델이 합성된 Hybrid 채널을 사용한다. 비선형 HPA 모델은 Saleh 모델을 사용한다. 그리고 각각의 채널 환경에서 8PSK, 16APSK, 32APSK 변조 방식에 따른 BER을 제시하고 그 성능을 제시한다.
-
본 논문에서는 WiMAX 의 신호세기(CINR: Carrier to Interference + Noise Ratio)의 변화와 예측 방법에 대해 연구한다. WiMAX 와 같은 무선 네트워크에서는 신호세기가 불규칙하게 변화하기 때문에 비디오 스트리밍시 에러나 지연이 발생할 수 있다. CINR 은 클라이언트 측의 가용 대역폭을 결정하는 중요한 요소이다. 하지만 기존의 RTCP(Real-time Transport Control Protocol)를 이용한 비트율 제어는 RTT(Round Trip time), PLR(Packet Loss Rate) 등의 정보를 사용하기 때문에 부정확하거나 지연이 발생될 수 있다. 이를 보완하기 위한 CINR 을 직접 비트율 제어에 사용하는 방법에 대해 연구하기에 앞서, 본 논문에서는 CINR 을 분석하고 미래의 값을 예측하는 방법에 대해 연구한다. 본 논문의 분석을 통해 CINR 의 예측을 비교적 정확하게 수행할 수 있다면 앞으로의 가용 대역폭을 비교적 정확하게 예측할 수 있고 효율적인 비디오 스트리밍 시스템을 제안할 수 있다.
-
최근 비디오 스트리밍과 대화형 비디오 서비스 등과 같은 광대역 멀티미디어 서비스를 지원하기 위하여 Wimax와 같은 4G 무선네트워크 시스템 기술이 발전해 왔다. 4G 무선네트워크의 OFDM(Orthogonal Frequency Division Multiplexing)과 MIMO(multi Input Multi Output)은 사용자들에게 매우 유연한 QoS(Quality of Service) 서비스를 제공해 줄 수 있다.[1] 이 논문에서는 다양한 네트워크 상황에서 멀티캐스트 그룹에게 효율적인 방법으로 통신 자원을 할당하기 위해 OFDM 방법을 사용 하였다. 이에 본 논문에서는 한 셀(cell) 내의 서로 다른 멀티캐스트의 그룹의 다른 SNR(Signal to noise Ratio)의 사용자 분포에 따른 적응적인 scalable 비디오 멀티캐스트 방식을 제안한다. 더 나은 수신율을 가진 사용자는 최적의 MCS(Modulation and Coding Scheme) 할당을 통해 서로 다른 화질의 scalable 비디오 계층 중 높은 해상도의 비디오를 받을 수 있다. 논문에서는 전체 전송률을 최적화 하는 대신 전송받은 전체 비디오의 평균 화질을 최적화하는 방법을 제안한다.
-
본 논문에서는 모바일 디바이스에서 영상 서비스와 같이 지연에 민감한 서비스를 이용할 때 적합한 절전 모드(psm) 파라미터를 제안한다. 휴대기기의 특성상 전력에 제한이 있는 모바일 디바이스라는 관점에서는 전력 소모가 중요한 문제인데 지연에 민감한 영상 서비스의 관점에서는 절전 모드에 동반되는 응답지연 또한 매우 중요한 문제이다. 따라서 영상 서비스와 같이 지연에 민감한 서비스를 이용할 때에 단순히 소비 전력을 최소화 하는 psm 을 적용해서는 응답지연이 늘어나게 된다. 그렇기 때문에 전력 소모와 응답지연의 trade-off 를 고려한 psm 를 적용하는 것이 필요한데 이를 위해 본 논문에서는 허용 지연에 따른 절전 모드 파라미터를 찾는 방법을 제안하고자 한다.
-
지상파DMB 방송 서비스는 기본적인 비디오 서비스뿐만 아니라 다양한 멀티미디어 방송 서비스를 제공하는 모습으로 발전하고 있다. 그러나 방송망이 가지는 제한된 대역폭으로 인하여 방송망을 통한 다양한 멀티미디어 방송 서비스를 제공하는 것이 어려운 실정이다. 최근 들어, 스마트 폰과 같은 스마트 단말기들의 등장으로 인하여 무선통신망을 통한 다양한 서비스를 제공하는 것이 용이해 졌다. 이러한 시점에서 지상파DMB 방송망과 무선통신망을 결합하는 새로운 방통융합형 서비스의 등장이 가능하게 되었다. 본 논문에서는 지상파DMB와 무선통신망을 포함하는 Hybrid 모바일 방송 시스템의 구성을 제안한다. 또한 이러한 시스템을 기반으로 제공 가능한 다양한 서비스 모델들을 제시한다.
-
최근 스마트폰에서 Wireless AP를 이용한 대형 쇼핑센터 또는 주차장에서의 실내 측위 어플리케이션들이 등장하고 있다. 하지만 이 어플리케이션들은 측정된 RSSI와 frequency를 이용한 Friis공식으로 거리 환산을 하여 삼각측량법으로 측위를 하게 되는데, 이 방법은 거리를 구함에 있어 오차가 심하여 실제 위치 측정이 Room level정도만 가능하다. 따라서 이에 대한 오차를 줄여 실시간으로 사용자의 위치를 파악하고 주변 정보와 최단거리 등을 알려주는 서비스가 앞으로 상당수의 쇼핑센터 또는 실내 놀이동산 등의 실내 문화공간에서 사용 될 수 있을 것으로 예측되므로 이에 대한 연구 필요성이 강조 되고 있다. 이에 본 논문은 장애물이 많은 실내에서의 위치기반 서비스에 있어 좀 더 정확한 위치정보 제공에 대한 제안 방안이다. 이를 위하여 여러 실험과 안드로이드 기반의 데모 프로그램 작성을 통하여 연구 개발 하였다.
-
초고속 인터넷 망이 보급되고 디지털 방송 서비스가 본격화됨에 따라 디지털 콘텐츠가 기하급수적으로 증가하였고, 댁내에서 멀티미디어 콘텐츠를 공유/재생할 수 있는 기기들이 다양화 되어지고, 스마트폰과 같은 개인용 모바일 기기의 사용이 보편화 되어짐에 따라 사용자는 멀티미디어 콘텐츠를 시청할 때 다양한 시청 환경 조건에 놓이게 되었다. 하지만, 사용자에게 제공되어지는 어플리케이션은 단말 및 특정 시청환경에 종속된 형태로 개발되어 지고 있고, 사용자의 단말 및 시청환경에 따라 서로 다른 수많은 어플리케이션이 개발되고 있다. 따라서, 사용자의 시청 환경을 고려하여 서로 다른 성능(Device Capability)을 가지는 기기들에 최적화된 사용자 인터페이스와 응용 프로그램을 제공하기 위한 홈 네트워크상에서의 상황인지형 스케일러블 데이터 서비스 기술 개발이 요구되어지고 있다. 이에, 본 논문에서는 하나의 어플리케이션 인터페이스를 통하여 수시로 변화하는 시청환경에 따라 사용자에게 최적의 어플리케이션을 제공할 수 있는 서비스 방법을 제안한다.
-
최근 유료 방송 서비스를 위한 제한수신 시스템의 적용에 있어 지적되었던 여러 문제들을 해결할 수 있는 DCAS(Downloadable Conditional Access System) 기술이 소개되었다. 또한, OpenCable과 DCAS를 기반으로 국내 디지털 케이블 방송 시스템을 위한 교환가능형 제한수신 시스템(eXchangeable CAS: XCAS) 표준이 재정되었다. 본 논문에서는 DCAS와 국내 XCAS 표준 규격을 기반으로 개발된 다운로드형 제한수신 시스템을 소개하고, 개발된 시스템의 성능 검증 결과를 제시하여 상용 유료방송 시스템에 적용하는 방안에 대해 논하고자 한다.
-
본 논문은 주파수 선택적인 MIMO 시스템에서 스트림간의 간섭을 효과적으로 제거하는 기법을 제안한다. 본 논문에서는 계산적으로 복잡도가 높은 리스트 검색 기법 대신에 채널 복호기에서 사용되는 사후 확률(a posteriori probability, APP)를 얻기 위해 반복적으로 스트림간 간섭을 제거하는 선형 이퀄라이저를 사용하였다. 반복회수가 증가할수록 이퀄라이저에 의해 채널은 점차 single input multiple output (SIMO) 형태의 채널에 가까워지고 MIMO 이퀄라이저의 최소평균제곱오차 (MMSE)에 가까워진다. HSPA UMTS standard를 따르는
$2{\times}2$ MIMO 시스템의 다운링크 통신 모의실험을 통해 제안된 기법이 기존의 수신 기법에 비해 상당한 성능이득을 얻을 수 있음을 확인할 수 있다. -
In real environment, background noise exists everywhere and degrades the performance of system. To reduce this distortion, a speech enhancement algorithm can be very useful and variety methods have been proposed. In this paper, we propose a postfilter to improve the performance of optimally modified log-spectral amplitude (OM-LSA) estimator. Proposed algorithm uses the formant postfilter to minimize perceptual distortion caused by background noise. We adjust an emphasizing parameter which is varied by spectral flatness and first reflection coefficient. The performance of the proposed algorithm is evaluated by measuring the log-spectral distance (LSD) and the perceptual evaluation of speech quality (PESQ) score. The test results show the improvement of proposed algorithm compared to conventional OM-LSA.
-
최근 다중 사용자 전송 기술에 관한 연구는 단일 사용자 MIMO 시스템에서의 선형적 용량증가가 다중 사용자 MIMO시스템에도 적용 될 수 있다는 것을 보여 주었다. 본 논문에서는 다중사용자 하향 채널에서 Vector Perturbation을 통해 성능 향상을 이끌어 내는 기법을 제안한다. 우리는 동시에 최대 다수의 사용자의 연결을 어느 정도 포기함으로써 서비스의 질(QoS)을 향상시키는데 중점을 두었다. 이렇게 희생한 사용자의 정보와 Perturbation 벡터를 적절히 이용하여 비트당에러율(BER)에서 큰 이득을 얻을 수 있었다. 모의 실험을 통해 Standard Vector Perturbation을 이용한 제안된 방법이 상당한 성능상 이득을 가져오는 것을 확인 할 수 있다.
-
본 논문은 3D-HDTV 지상파 방송을 위한 분산송신 기반 단일 주파수 방송망 내 송신안테나 위치에 따른 송신신호 전력분포를 분석하였다. 분산송신 기반 단일 주파수 방송망 구조는 하나의 주 송신안테나와 3개의 부 송신 안테나로 구성되어 있어 수신기가 방송망 내 어느 위치에 있더라도 최소 2개 이상의 송신신호를 수신할 수 있다. 이러한 방송망 구조는 송신 안테나들이 지역적으로 배치되어 있기 때문에 공간 다이버시티를 획득 할 수 있다. 그러나 거리에 따른 송신신호 전력 감쇠 때문에 방송망 내 수신기 위치에 따라 수신 SNR이 변화하게 된다. 시스템 시뮬레이션을 통해 제안된 단일 주파수 방송망 내 송신전력 분포 분석을 통하여 안정적인 데이터 수신율을 보장하기 위해 적용 가능한 데이터 송신기법에 대해 고찰하였다.
-
본 논문은 지상파 방송망 내 전계강도가 낮은 지역에 최소한의 데이터 전송률을 보장하기 위한 계층변조와 다중경로 채널 극복 및 수신 성능 향상을 위한 다중 안테나 수신기법을 SFN에 적용하여 제안하였다. 계층변조는 기존의 데이터 스트림에 부가적인 데이터 스트림을 삽입함에 따라 지상파 3D HDTV 방송 서비스는 더 많은 유효 전송률을 확보하고 고품질 비디오 서비스를 제공할 수 있었다. 그러나 기본 서비스의 품질을 유지하면서 부가적인 서비스의 품질을 보장하기 위한 대책이 필요하다. 그래서 송, 수신 안테나의 이득을 올리기 위해 다중 안테나 사용 방식을 채용하고, 그 수신 성능을 다중 안테나 위치에 따라 비교해 보았다. 그 결과, 수신 안테나가 한 쪽의 송신 안테나에 가까워질수록 실질적인 SNR이 증가하여 BER 성능이 향상되는 것을 확인하였다.
-
본 논문에서는 소스코딩에 활용되고 있는 LDPCA 부호를 가변 부호율을 얻는 채널코딩 목적으로써의 사용 가능성을 타진한다. 컴퓨터 성능 실험의 결과로 가변 부호율과 어느 정도의 BER 성능을 확인하였지만, 체크노드 머징기법이 여타의 LDPC 부호에 비해 성능을 크게 떨어뜨리는 것으로 나타났다. 향후 체크노드 머징이 가능하면서도 좀 더 개선된 성능을 가지는 LDPCA 를 설계하는 일이 중요할 것으로 생각된다.
-
Sparse한 신호 복원 방법으로 underdetemined system에서 l1-minimization을 이용한 compressive sensing의 연구와 함께, l1-minimization비해 간단한 greed 알고리듬도 활발히 연구되고 있다. 이에 본 논문은 greed 알고리듬의 대표적인 orthogonal matching pursuit기법에서 iteration 마다 support 선택 개수에 따른 성능을 연구한다. 모의 실험을 통해 OMP의 iteration 단계에서 하나의 support만 선택하는 것보다 다수의 support를 선택하는 것이 더 낮은 sparsity의 신호를 복원할 수 있고 더 낮은 계산량의 이득을 가져오는 것을 확인 할 수 있다.
-
A precoding strategy is one of the representative interference management techniques in cognitive radio (CR) network which is a typical interference-limited environment. The interference minimization approach to precoding is an appropriate scheme to mitigate the interference efficiently while it may cause the capacity loss of the desired channel. The precoding scheme for the maximal capacity of the desired channel improves the capacity of the desired channel while it increases the interference power and finally causes the capacity loss of the interfered users. Therefore, we propose a precoding scheme which satisfies these two conflicting goals and manages the interference signal in such an interference-limited environment. The proposed scheme consists of two steps. First, the precoder nulls out the largest singular value of the interference channel to mitigate the dominant interference signal based on the interference minimization approach. Second, the transmitter calculates the sum capacities per mode and selects a mode to maximize the sum capacity. In the second step, each mode consists of the right singular vectors corresponding to the singular values except the largest singular value eliminated in the first step. Simulation results show that the proposed precoding scheme not only efficiently mitigate the interference signal, but also has the best performance in terms of the sum capacity in a MIMO-based CR network.
-
최근 급격한 모바일 방송 시장의 변화로 인해 사용자 들이 다양하고 고화질의 방송 서비스에 대한 요구가 증대되고 있으며, 지상파 DMB 사업자들도 수익구조를 개선하기 위한 노력을 하고 있다. 이러한 요구와 노력에 맞춰 T-DMB와 역호환성을 유지 하면서 기존의 T-DMB와는 달리 계층변조 방식을 적용해 동일 주파수 내에서 채널의 용량을 증대시키는 AT-DMB 방송 기술을 개발 완료 하였다. AT-DMB의 채널 용량의 증대에 따라 서비스 채널을 늘리거나 SVC를 적용해 고화질 서비스 등 적용 가능한 서비스가 늘어남에 따라 사용자와 DMB 사업자들의 요구를 충족 시켜줄 수 있게 되었다. 이에 상용화 서비스에 앞서 실험방송을 위해 AT-DMB 송신 시스템을 구축하였다. 본 논문은 서론에서 AT-DMB의 배경, 본론에서 AT-DMB 송신 시스템에 대한 간략한 설명, 실험방송을 위해 구축된 송신 시스템 설명 및 예비 테스트 결과를 보여주고 결론을 맺는다.
-
3월11일 오후 2시46분경 일본 동북지역을 중심으로 M. 9.0 규모의 동일본대지진이 발생해 수많은 희생자가 나왔다. 지진발생 후 쓰나미가 일어나 방사선이 대량으로 유출되는 등 일본사상 최대의 국가적인 복합재난이 일어났다. 그럼에도 불구하고, 일본인들이 침착함을 잃지 않은 시민의식에 대해 세계 시민들은 극찬을 아끼지 않았다. 우리나라도 국가적으로는 대형 재난발생 시를 대비하여 행정안전부, 방송통신위원회, 소방방재청, 기상청, KBS, 재난전문가 등으로 구성된 가칭 "긴급재난방송협의회" 같은 것을 구성하여 긴밀하게 재난정보를 교환하는 유기적인 협력체제구성이 필요하다. 또, 나아가서는 이들 관련 부서에서는 재난방송 전담관을 두어 재난방송에 적극적으로 대처하여야 할 것으로 본다. 정부도 KBS에 대해 대폭적인 지원을 아끼지 않아야 하겠지만, KBS 또한 지금까지의 대응 자세에서 벗어나 "재난방송의 선진화"를 위해 재난방송시스템을 새로 구축해야 할 것이다. 마지막으로 KBS는 NHK의 지상파방송과 같이 KBS 위상에 걸 맞는 재난방송시스템을 구축하는 한편, 디지털시대에 있어서의 뉴 미디어를 이용하여 DMB나 스마트 폰, SNS 등을 이용한 각종 재난경보체제를 선도해야 할 재난주관방송사로서의 의무가 있다. 그것이 곧 공영방송의 본연의 임무이자 국민의 생명과 재산을 지키는데 최선을 다하는 길이다.
-
재난이 발생하였거나 발생할 우려가 있을 경우 국민들에게 이에 대한 정보를 신속하게 제공하면 많은 인명 및 재산 피해를 줄일 수 있을 것이다. 본 고에서는 이러한 대국민 재난정보전달시스템의 모델을 제시한다. 본론에서는 이 모델을 구성하고 있는 요소들의 기능 및 이슈에 대해 기술한다. 본 고에서 제안한 모델은 현재 사용하고 있는 재난정보전달시스템의 특징을 분석하거나, 앞으로 개발할 재난정보전달시스템을 설계할 경우 참조모델로 활용할 수 있다. 또한 국가 재난정보전달시스템을 통합하기 위한 기본 모델로도 활용할 수 있을 것이다.
-
최근 들어 일본의 대지진과 같이 "위험사회"에서 발생할 수 있는 여러 현상들이 나타나고 있다. 국가는 위험한 상황을 신속하게 국민에게 전달하여 국민의 생명과 재산을 보호해야하는 중요한 의무를 가진다. 이러한 국가의 의무를 효과적으로 수행하기 위해 국가는 법령에 재난정보전달에 필요한 사항을 규정한다. 본 고에서는 우리나라의 법령 중 재난정보전달과 관련된 법령을 수집하여 분석한다. 이를 위해 헌법, 자연재해대책법, 재난 및 안전관리 기본법, 방송통신발전기본법, 기상법, 마지막으로 민방위기본법과 관련 시행령을 조사하였다. 결론으로 이러한 법령과 관련 조직이 현재 가지고 있는 문제점을 파악하였다.
-
재난이 발생하였거나 발생할 우려가 있을 경우 국민들에게 이에 대한 정보를 신속하게 제공하면 많은 인명 및 재산 피해를 줄일 수 있을 것이다. 본 고에서는 우리나라에서 시행한 재난정보전달시스템에 대해 간략히 소개한다. 각 시스템의 장점 및 단점 또한 타 시스템과의 차별성에 대해 기술한다. 이러한 분석은 향후 국가 통합재난정보전달시스템을 구축하기 위한 기본 자료로 활용될 수 있을 것이다.
-
Lim, Jung-Tak;Jeon, Inchan;Kwak, Chunsub;Chang, Sekchin;Song, Jong Hyun;Choi, Seong Jong;Lee, Yeon 155
본 고에서는 미국의 재난정보전달시스템에 대해 조사한 후 우리나라의 재난정보전달시스템 구축을 위한 시사점을 찾는다. 우선, 미국의 관련 제도, 표준 및 시스템에 대해 분석한다. 이러한 분석으로 두 가지의 시사점을 정리하였다. 첫 번째 시사점은 여러 부처에 있는 다양한 재난정보전달시스템을 통합하기 위해 각 기관의 업무 분장을 명확하게 하는 법령의 제정의 중요성이다. 두 번째 시사점은 다양한 재난정보전달시스템을 상호연계하기 위해 정보교환에 필요한 사항을 국가표준이 필요성이다. 본 고의 미국의 재난정보전달시스템 사례 조사는 앞으로 우리나라의 재난정보전달시스템 구축을 위해 활용할 수 있을 것이다. -
Lee, Yong-Tae;Park, So-Ra;Lee, Yong-Hoon;Paek, Myung-Sun;Lim, Bo-Mi;Song, Yun-Jeong;Kim, Gun 157
현재는 국토해양부의 "도로터널 방재시설 설치 지침"에 따라 1종 도로 터널 내 아날로그 AM/FM 라디오 재난방송시스템이 설치되어 운영 중이나 T-DMB의 경우 관련 시스템이 개발이 되어 있지 않았다. T-DMB는 개인용, 휴대용, 이동형의 디지털방송매체로서의 특징을 가지고 있으며 최근들어 수신기 보급 증가로 새로운 재난방송 매체로 부상하고 있는 현실을 감안하면 터널 및 지하공간에서 T-DMB 방송망과 수신기를 활용한 국지적 재난방송 기술 개발은 매우 필요하다. 이에 본 논문은 기존 T-DMB 방송서비스 권역 내에서 터널 및 지하공간 등 T-DMB 수신환경이 열악한 지역에서 평상시에는 T-DMB 방송을 중계하여 수신환경을 개선하고 재난발생 시에는 기존 T-DMB 단말기로 수신 가능하며 각 재난상황에 맞는 맞춤형 재난경보방송을 송신하는 T-DMB 재난방송시스템 및 관련기술을 소개한다. -
최근 IT 기술의 발전으로 TV, DMB, 이동통신망 등을 이용한 효율적인 재난문자방송 서비스가 국내외에서 관심을 받고 있다. 특히. 이동통신망은 지역단위 전송이 가능하기 때문에 지진, 해일 등의 심각한 재난이 예상되는 지역에 신속한 경보 서비스를 가능하게 해준다. 국내에서는 이미 2G 이동통신망을 이용하여 대국민 재난문자방송 서비스를 실시하였다. 그러나 국내외적으로 3G/4G 이동통신망 서비스가 본격화 되었으며, 이에 맞는 재난문자방송 서비스가 필요한 실정이다. 이에 본 논문에서는 이동통신망을 이용한 재난문자방송 서비스인 CBS의 국내외 동향과 표준안 등을 소개하며, 국내 CBS의 향후 나아갈 방향을 제시하고자 한다.
-
이 논문에서는 최근 널리 사용되고 있는 소셜미디어를 지진정보전달과 관련된 특성 위주로 분석하고, 가장 적합한 소셜미디어 서비스를 이용하여 지진정보를 전달하는 시스템 개발에 대해 설명한다. 먼저 소셜미디어의 전달 특성을 분류하여 가장 적합한 소셜미디어 서비스를 선택한다. 그리고 해외에 유사한 서비스를 조사하여, 이와 같은 서비스가 효용성을 가질지 판단한다. 이를 바탕으로 지진정보전달시스템을 개발하여 소셜미디어를 활용한 지진정보전달 서비스 환경을 구축한다. 이 논문에서 개발한 시스템은 현재 실제 기상청에서 테스트를 진행하고 있으며, 테스트를 마칠 경우 실제 운영을 시작할 계획이다. 본 서비스를 시작할 경우 다양한 전달매체, 특히 비교적 안정적인 매체를 통해 지진정보를 이용할 수 있게 될 것이다.
-
스마트폰은 항상 사용자가 휴대하고 있으며 필요에 따라 적절한 어플리케이션을 내려 받아 기능을 확장할 수 있다. 이에 많은 서비스 업체들은 사용자가 언제 어디서나 자사의 서비스를 이용할 수 있도록 스마트폰용 어플리케이션을 개발하고 있다. 본 고에서는 현재 스마트폰 플랫폼인 iOS, 안드로이드, MS 에서 제공한 푸시 서비스에 대해 분석한다. 다음으로 국가의 재난경보서비스를 위해 이 기술을 활용할 경우의 문제점 찾아 보았다. 본 연구의 결과 현재의 푸시 기술은 많은 문제점을 가지고 있기 때문에 정부에서 본격적으로 푸시 기술을 활용한 스마트폰 재난경보서비스를 시작하기엔 아직 이른 것으로 판단된다.
-
한반도 및 근해의 지진 지진해일 감시를 위해 지진관측망이 구축되어 있다. 이러한 지진관측망는 향후 조기경보를 위해 보다 조밀하게 설치될 예정이다. 지진계측기의 정보통신망은 대부분 행정망 및 전용회선 단일망으로 운영되고 있으며 지진계측기의 전력체계는 상용전원의 단일 전력체계로 운영되고 있다. 국내 지진관측망 운영상의 문제점으로 단일 정보통신망 운영으로 인한 통신 단절 발생 시 지속적인 자료 수집 불능과 단일 전력체계인 상용전원 단절시 통신장비에 전원공급 단절로 인한 실시간 자료 전송 장애 발생이 있다. 또한 지진관측기의 정보통신망과 전력체계에 대한 원격감시 및 관리 기능이 부재하여 유지 보수 및 안정적 자료수집에 취약점을 가지고 있다. 이러한 취약점을 극복하기 위해서는 각종 재해에 대한 내재해성과 유지보수성을 향상시키는 것이 시급하며 정보통신망과 전력체계의 다중화/이중화가 좋은 대안이 될 수 있다.
-
최근 ISO/IEC의 MPEG과 ITU-T의 VCEG이 JCT-VC (Joint Collaborative Team for Video Coding)를 구성하여 HEVC (High Efficiency Video Coding) 차세대 비디오 압축 표준 제정을 위한 작업을 진행 중이다. 과거 압축률이 가장 좋은 것으로 알려진 H.264/AVC 보다 최대 50%까지 부호화 효율 향상을 목표로 하고 있다. HEVC는 H.264/AVC와는 상이한 부호화 구조를 채택하고 있고 작은 크기의 영상뿐만 아니라 크기가 큰 영상까지도 효율적으로 부호화할 수 있도록 설계되고 있다. 예측 및 변환 부호화 과정이 계층적 쿼드트리 구조를 가지며, 특히 변환 부호화는 작은 크기의 변환 블록으로부터
$32{\times}32$ 크기의 변환 블록까지 크게 확장되어 계층적 변환 구조를 이루며 부호화하도록 되어 있다. 본 논문에서는 기존 코덱과는 상이한 부호화 구조를 갖는 쿼드트리 부호화 기반 HEVC 코덱 표준을 위한 율-왜곡 (Rate-Distortion) 모델을 제안한다. 기존의 코덱에서는 부호화되는 기본 단위가$16{\times}16$ 로 일정하고, 변환 및 양자화되는 블록의 크기 역시$4{\times}4$ 또는$8{\times}8$ 크기 단위로 그 블록의 크기가 작을 뿐만 아니라 고정된 크기를 사용한다. 따라서 단일 확률 모형을 사용하여 율-왜곡 모델을 만들었으며, 그 정확도 역시 비교적 정확한 결과를 얻었다. 그러나 HEVC에서는 계층적 가변 블록 크기를 갖는 기본 부호화, 예측 및 변환/양자화 기법을 사용하기 때문에 기존의 단일 모델로는 정확한 율-왜곡 모델을 만들어 내기 어렵다. 제안하는 방법은 HEVC의 기본 단위인 CU (Coding Unit)별로 독립적인 확률 모형을 사용하여 율-왜곡모델을 사용하는 것으로 CU의 크기가 가변적이고 CU 내의 텍스처 역시 크기에 따라 매우 다른 특성을 가지고 있기 때문에 단일 모델을 사용하는 것보다 매우 효율적인 것을 실험을 통하여 확인하였다. -
현재 표준화가 진행 중인 HEVC (High-efficiency video coding) 는 기존의 동영상 표준과 마찬가지로 여러 기술들이 혼합된 하이브리드 영상 부호화 프레임 워크 구조를 따르고 있다. 특히, 다양한 크기의 부호화 단위 (Coding Unit : CU), 예측단위 (Prediction Unit : PU), 변환 단위 (Transform Unit : TU) 의 사용으로 인해 HD 이상의 영상에 대하여 기존의 H.264/AVC 보다 약 40%의 압축률 향상을 보이고 있다. 하지만 그로 인하여 부호화기 복잡도가 약 3 배 이상 증가하는 것으로 나타났으며 이는 실시간 부호화가 요구되는 분야에서 큰 문제가 될 것이다. 본 논문은 HEVC 부호화기 복잡도를 낮추기 위하여 최적의 CU 를 결정하는 과정 중 조기에 CU 를 결정하는 고속 CU 결정 방법을 소개한다. 실험 결과, 제안된 방법은 HM과 비교하여 PSNR (Peak Signal to Noise Ratio) 의 손실이 거의 없이 최대 약 58%의 부호화 시간을 절약하였다.
-
최근 표준화가 진행되고 있는 HEVC는 H.264/AVC의 기본 구조를 유지하면서 각 부호화기의 성능을 향상시키는 방향으로 진행되고 있다. 기존의 H.264/AVC는 화면 간 예측에서 예측 정보를 보내지 않고 복호화가 가능한 SKIP 모드와 예측 정보를 보내주는 화면 간 예측 모드들을 사용한다. 그런데 SKIP 모드는 율-왜곡 측면에서 극단적인 특성을 갖기 때문에 SKIP 모드와 다른 화면 간 예측 모드들 사이에 넓은 율-왜곡 파라미터 간격이 존재하며, 이는 화질 저하의 원인이 된다. 본 논문에서는 HEVC에서도 동일한 문제점이 존재하는지 분석하기 위해 SKIP 모드와 화면 간 예측 모드들의 율-왜곡 파라미터에 대한 분석을 수행하였다. 분석 결과를 바탕으로 HEVC에서도 부호화 효율을 향상시키기 위하여 새로운 화면 간 예측 모드가 필요함을 보였다.
-
본 논문에서는 HEVC(High Efficiency Video Coding) 부호화기에서 사용되는 TU(Transform Unit) 분할이 깊이에 따라 속도와 화질과 압축률에 미치는 영향을 분석한다. 현재 HD 영상의 표준 부호화기로 사용되던 H.264/AVC 를 대신할 차세대 부호화기인 HEVC 에 대한 표준화 작업이 이루어지고 있으며 이러한 HEVC 부호화기의 특징 중 하나로 영상 압축 시 CU, PU, TU 로 세분화 된 단위를 사용한다는 점을 들 수 있다. HEVC의 reference software 인 HM 의 경우 기존 H.264/AVC 에 비하여 UHD 영상에서 최대 40%에 가까운 비트 절감률을 보이지만 최적화가 이루어지지 않아 실시간 부호화에는 적합하지 않은 속도를 보인다. HM 에서는 각 CU 나 TU 에 대하여 quadtree 형식으로 분할하여 부호화를 수행한 후 최적의 분할 형태를 취하는 방식을 사용하기 때문에 많은 시간을 소요하게 되며 분할되는 깊이에 비례하여 기하급수적으로 속도가 느려지게 된다. 본 논문에서는 TU 가 분할되는 깊이가 부호화 화질과 속도에 어느 정도 영향을 미치는지를 분석하고 화질 손상을 최소화 하는 최적의 TU 분할 깊이를 제안하여 보기로 한다.
-
본 논문에서는 화면내 예측의 계산 복잡도를 감소시키기 위한 방법을 제안한다. HM2.0 의 화면내 예측방법인 각도에 의한 예측(Angular prediction)은 예측 대상블록 내부의 각 샘플이 예측하기 위해 사용하는 참조샘플로부터 정수단위의 위치에 있지 않을 경우 참조 샘플들을 보간 하여 예측을 수행한다. 이러한 방법은 예측 대상 블록의 크기가 커질수록 보간 하는 횟수가 증가하고 계산 복잡도가 증가하는 단점이 있다. 제안하는 방법은 한번의 보간으로 복수의 샘플들을 예측함으로써 보간 횟수를 줄이고 결과적으로 계산의 복잡도를 줄인다. PU_32x32 에 대해 제안하는 방법을 적용하였을 경우, 보간하는 횟수는 HM2.0 대비 1/2 배 또는 1/4 배 가까이 감소하고 성능 저하는 High-Efficiency(HE)에서 0.1% 또는 0.2% 정도로 미미하게 나타났다.
-
본 논문에서는 시간적 움직임 벡터 성분 값을 절삭하여 시간적 움직임 벡터를 저장하는데 필요한 메모리 요구량을 감소하는 방법에 대해서 제안한다. HEVC 에서 시간적 움직임 벡터는 움직임 병합 모드와 향상된 움직임 벡터 예측 방법에서 부호화 효율 향상을 위해서 사용되고 있다. 하지만 부호화해야 할 원본 영상의 공간적 해상도 및 비트 심도가 증가함에 따라 메모리에 저장할 시간적 움직임 벡터의 데이터뿐만 아니라 메모리 접근 대역폭도 크게 증가한다. 따라서 본 논문에서는 시간적 움직임 벡터 성분의 비트 심도를 조절한 후 메모리에 저장하는 방법에 대해서 제안한다. 제안하는 방법을 HM 2.0 에 구현하고 HEVC 표준화에서 사용되는 임의접근 및 저지연 실험 조건에서 실험했을 때, 평균 0.2%의 비트율 손실을 보이지만, 필요한 메모리 요구량을 약 반 정도 줄일 수 있다.
-
본 논문에서는 JCT-VC(Joint Collaboration Team on Video Coding)에서 표준화가 진행 중인 HEVC(High Efficiency Video Coding)의 Test Model 인 HM1.0과 현재 디지털 방송, 통신, 저장 매체 등 다양한 응용 분야에 사용되고 있는 범용 비디오 코덱들 간의 객관적, 주관적 측면에서의 부호화 성능을 비교한다. 이를 통해 HEVC의 현재 성능 수준에 대한 평가 결과를 보이고, 활용 가능성에 대해 결론을 맺는다. 비교 대상 코덱으로는 H.264/AVC 표준의 S/W 기반인 VideoLAN Project의 x264와 MPEG-2 표준으로 Harmonic사의 H/W기반의 최신형 실시간 인코더인 Electra8000을 사용하였다. 총 5개의 HD(1920x1080)영상에 대한 객관적 성능 비교 결과, HM1.0이 x264 대비 평균 44.93%의 BD-rate 감소와 평균 1.65%의 BD-PSNR 증가를 보였고, Electra8000에 대해서도 월등히 높은 성능차를 보였다. 주관적 화질 비교 결과 동일 PSNR 조건하에서 HM1.0이 범용 비디오 코덱들보다 주관적 화질이 유사하거나 좀 더 나음을 보였다.
-
MPEG 과 VCEG 의 공동협력팀인 JCT-VC(Joint Collaboration Team on Video Coding)에서는 H.264/AVC 보다 두 배 이상의 높은 부호화 효율을 목표로 HEVC(High Efficiency Video Coding) 표준화를 진행하고 있다. HEVC 표준화에서는 압축 효율뿐만 아니라 부호화기의 복잡도도 중요하게 고려되고 있다. 본 논문에서는 HEVC 부호화기의 높은 복잡도를 줄이기 위하여 상위 깊이의 부호화 단위(Coding Unit: CU)의 움직임 정보를 이용하여 현재 부호화하는 예측단위(Prediction Unit: PU)의 참조영상의 후보의 수를 제한하는 고속 부호화 알고리즘을 제안한다. 모의실험을 통하여 제안한 알고리즘은 HM3.0 에 비해 평균 10.8% 정도의 부호화 시간을 감소시키며, 이때 평균 비트율은 0.5%로 부호화 효율의 감소가 미미함을 확인 하였다.
-
본 논문에서는 현재 표준화가 진행중인 HEVC 의 고정 비트율(CBR) 부호화를 위한 비트율 제어(rate control) 기법을 다룬다. HEVC 의 임의접근(Random Access: RA) 부호화 모드는 계층적-B 부호화 구조를 통해 높은 부호화 효율을 제공할 수 있다. 기존의 HEVC 를 위한 비트율 제어 방식으로는 2 차 비트율-왜곡 모델 기반의 시간계층 및 프레임 타입에 따른 비트율 특성을 반영한 프레임 레벨의 비트율 제어 기법이 제시되었다. 이 같은 기존의 프레임 레벨의 비트율 제어 기법은 임의접근 모드의 계층적-B 구조에서 동작성능이 확인되었으나, HEVC 의 기본적인 부호화 단위(Coding Unit: CU)의 특성이 반영되지 않아 비트율 제어의 정확성이 제한되었다. 본 논문에서는 기존의 계층적 부호화 구조를 고려한 프레임 레벨의 비트율 제어 기법을 확장한 CU 레벨에서의 비트율 제어 기법을 제시하고 모의실험을 통해 제시된 기법의 비트율 제어 성능을 확인한다.
-
본 논문에서는 인터액티브 스마트 TV 적용을 위한 사운드트랙 검색 시스템을 제안한다. 제안하는 시스템은 동영상을 오디오와 비디오특징을 구분한 후, 각 오디오와 비디오 신호를 분석한다. 비디오 신호의 분석은 MPEG-2 비디오 인코더로부터 영상의 장면전환과 시작과 끝 위치를 검출하고, 오디오 신호의 분석은 AC-3 오디오 인코더로부터 오디오 특징을 추출한 후, 오디오 정보의 비트 벡터를 추출하여 데이터베이스를 생성한다. 생성된 데이터베이스와 사용자가 북마크를 하여 요청한 쿼리와 비교를 통하여 오디오 특징정보가 유사한 부분의 장면을 검색하고, 검색된 장면을 사용자에게 제공한다. 제안된 시스템의 성능 측정을 위해서 뉴스, 패널토론, 음악방송, 광고, 드라마 등 50개 TV 방송 프로그램의 데이터베이스를 이용해서 정확성을 측정하였다.
-
본 논문에서는 3DTV 의 입체감 향상을 위한 3D 음향의 원근감 재현 기술을 제안한다. 먼저, 3D 영상 객체의 깊이를 추출하고 영상 객체의 깊이에 따라 오디오 객체의 거리감을 조절한다. 오디오 거리감 재현을 위해 필요한 오디오 깊이 인자는 3D 영상의 좌/우 이미지의 차이 정보로부터 오디오에 맞도록 비선형 변환을 통해 구해진다. 3D 오디오 재현 알고리즘은 기존의 서라운드 입체음향 기술과 원근감 재현 기술로 구성된다. 원근감 재현 기술은 추정된 오디오 깊이 인자에 따라 신호크기, 초기 반사음, 근거리 머리전달함수, 위상 제어를 통해서 구현된다. 특히, 3D 영상 객체가 화면 앞으로 튀어 나올 때 소리도 튀어나오도록 함으로써 3D 영상 객체와 연동되는 입체 음향을 효과를 통해 3D 방송 시청 시 오디오/비디오 입체감을 향상시켜준다. 상용화된 3DTV 를 활용하여 음질 평가 전문가들의 주관 청취 평가를 통해 제안한 원근감 재현 기술이 3D 방송 시청에 적합함을 검증한다.
-
향후 인터넷 기반 애플리케이션에는 확장성, 보안 및 신뢰성, 새로운 서비스에 대한 유연성 및 QoS 등의 요구사항이 중요하다. 기존 클라이언트-서버 방식에서 이러한 요구 사항의 만족을 위해서는 복잡성 및 고비용 문제가 제기된다. 반면, 모든 형태의 분산 자원 접근이 가능한 P2P 통신 방식에서는 보다 간단한 해결방안을 제시함으로써 인터넷 기반 애플리케이션에 새로운 가능성을 제시하고 있다. 인터넷의 전통적인 클라이언트-서버 패러다임과는 달리 완전 분산 및 자율 조직 특성을 가진 P2P 개념은 확장성 및 신뢰성 측면에서 장래의 애플리케이션, 시스템 요소, 인프라 서비스를 위한 기본 설계지침으로 제시되고 있다. 본 논문에서는 P2P 실시간 스트리밍 프로토콜의 새로운 모델인 PREP 프로토콜을 설계 및 구현한다. 제안된 P2P 실시간 스트리밍 프로토콜을 NS-2를 통해서 설계하고 시뮬레이션을 통해 P2P 기반의 스트리밍 서비스의 가능성을 확인한다.
-
최근의 스마트 폰 및 스마트 TV 열풍은 사용자의 가정 내 무선 멀티미디어 네트워킹 서비스에 대한 욕구를 증가시켰고, 2004년 출범한 DLNA 기술의 보급을 촉진시켰다. 그러나 무선 네트워크 환경의 불안정성과 기존 TCP/UDP 데이터 전송 기술이 가진 한계로 인해 DLNA를 통한 고화질의 멀티미디어 데이터 서비스에는 제한이 존재했던 것이 사실이다. 이에 본 논문은 이러한 문제의 해결 방안을 모색하고자 DLNA 디바이스인 DMR과 DMS 간 SCTP 멀티 스트리밍 기술을 이용한 미디어 데이터 스트리밍 방법에 관해 연구하고, 이를 구현하였다. 전송된 스트림은 여러 조각으로 나뉘어 동일한 양의 버퍼에 복사되고, 버퍼 각각에 스트림 번호를 부여하여 SCTP 멀티 스트리밍 기법을 이용해 전송함으로써 더욱 신뢰성 있는 미디어 데이터의 스트리밍이 가능하였다.
-
Conditions on the MP4-based DASH Segments for the Replay of Client-side Concatenated Storage ResultsDASH(Dynamic Adaptive Streaming over HTTP)는 MPEG(Moving Picture Experts Group)에서 표준화 중인 HTTP를 이용한 적응형 비디오 스트리밍 기술이다. 일반적으로 HTTP를 이용한 적응형 비디오 스트리밍에서 클라이언트가 사용할 수 있는 기능은 파일 전체 또는 그 일부를 다운로드하는 것이다. 따라서 전체 콘텐트를 작은 파일 조각 즉, 세그먼트(segment)로 분할하여 세그먼트들을 순차적으로 다운로드함으로써 마치 스트리밍이 달성되는 것과 같은 효과를 낼 수 있다. 네트워크의 상태에 따라 전송률을 조절하기 위해서는 서버에 서로 다른 비트율로 부호화된 세그먼트들을 함께 보관해 두어 클라이언트로 하여금 선택할 수 있게 한다. DASH에서는 MPEG-2 TS 또는 MPEG-4 파일 포맷(MP4)를 기반으로 하는 두 가지 형태의 서버 콘텐트를 제공할 수 있다. MP4 기반 DASH의 경우, 클라이언트가 수신한 세그먼트들을 순차적으로 이어 붙여 저장한다 하더라도 특별한 조건을 만족하는 경우를 제외하고는 MP4 파일을 재생할 수 있는 기존 미디어 플레이어가 이를 재생하지 못한다. 본 논문에서는 이러한 특별한 조건을 제시하고 이를 검증하였다. 이 조건은 서버에서 제공하는 세그먼트들에 대한 조건이다.
-
본 논문에서는 스마트폰의 카메라와 플래시를 이용한 능동적 3차원 형상 취득 시스템을 제시한다. 두 대의 스마트폰을 이용하여 한 대의 스마트폰은 광원 역할과 광원 위치 추정을 위한 영상 취득을 하고 다른 스마트폰으로 고정된 위치에서 광원의 위치 변화에 따른 영상을 취득을 한다. 각 스마트폰에서 취득된 영상을 마커 기반에서 광원의 위치를 추정하고 카메라의 반응 함수에 의한 비선형적 왜곡과 렌즈의 왜곡을 보정한다. 광원의 방향 벡터와 보정된 영상의 밝기 값을 이용하여 photometric stereo 기법으로 3차원 형상을 취득한다.
-
영상 매칭은 컴퓨터 비전에서 중요한 기초 기술 중에 하나이다. 하지만 스케일, 회전, 조명, 시점변화에 강인한 대응점을 찾는 것은 쉬운 작업이 아니다. 이러한 문제점을 보안하기 위해서 스케일 불변 특징 변환(Scale Invariant Feature Transform) 고속의 강인한 특징 추출(Speeded up robust features) 알고리즘등에 제안되었지만, 시점 변화에 있어서 취약한 문제점을 나타냈다. 본 논문에서는 이런 문제점을 해결하기 위해서 시점 변화에 강인한 알고리즘을 제안하였다. 시점 변화에 강인한 영상매칭을 위해서 원본 영상과 질의 영상간 유사도 높은 특징점들의 호모그래피 변환을 이용해서 질의 영상을 원본 영상과 유사하게 보정한 뒤에 매칭을 통해서 시점 변화에 강인한 알고리즘을 구현하였다. 시점이 변화된 여러 영상을 통해서 기존 SIFT,SURF와 성능과 수행 시간을 비교 함으로서, 본 논문에서 제안한 알고리즘의 우수성을 입증 하였다.
-
얼굴검출기술의 발전으로 인하여, 다양한 분야에 얼굴 검출을 활용한 기술이 이용되고 있다. 최근 Viola 와 Jones 의 얼굴검출 방법이 신뢰도 있는 검출률과 빠른 연산속도로 인하여 주로 이용되고 있다. 하지만 고해상도 이미지와 제한된 하드웨어를 사용하는 시스템의 경우, 실시간 처리가 어려워지는 문제가 있다. 본 논문에서는 이와 같은 문제를 해결하고자 거리 정보를 이용한 빠른 얼굴검출방법을 제안한다. 속도 개선을 위해 먼저 거리 정보를 이용하여 영상의 불필요한 부분을 제거하고, 피부색상정보를 이용하여 관심영역을 설정한다. 또 크기에 대응하기 위해 피라미드 이미지를 이용하는 방법 대신, 거리 정보를 이용하여 얼굴의 크기를 추정한다. 마지막으로 검색창 내의 거리 분산을 계산하여, 평평하거나 굴곡이 심한 영역을 제거함으로 얼굴 검출 속도를 개선하였다. 실험결과 기존 방법에 비해 더 빠른 검출속도와 유사한 검출성능을 확인할 수 있었다.
-
Viola와 Jine가 제안한 AdaBoost를 이용한 얼굴 검출 알고리즘은 빠른 얼굴 검출 속도와 뛰어난 성능으로 인해 최근 여러분야에서 널리 사용되고 있는 알고리즘 중 하나이다. 하지만 AdaBoost를 이용하여 얼굴을 검출함에 있어 오검출이 존재하며, 이를 줄이기 위해서는 많은 연산이 요구되며, 실시간 얼굴 검출이 필요한 분야에 적용되기에는 속도 면에서 단점으로 작용한다. 기존의 Adaboost의 얼굴 검출기는 그레이스케일 영상만을 사용하므로, 영상의 컬러 정보와 부가적인 정보를 사용하면 더 적은 연산으로 오검출률을 감소시킬 수 있고, 올바른 얼굴을 검출이 된 다음 추적 알고리즘에 적용을 시키면 동영상으로 입력되는 영상에 대해 실시간으로 얼굴을 검출 할 수 있게 된다. 본 논문에서는 얼굴 추적을 위한 사전단계로 컬러 정보와 부가적인 정보로 깊이 정보를 사용하여 얼굴을 효율적으로 검출하는 알고리즘을 제안한다.
-
본 연구는 머리 추적 기술을 이용하여 파노라마 뷰어를 제어하는 새로운 방법을 제시한다. 360도 전방위로 녹화된 파노라마 비디오를 사용자의 머리를 추적하여 영상의 좌 우 회전, 위 아래 회전, 그리고 줌인/아웃이 가능하게 하며, 이는 사람의 관심 여부에 따라 머리가 움직이는 인간의 자연스러운 모습을 적용하여 쉽고 직관적인 제어가 가능하도록 한다. 실제 2009년 한국시리즈 야구 경기를 파노라마 카메라로 녹화하여 실험에 적용하여 실사용성을 확인하였다.
-
본 논문에서는 클러스터 기반 다중 홉 무선 네트워크에서 중계기 협력 ARQ 를 이용한 기회적 중계 기법을 제안한다. 클러스터 간 통신 시 성능을 열악하게 만들 수 있는 채널 페이딩 효과를 줄이기 위하여 각 클러스터 간 통신에 중계기를 이용한 협력 통신을 적용한다. 또한 다중 홉 통신에서는 중간 홉에서 오류가 발생할 경우 전송 도중 정보를 잃게 되는 전송 실패의 가능성이 존재한다. 따라서 전송 실패의 가능성을 줄이기 위하여 중계기로부터 재전송을 받을 수 있는 중계기 협력 ARQ 기법을 적용한다. 본 논문에서는 제안한 기법에 대한 전송 실패 확률을 분석한다. 그리고 모의 실험에서는 제안한 기법이 ARQ 를 사용하지 않은 기법과 성능 비교하여 신뢰도 측면에서 더 좋은 성능을 보임을 확인한다.
-
최근 비효율 적인 주파수 사용을 극복하기 위한 인지 접속 시스템 및 인지 접속 시스템 구현을 위한 스펙트럼 센싱 기술연구가 활발하게 진행되고 있다. 본 논문에서는 다수의 이차 사용자가 협력하여 우선 사용자를 감지하는 협력 스펙트럼 센싱기술에서 m-bit 결합을 사용하는 시스템의 성능을 닫힌 형태로 분석한다. 또한 컴퓨터 모의실험을 통하여 시스템 성능 분석의 유효성을 확인하도록 하며, bit 수에 따른 성능 변화를 확인한다.
-
무선통신 환경에서 채널 용량이 증가하면 정해진 전송률에 대한 불능 확률(outage probability)이 감소하며, 따라서 통신의 신뢰도가 향상된다. 본 논문에서는 채널 페이딩에 대한 시간 상관성(time correlation)이 있는 환경에서 ARQ 시스템의 합 채널 용량을 향상시키는 전력 할당(power allocation) 기법에 대해 다룬다. 송신기에서 전송이 시작되기 전의 채널 정보를 수신기의 피드백을 통해 알고 있다고 가정하고, ARQ 의 재전송 시점의 채널의 확률분포를 다루었다. 이 분포를 통해 재전송 시점의 채널을 추정하고, ARQ 의 모든 재전송에 대한 합 채널 용량 최대화를 위한 전력 할당 문제를 공식화하였다. 이 문제에 대한 해를 분석적으로 도출하였으며, 모의실험 결과를 통해 제안된 전력 할당 기법으로 얻는 합 채널용량이 재전송 시 동일한 전송전력을 사용한 기존의 기법보다 증가함을 확인한다.
-
기존의 OFDMA 시스템에서의 자원할당 기술은 주로 완벽한 채널정보에 기반하여 송신 전력, 부반송파를 할당하였다. 하지만 실제 시스템에서는 사용자의 움직임이나 채널 피드백 지연에 의해 완전한 채널정보를 얻을 수 없다. 본 논문에서는 불완전한 채널 정보를 갖는 OFDMA 중계 네트워크를 위한 자원 할당 기법을 제안한다. 불완전한 채널 정보를 갖는 환경에서는 패킷 오류가 발생할 확률이 높기 때문에 이를 예측하여 적응적 데이터 전송률을 할당하는 기법이 필요하다. 제안된 알고리즘은 채널 정보를 예측하여 데이터 전송률, 그리고 부반송파 할당을 통해 유효처리율을 최대화시킨다. 모의 실험 결과 제안된 알고리즘은 채널정보를 예측하지 않는 단순한 알고리즘과 비교하여 더 높은 유효처리율을 갖음을 확인하였다.
-
차세대 무선통신에서는 높은 데이터 전송률을 필요로 하여 높은 밀도의 주파수 재사용을 요구하게 된다. 따라서 셀 간 간섭을 효율적으로 줄이는 방법을 필요로 하게 된다. 기존의 정적인 간섭 조정 기법들은 셀 가장자리 성능을 향상시키기 위해서 네트워크 전체의 성능을 희생한다는 단점이 존재한다. 한편, 높은 전송률을 필요로 하며, 동시에, 높은 신뢰도의 통신을 위해서 중계단말기를 사용한 OFDMA 중계 네트워크에 대한 관심이 높아지고 있다. 따라서, 본 논문에서는 다중 셀 환경의 OFDMA 중계 네트워크에서의 셀 간 간섭을 적응적으로 조정하는 기법을 제안한다. 제안된 기법에서는 셀 간 간섭을 줄여서 셀 가장자리 성능을 향상시킴과 동시에 네트워크 전체 성능 또한 향상시키는 것을 목적으로 한다. 모의실험을 통해, 제안된 알고리즘이 정적 셀 간 간섭조정 기법들 보다 셀 가장자리 성능과 네트워크 전체 성능이 우수함을 확인한다.
-
본 논문에서는 내용 기반 음악의 감성추출 연구의 동향을 살펴보고, 평가치를 기반으로 청중의 기호를 분석해 본다. 청중의 기호 분석은 가능한 많은 사람이 공감 할 수 있는 데이터를 사용하고자, 최근 이슈가 되고 있는 "나는 가수다" 방송 프로그램의 음원 분석을 통해 이루어졌다. 데이터베이스는 총 7 번의 공연/경연마다 7 곡씩 순위가 매겨지므로 총 49 곡으로 이루어진다. 청중 평가단은 총 500 명의 엄격히 선발된 10 대에서 50 대, 각각 100 명 씩으로 구성되었다. 특징값은 오픈소스인 MIRtoolbox 를 이용해서, 총 376 개의 특징값을 추출하여 평가치와의 상관관계를 구해 청중 평가단의 기호를 분석한다. 실험결과 총 376 개의 특징값 중 10 개의 특징값이 청중평가단의 기호와 상관관계가 있다는 것이 나타났다. 마지막으로 내용 기반 음악의 감성 추출 연구에서 보이는 감성의 주관적 인식성 및 심리학적 설명의 난해함을 줄이고자, 향후 과제로 내용 기반 및 평가치 기반의 시스템을 결합한 감성 기반 음악 추천 시스템을 제안한다.
-
이 논문에서는 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템 또는 커버 노래 인식 (cover song identification) 시스템에서 사용 가능한 멜로디 유사도를 제안한다. QbSH 또는 커버 노래 인식은 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 오고 있다. 멜로디 유사도는 이런 시스템을 구현하는데 필수적인 요소이며, 두 개의 음악에서 멜로디가 추출되었다고 가정하고, 추출된 멜로디 사이의 유사한 정도를 수치로 표현한다. QbSh 시스템이나 커버 노래 인식 시스템은 멜로디 유사도에 기반하여 입력 노래와 유사한 노래를 데이터베이스에서 검색하는 작업을 수행한다. 이 논문에서 제안하는 멜로디 유사도 방식은 기존의 많이 연구되던 동적 시간 왜곡 (dynamic time warping, DTW) 방법과 크로마 표현 방법 (chroma representation)을 사용하였다. DTW방법은 비대칭적으로 사용하고 미디 노트 영역에서 표현된 멜로디 특징은 0이상 12 미만의 크로마 레벨로 표현하였다. 기존의 방법에서는 정수값을 많이 사용하였으나 이 논문에서는 실수값을 사용한다. DTW 에 사용하는 거리 함수를 기존에 사용하던 차이의 절대값 대신 꺾인 함수 형태를 사용함으로써 성능을 높였다. QbSH 시스템에서의 실험을 통해서 성능을 검증하였다. 본 논문에서는 10-12초 길이의 1000번의 쿼리(Query)에 대해서 28시간 정도의 데이터베이스에서 실험한 결과, 순위 역의 평균 (Mean reciprocal rank, MRR) 값이 0.713을 보였다.
-
이 논문에서는 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템에서의 거리 함수를 다양화하면서 그 성능 변화를 살펴본다. QbSH는 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 왔으며, 많은 경우, dynamic time warping (DTW) 방법으로 사용해서 정합하고 있다. 그러나, DTW에서 사용하는 거리에 대해서는 특별한 관심을 가지지 않았으며, 일반적으로 절대적 차이값이나 그것의 제곱값을 많이 사용해 왔다. 이 논문에서는 여러 가지 거리에 대해서 성능을 측정하였다. 성능측정은 특정한 시스템에서 이루어진 것이기 때문에 일반성을 가지지 않을 수 있으나, DTW에서 사용하는 거리를 기존의 것과 다른 것으로 변화시켜서 성능을 향상시킬 가능성이 있음을 이 논문에서는 밝힌다. 본 논문에서는 10-12초 길이의 1000번의 쿼리 (Query)에 대해서 28시간 정도의 데이터베이스에서 실험한 결과, 논문에서 제안하는 거리가 기존의 절대적 차이값을 사용한 것보다 제1후보 검출 정확도가 10% 가량 상승함을 확인할 수 있었다.
-
다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. MPEG 에서는 2008 년 10 월부터 MPEG-D USAC 기술에 대해 CfP 를 시작으로 본격적으로 표준화를 진행하고 있으며, 2011 년 3 월 96 차 미팅에서 Study on DIS 까지 승인하였다. 본 논문에서는 LPD 모드의 TCX 윈도우의 변경을 통한 USAC 성능향상 방법은 제안한다. TCX 프레임의 연결에 고정된 크기의 중첩만을 이용하는 현재의 방식과는 달리, 이전 TCX 모드와 다음 TCX 모드, transient 의 존재 유무에 따라 적절하게 TCX 윈도우 중첩크기를 조절하여 음악 특성 신호에 대해 LPD 모드의 음질을 개선할 수 있다.
-
본 논문에서는 지상파 3D HDTV 방송 서비스를 제공하기 위하여 기존의 유럽형 HDTV 방송 서비스인 DVB-T2 전송 시스템의 채널 부호군을 연구하고, 이 시스템의 외부 부호(Outer Code)로 쓰이는 BCH 부호의 경판정(Hard Decision)을 통한 복호를 연판정(Soft Decision)을 통한 복호로 수정함으로써 성능에 미치는 영향에 대해 살펴보았다. 또한 기존의 DVB-T2 전송시스템의 성능을 살펴보고, 이를 바탕으로 기존의 외부 부호(Outer Code)인 BCH 부호와 내부 부호(Inner Code)인 LDPC 부호의 조합을 연판정이 가능하고 복호하는 블록(Block)의 길이가 더 짧아진 BTC(Block Turbo Code)부호와 LDPC 부호와의 조합으로 바꿈으로써 기존의 DVB-T2 전송 시스템보다 블록 오류율이 낮아짐을 확인하였다.
-
최근 들어 케이블 방송망을 기반으로 한 디지털 방송, VoIP(Voice over Internet Protocol), VOD(Video on Demand), 영상전화, 이동전화, 무선 랜 로밍 등의 다양한 멀티미디어 서비스의 출현과 향후 도입될 새로운 융합형 멀티미디어 서비스의 수용을 위해 케이블 망의 고도화에 대한 요구가 제기되었다. 특히 유럽을 중심으로 이러한 요구를 만족시키기 위해 DVB(Digital Video Broadcasting)-C2 규격의 개발이 진행되었다. DVB-C2 규격에서는 기존의 게이블 전송 규격인 DVB-C에 대해 30% 이상의 전송 효율을 높이고자 새로운 변조 방식과 채널 오류정정 부호 방식을 도입하였다. 이에 본 논문은 본 논문에서는 DVB-C2 규격에서 도입된 채널 오류정정 부호인 BCH(Bose, Chaudhuri, and Hocquenghem) 부호와 LDPC(Low Density Parity Check) 부호의 연접 방식에 대한 성능을 검증하고자 한다. 이를 위해 개발된 시뮬레이터의 소개와 이를 통한 시험결과를 제시한다.
-
손실 채널의 데이터 손실을 보상하는 오류 정정 부호로 주로 사용되는 LT 부호는 일반적으로 RSD (robust soliton distribution)을 따르는 nonsystematic 구조를 가진다. RSD 를 따르는 유한한 길이의 LT 부호의 경우 높은 손실률 가진 채널 환경에서는 적합하지 않다. 본 논문은 기존의 RSD 를 다소 변형하여 systematic LT 부호에 적합한 무게 분포를 설계 방법을 제시하고, 시뮬레이션을 통해 기존의 RSD 를 이용한 LT 부호와 논문에서 제안하는 systematic 성질을 가진 LT 부호의 성능을 비교해 본다.
-
본 논문은 이미지가 갖는 R, G, B 비율의 분산을 이용하여, 공간 영역에서 정보를 은닉하는 알고리즘을 제시한다. 웹 상에서 Jpeg, bmp, gif 등의 포멧을 갖는 이미지를 raw 파일로 변환한 후, R,G,B 비율을 구한다. 그 중 사람의 눈에 가장 둔감한 B 비율 분산을 조작하여 정보를 은닉하는데 이용한다. 또한 오류율을 낮추기 위하여 (15,7)BCH Code 를 사용한다. 제안된 알고리즘이 JPEG(Joint Photographic coding Experts Group) compression, scale(이미지의 크기 변화), Mediancut 과 같은 이미지 변화에 강한 특성과 정보은닉 후에도 화질열화가 발생하지 않는 특성을 실험을 통해 보인다.
-
본 논문에서는 초고속 근거리 무선전송을 위한 60GHz 시스템에서 릴레이를 이용한 협력통신 기법을 제안한다. 60GHz대역은 LOS(Line-Of-Sight)가 보장되어 있지 않은 경우에 거리에 따른 신호 감쇄가 심하여 릴레이를 이용한 협력 통신 기법이 효과적이다. 릴레이를 이용한 협력통신 방법은 크게 증폭 후 전송(AF)과 복호 후 전송(DF)의 두 가지 프로토콜로 나누어지며, AF프로토콜은 Soft information을 보낼 수 있다는 장점이 있고 DF프로토콜은 릴레이에서 복호 후 데이터를 보낸다는 점에서 부호화 이득을 얻어 낼 수 있다는 장점이 있다. 또한 AF와 DF의 장점을 결합한 복호 후 증폭 전송(DAF)프로토콜이 소개되었고 이에 대한 분석이 이루어졌다. 이에 본 논문은 60GHz 시스템과 AWGN, Rayleigh 페이딩환경에서 AF프로토콜에 대한 DAF프로토콜의 성능 이득을 보이고 비교한다.
-
LDPC(low density parity check) 부호는 낮은 복잡성과 Shannon의 한계에 근접하는 오류 정정 능력을 보이기 때문에 turbo 부호와 함께 많은 응용분야에 적용되고 있다. 본 논문에서는 분산 동영상 부호화(distributed video coding: DVC) 시스템을 위한 부호율 적응적인(rate adaptive) LDPC 부호를 설계하기 위하여 패리티 점검 노드를 병합하는 방법을 제안한다. ACE(approximation cycles EMD) 알고리즘을 기반으로 효율적인 LDPC 부호를 설계하고 부호율 적응적인 특성을 갖기 위해 일정한 범위를 지정하고 지정된 범위에 따라 패리티 점검 노드를 병합한다. 그리고 ACE 알고리즘의 계수와 degree distribution을 변화시키면서 성능을 해석한다.
-
분산 동영상 부호화 시스템에서는 복호기에서 움직임 보상 보간 기법을 이용하여 부가정보를 생성한다. 생성된 부가정보와 원 Wyner-Ziv 프레임간의 차이를 채널 부호로 오류 정정하게 되는데 이때 부호기에서는 복호기에서의 오류 정정을 위하여 패리티 비트인 Wyner-Ziv 비트를 복호기로 보내게 되고 복호기에서는 이 Wyner-Ziv 비트를 이용하여 Wyner-Ziv 프레임을 복원하는데 더 많은 Wyner-Ziv 비트가 필요할 경우 피드백 채널을 통해 Wyner-Ziv 비트를 요청하게 된다. 이때 부호기에서 조건부 엔트로피를 구할 수 있다면 이를 이용하여 Wyner-Ziv 비트 전송량을 제어함으로써 피드백 채널을 제거 할 수 있다. 이를 위해 부호기에서도 부가정보를 알아야하는데 복호기에서 사용하는 부가정보 생성 기법은 복잡도가 높기 때문에 사용할 수 없다. 본 논문에서는 부호기에서 간단한 부가정보를 생성하는 방법을 제안하고 분산 동영상 부호화 시스템에 적용하여 피드백 채널을 제거하였을 때의 성능을 분석하였다.
-
ITU와 ISO/IEC가 공동으로 UHD급 영상 부호화를 위해 표준화를 진행하고 있는 HEVC 코덱은 H.264/AVC 대비 2배 이상의 압축 효율을 갖는 것을 목표로 정하고 있다. HEVC 코덱은 다수의 개선된 기술을 사용하고 있기 때문에 부호화효율을 크게 향상시킬 수 있었지만, 다른 한편으로 동작 복잡도가 매우 높기 때문에 여러 가지 다양한 응용 제품에서 활용되기 위해서는 복잡도 문제가 개선되어야 한다. 본 논문에서는 HEVC의 움직임 벡터 예측 시 현재 블록의 주변 블록들이 가지고 있는 참조 영상 정보를 이용하여 움직임 벡터 추정 모듈의 복잡도를 감소시키는 알고리즘을 제안한다. 본 논문에서 제안하는 알고리즘을 사용하면, 압축 영상의 화질 저하는 최소화하면서 부호화기의 동작속도를 크게 감소시킬 수 있음을 실험을 통해 알 수 있었다.
-
The fundamental problem of selective protection scheme for encoded bitstreams is to find an efficient algorithm to select the set of frames required to be encrypted that can maximize protection effect with the minimum amount of protected data is required. In this paper, we propose an optimal selective protection scheme for SVC bitstreams by protecting the best combination of frames for selective protection in the sense that the amount of data required for protection is minimized and the resulting visual quality degradation is maximized. The selection of the frames to be encrypted is done by first expressing R-Q (protection rate - visual quality) relationship with Lagragian cost model. The experimental results show that, compared to protecting SVC bitstreams layer by layer, the proposed scheme gives superior performance in terms of protection effectiveness due to its better selection of frames for protection given protection bit budgets.
-
본 논문에서는 향상된 중간 시점 합성 영상을 위한 깊이 영상 부호화 방식을 제안한다. 깊이 영상은 실제 영상과 다르게 날카로운 경계를 기준으로 완만한 변화를 가지는 픽셀 값을 가지는 특성이 있다. 따라서 깊이 영상의 부호화에서는 경계 영역을 효율적으로 부호화하는 것이 중요하다. 기존의 다시점 비디오 부호화기 (Multiview Video Coding)가 하나의 프레임 내에서 고정된 양자화 파라미터 값을 사용하는 것에 반해, 제안된 방식에서는 경계 영역을 효율적으로 부호화하기 위해 블록의 특성에 따라 적응적으로 양자화 파라미터를 할당한다. 2 차 미분 영상의 분포에 기반해 각 블록을 경계 블록, 평탄 블록, 일반 블록으로 구분하고 이에 따라 양자화 파라미터를 할당한다. 실험결과로서, 제안하는 방법의 성능이 다시점 비디오 부호화기 참조 소프트웨어 JMVC 8.3 에 비하여 BD-PSNR 이 평균 0.18dB 향상되고, BD-BR 은 평균 4.03% 감소되어 부호화 효율이 우수함을 확인할 수 있었다.
-
최근 손 동작 인식은 새로운 맨머신인터페이스(man-machine interface)를 위한 기술로 주목 받고 있으며, 이를 위한 손 검출은 손 동작 인식이나 손 추적을 위해 반드시 선행되어야 하는 중요한 기술이다. 기존에 연구되어온 대부분의 손 검출 방법으로는 색상을 기반으로 한 손 검출이었다. 하지만 색상을 기반으로 한 손 검출은 조명의 영향을 많이 받아 신뢰성을 보장하기 어렵다. 이러한 조명의 영향은 깊이 정보(depth information)를 이용함으로써 조명 변화에 강인한 손 검출을 수행할 수 있다. 본 논문에서는 손 검출을 깊이 정보를 활용하여 수행할 수 있는 방법을 제안하였다. 실시간으로 깊이 정보를 생성할 수 있는 depth sensor 하나를 사용하여 깊이 영상을 얻고 노이즈를 개선 해 준 후에 정의된 모션을 사용하여 손의 특징을 추출하여 손 검출을 하였다.
-
최근 3D 디스플레이가 3DTV는 물론 스마트폰이나 태블릿PC와 같이 작은 디스플레이 사이즈와 해상도를 가지는 휴대용 기기들에도 적용되어 다양한 형태로 사용자들에게 보급되어 보다 많은 관심을 받고 있다. 2D+Depth 형태의 입체영상에서 사용자에게 입체감을 주는 데는 깊이맵이 큰 영향을 준다. 또한 깊이맵이 복잡하게 구성되어 있을수록 사용자에게 보다 다양한 입체감을 제공할 수 있지만 실제로 사용자가 느끼는 입체감의 지각은 그렇지 못한 경우가 많기 때문에 사용자가 느끼는 임체감의 개선이 필요하다. 이에 본 논문에서는 깊이맵의 히스토그램을 기반으로 하여 깊이 평면과 깊이 편차를 이용하여 입체감을 개선하는 방법을 제안하고 주관적 실험을 통해 입체감의 변화를 확인하였다.
-
영역기반 스테레오 매칭의 분야에서 최근 인간의 시각체계(Human Visual System)에 기반하여 영역내의 밝기값과 거리값에 따라 적응적으로 가중치를 부여하는 적응적 영역 가중치(Adaptive Support-Weight) 방법이 좋은 매칭 결과를 보이고 있다. 하지만 이 방법은 영역 윈도우의 크기가 커짐에 따라 기하급수적으로 계산량이 많아지는 단점을 보이고 있다. 이에 Bilateral filter 수식으로 근사화 후 Integral Histogram 기법을 적용하여 영역 윈도우의 크기에 상관없이 상수 시간 O(1) 내에 매칭을 수행하는 연구가 진행되었다. 하지만 이 방법은 근사화 과정에서의 원 ASW 수식을 왜곡하기 때문에 매칭 정확도의 손실을 가져오게 된다. 이에 본 논문에서는 Bilateral 접근 방식, Sub-Block 방식 및 적응적 시차 탐색 방식에 대하여 각 방식에서 필요한 메모리 자원과 소모되는 계산량의 비용과 동시에 매칭 결과 정확도 면에서 비교하고 가장 좋은 접근 방식을 도출하고자 한다.
-
최근 3D 입체 영화 및 3D 방송 기술의 개발과 더불어, 사용자의 몰입감을 극대화하기 위하여, 3D 입체영상과 사용자의 인터랙션 효과를 융합하는 3D Interaction 기술이 개발되고 있다. 본 논문에서는 3D 디스플레이에서의 시각안전영역을 고려한 3D 사용자 인터페이스의 구현 방법에 대해서 소개한다. 사용자의 입력에 따라 객체의 변이 정보를 계산하고, 변이 정보가 사람의 시각안정영역 내에서 존재하도록 적응적으로 깊이를 조절하여, 사용자의 시각적 편안함과 3D 객체에 대한 조절 기능을 제공할 수 있다. 무안경 3D 디스플레이 상에서의 구현 결과를 통해 제안하는 기술의 효율성을 보여준다.
-
최근 소셜 미디어(Social Media)라는 말은 컴퓨터 관련 연구분야에 종사하는 사람들 뿐만 아니라 일반 사람들도 모르는 사람이 없을만큼 중요하고, 많이 쓰이는 말이다. 본 연구에서는 인터넷과 통신기기의 발달로 이러한 소셜 미디어들이 사용자들이 감당할 수 없을 만큼 생성되지만 이러한 소셜 미디어를 어떻게 사용하고 효율적으로 묶어서 표현해야 하는지에 관한 연구이다. 소셜미디어의 종류에는 블로그, 소셜 네트워킹 서비스(SNS), 위키, UCC, 마이크로 블로그 등으로 나누어진다. 본 연구에서는 Social Media를 기반으로 Tangible Blog를 위한 콘텐츠를 저작하는 시스템에 관한 연구를 진행한다. 여기서 소셜미디어는 일반적으로 사용되는 사진, 동영상, 효과음, 텍스트에 3D Contents를 추가는 것을 목표로 한다. 3D Contents는 현재 게임분야에 많이 사용되고 있는 Kinect를 이용하여 생성하고 이러한 소셜 미디어들을 Web 환경에서 Authoring 하는 방법에 관한 연구를 소개한다. 최종적으로는 현재 많이 사용되고 있는 Blog의 형태에서 발전한 Tangible Blog를 만드는 것이 목표이다. 여기서 Tangible Blog는 기존의 텍스트, 음악, 동영상 등의 소스를 이용한 사용자의 일상생활 및 의견 표현을 넘어선 3D Contents의 활용, 스토리텔링 기법 활용 및 Sensory Effect를 활용한 실감 있는 블로그를 만드는 것을 목표로 한다.
-
Broadcasting nature of wireless communications makes it possible to apply opportunistic network coding (OPNC) by overhearing transmitted packets from a source to sink nodes. However, it is difficult to apply network coding to the topology of multiple relay and sink nodes. We propose to use relay node selection, which finds a proper node for network coding since the OPNC alone in the topology of multiple relays and sink nodes cannot guarantee network coding gain. The proposed system is a novel combination of wireless network coding and relay selection, which is a key contribution of this paper. In this paper, with the consideration of channel state and potential network coding gain, we propose relay node selection techniques, and show performance gain over the conventional OPNC and a channel-based selection algorithm in terms of average system throughput.
-
MIMO(multi-input multi-output) 시스템은 여러 개의 송 수신기를 이용하여 정보를 전송하여 주파수 대역폭의 확장 없이 채널 용량을 증가시킨다. 그러나 공간 다이버시티를 증가시키는 STBC(space time block code)를 제외한 공간 다중화 방식을 사용하는 LDC(linear dispersion code) 시스템은 변조 레벨이 증가할수록 수신기의 복잡도가 기하급수적으로 높아진다. 본 논문에서는 하이브리드 LDC-MIMO 시스템을 적용하여 낮은 변조 레벨에서도 전송량을 증가시키면서 수신기의 복잡도를 감소시킬 수 있는 시스템을 제안한다. 제안된 알고리듬은 컴퓨터 시뮬레이션을 통하여 검증하였다.
-
본 논문에서는 그 동안 국내 지상파 DTV 방송의 임시대역으로 사용해 오던 Ch.61~69(752~806MHz)를 포함한 700MHz 대역의 주파수 Ch.52~69(698~806MHz)를 지상파방송 디지털전환 이후 경매에 의해 통신에 할당하려는 방송통신위원회의 정책 추진에 대한 기술적, 정책적 타당성을 분석하고, 디지털 방송에서의 주파수 필요성과 상관성을 비교하여 바람직한 주파수 정책에 대한 방향을 모색하고자 하였다. 디지털 방송의 경우 이 대역에서 차세대방송용으로 활용할 계획을 가지고 있으며 방송 콘텐츠산업과 디스플레이산업의 발전 촉매제로 간주하고 있다. UDTV(Ultra-HDTV) 및 Full-HD 3DTV 를 비롯하여 HD 혹은 Full-HD MMS(Multi Mode Service) 서비스와 무안경식 3DTV, 홀로그래피 3DTV 와 같은 차세대방송 환경 구축을 위해서는 우선 700MHz 대역의 주파수의 추가 확보와 정책적 지원의 필요성이 요구되고 있다. 본 논문에서는 무선통신과 방송분야의 주파수 요구 내용을 비교함으로써 바람직한 주파수 할당 정책에 대한 대안을 제시하였다.
-
본 논문은 디지털 케이블전송망인 HFC(Hybrid Fiber and Coaxial)망 기반하에서 6MHz 다수의 방송채널결합 기술을 이용하여, 대용량 3D 및 8K-UHD 콘텐츠 전송을 위한 방송망 채널결합형 200Mbps 급 1024-QAM 송수신시스템 개발에 대하여 기술한다. H.264 비디오 부호화기를 사용하여 8K-UHDTV 및 3D/UHD 융합형 서비스를 시청자에게 제공하기 위해서는 약 120~160Mbps 의 대용량 데이터 전송률이 확보되어야 한다. 이와같이 대용량 3D/8K-UHDTV 콘텐츠를 전송하기 위해서는 상대적으로 채널환경이 우수한 HFC 디지털 케이블망을 이용한 대용량 실감미디어 콘텐츠 전송기법에 대한 연구가 주목 받고 있다. 본 논문에서는 FPGA 를 이용하여 HFC 망 기반에서 기존 OpenCalbe/DOCSIS 3.0 256-QAM 대비 약 30% 전송효율이 개선된 3D/8K-UHDTV 대용량 실감미디어 콘텐츠 전송을 위한 방송망 채널결합형 1024-QAM 송수신기 구현 및 개발에 관한 내용을 기술한다.
-
컴퓨터-생성 홀로그램(computer-generated hologram, CGH) 기법은 실사객체 혹은 가상의 객체로부터 계산에 의해 디지털 홀로그램을 생성해 낼 수 있다. 하지만 HD급 해상도의 디지털 홀로그램 한 프레임을 일반적인 PC를 이용해 계산하기 위해서는 약 10분 정도가 소요된다. 이는 실시간 홀로그래픽 비디오 서비스를 어렵게 하는 문제점 중에 하나이다. 본 논문에서는 CGH 기법의 과도한 연산량을 줄이기 위해 깊이정보(depth-map) 비디오 프레임간의 공간적인 중복성을 이용하는 방법을 제안한다. 이 방법은 인접한 깊이정보 프레임간의 차이를 구해 동일한 깊이값을 갖는 좌표들의 CGH 계산을 생략하는 것이다. 제안한 방법을 적용한 결과 연산속도가 52%정도 향상되는 것을 확인할 수 있었다.
-
최근, 다수의 3D 콘텐츠가 개발되고 있으며 이러한 3D 콘텐츠는 스테레오 카메라를 이용하여 촬영되고 있다. 그러나 대부분의 3D 콘텐츠는 제작자의 개인적인 경험에 바탕을 두고 제작되고 있어, 일괄적인 기준이 모호한 상황이다. 이에 본 논문에서는 제공된 정보로부터 정확한 3D 정보들을 계산해주는 3D 계산기를 제안한다. 제안된 3D 계산기는 제작자의 선택을 돕고자, 주어진 정보로부터 정확한 기기의 위치, 받침대의 위치, 시차, 카메라와 렌즈의 떨어진 거리등을 계산해준다. 따라서, 제안된 3D 계산기는 촬영 대상 물체가 실제 영화관이나 3D Display 상에서 어떻게 보여지는지를 미리 계산하여 보여줌으로써, 3D 콘텐츠를 제작함에 있어 제작시간을 줄이고 제작자의 의도를 정확하게 반영할 수 있도록 도와준다. 제안된 3D 계산기는 windows OS, iOS, 그리고 android OS 등 다수의 OS에서 사용 가능하도록 다수의 OS상에서 포팅이 되어 있다.
-
3D 영상산업이 발전해 오면서 현재 3D 영상으로 가장 많이 사용되는 것이 stereoscopic 이다. 이러한 stereoscopic 영상을 표현해 주는 기기로써, 셔터식 혹은 편광식 3D 디스플레이가 사용되고 있으며 두가지 방식 모두 제품화가 이루어져 경쟁을 하고 있는 상황이다. 그러나 이러한 3D 디스플레이에 관련하여 crosstalk 문제는 해결해야 하는 가장 큰 문제로 남아 있다. 본 논문에서는 편광식 3D 디스플레이의 다양한 파라메터에서 나타날 수 있는 crosstalk를 시뮬레이션하여 보여주는 시뮬레이터를 제안한다. 다양한 옵션하에서 나타날 수 있는 crosstalk를 시뮬레이션하여 보여줌으로써, 3D 디스플레이의 제작에 있어 crosstalk를 최소화하기 위한 최적의 파라메터를 찾을 수 있다.
-
3D 영상산업이 발전해 오면서 현재 3D 영상으로 가장 많이 사용되는 것이 바로 stereoscopic 영상이다. 이러한 영상은 인간의 뇌를 속임으로써 화면에 비쳐지는 영상이 마치 화면 밖에 위치하는 것 같은 착각을 일으키게 만들어 3D영상을 인식할 수 있게 해준다. 이때 사람이 양안시를 인식하는 문제에 관한 연구는 이미 안경학에서 많은 발전을 이루어 왔지만, 현재 논의의 중점인 3D 양안시력은 평소 사람이 사용하는 양안시가 아닌 3D Display에서 비춰지는 영상을 다양한 방법으로 양쪽 눈에 다른 영상을 인식하게 함으로써 입체를 인식하게 하는 것이며, 이러한 3D 양안시력을 측정하는 방법에 대해서는 기존의 양안시력과는 다른 측정 방법을 적용하여야 한다. 따라서 이 논문에서는 이러한 3D 입체 영상에 대한 입체시를 측정하는 방법에 대하여 제안한다.
-
디저털 홀로그래피는 CCD를 이용하여 간섭 패턴을 기록하고 기록된 간섭무늬에 담겨진 물체의 정보로 입체영상을 복원하는 기술을 말하며, 현미경을 이용한 디지털 홀로그래피 기술은 3D 형상 복원이나 바이오포토닉스 등 다양한 분야에서 사용되고 있다. 하지만, 디지털 홀로그래피 기술은 촬영된 간섭패턴에서 픽셀의 위상차가 레이저 파장의 1/2 이상일 경우, 기존의 phase unwrapping 알고리즘으로는 해당 픽셀의 위상차이를 계산할 수 없는 문제가 있다. 이와 같은 문제를 해결하기 위해 본 논문에서는 다수의 홀로그램 영상과 깊이맵을 사용하여 완전한 형태의 깊이맵을 구하는 방법을 제안한다.
-
본 논문에서는 안경식 스테레오스코픽 3DTV에 대한 효율적인 주관적 화질평가 방법에 대한 논의를 한다. 3DTV의 주관적 화질평가는 시각피로나 신체적 불편감을 유발하는 요인들을 규명하고 평가하여 사용자가3D 영상물을 관람할 때 이들을 최소화하면서 컨텐츠 제공자가 의도한 입체 깊이를 시청자가 지각 할 수 있도록 도와 줄 수 있도록 가이드라인을 제공하기 위해 이루어진다. 주관적 화질평가를 위해 적절한 깊이감을 갖는 카메라기반의 실영상과 컴퓨터 그래픽 기반의 3D컨텐츠를 사용하였다. 설문은 디스플레이 자체와 3D컨텐츠에 대한 화질평가 구분을 하고, 전문가와 일반인들을 대상으로 이루어졌다. 주관적 평가에 앞서 평가결과에 대한 객관성을 유지하기 위해 Random-dot Stereogram을 이용하여 개인별 입체시 평가를 하였다. 일반인들의 경우 전문가들에 비해 상대적으로 응답편차가 많이 발생하였으나 전문가 집단과 일반인 집단의 설문응답 경향은 대체적으로 일치하였다. 전문가 그룹의 주관적 평가 결과를 적절히 반영하고 일반인들의 응답편차를 줄임으로써 3DTV에 대한 주관적 평가에 대한 시간과 비용을 효율적으로 줄일 수 있을 것으로 기대된다.
-
홀로그램은 레이저 빔의 간섭을 이용하여 입체영상을 광학적으로 기록하는 방법으로 동영상의 기록 및 재생에는 여러 제약 조건이 따른다. 때문에 광학적 방법으로는 홀로그램 TV 시스템을 구현하기 힘들다. 이런 단점을 극복하기 위해 컴퓨터를 이용해 홀로그램을 구현할 수 있다. 즉, 광학적인 신호들을 근사화한 후 컴퓨터에서 수학적인 연산을 거쳐 간섭 무늬를 계산하는 Computer generated hologram(CGH) 방법을 사용하여 패턴을 생성한다. 하지만 CGH 기법의 경우 상당한 연산을 필요로 하기 때문에 연산을 최적화하여 홀로그램 생성에 걸리는 시간과 비용을 최소화하려는 연구들이 많이 진행되고 있다. 본 논문에서는 이전에 연구된 CGH 고속 연산을 위한 알고리즘을 정리하며 연산 식의 최적화를 통해 연산을 횟수를 줄이는 방법과 look-up table 을 이용한 방식의 연산량과 하드웨어 비용을 계산하여 multi-processor 에 적용 시 어떤 알고리즘이 유리할지 제안한다.
-
본 논문에서는 안드로이드 운영체제 기반 스마트폰에서 Camera Preview를 이용하여 실시간으로 3D 입체영상을 생성하는 기법을 제안한다. 3D 입체영상은 2D 영상에 깊이감을 부여하여 시청시에 입체감을 느낄 수 있도록 변환한 영상이다. 그러나 모바일 단말기에서는 이러한 3D 입체영상을 생성하더라도 하드웨어의 제약으로 인해 사용자가 만족할만한 성능을 구현하는데 어려움이 있다. 먼저 안드로이드 운영체제에서 카메라를 사용하기 위한 구성 및 방법에 대해서 설명하고, 그에 따른 3D 입체변환 알고리즘을 제안한다. 제안 방법에서는 단말기의 성능에 맞는 우수한 결과를 생성하기 위한 에지 추출, 깊이맵 생성 방법을 분석하고, 획득한 깊이맵을 기반으로 하여 좌영상과 우영상을 생성한다. 최종적으로 획득한 두 영상을 병합하여 화면에 Display한다.
-
현재의 IT 산업은 개인 컴퓨터에서 벗어나 이동이 가능한 mobile 분야에서 최근 mobile에 smart를 추가한 ubiquitous로 최근 변화하고 있다. 또한 스마트폰의 보급으로 3D 산업은 monitor display 에서부터 mobile display로 이동하고 있는 추세이다. 하지만 현재까지 3D산업의 mobile display는 device의 공급 부족과 콘텐츠 부족으로 인해 실생활에서 사용되고 있지 못하다. 따라서 안드로이드 폰을 기반으로 한 스마트폰을 이용하여 실시간 입체 영상을 구현하여 원활한 실시간 mobile 3D display 의 가능성과 향후 개선 방향을 제안하고자 한다. 본 논문은 Digital Image Stabilization을 사용하여 motion vector를 계산하여 실시간으로 입체 영상을 구현하는 방법을 제안한다.
-
최근 스마트폰의 급속한 성장에 이어 보급률 또한 급증하고 있다. 또한 아이폰 및 안드로이드 등 스마트폰 시대를 이끌어나가는 대표적인 OS마다 다양한 API를 공개하고 있어 더욱 질 좋고 다양한 스마트폰 어플리케이션이 연구되어지고 있다. 본 논문에서는 스마트폰의 모노 카메라를 이용하여 입체영상을 제작하고, 여기에 증강현실 콘텐츠를 합성하는 스마트폰 입체 증강현실 시스템을 제안한다.
-
최근 3 차원 디스플레이 기술의 발전에 힘입어 3 차원 컨텐츠에 대한 수요도 늘고 있다. 스테레오스코픽(Stereoscopic) 렌즈를 이용하여 3 차원 컨텐츠를 만들거나 여러 장의 2 차원 영상을 이용한 3 차원 복원 연구가 활발히 진행되는 가운데 본 논문에서는 단일 2 차원 영상을 이용해서 깊이 지도를 획득하는 알고리즘을 제안한다. 단일 영상을 보고 3 차원 구조를 파악하는 인간의 시각 체계의 능력에 착안하여 본 논문에서는 단일 영상을 이용하여 깊이 정보를 추출하는 알고리즘을 제안한다. 깊이 단서들 중, 가림 단서를 소개하고 추가로 인간의 시각 체계에서 사용하는 깊이 단서들을 결합하여 기계 학습 알고리즘에 접목시킨다. 실험을 통해 우리는 제안 알고리즘이 물체의 외곽정보를 이용하여 양질의 깊이 지도를 준다는 것을 확인할 수 있다.
-
최근 3D 콘텐츠의 관심 증가는 Display 장치, 모바일 기기 등의 하드웨어적인 발전을 가져왔고, 이에 따른 입체 콘텐츠의 필요성이 대두되고 있다. 본 논문에서는 자동으로 2D영상을 3D입체영상으로 변환하는 기법을 제안한다. 영상에서 에지맵과 채도 영상을 추출하고 합성하여 깊이맵을 생성하고 필터를 통해 노이즈 제거 등 보정 작업하여 최종 깊이맵을 생성한다. 이 깊이맵을 이용해 2D영상의 시프트된 영상을 만들어 입체영상을 생성한다.
-
가변적인 블록을 이용하는 H.264/AVC 인터 화면에서의 모드 결정 방법은
$16{\times}16$ 부터$P8{\times}8$ 모드까지 인터 모드에 대해 비트율 왜곡값을 계산 한 뒤 공간적 상관도를 고려하기 위해 인트라$4{\times}4$ 와 인트라$16{\times}16$ 모드까지 비트율 왜곡값을 계산하고, 계산된 비트율 왜곡값 중 가장 작은 값을 갖는 모드를 최종 모드로 선택한다. 하지만 이러한 과정으로 부호기의 복잡도는 증가한다. 복잡도를 감소시키기 위해 본 논문에서는 IPPP구조에서의 인터 모드와 인트라 모드의 특징을 이용하여 고속 부호화를 제안한다. 제안하는 알고리즘은 인터 모드에 대해서 최적 모드를 결정하기 위한 비트율 왜곡값의 상관도와 시간 상관도를 이용하고, 인트라 모드에 대해서는 인트라 화면 내에서의 각 인트라 모드에 대한 최대 최소 임계값을 이용하여, 발생확률이 낮은 인터와 인트라 모드의 활성화 여부를 결정한다. 본 알고리즘의 적용 범위는 상대적으로 인터 화면에서 발생 빈도가 낮은$16{\times}8$ ,$8{\times}16$ ,$P8{\times}8$ 와, 인트라$4{\times}4$ , 인트라$16{\times}16$ 모드이다. 제안하는 알고리즘은 기존의 H.264/AVC에 비해 1.36% 비트가 증가 했고, PSNR은 0.06dB 감소했다. 즉, 부호화 효율의 큰 감소 없이 평균 42.58%의 부호화 시간을 감소시켰다. -
본 논문에서는 깊이 맵의 재배열 과정을 통해서, 보다 개선된 영상을 합성하는 방법을 제안한다. 제안하는 방법은 전체 깊이 맵을 여러 그룹(Group)으로 나누고, 각각의 그룹에 서로 다른 가중치를 주어 가까운 물체에 좀 더 많은 깊이 값을 가질수 있도록 조절하였다. 깊이 맵 추정(Depth Estimation) 및 중간 시점 영상의 합성(View Synthesis)을 통하여 기존 방식과의 비교를 진행하였고 그 결과, 전체적인 비디오 시퀀스(Video Sequence)에 대한 PSNR은 유지하면서, 보다 시각적으로 자연스러운 영상을 얻을 수 있었다.
-
Bae, Yun-Jin;Lee, Yoon-Hyuk;Kim, Dong-Yoon;Lee, Jae-Won;Choi, Hyun-Jun;Seo, Young-Ho;Kim, Dong-Wook 356
본 논문에서는 깊이영상 기반의 영상합성과 다시점 영상 생성 기술을 이용하여 3차원 입체 콘텐츠를 제작하는 방법을 제안하였다. 이를 위해 깊이영상을 촬영한 후에 깊이정보를 조절하고, 레이어 기반의 영상으로 합성한 후에 이를 이용하여 다시점 영상을 생성하였다. 깊이카메라와 RGB 카메라로 구성된 카메라 시스템을 이용하여 객체들을 촬영함으로써 객체에 대한 3차원 정보를 획득하고 이를 데이터베이스화하여 3차원 영상을 합성하고 생성하는데 이용한다. 3차원 영상의 위치 및 거리를 고려하여 객체의 3차원 정보를 조절하고, 레이어 기반으로 하나의 영상으로 합성한다. 합성된 영상은 다시점 영상 생성 도구를 이용하여 원하는 시점만큼의 다시점 영상들로 생성된다. 본 논문에서는 객체와 사람의 영상을 합성하였고, 이들을 이용하여 각각 37시점의 다시점 영상을 생성하였다. -
Lee, Yoon-Huyk;Kim, Dong-Yun;Bea, Yoon-Jin;Lee, Jae-Won;Choi, Hyun-Jun;Seo, Young-Ho;Kim, Dong-Wook 359
본 논문에서는 고속으로 디지털 홀로그램을 생성할 수 있는 하드웨어구조를 제안하였다. 수정된 컴퓨터 생성 홀로그램(computer-generated hologram, CGH) 알고리즘을 이용하고, 전체 화소에서 홀로그램의 한 화소씩 연산하는 방법을 선택하여 홀로그램 한 화소씩 계산하고 바로 출력 하여 메모리 병목현상을 제거하기 위한 파이프라인 기반의 하드웨어 구조를 제안하였다. CGH 알고리즘을 바탕으로 입력부, 연산부, 및 정규화부로 구성된 디지털 홀로그램 생성기의 구조를 제안하였고, 객체의 화소만 저장하여 반복 사용하기 때문에 메모리의 사용량을 줄일 수 있었다. 제안한 하드웨어는 세로 방향으로 확장을 하여 동작을 병렬화시킬 수 있다. 제안한 하드웨어는 1K의 광원에 대해 HD급 홀로그램을 초당 약 87장을 생성할 수 있었다. -
이 논문에서 제안한 방법은 간단하게 중간 시점 깊이 영상을 생성하는 방법이다. 왼쪽 시점과 오른쪽 시점 두 가지 깊이 영상을 가지고 깊이값을 계산 한 후 깊이값과 시점의 이동에 따라 물체의 위치가 변화하는 상관관계를 간단한 식으로 계산해 중간 시점을 만든다. 중간 시점을 생성 한 후, occlusion영역을 채우는 방법과 픽셀 이동에 따른 노이즈 감소 방법을 사용한다. 우리가 생성한 중간 시점의 PSNR은 32.255dB이며,
$1,920{\times}1,080$ 영상 기준 한 장당 약 0.406s의 생성 속도를 갖는다. -
본 논문에서는 시청자의 색상 특성을 고려하여 양안식 영상에서의 색상 불일치를 예측하는 방법을 제안했다. 먼저 색상 불일치 예측을 위한 주관적 평가로 색상 민감도 평가를 수행했다. 기본 세 채널 색 R, G, B에 대해 각각의 색상의 오차 범위를 결정한 후, 이를 기반으로 관심도와 복잡도를 평가하여 보다 세밀한 주관적 평가를 수행했다. 실험 결과를 통해 제안한 방법이 기존의 색상의 품질을 평가하기 위해 사용하는 유클리디안 색 거리 계산 방법과 US & Canadian Government Printing Offices의 품질 수준 규격(Qulaity Level Specifications)을 이용한 방법보다 효율적으로 색상 불일치 여부를 평가함을 확인했다.
-
본 논문에서는 가상 시점 생성 시 발생하는 홀 영역의 메움 기법에 관하여 기하학적 제약조건을 이용한 예제 기반 영상 인페인팅 기술을 제안한다. 생성된 가상 시점이 실제 카메라들의 중간에 위치하는 경우, 이 때 발생하는 홀 영역은 시점 간 보상으로 메울 수 있다. 하지만, 가상 시점이 실제 카메라들의 Field-of-View를 벗어난 경우에는 홀 영역에 대한 정보가 없기 때문에 이를 메우는데 어려운 문제가 따른다. 이러한 문제를 해결하기 위해 제안한 방법은 예제 기반의 영상 인페인팅 기술을 이용하여 홀 영역을 메운다. 제안한 방법은 홀 영역의 기하학적 특성을 제약조건으로 우선순위(Priority)를 계산한다. 최적의 패치를 찾기 위해 컬러 정보뿐만 아니라 깊이 정보(Depth)를 활용한다. 또한, 전경 물체의 텍스쳐로 인하여 잘못된 패치가 선택되는 문제를 해결하기 위해 적응적으로 패치 크기를 변경한다. 실험 결과에서 제안한 방법은 일반적인 홀 메움 방식과 비교하여 객관적 평가와 주관적 평가 모두에서 시각적으로 우수한 결과를 보여주었다.
-
최근 들어, Time-of-Flight (TOF) 방식의 깊이 센서가 컴퓨터 비전이나 영상처리분야 등의 연구에서 다양하게 활용되고 있다. TOF 방식의 깊이 센서는 실시간으로 정확한 깊이 정보를 획득할 수 있는 장점이 있는 반면, 해상도가 낮고 센서의 광학적 특성으로 인해 노이즈가 발생한다는 단점이 있다. 본 논문에서는 이러한 깊이 센서의 단점을 극복하고 고품질의 다시점 영상 합성을 위해 기존 깊이 센서에 여러 대의 Charge-coupled Device (CCD) 카메라를 결합하여 시점 간 일관성 있는 고해상도의 깊이 영상을 획득하는 기술을 제안한다. 한정되어 있는 시점의 영상을 이용하여 다시점 영상을 합성할 때, 각 시점에 해당하는 깊이 영상의 정확도에 따라 합성되는 영상의 품질이 결정된다. 따라서 보유 시점에 해당하는 깊이 영상 간의 일관성이 유지되고 객체의 경계가 정확히 보존되어야만 생성되는 임의 시점 영상의 품질이 보장될 수 있다. 이에, 본 논문에서는 Joint Bilateral Upsampling (JBU)을 기반으로 시점 간 일관성을 고려한 깊이 영상의 해상도 개선 기술을 제안하고 이를 통해 다시점 영상 합성 결과의 품질을 향상시킨다.
-
본 논문에서는 스테레오스코픽 영상 및 깊이 프레임 오류 은닉 알고리즘을 제안한다. i) 좌측 컬러 프레임 오류 발생시 시간적 상관관계를 이용하여 프레임을 복원한다. iii) 우측 컬러 프레임 오류 발생시 깊이 정보 및 DIBR 기법을 이용하여 좌 우 시점간의 매칭 픽셀을 예측하고, 매칭된 픽셀의 움직임 벡터 및 밝기 차이를 이용하여 프레임을 복원한다. iii) 좌측 깊이 프레임과 iv) 우측 깊이 프레임의 오류 발생시 좌 우측 컬러 프레임의 움직임 벡터를 이용하여 손실된 프레임을 복원한다. 컴퓨터 모의 실험을 통해 제안하는 알고리즘의 스테레오스코픽 컬러 및 깊이 프레임 오류 복원 성능을 확인한다.
-
스테레오스코픽(stereoscopic) 3D 비디오 서비스는 기존 2D 와의 호환성을 유지하면서 새로운 3D 비디오 서비스를 제공할 수 있는 것으로, 전송 대역이 제한된 지상파 방송에서 높은 부호화 효율을 갖는 스테레오스코픽 비디오 코덱이 요구된다. 따라서 3D 를 위한 부가영상의 부호화를 위해 H.264/AVC 등을 고려하고 있으며, 또한 부가영상을 비실시간으로 전송하는 비실시간(Non-Real Time: NRT) 3D 서비스도 고려되고 있다. 본 논문에서는 NRT 3D 서비스를 위한 스테레오스코픽 비디오 부호화에 있어서, HEVC 에서 고려중인 적응루프필터(ALF: Adaptive Loop Filter)를 전/후처리 필터로 적용하는 기법을 제시한다. 특히, 부가영상의 후처리에 ALF 를 적용하기 위하여 부호화 과정에 결정되는 CU(Coding Unit) 구조를 이용하는 HEVC 와 달리 H.264/MVC 로 부호화한 부가영상의 매크로블록(MB) 부호화 모드를 이용한 ALF 적용 기법을 제안한다. 부가영상 부호화에 있어서 전처리 및 후처리 과정으로 ALF 를 적용함으로써 최대 약 20.5%의 부가영상의 부호화 성능 향상을 확인하였다.
-
DMB 와 같은 모바일 기기에서 3 차원 입체 영상 서비스를 제공하기 위해서는 스테레오스코픽 콘텐츠를 생성하는 단계에서 모바일 기기의 특성, 즉 3D 디스플레이의 특성을 고려하여 촬영하거나 또는 가공하여야 한다. 본 논문에서는 일반적으로 HD 급 고해상도로 촬영된 스테레오스코픽 3 차원 콘텐츠를 모바일 환경에 적합하도록 크기를 변환하기 위한 알고리즘 및 그에 따라 변환된 모바일 3 차원 영상의 분석 결과를 제시하고자 한다.
-
Kim, Dongyun;Lee, Yoon-Huyk;Bea, Yoon-Jin;Lee, Jae-Won;Choi, Hyun-Jun;Seo, Young-Ho;Yoo, Ji-Sang;Kim, Dong-Wook 385
본 논문에서 제안하는 알고리즘은 홀로그램의 생성 및 획득 방식에 따라서 해상도 스케일러블 코딩 방식과 광원 기반의 SNR 스케일러블 코딩 방식으로 구성된다.$1,024{\times}1,024$ 크기의 홀로그램에 대해서 홀로그램 기반의 해상도 스케일러블 코딩은 1:1에서 100:1의 압축율을 가지면서 여러 단계의 적응적인 서비스가 가능하도록 하였다. 광원 기반의 SNR 스케일러블 코딩은 1:1에서 100:1의 압축율을 가지면서 여러 단계의 서비스가 가능하도록 하였다. -
본 논문에서는 원거리에서 디스플레이를 제어하는 인터페이스를 제안한다. 제안하는 인터페이스는 사용자의 얼굴과 손을 관심 영역으로 규정하고, 이를 추적하여 사용자의 특정 동작을 인터페이스 입력으로 사용한다. 사용자에게 익숙한 손 동작을 인터페이스 입력으로 제공하고, 추가적인 장비를 강요하지 않는 비전 기반의 상호작용 방법을 이용하기 때문에, 사용자는 별도의 훈련 과정 없이 편하게 디스플레이를 제어할 수 있다. 빠르고 정확하게 사용자의 손을 검출하기 위해서 적외선 영상과 컬러 영상을 혼합하는 다중 비전 기반 방법을 사용하며, 손가락 끝 검출을 통해서 손가락 동작을 인식 한다. 인식된 동작을 원거리 통신방법을 이용하여 실제 디스플레이에 적용하여 효용성을 검증 한다.
-
본 논문에서는 시점제어형 미디어 서비스를 위한 안드로이드 기반 미디어 프레임워크 인터페이스를 설계 및 구현한다. 우선적으로 시점제어형 미디어 서비스의 필요성과 개념을 설명한다. 그리고 안드로이드 플랫폼에 포팅된 미디어 프레임워크 라이브러리 구조와 시점제어형 미디어를 재생을 위해서 필요한 인터페이스를 설계 및 구현 결과를 설명한다. 마지막으로 개발된 미디어 프레임워크 인터페이스를 활용하여 시점제어형 미디어 성능 및 기능 시험 및 결과를 보여주고, 향후 도래할 융합형 미디어 서비스를 위해 해결해야 할 문제점 및 해결 방안을 고민해 본다.
-
Ko, Yong Jae;Kim, Young Chul;Jo, Hyun Gyu;Kim, Hyung Do;Kang, Bong Sok;Kim, Hyung Jin;Park, Ki Seok;Kim, Seong Tae;Lee, Sung Hun 393
본 논문에서는 모바일 통신 방송 융합분야는 세계 각국이 서로 상이한 표준을 가지고 있어 해외 시장 진출 시 제품 신뢰성 확보를 위한 해외 현지에서의 테스트가 중요시 되어서 국내 기업의 테스트 비용과 개발기간 면에서 경쟁력 확보의 악재로 작용하고 있다. 따라서 모바일 통신 방송의 세게 각 국 표준의 테스트 인프라를 확보하고 이를 활용하는 테스트의 전반적인 시스템을 구축하여 국내 기업의 테스트 비용 절감 및 개발기간 단축과 다양한 서비스 개발이 가능하다. -
본 논문은 두 대의 카메라와 한 대의 프로젝터로 구성된 Pro-cam시스템을 이용하여, 출력된 패턴 영상을 카메라로 촬영하고 이를 기반으로 Depth Map을 계산하는 모듈의 실시간 처리를 위한 GPU기반 병렬처리 기법을 제안한다. 입력받은 영상으로부터 구조광의 패턴을 해석하고, Depth Map을 계산하기 위해서, Dynamic pattern decoding하는 과정은 프로젝터의 패턴영상과 촬영된 카메라 패턴영상 간의 관계를 반복적으로 비교하므로, 이를 GPU 프로그래밍을 이용하여 병렬 처리를 통해 고속화하였다. 결과적으로 본 논문에서는 기존 CPU에서 수행했던 속도에 비해 약 18배정도 속도를 개선 할 수 있었다.
-
카메라를 이용하여 정지 영상을 획득할 때 발생할 수 있는 모션 블러 (motion blur) 현상을 보정하기 위해서는 정확한 블러파라미터 (블러의 방향, 블러의 크기)의 추정이 가장 중요하다. 본 논문에서는 블러된 영상의 로그 스펙트럼 (log spectrum)의 비등방성 (anisotropic)과 엔트로피 (Entropy) 특성에 기반한 블러 파라미터 추정 방법을 제안한다. 제안하는 기법은 1D 로그스펙트럼을 이용한 비등방성의 효과적인 분석과 블러 크기의 정확도를 증가시키기 위한 보상 과정을 포함한다. 실험 결과를 통해 제안하는 기법이 단일 영상에서의 등속 직선 운동의 모션 블러 현상을 더 효과적으로 보정하는 것을 보였다.
-
모바일 영상 기기들에 사용되는 저전력, 고화질의 이미지 센서는 Rolling Shutter 방식을 사용하는 CIS(CMOS Image Sensor)이다. 구조적 특성에 의해 Rolling Shutter 방식을 사용하는 CIS는 촬영 환경에 의해 결과물에 왜곡을 일으키게 된다. 본 논문은 Rolling Shutter에 의한 왜곡을 분석하고 촬영된 영상의 Rolling Shutter 왜곡 모션벡터를 예측하는 알고리즘을 제안하였다. 또한 제안 알고리즘의 정확성을 높이기 위해 Sub-block과 Kalman-filter를 적용하여 Sub-pixel 단위로 계산하여 기존의 Lucas-Kanade 알고리즘 보다 효율적인 모션벡터 예측 알고리즘을 제안한다. 또한 보다 정확한 성능 변화를 추적하기 위하여 MSE 방식을 사용하여 비교 분석 하였다.
-
최근 방송과 통신의 융합으로 방송 통신 융합형 서비스가 활발해지고 있고, 사용자의 요구사항이 높아지고 있는 가운데 무선 채널을 이용한 인터랙티브 비디오 스트리밍 서비스는 가장 큰 서비스로 자리 잡고 있다. 인터랙티브 비디오 서비스중 하나인 파노라마 비디오는 기존의 고정적인 시청환경을 사용자가 능동적으로 선택할 수 있다는 측면에서 발전의 가능성이 큰 분야 중 하나이다. 하지만 넓은 시점을 가진 파노라마 비디오는 높은 대역폭이 요구된다는 단점이 있다. 이에 본 논문은 사용자가 파노라마 비디오 서비스를 받을 때 시청 시점을 변경시키면서 사용되는 비트율을 시공간적 필터를 사용하여 줄일 수 있는 방법을 제안한다. 이를 이용하여 고 대역폭 사용이 불가피한 파노라마 비디오 스트리밍 서비스의 요구 대역폭을 줄임으로서 인터렉티브 비디오의 스트리밍 서비스분야에서 효율적인 대역폭 사용을 위한 기술로 사용될 수 있음을 확인 할 수 있다.
-
영상 서비스에서 사용자가 시청하는 비디오 화질을 측정하는 것은 사용자의 QoE(Quality of Experience)를 추정할 수 있는 중요한 작업 중 하나이다. 이를 위해 가장 널리 쓰이는 측정 방법 중 PSNR이 있다. PSNR은 원본영상과 시청영상간의 각 픽셀 값의 차이를 계산하여 화질을 측정하는 객관적인 평가 방법이다. 본 논문에서는 객관적 평가 방법인 PSNR에 시청자가 영상 측정 시 느낄 수 있는 시선 인식 집중도를 접목시킨 품질 측정방법을 제안한다. 이는 사용자의 시각적 특성이 고려되기 때문에 보다 사용자에게 맞는 영상 품질을 측정할 수 있게 된다.
-
본 논문에서는 인간의 시각 인지 능력(Human Visual System; HVS)을 기반으로 하는 영상 품질 측정 방법을 제안한다. 보다 구체적으로 제안하는 시각 인지 기반의 영상 품질 측정 방법은 기존의 객관적인 품질 평가 방법인 PSNR 품질 측정 방법에 1) HVS 에 기반한 foveated contrast sensitivity 을 이용하여 집중 영역으로부터 거리에 따른 인식률 저하를 반영하였으며, 이와 동시에 2) Just Noticeable Distortion(JND)을 통해 영상의 휘도 대비 차이에서 오는 인식률 차이를 반영하여 사용자가 인지하는 품질을 계산하였다. 이러한 연구 결과는 특히 대형 영상의 부호화 과정에서 양자화 및 bit allocation, 또는 기 부호화된 영상의 전송 과정에서 차등화된 오류 보호 기술 등에 활용할 수 있을 것이다.
-
근래 다양한 형태의 멀티미디어 콘텐츠가 광범위하게 소비됨에 따라 단방향의 평면적 콘텐츠가 제공하는 시점의 한계에서 벗어나 사용자에게 보다 다양한 시점의 영상을 제공함으로써 사용자가 원하는 시점을 선택할 수 있는 실감형 콘텐츠에 대한 욕구가 증가하고 있다. 이러한 실감형 콘텐츠 중 하나인 파노라마 영상은 다수의 카메라를 통해 획득된 영상들을 하나의 영상으로 이어 붙여 넓은 시야의 영상을 제공함으로써 증대된 현장감과 몰입감을 제공하며 사용자 시점의 자유도를 증가시킬 수 있다. 본 고에서는 다수 영상의 스티칭 시 발생하는 고스팅 영향(ghosting effect)를 최소화 하기 위한 칼럼 시차 최소화 (Column Disparity Minimaization)기반의 멀티밴드 블랜딩(Multiband blending)을 소개 하고자 한다.
-
두 카메라 혹은 다수의 카메라에서의 컬러 보정은 알고리즘의 성능 향상 및 양안식 3D 카메라에서 매우 중요한 기술이다. 최근 컬러 보정 방법들이 다수 제안되었지만 이 방법들의 결과에 대한 정확한 측정 방법이 많지 않으며 기존의 측정 방법은 두 영상이 카메라의 위치에 따른 서로 다른 장면을 가지고 있을 경우에 적합하지 않을 수 있다. 본 논문에서는 컬러 보정을 위한 컬러 간의 유사성 측정 기법을 제안한다. 이 기법은 대상이 되는 두 영상의 장면이 일치하지 않는 경우를 고려하여 대응점 검색을 통해 두 장면 간의 같은 컬러를 가져야 하는 대응점을 찾고 이 대응점 주위의 영역으로부터 통계치를 계산하여 컬러의 유사성을 비교한다. 이 경우 두 영상의 위치 변화에 따른 장면 변화와 대응점의 약간의 어긋남에 대해서 고려할 수 있다. 또한 대응점들이 영상의 모든 영역을 포함하지 않을 수 있기 때문에 전체 영상의 통계치를 계산하여 컬러의 유사성을 비교도 동시에 수행하여 결과적인 컬러의 유사성은 대응점 기반과 전체 영상 기반의 유사성의 가중치의 합으로 결정되며 이 가중치는 대응점 기반의 컬러 비교가 영상 내의 얼마만큼의 영역을 포함하는지에 따라서 결정된다.
-
방송 환경과 인터넷 환경이 융합되고 스마트 TV의 등장에 따라, 사용자는 복잡한 미디어 서비스 환경에 노출되었다. 이로 인해 사용자가 접하는 미디어 콘텐츠의 종류와 데이터의 양은 기하급수 적으로 증가 하고 있다. 웹과 인터넷을 기반으로 하는 정보기술은 모바일 전자 기술의 발달에 따라 데스크탑 이라는 공간적인 한계를 벗어나 유기적인 유비쿼터스 환경으로 변화하고 있으며, 정보 및 콘텐츠의 개념은 웹문서와 텍스트를 넘어서 UCC, 음악, 영화 등의 모바일 멀티미디어 콘텐츠들로까지 빠르게 확장되고 있다. 또한, N-스크린과 IPTV 서비스의 등장은 사용자로 하여금 장소와 시간에 관계없이 미디어를 취득할 수 있는 이득을 제공할 수 있으나 사용자가 선택은 더욱 힘들어 졌다. 방송 통신 융합 단말에서 콘텐츠에 대한 정보를 제공 받기 위해서는 TV-Anytime 인터페이스, MPEG Query Format 인터페이스, OPEN API 등이 사용 가능하다. TV-Anytime 인터페이스는 대용량 저장 장치를 갖는 방송 단말기에서 메타데이터를 제공 및 검색하기 위한 인터페이스를 제공하며, MPEG Query Format 인터페이스는 MPEG-7을 기반으로 하는 메타데이터를 검색하기 위한 인터페이스를 제공한다. 또한, OPEN API는 업체들을 중심으로 공개적으로 제공 되어지는 API로 개방과 참여를 목적으로 한다. 이에 본 논문에서는 사용자의 콘텐츠 사용 정보를 바탕으로 선호 정보를 생성하고, 이를 바탕으로 콘텐츠에 대해서 강화된 정보를 생성하기 위한 서비스를 설계 및 개발한다.
-
3D 디스플레이 장치는 디스플레이 장치의 시점 수에 따라 다시점 디스플레이 장치 및 스테레오 디스플레이 장치로 구분할 수 있다. 스테레오 디스플레이 장치는 좌우 두 개의 영상을 디스플레이 방식에 따라 영상포맷을 변경하여 디스플레이에 보여지고 다시점 디스플레이는 두 개 이상의 영상 데이터를 포함하는 것으로 구분할 수 있다. 영상의 화질문제로 인하여 최근 3DTV는 스테레오 방식을 사용하고 있으며 대기업에서 양산하고 있는 기술이다. 스테레오 방식에서는 개인용 단말의 경우 사용자의 위치 및 눈의 위치에 따라 깊이감을 달리 보여주는 장치가 개발되고 있어 이에 대한 연구를 진행하였다. 이와같은 기술의 흐름에 맞춰 3D 디스플레이 장치를 위한 눈 추적 알고리즘을 구현하였다. 본 논문에는 카메라에서 입력되는 영상에서 얼굴영역을 Haar training 방법을 통하여 추출하였으며 PCA 방법을 통하여 눈 영역을 추출하였다. 알고리즘의 복잡도로 인하여 연산량을 줄이기 위하여 Downsampling 방법을 활용하여 연산량을 약 26% 감소시켰다. 본 연구 결과를 통하여 얼굴 및 눈 추적 알고리즘 구현시 최적화를 위하여 필요한 프로세스를 예측할 수 있다.
-
본 논문에서는 카메라 내장형 텔레비전을 통해 획득한 영상을 이용한 간단한 체조 게임을 제안한다. 팔을 수평 방향으로 벌리는 과정을 간단한 체조 게임이라고 정의한다. 이를 위해 첫 번째 단계로 연속적으로 입력되는 영상의 평균 영상을 통하여 배경 영상으로 정의한다. 두 번째 단계로 배경 영상과의 차이를 이용한 사람 영역을 검출한다. 세 번째 단계로 검출된 사람 영역에 대해 세로 방향 축의 사영을 통해 특징 벡터를 구한다. 마지막 단계로 특징 벡터를 SVM(Support Vector Machine)을 이용해 학습 및 분류를 수행하여 간단한 체조 게임 인식을 위한 사람의 움직임을 구분하는 방법을 제안한다.
-
얼굴을 인식하는 방법은 많은 연구가 이루어져 왔으며, 이를 통해 다양한 형태의 어플리케이션으로 보급되어 왔다. 특히, 사용자의 인식은 사용자와 시스템 간의 한 차원 높은 인터랙션을 제공하는 것이 가능하다. 본 논문에서는 사용자에게 내츄럴한 인터랙션을 제공하기 위해 적외선 영상과 컬러영상을 동시에 입력 받아 추출된 휴먼 영역을 이용하여 사용자의 얼굴 인식을 수행하고 특정 사용자에게만 인터랙션을 제공하는 인터페이스 구현 방법을 제안한다. 이를 위해, 간단하게 제작된 시스템을 통해 같은 시점의 적외선과 컬러 영상을 추출하여 조명 변화에 강인하게 얼굴과 손 영역을 인식한다. 이는 얼굴 인식을 기반으로 사용자를 분별하여 서비스 하는 것이 가능하여, 다양한 어플리케이션으로 향상된 서비스를 제공할 것으로 기대한다.
-
본 논문에서는 알파벳 조합으로 생성되는 새로운 형태의 마커를 제안한다. 제안하는 마커는 일상 생활에서 흔히 접할 수 있는 알파벳으로 구성 되어 있고, 사용자가 직접 알파벳을 조합하여 마커를 제작하는 것 또한 가능하기 때문에 사용자에게 친숙하며 직관적인 상호작용이 가능하다. 제안하는 마커는 효과적이고 빠른 방법으로 인식이 가능하므로 평균 58.8fps 의 속도로 동작한다. 본 논문에서는 제안하는 마커를 이용한 어플리케이션으로 이것의 효용성을 증명한다.
-
Spectral segmentation is a major trend in image segmentation. Specially, constrained spectral segmentation, inspired by the user-given inputs, remains its challenging task. Since it makes use of the spectrum of the affinity matrix of a given image, its overall quality depends mainly on how to design the graphical model. In this work, we propose a sparse, multi-layer graphical model, where the pixels and the over-segmented regions are the graph nodes. Here, the graph affinities are computed by using the must-link and cannot-link constraints as well as the likelihoods that each node has a specific label. They are then used to simultaneously cluster all pixels and regions into visually coherent groups across all layers in a single multi-layer framework of Normalized Cuts. Although we incorporate only the adjacent connections in the multi-layer graph, the foreground object can be efficiently extracted in the spectral framework. The experimental results demonstrate the relevance of our algorithm as compared to existing popular algorithms.
-
최근 의료 장비들이 발전하고 진단 및 연구에 다양하게 이용되면서 이로부터 얻은 3차원 의료 영상들을 자동으로 처리해주는 기술의 수요가 늘고 있다. 자동 뼈 영역화 기법은 이러한 기술들 중 하나로써 골다공증이나 뼈 골절, 골격질환 등의 진단의 효율성을 크게 높여줄 것으로 기대되고 있다. 그러나 현재까지 이를 위한 다양한 연구들이 진행되었음에도 2차원 영상과는 달리 높은 데이터양과 주변 조직과의 모호한 경계들이 많다는 어려움 때문에 실제 진단에는 사용되지 못하고 있다. 이에 따라 본 논문에서는 다중 해상도를 기반으로 하여 영역화와 정합기법을 반복적으로 수행함으로써 3차원 의료 영상 내에서 자동으로 뼈를 영역화 해내는 기법을 제안한다. 낮은 해상도 단계에서 학습된 집합의 뼈 정보들을 이용하여 대략적인 뼈 위치를 검출하고, 이후 해상도를 높여가면서 정합 과정과 영역화 과정을 반복적으로 수행한다. 성능을 확인하기 위해 무릎 자기공명영상(magnetic resonance image)내에서 대퇴골(femur)과 경골(tibia)을 영역화 하는 실험을 진행하였으며 60개의 학습 데이터들을 바탕으로 40개 영상에서의 뼈들을 영역화 하였다.
-
본 논문에서는 적외선 스테레오 카메라를 이용하여 고속으로 날아가는 표적의 좌표들을 측정하고 회귀분석을 통한 오차특성을 이용하여 추정하는 시스템을 제안한다. 표적과 배경의 온도차이로 표적 영역을 검출하고 적외선 스테레오 카메라 정합과 카메라 파라미터를 이용하여 표적의 좌표를 추정한다. 본 논문에서 제안하는 적외선 스테레오 카메라 시스템을 검증하기 위해 3차원 궤적(x,y,z) 측정기로 표적의 속도와 거리를 측정하여 표적 궤도를 예측하고, 여러 차례 실험한 비디오 데이터로부터 스테레오 정합을 이용하여 z, x축의 거리(좌표)들을 구하고 회귀 분석(regression analysis)을 사용하여 최소 자승법(Least squares method)으로 표적의 궤적들을 비교하였다. 적외선 스테레오 정합 시스템에 오차특성을 적용하여 표적의 좌표를 보정할 수 있었다. 향후 다양한 표적들의 오차를 모델화하여 고속표적들의 좌표 측정을 향상 시킬 수 있을 것으로 기대된다.
-
본 논문에서는 조명 보정과 지역적인 밝기 정보를 이용한 유해 영상에서의 피부색 검출 방법을 제안한다. 첫번째, 조명의 영향을 줄이기 위하여 입력 영상을 히스토그램 평활화하여 명암 값의 분포가 한쪽으로 치우치거나 균일하지 못한 영상의 명암 값 분포를 균일화 시켜 영상을 향상될 수 있도록 한다. 그 다음, 평활화 시킨 영상을 25 개의 블록으로 분할한 후, 각 블록에서의 밝기 값에 대한 통해 평균과 왜도를 구한다. 구해진 값들을 영상의 임계값으로 설정하여 이진화 시킨다. 그리고, 평활화시킨 영상의 RGB 값을 Lab 컬러 공간으로 변환한다. 변환된 컬러 공간내의 조명 성분 값인 L(Luminance)값을 추출하여 이를 역변환 한다. 역변환한 L 값은 비정규 조명을 갖는 유해 영상의 조명에 민감한 영향을 제거하기 위하여 평활화 영상에 합한다. 마지막으로, 밝기 임계값을 통해서 얻어진 이진영상내의 객체 영역과 RGB 피부색 임계값을 통한 조명 보정된 평활화 영상내의 피부색 영역의 공통된 영역을 결과값으로 추출한다.
-
본 논문에서는 영상에서의 물체 인식에 주로 사용되었던 공간 피라미드를 변형시킨 각도 피라미드를 이용한 bag-of-features 방법으로 회전 변화에도 강한 물체 인식에도 적용할 수 있도록 한다. 기존의 공간 피라미드에서 수직의 격자 모양으로 영상을 나누었던 것에 비해 각도 피라미드는 영상의 중심을 기준으로 동일한 각도로 영상을 분할하여 피라미드로 만든다. 각 영역 안에서 특징들의 히스토그램으로 영상을 표현하고 영상간의 유사도는 각도 피라미드를 단계별로 순환적 자리옮김을 통해 회전시켜가며 히스토그램 교집합을 구하여 측정한다. 이 방법을 Caltech-101 데이터베이스에 적용해본 결과 회전 변환을 준 테스트 영상에 대해 기존의 공간 피라미드를 사용한 방법에 비해 높은 성능을 보이는 것을 확인하였다. 따라서 이 방법을 통하여 다양한 상황의 일반적인 물체 분류할 수 있을 것으로 기대한다.
-
본 논문에서는 챔퍼 디스턴스 매칭(chamfer distance matching)를 이용하여 위성 영상 상의 북한군 자주포진지(self-propellent artillery position)를 매칭하는 기법을 제안한다. 먼저 입력되는 위성 영상을 잡음환경에 강인한 가우시안-라플라시안 연산자를 이용하여 에지(edge)를 추출한다. 추출된 에지 영상의 각 픽셀에 대해 가장 가까운 에지까지의 거리를 나타내는 거리 변환(distance transform) 영상을 생성한다. 템플릿 영상은 다양한 자주포진지 영상에서 샘플링된 영상으로 에지를 추출한 후 거리 변환을 거친다. 마지막으로 템플릿 영상을 입력된 거리 변환 영상에 윈도우 슬라이딩(window sliding)하여 최소값의 가지는 위치를 구한다. 제안 기법은 잡음에 강인한 가우시안-라플라시안 연산자를 사용하여 기상조건에 의한 입력 영상의 편차에도 효율적인 매칭이 가능하다. 또한 에지 기반의 챔퍼 매칭을 이용하기 때문에 비 균일 조명 환경에서도 강인한 매칭이 이루어진다. 전산 모의 실험에서 제안 알고리즘은 입력 위성 영상 상의 자주포진지를 적은 계산량으도 신뢰있게 매칭함을 보여준다.
-
미토콘드리아의 수송은 치매, 다형성 경화증, 알츠하이머병 등의 신경성 질환과 관련하여 활발하게 연구되고 있다. 하지만 미토콘드리아 영상의 경우 일반 영상에 비해 노이즈(noise)가 많고 초당 프레임 수(frame-persecond)가 낮기 때문에 분석이 쉽지 않다. 이에 따라 미토콘드리아의 수송 통로인 축색돌기(axon)를 사전에 검출하고자 하는 연구들이 진행되고 있다. 본 논문에서는 이러한 배경을 바탕으로 미토콘드리아 영상에서 축색돌기를 자동으로 분리, 검출해내는 알고리즘을 제안한다. 배경이 비해 밝게 착색되어 있다는 미토콘드리아의 특성을 이용하여 축색돌기를 구분하는 데에 최대 화소값 기법(maximum intensity)과 혈관 증폭 필터(vessel enhancement filter)를 이용한다. 두 기법을 통해 얻은 축색돌기의 파편들은 로젠펠드 세선화(rosenfeld thinning)와 선형 보간법(linear interpolation)을 이용하여 연결되고 최종적인 검출 결과를 얻어낸다. 제시된 실험결과는 영상에서 전체적인 축색돌기가 성공적으로 검출되고 있음을 보여준다.
-
본 논문에서는 스테고 영상의 화질을 개선하기 위해 픽셀 값의 주변 통계적 특성을 고려한 보다 정확한 계수값을 사용한 픽셀 변형 방법을 제안한다. 이와 같은 방법을 사용함으로써 기존 방법의 삽입 용량을 유지하면서도 스테고 영상의 왜곡 정도가 줄어 PNSR 수치가 기본 방법보다 높아지게 된다.
-
본 논문에서는 data over cable service interface specifications (DOCSIS) 3.0 상향 케이블 모뎀에서 프리앰블을 이용하여 주파수 옵셋을 추정하고 보상하는 알고리즘에 대해 설명한다. 또한 본 논문에서 설명한 알고리즘을 적용한 컴퓨터 모의실험 결과를 보여준다. 송수신기에서 사용하는 오실레이터의 주파수 차이에 의해 주파수 옵셋이 발생하며 이를 얼마나 정확히 추정하여 보상하는가에 의해 수신기의 성능이 좌우된다. DOSCIS 3.0 상향 케이블 모뎀의 패킷 구조는 수신기에서 타이밍 동기나 주파수 옵셋 보상 그리고 채널 등화를 용이하게 하기 위해 송수신기간에 알고 있는 시퀀스를 보내는 프리앰블과 사용자 데이터를 보내는 페이로드로 구성된다. 본 논문에서는 여러 개의 constant amplitude zero autocorrelation (CAZAC) 시퀀스를 프리앰블로 사용하였으며 이 CAZAC 시퀀스를 이용하여 주파수 옵셋을 추정하고 보상하였다.
-
본 논문에서는 다중 반송파, 특히 OFDM 시스템의 PAPR 을 감소시킬 수 있는 CFR 알고리즘을 다룬다. 기존의 피크 윈도윙 기법이 윈도우 길이 내에 피크들이 여러 개 있을 경우, 과도 clipping 으로 인하여 성능이 열화되는 현상을 개선하기 위하여 포락선 기반 피크 윈도윙 기법을 적용한다. 뿐만 아니라, 피크 윈도윙이 가지고 있는 EVM 열화를 완화하기 위하여 기존의 단순 clipping 기법과 혼합하여 시스템에서 요구하는 EVM 성능뿐 아니라 ACLR 성능까지도 만족하도록 한다. MATLAB 을 이용하여 알고리즘을 검증하고, 하드웨어 구현을 위하여 Xilinx Virtex5 를 이용하여 검증하여 제안하는 기법의 복잡도는 높지만 EVM 과 ACLR 성능이 우수함을 알 수 있다. 효율적인 주파수 이용과 수신 성능 측면에서 우수한 성능을 보인다. 따라서 DVB-T 나 LTE, IEEE 802.16m 등의 차세대 방송 및 통신의 전송에 이용되는 OFDM 신호의 PAPR 을 효과적으로 줄일 수 있는 기법으로 적용될 수 있다.
-
최근 무선전송에서 SISO(single input singe output) 시스템의 전송률이 샤논 한계(Shannon limit)에 근접함에 따라, 이것을 극복하여 더 높은 데이터 전송률을 얻기 위해 MIMO(multiple input multiple output) 시스템에 대한 연구가 활발하게 이루어지고 있다. 현재 진행 중인 DVB-NGH 시스템 표준화에도 전송률 개선을 위해 MIMO SM(Spatial Multiplexing) 기술에 대해 고려하고 있으며, 방송 시스템 내 송수신 안테나들 간 상관(correlation)이 발생하는 경우에 성능 개선을 위해 Precoding과 MIMO SM을 결합한
$2{\times}2$ 구조의 MIMO SM 방법이 제안되었다. 이 방법은 두 개의 송신안테나에 모두 16QAM 신호가 전송되는 경우와 두 송신안테나에 각각 16QAM, QPSK 신호가 전송되는 경우를 포함하고 있다. 이때 고출력 증폭기(high power amplifier) 전단에서 두 송신 안테나에 서로 다른 변조가 적용되는 경우에 PAPR(peak-to-average power ratio)이 달라서 고출력 증폭기 출력단의 송신전력 차이로 인해 각 신호의 방송권역(coverage)이 같지 않은 문제가 발생한다. 본 논문은 이러한 문제를 극복하기 위해$2{\times}2$ MIMO SM 방식에서 송신 안테나별로 신호의 변조방식이 서로 다른 경우에 송신신호의 PAPR을 같게 하여 증폭기 출력단에서 각 송신신호의 전력이 동일하게 할 수 있는 방법을 제안한다. 제안한 방법은 수신기의 복잡도를 증가시키지 않으면서 두 송신 신호의 방송권역을 동일하게 한다. -
본 논문에서는 MIMO(multi-input multi-output) 시스템에서의 시간영역 채널 추정방법을 제안하였다. 제안된 알고리듬은 각 안테나에서 전송되는 시간영역의 OFDM(orthogonal frequency division multiplexing) 심볼 구간에 직교코드를 곱하여 기존의 채널 추정보다 긴 채널 추정이 가능하다. 제안된 알고리듬을 바탕으로 다양한 길이의 직교코드를 이용하여 채널추정이 가능함을 컴퓨터 시뮬레이션을 통해 검증하였다.
-
본 논문에서는 특징점 기반 색상보정을 이용한 다시점 비디오 부호화 전처리 방법을 제안 한다. 다시점 영상은 조명 및 카메라 간의 특성차이로 인해 인접 시점 간 색상차를 보인다. 이를 보정하기 위한 여러 가지 방법 중, 본 논문에서는 영상간의 대응되는 특징점들을 기반으로 상대적인 카메라의 특성을 모델링하고 이를 통해 색상을 보정하는 방법을 이용하였다. 대응되는 특징점을 추출하기 위해 Harris 코너 검출법을 사용하였고, 모델링 된 수식의 계수는 가우스-뉴튼 순환 기법으로 추정하였다. 참조 영상을 기준으로 보정해야할 타겟 영상의 색상값을 RGB 성분별로 보정했다. 테스트 영상을 가지고 실험한 결과 제안한 전처리 방법으로 보정을 하였을 경우, 전처리 과정을 거치지 않았을 때보다 화질 및 압축효율이 향상됨을 알 수 있었다. 또한 누적 히스토그램 기반의 전처리 방식과 비교했을 때, PSNR은 성분별로 0.5 dB ~ 0.8dB 정도 올랐고 Bit rate는 14% 정도 절감되는 효과를 확인 하였다.
-
율-왜곡 최적화 기법을 통한 화면내 예측 모드 결정 방법은 부호화 효율이 높지만 복잡도가 크다. 본 논문에서는 H.264/AVC의 율-왜곡 값의 특성을 분석하여 율-왜곡 최적화 기법에 사용되는 예측 모드의 후보를 줄임으로써 보다 빠른 휘도 화면내
$4{\times}4$ 예측 모드 결정 방법을 제안한다. 제안된 방법은 균일한 차분 블록값을 가지는 예측 모드와 균일하지 않은 차분 블록값을 가지는 예측 모드의 통계적 분석을 통해 부호화 속도를 향상시킨다. H.264/AVC의 참조 소프트웨어 JM 14.2와 비교하여 0.04[dB]라는 무시할 수 있는 PSNR의 손실을 가지면서도 0.3[%]의 비트율 절약과 19.6[%]의 부호화 속도 향상을 가져왔다. -
기존의 무손실 압축은 일반적으로 채널간의 상관관계를 거의 이용하지 않고, 각각의 채널을 따로 압축하였다. 본 논문에서는 컬러 이미지가 갖는 채널 간의 상관관계를 이용하여 무손실 압축의 성능을 향상시키는 방법을 제안하였다. 제안하는 방법에서는 채널 간 상관관계를 표현할 수 있도록 비대칭 샘플링을 이용하여 모자이크 이미지와 나머지 이미지로 나누어 압축을 수행하였고, 압축된 모자이크 이미지의 정보를 이용해서 나머지 이미지를 예측하여 압축할 정보의 양을 감소시켰다. 압축 성능을 평가하는데 일반적으로 사용되는 데이터들에 대하여 실험한 결과, 기존의 압축표준인 JPEG2000 lossless에 대해 평균 4.75%의 성능 향상을 보여주었다.
-
본 논문에서는 스마트TV향 VoIP(Voice over Internet Protocol) 컨퍼런스 기능을 위한 잡음제거 알고리즘의 성능비교 하였다. 기존에 연구 되어져 있는 Improved Minima Controlled Recursive Averaging(IMCRA)방식과 Gaussian분포 기반의 잡음제거 알고리즘, IMCRA방식과 Gamma분포 기반의 잡음제거 알고리즘, IMCRA방식과 Mel-filter를 적용한 잡음제거 알고리즘, R&L 알고리즘들의 방식을 비교하였으며, 성능 비교를 위해 각 알고리즘을 통해 나온 다양한 잡음 환경에서의 잡음이 제거된 신호의 PESQ와 연산속도를 비교한다.
-
최근 사회가 급속도로 발전하고 있는 동시에 흉악범죄가 증가하고 있다. 이에 따라 사람들은 범죄에 대한 안전 불감증이 증가하여 위기관리에 대한 관심이 높아지고 있다. 그리하여 다양한 보안업체가 생성되고 있고 이러한 보안업체들은 첨단기술을 이용하여 첨단장비를 만들어 사회 곳곳에서 치안 유지에 만전을 기하고 있다. 이렇듯 홈 시큐리티는 점점 그 중요성을 더해가고 있다. 하지만 이러한 보안업체 장비들은 일반 가정에서 사용하기에는 값이 비싸 이용하기가 쉽지가 않다. 본 논문에서는 이러한 값비싼 첨단장비를 대체하기 위하여 값이 싼 CAM을 이용하여 최근에 많은 디바이스 탑재되고 있는 DLNA를 기반으로 한 홈 시큐리티 시스템을 제안하고자 한다.
-
본 논문에서는 위성 DMB 환경에서 멀티채널 오디오 서비스를 제공할 수 있는 시스템을 제안한다. 위성 DMB 서비스는 2005 년부터 상용서비스를 시작한 이동멀티미디어방송 서비스로서, QVGA 급의 영상과 FM 음질의 오디오 서비스를 제공한다. 본 연구에서는 기존의 위성 DMB 시스템과 호환성을 유지하면서, 적은 비트율의 데이터를 추가하여 멀티채널 오디오 서비스를 제공하는 시스템에 대한 연구를 수행하였다. 이를 위하여 기존의 스테레오 오디오 시스템과 호환성을 가지면서도 적은 비트율의 데이터 추가만으로 멀티채널 오디오 신호의 재현이 가능한 멀티채널 오디오 부호화 기술을 적용하였고, 기존 위성 DMB 단말의 동작에 영향을 주지 않으면서, 멀티채널 오디오 서비스가 제공되는 것을 식별할 수 있도록 하는 시그널링 방법을 개발하여 적용하였다. 연구 결과의 검증을 위하여 위성 DMB 멀티채널 오디오 부호화기 및 단말을 개발하여 방송 실험을 수행하였고, 이를 통하여 제안한 방법으로 위성 DMB 환경에서 멀티채널 오디오 서비스를 효율적으로 제공할 수 있음을 증명하였다.
-
최근 사용자와 컴퓨터간의 상호작용이 가능한 사용자 인터페이스(UI, User Interface)에 대한 연구가 활발히 진행되고 있다. 이중 키보드나 마우스, 리모컨과 같은 별도의 입력장치가 없이 뇌의 활동으로부터 발생하는 생체신호를 이용하여 사용자의 생각만으로 컴퓨터와 커뮤니케이션을 할 수 있는 뇌만으로 컴퓨터와 커(BCI, Brain-Computer Interface) 시스템이 각광을 받고 있다. 본 연구에서는 뇌의 생체신호로는 뇌전도도(EEG, Electroencephalogram)를 사용하였으며, 이를 통하여 P300 speller 실험을 수행하였다. P300 speller 실험을 통하여 발생된 뇌전도도를 취합하여 P300(사건 관련 전위(ERP, Event-related potential)에서 자극 제시 약 300msec 후에 정점에 달하는 정파)을 분석하였다.
-
본 논문에서는 스마트 TV 시청시에 녹화하는 골프 동영상에서 오디오기반의 경계영역 검출를 이용하여 썸네일을 고속으로 생성하는 방법을 제안한다. 제안된 방법은 녹화되는 골프동영상의 인코딩된 오디오 정보로 부터 추출된 MDCT계수를 이용하여 온셋 구간 검출 및 오디오 세그먼테이션을 수행함으로써 골프 동영상을 6개의 오디오 클래스로 자동 분할한다. 분할된 오디오 세그먼트와 상응하는 비디오 프레임을 맵핑하여 골프 동영상의 썸네일을 생성한다. 제안된 오디오기반 경계영역 검출방법의 성능 측정 결과, 97.4%의 Recall과 96.85%의 Precision의 우수한 분류 성능을 나타내었다.
-
디지털 컨버전스와 유비쿼터스 시대의 시작은 디지털 미디어 기술의 발전과 방송 통신 사업의 컨버전스를 가속화 시켰으며, 그 결과로DMB, WCDMA, Wibro, IP-TV, HSDPA 등의 새로운 형태의 차세대 제품과 서비스들이 뉴미디어 매체의 핵심으로 등장하고 있다. 국내에서 방송 통신의 컨버전스의 빠른 진행은 세계 최초로 디지털 멀티미디어 방송(DMB) 서비스 시작을 가능하게 하였다. DMB 서비스는 멀티미디어 서비스가 핵심이다. DMB 데이터 서비스인 Broadcasting Website Service(BWS)는 현재 지상파 DMB방송 사업자인 KBS, MBC, SBS, YTNDMB가 본방송 준비 막바지 단계이며, 삼성전자와 LG전자를 비롯한 단말기 개발사들도 데이터 서비스를 위한 제품 출시에 서두르고 있는 등 DMB 산업의 활성화의 주역이 될 것으로 예상된다. DMB의 데이터 서비스는 뉴스, 날씨, 프로그램 정보 등의 단순 정보보기 수준에 그치지 않고, 리턴 채널을 이용한 양방향 서비스와, SMS, 전화걸기 등 휴대전화 단말의 고유기능과의 연계를 통한 다양한 서비스도 선보일 것이다. 더 나아가 향후 T-Commerce와 개인 광고 등 새로운 비즈니스 모델과 사업영역으로 확산시켜 나갈 수 있을 것이다. 그러나, 아직까지 DMB와 데이터 서비스는 초기단계로서, 표준 기술의 규격 작업, 이론적 논의들, 관련 사업자들의 비즈니스 준비 등에서 검토되어, 실제 사용자들을 대상으로한 연구 분석이 이루어 지지 않았다는 연구의 한계를 가지고 있다. 본격적으로 방송, 통신 컨버전스 데이터 서비스가 시작되면서, 사용자들에 초점을 맞춘 많은 연구가 이루어지길 바라며, 이러한 연구의 분석를 통해 또 다른 새로운 서비스와 비즈니스 기회의 창출을 기대해 본다.
-
본 논문에서는 MPEG-7 비주얼 디스크립터를 기반으로 Digital Image의 효과적인 검색이 가능한 시스템의 개발하였다. MPEG-7에 포함되어 있는 비주얼 디스크립터 툴은 컬러, 텍스처, shape, motion, localization, 얼굴 인식 등을 포함한다. 이들 MPEG-7에서 제공하는 비주얼 디스크립터를 그대로 이용하여 Digital Image의 검색 시스템을 구현하기에는 시스템이 불필요하게 커질 수 있으며 Digital Image의 검색 성능이 그다지 높지 않다는 문제점이 발생한다. 구체적으로는 모든 디스크립터를 이용하여 데이터베이스에 존재하는 모든 Digital Imag에 대한 검색을 수행하기에는 많은 처리시간이 요구된다는 것과 어떠한 디스크립터를 이용해야 정확한 검색이 이루어질지 알 수 없기 때문이다. 이를 위해 본 논문에서는, MPEG-7 비주얼 디스크립터의 특성을 저작권위원회에서 제공받은 데이터베이스를 이용하여 분석하고 이들 디스크립터의 효과적인 결합 기술을 개발하였다. 기존의 디스크립터 결합 방식은 각각의 디스크립터에 동일한 가중치를 부여하고 검색을 수행하는 방식이었으나 본 논문에서는 정보이론을 기반으로 디스크립터의 가중치를 자동으로 부여하는 방식으로 검색 시스템을 구성하였다. 개발된 시스템은 기존의 동일한 가중치를 부여한 시스템에 비해서 데이터베이스에 대한 각 디스크립터의 특성을 반영하여 가중치를 결정하도록 구성하였다.
-
최근 국내에 디지털 라디오 방송을 도입하기 위한 실험방송이 진행 중이며, 조만간 디지털 라디오 방식이 결정될 것으로 전망되고 있다. 본 논문에서는 연내 ISO/IEC 국제표준 제정이 예상되는 USAC의 디지털 라디오 방송에의 적용 가능성을 검토하고, 도입의 장점 및 고려사항 등을 제안하고자 한다.
-
기존의 실시간 파노라마 합성 알고리즘에서는 매칭점과 입력 영상에서의 outlier를 구분하고 제거하기가 어렵기 때문에 노이즈가 많은 영상 또는 반복적인 패턴이 많은 영상에서 왜곡이 쉽게 발생하는 문제가 있다. 따라서 본 논문에서는 기존의 실시간 파노라마 합성 프레임웍에서 실시간 합성 조건을 만족시키면서 효과적으로 매칭점과 입력 영상에서의 outlier를 제거하는 방법을 제안한다. 이를 위해서 선형 모델에서 outlier을 제거하는 데 주로 사용되는 RANSAC 알고리즘을 실시간 파노라마 합성에서 사용되는 비선형 모델에 적용 가능하도록 수정하고 속도 향상을 위해서 사용되는 모델의 파라미터를 줄이는 방법을 제안한다. 이를 통하여 매칭점 중에 존재하는 outiler를 제거하고 전체 매칭점 중에서 inlier 비율을 이용하여 입력되는 영상시퀀스에서 outlier 영상을 제거하는 방법을 제안한다. 실험 결과 기존의 방법에 비해서 합성 결과의 왜곡이 줄어드는 것을 확인하였다.
-
본 논문에서는 DIBR(Depth image-based rendering)을 통해 생성되는 3D 영상의 홀을 고품질로 채우는 방법을 제안한다. 이를 위해, 생성된 영상의 깊이도를 고려한 희소성(Sparsity) 기반의 인페인팅 알고리즘을 홀 채우기에 적용하였다. 본 논문에서 제안하는 알고리즘은 홀 주변의 전경 텍스쳐를 제외한 배경 텍스쳐 정보만을 이용하기 때문에, 홀 채우기 시 전경 텍스쳐와 배경 텍스쳐가 혼합되는 문제점이 발생하지 않는다. 또한 희소성 기반의 인페인팅을 이용하기 때문에 에지 정보를 활용한 고품질의 홀 채우기가 가능하다. 본 논문에서 제안하는 알고리즘과 기존의 홀 채우기 알고리즘과의 주관적 화질 비교 결과, 본 논문에서 제안하는 알고리즘의 우수성을 확인할 수 있었다.
-
휴대 단말 기기에 대한 관심 증가와 함께 사용자의 얼굴을 검출하는 응용 방법에 대한 연구가 활발히 진행되고 있다. 하지만 주변 조명 등의 영향으로 얼굴 검출이 어려운 문제점이 있다. 이를 해결하기 위하여 다양한 접근방법이 제안되어 왔지만, 제한된 하드웨어에 적용하기에는 높은 복잡도를 가지는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하고 효율적으로 얼굴 검출 정확도를 향상 시킬 수 있는 조명 대비를 개선 알고리즘을 제안하였다. 이를 위하여 입력된 영상에서 가우시안 분포를 분석하고, 분석된 분포를 기반으로 각기 다른 조명 대비 개선 알고리즘을 적용하였다. 실험 결과 제안하는 방법이 다양한 조명 환경에서 얼굴 검출 정확도를 향상 시키는 것을 확인하였다.
-
본 논문에서는 웨이블릿 기저를 적용하여 영상을 주파수 대역이 각각 다른 영상으로 분리하고 이들과 원본 영상을 조합 후 웨이블릿 역변환을 적용하여 고해상도의 영상을 획득하는 초고해상도 기법을 제안한다. 기존의 단일 영상을 이용한 초고해상도 기법의 경우 영상에서의 고주파 대역을 찾기 위해 확률 기반의 여러 다양한 방법이 제시되었으나 연산 복잡도 증가로 인해 처리시간 증가 등의 문제가 발생한다. 이러한 문제를 해결하기 위해 웨이블릿 기저 함수를 이용한 다양한 초고해상도 기법이 제안되었다. 본 논문에서는 주어진 영상 내에서 웨이블릿 기저 함수를 이용하여 주파수 대역 별로 영상을 먼저 생성하고, 원본 영상과 주파수 대역 별로 분리된 영상을 조합한 후 웨이블릿 역변환을 적용하여 해상도를 증가시키는 새로운 기법을 제안한다. 실험을 통해 제안하는 웨이블릿 기반의 초고해상도 기법이 기존의 해상도 향상을 위한 다양한 보간법에 비해 향상된 효율을 보이는 것을 확인하였다.
-
본 논문은 3차원 TV에 있어서, 인간의 색 순응에 근거하여 3차원 재생 방식에서도 2차원 재생 방식의 색상을 재현하기 위한 색상 톤 매핑 연산자를 제안한다. 이를 위하여 각 재생 방식에 따라 동일한 128단계의 무채색 색표를 이용한 색상 요소 입출력 관계 곡선을 측정 및 모델링하였고, 그 오차를 보정하기 위한 색상 톤 매핑 연산자를 도출하였다. 또한 도출된 색상 톤 매핑 연산자에 의한 색 포화 및 색 대비 왜곡을 완화하기 위하여 동적 영역 정규화를 실시하였다. 이를 통해 기존 3차원 영상 대비 10.13dB의 PSNR 개선 효과를 확인 할 수 있었다.
-
최근 입체 콘텐츠 및 디스플레이의 지속적인 발전과 관심도가 증가하고 있고, 입체 변환에 대한 연구가 활발히 진행되어지고 있다. 본 논문에서는 단일 카메라로부터 획득한 다수의 영상을 이용하여 최적의 입체영상을 선택하는 방법에 대하여 제안한다. 이러한 방식은, 스테레오 카메라를 이용하여 입체를 제작하는 방식과 단일 영상의 깊이 정보를 이용하여 입체로 변환하는 방식의 단점을 없애고 장점을 가져올 수 있다. N 장의 영상을 획득한 후, 에지의 방향성을 계산하여 주각을 구한다. 또한 임의의 두 장을 선택한 후 두 영상에 대한 프로젝션 데이터를 구하여 상관관계를 계산한 후, 이를 이용하여 이동벡터를 구한다. 이 두 가지 변수를 이용하여 최적의 입체영상을 선택하고, 입체로 시청 가능하도록 보정한 후 입체영상으로 제작한다. 실험에서는 분석을 수행하여 성능을 평가한다.
-
인간이 입체로 시청할 때에는 같은 거리에 있는 객체들도 밝기나 채도에 따라 입체감의 차이가 발생한다. 이러한 정보들을 활용함으로써 입체 화질을 개선한 영상은 기존의 입체 영상의 입체감을 증대시킬 수 있는 효과가 있다. 본 논문에서는 좌우영상의 전처리 과정을 통하여 입체 영상에서의 입체 화질을 개선하는 영상처리 기술을 제안한다. 제안 방법으로는 대비향상기법, 채도처리 기법의 2가지 방법을 제안한다. 실험을 통해 각 제안방법의 우수성과 장단점을 분석하고, 여러 가지 입체영상을 실험함으로써 제안한 방법이 주관적 실험 아래 입체감이 개선되었음을 증명하였다.
-
기존 ATSC 시스템의 시간영역 채널 추정은 많은 탭을 사용하고 복잡도가 높지만 OFDM과 같이 보호구간을 이용하여 주파수 영역 등화기를 사용하면 복잡도를 낮추면서 정확한 채널 보상이 가능하다. 본 논문은 ATSC 시스템의 프레임에 보호구간을 삽입하여 주파수 영역 채널 등화를 제안하였다. 또한 DTV수신기의 성능을 확인하기 위해 브라질 채널을 이용하여 컴퓨터 모의실험을 통해 성능을 확인하였다.
-
IPTV와 같은 양방향성을 가지는 방송 시청 환경에서 시청자들이 다수의 카메라로 획득된 다양한 시점의 방송 콘텐츠를 능동적으로 소비할 수 있도록 시점제어 서비스 플랫폼을 개발하였다. 시점제어 서비스 플랫폼은 사용자의 인터랙션에 따라 변화가 일어나는 장면을 저작하기 위한 시점제어형 장면 저작도구와 사용자의 인터랙션에 따라 장면을 재생하는 시점제어형 콘텐츠 재생기로 구성된다. 상기 장면 구성을 위해서 본 논문에서는 MPEG-4 LASeR 표준을 이용하였으며, 장면 정보와 AV 엘리먼트리 스트림을 포함하는 파일 포맷으로 ISO 베이스 미디어 파일 포맷을 사용하였다. 한편 저작자의 의도에 따라 장면을 자유롭게 구성할 수 있는 시점제어형 콘텐츠를 기존 TV 리모콘으로 제어하기 불편한 점이 있으므로, 사용자의 시선으로 장면을 제어할 수 있도록 시선추적 기술을 개발하였다.
-
최근 다양한 단말기를 대상으로 동일한 미디어 콘텐츠, 애플리케이션 서비스를 제공하는 N-Screen 전략이 두드러지고 있다. N-Screen 서비스를 제공하는 방법의 하나로 단말 간 유사한 사용자 인터페이스를 제공하는 방법이 있다. 이는 사용자에게 친숙한 사용자 경험을 제공하는 장점이 있으며, 이러한 방법을 위해서는 단말 간 장면 동기화가 매우 중요하다. 기존의 N-Screen 서비스에서는 장면 동기화를 위하여, 단말 간 API 인터페이스 등을 사전에 조율해야 하는 문제점이 존재한다. 이에 본 논문은 상기와 같은 N-Screen 서비스의 동기화 방법의 문제점을 해결하기 위하여, 명령어 혹은 이벤트 중심이 아닌 자원 중심의 단말 간 통신 방법에 대해 제안하였다. 이를 위하여 장면 업데이트의 내용을 효율적으로 XML 형태로 기술하고, 전송하는 방법에 대해 연구하였다.
-
본 논문에서는 한 가지의 TV 방송 플랫폼 구현에만 그쳐왔던 기존의 시스템에서 벗어나 여러 나라의 방송규격에 대응하는 멀티 시스템 개발을 목표로 현재 미국 방송 규격 서비스에 있어 서로 다른 규격인 고화질 MPEG-2 기반의 HDTV 지상파 방송 서비스 및 H.264 기반의 이동수신을 위한 모바일 방송 서비스를 실시간으로 처리할 수 있도록 구현하며, 한 개의 프로세서를 이용하여 멀티 모드 기반의 TV 방송서비스를 구성하는 방법을 제안한다. 따라서 제안하는 설계 기법을 적용하여 여러 나라의 TV 방송 서비스에 있어 설정하나만으로도 전세계에서 실시간 TV 방송 서비스가 가능할 뿐만 아니라, 다양한 멀티미디어 콘텐츠와 고화질의 서비스를 얻을 수 있다. 따라서 기존의 셋탑박스 뿐 아니라 휴대기기 및 IT 제품에 있어 휴대 및 이동하며 수신할 수 있는 서비스를 제공할 것이다.
-
본 연구에서는 방송 촬영용 LED Spot 조명기기를 두 가지 형태로 개발하여, 현재 방송용 스튜디오 조명기기가 설치되어 있는 공간에서 다수 사용되고 있는 영국의 Arri사 650W와 1000W Fresnel Spot 조명기기와 조도, 색온도, 연색성 등의 비교 데이터 측정과 피사체의 촬영 시 영상 및 연색성에 따른 색상을 비교 측정하였다. 그리고 방송 촬영용으로 LED Spot 조명기기가 대체 가능한지를 판단하기 위하여 성능평가분석 하였다.
-
최근 스마트폰, 태블릿 PC와 같은 모바일 스마트 디바이스(mobile smart devices)와 더불어 스마트 TV에 대한 관심이 크게 증가하면서 사용자들의 컨텐츠와 기능에 대한 요구 또한 다양해지고 있다. 스마트 TV가 컨텐츠와 기능적 측면에서 사용자의 편의와 재미, 그리고 유익함을 동시에 만족시키기 위해서는 더욱 지능화된 기능을 탑재할 필요가 있다. 일반적으로 남녀에 따라 TV를 시청하는 경향이 다르기 때문에 현재 TV를 시청하는 사용자의 성별분류(gender classification)를 통해 성별에 따른 따른 채널이나 광고, 응용 프로그램을 달리 제공하는 성별 기반의 스마트 TV 응용을 개발할 수 있게 된다. 본 논문에서는 스마트 TV 응용에 적합한 BGOLAM 기반의 성별분류 방법에 대해 제안하고, 실험을 통해 제안하는 방법의 적절성을 보인다.
-
최근 디지털 방송 서비스가 본격화가 이루어짐에 따라 디지털 콘텐츠는 기하급수적으로 늘어나고 있다. 또한 방송통신 융합 환경은 기존 셋탑 박스와 같은 방송 전용 단말기와 PC, 노트북, PDA와 같은 인터넷 단말기기, 그리고 모바일 폰과 같은 통신기기 사이의 벽을 허물고 있다. IPTV, SmartTV 시대의 도래로 방송통신 제공자의 양방향성 콘텐츠의 제공 및 상호연동 서비스의 제공은 중요한 이슈가 되었다. 이에 따라 다양한 단말기를 이용해 N-Screen이 가능하도록 방송통신 융합 서비스를 제공하고, 이를 위한 여러 콘텐츠 제작이 활발히 일어나고 있다. 이에 본 논문은 양방향성과 상호운용성을 높이기 위한 하나의 방법으로, 방송통신 융합서비스를 인터넷에 의한 전송과 방송 셋탑에 의한 전송에 있어서 상호 동일한 콘텐츠의 통일성을 유지하여 관리가 쉽도록 하는 Scalable Application Framework를 이용하였고 이를 실제 멀티미디어 모바일 단말기기에 적용하고 구현하였다. 이를 통해 앞으로 스마트 방송 시대에 대비할 수 있는 시스템의 대안을 제안하고자 한다. MPEG-21의 DID를 기초로 하여 SADL(Scalable Application Description Language)를 정의하고 이를 이용한 다양한 프레임워크 모델 중 일부인 멀티미디어 모바일 단말기기에 적용하여 이를 활용하는 방안에 대해 논의한다.
-
본 논문에서는 송신단에서의 shifted TR 기법과, 이 것에 수신단에서의 선택적 MMSE 등화기를 추가한 통신시스템을 주파수 선택적 채널에서 실험해보고 이것이 shifted TR 기법만 사용했을 때와 비교하여 수신단의 선택적 MMSE 등화기가 성능에 어떤 영향을 끼치는지 관찰하였다. 이를 보호 구간 별로 실험 결과를 비교하였으며 수신단에 선택적 MMSE 등화기를 추가시켰을 경우, shifted TR 기법만을 사용했을 경우보다 비트 오차율 측면에서 성능의 이득이 있음을 확인하였다.
-
본 논문에서 우리는 unequal loss protection(ULP) 알고리즘을 기반으로 패킷이 손실될 수 있는 망 환경에서 인지적으로 재구성된 영상의 왜곡을 최소화하는 방법을 제안한다. 알고리즘에는 2가지의 주요 요인이 있다. 첫째, 인간 시각 체계의 균일하지 않은 분포의 함수로 압축된 영상에 가중치를 준다. 둘째, 패킷은 오류 전파가 일어나지 않도록 하면서 각각의 group of picture(GOP)내에서 시간적인 중요성이 할당된다. 프레임의 인지적인 중요성과 GOP의 계층적인 중요성을 동시에 고려하여, 제안하는 ULP알고리즘은 인간 시각적으로 가장 중요한 지역의 크기를 식별하여 효율적인 forword error correction(FEC) 알고리즘을 수행한다.
-
본 논문은 H.264/AVC에서 사용하는 기존의 SVC 알고리즘에 추가적으로 인간의 시각적 중요도 정보를 활용하는 기법을 제안한다. 이 접근방식에서 기존의 SVC 알고리즘을 수정하기 위해 사람의 시각 체계가 균일하지 않게 표본화를 하는 정보가 이용된다. 우리는 각각의 화질계층에서 가장 중요한 지역의 크기를 조절함으로써 효율성과 공정성 모두 강조하는 새로운 자원 할당 알고리즘을 제안하였다. 효율성은 제안하는 SVC의 낮은 화질계층에서, 공정성은 중요한 지역의 크기를 크게 하는 높은 화질계층에서 강조된다. 실험결과는 제안하는 SVC 알고리즘이 압축된 비디오의 주관적인 시각적 화질을 개선하는 것을 보여준다.
-
최근 비디오를 즐기는 방법에 있어서 다양한 형식 및 기기가 사용되고 있으며, 이러한 실질적 요구를 충족시키기 위한 방법으로 빠른 비디오 변환 기술이 필요하다. 비디오 변환 기술 중 해상도 축소를 위한 새로운 움직임 벡터 재예측 방법을 제안한다. 줄어든 영상 내 블록의 움직임 벡터를 결정하기 위해 원본 영상 내 대응 되는 위치의 2개 이상의 움직임 벡터들을 K-means clustering 방법 기반으로 다중 후보 움직임 벡터를 결정하고, 결정된 움직임 벡터 중에서 차이의 절대값 합이 최소가 되는 움직임 벡터를 줄어든 영상 내 블록을 위한 움직임 벡터로 결정한다,. 실험 결과 비디오 변환 없이 압축을 수행한 연산시간에 비해 9% 정도의 연산시간이 필요하였으며, 압축 효율은 BR-RATE가 약 17정도 증가하여 기존의 방식의 증가량에 비해 60%로 줄어든 결과를 보여주었다.
-
국내 IT시장에서 비디오 분야가 차지하는 분야는 매우 크다. 스마트폰, 테블릿 PC, 3D, UHDTV 등 간접적으로나 직접적으로 비디오 분야와 밀접한 관계를 맺고 있다. 이런 추세에 따라서 멀티미디어를 무선 인터넷 환경에서 실시간으로 감상하기 위해 비디오 분야에서는 높은 압축률의 코덱이 선결 과제이다. 이에 따라 기존의 H.264에서 좀 더 발전한 HEVC 차세대 비디오 코덱의 표준화가 진행 중이다. 이에 본 논문은 비디오 분야에서 가장 큰 복잡도를 갖는 움직임 추정 부분과 관련해서 새로운 알고리즘을 제안한다. 제안하는 알고리즘을 사용해 복잡도를 줄이고 기존 알고리즘과 비교해 화질 열화를 개선함으로써 차세대 코덱에 필요한 데이터 감소에 크게 이바지 할 것으로 보인다.
-
H.264/AVC는 휘도 신호
$4{\times}4$ 블록을 위하여 9개의 화면 내 예측모드를 사용한다. 예측 모드는 8개의 방향성을 가진 모드와 하나의 비방향성 DC 모드가 있다. 휘도 신호$16{\times}16$ 블록에서는 4가지의 예측 모드가 있으며 색차 신호$8{\times}8$ 에서도 4개의 예측모드를 사용한다. 이러한 예측 모드들 중 최적의 예측 모드를 선택하기 위하여, 부호화기는 선택 가능한 모든 예측 모드의 율-왜곡 비용을 계산한 후, 최적의 율-왜곡 비용을 가진 예측 모드를 사용하여 부호화를 수행한다. 따라서 H.264/AVC의 화면 내 예측 과정은 많은 계산 복잡도를 가진다. 특히 하이 프로파일에서는 휘도 신호$8{\times}8$ 블록이 화면 내 예측을 위해서 고려되므로 더욱 많은 계산 복잡도를 요구한다. 이에 본 논문은 H.264/AVC 하이 프로파일의 화면 내 예측의 부호화 계산 복잡도를 줄이는 방법을 제안한다. 현재 매크로 블록의 분산을 계산한 후, 이를 이용하여 율-왜곡 최적화에 후보로 사용되어지는 블록 모드를 결정하고, 각 블록 모드에서 제공하는 예측 모드들을 효율적으로 선택하는 방법을 연구 개발하였다. 제안된 방법은 기존 H.264/AVC 참조 소프트웨어인 JM13.1 부호화 시간 대비 약 83%의 연산시간이 감소하는 결과를 보였다. -
H.264/AVC에서는 율-왜곡 최적화 기법을 사용하여 부호화 성능을 이전 보다 대폭 향상시켰다. 율-왜곡 최적화 기법은 선택할 수 있는 모든 코딩 모드들의 비용을 계산한 후, 최소의 비용을 가진 모드를 선택하여 부호화를 한다. 따라서 코딩 모드들이 많아질수록 복잡도 역시 증가하며, 기존 표준보다 다양한 코딩모드를 지원하는 H.264에서는 복잡도가 더 많이 증가한다. 본 논문에서는 SAHTD(Sum of Absolute Hadamard Transform Difference)를 이용하여 화면 내 모드 결정부에서 빠른 화면내 모드 결정을 하면서도 압축 손실이 적게 발생하는 방법을 제시하였다. 휘도 신호
$16{\times}16$ 블록, 휘도 신호$4{\times}4$ 블록, 색차 신호$8{\times}8$ 블록 모두 SAHTD를 기준으로 최적의 모드가 결정된다. 휘도 신호$16{\times}16$ 블록에서 SAHTD값에 따라$4{\times}4$ 블록 부호화 과정을 조기 종결이 가능하게 하는 것과, 휘도 신호$4{\times}4$ 에서는 SAHTD 값이 가장 낮은 3개의 모드와 MPM(Most Probable Mode)을 후보 모드로 선택하여 율-왜곡 최적화를 수행하는 방식이 사용되었다. MPM이 SAHTD값이 가장 낮을 경우 MPM이 휘도신호$4{\times}4$ 블록의 최적의 모드로 선택되고 종료된다. JM 참조 소프트웨어를 통한 실험결과 제안된 기법은 기존 JM의 방식에 비해 화면 내 프레임의 부호화 시간의 84.7% 감소와 0.049dB의 PSNR 감소율, 0.595%의 비트 증가율을 보여주었다. -
This paper presents a Channel DiVision (CDV) scheme for transform-domain distributed video coding. In the proposed system, we employ the symmetric motion estimation to generate high quality side information for Wyner-Ziv (WZ) frames. Also, the decoder estimates the distortion of the side information, which is used to classify the transmitting channels for WZ frames. Each channel has a different expected noise. Then, the encoder allocates an appropriate number noise. Then, the encoder allocates an appropriate number present rate-distortion performance results and comparisons with existing state-of-the-art algorithms and H.264.
-
본 논문은 HEVC 표준화 회의 중 빈 단위 병렬화 위해 제안된 V2V 기술을 바탕으로 슬라이스 내에서 적응적으로 발생 확률 예측을 통하여 압축 효율을 높이는 기술을 제안한다. 기존의 V2V 기술은 슬라이스 단위로 확률 양자화 간격과 대표 확률 결정하여 다수개의 빈 코더에 매핑하여 병렬 엔트로피 부호화를 수행하였다. 제안하는 방법은 V2V 기술에서 슬라이스 보다 작은 단위의 확률적 특성을 고려하여 슬라이스 내에서 대표확률의 선택을 적응적으로 결정한다. 대표 확률의 적응적인 선택은 이전의 부호화된 빈의 실제 심볼의 확률을 이용하며, 이로 인해 슬라이스 보다 작은 단위의 국부적 특성을 확률 양자화기에 반영할 수 있다. 실험 결과, 제안하는 방법을 위해 실험된 현재 부호화 빈의 발생확률은 이용하여 최적의 확률을 얻는 실험은 기존의 V2V 기술 대비 0.1%의 부호화 효율을 얻었다.
-
채색화 기법은 일부 픽셀의 색상 정보를 이용하여 흑백의 이미지에 색상 정보를 추가하는 기법이다. 이러한 채색화 기법을 기반으로한 색상 이미지 압축기법들이 연구되고 있다. 색상 평면에서 대표적인 픽셀들을 소스 픽셀로 자동적으로 선택하고, 이 소스 픽셀들의 위치와 색상 정보만을 디코더에 압축하여 전송한다. 본 논문에서는 밝기 변화량을 이용하여 소스 픽셀의 위치를 결정함으로써, 디코더에서도 동일한 작업으로 소스 픽셀의 위치를 결정할 수 있다. 따라서 소스 픽셀에 대한 위치정보를 전송하기 위한 비트량을 줄임으로써 압축 효율을 높였다. 제안알고리듬은 디코더에서 색상정보의 복원에 이용하는 채색화 기법의 특성에 맞추어서 밝기가 평평하고 넓은 영역에서 먼저 소스픽셀을 선택하여, 이웃의 비슷한 밝기를 가지는 픽셀에 대한 색상 정보를 효율적으로 압축한다.
-
본 논문에서는 휘도성분과 색차성분의 유사성을 이용하여 부호화 성능을 향상시키기 위한 방법을 제안한다. 하나의 영상을 구성하는 휘도성분과 색차성분은 유사성이 높아 그 유사성을 이용하여 부호화 효율을 높이는 것이 가능하다. 현재 CU(Coding Unit)를 압축할 때 화면 내 예측방법을 사용한다면, 색차성분의 화면 내 예측모드가 휘도성분의 정보를 이용하는 경우에 본 논문의 알고르듬을 적용한다. 색차성분이 휘도성분의 정보를 이용하는 경우에는 휘도성분과 색차성분 간 유사도가 높다는 것을 의미하기 때문에 휘도성분의 스캔방법을 기본으로 중요한 변환계수의 위치정보를 이용하여 색차성분의 스캔 방법을 적응적으로 결정한다. 현재 배포된 HEVC의 레퍼런스 소프트웨어인 HM 3.1을 이용하여 실험한 결과 색차성분에 대해 0.39%의 부호화 효율을 있음을 확인할 수 있었다.
-
분산 비디오 기술의 대표적인 기술 중 하나는 와이너 지브 부호화 기술이다. 종래 와이너 지브 부호화 기술에서는 낮은 복잡도의 부호화기를 얻기 위하여 일반적으로 인트라 부호화된 키 픽처를 사용한다. 하지만 인트라 부호화 방법은 공간적 중복성분만을 제거하기 때문에, 정적인 영상에서 부호화 효율이 매우 떨어지게 되어, 전체적인 율 왜곡 성능을 저하시킨다. 본 논문에서는 움직임 벡터를 (0, 0)으로 간주한 제로 모션 키 픽처를 이용하여 공간적 중복성분 이외에 시간적 중복성분 또한 제거하여 부호화 효율 성향을 위한 방법에 대한 종래 인트라 키 픽처 대비 율 왜곡 성능을 비교하여 보이고, 제로 모션 키 픽처 부호화의 복잡도가 기존 인트라 부호화 방법과 유사한 것을 보였다. 실험결과 기존 방법에 비해 유사한 복잡도를 갖으면서, 정적인 영상에서 최대 56%의 비트율 이득을 얻었다.
-
스케일러블 비디오 코딩은 레이어간 예측 기능을 이용하여 시뮬케스트 코딩에 비해 코딩 효율을 높인다. 하지만 스케일러블 비디오 코딩의 레이어간 예측으로는, 인트라 픽셀(inta pixel). 모션 정보(motion vector information), 레지듀얼(residual)등의 예측이 수행되는데, 이는 많은 계산 시간을 소요하게 되며, 시뮬케스트에 비해 코딩 시간이 증가하게 된다. 특히 인코더의 경우, 가장 최적의 모드를 선택하기 위하여, 기존 H.264 AVC에서 사용하는 예측을 수행한 뒤, 부가적으로 스케일러블 비디오 코딩의 레이어간 예측을 수행하기 때문에, 하나의 영상이 많은 레이어를 포함할수록 인코딩에 의한 계산부하가 매우 증가하게 된다. 본 논문에서는 이를 해결하기 위해, 멀티 코어 이용하여 레이어별로 병렬처리가 가능하도록 하는 스케일러블 비디오 인코더의 구조를 제안한다. 이로써 하나의 영상이 포함하는 레이어의 수가 증가함에 따라 발생하는 인코딩 계산 부하를 줄이도록 하였다. 그리하여 본 논문에서 제안하는 구조를 적용하였을 때, 2개의 공간영역으로의 스케일러빌리티를 가지는 영상들에 대해서는 평균 24.8%의 속도가 향상되었고, 1개의 공간영역과 1개의 화질 영역으로의 스케일러빌리티를 가지는 영상들에 대해서는 평균 82%의 속도 향상을 보였다.
-
자연현상이나 실제 상황을 담고 있는 비디오 시퀀스는 기본적으로 주위의 픽셀들과 높은 상관도를 가지고 있다. 따라서 움직임 벡터 정보도 주위 블록의 정보와 상관도가 높으며, 움직임 예측을 수행할 때의 계산 량을 줄이는데 용이하게 사용되어져 왔다. 본 논문에서도 이를 이용하여 움직임 벡터를 예측하는 방법을 제시한다. 현재 블록의 정확한 움직임 벡터 예측을 위하여, 참조 프레임의 움직임 벡터와 현재 프레임의 움직임 벡터 정보를 참조하여 시작점을 정확하게 재조정하였다. 더 정확해진 시작점 예측으로 인해 움직임 정보의 중앙으로 수렴하는 확률이 더 높아 졌으며, 이를 이용하여 enhanced hexagonal search의 첫 단계를 수정함으로써 search point를 줄였다. 실험결과에서는 제안한 알고리즘의 장점과 단점을 분석하고 각 테스트 시퀀스에 따른 성능을 비교하였다.