• 제목/요약/키워드: 멀티미디어공학

검색결과 1,011건 처리시간 0.032초

비선형 필터 기반의 적응적 슈트제거 방법 (Nonlinear Filter-based Adaptive Shoot Elimination Method)

  • 조진수;배종우
    • 전자공학회논문지SC
    • /
    • 제45권2호
    • /
    • pp.18-25
    • /
    • 2008
  • TV를 포함하는 최근의 디스플레이 시스템들은 디지털화 및 대형화되는 추세이며, 이러한 시스템들의 화질은 현재의 디스플레이 시스템 시장에서 매우 중요한 상품 경쟁력의 하나로 인식되고 있다. 이에 디지털 디스플레이 시스템의 화질을 개선하기 위한 다양한 연구들이 진행되어 왔다. 선명도 개선 기술은 디지털 영상(혹은 동영상)의 화질개선을 위한 중요한 기술들 중 하나로서, 일반적으로 영상경계(edge)의 천이시간(transition time)을 줄여 주는 천이향상(transient improvement) 기술을 기반으로 하고 있다. 하지만, 이 기술은 흔히 천이가 향상된 영상경계 주변에 원치 않는 휘도(혹은 색차)의 변화를 가져올 수 있는 오버슈트(overshoot) 및 언더슈트(undershoot) 현상을 발생시킨다. 이에 본 논문에서는 천이향상 시 발생하는 오버슈트 및 언더슈트를 효과적으로 제거하여 시각적으로 보다 선명하고 깨끗한 디지털 영상(혹은 동영상)을 얻기 위한 새로운 방식의 비선형 필터 기반의 적응적 슈트제거 방법(nonlinear filter-based adaptive shoot elimination method)을 제안한다. 제안한 방법은 두 가지 직교 방향(orthogonal directional)의 최소/최대 비선형 필터들과 적응적 슈트제거 방식을 적용하여 시각적으로 민감한 오버슈트 및 언더슈트를 효과적으로 제거한다. 실험을 통하여, 제안한 방법이 영상경계의 천이향상 정도는 그대로 유지하면서 영상의 왜곡을 초래하는 오버슈트 및 언더슈트를 거의 완벽하게 제거한다는 것을 보여 주었다. 제안한 방법이 적용될 수 있는 제품들로는 디지털 TV, 디지털 모니터, 디지털 카메라/캠코더, 휴대형 멀티미디어 플레이어(PMP) 등이 있다.

VoiceXML을 이용한 Web 연동 학습 시스템 설계 및 구현 (Design and Implementation of Web Interworking Learning System Using VoiceXML)

  • 김동현;조창수;신정훈;홍광석
    • 전자공학회논문지CI
    • /
    • 제42권2호
    • /
    • pp.21-30
    • /
    • 2005
  • 멀티미디어 및 통신망 기술의 발전은 학습 시스템 구현 측면에서의 많은 변화를 이룩하였다. 보다 창의적이며, 보다 효율적인 학습 시스템 구축을 위한 연구가 Web 및 전화망을 이용하여 시도되었다. 그러나 현재까지 구현된 학습 시스템의 경우 웹 또는 전화망을 이용한 단독 시스템으로 각각의 장 단점을 가지고 있다. 즉, Web을 이용한 학습 시스템의 활용을 통한 학습시 단점으로는 컴퓨터를 활용한 정적인 상태에서의 학습만 가능하며, 컴퓨터를 사용하지 못하는 사람들에겐 이용하기 위한 새로운 시스템 활용법을 익혀야 하는 문제점이 존재하였다. 또한, 전화망을 이용한 학습 시스템의 경우 언제 어디서나 전화를 활용학습이 가능하다는 장점을 가지고 있으나, 컴퓨터를 활용한 시스템과 같이 심도있게 효율적으로 정보의 전달이 이루어지지 않는다는 단점을 가지고 있다. 이에 본 논문에서는 VoiceXML을 활용하며 전화망을 경유한 학습 시스템과 Web 기반 학습 시스템의 연동을 통한, 효율적이며 편리한, 언제 어디서나 활용 가능한 학습 시스템을 제안 한다. 또한 전화망을 사용한 학습 시스템에서 사용자 ID, password, 이름 등록 기능의 새로운 알고리즘을 제안하고 전화망과 Web을 사용한 학습시스템에서는 개인학습 진도 저장 기능을 제안한다.

광가입자망을 통한 IPTV 서비스 제공 (IPTV Service Provider over FTTH)

  • 박인규
    • 대한전자공학회논문지TC
    • /
    • 제43권5호
    • /
    • pp.7-16
    • /
    • 2006
  • IPTV는 하나의 셋톱박스로 TV와 연결, DSL망이나 광가입자망(FTTH)나 광동축혼합망(HFC)을 통해 초고속인터넷 방송 데이터서비스 전자상거래 등을 제공하는 서비스를 말한다. 최근 IPTV에 대한 사회적 분위기가 무르익으면서 통신사업자들 사이에서는 더 이상 IPTV 투자계획을 미룰 수 없다는 절박함과 함께 네트워크 고도화 전략이 IPTV 서비스의 승부처로 부각되고 있다. 인터넷 IPTV 인터넷전화 등 트리플플레이서비스(TPS)를 제공하기 위해서는 광케이블을 이용한 FTTH 구축이 필수적이다. IPTV를 염두에 둔 통신사들의 네트워크 전략은 특히 현재의 초고속인터넷망 주류인 xDSL이나 케이블모뎀 망(HFC)이 광랜이나 광가입자망(FTTH) 등 100Mbps급으로 바뀌는 촉매제 역할을 할 것으로 예상된다. 대용량 멀티미디어, 즉 TV프로그램도 실시간으로 전송할 수 있는 초고속인터넷 가입자망의 진화에 따라 등장한 IPTV는 방송법상의 종합유선방송(케이블TV)과 사실상 동일한 서비스를 제공할 수 있다. IPTV는 케이블TV업계의 존립을 흔들 수 있는 위협적인 존재가 아닐 수 없다. 비즈니스 모델이 똑같기 때문입니다. 시장 정체에 빠진 유선 통신사업자는 케이블TV방송사(SO)에 대응해 초고속인터넷 시장을 지키기 위해서라도 반드시 방송부문의 협력이 필요한 상황이다. 분명한 것은 IPTV가 컨버전스 시대의 신규 서비스로, 소비자에게 다양한 서비스의 선택권을 제공해 국민의 편의를 높일 것이다. 이에 따른 통신 업체의 정부의 역할에 대하여 논의한다.

영역/시간 세분화 D-TDD OFDM 구조에 기반한 새로운 WMAN 시스템 구조 설계 (Enhanced WMAN System based on Region and Time Partitioning D-TDD OFDM Architecture)

  • 김미란;정희정;김낙명
    • 대한전자공학회논문지TC
    • /
    • 제43권11호
    • /
    • pp.68-77
    • /
    • 2006
  • 미래 무선 멀티미디어 서비스에서 발생하는 비대칭 트래픽을 해결하기 위한 중요한 대안으로 동적 시간 분할 이중화(D-TDD: dynamic time division duplexing) 기법이 대두되고 있다. 그러나 D-TDD 모드 셀룰러 시스템에서는 교차 시간 슬롯(CTS: cross time slot) 구간 내에서 발생하는 기지국 (BS)간 그리고 단말기 (MS)간 간섭은 시스템 성능을 저하시킨다. 이러한 간섭을 완화하기 위하여 본 논문에서는 직교 주파수 분할 다중화 (OFDM) 시스템을 위한 D-TDD모드에서 동작하는 영역/시간 세분화 제어(region and time partitioning) 기법을 제안한다. 즉, CTS 구간에서의 각 타임슬롯을 일정 수의 미니슬롯들로 분할하고 각 셀은 각 타임슬롯의 미니슬롯과 같은 수의 영역들로 분할하여, 각 사용자들은 자신이 위치한 영역에 따라 각각에 대응되는 미니슬롯을 할당받는다. 이와 같은 구조를 통하여 각 셀에서 간섭의 요인이 되는 인접요소들을 배제시키고, 역방향 간섭을 주는 요인들 간의 거리를 최대한 이격시킨다. 또 셀 간 간섭을 최소화하기 위하여, 신호품질을 고려한 시간 자원할당 기법을 제안한다. 모의실험을 통하여, 제안된 기법은 기존의 시간자원할당 기법 대비 outage 확률과 대역폭 효율의 측면에서 보다 우수한 성능을 보임을 확인하였다.

깊이맵 업샘플링을 이용한 객관적 메트릭과 3D 평가의 비교 (Comparison of Objective Metrics and 3D Evaluation Using Upsampled Depth Map)

  • 사이드 마흐모드포어;최창열;김만배
    • 방송공학회논문지
    • /
    • 제20권2호
    • /
    • pp.204-214
    • /
    • 2015
  • 업샘플링 깊이맵은 깊이 카메라로부터 획득된 깊이맵의 공간 해상도를 증가시키는 방법이다. 깊이맵의 성능은 입체영상, 멀티뷰의 3D 입체감과 밀접한 관계가 있다. PSNR 등의 객관적 메트릭으로 깊이맵의 업샘플링 성능을 평가하고, 생성된 입체영상은 주관적 평가를 통해서 입체감 및 시각적 피로도를 조사한다. 후자의 주관적 평가는 인적 물적 자원을 필요로 하는 반면에, 전자의 객관적 메트릭은 수학적 표현으로 정량적 수치값을 알려준다. 따라서 주관적 평가와 높은 상관관계를 가지는 객관적 메트릭이 주관적 평가를 대체할 수 있다면 많이 시간을 필요로 하는 주관적 평가가 불필요하다. 이를 위해 본 논문에서는 다양한 객관적 메트릭과 3D 주관적 평가 사이의 관계를 조사한 후에, 이용한 메트릭에 기반한 주관평가와 상관관계가 높은 객관적 메트릭을 제안한다. 업샘플링된 깊이맵의 성능을 측정하기 위해 다양한 참조영상 및 무참조영상 평가 메트릭들을 이용하였다. 주관적 평가는 DSCQS 입체영상 테스트로 수행되었다. 세 종류의 상관관계의 활용 및 분석을 통해서, SSIM과 Edge-PSNR이 주관적 평가를 대체할 수 있는 적합한 객관적 메트릭임을 실험을 통해서 검증하였다.

신경망 기반의 텍스처 분류기를 이용한 스크래치 검출 (Film Line Scratch Detection using a Neural Network based Texture Classifier)

  • 김경태;김은이
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.26-33
    • /
    • 2006
  • 영화복원은 오래된 필름으로부터 손상된 영역을 자동으로 검출하여 복원하는 것이다. 영화복원은 고화질의 멀티미디어 서비스를 위한 필수작업이기 때문에, 현재 많은 연구자들로부터 관심을 받고 있다. 필름은 flick, dust, 스크래치 등의 원인으로 손상이 이루어지는데, 이 중 가장 주된 요인은 스크래치이다. 스크래치로 손상된 데이터의 복원연구는 지난 몇 년간 활발히 수행되고 있다. 스크래치 복원을 위해서는 위치 및 길이 등의 기준에 따라 나타나는 다양한 종류의 스크래치들을 모두 검출할 수 있어야만 한다. 본 논문에서는 영화의 각 프레임 상에 나타나는 다양한 종류의 모든 스크래치를 자동으로 검출할 수 있는 신경망 기반의 검출 방법을 제안한다. 다양한 높이와 폭을 가진 스크래치들을 검출하기 위해 pyramid를 이용하여 입력 영상은 다양한 해상도의 영상으로 변환된다. 각 변환된 영상에 대하여 신경망기반의 텍스처 분류기를 이용하여 스크래치와 비스크래치의 영역으로 분류한다. 이때, 처리속도의 향상을 위해 에지로 분류된 화소에 대하여만 신경망을 적용한다. 제안된 방법의 평가를 위해 다양한 종류의 스크래치를 가진 영화 및 애니메이션 데이터에 대해 실험이 이루어졌고, 그 결과, 제안된 방법의 강건함과 효율성이 입증되었다.

고혈압관리를 위한 웹 기반의 지능정보시스템: 하이퍼링크를 이용한 추론방식으로 (Web-enabled Healthcare System for Hypertension: Hyperlink-based Inference Approach)

  • Song, Yong-Uk;Ho, Seung-Hee;Chae, Young-Moon;Cho, Kyoung-Won
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.91-107
    • /
    • 2003
  • 하이퍼링크 기반 추론은 웹의 하이퍼텍스트 기능을 이용함으로써 접근성, 멀티미디어 기능,빠른 응답 시간, 서버의 안정성, 사용 및 업그레이드의 용이성, 플랫폼 독립성 등을 갖는 의료 전문가시스템을 구현할 수 있도록 해 준다. 전문가의 규칙에 따라 서로 하이퍼링크된 HTML문서들은 웹 서버에 적재된 후 추론 기능을 제공하게 되는데, 이러한 HTML문서들은 자체 개발한 WeBIS (Web-based Inference System)라는 GUI 기반 의사결정 그래프 편집 도구에 의해 자동으로 관리된다. 그럼에도 불구하고, 의료분야 전문가시스템이 다루는 규칙베이스의 크기가 큰 경우에 지식공학자가 이들 규칙들을 수작업으로 입력, 관리하는 것이 매우 어렵게 된다. 따라서, 본 연구에서는 고혈압 관리를 위 한 의사결정 그래프 자동 생성 시스템을 개발하였다. 이러한 일련의 과정을 통하여 본 연구에서는 하이퍼링크 기반 추론 기법을 이용하여 웹 기반 의료 전문가 시스템을 개발하는 방법론을 제시하였고, 그 응용으로써 빠른 응답속도와 안정성을 보이는 웹기반 고혈압 관리 시스템을 구현하였다.

  • PDF

준 지도학습과 여러 개의 딥 뉴럴 네트워크를 사용한 멀티 모달 기반 감정 인식 알고리즘 (Multi-modal Emotion Recognition using Semi-supervised Learning and Multiple Neural Networks in the Wild)

  • 김대하;송병철
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.351-360
    • /
    • 2018
  • 인간 감정 인식은 컴퓨터 비전 및 인공 지능 영역에서 지속적인 관심을 받는 연구 주제이다. 본 논문에서는 wild 환경에서 이미지, 얼굴 특징점 및 음성신호로 구성된 multi-modal 신호를 기반으로 여러 신경망을 통해 인간의 감정을 분류하는 방법을 제안한다. 제안 방법은 다음과 같은 특징을 갖는다. 첫째, multi task learning과 비디오의 시공간 특성을 이용한 준 감독 학습을 사용함으로써 영상 기반 네트워크의 학습 성능을 크게 향상시켰다. 둘째, 얼굴의 1 차원 랜드 마크 정보를 2 차원 영상으로 변환하는 모델을 새로 제안하였고, 이를 바탕으로 한 CNN-LSTM 네트워크를 제안하여 감정 인식을 향상시켰다. 셋째, 특정 감정에 오디오 신호가 매우 효과적이라는 관측을 기반으로 특정 감정에 robust한 오디오 심층 학습 메커니즘을 제안한다. 마지막으로 소위 적응적 감정 융합 (emotion adaptive fusion)을 적용하여 여러 네트워크의 시너지 효과를 극대화한다. 제안 네트워크는 기존의 지도 학습과 반 지도학습 네트워크를 적절히 융합하여 감정 분류 성능을 향상시켰다. EmotiW2017 대회에서 주어진 테스트 셋에 대한 5번째 시도에서, 제안 방법은 57.12 %의 분류 정확도를 달성하였다.

복잡도 기반 적응적 샘플 오프셋 병렬화 (Complexity-based Sample Adaptive Offset Parallelism)

  • 유은경;조현호;서정한;심동규;김두현;송준호
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.503-518
    • /
    • 2012
  • 본 논문은 High Efficiency Video Coding (HEVC)의 인-루프 필터 기술인 Sample Adaptive Offset (SAO)에 대하여 복잡도 분석기반의 병렬화 방법을 제안한다. HEVC의 SAO는 쿼드트리 기반으로 영상을 다수의 SAO영역으로 분할하고, 각 영역 단위로 에러 보정을 위한 오프셋 값을 전송함으로써 복호화된 화소의 에러를 보정한다. HEVC의 SAO는 데이터 레벨의 병렬화를 통하여 고속화할 수 있는데, SAO영역 단위의 데이터 레벨 병렬화는 영역의 크기가 일정하지 않아 멀티 코어를 사용한 병렬화시 작업량 불균형(Workload imbalance)이 발생한다. 또한, SAO는 영역 단위로 필터링 적용 여부가 결정되므로 균둥하게 SAO영역을 각 코어에 할당하더라도, 작업량 불균형이 발생할 수 있다. 본 논문에서는 SAO영역의 최소 단위인 Largest Coding Unit (LCU)를 SAO 수행의 기본단위로 하여, 각 단위에서의 SAO 파라미터 정보를 이용하여 복잡도를 미리 예측 하였다. 예측된 복잡도를 기반으로 각 코어에 균일하게 작업량이 할당될 수 있도록 영역을 코어에 적응적으로 할당하여 병렬화를 수행한 결과 순차 수행 기반 SAO에 비하여 2.38배, 영역 균등 SAO 병렬화 대비 21% 속도 향상되었다.

다중 질의를 위한 적응적 영상 내용 기반 검색 기법 (Adaptive Image Content-Based Retrieval Techniques for Multiple Queries)

  • 홍종선;강대성
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.73-80
    • /
    • 2005
  • 본 최근 영상 및 멀티미디어의 시각적인 내용을 기반으로 하는 검색 방법에 관한 많은 연구들이 진행되고 있다. 내용 기반 영상 검색(content-based image retrieval)에 관한 대부분의 기존의 질의 방법은 입력 영상에 의한 질의 또는 컬러(color), 형태(shape), 특징(texture) 등과 같은 low-level 특징을 사용한다. 그러나 이러한 방법들은 비교적 사용하기 불편하고 방법이 편중되어 있어서 일반 사용자들의 다양한 질의 요구에 적합하지 못하다. 본 논문에서 제안하는 것은 내용 기반 영상 검색 시스템 하의 컬러 객체의 자동 추출과 다중 질의를 위한 레이블링 알고리즘이다. 이것은 먼저 single colorizing 알고리즘을 사용하여 영상의 영역을 단순화 시키고 제안하는 Color and Spatial based Binary tree map (CSB tree map)을 이용하여 컬러 객체를 추출한다. 그리고 제안하는 레이블링 알고리즘을 이용하여 데이터베이스의 객체들을 색인한다. 이것은 컬러와 공간 정보를 고속으로 레이블링 하고 객체의 컬러 속성과 크기 및 위치 정보를 이용하여 객체의 컬러 기반과 공간적 기반의 조합을 바탕으로 하는 사용자의 다양한 질의에 부합할 수 있는 적응성 있는 시스템을 구현한다. 본 논문에서는 "Washington" 데이터베이스를 이용한 비교 실험을 통해서 제안하는 시스템의 검색 결과의 우수함을 알 수 있었다.