• 제목/요약/키워드: 멀티 디코더

검색결과 46건 처리시간 0.022초

팽창된 합성곱 계층 연산 풀링을 이용한 멀티 모달 네트워크 성능 향상 방법 (Improved Multi-modal Network Using Dilated Convolution Pyramid Pooling)

  • 박준영;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.84-86
    • /
    • 2018
  • 요즘 자율주행과 같은 최신 기술의 발전과 더불어 촬영된 영상 장면에 대한 깊이있는 이해가 필요하게 되었다. 특히, 기계학습 기술이 발전하면서 카메라로 찍은 영상에 대한 의미론적 분할 기술에 대한 연구도 활발히 진행되고 있다. FuseNet은 인코더-디코더 구조를 이용하여 장면 내에 있는 객체에 대한 의미론적 분할 기술을 적용할 수 있는 신경망 모델이다. FuseNet은 오직 RGB 입력을 받는 기존의 FCN보다 깊이정보까지 활용하여 RGB 정보를 기반으로 추출한 특징지도와의 요소합 연산을 통해 멀티 모달 구조를 구현했다. 의미론적 분할 연구에서는 객체의 전역 컨텍스트가 고려되는 것이 중요한데, 이를 위해 여러 계층을 깊게 쌓으면 연산량이 많아지는 단점이 있다. 이를 극복하기 위해서 기존의 합성곱 방식을 벗어나 새롭게 제안된 팽창 합성곱 연산(Dilated Convolution)을 이용하면 객체의 수용 영역이 효과적으로 넓어지고 연산량이 적어질 수 있다. 본 논문에서는 컨볼루션 연산의 새로운 방법론적 접근 중 하나인 팽창된 합성곱 연산을 이용해 의미론적 분할 연구에서 새로운 멀티 모달 네트워크의 성능 향상 방법을 적용하여 계층을 더 깊게 쌓지 않더라도 파라미터의 증가 없이 해상도를 유지하면서 네트워크의 전체 성능을 향상할 수 있는 최적화된 방법을 제안한다.

  • PDF

IMAP 프로토콜을 이용한 멀티미디어 메일 시스템 (A Multimedia Mail System using IMAP Protocol)

  • 이봉환;박문호;이하욱;주기호;이찬도;이남준;심영진
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1297-1307
    • /
    • 1997
  • 본 논문에서는 인터넷 상에서 멀티미디어 메일을 주고 받을 수 있게 하는 멀티 미디어 메일 시스템을 구현하였다. 이 메일 시스템은 기존의 텍스트 위주의 e-mail 시스템을 확정한 것으로 텍스트, 이미지,,MPEG 비디오 및 바이너리 데이터의 전송을 가능하게 한다. 멀티미디어 데이터를 표현하기 위해서 기존의 RFC-822 포맷을 확정한 MIME(Multipurpose Untemet Nail Extension)를 그대로 사용한다. 한편, 메이팍스 검색 프로토콜로는 현재 널리 사용되고 있는 POP(Post Office Pritocol)보다 기능이 우수한IMAP(Internet Mail Access Prltocol)을 사용한다. 메일클라이언트는 PC에 구현 하였고 메일 서버는 UNX 시스템에 구현하였다. 구현한 메일 시스템은 바이너리 파일의 추가 기능을 제공하며, 수신된 멀티미디어 메일을 검색하는 경우 수신 윈도우 내에서 포스트스크립트뷰어, MPEG 디코더 등의 응용프로그램과의 직접적인 인터페이스 기능을 제공하여 사용자가 다양한 형태의 메일 메시지를 듣고 볼 수 있게 한다.

  • PDF

실시간 COFDM시스템을 위한 효율적인 구조를 갖는 비터비 디코더 설계 (The viterbi decoder implementation with efficient structure for real-time Coded Orthogonal Frequency Division Multiplexing)

  • 황종희;이승열;김동순;정덕진
    • 대한전자공학회논문지TC
    • /
    • 제42권2호
    • /
    • pp.61-74
    • /
    • 2005
  • 디지털 멀티미디어 방송(DMB)은 대용량의 멀티미디어 정보를 무선환경의 이동체에 전송하기 위해 제안된 방식이다. 이러한 멀티미디어 서비스를 제공하기 위해 DM시스템은 COFDM 변조방식을 사용하여 다중 경로 페이딩 현상을 극복하고, 동시에 강력한 채널오류 정정 능력을 필요로 한다. DMB 수신기를 위한 비터비 디코더(구속장 7, code rate 1/4)는 가변 부호화된 데이터의 복호화를 수행해야 하고, 방송시스템이므로 실시간으로 동작하기 위해서 효율적인 구조를 가져야 한다. 따라서 DMB 시스템을 위한 비터비 디코더를 구현하기 위해서는 복호화 과정을 고속으로 수행할 수 있는 별도의 전용 하드웨어 모듈을 설계하는 것이 바람직하다. 본 논문에서는 많은 연산량을 효율적으로 줄일 수 있는 결합된 Add-Compare-Select(ACS)와 Path Metric Normalization(PMN)구조를 새롭게 제안하고자 한다. PMN구조에서의 단점인 comparison tree에 의한 임계 경로(critical path)의 문제를 고정치(fixed value)에 의한 선택 알고리즘을 적용함으로써 고속 동작이 가능하게 하였고, ACS구조에서는 분할 기법(decomposition method)과 선계산(pre-computation)을 이용하여 덧셈기, 비교기, 표준화기의 복잡도를 줄일 수 있도록 하였다. 시뮬레이션 결과 펑처드 비터비 디코더는 일반적인 구조를 적용했을 때 보다 면적 $3.78\%$, 전력소모 $12.22\%$, 최대 게이트 지연 $23.80\%$의 감소율을 보였다.

딥 컨볼루셔널 인코더-디코더 네트워크를 이용한 망막 OCT 영상의 층 분할 (Layer Segmentation of Retinal OCT Images using Deep Convolutional Encoder-Decoder Network)

  • 권오흠;송민규;송하주;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제22권11호
    • /
    • pp.1269-1279
    • /
    • 2019
  • In medical image analysis, segmentation is considered as a vital process since it partitions an image into coherent parts and extracts interesting objects from the image. In this paper, we consider automatic segmentations of OCT retinal images to find six layer boundaries using convolutional neural networks. Segmenting retinal images by layer boundaries is very important in diagnosing and predicting progress of eye diseases including diabetic retinopathy, glaucoma, and AMD (age-related macular degeneration). We applied well-known CNN architecture for general image segmentation, called Segnet, U-net, and CNN-S into this problem. We also proposed a shortest path-based algorithm for finding the layer boundaries from the outputs of Segnet and U-net. We analysed their performance on public OCT image data set. The experimental results show that the Segnet combined with the proposed shortest path-based boundary finding algorithm outperforms other two networks.

프로그래머블 멀티 포맷 비디오 디코더 (A Programmable Multi-Format Video Decoder)

  • 김재현;박구만
    • 방송공학회논문지
    • /
    • 제20권6호
    • /
    • pp.963-966
    • /
    • 2015
  • 본 논문에서는 최신 압축 표준인 HEVC(High Efficiency Video Coding)를 포함한 다양한 비디오 압축 표준을 처리할 수 있는 프로그래머블 멀티 포맷 복호기(Multi-Format video Decoder: MFD)를 제안한다. 제안한 MFD는 DTV(Digital Tele-Vision) SoC(System on Chip)에 필요한 고사양의 FHD(Full High Definition) 비디오 복호기를 목표로 하였다. 다양한 동영상 압축 표준과 방대한 연산 능력을 지원하기 위하여 제안된 플랫폼에서는 재구성형 프로세서(reconfigurable processor)와 하드웨어 가속기의 하이브리드 구조를 사용하였다. 실험결과 HEVC로 압축된 초당 30장의 FHD 영상을 300MHz에서 디코딩 가능함을 확인하였다.

Motion JPEG용 허프만코딩 기반의 엔트로피 디코더 설계 (A Design of Huffman Coding Based on Entropy Decoder for Motion JPEG)

  • 김경현;손승일;이민수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.89-92
    • /
    • 2008
  • 정보화 사회가 진행되어감에 따라 카메라 센서, 디지털 카메라, 휴대폰, 영상 관련디지털 기기들이 증가하고 이로 인하여 영상정보 서비스 기술의 중요성이 크게 부각되었다. 특히 멀티미디어 응용서비스 기술에서는 영상 정보가 필수적인데, 그 영상 정보의 양이 너무 방대하여 압축 부호화를 하여 사용되고 있다. 본 논문에서는 정지영상압축 방법 중 JPEG표준에서 제시한 4가지 동작 모드 중 베이스라인을 기반으로 하는 JPEG 알고리즘을 연구하여 허프만코팅 기반의 엔트로피 디코더의 불규칙적인 데이터 입출력타이밍의 효과적인 제어를 통해 Motion JPEG에서 동작 가능한 디코더를 C언어를 통해 시뮬레이션하고 최적화된 결과를 VHDL로 구현하였다.

  • PDF

블루투스를 이용한 RTOS 내장형 무선 도어폰 설계 및 구현 (The design and implementation of wireless video door phone with embedded RTOS using Blutooth)

  • 조명훈;강명구;김대진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1097-1100
    • /
    • 2003
  • 본 논문에서는 최근 유선을 대치하기 위해 등장한 여러 가지 근거리 무선통신 방식 중 블루투스 기술과 시스템의 안정성 및 리소스의 효율적 사용을 위한 멀티태스킹이 가능한 RTOS(uC/OS)를 이용하여 투선 비디오 도어폰을 설계 및 구현해 본다. 송신기는 카메라, 비디오 디코더, 영상 압축칩 프로세서(ARM7TDMI), 메모리, 블루투스 모듈 등을 이용하여 임베디드 시스템을 구성하였고, 수신기는 블루투스 모듈을 통해 수신된 영상 데이터를 모니터에 디스플레이 할 수 있다.

  • PDF

Motion JPEG용 베이스라인 기반의 디코더 설계 (A Design of Baseline Based on Decoder for Motion JPEG)

  • 김경현;손승일;이민수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.608-611
    • /
    • 2008
  • 정보화 사회가 진행되어감에 따라 카메라 센서, 디지털 카메라, 휴대폰, 영상 관련디지털 기기들이 증가하고 이로 인하여 영상정보 서비스 기술의 중요성이 크게 부각되었다. 특히 멀티미디어 응용서비스 기술에서는 영상 정보가 필수적인데, 그 영상 정보의 양이 너무 방대하여 압축 부호화를 하여 사용되고 있다. 본 논문에서는 정지영상압축 방법 중 JPEG표준에서 제시한 4가지 동작 모드 중 베이스라인을 기반으로 하는 JPEG 알고리즘을 연구하여 Motion JPEG에서 동작 가능한 디코더를 C언어를 통해 시뮬레이션하고 최적화된 결과를 VHDL로 구현하였다. Motion JPEG의 무선전송 환경에 적용 가능한 불규칙한 스트리밍 방식의 입력데이터의 처리가 가능한 파이프라인 구조로 설계하였다. 설계결과 Xilinx XC3S1000 FG676-4 환경에서 66.130MHz의 동작속도를 나타내었고 최초 223클록의 딜레이 이후 매 클록마다 화소데이터를 얻을 수 있었다 Motion JPEG 디코더를 설계하는데 사용된 게이트는 총 54,143개이다.

  • PDF

네트워크 상에서 동영상 검색을 위한 브라우징 시스템의 구현 (Implementation of Browsing System for Video Retrieval over Network)

  • 하명환;나윤정;이상길
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1997년도 학술대회
    • /
    • pp.33-38
    • /
    • 1997
  • 최근에 윈도 NT를 탑재한 고성능 PC의 등장, ATM 카드, 실시간 MPEG 인코더/디코더 보드의 개발 등, 컴퓨터 업계의 눈부신 발전으로 영상 데이터를 네트워크에 분산 저장하고, 브라우저를 사용하여 필요한 자료를 검색, 활용, 편집할 수 있는 멀티미디어 방송 제작 환경 구축이 가능하게 되었다. 본 연구에서는 실시간 영상 전송을 위해 ATM 망을 구성하고, 네트워크상에서 효율적인 검색을 위한 클라이언트/서버 모델을 제시하며, 자동 인덱싱 기능을 가진 동영상 검색 브라우저 시스템을 구현해 보고 앞으로의 연구방향을 검토하였다. 모든 사용자 인터페이스 편리한 윈도 GUI 환경을 사용하므로 사용자는 프로그램을 쉽게 사용할 수 있으며, 프로그램 전체는 C++를 사용하여 클래스 단위로 제작되어 향후 시스템 개발이 용이하게 설계되었다.

  • PDF

H.264/AVC 인트라 예측모드용 디코더 설계 (Design of Decoder for H.264/AVC Intra Prediction Mode)

  • 정덕영;손승일
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1046-1050
    • /
    • 2005
  • 영상 정보의 발전으로 다양한 멀티미디어 서비스를 가능하게 하였고 네트워크와 IT의 발전으로 사용자가 풍부한 정보를 접할 수 있는 기회를 제공하였다. 이러한 동영상과 정지영상의 많은 정보를 압축하는 여러 방식 중에서 디지털 비디오 압축 관련 국제 표준안 중 MPEG-4와 H.264가 발표되었다. 유연성이 좋은 MPEG-4와 달리 H.264는 비디오 프레임의 효율적인 압축과 신뢰성을 강조 한다. 특히 H.264의 압축 기술은 HDTV처럼 큰 영상 뿐 아니라 카메라폰이나 DMB등의 특히 작은 크기의 영상에서 고품질의 영상을 보다 효율적으로 제공 한다. 본 논문은 기존의 동영상 압축 표준에 비하여 높은 압축성능과 유연성의 장점을 가지고 있고 표준 H.264/AVC에서 공간적 예측을 사용하여 비디오 프레임을 압축하는 방법인 Intra coding 에서 사용하는 여러 모드 중 4*4 예측모드를 연구하여 C언어를 이용한 최적화된 시뮬레이션과 Intra coding decoder의 성능평가를 통한 최적화를 실시하였고, 최적화된 예측 정보를 바탕으로 Intra coding decoder를 VHDL언어를 이용하여 하드웨어로 구현하였다.

  • PDF