• 제목/요약/키워드: encoder-decoder

검색결과 451건 처리시간 0.025초

MEDU-Net+: a novel improved U-Net based on multi-scale encoder-decoder for medical image segmentation

  • Zhenzhen Yang;Xue Sun;Yongpeng, Yang;Xinyi Wu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1706-1725
    • /
    • 2024
  • The unique U-shaped structure of U-Net network makes it achieve good performance in image segmentation. This network is a lightweight network with a small number of parameters for small image segmentation datasets. However, when the medical image to be segmented contains a lot of detailed information, the segmentation results cannot fully meet the actual requirements. In order to achieve higher accuracy of medical image segmentation, a novel improved U-Net network architecture called multi-scale encoder-decoder U-Net+ (MEDU-Net+) is proposed in this paper. We design the GoogLeNet for achieving more information at the encoder of the proposed MEDU-Net+, and present the multi-scale feature extraction for fusing semantic information of different scales in the encoder and decoder. Meanwhile, we also introduce the layer-by-layer skip connection to connect the information of each layer, so that there is no need to encode the last layer and return the information. The proposed MEDU-Net+ divides the unknown depth network into each part of deconvolution layer to replace the direct connection of the encoder and decoder in U-Net. In addition, a new combined loss function is proposed to extract more edge information by combining the advantages of the generalized dice and the focal loss functions. Finally, we validate our proposed MEDU-Net+ MEDU-Net+ and other classic medical image segmentation networks on three medical image datasets. The experimental results show that our proposed MEDU-Net+ has prominent superior performance compared with other medical image segmentation networks.

재사용성과 확장성 있는 HL7 인코딩/디코딩 프레임워크의 설계 및 구현 (Design and Implementation of a Reusable and Extensible HL7 Encoding/Decoding Framework)

  • 김정선;박승훈;나연묵
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.96-106
    • /
    • 2002
  • HL7 (Health Level 7)은 Healthcare 환경의 이질적 시스템간에 임상 및 관리정보의 교환을 가능하게 하는 국제 표준 프로토콜로서 표준 인코딩 규칙에 따른 다양한 HL7 메시지 양식을 정의하고 있다. 본 논문에서는 메시지 객체 모델(Message Object Model)과 메시지 정의 저장소(Message Definition Repository)를 이용하여 유연성, 재사용성, 확장성이 탁월한 HL7 인코딩/디코딩 프레임워크의 설계 및 구현을 제시한다. 메시지 객체 모델은 HL7 메시지를 구성하는 객체들과 그들 간의 다양한 관계를 나타내는 추상적 HL7 메시지 양식으로서, 세그먼트, 필드, 컴포넌트 등과 같은 HL7 메시지의 표준 구성요소들 간의 논리적 관계를 반영하는 동시에 표준안에 의해 규정된 구조적 제약사항을 만족하도록 하여 준다. 메시지 객체 모델은 플랫폼 종속적인 데이터 양식과 상관없이 독립적으로 HL7 인코더와 디코더를 구축할 수 있도록 하여 주기 때문에 최소의 노력으로 임의의 이질적 병원 정보 시스템들을 상호 연결할 수 있도록 한다. 한편, HL7 메시지들을 정의하고 있는 외부 데이터베이스인 메시지 정의 저장소는 표준 HL7 메시지 양식이 수정되더라도 인코더와 디코더의 구현이 영향을 받지 않게 하여 준다. 게다가, 메시지 정의 저장소는 인코더와 디코더 각각의 입력(즉, 메시지 객체 모델로 표현된 HL7 메시지 객체와 인코딩된 HL7 메시지 문자열)에 대하여 합법성 여부를 조사하는 데 유용하게 사용된다. 본 논문에서는 프로토타입 HL7 인코더와 디코더의 구현을 위해 JAVA를 이용하였지만, 제시된 인코딩/디코딩 프레임워크는 인코더와 디코더를 ActiveX, JAVABEAN 또는 CORBA 객체 등과 같이 독립된 표준 컴포넌트로서 쉽게 구현될 수 있도록 하여 준다.

Adaptive Importance Channel Selection for Perceptual Image Compression

  • He, Yifan;Li, Feng;Bai, Huihui;Zhao, Yao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3823-3840
    • /
    • 2020
  • Recently, auto-encoder has emerged as the most popular method in convolutional neural network (CNN) based image compression and has achieved impressive performance. In the traditional auto-encoder based image compression model, the encoder simply sends the features of last layer to the decoder, which cannot allocate bits over different spatial regions in an efficient way. Besides, these methods do not fully exploit the contextual information under different receptive fields for better reconstruction performance. In this paper, to solve these issues, a novel auto-encoder model is designed for image compression, which can effectively transmit the hierarchical features of the encoder to the decoder. Specifically, we first propose an adaptive bit-allocation strategy, which can adaptively select an importance channel. Then, we conduct the multiply operation on the generated importance mask and the features of the last layer in our proposed encoder to achieve efficient bit allocation. Moreover, we present an additional novel perceptual loss function for more accurate image details. Extensive experiments demonstrated that the proposed model can achieve significant superiority compared with JPEG and JPEG2000 both in both subjective and objective quality. Besides, our model shows better performance than the state-of-the-art convolutional neural network (CNN)-based image compression methods in terms of PSNR.

의사 형태소 단위 채팅 시스템 (Chatting System that Pseudomorpheme-based Korean)

  • 김시형;김학수
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.263-267
    • /
    • 2016
  • 채팅 시스템은 사람이 사용하는 언어로 컴퓨터와 의사소통을 하는 시스템이다. 최근 딥 러닝이 큰 화두가 되면서 다양한 채팅 시스템에 관한 연구가 빠르게 진행 되고 있다. 본 논문에서는 문장을 Recurrent Neural Network기반 의사형태소 분석기로 분리하고 Attention mechanism Encoder-Decoder Model의 입력으로 사용하는 채팅 시스템을 제안한다. 채팅 데이터를 통한 실험에서 사용자 문장이 짧은 경우는 답변이 잘 나오는 것을 확인하였으나 긴 문장에 대해서는 문법에 맞지 않는 문장이 생성되는 것을 알 수 있었다.

  • PDF

삭제된 변환계수의 복원을 이용한 임의형태 영상영역 변환부호화 (Transform Coding of Arbitrarily-Shaped Image Segments Using Recovery of Truncated Coefficients)

  • 김희정;김지홍
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2351-2354
    • /
    • 2003
  • A new transform coder for arbitrarily shaped image segments is proposed. In the encoder, a block-based DCT is applied to the resulting image block after shifting pixels within the image segment to block border and padding the mean value of the pixels to empty region. For reducing the transmission bit rate, the transform coefficients located in padded region are truncated and only the remaining transform coefficients are transmitted to the decoder. In the decoder, the transform coefficients truncated in the encoder are recovered using received transform coefficients and a block-based inverse DCT is performed.

  • PDF

Reed-Muller 부호의 인코더 및 디코더 설계 (Design of an Encoder and Decoder Using Reed-Muller Code)

  • 김영곤;강창언
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1984년도 추계학술발표회논문집
    • /
    • pp.15-18
    • /
    • 1984
  • The majority - logic decoding algorithm for Geometry code is more simply imlemented than the known decoding algorithm for BCH codes. Thus, the moderate code word, Geometry codes provide rather effective error control. The purpose of this paper is to investigate the Reed - Muller code and to design the encoder and decoder circuit and to find the performance for (15, 11) Reed - muller code. Experimental results show that the system has not only single error - correcting ability but also good performance.

  • PDF

3-Bit Soft Decision Viterbi 복호기의 VLSI 설계 (VLSI Design of 3-Bit Soft Decision Viterbi Decoder)

  • 김기명;송인채
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.863-866
    • /
    • 1999
  • In this paper, we designed a Viterbi decoder with constraint length K=7, code rate R=1/2, encoder generator polynomial (171, 133)$_{8}$. This decoder makes use of 3-bit soft decision. We designed the Viterbi decoder using VHDL. We employed conventional logic circuit instead of ROM for branch metric units(BMUs) to reduce the number of gates. We adopted fully parallel structures for add-compare-select units(ACSUs). The size of the designed decoder is about 200, 000 gates.s.

  • PDF

단일 엔코더 및 디코더를 이용하는 다시점 비디오 시스템 (Multi-View Video System using Single Encoder and Decoder)

  • 김수학;김윤;김만배
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.116-129
    • /
    • 2006
  • 인터넷을 통한 데이터 전송 기술의 발전은 다양한 실감 콘텐츠를 확산시키는 역할을 하고 있고, 이러한 실감 콘텐츠의 하나로 다시점 비디오가 연구되고 있다. 다시점 비디오는 여러 대의 카메라로부터 획득한 영상을 사용자에게 전달해 원하는 시점에서 영상을 시청할 수 있도록 하는 차세대 영상이다. 다시점 영상을 공급하기 위해서는 일반적으로 카메라 개수와 같은 개수의 엔코더와 디코더가 필요하며, 또한 상대적으로 큰 전송 대역폭을 필요로 한다. 본 논문에서는 상기 문제점을 해결하기 위해서 단일 엔코더와 디코더만을 이용하는 다시점 비디오 시스템을 제안한다. 부호화에서는 다시점 YUV 비디오를 GOP 단위로 믹싱하여 l 개의 YUV 스트립을 만든 후에, 단일 H.264/ AVC 엔코더로 부호화하여 압축 비트열을 생성한다. 또한 복호화도 단일 디코더 및 이를 제어하는 스케줄러로 구성된다. 스케줄러는 디코더 이용률과 프레임 스킵을 활용하여 각 시점 영상들이 동등한 복호화 프레임 개수를 가지게 한다. 또한 프레임 스킵에서는 비용 함수를 이용하여 H.264/AVC 프로화일에 따른 효율적인 프레임 선택 방법을 제안한다. 다양한 메인 및 베이스라인 프로화일 다시점 영상들을 활용하여 제안 방법의 성능을 검증하였다. 실험 결과는 각 시점 영상이 동등한 디코더 이용률을 얻는 것을 보여준다. 또한 rate-distortion 커브를 이용하여 제안한 방식과 동시 방식의 성능을 검증하였다.

엔트로피 코딩 기반의 분산 비디오 코딩을 위한 블록 기반 복잡도 분배 (Complexity Balancing for Distributed Video Coding Based on Entropy Coding)

  • 유성은;민경연;심동규
    • 방송공학회논문지
    • /
    • 제16권1호
    • /
    • pp.133-143
    • /
    • 2011
  • 본 논문은 엔트로피 코딩 기반 분산 비디오 코딩 시스템에서의 복잡도 분배 기법을 제안한다. 제안하는 방법은 복호화기의 복잡도 감소를 위하여 채널 코더 대신 엔트로피 코더를 이용하며, 저 복잡도로 높은 부호화 효율을 얻기 위한 블록 단위 복잡도 분배 방법을 수행한다. 제안하는 분산 비디오 복호화기는 움직임 추정을 수행하여 측정된 움직임 벡터를 부호화기로 전송하고, 부호화기에서는 복호화기로부터 수신된 움직임 벡터를 보정하여 보다 정확한 움직임 추정을 수행한다. 움직임 벡터의 보정을 수행 시, 수신된 움직임 벡터와 예측 움직임 벡터를 이용하여 최적의 예측 움직임 벡터를 결정하며, 움직임 벡터와 예측 움직임 벡터의 차에 따라 범위를 조절함으로써 블록의 복잡도를 적응적으로 할당한다. 제안하는 부호화기는 H.264/AVC의 부호화기의 복잡도에 비교하여 11.8% 감소하였고, 제안하는 복호화기는 기존의 분산 비디오 시스템의 복호화기 복잡도보다 99%감소되다.

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.