• 제목/요약/키워드: decoder

검색결과 1,658건 처리시간 0.027초

신경망 기반 비디오 압축을 위한 레이턴트 정보의 방향 이동 및 보상 (Latent Shifting and Compensation for Learned Video Compression)

  • 김영웅;김동현;정세윤;최진수;김휘용
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.31-43
    • /
    • 2022
  • 전통적인 비디오 압축은 움직임 예측, 잔차 신호 변환 및 양자화를 통한 하이브리드 압축 방식을 기반으로 지금까지 발전해왔다. 최근 인공 신경망을 통한 기술이 빠르게 발전함에 따라, 인공 신경망 기반의 이미지 압축, 비디오 압축 연구 또한 빠르게 진행되고 있으며, 전통적인 비디오 압축 코덱의 성능과 비교해 높은 경쟁력을 보여주고 있다. 본 논문에서는 이러한 인공 신경망 기반 비디오 압축 모델의 성능을 향상시킬 수 있는 새로운 방법을 제시한다. 기본적으로는 기존 인공 신경망 기반 비디오 압축 모델들이 채택하고 있는 변환 및 복원 신경망과 엔트로피 모델(Entropy model)을 이용한 율-왜곡 최적화(Rate-distortion optimization) 방법을 사용하며, 인코더 측에서 디코더 측으로 압축된 레이턴트 정보(Latent information)를 전송할 때 엔트로피 모델이 추정하기 어려운 정보의 값을 이동시켜 전송할 비트량을 감소시키고, 손실된 정보를 추가로 전송함으로써 손실된 정보에 대한 왜곡을 보정한다. 이러한 방법을 통해 기존의 인공 신경망 기반 비디오 압축 기술인 MFVC(Motion Free Video Compression) 방법을 개선하였으며, 실험 결과를 통해 H.264를 기준으로 계산한 BDBR (Bjøntegaard Delta-Bitrate) 수치(%)로 MFVC(-14%) 보다 두 배 가까운 비트량 감축(-27%)이 가능함을 입증하였다. 제안된 방법은 MFVC 뿐 아니라, 레이턴트 정보와 엔트로피 모델을 사용하는 신경망 기반 이미지 또는 비디오 압축 기술에 광범위하게 적용할 수 있다는 장점이 있다.

근단 배경 잡음 환경에서 G.729A 음성부호화기 파라미터에 기반한 새로운 음성 강화 기법 (Speech Reinforcement Based on G.729A Speech Codec Parameter Under Near-End Background Noise Environments)

  • 최재훈;장준혁
    • 한국음향학회지
    • /
    • 제28권4호
    • /
    • pp.392-400
    • /
    • 2009
  • 본 논문에서는 근단 (Near-End) 잡음 환경에서 ITU-T의 표준 음성부호화기인 G.729A CS-ACELP 기반의 효과적인 음성강화 기법을 제시한다. 일반적으로 다양한 배경 잡음이 존재하는 근단 환경에서 수신하는 원단 화자 음성의 명료도가 매우 감소하므로, 이를 극복하기 위한 원단 화자 음성 강화 기법이 필요하다. 기존의 음성강화 시스템과는 대조적으로, 다양한 배경 잡음이 존재하는 근단 환경에서 음성부호화기에 기반하여, 원단으로부터 수신된 비트스트림 파라미터 중 여기신호(excitation signal)를 강화하는 알고리즘을 제시한다. 구체적으로, 다양한 배경 잡음이 존재하는 근단 환경에서 G.729A CS-ACELP의 부호화기를 통해 배경 잡음의 여기신호를 추정하고, 추정된 배경 잡음의 여기신호를 기반으로 원단 화자로부터 전송된 음성 신호의 여기신호를 강화시키는데, 특별히 G.729A 복호화기내에서 원단의 음성 신호를 직접 강화하는 알고리즘을 제안한다. 제안된 음성 강화 기법의 성능은 다양한 잡음 환경 하에서 ITU-T P.800의 주관적 음질 측정 방법인 CCR (Comparison Category Rating) 테스트에 의해 평가되었으며, 기존의 SNR 복구 기법과 비교해서 우수한 성능을 보여주었다.

여기신호의 상관관계 기반 joint coding을 이용한 MPEG-4 audio lossless coding 인코더 복잡도 감소 방법 (A Complexity Reduction Method of MPEG-4 Audio Lossless Coding Encoder by Using the Joint Coding Based on Cross Correlation of Residual)

  • 조충상;김제우;최병호
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.87-95
    • /
    • 2010
  • 오디오 신호를 무손실 압축하여 휴대용 멀티미디어 기기에서 최고의 오디오 품질을 제공하는 기기들이 등장하고 있으며, 무손실 오디오 압축을 위한 기술에서는 2006년 MPEG-4 audio lessless coding(ALS)와 MPEG-4 scalable lossless coding(SLS)가 국제 표준으로 채택 되었다. 2009년에는 MPEG에서 최대 스테레오 음원까지만 지원하는 MPEG-4 ALS simple profile을 정의하였다. 표준화된 무손실 오디오 코덱이 휴대용 멀티미디어 기기에서 널리 이용되기 위해서는 휴대용 멀티미디어 기기에서 가장 널리 쓰이는 스테레오 조건에서 낮은 복잡도를 보여야 한다. 하지만 기존 연구에서는 MPEG-4 ALS의 압축률을 향상시키거나, 혹은 다채널 환경에서의 복잡도를 개선하기 위한 연구들이 주로 이루어졌다. 본 논문에서는 MPEG-4 ALS 인코더의 복잡도와 압축률을 분석하고, 이를 바탕으로 MPEG-4 ALS simple profile 조건에서 MPEG-4 ALS 인코더의 복잡도를 개선하기 위한 방법을 제안한다. 분석 결과 MPEG-4 ALS 인코더의 analysis 블록에서 전체 복잡도의 75% 발생하므로, 기존의 연구에서 개발된 저 복잡도 필터를 인코더에 적용하여 복잡도를 감소시키며, joint coding의 압축 효율과 여기 신호의 상호상관계수의 관계를 기반으로 joint coding 결정 방법을 제안한다. 제안된 방법과 저 복잡도 필터가 포함된 MPEG-4 ALS 인코더의 성능은 MPEG-4 conformance test 파일과 일반 음악 파일을 이용하여 복잡도 및 압축률로써 평가된다. 실험 결과 제안된 방법이 적용되었을 경우 압축률은 유사하면서 인코더 복잡도가 24% 감소한다. 이를 통해 본 논문에서 제안된 방법이 MPEG-4 ALS 인코더의 복잡도 감소에 탁월한 성능을 가짐을 보였다.

두층 섬광결정과 위치민감형광전자증배관을 이용한 소동물 양전자방출단층촬영기 개발: 기초실험 결과 (Development of a Small Animal Positron Emission Tomography Using Dual-layer Phoswich Detector and Position Sensitive Photomultiplier Tube: Preliminary Results)

  • 정명환;최용;정용현;송태용;정진호;홍기조;민병준;최연성;이경한;김병태
    • 대한핵의학회지
    • /
    • 제38권5호
    • /
    • pp.338-343
    • /
    • 2004
  • 목적: 이 연구의 목적은 두층 섬광결정을 사용하여 PET 기기 시야 외곽에서 발생하는 영상 왜곡현상을 최소화하는 고 민감도, 고 분해능의 소동물 PET 시스템을 개발하는 것이다. 대상 및 방법: GATE (Geant4 Application for Tomographic Emission) 시뮬레이션 프로그램을 사용하여 시스템을 모사하였고 시스템 성능을 예측하였으며 시뮬레이션에서 도출한 파라미터를 기준으로 시스템을 설계 제작 하였다. 두층 섬광결정은 Lutetium Oxyorthosilicate (LSO)와 Lutetium-Yttrium Aluminate-Perovskite (LuYAP)으로 구성하였다. 섬광결정의 각 픽셀크기는 $2mm{\times}2mm{\times}8mm$이며 $8{\times}8$로 배열하여 두층 섬광결정으로 구성하였다. 두층 섬광결정 배열을 위치민감형 광전자증배관(Position Sensitive Photomultiplier Tube: PSPMT)과 결합하여 한 개의 검출기를 구성하였으며, 총 16개 검출기를 지름 10 cm, 유효시야 8 cm인 원형으로 배열하였다. 검출기로부터 출력된 데이터는 소켓, 디코더, ADC, FPGA회로를 거쳐 전 처리 컴퓨터에 입력되고 마스터 컴퓨터에 저장 되도록 하였다. 결과: 시스템 개발의 초기 연구로 한쌍 검출기만 사용하여 단층영상을 획득하고 민감도와 공간분해능을 측정하였다. 점선원을 시야 중앙에 위치했을 때 공간분해능은 2.3 mm FWHM이고, 민감도는 10.9 $cps/{\mu}Ci$이었다. 결론: 구축한 시스템을 사용하여 선원의 위치와 모양변화를 정확하게 측정한 사이노그램과 PET 영상을 획득할 수 있었다. 이 연구는 고 분해능 고 민감도 PET 시스템 개발의 초기연구로, 소형 원형 PET 시스템 개발 가능성을 보여준다.lamate을 이용하여 측정한 사구체 여과율과 통계적으로 유의한 상관 관계를 보이지 않았다. 결론: Gates 방법을 이용한 사구체 여과율 측정에서 배후 방사능 관심 영역은 신장의 상방과 양측 신장사이, 즉 혈액 풀 방사능이 많이 분포하는 부위에 설정하는 것이 I-125-iothalamate을 이용한 사구체 여과율과 가장 높은 상관 관계를 보였고, 신장 깊이가 깊지 않은 2군에서 두 사구체 여과율은 더 높은 상관 관계를 보였다.7%$, 25분일 때 $95{\pm}12%$, 40분일 때 $98{\pm}3%$로 통계학적으로 유의한 차이는 없었다(p>0.05). 항응고제 종류에 따른 결합효율은 헤파린을 사용한 경우 $89{\pm}20%$, CPDA를 사용한 경우 $97{\pm}6%$, ACD를 사용한 경우 $98{\pm}4%$로 CPDA와ACD를 사용한 경우에 유의하게 높은 결합효율을 보였다(p<0.001). 결론: 변형 체내 표지법으로 적혈구를 표지시 우수한 결합효율을 유지하기 위해서는 채취하는 혈액의 양은 3 mL 이상, 배양시간은 10분 이상(10분-40분), 항응고제는 ACD나 CPDA tinning 시간은 20분 이상(20-35분)을 유지하고, 가능한 rotating invertor를 사용하는 것이 좋을 것으로 생각된다.KC $\varepsilon$이 K562(Adr)세포에서 많이 발현되었으나, K562와 K562(Adr)세포에서는 verapamil처리에 따른 PKC 아형의 변화는 없었다. 결론: Verapamil은 암세포의 종류에 따라 MIBI와 TF의 섭취를 감소시켰고, 고용량에는 MDR세포의 섭취도 감소시켰으며 이러한 현상은 세포독성 이나 PKC효소 아형과는 관련이 없었다. 그러므로 MDR의 진단시 verapamil을

AMOLED 컬럼 구동회로 응용을 위한 시분할 기법 기반의 면적 효율적인 10b DAC (An Area-Efficient Time-Shared 10b DAC for AMOLED Column Driver IC Applications)

  • 김원강;안태지;이승훈
    • 전자공학회논문지
    • /
    • 제53권5호
    • /
    • pp.87-97
    • /
    • 2016
  • 본 논문에서는 시분할 기법을 적용하여 AMOLED 컬럼 구동회로용 DAC의 유효 채널 면적을 최소화한 2단 저항 열 기반의 10비트 DAC를 제안한다. 제안하는 DAC는 시분할 기법 기반의 DEMUX, 6비트 및 4비트의 2단 저항 열 구조를 기반으로 하는 롬 구조의 디코더를 2단계로 사용하여 기존의 디스플레이용 DAC보다 빠른 변환속도를 가지는 동시에 하나의 패널 컬럼 구동을 위한 DAC의 유효 면적을 최소화하였다. 두 번째 단 4비트 저항 열에서는 DAC 채널의 면적과 부하 영향을 줄이는 동시에 버퍼 증폭기로 인한 채널 간 오프셋 부정합을 제거하기 위해 기존의 단위-이득 버퍼 대신 간단한 구조의 전류원으로 대체하였다. 제안하는 1:24 DEMUX는 하나의 클록과 5비트 2진 카운터만을 사용하여, 하나의 DAC 채널이 24개의 컬럼을 순차적으로 구동할 수 있도록 하였다. 각 디스플레이 컬럼을 구동하는 출력 버퍼 입력 단에는 0.9pF의 샘플링 커패시터와 작은 크기의 source follower를 추가하여 top-plate 샘플링 구조를 사용하면서 채널 전하 주입에 의한 영향을 최소화하는 동시에 출력 버퍼의 신호정착 정확도를 향상시켰다. 제안하는 DAC는 $0.18{\mu}m$ CMOS 공정으로 제작하였으며, DAC 출력의 정착 시간은 입력을 '$000_{16}$'에서 '$3FF_{16}$'으로 인가했을 때 62.5ns의 수준을 보인다. 제안하는 DAC 단위 채널의 면적 및 유효 채널 면적은 각각 $0.058mm^2$$0.002mm^2$이며, 3.3V의 아날로그 및 1.8V의 디지털 전원 전압에서 6.08mW의 전력을 소모한다.

적응 변조 시스템에서 각 MIMO 기법에 따른 최적의 터보 부호화된 V-BLAST 기법 (The Optimal Turbo Coded V-BLAST Technique in the Adaptive Modulation System corresponding to each MIMO Scheme)

  • 이경환;류상진;최광욱;유철우;홍대기;김대진;황인태;김철성
    • 대한전자공학회논문지TC
    • /
    • 제44권6호
    • /
    • pp.40-47
    • /
    • 2007
  • 본 논문에서는 V-BLAST (Vertical-Bell-lab Layered Space Time) 복호 알고리즘의 ordering과 slicing 과정에 MAP(Maximum A Posteriori) 디코더의 외부 정보 (extrinsic information)를 이용한 최적의 터보 부호화된 (Optimal Turbo Coded) V-BLAST 적응 변조 시스템을 제안 후 성능을 관찰한다. 또한, 적응 변조 시스템에서 간단하게 V-BLAST 시스템과 터보 부호화 (Turbo Coding) 기법이 결합된 기존의 터보 부호화된 V-BLAST 기법을 적용한 경우와 기존의 터보 부호화된 V-BLAST 기법에서 V-BLAST 디코딩 알고리즘 대신 ML (Maximum Likelihood) 디코딩 알고리즘을 적용한 경우에 비교하여 전송률 (throughput) 성능과 복잡도를 살펴본다. 게다가, MIMO (Multiput-Input-Multiple-Output) 기법을 적용하여 제안된 시스템의 성능 개선을 확인한다. 모의 실험 결과, 제안된 디코딩 알고리즘은 ML 디코딩 알고리즘에 비해 복잡도가 낮으나, 기존의 시스템에 비해 복잡도가 높다. 하지만, 성능 개선 측면에서 제안된 시스템의 전송률 성능은 기존의 시스템에 비하여 전신호 대 잡음 비(SNR: Signal to Noise Ratio) 구간에서 우수하고, ML 디코딩 알고리즘을 적용한 기존 시스템의 전송률 성능에 거의 근접함을 보인다. 특히, 실험 결과는 각 MIMO 기법에서 제안된 시스템이 기존의 시스템에 비하여 각각 최대 350kbps, 460 kbps, 740 kbps의 전송률 성능 개선을 보여주고, 이것은 제안된 디코딩 알고리즘의 효과가 송 수신안테나의 수가 증가할수록 커진다는 것을 의미한다.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

실데이터 기반 능동 소나 신호 합성 방법론 (Real data-based active sonar signal synthesis method)

  • 김윤수;김주호;석종원;홍정표
    • 한국음향학회지
    • /
    • 제43권1호
    • /
    • pp.9-18
    • /
    • 2024
  • 최근 수중표적의 저소음화와 해상교통량의 증가로 인한 주변 소음의 증가로 능동 소나 시스템의 중요성이 증대되고 있다. 하지만 신호의 다중 경로를 통한 전파, 다양한 클러터와 주변 소음 및 잔향 등으로 인한 반향신호의 낮은 신호대잡음비는 능동 소나를 통한 수중 표적 식별을 어렵게 만든다. 최근 수중 표적 식별 시스템의 성능을 향상 시키기 위해 머신러닝 혹은 딥러닝과 같은 데이터 기반의 방법을 적용시키려는 시도가 있지만, 소나 데이터셋의 특성 상 훈련에 충분한 데이터를 모으는 것이 어렵다. 부족한 능동 소나 데이터를 보완하기 위해 수학적 모델링에 기반한 방법이 주로 활용되어오고 있다. 그러나 수학적 모델링에 기반한 방법론은 복잡한 수중 현상을 정확하게 모의하는 데에는 한계가 있다. 따라서 본 논문에서는 심층 신경망 기반의 소나 신호 합성 기법을 제안한다. 제안하는 방법은 인공지능 모델을 소나 신호 합성 분야에 적용하기 위해, 음성 합성 분야에서 주로 사용되는 타코트론 모델의 주요 모듈인 주의도 기반의 인코더 및 디코더를 소나 신호에 적절하게 수정하였다. 실제 해상 환경에 모의 표적기를 배치해 수집한 데이터셋을 사용하여 제안하는 모델을 훈련시킴으로써 보다 실제 신호와 유사한 신호를 합성해낼 수 있게 된다. 제안된 방법의 성능을 검증하기 위해, 합성된 음파 신호의 스펙트럼을 직접 분석을 진행하여 비교하였으며, 이를 바탕으로 오디오 품질 인지적 평가(Perceptual Quality of Audio Quality, PEAQ)인지적 성능 검사를 실시하여 총 4개의 서로 다른 환경에서 생성된 반사 신호들에 대해 원본과 비교해 그 차이가 최소 -2.3이내의 높은 성적을 보여주었다. 이는 본 논문에서 제안한 방법으로 생성한 능동 소나 신호가 보다 실제 신호에 근사한다는 것을 입증한다.