• 제목/요약/키워드: DECODER

검색결과 1,660건 처리시간 0.032초

공간적 유사성과 심볼단위 오류정정 채널 코드를 이용한 경량화 비디오 부호화 방법 (Lightweight video coding using spatial correlation and symbol-level error-correction channel code)

  • 고봉혁;심혁재;전병우
    • 방송공학회논문지
    • /
    • 제13권2호
    • /
    • pp.188-199
    • /
    • 2008
  • 기존의 부호화 기술은 부호화기의 복잡도가 복호화기에 비해 매우 높은 구조로 이루어져 있다. 하지만 최근에 부호화기 복잡도의 대부분을 차지했던 움직임 예측/보상과정을 없애는 경량화 부호화 구조에 대한 연구가 중요해졌다. Wyner-Ziv 부호화 기술은 이의 대표적인 기술로서 부호화기는 단순히 현재 프레임에 대한 패리티 정보만을 생성하며 프레임 간 유사성을 이용하는 어떠한 처리절차도 행하지 않기 때문에 종래의 기술에 비해 매우 간단한 구조를 갖는다. 하지만 Wyner-Ziv 부호화 구조에서는 잡음이 많은 보조영상을 복호화에 이용 할 경우 채널 코드의 복호화 오류가 발생한다. 이러한 복호화 오류는 특히 영상 간 유사성이 적어 보조정보를 잘 만들 수 없는 경우 더 많이 발생하며 복원된 영상에 마치 Salt & Pepper와 같은 형태의 잡음으로 나타난다. 이러한 잡음은 비록 그 발생빈도가 적더라도 복원된 영상의 주관적인 화질을 상당히 떨어뜨리는 요소로 작용하므로 이전에는 공간적 유사성을 이용하여 이러한 오류를 정정하는 선택적 미디언 필터를 사용한 경량화 부호화 방법을 제안하였었다. 하지만 이전 방법에서는 텍스처가 복잡한 영상의 경우, 필터적용에 따른 텍스처의 손실이 오류정정으로 얻는 이득보다 더 큰 경우가 발생하는 문제점이 있었다. 따라서 본 논문에서는 선택적 미디언 필터에 복원영상과 보조정보 내 잡음에 관한 정보를 제공함으로써 필터링에 따른 텍스처의 손실을 최소화하는 향상된 경량화 부호화 방법을 제안한다. 실험결과는 이전 방법에 비해 최대 0.84dB에 이르는 성능향상을 보였다.

분자통신 채널에서 소프트 값을 이용한 해밍부호의 복호에 대한 연구 (A Study on the Decoding of Hamming Codes using Soft Values on the Molecular Communication Channel)

  • 정호영
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.338-343
    • /
    • 2020
  • 본 논문에서는 소프트 값을 활용한 Hamming 부호의 복호 방식이 분자 통신 채널에도 적용될 수 있음을 보였다. 분자 통신 시스템의 복조기 출력단에서 복호에 활용될 수 있는 소프트 값 기준을 제안하고 이를 활용한 복호 방식이 분자 통신 채널에서도 신뢰도를 향상시킬 수 있음을 모의실험을 통해 보였다. 확산 기반 분자통신 채널을 가정하였으며 BCSK 변조방식을 이용하여 정보 심벌을 전송하였다. 매 심벌구간 마다 수신기에 흡수되는 분자 수를 적절한 문턱값과 비교하여 복조한 후 흡수된 분자 수는 더 이상 사용되지 않는다. 본 논문에서는 더 이상 사용되지 않는 분자수 정보를 소프트 값으로 복호 과정에 활용하여 복호기의 BER 성능을 개선하였다. BER 성능 향상을 확인하기 위해 시뮬레이션을 수행하였으며, 비트 당 분자수가 600인 경우 해밍 부호를 사용하지 않은 BCSK 시스템의 오율에 대해 (15,11) 해밍 부호의 오율이 약 5.0×10-3 정도 개선되었으며 이에 대해 소프트 값을 활용한 (15,11) 해밍 부호의 오율은 동일한 정도로 개선되었음을 볼 수 있었다. (7,4) 해밍 부호의 경우에도 (15,11) 해밍 부호와 유사한 결과를 보여준다. 따라서 수신기에 흡수된 분자수와 문턱 값의 차이 값을 소프트 값으로 활용하면 분자통신 채널에서도 해밍 부호의 BER 성능을 크게 개선할 수 있음을 알 수 있다.

비가우시안 잡음 채널에서 Robust 등화기법을 이용한 터보 부호의 MAP 알고리즘 성능분석 (Performance Analysis of MAP Algorithm by Robust Equalization Techniques in Nongaussian Noise Channel)

  • 소성열
    • 한국통신학회논문지
    • /
    • 제25권9A호
    • /
    • pp.1290-1298
    • /
    • 2000
  • 터보 부호의 복호기는 각 복호 단계마다 순방향과 역방향의 메트릭을 계산하여 복호할 비트의 잉여 정보를 추출하여 다음 복호 단계에서 이 정보를 이용하는 반복 복호 기술이다. 터보 부호는 인터리버의 크기가 크고 반복 복호가 충분히 수행되었을 때 BER의 관점에서 Shannon Limit에 근접하는 우수한 성능을 보였다. 그러나 많은 연산량에 따른 복잡도의 증가와 인터리버와 반복 복호에 따른 지연과 실시간 처리의 어려움이라는 문제점을 안고 있다. 본 논문에서는 터보 부호의 복호 알고리즘으로 사용되고 있는 MAP(maximum a posteriori) 알고리즘과 이의 성능을 결정하는 요소를 분석한다. MAP알고리즘은 모든 인접 비트들과 수신 심벌들 사이의 상태와 천이 확률을 통해 연성 결정값을 결정하여 반복 복호 동작을 수행한다. 그러므로 MAP알고리즘의 성능 향상을 위해서는 인접한 수신 심볼들의 신뢰성을 보장해 주어야만 한다. 하지만 MAP 알고리즘 자체에서는 이를 위한 어떠한 동작도 해줄 수가 없기 때문에 추가적인 알고리즘이 필요하디는 결론을 얻을 수 있으며 반복 복호 동작을 줄일수 있게된다. 따라서 수신된 심볼에 대하여 좀 더 신뢰성을 있는 정보를 MAP 알고리즘의 입력으로 주기 위해 Robust 등화기법을 적용하여 MAP 알고리즘과 터보 부호의 성능을 비가우시안 채널 환경에서 분석한다.

  • PDF

모순 검증을 통한 다중 움직임 벡터 해상도 시그널링 방법 (Signaling Method of Multiple Motion Vector Resolutions Using Contradiction Testing)

  • 원광현;박영현;전병우
    • 전자공학회논문지
    • /
    • 제52권7호
    • /
    • pp.107-118
    • /
    • 2015
  • 대부분의 비디오 압축 표준들이 1/4 부화소 정밀도와 같은 고정 움직임 벡터 해상도를 사용하고 있는 데 반해, 다중 움직임 벡터 해상도를 지원하는 형태의 구조는 비디오 콘텐츠의 성질에 따라 필요로 하는 만큼의 움직임 벡터 정밀도를 효율적으로 사용할 수 있고, 더 정확한 움직임 예측자 생성이 가능해지므로, 부호화 효율을 향상할 수 있다는 장점이 있다. 그러나 다중 움직임 벡터 해상도 구조는 각각 움직임 벡터에 대해 선택된 움직임 벡터 해상도를 추가로 시그널링 해야 한다는 문제점이 있다. 본 논문에서는 움직임 벡터 해상도의 모순 검증 기반 시그널링 구조를 제안한다. 제안 방법은 여러 개의 후보 중, 각 움직임 벡터에 대해 최소크기의 부호화율을 갖는 움직임 벡터 해상도를 선택한다. 또한, 움직임 벡터 해상도의 시그널링에 따른 오버헤드를 줄이기 위해, 부호화기 및 복호화기 양쪽에서 미리 정의된 기준을 통한 모순 검증 과정을 수행하여 시그널링 할 필요가 없는 후보 움직임 벡터 해상도를 판별하는 과정을 수행한다. 실험 결과, 제안 구조가 고정 움직임 벡터 해상도 기반의 구조와 비교하여 $Bj{\o}ntegaard$ delta bit rate (BDBR)에서 평균 약 4.01%의 이득(최대 15.17%)을 달성함으로써 부호화되는 움직임 정보의 양을 줄이는 데 효과적이라는 것을 검증하였다.

포톤 계수 방식의 $32{\times}32$ 픽셀 어레이를 갖는 디지털 CMOS X-ray 이미지 센서 설계 (A Design of Digital CMOS X-ray Image Sensor with $32{\times}32$ Pixel Array Using Photon Counting Type)

  • 성관영;김태호;황윤금;전성채;진승오;허영;하판봉;박무훈;김영희
    • 한국정보통신학회논문지
    • /
    • 제12권7호
    • /
    • pp.1235-1242
    • /
    • 2008
  • 본 논문에서는 $0.18{\mu}m$ triple-well CMOS 공정을 사용하여 포톤계수 방식의 $32{\times}32$ 픽셀 어레이를 갖는 CMOS ray 영상센서를 설계하였다. 설계된 영상센서의 카픽셀은 $100{\times}100\;{\mu}m2$ 면적을 가지고 있고 약 400개의 트랜지스터로 구성되어 있으며, 범프 본딩을 통해 ray 검출기와 CSA(Charge Sensitive Amplifier)의 연결을 위한 $50{\times}50{\mu}m2$의 오픈패드를 가지고 있다. 각각의 싱글픽셀 CSA에서 전압 바이어스 회로를 사용한 folded cascode CMOS OP amp 대신 레이아웃 면적을 줄이기 위하여 self biased folded cascode CMOS OP amp를 이용하였으며, 계수 모드 진입 전후에 CLK에서 발생 할 수 있는 short pulse를 제거하는 15bit LFSR 계수기 (Linear Feedback Shift Register Counter) 클럭 발생회로를 제안하였으며, 읽기 모드에서 CMOS X-ray 영상센서의 최대 전류를 줄이기 위하여 열 어드레스 디코더를 이용하여 한 열씩 읽도록 설계하였다.

미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약 (Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV)

  • 이태석;선충녕;정영임;강승식
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.58-65
    • /
    • 2019
  • 문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.

비전센서 및 딥러닝을 이용한 항만구조물 방충설비 세분화 시스템 개발 (Development of Fender Segmentation System for Port Structures using Vision Sensor and Deep Learning)

  • 민지영;유병준;김종혁;전해민
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제26권2호
    • /
    • pp.28-36
    • /
    • 2022
  • 매립지 위에 건설되는 항만시설물은 바람(태풍), 파랑, 선박과의 충돌 등 극한 외부 하중에 노출되기 때문에 구조물의 안전성 및 사용성을 주기적으로 평가하는 것이 중요하다. 본 논문에서는 항만 계류시설에 설치된 방충설비의 유지관리를 위하여 비전 및 딥러닝 기반의 방충설비 세분화(segmentation) 시스템을 개발하였다. 방충설비 세분화를 위하여 인코더-디코더 형식과 인간 시각체계의 편심 기능에서 영감을 얻은 수용 영역 블록(Receptive field block) 기반의 합성곱 모듈을 DenseNet 형식으로 개선하는 딥러닝 네트워크를 제안하였다. 네트워크 훈련을 위해 BP형, V형, 원통형, 타이어형 등 다양한 형태의 방충설비 영상을 수집하였으며, 탄성 변형, 좌우 반전, 색상 변환 및 기하학적 변환을 통해 영상을 증강시킨 다음 제안한 딥러닝 네트워크를 학습하였다. 기존의 세분화 모델인 VGG16-Unet과 비교하여 제안한 모델의 세분화 성능을 검증하였으며, 그 결과 본 시스템이 IoU 84%, 조화평균 90% 이상으로 정밀하게 실시간으로 세분화할 수 있음을 확인하였다. 제안한 방충설비 세분화 시스템의 현장적용 가능성을 검증하기 위하여 국내 항만 시설물에서 촬영된 영상을 기반으로 학습을 수행하였으며, 그 결과 기존 세분화 모델과 비교하였을 때 우수한 성능을 보이며 정밀하게 방충설비를 감지하는 것을 확인하였다.

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측 (Prediction of Music Generation on Time Series Using Bi-LSTM Model)

  • 김광진;이칠우
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.65-75
    • /
    • 2022
  • 딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

MPEG-I AEP 기반 실시간 6 자유도 공간음향 렌더링 시스템 (A Real Time 6 DoF Spatial Audio Rendering System based on MPEG-I AEP)

  • 강경옥;유재현;장대영;이용주;이태진
    • 방송공학회논문지
    • /
    • 제28권2호
    • /
    • pp.213-229
    • /
    • 2023
  • 본 논문에서는 가상환경에 위치한 청취자의 움직임에 대응하여 실시간으로 6DoF 공간음향을 제공하는 공간음향 렌더링 시스템에 대해 소개한다. 본 시스템은 MPEG-I Immersive Audio CfP 대응을 위하여 MPEG-I AEP를 개발환경으로 사용하여 구현되었으며 인코더와, 디코더를 포함하는 렌더러로 구성된다. 인코더는 인코더 입력 포맷(EIF) 파일에 포함된 가상공간 장면의 공간적 오디오 파라미터와, SOFA 파일로 제공되는 음원의 지향성 정보 등의 메타데이터를 오프라인으로 부호화하여 비트스트림으로 전달하는 역할을 하며, 렌더러는 전달된 비트스트림을 수신하여 청취자의 위치에 따라 실시간으로 6DoF 공간음향 렌더링을 수행한다. 개발된 렌더링 시스템에 적용한 주요 공간음향 처리 기술로는 음원 효과 및 장애물 효과 처리 기술이 있으며, 그 외 시스템 동작에 필요한 기술로는 도플러 효과 및 음장효과 처리 기술 등이 있다. 개발된 시스템에 대한 성능평가 결과로서 자체 주관평가 결과를 소개한다.

다중 어댑터를 이용한 교차 언어 및 스타일 기반의 제목 생성 (Cross-Lingual Style-Based Title Generation Using Multiple Adapters)

  • 박요한;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.341-354
    • /
    • 2023
  • 문서의 제목은 문서의 내용을 가장 효율적으로 요약하여 제공해 준다. 이때 독자들이 선호하는 스타일과 언어에 따라 문서의 제목을 다르게 제공해 준다면, 독자들은 문서의 내용을 좀 더 쉽게 예측할 수 있다. 본 연구에서는 문서가 주어졌을 때 언어와 스타일에 따라 제목을 자동 생성하는'교차 언어 및 스타일 기반의 제목 생성 모델을 제안한다. 모델을 학습하기 위해서는 같은 내용을 다른 언어와 다른 스타일로 작성한 병렬데이터가 필요하다. 그러나 이러한 종류의 병렬데이터는 구축하기 매우 어렵다. 반면, 단일 언어와 단일 스타일로 구축된 제목 생성 데이터는 많으므로 본 연구에서는 제로샷(zero-shot) 학습으로 제목 생성을 수행하고자 한다. 교차 언어 및 스타일 기반의 제목 생성을 학습하기 위해 다중 언어로 사전 학습된 트랜스포머 모델에 각 언어, 스타일, 기계번역을 위한 어댑터를 추가하였다. 기계 번역용 병렬데이터를 이용하여 기계번역을 먼저 학습한 후, 동일 스타일의 제목 생성을 학습하였다. 이때, 필요한 어댑터만을 학습하고 다른 부분의 파라미터는 모두 고정시킨다. 교차 언어 및 스타일 기반의 제목을 생성할 때에는 목적 언어와 목적 스타일에 해당하는 어댑터만을 활성화시킨다. 실험 결과로는 각 모델을 따로 학습시켜 파이프라인으로 연결시킨 베이스라인에 비해 본 연구에서 제안한 제로샷 제목 생성의 성능이 크게 떨어지지 않았다. 최근 대규모 언어 모델의 등장으로 인한 자연어 생성에서의 많은 변화가 있다. 그러나 제한된 자원과 제한된 데이터만을 이용하여 자연어 생성의 성능을 개선하는 연구는 계속되어야 하며, 그런 점에서 본 연구의 의의를 모색한다.