• 제목/요약/키워드: 디코더

검색결과 332건 처리시간 0.024초

워드 임베딩의 유사도 클러스터링을 통한 다중 문장 요약 생성 기법 (Multi Sentence Summarization Method using Similarity Clustering of Word Embedding)

  • 이필원;송진수;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.290-292
    • /
    • 2021
  • 최근 인코더-디코더 구조의 자연어 처리모델이 활발하게 연구가 이루어지고 있다. 인코더-디코더기반의 언어모델은 특히 본문의 내용을 새로운 문장으로 요약하는 추상(Abstractive) 요약 분야에서 널리 사용된다. 그러나 기존의 언어모델은 단일 문서 및 문장을 전제로 설계되었기 때문에 기존의 언어모델에 다중 문장을 요약을 적용하기 어렵고 주제가 다양한 여러 문장을 요약하면 요약의 성능이 떨어지는 문제가 있다. 따라서 본 논문에서는 다중 문장으로 대표적이고 상품 리뷰를 워드 임베딩의 유사도를 기준으로 클러스터를 구성하여 관련성이 높은 문장 별로 인공 신경망 기반 언어모델을 통해 요약을 수행한다. 제안하는 모델의 성능을 평가하기 위해 전체 문장과 요약 문장의 유사도를 측정하여 요약문이 원문의 정보를 얼마나 포함하는지 실험한다. 실험 결과 기존의 RNN 기반의 요약 모델보다 뛰어난 성능의 요약을 수행했다.

BERT 기반 Sequence-to-Sequence 모델을 이용한 한국어 질문 생성 (Korean Question Generation using BERT-based Sequence-to-Sequence Model)

  • 이동헌;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.60-63
    • /
    • 2020
  • 기계 독해는 입력 받은 질문과 문단의 관계를 파악하여 알맞은 정답을 예측하는 자연어처리 태스크로 양질의 많은 데이터 셋을 필요로 한다. 기계 독해 학습 데이터 구축은 어려운 작업으로, 문서에서 등장하는 정답과 정답을 도출할 수 있는 질문을 수작업으로 만들어야 한다. 이러한 문제를 해결하기 위하여, 본 논문에서는 정답이 속한 문서로부터 질문을 자동으로 생성해주는 BERT 기반의 Sequence-to-sequence 모델을 이용한 한국어 질문 생성 모델을 제안한다. 또한 정답이 속한 문서와 질문의 언어가 같고 정답이 속한 문장의 주변 단어가 질문에 등장할 확률이 크다는 특성에 따라 BERT 기반의 Sequence-to-sequence 모델에 복사 메카니즘을 추가한다. 실험 결과, BERT + Transformer 디코더 모델의 성능이 기존 모델과 BERT + GRU 디코더 모델보다 좋았다.

  • PDF

발화 내 페르소나 트리플 추출 방법 연구 (A Method for Extracting Persona Triples in Dialogue)

  • 장윤나;양기수;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.726-729
    • /
    • 2023
  • 본 논문에서는 대화 중 발화에서 페르소나 트리플을 추출하는 방법을 연구한다. 발화 문장과 그에 해당하는 트리플 쌍을 활용하여 발화 문장 혹은 페르소나 문장이 주어졌을 때 그로부터 페르소나 트리플을 추출하도록 모델을 멀티 태스크 러닝 방식으로 학습시킨다. 모델은 인코더-디코더 구조를 갖는 사전학습 언어모델 BART [1]와 T5 [2]를 활용하며 relation 추출과 tail 추출의 두 가지 태스크를 각각 인코더, 디코더 위에 head를 추가하여 학습한다. Relation 추출은 분류로, tail 추출은 생성 문제로 접근하도록 하여 최종적으로 head, relation, tail의 구조를 갖는 페르소나 트리플을 추출하도록 한다. 실험에서는 BART와 T5를 활용하여 각 태스크에 대해 다른 학습 가중치를 두어 훈련시켰고, 두 모델 모두 relation과 tail을 추출하는 태스크 정확도에 있어서 90% 이상의 높은 점수를 보임을 확인했다.

  • PDF

DVD 시스템에서 사용되는 변조 코드에 대한 간소화된 디코더 (Simplified Decoder of the Modulation Code for DVD System)

  • 김형석;이주현;이재진
    • 한국통신학회논문지
    • /
    • 제30권4C호
    • /
    • pp.247-252
    • /
    • 2005
  • 현재 DVD 시스템의 채널에서 디코더는 16비트 입력을 받아 8비트 데이터 심볼을 복원한다. 이러한 DVD용 변조 코드는 주 테이블(main table)과 부 테이블(sub table)로 이루어진 EFMplus 코드를 사용한다. 본 논문에서는 디코더 구현시 필요한 코드 테이블의 크기를 줄이기 위해 EFMplus 코드를 3개의 그룹으로 나눈 후 각 코드의 가지 수를 줄이는 방법을 제안하고 이 코드 테이블을 이용하여 디코더를 구현하였다. 이 방식은 기존의 테이블을 이용하여 디코딩할 때 필요한 코드 수 1376개를 750개로 약 $46\%$정도 감소시켜 EFMplus 코드를 구현할 때 필요한 ROM의 크기를 약 2배 정도 줄였다.

화면 예측 부호화를 위한 효율적인 메모리 관리기법에 관한 연구 (A Study on Efficient Memory Management Technique for Picture Predication Encoding)

  • 전형수;정사균;이윤채;유철중;장옥배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.1259-1262
    • /
    • 2006
  • H.264는 기존의 압축 표준들보다 월등한 압축률을 가지고 있어 다양한 멀티미디어 서비스에 적합하다. 특히 적은 양의 데이터 전송으로 서비스 받을 수 있는 모바일 기기에서는 빼놓을 수 없는 기술이 되었다. 현재 모바일 기기에서 영상 서비스는 하드웨어 기반의 디코더 형식으로 되어 있기 때문에 소프트웨어 기반의 디코더 개발이 시급하다. 그러기 위해서는 모바일 기기에서 탑재된 적은 용량의 메모리를 사용하므로써 빠른 재생이 가능해야 한다. 그래서 영상 복호화시에 사용되는 메모리 양을 줄일 수 있도록 참조픽처의 메모리를 관리하는 방법을 제안한다. 기존의 고정크기를 갖는 장기 참조픽처를 배제하고 단기 참조픽처로써 대체하고 비참조 픽처의 사용은 POC(Picture Order Count)에 전체 사용하지 않고 단지 순서를 정하기 위해 메모리 로드없이 순서 조합에 필요한 위치만 갖도록 하였다. 그러므로, 모바일 기기에서 메모리의 사용을 최대한 줄여 영상을 재생할 수 있도록 제안하였다.

  • PDF

강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델 (Multi-Decoder Conversational Model for Generating Robust Response Based on Denoising Mechanism)

  • 김태형;박성배;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.141-146
    • /
    • 2018
  • 최근 대화 모델 학습에는 시퀀스-투-시퀀스 모델이 널리 활용되고 있다. 하지만 기본적인 시퀀스-투-시퀀스 모델로 학습한 대화 모델은 I don't know 문제와 사오정 문제를 내포한다. I don't know 문제는 입력 발화에 대해 안전하고 무미건조한 단편적인 대답을 많이 생성하는 문제이다. 사오정 문제는 입력 발화에 대해 적절한 응답을 생성했지만 입력 발화와 동일한 의미를 지니지만 어순, 어미 등의 변화가 있는 발화에는 적절한 응답을 생성하지 못하는 문제이다. 이전 연구에서 디노이징 메커니즘을 활용하여 각각의 문제를 완화하는 대화 모델들을 학습할 수 있음을 보였으나 하나의 모델에서 두 문제를 동시에 해결하지는 못하였다. 본 논문에서는 디노이징 메커니즘을 활용하여 각각의 문제에 강점을 지닌 디코더들을 학습하고 응답 생성 시 입력 발화에 따라 두 디코더를 적절하게 반영하여 언급한 문제 모두에 대해 강건한 응답을 생성할 수 있는 모델을 제안한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 한국어 대화 데이터로 실험을 수행하였다. 실험 결과 단일 문제를 해결하는 모델들과 비교하여 ROUGE F1 점수와 사람이 평가한 정성 평가에서 성능 향상을 보였다.

  • PDF

대역확산방식 FTS 인코더/디코더 구현 (Implementation of Spread Spectrum FTS Encoder/Decoder)

  • 임유철;마근수;김명환;이재득
    • 항공우주기술
    • /
    • 제8권1호
    • /
    • pp.179-186
    • /
    • 2009
  • 본 문서는 방해파 등의 잡음에 강하며 특히 명령신호 비닉성 및 비화성에 탁월한 장점을 갖는 대역확산 변조방식을 활용한 FTS 인코더/디코더의 설계 및 구현에 관하여 기술한다. 우선 명령포맷은 64비트 패킷신호로 구성되며 각각의 명령신호는 트리플DES암호화 알고리즘을 이용하여 암호화 작업을 수행하고, 또한 오류정정 기법의 하나인 콘볼루션코딩 및 비터비디코딩 기법을 적용하여 통신 신뢰성을 높이도록 설계한다. 대역확산을 위해 직접확산기법을 적용하고 확산코드는 256비트 골드코드를 사용하며, 설계한 FTS 인코더와 디코더가 잘 동작하는지 검증하기 위해 시뮬레이션을 수행하고 최종 하드웨어를 구현하여 그 결과를 확인하였다.

  • PDF

PRML 신호용 저 전력 아날로그 병렬처리 비터비 디코더 개발 (Fabrication of a Low Power Parallel Analog Processing Viterbi Decoder for PRML Signal)

  • 김현정;손홍락;김형석
    • 대한전자공학회논문지SD
    • /
    • 제43권6호
    • /
    • pp.38-46
    • /
    • 2006
  • DVD용 PRML신호를 디코딩할 수 있는 병렬 아날로그 비터비 디코더를 칩으로 제작하고 테스트 결과를 기술하였다. 병렬 아날로그 비터비 디코더는 기존의 디지털 비터비 디코더를 아날로그 병렬처리 회로를 이용하여 구현한 것으로, 전력 소모가 매우 적다는 장점이 있다. 본 연구에서는 제안한 순환형 아날로그 비터비 디코더 회로를 DVD의 PRML 신호 디코딩용으로 설계 제작하였고, 그 상세 설계 내용과 각 회로의 신호 특성을 분석하였으며, 이를 기반으로 향후 개선 사항을 기술하였다. 또한, 칩으로 제작된 회로가 동작하여 PRML용 신호가 잘 디코딩됨을 보였다.

쓰기 동작의 에너지 감소를 통한 비터비 디코더 전용 저전력 임베디드 SRAM 설계 (Low Power Embedded Memory Design for Viterbi Decoder with Energy Optimized Write Operation)

  • 당호영;신동엽;송동후;박종선
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.117-123
    • /
    • 2013
  • 비터비 디코더(Viterbi decoder)용 임베디드 SRAM은 범용(General purpose) CPU에 쓰이는 SRAM과 달리 읽기, 쓰기 동작이 비터비 복호 알고리즘에 따라 일정한 액세스 패턴을 갖고 동작한다. 이 연구를 통하여 제안된 임베디드 SRAM의 구조는 이러한 메모리 동작의 패턴에 최적화되어 워드라인과 비트라인에서 발생하는 불필요한 전력소모를 제거함으로써 쓰기 동작의 소모 전력을 크게 줄일 수 있다. 65nm CMOS 공정으로 설계된 비터비 디코더는 본 논문에서 제안된 SRAM 구조를 이용하여 기존의 임베디드 SRAM 대비 8.92%만큼 면적증가로 30.84% 소모 전력 감소를 이룩할 수 있었다.