• 제목/요약/키워드: 태스크 모델

검색결과 266건 처리시간 0.025초

언어 모델의 뉴스 도메인 요약 성능 비교 분석 (Comparative Analysis of Language Model Performance in News Domain Summarization)

  • 류상원;김윤수;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF

군집 적응형 시스템의 목표 기반 테스트를 위한 태스크 기반 테스트 모델 적용 타당성 연구 (A Feasibility Study of Goal-based Testing with a Task-based Test Model for Collective Adaptive Systems)

  • 이정현;지은경;임유진;배두환
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권8호
    • /
    • pp.393-398
    • /
    • 2016
  • 군집 적응형 시스템(Collective Adaptive System, CAS)은 다수의 에이전트를 포함하는 적응형 시스템으로, 에이전트들 간의 헙업을 통해 목표를 수행한다. 협업을 기반으로 시스템의 목표를 수행하는 CAS는 복수의 에이전트들 간의 상호작용에 대한 테스트가 필수적이다. 본 연구에서는 CAS를 테스트하기 위한 하나의 방법으로 태스크 기반의 테스트 모델을 적용하여 모델 기반 테스팅을 하는 것에 대한 타당성을 분석한다. 분석을 위해 CAS의 한 사례로 스마트 홈 시스템을 적용하였고, 그 결과 태스크 모델을 수정 및 확장하면 CAS의 목표 달성 여부를 판별할 수 있는 체계적인 테스트 케이스 생성이 가능한 것을 확인하였다.

KorPatELECTRA : A Pre-trained Language Model for Korean Patent Literature to improve performance in the field of natural language processing(Korean Patent ELECTRA)

  • Jang, Ji-Mo;Min, Jae-Ok;Noh, Han-Sung
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.15-23
    • /
    • 2022
  • 특허 분야에서 자연어처리(Natural Language Processing) 태스크는 특허문헌의 언어적 특이성으로 문제 해결의 난이도가 높은 과제임에 따라 한국 특허문헌에 최적화된 언어모델의 연구가 시급한 실정이다. 최근 자연어처리 분야에서는 특정 도메인에 특화되게 사전 학습(Pre-trained)한 언어모델을 구축하여 관련 분야의 다양한 태스크에서 성능을 향상시키려는 시도가 지속적으로 이루어지고 있다. 그 중, ELECTRA는 Google이 BERT 이후에 RTD(Replaced Token Detection)라는 새로운 방식을 제안하며 학습 효율성을 높인 사전학습 언어모델이다. 본 연구에서는 대량의 한국 특허문헌 데이터를 사전 학습한 KorPatELECTRA를 제안한다. 또한, 특허 문헌의 특성에 맞게 학습 코퍼스를 정제하고 특허 사용자 사전 및 전용 토크나이저를 적용하여 최적화된 사전 학습을 진행하였다. KorPatELECTRA의 성능 확인을 위해 실제 특허데이터를 활용한 NER(Named Entity Recognition), MRC(Machine Reading Comprehension), 특허문서 분류 태스크를 실험하였고 비교 대상인 범용 모델에 비해 3가지 태스크 모두에서 가장 우수한 성능을 확인하였다.

MPEG-2 디코딩을 위한 멀티미디어 시스템에서 우선순위에 의한 태스크 스케쥴링 기법 (A Prioritized Task Scheduling Method in Multimedia Systems for MPEG-2 Decoding)

  • 김진환
    • 정보처리학회논문지B
    • /
    • 제12B권2호
    • /
    • pp.173-180
    • /
    • 2005
  • 본 논문에서는 MPEG-2 비디오 스트림의 프레임을 디코딩하는 멀티미디어 태스크에 대한 효율적인 실시간 스케줄링 기법이 제시된다. 태스크 모델에서 각 프레임은 각각의 멀티미디어 태스크에 의하여 디코딩되며 각 태스크는 비디오 스트림내 프레임의 순서와 중요도에 따라 우선 순위가 설정된다. MPEG-2 비디오 스트림의 디코딩 기능을 수행하는 멀티미디어 태스크마다 CPU 대역폭을 효과적으로 할당하고자 우선순위에 기반한 스케줄링 기법을 사용하는 것이다. 본 논문에서 멀티미디어 태스크에 할당된 CPU 대역폭을 우선순위에 따라 동적으로 제어하는 방법이 기술된다. 우선순위에 의한 스케줄링 기법의 주요 목적은 멀티미디어 태스크들의 디코딩 시간을 감소시키는 한편 종료시한 이후에 실행이 완료되는 디코딩 태스크의 수를 최소화함으로써 멀티미디어 시스템의 실시간적 성능을 향상시키는 것이다. 제시된 스케줄링 기법의 성능은 시뮬레이션 실험을 통하여 다른 기법과 비교 분석된다.

DECO-LGG 반자동 증강 학습데이터 활용 멀티태스크 트랜스포머 모델 기반 핀테크 CS 챗봇 NLU 시스템 (Multitask Transformer Model-based Fintech Customer Service Chatbot NLU System with DECO-LGG SSP-based Data)

  • 유광훈;황창회;윤정우;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.461-466
    • /
    • 2021
  • 본 연구에서는 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph)에 기반한 반자동 언어데이터 증강(Semi-automatic Symbolic Propagation: SSP) 방식에 입각하여, 핀테크 분야의 CS(Customer Service) 챗봇 NLU(Natural Language Understanding)을 위한 주석 학습 데이터를 효과적으로 생성하고, 이를 기반으로 RASA 오픈 소스에서 제공하는 DIET(Dual Intent and Entity Transformer) 아키텍처를 활용하여 핀테크 CS 챗봇 NLU 시스템을 구현하였다. 실 데이터을 통해 확인된 핀테크 분야의 32가지의 토픽 유형 및 38가지의 핵심 이벤트와 10가지 담화소 구성에 따라, DECO-LGG 데이터 생성 모듈은 질의 및 불만 화행에 대한 양질의 주석 학습 데이터를 효과적으로 생성하며, 이를 의도 분류 및 Slot-filling을 위한 개체명 인식을 종합적으로 처리하는 End to End 방식의 멀티태스크 트랜스포머 모델 DIET로 학습함으로써 DIET-only F1-score 0.931(Intent)/0.865(Slot/Entity), DIET+KoBERT F1-score 0.951(Intent)/0.901(Slot/Entity)의 성능을 확인하였으며, DECO-LGG 기반의 SSP 생성 데이터의 학습 데이터로서의 효과성과 함께 KoBERT에 기반한 DIET 모델 성능의 우수성을 입증하였다.

  • PDF

차량 전장용 운영체제의 주기적 태스크 검증을 지원하는 테스트 케이스 생성기 (Test Case Generator Supporting The Verification of Alarm In Automotive Operating System)

  • 최우용;김동우;최윤자
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.591-594
    • /
    • 2017
  • 안전 필수 시스템(Safety-critical system) 중 하나인 차량 전장용 운영체제의 엄밀한 검증을 위하여 모델 기반 테스트 생성기법들이 연구되어 왔다. 그러나 기존의 연구들은 이러한 차량 전장용 운영체제에서 빈번히 사용되는 주기적인 동작을 요하는 작업들에 대한 테스트 생성 문제를 해결하지 못하였다. 본 연구에서는 주기적 태스크의 검증을 지원하지 않았던 기존의 테스트 케이스 생성기에 알람 모델을 추가하여 보완하였다. 이를 통해 차량 전장용 운영체제의 검증에 있어서 주기적 태스크를 포함한 다양한 테스트 케이스를 생성할 수 있었고 차량 전장용 운영체제의 보다 엄밀한 검증이 가능해졌다.

병렬 내장형 소프트웨어 개발환경을 위한 데이터 플로우 블록 클러스터링 (Dataflow Block Clustering for Parallel Embedded Software Development Environment)

  • 조용우;권성남;하순회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.337-341
    • /
    • 2008
  • 갈수록 복잡해지는 내장형 시스템을 개발함에 있어서 소프트웨어 개발의 중요성은 날로 커지고 있다. 기존 연구에서 소프트웨어 개발 효율을 높이기 위해 소프트웨어의 재사용 가능성을 높이고 병렬성 명세를 용이하게 하고자 중간단계코드(CIC)를 정의하였다. 이 중간단계 코드는 각 태스크의 순수 알고리즘을 기술하는 C형태의 태스크 코드와 그 외의 정보를 포함하는 XML형태의 아키텍쳐 정보 파일로 구성된다. 이 CIC는 사용자가 직접 기술할 수 있고 각종 모델로부터 자동 생성할 수도 있다. 이 논문에서는 후자에 초점을 두고 데이터 플로우 모델에 사용된 블록들을 클러스터링하여 태스크 코드를 생성하는 기법을 제안하였다. 이것을 위해 블록 클러스터링 알고리즘은 주어진 클러스터의 크기로 블록이 묶일 때까지 블록의 수행시간 정보를 고려하여 함수 병렬성을 최대한 보존하며 블록들을 묶어나간다. H.263 코덱 예제를 이용한 실험을 통해 제안하는 방법이 다양한 클러스터의 크기 조건에 대해서 다양한 클러스터링 결과를 제공함을 보였다.

  • PDF

디스크 입출력의 병렬성을 이용한 대용량 입출력 QoS 제어 기법 (A Massive I/O QoS Control Method using Parallelism fo Disk I/O)

  • 장시웅;정기동
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권1호
    • /
    • pp.98-106
    • /
    • 1999
  • 본 논문에서는 대용량 입출력을 수행하는 태스크의 QoS를 제어하기 위한 방법으로사용자가 시스템에 입출력 요구시 요구 대역폭을 제시하고, 파일시스템에서 디스크개소와 입출력 이벤트를 고려하여 입출력의 병렬성을 제어함으로써 QoS를 제어하는 방법을 제안하였다. 그리고, 시스템에서 각 태스크가 주어진 병렬성을 가지고 입출력을 진행하고 있을 때, 요구 대역폭을 가지고 입출력을 요구하는 태스크의 대역폭을 만족시키기 위한 병렬성을 계산하는 분석 모델을 유도하였다. 그리고, 디스크 입출력의 병렬성을 이용하여 대용량 입출력의 QoS를 효율적으로 제어할 수 있음을 분석 모델의 결과를 통해 검증하였다.

Prompt를 활용한 페르소나 대화 생성 연구 (A Study on Prompt-based Persona Dialogue Generation)

  • 장윤나;양기수;문현석;서재형;임정우;손준영;박찬준;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.77-81
    • /
    • 2022
  • 최근 사전학습 언어모델에 내재된 지식을 최대한으로 활용하고자 태스크에 대한 설명을 입력으로 주는 manual prompt tuning 방법과 자연어 대신 학습가능한 파라미터로 태스크에 대한 이해를 돕는 soft prompt tuning 방법론이 자연어처리 분야에서 활발히 연구가 진행되고 있다. 이에 본 연구에서는 페르소나 대화 생성 태스크에서 encoder-decoder 구조 기반의 사전학습 언어모델 BART를 활용하여 manual prompt tuning 및 soft prompt tuning 방법을 고안하고, 파인튜닝과의 성능을 비교한다. 전체 학습 데이터에 대한 실험 뿐 아니라, few-shot 세팅에서의 성능을 확인한다.

  • PDF

패러프레이즈 문장 검출을 위한 양방향 트랜스포머 모델 구축 (Construction of a Bidirectional Transformer Model for Paraphrasing Detection)

  • 고보원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.465-469
    • /
    • 2019
  • 자연어 처리를 위해서 두 문장의 의미 유사성을 분석하는 것은 아주 중요하다. 이 논문은 패러프레이즈 검출 태스크를 수행하기 위한 Paraphrase-BERT를 제안한다. 우선 구글이 제안한 사전 학습된 BERT를 그대로 이용해서 패러프레이즈 데이터 (MRPC)를 가지고 파인 튜닝하였고 추가적으로 최근에 구글에서 새로 발표한 Whole Word Masking 기술을 사용하여 사전 학습된 BERT 모델을 새롭게 파인 튜닝하였다. 그리고 마지막으로 다중 작업 학습을 수행하여 성능을 향상시켰다. 구체적으로 질의 응답 태스크와 패러프레이즈 검출 태스크를 동시에 학습하여 후자가 더 잘 수행될 수 있도록 하였다. 결과적으로 점점 더 성능이 개선되었고 (11.11%의 정확도 향상, 7.88%의 F1 점수 향상), 향후 작업으로 파인 튜닝하는 방법에 대해서 추가적으로 연구할 계획이다.

  • PDF