• Title/Summary/Keyword: 일반화하기

검색결과 3,703건 처리시간 0.031초

기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가 (Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment)

  • 임준호;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

일반화된 정규-라플라스 분포를 이용한 음성검출기 (Voice Activity Detection employing the Generalized Normal-Laplace Distribution)

  • 김상균;권장우;이상민
    • 한국멀티미디어학회논문지
    • /
    • 제17권3호
    • /
    • pp.294-299
    • /
    • 2014
  • 본 논문에서는 일반화된 정규-라플라스(generalized normal-Laplace) 분포 기반의 음성 검출기(voice activity detection) 알고리즘을 제안한다. 제안된 알고리즘은, 잡음 섞인 음성 신호의 확률밀도함수를 일반화된 정규-라플라스 분포로 표현한 다음, 일반화된 정규-라플라스 분포의 음성과 잡음의 분산을 고차 모멘트(higher order moments)를 이용하여 추정한다. 제안된 알고리즘은 다양한 조건의 잡음 환경에서 기존의 음성 검출기들과 비교하였으며 향상된 성능을 보였다.

B-스플라인 동작을 이용한 Generalized Cylinder의 직접제어 (Direct Manipulation of Generalized Cylinders based on B-spline Motion)

  • 장태익;이주행;김명수;홍성제
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제4권2호
    • /
    • pp.47-55
    • /
    • 1998
  • 본 논문은 일반화된 원통(generalized cylinder)의 모양을 상호작용을 통해 조절할 수 있도록 하는 직접 제어 방법을 제시한다. 이 연구에서는 일반화된 원통을 단면을 이루는 B-스플라인 곡선이 B-스플라인 동작에 의해서 움직여 지나간 스윕(sweep) 곡면으로 해석한다. 만들어진 곡면은 주어진 단연 곡선들을 골격 곡선을 따라서 보간하는 NURBS 곡면으로 나타내어진다. 사용자가 일반화된 원통 곡면 위의한 점을 움직일 때, 단면의 모양과 해당하는 동작을 수정하여 일반화된 원통의 곡면이 사용자에 의해 움직여진 위치를 지나도록 변형시킨다. 곡면의 변형은 목표 추적 과정을 거쳐 이루어진다. 이 방법에 의해 구현된 시스템을 이용하여 실시간으로 일반화된 원통을 직접 제어를 통해 디자인 할 수 있다.

  • PDF

외부 스토리지 무결성 검증 기법 일반화에 대한 연구 (A Study on Normalization of Oursourced Storage Auditing Scheme)

  • 은하수;오희국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.882-885
    • /
    • 2013
  • 외부 스토리지 무결성 검증 기법이란, 외부에 저장된 사용자의 데이터가 손상되었는지 확인하는 기법으로써 2004년 Deswarte 등이 제안한 이래 꾸준히 연구되어왔다. 하지만, 대부분의 기법들이 준동형 해쉬를 이용한 기법으로서 데이터를 지수에 두고 연산을 하고 있다. 따라서 데이터의 크기가 커질수록 검증에 필요한 연산량이 늘게 된다. 이를 줄이기 위한 기법으로서 데이터를 블록단위로, 블록을 조각 단위로 나누어 연산 후, 결합하여 최종 증거를 생성하는 기법들이 제안되고 있다. 본 논문은 이들 기법을 일반화하고 정리해봄으로써 향후 외부 스토리지 검증기법의 연구 방향을 제시하는 것을 목표로 하고 있다. 이를 위해 본 논문에서는 외부 스토리지 무결성 기법의 일반화 모델을 세우고, 이를 이용해 최근에 제안된 Wang 등의 기법을 일반화하였다. 일반화된 Wang 등의 기법을 토대로 개선되어야 할 점을 분석하고, 향후 연구의 방향을 정리해본다.

강화학습 기반의 차량 경로 문제 일반화 방안 연구 (A Study of Solving the Generalized Vehicle Routing Problem Using Reinforcement Learning)

  • 정철환;김광수;김한솔
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.705-707
    • /
    • 2022
  • 본 연구에서는 기존 차량 경로 문제(Vehicle Routing Problem)의 범위를 확장시켜 일반화된 차량 경로문제(Generalized Vehicle Routing Problem)를 제시하고, 이 문제를 해결하기 위한 강화학습 모델을 제안한다. 기존의 차량 경로 문제는 depot에서 각 node(또는 각 node에서 depot)의 단방향만 존재해 제한된 문제만을 해결할 수 있었다. 이 한계점을 극복하기 위해 depot을 제외한 모든 node가 서로 연결된 형태의 일반화된 차량 경로 문제를 정의하고 이를 해결하고자 한다. 차량 경로 문제는 NP-hard 문제로 최근에는 강화학습을 이용해 이를 해결하고자 하는 모델이 연구되고 있다. 본 연구에서는 새로 정의한 일반화된 차량 경로 문제를 해결하기 위한 강화학습 모델을 제안한다.

  • PDF

감마 일반화 선형 모형에서의 산포 모수 추정량에 대한 효율성 연구 (Comparing the efficiency of dispersion parameter estimators in gamma generalized linear models)

  • 조성일;이우주
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.95-102
    • /
    • 2017
  • 감마 일반화 선형모형은 포아송 분포 또는 이항 분포에 기반한 일반화 선형모형에 비해 적은 관심을 받아왔다. 따라서 감마 일반화 선형모형에서는 오래전에 개발된 통계적인 기법이 아직도 사용되고 있으며, 특히 산포 모수에 대해서는 근사 추정치가 여전히 사용되고 있다. 본 논문에서는 감마 일반화 선형 모형의 산포 모수에 대해 다양한 추정량들을 알아보고 수치 연구를 통해 그들의 효율성을 비교한다. 수치 실험의 결과 최대 가능도 추정량과 Cox-Reid의 수정된 최대 가능도 추정량이 기존의 근사 추정량에 비해 좋은 성능을 보임을 확인하였다.

2차원 중합전 일반화된-막 구조보정 (2D Prestack Generalized-screen Migration)

  • 송호철;설순지;변중무
    • 지구물리와물리탐사
    • /
    • 제13권4호
    • /
    • pp.315-322
    • /
    • 2010
  • 위상막 구조보정과 split-step Fourier 구조보정은 주파수-파수, 주파수-공간 영역에서 단방향 파동방정식을 이용하여 빠른 계산 속도로 수평적 속도변화를 고려할 수 있는 구조보정이다. 일반화된-막(generalized-screen) 구조보정은 주파수-파수영역에서 수직전파를 가정하는 위의 두 구조보정과는 달리 수직전파를 가정하지 않고, 지수함수의 무한급수 전개를 이용한다. 또한 수직느리기항의 테일러 급수전개를 일반화하여 고차항을 추가함으로써 급격한 속도변화를 갖는 지하구조에서 넓은 각으로 전파하는 파동장에 대한 정확도를 향상시켰다. 이 논문은 다양한 경사와 급격한 속도변화를 포함하는 복잡한 지하구조를 효율적으로 보다 정확하게 영상화하기 위하여 2차원 일반화된-막 구조보정에 대하여 연구하였다. 일정한 미소변량(constant perturbation)을 갖는 매질과 SEG/EAGE 암염돔을 모사한 모델에 대하여 일반화된-막 전파자와 위상막 전파자의 전파된 파동장을 비교한 결과, 일반화된-막 전파자가 파동장의 넓은각 전파에 대해 위상막 전파자보다 높은 정확도를 보였다. 또한 일반화된-막 전파자의 차수를 증가시킬수록 넓은 각으로 전파하는 파동장의 정확도가 향상되었다. 큰 수평적 속도변화와 급경사를 갖는 모델과 SEG/EAGE 암염돔 합성 탄성파탐사 자료에 대하여 일반화된-막 구조보정과 위상막 구조보정을 적용한 결과, 일반화된-막 구조보정이 속도변화가 크고 급격한 경사를 갖는 반사면을 보다 정확한 위치에 뚜렷하게 영상화하였다.

GSP를 활용한 중학교 2학년 수학 영재학급의 일반화 수업 분석과 교육적 시사점 - Viviani 정리를 중심으로 - (An Analysis of Generalization Class using GSP for the 8th Grade Students in a Math Gifted Class - Focused on Viviani theorem -)

  • 강정기
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제30권1호
    • /
    • pp.23-46
    • /
    • 2016
  • 본 연구는 교육 현장의 영재학급에 대한 바람직한 일반화 수업 구현을 돕는 것을 목적으로, GSP를 활용한 일반화 수업을 설계 및 적용해봄으로써 수업의 실제를 파악해 보고자 하였다. 이를 위해 중학교 2학년 영재학급 학생 13명을 대상으로 GSP를 활용한 Viviani 정리의 일반화 수업을 계획하여 적용해 보았다. 그 결과 'GSP에 의한 추측 조정과 패턴 확인', 'GSP 확인이 증명이라는 오개념과 극복', '주제 이탈과 인지적 격차', '미완의 추측에 의한 증명 완성', '일반화와 일반성 이해 사이의 괴리'라는 다섯 가지 주제를 추출할 수 있었다. 추출한 주제를 토대로 영재학급에서의 바람직한 일반화 수업 구현을 위한 교육적 시사점에 대해 논의하였다.

일반화가능도 이론을 이용한 집단논리적사고력검사(GALT)의 신뢰도 분석 (An Analysis of the Reliability of Group Assessment of Logical Thinking (GALT) using Generalizability Theory)

  • 류춘렬;이용근
    • 한국지구과학회지
    • /
    • 제31권1호
    • /
    • pp.95-105
    • /
    • 2010
  • 본 연구의 목적은 집단논리적사고력검사의 이용 목적에 따라 일반화가능도이론을 적용하여 문항과 피험자만을 고려한 단일국면의 오차원, 그리고 문항과 피험자, 그리고 영역을 고려한 다국면의 오차원을 분석하는 데 있다. 연구는 지방 소재 초 중 고등학생 총 1016명을 대상으로 이루어졌으며, 21문항의 GALT 완본을 40분 동안 실시하고, 이 중 축소본에 해당하는 12문항을 별도로 추출하여 일반화가능도이론을 이용한 신뢰도 분석에 이용하였다. 자료의 분석을 위해 일반화가능도이론을 적용하여 $p{\times}i$설계와 $p{\times}(i:h)$설계로 나누어 G 연구와 D 연구를 실시하였다. 분석결과는 다음과 같다. 첫째, 완본과 축소본을 $p{\times}I$설계로 D 연구를 수행한 결과 완본의 경우 21문항을 평가했을 때 0.87로 적정 수준의 일반화가능도 계수인 0.80을 상회하였으며, 13문항에서도 적정 수준의 일반화가능도 계수에 도달하였다. 축소본의 경우 12문항을 평가했을 때 0.77로 적정 수준의 일반화가능도 계수에 미치지 못하였으며, 최소 15문항 이상에서 신뢰도가 적정 수준에 도달하였다. 둘째, 축소본을 $p{\times}(I:H)$설계로 D 연구를 수행한 결과 6영역에 대해 영역별로 2문항씩 구성될 경우 0.71로 적정 수준의 일반화가능도계수인 0.80 보다 낮게 측정되었으며, 최소 영역별 5문항 이상에서 신뢰도가 적정 수준에 도달하였다.

초등학교 4,5,6학년 영재학급 학생의 패턴 일반화를 위한 해결 전략 비교 (A Comparison of Mathematically Gifted Students' Solution Strategies of Generalizing Geometric Patterns)

  • 최병훈;방정숙
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제22권4호
    • /
    • pp.619-636
    • /
    • 2012
  • 본 연구의 목적은 학년에 따라 수학영재학급 학생들이 패턴 일반화 과정에서 사용하는 전략의 차이와 일반화 표현 방법을 알아보는 것이다. 연구를 위해 단위학교 영재학급 4~6학년 30명을 대상으로 도형과 관련한 4개의 과제에 대한 해결 전략을 살펴보았다. 연구결과, 일반화를 시작하는 단계의 문항에서 학생들은 패턴의 앞 뒤 수를 이용하여 문제를 해결하는 순환적인 관계인식 전략으로 문제를 해결하는 경우가 많았고 일반화를 형성하는 단계의 문항에서는 학년이 높아질수록 주어진 정보로 규칙이나 식을 만들어 해결하려는 상황적 인식 전략을 사용한다는 것을 알 수 있었다. 그러나 난이수준이 높은 문항일수록 학생들은 그리거나 뛰어 세기 등의 구체화를 통한 인식 전략이나 순환적인 관계 인식 전략을 선호하는 경향이 있었다. 일반화를 명확하게 하는 단계의 문항에서 학생들은 패턴을 언어로 기술하는 경향이 많았으며 높은 학년일수록 패턴을 대수적 표현(기호 또는 수식)으로 기술하려고 하였다. 정당화 단계의 문항에서 학년이 높을수록 일반화된 식으로 표현하는 비율이 높았다. 연구 결과를 통해 패턴을 찾는 과제에서 영재학급 학생들이 일반화를 하기 위한 전략의 차이를 알고 지도하는데 도움을 줄 수 있는 시사점을 제공하고자 한다.

  • PDF