• 제목/요약/키워드: 절차언어

검색결과 237건 처리시간 0.031초

대규모 언어 모델 및 인컨텍스트 러닝을 활용한 수치 추론 데이터셋 증강 (Numerical Reasoning Dataset Augmentation Using Large Language Model and In-Context Learning)

  • 황예찬;임진수;이영준;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델의 인컨텍스트 러닝과 프롬프팅을 활용하여 수치 추론 태스크 데이터셋을 효과적으로 증강시킬 수 있는 방법론을 제안한다. 또한 모델로 하여금 수치 추론 데이터의 이해를 도울 수 있는 전처리와 요구사항을 만족하지 못하는 결과물을 필터링 하는 검증 단계를 추가하여 생성되는 데이터의 퀄리티를 보장하고자 하였다. 이렇게 얻어진 증강 절차를 거쳐 증강을 진행한 뒤 추론용 모델 학습을 통해 다른 증강 방법론보다 우리의 방법론으로 증강된 데이터셋으로 학습된 모델이 더 높은 성능을 낼 수 있음을 보였다. 실험 결과 우리의 증강 데이터로 학습된 모델은 원본 데이터로 학습된 모델보다 모든 지표에서 2%p 이상의 성능 향상을 보였으며 다양한 케이스를 통해 우리의 모델이 수치 추론 학습 데이터의 다양성을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

한국어 튜터링 챗봇을 위한 말뭉치 구축 (Building a Corpus for Korean Tutoring Chatbot)

  • 김한샘;최경호;한지윤;정해영;곽용진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.288-293
    • /
    • 2017
  • 교수-학습 발화는 발화 턴 간에 규칙화된 인과관계가 강하고 자연 발화에서의 출현율이 낮다. 일반적으로 어휘부, 표현 제시부, 대화부로 구성되며 커리큘럼과 화제에 따라 구축된 언어자원이 필요하다. 기존의 말뭉치는 이러한 교수-학습 발화의 특징을 반영하지 않았기 때문에 한국어 교육용 튜터링 챗봇을 개발하는 데에 활용도가 떨어진다. 이에 따라 이 논문에서는 자연스러운 언어 사용 수집, 도구 기반의 수집, 주제별 수집 및 분류, 점진적 구축 절차의 원칙에 따라 교수-학습의 실제 상황을 반영하는 준구어 말뭉치를 구축한다. 교실에서 발생하는 언어학습 상황을 시나리오로 구성하여 대화 흐름을 제어하고 채팅용 메신저와 유사한 형태의 도구를 통해 말뭉치를 구축한다. 이 연구는 한국어 튜터링 챗봇을 개발하기 위해 말뭉치 구축용 챗봇과 한국어 학습자, 한국어 교수자가 시나리오를 기반으로 발화문을 생성한 준구어 말뭉치를 최초로 구축한다는 데에 의의가 있다.

  • PDF

메타데이터언어 및 저장체계의 개발 방법에 관한 연구 (A Study on the Development Methods of Metadata Language and Repository Architecture)

  • 박동진
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2007년도 춘계학술대회
    • /
    • pp.163-170
    • /
    • 2007
  • 아직 국내에서는 표준 메타데이터를 기반으로 한 정보시스템 개발의 경험이 없으며 최신의 메타데이터 개발도구, 절차, 핵심기술 및 통합방법에 관한 가이드라인이 없다. 그러나 향후 3-4년 이후에 본격적인 메타데이터 시스템의 개발이 시작될 예정인데 각 기관에서는 미래의 시스템에 대하여 어떻게 준비를 하고 진행을 해야 할지를 모르고 있는 실정이다. 따라서 현재 외국에서 성공적으로 개발되어 운영되고 있는 메타데이터 기반 시스템을 벤치마킹하여 시스템 개발프로세스를 표준화하고, 이를 기반으로 한 시스템의 개발 방법론에 대한 연구가 시급한 상황이다. 본 연구는 이를 위한 사전연구에 해당하는 것으로 구체적인 연구의 목표는 메타데이터 언어와 저장체계 개발과 관련된 프레임워크를 제시하는 것이다.

  • PDF

한국어 형용사 의미계층의 전산적 추출 (The Computational Extraction of Semantic Hierarchies for Korean Adjectives)

  • 송상헌;최재웅
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.109-116
    • /
    • 2006
  • 자연 언어의 각 어휘는 서로 관계를 가지고 계층적 입체적 모델로 존재한다. 이러한 전제에서 출발한 연구 가운데 대표적인 것이 의미 계층이다. 본고에서는 한국어 형용사의 의미 계층을 추출하는 것을 목표로 하여, 형식적 객관적 방법론을 정립하고, 결과를 비교적 신속하고 정확하게 이끌어 낼 수 있는 전산적 처리 도입하였다. 우선 전체 구축에 필요한 절차를 세우고 각 단계에서 필요한 방법과 휴리스틱을 정리하였다. 이를 바탕으로 사전 뜻풀이말을 이용하여 반자동으로 작업하였으며, 일부 코퍼스를 활용하였다 최종 알고리즘으로는 Top-Down 방식을 택하였다. 이렇게 추출된 한국어 형용사 의미 계층은 226개의 최상위어에서 시작하여 총 3,792개의 표제어를 망라한다. 또한 수직적 계열 관계만을 명시했을 경우 나타날 수 있는 한계를 보완하기 위해, 동의어 반의어와 같은 수평적 의미 관계와 공기 명사와 같은 결합 관계 등을 함께 기술하였다. 한편 표제항을 뜻풀이말의 공기 명사를 이용하여 의미별로 분류하고 각 분류마다 별도의 의미 계층을 수립하였다.

  • PDF

SMT-Solver 를 사용한 자바바이트코드의 배열 오버플로우 검증 (A Verification of Array Overflow in Java Bytecode using SMT-Solver)

  • 이상협;김제민;박준석;유원희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.261-264
    • /
    • 2011
  • 자바프로그램 검증은 안전하고 정확한 프로그램을 만들기 위한 필수적인 조건이지만 자바언어로 작성된 프로그램은 바이트코드로 작성되어 있는 클래스 파일로 배포되기 때문에 바이트코드에 대한 검증이 필요하다. 하지만 자바 바이트코드는 가독성이 떨어져 중간언어로 변환을 하고 그 중간코드에서 검증에 필요한 조건들을 작성 해야 한다. 이 논문에서는 새로 정의된 중간언어인 BIRS을 통해 컴파일시 검증이 되지 않는 배열 오버플로우에 대한 정적검증을 설명하고 검증 절차에 필요한 명제의 정의와 검증 시 사용되는 SMT-Solver 인 Z3 의 사용법에 대하여 서술하였다.

규칙기반 한글 자동 프로그램을 위한 프로그램 변형기법 (A Program Transformational Approach for Rule-Based Hangul Automatic Programming)

  • 홍성수;이상락;심재홍
    • 한국정보처리학회논문지
    • /
    • 제1권1호
    • /
    • pp.114-128
    • /
    • 1994
  • 초고급 언어에 의한 자동 프로그래밍은 프로그램의 자료구조 이외에 많은 부분을 시스템이 관장함으로써 프로그램 명세의 표현이 추상적이지만 프로그램 의미소가 술 어논리, 집합, 사상, 혹은 제안된 자연언어를 사용하기 때문에 초고급 구조에 익숙하 지 않은 프로그래머들이 이를 이용하여 프로그램을 작성하는 경우 상당한 어려움이 따 르고, 이들 초고급언어 구조에 익숙하기까지 많은 시간이 요하게 된다. 왜냐하면 초 고급언어는 프로그램 명세의 표현이 추상적이지만 프로그램 의미소가 술어 논리, 집합, 사상, 혹은 제한된 자연언어를 사용하기 때문이다. 본 논문에서는 기존의 자동 프로 그램의 어려움을 줄이기 위해서 한글로 구성된 선언적구문, 절차적 구문, aggregate 구문으로 광역언어를 설계하고 구현한다. 본 논문에서는 제안하는 한글 자동 프로그래 밍 시스템(Hangul Automatic Programming)은 입력으로 순수한 한글로 구성되어 있으며 추상 알고리즘(Abstract Algorithm)과 자료형(Data Type)혹은 절차적 구문을 받아서 출력으로는 C 언어 프로그램을 만들어 낸다. 자동 프로그래밍 접근 방식은 프로그램 변형기법과 규칙기반에 바탕을 두고 문제영역은 일반적인 프로그램으로 한정 하였다. 시스템 제어구조는 한글 프로그램을 입력으로 받아서 지식베이스로부터 적절한 규칙 을 선택해서 이것을 변형한 다음 전체 데이타 베이스에 넣는데 이과정을 프로그램이 완성 될 때 까지 반복한다.

  • PDF

비행 절차에 따른 항공기 소음 분석용 INM 입력 자료 생성 모듈 설계 (Design of INM Input Generation Module for Aircraft Noise Analysis with Flight Procedures)

  • 최철희;은연주;전대근;전향식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.178-182
    • /
    • 2012
  • PEAT(Procedure/airspace Efficiency Assessment Tool)는 비행절차 및 공역 설계 프로그램을 이용하여 설계된 비행절차에 대해, 연료소모, 비행시간, 비행적합성, 소음분석 등의 효율성을 평가한다. 이 중 본 연구에서는 소음 분포 해석을 위한 INM(Integrate Noise Model)의 입력 자료를 생성하는 모듈을 설계하였다. 소음 분포 해석을 위한 INM 입력 파일은 항공기 기종, 소음 모델, 공항 환경, 활주로 트랙, 항공기 운항 횟수, 비행로 등에 관한 데이터를 담고 있어야 하며, 본래 파일 형태의 입력으로 구동하도록 설계되어 있지 않은 INM의 특성상 적절한 파일 형식을 만족시켜야 하는 구속조건 또한 뒤따른다. 따라서 입력될 데이터는 원래 주어진 확장성 마크업 언어(XML)에서 데이터베이스파일(DBF) 변환되도록 설계하였으며, 본 논문에서는 INM의 입력 자료를 제공하고 INM의 소음 분석 결과를 변환하여 저장하는 기능을 갖는 모듈의 설계 결과를 제시한다.

  • PDF

암시적/명시적 협업 프로세스 언어의 비교분석 (Comparison and Analysis of Implicit and Explicit Collaboration Process Languages)

  • 조명현;박정업;설주영;백문홍;손진현
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.671-682
    • /
    • 2006
  • 지금까지 비즈니스 프로세스 관리에 대한 표준 및 다양한 연구 활동들이 수행되어 왔다. 하지만 아직 범용적인 협업 프로세스 언어 표준이 규정되어 있지 않은 상태이기 때문에, 관련 연구 활동들이 체계적이지 못한 면이 있다. 본 연구는 대표적인 협업 프로세스 언어들(BPEL4WS, BPML, WSCI, WS-CDL, BPSS 등)의 비교 분석을 통하여 협업 프로세스 언어를 올바르게 선택하고 활용하는 가이드라인을 제시하고자 한다. 이를 위해, 본 논문에서는 먼저 협업 방식에 따라 암시적 협업과 명시적 협업을 정의하고 세 단계의 순차적인 방법론에 따라 협업 프로세스언어들의 특징을 비교 분석한 결과를 제시한다. 첫 번째 단계로, Bernauer가 제안한 협업 환경의 프레임워크와 협업 프로세스 모델링 절차에 따라 협업 프로세스 언어가 가져야 할 필수 요소를 추출한다. 두 번째 단계로, 추출된 필수 요소를 기반으로 협업 프로세스 언어들의 특징을 분석한다 마지막으로 협업 프로세스 언어들의 특징을 반영하여 실제 비즈니스 프로세스를 구성하는 완전한 예제를 제시한다.

수업컨설팅 지원을 위한 수업언어 분석 프로그램 설계 및 개발 (Design and Development of the Verbal Interaction Analysis Program for Supporting Teaching Consultation)

  • 백제은;김경현
    • 컴퓨터교육학회논문지
    • /
    • 제18권1호
    • /
    • pp.1-12
    • /
    • 2015
  • 본 연구는 수업컨설팅을 효과적으로 지원하기 위한 수업언어 분석 프로그램을 개발하는 데 목적이 있다. 이를 위해 사용자 요구사항을 바탕으로 수업언어를 체계적으로 분석할 수 있는 컴퓨터 프로그램을 개발하였다. 개발된 수업언어 분석 프로그램은 다음과 같은 특징이 있다. 첫째, 사용자가 분석 도구의 틀을 원하는 바대로 설정할 수 있기 때문에 다양한 형태의 수업언어 분석이 가능하다. 둘째, 횟수나 시간비율과 같은 양적 분석의 결과뿐만 아니라 수업언어 전사와 같은 질적 분석의 결과를 얻을 수 있다. 셋째, 사용자가 분석 단위 시간, 동영상 플레이어 환경, 입력 및 결과 파일 형태와 같은 프로그램 환경을 자유롭게 설정할 수 있기 때문에 개인별 맞춤형 분석이 가능하다. 마지막으로 수업컨설팅 절차에 따른 활동 결과를 체계적으로 기록하고 관리할 수 있다. 이 프로그램은 수업컨설팅이 보다 전문적으로 이루어지도록 지원할 것이라 기대한다.

EPL 기반의 SW전공자를 위한 프로그래밍 수업 모형에 관한 연구 (A Study on the EPL using Instructional Model of SW Major's Programming Class)

  • 고광일
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.891-898
    • /
    • 2018
  • 4차 산업혁명시대에서 그 중요성이 날로 증대하고 있는 소프트웨어의 핵심 교육 영역인 프로그래밍 언어는 논리적 사고 능력을 요구하고 있어 SW전공 학생들에게도 어려운 과목으로 인식되고 있다. 이런 어려움으로 인해 SW전공 학생이 프로그래밍 언어 입문 수업 도중 전공에 대한 흥미와 자신감을 잃고 전공을 변경하거나 학업 자체를 포기하는 상황이 발생하기도 한다. 본 연구는 SW전공자의 프로그래밍 입문 수업에 일반적으로 사용되는 C 언어 교육에 스크래치를 활용하는 수업 모형을 설계하였다. 이를 위해, C언어가 지원하는 프로그래밍 개념들 중 스크래치로 교육 가능한 개념들을 명확히 파악하고 그 개념들의 이해와 활용 능력을 배양하기 위한 스크래치 실습 예제들을 개발하였다. 본 수업 모형은 프로그래밍 개념들에 대해서 먼저 스크래치의 구현 방식 교육과 예제들을 통해 명확하게 이해하고 C언어로 교육 내용을 확장하는 절차를 지원하며 모 지방 사립대의 SW전공 신입생들을 대상으로 효과를 실험하였다.