• Title/Summary/Keyword: 과학 언어

검색결과 1,522건 처리시간 0.025초

마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 (Unpaired Korean Text Style Transfer with Masked Language Model)

  • 배장성;이창기;황정인;노형종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.391-395
    • /
    • 2021
  • 텍스트 스타일 변환은 입력 스타일(source style)로 쓰여진 텍스트의 내용(content)을 유지하며 목적 스타일(target style)의 텍스트로 변환하는 문제이다. 텍스트 스타일 변환을 시퀀스 간 변환 문제(sequence-to-sequence)로 보고 기존 기계학습 모델을 이용해 해결할 수 있지만, 모델 학습에 필요한 각 스타일에 대응되는 병렬 말뭉치를 구하기 어려운 문제점이 있다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행하는 방법들이 연구되고 있다. 이 연구들은 주로 인코더-디코더 구조의 생성 모델을 사용하기 때문에 입력 문장이 가지고 있는 내용이 누락되거나 다른 내용의 문장이 생성될 수 있는 문제점이 있다. 본 논문에서는 마스크 언어 모델(masked language model)을 이용해 입력 텍스트의 내용을 유지하면서 원하는 스타일로 변경할 수 있는 텍스트 스타일 변환 방법을 제안하고 한국어 긍정-부정, 채팅체-문어체 변환에 적용한다.

  • PDF

CPS 모형으로 개발된 동물 발생 실험수업에서 나타난 과학영재의 특성에 따른 언어적 상호작용 분석 (The Analysis of The Science Gifted's Characteristics Present in Linguistic Interactions in The Animal Development Inquiry Activity Program Based on Creative Problem Solving(CPS) Model)

  • 안주현;전미란;박기석;전상학
    • 영재교육연구
    • /
    • 제20권1호
    • /
    • pp.107-130
    • /
    • 2010
  • 본 연구에서는 과학영재 학생들을 대상으로 생물 영역의 동물 발생 실험수업을 통해 나타나는 언어적 상호작용을 분석하여 과학영재성을 보여주는 특성들을 알아보고자 하였다. 연구 대상은 서울대학교 과학영재센터의 중학교 1학년 학생 20명이었으며, Creative Problem Solving (CPS) 모형을 기반으로 개발된 동물 발생 실험 프로그램으로 소집단 토의 중심의 실험 수업을 총 4회 진행하면서 학생들의 언어적 상호작용을 녹음 및 녹화, 관찰하였다. 전사된 내용으로부터 질문-응답 유형과 과학영재의 특성을 추출하여 분석하였다. 질문-응답의 유형 분석에서는 보다 높은 사고력을 요하는 사고형 질문이 기본정보형 질문보다 3~6배나 높게 나타났다. 특히, 탐구실험 I은 다른 세 탐구실험보다 기본정보형 및 사고형 질문이 40% 이상 높게 나타났다. 언어적 상호작용의 분석 결과 창의적 지필검사에서 보기 어려웠던 창의성의 세부 요인을 확인할 수 있었으며, 문제발견력 및 문제해결력, 고도의 언어능력 등을 확인하였고, 정의적 특성인 과제 집착력과 리더십도 드러나는 것을 볼 수 있었다. 본 연구 결과는 지필고사를 대신하는 영재의 판별 및 선발에서 활용할 수 있는 프로그램 개발에 실질적인 도움을 줄 수 있을 것으로 사료된다.

교육용 프로그래밍 언어 연구 동향 (A Review and Synthesis of Research in Educational Programming Language)

  • 안상진;서영민;이영준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제45차 동계학술발표논문집 20권1호
    • /
    • pp.139-142
    • /
    • 2012
  • 최근 정보교육과정의 개정은 컴퓨터 과학의 기본 내용들을 정보 교과에 포함하였고, 그 컴퓨터 과학적인 사고를 실세계에 구현하는 것을 교육 목표로 하여 학생들에게 프로그래밍 교육을 실시하고 있다. 하지만 기존의 범용 프로그래밍 언어는 학습자가 습득하고 활용하는 데 많은 시간이 걸리고 인지적 부담이 큰 단점이 있었다. 이러한 단점을 보완하고자 교육용 프로그래밍 언어가 등장하였고, 교육용 프로그래밍 언어를 활용하여 교육적인 효과를 얻기 위한 다양한 연구가 진행되고 있다. 본 연구는 한국에서 진행된 교육용 프로그래밍 언어 관련 연구를 분석하여 연구의 의미를 발견하고 추후의 연구 방향을 제시하고자 한다.

  • PDF

유아 언어학습에 대한 하이퍼망 메모리 기반 모델 (Hypernetwork Memory-Based Model for Infant's Language Learning)

  • 이지훈;이은석;장병탁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.983-987
    • /
    • 2009
  • 유아들의 언어습득에 있어서 중요한 점 하나는 학습자에 대한 언어환경의 노출이다. 유아가 접하는 언어환경은 부모와 같은 인간뿐만 아니라 각종 미디어와 같은 인공적 환경도 포함되며, 유아는 이러한 방대한 언어환경을 탐색하면서 언어를 학습한다. 본 연구는 대용량의 언어 데이터 노출이 영향을 미치는 유아언어학습을 유연하고 적절하게 모사하는 인지적 기제에 따른 기계학습 방식을 제안한다. 유아의 초기 언어학습은 문장수준의 학습과 생성 같은 행동들이 수반되는데, 이는 언어 코퍼스에 대한 노출만으로 모사가 가능하다. 모사의 핵심은 언어 하이퍼망 구조를 가진 기억기반 학습모델이다. 언어 하이퍼망은 언어구성 요소들 간의 상위차원 관계 표상을 가능케 함으로써 새로운 데이터 스트림에 대해 유사구조의 적용과 이용을 도모하여 발달적이고 점진적인 학습을 모사한다. 본 연구에서는 11 개의 유아용 비디오로부터 추출한 문장 32744개를 언어 하이퍼망을 통한 점진적 학습을 수행하여 문장을 생성해 유아의 점진적, 발달적 학습을 모사하였다.

C2JNI: 내장 C 언어에서 JNI 코드를 생성하는 변환기 (C2JNI: An Embedded C to JNI Translator)

  • 유재우;최종명;김영철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1551-1559
    • /
    • 2004
  • 자바는 플랫폼에 독립적인 객체지향 프로그래밍 언어로서 널리 사용되고 있지만, 플랫폼에 의존적인 기능을 사용해야 하거나 흑은 유산 시스템(legacy system)을 재사용하기 위해서는 JNI를 이용해야 한다. JNI는 자바가 C/C++ 언어와 결합하기 위한 표준화된 규칙과 API를 제공하지만, 개발자가 JNI를 이용해서 프로그램을 개발하는 것은 매우 복잡하고, 번거롭다는 단점이 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 자바 프로그램에 내장된 C 프로그램 코드를 자동적으로 JNI 명세에 맞는 C 언어로 변환할 수 있는 C2JNI라는 변환기를 소개한다. C2JNI를 사용하는 경우에 내장된 C 언어 프로그램은 JNI API를 사용하지 않고서도 C 언어와 자바 프로그램을 결합할 수 있기 때문에 개발자는 자바와 C 언어에 대한 지식만 있으면, 자바와 C 언어를 결합해서 사용할 수 있다.

Cross-lingual Post-Training (XPT)을 통한 한국어 언어모델 구축 및 비교 실험 (Korean language model construction and comparative analysis with Cross-lingual Post-Training (XPT))

  • 손수현;박찬준;이정섭;심미단;이승현;이진우;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.295-299
    • /
    • 2022
  • 자원이 부족한 언어 환경에서 사전학습 언어모델 학습을 위한 대용량의 코퍼스를 구축하는데는 한계가 존재한다. 본 논문은 이러한 한계를 극복할 수 있는 Cross-lingual Post-Training (XPT) 방법론을 적용하여 비교적 자원이 부족한 한국어에서 해당 방법론의 효율성을 분석한다. 적은 양의 한국어 코퍼스인 400K와 4M만을 사용하여 다양한 한국어 사전학습 모델 (KLUE-BERT, KLUE-RoBERTa, Albert-kor)과 mBERT와 전반적인 성능 비교 및 분석 연구를 진행한다. 한국어의 대표적인 벤치마크 데이터셋인 KLUE 벤치마크를 사용하여 한국어 하위태스크에 대한 성능평가를 진행하며, 총 7가지의 태스크 중에서 5가지의 태스크에서 XPT-4M 모델이 기존 한국어 언어모델과의 비교에서 가장 우수한 혹은 두번째로 우수한 성능을 보인다. 이를 통해 XPT가 훨씬 더 많은 데이터로 훈련된 한국어 언어모델과 유사한 성능을 보일 뿐 아니라 학습과정이 매우 효율적임을 보인다.

  • PDF

초.중등 과학 교과서 화산과 지진 관련 단원 글의 언어 구조 비교 분석 (A Comparative Analysis of the Linguistic Features of Texts used in the unit of Volcano and Earthquake in Korean Elementary and Secondary School Science Textbooks)

  • 신명환;맹승호;김찬종
    • 한국지구과학회지
    • /
    • 제31권1호
    • /
    • pp.36-50
    • /
    • 2010
  • 이 연구의 목적은 초 중 고등학교 과학 교과서 글의 구조적 특징을 종합적으로 분석하여 학생들이 상급 학교로 진학하면서 경험하게 되는 과학 교과서 글의 변화 양상을 살펴보는 것이다. 연구 자료로 제 7차 교육 과정에 의해 개발된 초 중 고등학교 과학 교과서의 '화산과 지진' 관련 단원의 글을 선정하였으며, '텍스트 구성적 의미', '상호 관계적 의미', '내용과 논리 관계 의미'의 측면에서 글을 비교 분석하였다. 연구 결과, 과학 교과서의 글은 학교급에 따라 글의 구조를 비롯한 언어적 특징이 다르게 나타나며, 학생들이 상급 학교로 진학하면서 이러한 글의 구조적 특징 차이에 의해서도 과학 교과서를 읽고 이해하는 것이 어렵고 생소하다고 인식할 수 있음을 문제로 제기하였다. 또한 과학을 학습하는 과정에서 과학의 언어가 지니는 구조적 특징에 대한 과학 교사의 중재자 역할이 필요함을 제안하였다.

지구과학 논문의 언어 특성 이해: 레지스터 분석 (Understanding of the Linguistic Features of Earth Science Treatises: Register Analysis Approach)

  • 맹승호;신명환;차현정;함석진;신현정;김찬종
    • 한국지구과학회지
    • /
    • 제31권7호
    • /
    • pp.785-797
    • /
    • 2010
  • 이 연구에서는 과학 논문 레지스터를 분석하여 지구과학 논문의 언어 특성을 탐색하였다. 연구 자료로 지질과학, 대기과학, 해양과학의 한국어 논문 1편씩을 선정하였다. 지구과학 논문 레지스터의 특징은 다음과 같다. 첫째, 주제부와 설명부 간의 의미적, 지시적 연결이 체계적으로 이루어지고 있으며, 이를 통해 텍스트가 제시하려는 메시지와 요점이 통일적으로 응집력 있게 제시되었다. 둘째, 각 텍스트의 장르 요소에 따라 연역적 추론 또는 귀추적 추론 관계 및 인과 관계를 나타내는 술어들이 사용되었으며, 논리적 관계는 접속어구보다는 술어의 유형을 통해 표현되었다. 셋째, 대부분의 논문 텍스트에서 가능성을 나타내는 인식적 술어를 사용하여 과학자들의 해석과 설명 및 주장을 간접적으로 표현하는 약한 상호관계를 형성하였다. 연구 결과를 근거로 학생들이 과학 학습 과정에서 과학 텍스트에 대한 문해 능력을 높이고, 과학자들의 지식 구성 방식을 이해하기 위해서는 과학 글에서 각 문장을 구성하는 주제부와 설명부의 연결 관계를 파악하고, 술어의 유형에 따라 논리적 관계를 조사하는 과학 언어 풀어내기 활동이 과학 교육과정에 포함되어야 함을 논의하였다.

의미 분석 (Meaning Analysis)

  • 이건원
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.419-423
    • /
    • 2000
  • 성공적인 의사소통의 경우에 성(性)이, 이(理)와 명(命)으로 나타난 것이 같다. 진리(aletheia)가, 언어(logos)와 운명(moira)으로 나타난 것들이 일치하는 것이 성공적인 언화행위가 된다. 측정대상(melos)과 본체(ousia)가 구분되는 것은 언어와 운명의 괴리가 있을 수 있기 때문이다. 체계적인 언어처리의 지식기반을 측정대상에 한정한다. (1) 철학의 시작은 더 옳은 언어표현의 정의(definition)로 이전의 잘못 사용된 언어처리를 대체시키는 것으로 소크라테스는 보았다. [R. Crossman] (2)잘못을 지적하는 등에(Tabanidae)의 역할과 옳은 지식의 상기를 돕는 산파법(maieutics)이 소크라테스의 의미분석의 방법이다. [R. Crossman] (3) 언어를 통하여 진리를 추구한다는 입장(via language)에서 한 언어표현이 그 진리의 운명으로 나타남과 어긋날 때, 운명을 택하는 것은 조화 보다 더 안정의 우위를 인정하는 논리적인 입장으로 합리성 보다 실용(pragma)의 우위를 인정하는 것이다. [W. Quine] (4) 공동체의 공통규범의 추구는 그 언어 속의 공통의 형식 또는 법칙의 추구에 기초하는 것이 자연스럽다. 여기에서 그 언어사용은 그 기저의 법칙(underlying rule)에 개입한다는 입장에 기초한다. [J. Searle] (5) 진리의 언어표현과 운명적인 사태들 사이의 괴리를 처리하기 위하여 체계적인 언어표현의 대상(The Young Tableaux)과 실제(The continuum)의 구분을 수용한다. [AMS(2000)]언어표현의 대상은 나타난 것(顯)이고 실제에는 나타나지 않은 것도 있다. [伊川, 明道] (6) 이 나타난 것과 나타나지 않은 것에 간격이 없다는 것(顯微無間)은 그 의사소통이 성공적인 것이라는 것을 말한다. 따라서 그 언어의 표현완전성(functional completeness)은 언화행위가 성공적이라는 것이다. [J. Searle] (7) 수로 쓰인 것(象數)과 시로 쓰인 것(義理)이 하나인 것은 그 나타난 것과 나타나지 않은 것들 사이에 어떠한 틈도 없음을 말한다. [成中英] (8) 공통의 규범의 공통성 속에 규범적인 측면이 벌써 있다. 공통성에서 개인적이 아닌 공적인 규범으로의 전이는 규범, 가치, 규칙, 과정, 제도로의 전이라고 본다. [C. Morrison] (9) 우리의 언어사용에 신비적인 요소를 부인할 수가 없다. 넓은 의미의 발화의미(utterance meaning) 속에 신비적인 요소나 애정표시도 수용된다. 의미분석은 지금 한글을 연구하고, 그 결과에 의존하여서 우리의 실제의 생활에 사용하는 $\boxDr$한국어사전$\boxUl$등을 만드는 과정에서, 어떤 의미에서 실험되었다고 말할 수가 있는 언어과학의 연구의 결과에 의존하여서 수행되는 철학적인 작업이다. 여기에서는 하나의 철학적인 연구의 시작으로 받아들여지는 이 의미분석의 문제를 반성하여 본다.

  • PDF