• Title/Summary/Keyword: 과학 언어

Search Result 1,502, Processing Time 0.029 seconds

The Patterns of Interlanguage in Science Learning and the Characteristics of Interlanguage through the Change of Understanding of Science Languages (과학 학습 과정에서 나타나는 중간언어의 유형 및 과학 언어에 대한 이해수준 변화에 따른 중간언어의 특징)

  • Yang, Chan-Ho;Kim, Ji-Yeong;Shin, Pil-Yeo;We, Hat-Nim;Shin, Myung-Hwan;Kang, Do-Young;Kim, So-Yo;Min, Hyun-Sik;Kim, Chan-Jong;Noh, Tae-Hee
    • Journal of The Korean Association For Science Education
    • /
    • v.31 no.5
    • /
    • pp.745-757
    • /
    • 2011
  • In this study, we investigated the interlanguage of ninth graders that was used to classify and explain the phenomena related to the change of the matters in a group discussion and semi-structured interview. The patterns of the interlanguage were classified and analyzed through the change of their understanding of science languages. The analyses of the results suggested that the interlanguage of the students are classified into the three patterns according to its meaning and form. Pattern 1 is science language used in combination with everyday language to express scientific meaning. This was used by most students regardless of the level of understanding of science languages. Pattern 2 is everyday language used to show scientific meaning, which was used by students who had better understanding of science languages than the others. Pattern 3 is using languages with multiple meaning, which was mainly used by students who have superficial understanding of science languages. Educational implications of these findings are discussed.

Comparison of the Features of Science Language between Texts of Earth Science Articles and Earth Science Textbooks (지구과학 논문과 지구과학 교과서 텍스트의 과학 언어적 특성 비교)

  • Lee, Jeong-A;Kim, Chan-Jong;Maeng, Seung-Ho
    • Journal of The Korean Association For Science Education
    • /
    • v.27 no.5
    • /
    • pp.367-378
    • /
    • 2007
  • The purpose of this study is to investigate the features of science language in Earth science textbooks and Earth science research articles. We examined two Earth science textbooks and two Earth science articles using the taxonomy of scientific words, the text structure analysis of explanations, the analysis of conjunctive relations and reasoning, and the function of conjunction. The results showed that school science language revealed in Earth science textbooks had high proportion of naming words and the text structures in which definition/exemplification structure and description structure were dominant. Also, internal relations that showed additional arrangement rather than logical inference, were predominant in Earth science textbooks. However, scientists' science language revealed in the Earth science articles had more proportion of process words and concept words than the Earth science textbooks and the schematic structure of explanation texts, such as orientation - implication sequence - conclusion. In addition, the text structures in each sentences of implication -sequence showed cause/effect or problem-solving after description structures. Also each sentences expressed causal or abductive reasoning through the internal relations using verbs or adverbial inflection. It is necessary that we bridge the gap between the two languages for students' authentic use of science language. For the bridging, we propose "interlanguage", which mediates between school science language and scientists' language.

Iterative Feedback-based Personality Persona Generation for Diversifying Linguistic Patterns in Large Language Models (대규모 언어 모델의 언어 패턴 다양화를 위한 반복적 피드백 기반 성격 페르소나 생성법)

  • Taeho Hwang;Hoyun Song;Jisu Shin;Sukmin Cho;Jong C. Park
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.454-460
    • /
    • 2023
  • 대규모 언어 모델(Large Language Models, LLM)의 발전과 더불어 대량의 학습 데이터로부터 기인한 LLM의 편향성에 관심이 집중하고 있다. 최근 선행 연구들에서는 LLM이 이러한 경향성을 탈피하고 다양한 언어 패턴을 생성하게 하기 위하여 LLM에 여러가지 페르소나를 부여하는 방법을 제안하고 있다. 일부에서는 사람의 성격을 설명하는 성격 5 요인 이론(Big 5)을 이용하여 LLM에 다양한 성격 특성을 가진 페르소나를 부여하는 방법을 제안하였고, 페르소나 간의 성격의 차이가 다양한 양상의 언어 사용 패턴을 이끌어낼 수 있음을 보였다. 그러나 제한된 횟수의 입력만으로 목표하는 성격의 페르소나를 생성하려 한 기존 연구들은 세밀히 서로 다른 성격을 가진 페르소나를 생성하는 데에 한계가 있었다. 본 연구에서는 페르소나 부여 과정에서 피드백을 반복하여 제공함으로써 세세한 성격의 차이를 가진 페르소나를 생성하는 방법론을 제안한다. 본 연구의 실험과 분석을 통해, 제안하는 방법론으로 형성된 성격 페르소나가 다양한 언어 패턴을 효과적으로 만들어 낼 수 있음을 확인했다.

  • PDF

KorSciDeBERTa: A Pre-trained Language Model Based on DeBERTa for Korean Science and Technology Domains (KorSciDeBERTa: 한국어 과학기술 분야를 위한 DeBERTa 기반 사전학습 언어모델)

  • Seongchan Kim;Kyung-min Kim;Eunhui Kim;Minho Lee;Seungwoo Lee;Myung-Seok Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.704-706
    • /
    • 2023
  • 이 논문에서는 과학기술분야 특화 한국어 사전학습 언어모델인 KorSciDeBERTa를 소개한다. DeBERTa Base 모델을 기반으로 약 146GB의 한국어 논문, 특허 및 보고서 등을 학습하였으며 모델의 총 파라미터의 수는 180M이다. 논문의 연구분야 분류 태스크로 성능을 평가하여 사전학습모델의 유용성을 평가하였다. 구축된 사전학습 언어모델은 한국어 과학기술 분야의 여러 자연어처리 태스크의 성능향상에 활용될 것으로 기대된다.

  • PDF

Analyzing the Form, Presentation, and Interactivity of External Representations in the Matter Units of Elementary Science Digital Textbooks Developed Under the 2015 Revised National Curriculum (2015 개정 교육과정에 따른 초등학교 과학과 디지털교과서의 물질 영역에 나타난 외적 표상의 양식과 제시 방법, 상호작용성 분석)

  • Kim, Haerheen;Shin, Kidoug;Noh, Taehee;Kim, Minhwan
    • Journal of Korean Elementary Science Education
    • /
    • v.41 no.2
    • /
    • pp.418-431
    • /
    • 2022
  • In this study, we analyzed the form, presentation, and interactivity of external representations presented in the matter units of elementary school science digital textbooks developed under the 2015 Revised National Curriculum. The analytic framework of the previous study was modified and supplemented. The matter units in the 3rd-6th grade science digital textbooks were analyzed by dividing them into "body texts" and "inquiries" area. The results revealed that visual-verbal and visual-nonverbal representations were presented the most. Conversely, audial-nonverbal representations were presented at a high frequency only in the body texts, and audial-verbal representations were presented at a low frequency in both the body texts and the inquiries. Regarding the presentation, when verbal and visual-nonverbal representations appeared together, visual-verbal and visual-nonverbal representations were primarily presented together. In some cases where visual-verbal, audial-verbal, and visual-nonverbal representations were presented together, information on visual-verbal and audial-verbal representations was presented redundantly. Audial-nonverbal representations unrelated to contents were presented along with other external representations, and the frequency was particularly high in the body texts. Regarding the contiguity, no visual-verbal and visual-nonverbal representations were presented on different pages, and no audial-verbal representations were presented asynchronously with visual-nonverbal representations. Regarding the interactivity, explanatory feedback and low-level manipulations were mainly presented. Based on the results, implications to improve digital textbooks are discussed from the perspective of multiple representation-based learning.

Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots (패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축)

  • Choi, Su-Won;Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

A Comparative Study on Building Korean & Chinese Music Request Sentence Patterns for AI Assistant Platforms (AI 어시스턴트 플랫폼의 한국어와 중국어 음악청취 요청문 패턴구축 비교 연구)

  • Yun, Soeun;Li, Jiabin;Nam, Jeesun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.383-388
    • /
    • 2020
  • 본 연구에서는 AI 어시스턴트의 음악청취 도메인 내 요청문을 인식 및 처리하기 위해 한국어와 중국어를 중심으로 도메인 사전 및 패턴문법 언어자원을 구축하고 그 결과를 비교분석 하였다. 이를 통해 향후 다국어 언어자원 구축의 접근 방법을 모색할 수 있으며, 궁극적으로 패턴 기반 문법으로 기술한 언어자원을 요청문 인식에 직접 활용하고 또한 주석코퍼스 생성을 통해 기계학습 성능 향상에 도움을 줄 수 있을 것으로 기대된다. 본 연구에서는 우선 패턴문법의 구체적인 양상을 살펴보기에 앞서, 해당 도메인의 요청문 유형의 카테고리를 결정하는 과정을 거쳤다. 이를 기반으로 한국어와 중국어 요청문의 실현 양상과 패턴유형을 LGG 프레임으로 구조화한 후, 한국어와 중국어 패턴문법 간의 통사적, 형태적, 어휘적 차이점을 비교분석 하여 음악청취 도메인 요청문의 언어별 생성 구조 차이점을 관찰할 수 있었다. 구축한 패턴문법은 개체명을 변수(X)로 설정하는 경우, 한국어에서는 약 2,600,600개, 중국어에서는 약 11,195,600개의 표현을 인식할 수 있었다. 결과적으로 본 연구에서 제안한 언어자원의 언어별 차이에 대한 통찰을 통해 다국어 차원의 요청문 인식 자원과 기계학습 데이터로서의 효용을 확인하였다.

  • PDF

DecoFESA: A Hybrid Platform for Feature-based Sentiment Analysis Based on DECO-LGG Linguistic Resources with Parser and LSTM (DECO-LGG 언어자원 및 의존파서와 LSTM을 활용한 하이브리드 자질기반 감성분석 플랫폼 DecoFESA 구현)

  • Hwang, Changhoe;Yoo, Gwanghoon;Nam, Jeesun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.321-326
    • /
    • 2020
  • 본 연구에서는 한국어 감성분석 성능 향상을 위한 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph) 패턴문법 기술 프레임에 의존파서 및 LSTM을 적용하는 하이브리드 방법론을 제안하였다. 본 연구에 사용된 DECO-LGG 언어자원을 소개하고, 이에 기반하여 의미 정보를 의존파서(D-PARS)와 페어링하는 한편 OOV(Out Of Vocabulary)의 문제를 LSTM을 통해 해결하여 자질기반 감성분석 결과를 제시하였다. 부트스트랩 방식으로 반복 확장될 수 있는 LGG 언어자원 및 알고리즘을 통해 수행되는 자질기반 감성분석 프로세스는 전용 플랫폼 DecoFESA를 통해 그 범용성을 확장하였다. 실험을 위해서 네이버 쇼핑몰의 '화장품 구매 후기글'을 크롤링하였으며, DecoFESA 플랫폼을 통해 현재 구축된 DECO-LGG 언어자원 기반의 감성분석 성능을 평가하였다. 이를 통해 대용량 언어자원의 구축과 이를 활용하기 위한 어휘 시퀀스 처리 알고리즘의 구현이 보다 정확한 자질기반 감성분석 결과를 제공할 수 있음을 확인하였다.

  • PDF

Exploration on possibility of finding gifted underachievers with high spatial ability and low verbal ability in elementary science field: Focused on "Light Propagation" (높은 공간능력과 낮은 언어능력을 가진 초등 미성취 과학영재의 발견가능성 탐색 - 빛의 직진 개념을 중심으로 -)

  • Jung, Yeon-su;Lee, Jiwon;Kim, Jung Bog
    • Journal of Gifted/Talented Education
    • /
    • v.26 no.1
    • /
    • pp.101-122
    • /
    • 2016
  • The purpose of this study is to explore a possibility finding gifted underachievers who have high spatial ability, but low verbal ability in elementary science field. In Korea, because teachers used to refer students' academic achievement only when they recommend gifted students, underachievers used to be excluded. The participants are 5th-grade students in elementary school. In this research, developed teaching materials were given to students to find underachievers. Results of spatial ability test, verbal ability test, science academic achievement, non-verbal test, and interviews about light propagation concept were obtained. By analyzing results of this study, we found that spatial ability is the most important factors to understand light propagation. And there are some features to understand light propagation according to spatial ability. Lastly, this study shows the possibility of non-verbal test to find gifted underachievers with high spatial ability and low verbal ability.

Calibration of Pre-trained Language Model for Korean (사전 학습된 한국어 언어 모델의 보정)

  • Jeong, Soyeong;Yang, Wonsuk;Park, ChaeHun;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.243-248
    • /
    • 2020
  • 인공 신경망을 통한 심층 학습 모델의 발전은 컴퓨터 비전, 자연언어 이해 문제들에서 인간을 뛰어넘는 성능을 보이고 있다. 특히 트랜스포머[1] 기반의 사전 학습 모델은 질의응답, 대화문과 같은 자연언어 이해 문제에서 최근 높은 성능을 보이고 있다. 하지만 트랜스포머 기반의 모델과 같은 심층 학습 모델의 급격한 발전 양상에 비해, 이의 동작 방식은 상대적으로 잘 알려져 있지 않다. 인공 신경망을 통한 심층 학습 모델을 해석하는 방법으로 모델의 예측 값과 실제 값이 얼마나 일치하는지를 측정하는 모델의 보정(Calibration)이 있다. 본 연구는 한국어 기반의 심층학습 모델의 해석을 위해 모델의 보정을 수행하였다. 그리고 사전 학습된 한국어 언어 모델이 문장이 내포하는 애매성을 잘 파악하는지의 여부를 확인하고, 완화 기법들을 적용하여 문장의 애매성을 확신 수준을 통해 정량적으로 출력할 수 있도록 하였다. 또한 한국어의 문법적 특징으로 인한 문장의 의미 변화를 모델 보정 관점에서 평가하여 한국어의 문법적 특징을 심층학습 언어 모델이 잘 이해하고 있는지를 정량적으로 확인하였다.

  • PDF