• Title/Summary/Keyword: 과학 언어

검색결과 1,503건 처리시간 0.039초

반자동구축된 개체명 주석코퍼스 DecoNAC과 KoBERT를 이용한 개체명인식 플랫폼 DecoNERO (A Named Entity Recognition Platform Based on Semi-Automatically Built NE-annotated Corpora and KoBERT)

  • 김신우;황창회;윤정우;이성현;최수원;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.304-309
    • /
    • 2020
  • 본 연구에서는 한국어 전자사전 DECO(Dictionnaire Electronique du COreen)와 다단어(Multi-Word Expressions: MWE) 개체명을 부분 패턴으로 기술하는 부분문법그래프(Local-Grammar Graph: LGG) 프레임에 기반하여 반자동으로 개체명주석 코퍼스 DecoNAC을 구축한 후, 이를 개체명 분석에 활용하고 또한 기계학습에 필요한 도메인별 학습 데이터로 활용하는 DecoNERO 개체명인식 플랫폼을 소개하는 데에 목적을 두었다. 최근 들어 좋은 성과를 보이는 것으로 보고되고 있는 기계학습 방법론들은 다양한 도메인을 기반으로한 대규모의 학습데이터를 필요로 한다. 본 연구에서는 정교하게 설계된 개체명 사전과 다단어 개체명 시퀀스에 대한 언어자원을 바탕으로 하는 반자동으로 학습데이터를 생성하는 방법론을 제안하였다. 본 연구에서 제안된 개체명주석 코퍼스 DecoNAC 기반 접근법의 성능을 실험하기 위해 온라인 뉴스 기사 텍스트를 바탕으로 실험을 진행하였다. 이 실험에서 DecoNAC을 적용한 경우, KoBERT 모델만으로 개체명을 인식한 결과에 비해 약 7.49%의 성능향상을 기대할 수 있음을 확인하였다.

  • PDF

거대 언어 모델의 정치적 편향과 하위 작업에서의 영향 (Political Bias in Large Language Models and Implications on Downstream Tasks)

  • 서정연;조석민;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.552-557
    • /
    • 2023
  • 거대 언어 모델의 성능이 비약적으로 높아지며 인간과의 직접적인 상호 작용 과정이 가능해지고, 이에 따라 윤리 검증의 필요성이 대두되고 있다. 본 연구에서는 인간이 지닌 여러 가치관 중에 정치에 초점을 둔다. 거대 언어 모델의 정치 성향이 사용자의 입력에 따라 변할 수 있는지와 하위 작업에 끼치는 영향에 대해 알아보고자 두 개의 실험을 설계하였고 이에 대한 결과를 분석하였다. 실험에는 거대 언어 모델의 정치 성향을 입력 대조군으로, 세가지 다른 입력 (탈옥 기법, 정치 페르소나, 탈옥 페르소나)을 입력 실험군으로 규정하였다. 실험 결과, 거대 언어 모델의 정치 성향은 탈옥 기법에서 가장 큰 폭으로 변화하였고, 정치 페르소나와 탈옥 페르소나에서는 변화가 크지 않아, 거대 언어 모델에 내재된 정치 성향의 영향에서 크게 벗어나지 못함을 확인하였다. 또한, 하위 작업에서의 실험을 통해 변화된 정치 성향은 하위 작업의 성능 개선을 가져올 수 있으며, 각 실험군에 따라 하위 작업에서 다른 방식의 양상을 보임을 확인하였다. 이는 실제 모델이 사용될 때 개인화된 응답보다는 모델이 선호하는 응답을 받게 되며, 거대 언어 모델의 정치 성향이 사용자에게 여과없이 노출될 수 있음을 시사한다.

  • PDF

반자동 언어데이터 증강 방식에 기반한 FbSA 모델 학습을 위한 감성주석 데이터셋 FeSAD 구축 (Building Sentiment-Annotated Datasets for Training a FbSA model based on the SSP methodology)

  • 윤정우;황창회;최수원;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.66-71
    • /
    • 2021
  • 본 연구는 한국어 자질 기반 감성분석(Feature-based Sentiment Analysis: FbSA)을 위한 대규모의 학습데이터 구축에 있어 반자동 언어데이터 증강 기법(SSP: Semi-automatic Symbolic Propagation)에 입각한 자질-감성 주석 데이터셋 FeSAD(Feature-Sentiment-Annotated Dataset)의 개발 과정과 성능 평가를 소개하는 것을 목표로 한다. FeSAD는 언어자원을 활용한 SSP 1단계 주석 이후, 작업자의 주석이 2단계에서 이루어지는 2-STEP 주석 과정을 통해 구축된다. SSP 주석을 위한 언어자원에는 부분 문법 그래프(Local Grammar Graph: LGG) 스키마와 한국어 기계가독형 전자사전 DECO(Dictionnaire Electronique du COréen)가 활용되며, 본 연구에서는 7개의 도메인(코스메틱, IT제품, 패션/의류, 푸드/배달음식, 가구/인테리어, 핀테크앱, KPOP)에 대해, 오피니언 트리플이 주석된 FeSAD 데이터셋을 구축하는 프로세싱을 소개하였다. 코스메틱(COS)과 푸드/배달음식(FOO) 두 도메인에 대해, 언어자원을 활용한 1단계 SSP 주석 성능을 평가한 결과, 각각 F1-score 0.93과 0.90의 성능을 보였으며, 이를 통해 FbSA용 학습데이터 주석을 위한 작업자의 작업이 기존 작업의 10% 이하의 비중으로 감소함으로써, 학습데이터 구축을 위한 프로세싱의 소요시간과 품질이 획기적으로 개선될 수 있음을 확인하였다.

  • PDF

언어모델 전이학습 기반 해외 직접 구매 상품군 분류 (A Method of Classification of Overseas Direct Purchase Product Groups Based on Transfer Learning)

  • 오교중;최호진;차원석;김일구;우찬균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.571-575
    • /
    • 2022
  • 본 논문에서는 통계청에서 매월 작성되는 온라인쇼핑동향조사를 위해, 언어모델 전이학습 기반 분류모델 학습 방법론을 이용하여, 관세청 제공 전자상거래 수입 목록통관 자료를 처리하기 위해서 해외 직접 구매 상품군 분류 모델을 구축한다. 최근에 텍스트 분류 태스크에서 많이 이용되는 BERT 기반의 언어모델을 이용하며 기존의 색인어 정보 분석 과정이나 사례사전 구축 등의 중간 단계 없이 해외 직접 판매 및 구매 상품군을 94%라는 높은 예측 정확도로 분류가 가능해짐을 알 수 있다.

  • PDF

언어 영재교육의 필요성과 방향 탐색 (The necessity and direction of verbally gifted education)

  • 강승희;조석희
    • 영재교육연구
    • /
    • 제14권1호
    • /
    • pp.91-114
    • /
    • 2004
  • 본 연구는 현재 시행되고 있는 영재교육에서 상대적으로 적은 관심을 받고 있는 언어 영재 교육의 필요성과 방향을 탐색하기 위한 시도로써 이루어졌다. 과학 문명의 발전을 위해 과학 영재교육이 필요하다면, 인류 문화의 발전을 위해서는 여러 분야의 영재교육이 골고루 이루어져야 한다. 특히 언어가 주가 되는 여러 분야의 전문가들에 의해 우리의 문화, 예술의 경쟁력을 높일 수 있을 것이다. 본 연구에서는 효과적인 언어 영재 교육이 이루어지기 위한 준비로서 현재 우리나라 언어 영재교육의 현황을 분석하고, 언어 영재교육의 필요성과 방향을 탐색하여, 언어 영재교육의 내실화를 기할 수 있는 기초를 제공하였다. 언어 영재교육이 올바르게 이루어지기 위해서는 무엇보다도 언어 영재들에 대한 잘못된 인식을 변화시켜 언어 영재 교육의 필요성을 깨닫도록 해야 하며, 언어 영재에 관한 기초 연구를 실시하여 언어 영재성 및 특성을 이해할 수 있어야하며, 언어 영재와 기타 다른 영역의 영재들을 위할 프로그램을 개발하여야한다.

한국어-영어 공감대화 데이터셋과 성격을 기반으로 한 언어모델 평가 (Language Model Evaluation Based on Korean-English Empathetic Dialogue Datasets and Personality)

  • 이영준;현종환;이도경;성주원;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.312-318
    • /
    • 2023
  • 본 연구는 다양한 대규모 언어 모델들의 한국어/영어 공감 대화 생성에서 성능을 실험적으로 비교 분석하는 것과 개인의 성향과 공감 사이에서의 상관 관계를 실험적으로 분석하는 것을 목표로 한다. 이를 위해, 한국어 공감 대화 데이터셋인 KorEmpatheticDialogues 를 구축하였고, personality-aware prompting 방법을 제안한다. 실험을 통해, 총 18개의 언어 모델들 간의 공감 대화 생성 성능을 비교 분석하였고, 개인의 성향에 맞춤형 제공하는 공감이 더 상호작용을 이끌어낼 수 있다는 점을 보여준다. 코드와 데이터셋은 게재가 허용되면 공개할 예정이다.

  • PDF

과학 학습 언어의 문법적 특성을 고려한 초등학생의 과학적 의사소통 능력 고찰 (Investigation of Elementary Students' Scientific Communication Competence Considering Grammatical Features of Language in Science Learning)

  • 맹승호;이관희
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제41권1호
    • /
    • pp.30-43
    • /
    • 2022
  • 이 연구는 초등학생의 과학 수업 대화 및 글쓰기에 구현된 언어 표현의 국어 문법적 특성에 근거하여 그들의 과학적 의사소통 능력의 양상을 조사하였다. Brown et al. (2010)의 증거에 기반한 추론 프레임웍을 순환학습모형에 접목하여 작성한 수업안을 초등학교 5학년을 대상으로 "날씨와 우리 생활" 단원에 적용하였다. 수업 대화에 활발히 참여한 학생 8명의 대화 전사본과 그 학생들의 과학 글쓰기 문장을 연구 자료로 활용하였으며, 텍스트의 내용 및 논리 관계 분석 방법을 적용하여 문법적 특성을 조사하였다. 연구에 참여한 초등학생들은 데이터 분석, 증거 해석, 규칙 적용, 설명 구성 등의 맥락에서 사용되는 과학 언어의 문법적 구조와 일치하지 않는 언어 사용의 양상을 보였다. 그러나 부분적으로 명사화 방식의 문법적 은유를 사용하거나, 적절한 인과 관계의 문법 구조를 사용한 글쓰기 사례도 제시되었다. 교사의 교수법적 안내 발화나 교과서 텍스트의 문법 구조를 통해 학생들이 과학의 문화에서 사용되는 언어 활동의 양태를 경험하면 초등학생도 유사한 과학적 말하기와 글쓰기를 나타낼 수 있었다. 학생들이 증거에 기반한 추론에 근거한 과학지식 구성의 맥락에 적절한 언어 사용 이해와 이에 대한 문식 기능을 습득할 수 있게 하려면, 과학 학습에 관한 언어 사용 모델을 접할 기회를 충분히 제공해 주는 것이 필요함을 논의하였다.

비주얼 베이직을 이용한 초등 정보과학영재용 프로그래밍 언어 교육내용 탐색

  • 강성원;이재호
    • 한국영재학회:학술대회논문집
    • /
    • 한국영재학회 2003년도 추계학술대회
    • /
    • pp.209-219
    • /
    • 2003
  • 초등 정보과학 영재교육의 핵심이 되는 프로그래밍교육은 창의적 사고와 수준 높은 문제 해결력을 동원하여 새로운 알고리즘을 생성해내는 정보 교육의 중요한 분야임에도 불구하고 초등 정보과학영재의 특성을 고려한 체계적인 교육 내용이 확립되어 있지 못한 상태이다. 본 연구에서는 초등 정보과학영재를 위한 프로그래밍 교육의 필요성을 탐색하여 프로그래밍 교육내용 요소를 추출하였으며, 프로그래밍 언어 선정기준을 통해 비주얼, 베이직을 교육용 프로그래밍 언어로 선정한 후 프로그래밍 교육내용을 제안하였다.

  • PDF

'과학동아' 지구과학 기사의 언어적 특성으로 본 과학 잡지의 과학 대중화 기제 (Science Popularizing Mechanism of a Science Magazine in terms of the Linguistic Features of Earth Science Articles in 'Science Donga')

  • 함석진;맹승호;김찬종
    • 한국지구과학회지
    • /
    • 제31권1호
    • /
    • pp.51-62
    • /
    • 2010
  • 과학 잡지가 과학자와 일반인 사이의 접점 역할을 수행하며 과학의 대중화에 기여할 수 있게 해 주는 기제를 과학 잡지 텍스트의 언어적 특성에서 찾기 위하여 과학 동아에 수록된 지구과학 관련 기사 12편을 선정하였다. 선정된 과학 잡지 텍스트의 언어적 특성을 규명하기 위하여 레지스터 분석을 실시하였다. 연구 결과, 1) 기자가 쓴 글은 과학자의 사유와 대화를 표현하는 인식적 술어와 발화적 술어의 비율이 높았다. 2) 기자의 글에는 문장의 주체가 사람으로 드러나는 비율이 높지만 과학자의 글에는 사람은 거의 드러나지 않으며 주체가 생략된 경우도 많았다. 3) 과학자의 글은 대부분 평서형 서법을 사용하지만, 기자가 쓴 글에서는 의문형과 청유형 서법, 생략 등의 비평서형 문장이 많았다. 4) 문장 속에 포함된 절의 밀도는 기자의 글이나 과학자의 글 모두 비슷하였다. 5) 정보의 구조 또한, 기자의 글은 단순한 정보의 발전 형태를 띠었고, 과학자의 글은 그에 비해 다소 복잡한 정보 구조를 나타내었다. 과학 잡지 텍스트의 언어적 특징을 통해 과학 잡지는 기자의 글을 통해 어려운 과학 내용을 쉽고 친숙한 텍스트로 제시함으로써 과학의 대중화에 기여할 뿐 아니라, 과학자가 쓴 순화된 과학 텍스트를 통해 일반인들을 과학의 언어라는 과학의 문화에 친숙하게 함으로써 과학의 대중화에 기여하게 됨을 밝혀 내었다.

메타 디자인의 가능성 (Meta Design)

  • 오창섭
    • 한국디자인학회:학술대회논문집
    • /
    • 한국디자인학회 2000년도 추계 학술발표대회 논문집
    • /
    • pp.132-133
    • /
    • 2000
  • 오늘날 메타(mee)라는 용어는 '메타언어', '메타과학', '메타비평' 등의 합성어를 통해 자신의 존재를 이 사회에서 확인 받고 있다. 특히 메타언어는 메타라는 용어를 가장 적극적으로 사용하는 경우라고 할 수 있다. 왜냐하면 메타언어는 언어를 연구대상으로 하는 학문영역에서 언어의 한 특성, 흑은 자체의 구조를 설명하는 보다 일반화된 개념으로 소통되고 있기 때문이다. (중략)

  • PDF