• 제목/요약/키워드: 언어적 특성

검색결과 1,358건 처리시간 0.031초

KorBERT 기반 빈칸채우기 문제를 이용한 텍스트 분류 (Text Classification using Cloze Question based on KorBERT)

  • 허정;이형직;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.486-489
    • /
    • 2021
  • 본 논문에서는 KorBERT 한국어 언어모델에 기반하여 텍스트 분류문제를 빈칸채우기 문제로 변환하고 빈칸에 적합한 어휘를 예측하는 방식의 프롬프트기반 분류모델에 대해서 소개한다. [CLS] 토큰을 이용한 헤드기반 분류와 프롬프트기반 분류는 사전학습의 NSP모델과 MLM모델의 특성을 반영한 것으로, 텍스트의 의미/구조적 분석과 의미적 추론으로 구분되는 텍스트 분류 태스크에서의 성능을 비교 평가하였다. 의미/구조적 분석 실험을 위해 KLUE의 의미유사도와 토픽분류 데이터셋을 이용하였고, 의미적 추론 실험을 위해서 KLUE의 자연어추론 데이터셋을 이용하였다. 실험을 통해, MLM모델의 특성을 반영한 프롬프트기반 텍스트 분류에서는 의미유사도와 토픽분류 태스크에서 우수한 성능을 보였고, NSP모델의 특성을 반영한 헤드기반 텍스트 분류에서는 자연어추론 태스크에서 우수한 성능을 보였다.

  • PDF

과학교과서의 학년 간 언어적 특성 분석 -텍스트 정합성을 중심으로- (An Analysis of Linguistic Features in Science Textbooks across Grade Levels: Focus on Text Cohesion)

  • 류지수;전문기
    • 한국과학교육학회지
    • /
    • 제41권2호
    • /
    • pp.71-82
    • /
    • 2021
  • 교과서를 통한 학습의 효율성을 최대화하기 위해서는 교과서에 수록된 텍스트 특성이 예상된 학습자의 특성(i.e., 언어적 및 인지적 능력, 배경지식 수준)에 따라 체계적으로 조절되어야 한다. 이에 따라 현재 연구에서는 과학교과서 개발에 이러한 체계적인 원칙이 반영되어 있는지를 알아보기 위하여 중학교 1, 2, 3학년 과학교과서의 학년 간 언어적 특성을 비교 분석하였다. 구체적으로 한국어 분석 프로그램인 Auto-Kohesion 시스템을 활용하여 기존 텍스트 분석 연구에 많이 활용되었던 텍스트 표층 구조 측정치, 어휘 관련 측정치, 통사적 복잡성 측정치와 같은 피상적 측정치에 더하여 여러 정합성 관련 측정치(e.g., 명사 반복, 접속사, 대명사)를 분석하였다. 주요 분석 결과, 대체로 어절 및 문장 길이, 어휘 빈도와 같은 피상적으로 두드러지는 특성에 대해서는 학년이 증가함에 따라 텍스트 복잡도가 상승하는 방향으로 단계적으로 조절이 이루어졌지만, 그 외의 많은 언어적 특질에 대해서는 체계적으로 조절되지 않은 것으로 나타났다. 특히 여러 정합성 측정치들이 교과서 개발 과정에서 충분히 고려되지 않은 것으로 시사되었다. 이러한 결과는 저학년 학습자들이 교과서를 사용할 때 발달 단계에 맞지 않는 어려운 텍스트를 접할 가능성이 있어서 학습 의욕 및 효율성 저하 현상이 발생할 수 있다는 것을 제시한다. 아울러 고학년 교과서가 고등 교육을 대비하여 더욱 복잡한 텍스트를 처리할 수 있는 능력을 개발시키기 위한 용도로 적절하지 않을 수 있음을 시사한다. 본 연구는, 추후 교과서 개발 과정에서, 예상된 독자 특성의 변화에 따라 정합성 측정치를 포함한 여러 언어적 특성이 단계적으로 조절되어야 함을 제안한다.

언어변이와 세계영어들 (Language Variation and World Englishes)

  • 김양순
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.234-239
    • /
    • 2021
  • 본 연구는 언어의 본질인 언어변이의 주된 방향성을 탐색하고 언어변이의 결과로 나타나는 영어의 모든 방언들, 즉 세계영어들을 연구하는 것이다. 특정지역에서 사용되는 지역적, 사회적 방언의 연구인 언어변이의 특성을 규명하기 위하여 하이브리드 언어변이모델을 제안한다. 사회적 거리두기, 대면과 비대면 소통모드, 그리고 언어적 다양성이라는 세 가지 상호영향자의 관점에서 하이브리드 언어변이모델을 제안하고 언어변이의 결과로 나타나는 세계적 영어방언 현상인 세계영어들의 다양성 특질을 연구한다. 세계영어들의 문맥에서 지역화 목적으로 영어가 어떻게 사용되는가를 살펴보면, 사회적 거리두기가 높은 비대면의 상황에서는 다양성이 감소하여 좀 더 표준적이며 글로벌한 영어가 사용되며 변이가 줄어 세계영어들의 확장 속도가 완만해진다. 동시에 지역적인 사용이 줄어들어 의사소통의 오류도 줄어든다. 반면 사회적 거리두기가 낮은 대면의 상황에서는 세계영어들의 확장 속도가 빨라지고 변이의 형태가 다양해지며 의사소통의 오류 또한 증가한다. 이러한 영어변이 현상의 특성을 살펴보기 위하여 세계영어들의 핵심 원이라고 할 수 있는 영국영어, 미국영어, 그리고 캐나다영어의 언어적, 사회적 변이의 사례를 비교 분석한다.

청각장애아동의 특성에 적합한 웹기반 언어학습 시스템 연구 (A Study on the Web-based Language Learning System for Hearing Impaired children)

  • 금경애;권오준;김태석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.839-843
    • /
    • 2003
  • 듣고 발화하는 과정을 통해 언어를 재구성해가는 건청아동과는 달리 청각장애 아동은 청력의 상실로 인해 언어습득의 선천적 매커니즘이 작용될 수 없으며 이는 청각장애아동의 언어능력향상을 위한 웹기반언어학습이 의도적으로 구성되어야 항을 의미한다. 동작이나 상황을 나타내는 말을 동적으로 구현하여 사물 및 행동에 대한 관찰력을 증진시키고 주도적으로 상황언어를 익힐 수 있도록 유도하는 시스템 구성이 필요하며 대체사고 전략을 활용하고 얼굴표정과 반대어와 대비어를 강조해야 함이 웹기반 언어학습을 통한 청각장애아동의 문법적 오류를 감소시키는 효과적 방법임을 이 논문을 통해 제안하고자 한다.

  • PDF

CPS 모형으로 개발된 동물 발생 실험수업에서 나타난 과학영재의 특성에 따른 언어적 상호작용 분석 (The Analysis of The Science Gifted's Characteristics Present in Linguistic Interactions in The Animal Development Inquiry Activity Program Based on Creative Problem Solving(CPS) Model)

  • 안주현;전미란;박기석;전상학
    • 영재교육연구
    • /
    • 제20권1호
    • /
    • pp.107-130
    • /
    • 2010
  • 본 연구에서는 과학영재 학생들을 대상으로 생물 영역의 동물 발생 실험수업을 통해 나타나는 언어적 상호작용을 분석하여 과학영재성을 보여주는 특성들을 알아보고자 하였다. 연구 대상은 서울대학교 과학영재센터의 중학교 1학년 학생 20명이었으며, Creative Problem Solving (CPS) 모형을 기반으로 개발된 동물 발생 실험 프로그램으로 소집단 토의 중심의 실험 수업을 총 4회 진행하면서 학생들의 언어적 상호작용을 녹음 및 녹화, 관찰하였다. 전사된 내용으로부터 질문-응답 유형과 과학영재의 특성을 추출하여 분석하였다. 질문-응답의 유형 분석에서는 보다 높은 사고력을 요하는 사고형 질문이 기본정보형 질문보다 3~6배나 높게 나타났다. 특히, 탐구실험 I은 다른 세 탐구실험보다 기본정보형 및 사고형 질문이 40% 이상 높게 나타났다. 언어적 상호작용의 분석 결과 창의적 지필검사에서 보기 어려웠던 창의성의 세부 요인을 확인할 수 있었으며, 문제발견력 및 문제해결력, 고도의 언어능력 등을 확인하였고, 정의적 특성인 과제 집착력과 리더십도 드러나는 것을 볼 수 있었다. 본 연구 결과는 지필고사를 대신하는 영재의 판별 및 선발에서 활용할 수 있는 프로그램 개발에 실질적인 도움을 줄 수 있을 것으로 사료된다.

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

아동학대에서 발생하는 언어폭력에 영향을 미치는 심리사회적 요인에 관한 연구 (A Study on the Sociopsychological Factors Affecting Verbal Abuse of Children)

  • 김진영;강혜원;박지선
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.545-555
    • /
    • 2020
  • 본 연구는 아동학대 중 언어폭력과 관련이 있는 가해자의 특성 및 범행 특성에 대해 알아보고, 언어폭력에 영향을 미치는 심리사회적 요인에 대해 분석하고자 하였다. 본 연구는 전국 검찰청에서 조사를 통해 수집된 2010-2015년 사이 발생한 아동학대 사건 중 가해자의 언어폭력이 있었던 154건의 배경 및 범행 특성을 분석하고, 이를 언어폭력이 동반되지 않은 398건의 아동학대 사건들과 비교하여 살펴보았다. 그 결과 언어폭력이 나타난 아동학대 사건에서 남성 가해자의 비율이 높고, 가해자가 알코올 중독인 경우가 많으며, 가해자의 전과 또한 더 많은 것으로 나타났다. 더불어, 아동을 대상으로 언어폭력을 저지르는 가해자가 언어폭력이 동반되지 않은 사건의 가해자보다 적대적이고 통제적인 양육 태도를 보이고, 피해 아동을 형제나 친구 등과 차별하거나 편애하는 경우가 더 많았다. 마지막으로 아동학대의 예방 및 언어폭력의 심각성에 대한 인식 제고 및 정책적 노력을 위한 본 연구의 함의 및 한계점, 후속 연구에 대해 논의하였다.

퍼지추론에 의한 계층구조를 가진 품질의 정성적 평가 (Qualitative Evaluation of Quality with Hierarchical Structure Using Fuzzy Inference)

  • Kim, Jeong Man
    • 산업경영시스템학회지
    • /
    • 제20권43호
    • /
    • pp.37-46
    • /
    • 1997
  • 제품의 정성적 품질평가에서, 제품의 최종품질을 구성하는 다수의 특성에 대한 만족도가 언어로써 표현되어 소비자의 구매행동이란 의사결정으로 표출되는데, 이러한 주관적 평가에는 평가의 애매함(fuzziness)이 수반되므로 품질의 평가구조를 합리적으로 파악하기 위해서는 애매함의 존재를 고려에 넣지 않으면 안된다. 다수의 품질특성이 계층적(hierarchical)인 구조로 연결되어 최상위 품질특성으로 구성되며, 특성간의 중요도(relative importances)가 계층별로 결정되는 경우, 이들 개개의 특성에 대한 만족도의 평가로부터 어떤 구조적인 관계를 통해 그 제품에 대한 종합평가가 이루어지나, 개개의 특성에 대한 평가가 애매한 이상 최종 결과인 종합적 만족도도 애매한 것으로 된다. 즉, 평가모델의 구조도 평가의 패턴도 퍼지화되므로 이러한 평가에서 퍼지이론의 응용에 따른 효과를 가장 크게 기대할 수 있는 퍼지추론모델을 이용하여 계층간, 품질특성간의 퍼지관계와 특성의 중요도 및 언어변수(linguistic variables)의 형태로 주어지는 입력정보로써 품질구조를 명확히 하고, 패턴인식(pattern recognition)의 개념을 이용하여 평가자의 제품에 대한 평가결과를 언어로써 표현한다.

  • PDF

클라우드 컴퓨팅 서비스의 정보보호 실효성 증진을 위한 정보보호 정책의 언어적 특성 분석 (An Analysis of Linguistic Characteristics of Information Protection Policies to Improve the Effectiveness of Information Protection in Cloud Computing Services)

  • 정은한;김경일
    • 융합정보논문지
    • /
    • 제10권10호
    • /
    • pp.15-23
    • /
    • 2020
  • 클라우드 서비스 제공자가 어떠한 정보보호정책을 소비자에게 제시하고 있는지 이용자는 잘 모르고 있는 것이 현실이다. 클라우드 서비스 공급자가 제공하는 정보보호 정책의 내용과 언어적 특성을 분석하여 정보보호의 실효성을 향상시킬 수 있는 방안을 찾고자 함이 본 연구의 목적이다. 연구 목적 달성을 위하여 클라우드 서비스를 제공하는 47개사의 정보보호 정책의 내용을 조사하고 언어적 특성이 미치는 영향을 분석하여 클라우드 서비스의 효율성을 높일 수 있는 있는 방안을 마련하고자 한다. 연구결과를 통해 기술적 처리방법의 포괄적 표현 등으로 인한 낮은 가독성이 법적 분쟁의 소지는 물론 클라우드 서비스의 확산에 방해가 될 수 있는 요인으로 나타났다. 연구결과는 이용자들에게 제공하여야 할 사항들을 제언함으로써 정보보호의 실효성을 높일 수 있을 것이다.

중한 이메일 자동번역시스템 (A Chinese-Korean E-Mail Translation System)

  • 김운;권오욱;오영순;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-230
    • /
    • 2009
  • 본 논문에서는 중국어의 이메일 특성을 이용한 중한 대화체 자동번역 방법에 대하여 기술한다. 본 논문에서는 중국어와 한국어와 같이 언어 간의 어순이 다르고 이메일과 같이 특정한 도메인의 언어적 자원도 제한적인 특성을 고려하여 중국어 이메일 특성을 이용한 규칙 기반의 번역 방법을 시도하였다. 이를 위해, 본 논문에서는 중국어의 굳어진 표현이 많고, 한글자 단어 많으며, 입력 오류 많고, 청유 및 경어가 많은 이메일 특성 분석을 통해 그에 대응되는 처리 방법을 제안하였다. 그리고, 그 방법의 타당성을 증명하기 위해 규칙기반의 중한 뉴스 자동번역 시스템과 비교 실험을 하였으며, 규칙기반과 통계적 방법의 타당성 실험을 위해 Gmail과도 비교 실험을 하였다. 두 가지 비교 실험 결과, 본 논문에서 접근한 방법이 모두 우수하였으며, 그 타당성을 증명하였다.

  • PDF