• 제목/요약/키워드: 현대언어

검색결과 259건 처리시간 0.026초

MASS를 이용한 영어-한국어 신경망 기계 번역 (English-Korean Neural Machine Translation using MASS)

  • 정영준;박천음;이창기;김준석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.236-238
    • /
    • 2019
  • 신경망 기계 번역(Neural Machine Translation)은 주로 지도 학습(Supervised learning)을 이용한 End-to-end 방식의 연구가 이루어지고 있다. 그러나 지도 학습 방법은 데이터가 부족한 경우에는 낮은 성능을 보이기 때문에 BERT와 같은 대량의 단일 언어 데이터로 사전학습(Pre-training)을 한 후에 미세조정(Finetuning)을 하는 Transfer learning 방법이 자연어 처리 분야에서 주로 연구되고 있다. 최근에 발표된 MASS 모델은 언어 생성 작업을 위한 사전학습 방법을 통해 기계 번역과 문서 요약에서 높은 성능을 보였다. 본 논문에서는 영어-한국어 기계 번역 성능 향상을 위해 MASS 모델을 신경망 기계 번역에 적용하였다. 실험 결과 MASS 모델을 이용한 영어-한국어 기계 번역 모델의 성능이 기존 모델들보다 좋은 성능을 보였다.

  • PDF

표정과 언어 감성 분석을 통한 스트레스 측정시스템 설계 (A Design of Stress Measurement System using Facial and Verbal Sentiment Analysis)

  • 유수화;전지원;이애진;김윤희
    • KNOM Review
    • /
    • 제24권2호
    • /
    • pp.35-47
    • /
    • 2021
  • 끊임없는 경쟁과 발전을 요구하는 현대사회에는 다양한 스트레스가 존재하고 그 스트레스는 많은 경우 인물의 표정과 언어로 표현된다. 따라서 스트레스는 표정과 언어 분석을 통하여 측정할 수 있으며, 이를 효율적으로 관리하기 위한 시스템 개발이 필요하다. 본 연구에서는 표정과 언어 감성 분석을 통하여 스트레스를 측정할 수 있는 시스템을 제안한다. 인물의 표정과 언어 감성을 분석하여 주요 감성값 기준으로 스트레스 지수를 도출하고 표정과 언어의 일치성을 기준으로 통합 스트레스 지수를 도출하는 스트레스 측정 방법을 제안한다. 스트레스 측정기법을 통한 정량화, 일반화는 다수의 연구자가 객관적인 기준으로 스트레스 지수를 평가할 수 있도록 할 수 있다.

'공평한' 언어를 위하여 -독일어 개혁의 페미니즘적 노력- ($F\"{u}r$ eine 'gerechte' Sprache -Zu den feministischen $Bem\"{u}chungen$ um eine Reform des Deutschen)

  • 페터 슈미터
    • 한국독어학회지:독어학
    • /
    • 제3집
    • /
    • pp.5-34
    • /
    • 2001
  • 최근 구직광고, 시청, 정치 정당, 행정부처나 특정 일간지와 시사잡지의 최근 정보 팜플렛을 1981년 이전에 나온 관련 출판물들과 비교해보면 지난 20년 동안 현대 독일어 체계에서 주목할 만한 변화가 일어났으며 어느 정도 성과가 있었음을 어렵지 않게 알 수 있을 것이다. 언어의 실천 분야에서 1981년에 처음 나타난 이런 변화(vgl. Guentherodt, Ingrid / Hellinger, Marlis/Pusch, Luise F./Tromel-Plotz, Senta: Richtliruen 2ur Vermeidung sexistischen Sprachgebrauchs. In: Linguistische Berichte H. 71, 1981, 1-7)는 특히 어휘와 대명사 체계뿐 아니라 관사체계와 명사곡용과 관련된 변화에 대해서도 관심을 보이고 있다. 이런 언어변화는 계몽적 논문 그리고 '신 여성운동'과 그 결과로 나타난 '페미니즘 언어학'의 부단한 요구가 결정적이었다. 여기서 말하는 요구란 전통적인 언어체계에 머물러 있던 '성차별'을 없애고 독일어를 개혁함으로써 어휘와 문법에서 여성의 대표성을 감지할 수 있을 정도로 남성적-가부장적 관점의 지배적인 면을 없애고 '공평한 언어'를 만들어내는 것이었다. 궁극적으로 사람들은 이런 언어개혁을 통하여 여성의 사회적인 권리평등의 길을 마련하고 싶었다. 이 논문의 목적은 이런 복잡한 문제를 좀 더 알기 쉽게 밝혀보려는 것이다. 이를 위하여 첫 번째로 사회 정치적인 맥락에서 언어 개혁을 위한 노력을 살피고 언어 이론적인 토대를 질문하였다. 두 번째로 독일 페미니즘 언어학의 구체적인 역사적 기원을 간단히 살펴보았다. 세 번째로 개혁안을 자세히 논의하면서 체계적으로 정리하였다. 마지막으로 네 번째로는 개혁안과 그의 언어학적 기초에 대한 비판의 핵심 쟁점을 살피고, 찬반주장이 또 다른 분야로, 즉 한편으로 언어정책(찬성 주장) 분야로 다른 한편으로 체계언어학(반대 주장) 분야로 확대되기 때문에 언어개혁에 대한 페미니즘적 노력의 지지자와 반대자간의 논쟁에서 해결할 수 없는 것으로 보이는 문제를 테제로 제시하였다.

  • PDF

사이버시대의 소비문화 : 디지털폐인 문화를 중심으로

  • 김난도
    • 한국복식학회:학술대회논문집
    • /
    • 한국복식학회 2004년도 제29회 정기총회 및 춘계학술대회
    • /
    • pp.3-12
    • /
    • 2004
  • $\square$ 디지털폐인 탐구 -폐인, 언어, 리플문화, 사진합성, 그외 작품활동 등 $\square$ 어떻게 읽을 것인가 -가상공간은 포스트 모더니즘의 현대 소비문화가 식민화된 형태 - 폐인사이트 요소분석과 심층인터뷰를 통한 포스트모더니티 분석 $\square$ 소비문화적 함의 - 능동적 소비문화 - 대항적 소비문화 - 키치적 소비문화 (중략)

  • PDF

KDC 제4판 언어 및 문학류 전개의 개선방안 (Suggestions for the Gasses Language and Literature of the 4th Edition of Korean Decimal Classification)

  • 오동근;배영활;여지숙
    • 한국문헌정보학회지
    • /
    • 제42권4호
    • /
    • pp.141-157
    • /
    • 2008
  • 이 연구에서는 KDC 제4판 언어류와 문학류의 분류항목들을 개선하기 위해, 언어류와 문학류의 본표 항목과 조기표 항목을 분석하여 개선을 위한 구체적인 방안을 제시하였다. 그 개선방안은 한국문학과 영미문학의 시대구분을 위한 새로운 분류항목의 설정, 불합리하게 설정된 언어정책 및 언어행정의 해당언어의 역사 아래로의 이치, 각국 언어 및 문학의 부적합한 명칭표기의 조정, 표준구분의 적용과 의미파악에 어려움이 있는 주기에 대한 추가주기의 설정 및 보완, 2개국어사전의 분류규정의 변경, 한국 현대소설의 주제세분을 비롯해 영국문학과 미국문학의 구분을 위한 선택조항의 적용, 그리고 기타 아시아 제어 아래의 드라비다어와 기타 제어 아래의 켈트어, 셈어족, 함어족 하위 분류항목 등 세분전개가 불필요한 항목의 주기화 등으로 요약할 수 있다.

대규모 언어모델 활용을 통한 통계자료 처리 및 온라인 가격지표 개발 방법론 연구 (Utilizing Large Language Models(LLM) for Efficient Online Price Index Development and Statistical Data Processing)

  • 오교중;최호진;안현각;김일구;차원석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-104
    • /
    • 2023
  • 본 연구는 현대 사회에서 빅데이터의 중요성이 강조되는 가운데, 온라인 시장의 확장과 소비자들의 다양한 소비 행태 변화를 반영한 가격지표 개발을 목표로 한다. 통계청의 기존 통계조사 방법론에 대한 한계를 극복하고, 온라인 쇼핑몰 데이터에서 필요한 정보를 추출하고 가공하기 위해 대규모 언어 모델(LLM)을 활용한 인공지능 기술을 적용해보고자 한다. 초기 연구 결과로 공개 Polyglot을 활용하여 비정형 자료 처리와 품목분류에 응용해 보았으며, 제한된 학습 데이터를 사용하여도 높은 정확도의 처리 결과를 얻을 수 있었으며, 현재는 적용 품목을 확장하여 더욱 다양한 품목에 방법론을 적용하는 연구를 진행 중이다.

  • PDF

한국어 텍스트에 사용된 이음표의 자동 전사 (Automatic Transcription of the Union Symbols in Korean Texts)

  • 윤애선;권혁철
    • 한국언어정보학회지:언어와정보
    • /
    • 제7권1호
    • /
    • pp.23-40
    • /
    • 2003
  • In this paper, we have proposed Auto-TUS, an automatic transcription module of three union symbols-hyphen, dash and tilde (‘­’, ‘―’, ‘∼’)-using their linguistic contexts. Few previous studies have discussed the problems of ambiguities in transcribing symbols into Korean alphabetic letters. We have classified six different reading formulae of the union symbols, analyzed the left and right contexts of the symbols, and investigated selection rules and distributions between the symbols and their contexts. Based on these linguistic features, 86 stereotyped patterns, 78 rules and 8 heuristics determining the types of reading formulae are suggested for Auto-TUS. This module works modularly in three steps. The pilot test was conducted with three test suites, which contains respectively 418, 987 and 1,014 clusters of words containing a union symbol. Encouraging results of 97.36%, 98.48%, 96.55% accuracy were obtained for three test suites. Our next phases are to develop a guessing routine for unknown contexts of the union symbols by using statistical information; to refine the proper nouns and terminology detecting module; and to apply Auto-TUS on a larger scale.

  • PDF

객체지향형 교육용 프로그래밍 언어 '두리틀(Dolittle)'의 수학 교육-학습 활용 방안

  • 황우형;김경미
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제19권1호통권21호
    • /
    • pp.215-240
    • /
    • 2005
  • 본 논문은 최근 일본에서 개발된 객체지향형 교육용 프로그래밍 언어(EPL: Educational Programming Language) '두리틀(Dolittle)'을 소개하고, 두리틀을 수학 교수-학습에 활용하기 위한 최초의 연구이다. 두리틀은 LOGO의 거북 그래픽스(Turtle Graphics)와 인크리멘탈(Incremental) 프로그래밍 방식, 즉각적인 피드백 등 많은 교육적 이점을 수용하고, 현대 프로그래밍의 고급 기능들을 프로토타입(Prototype) 방식을 통해 어린 학생들도 쉽게 이해할 수 있게 한 텍스트기반의 한글 교육용 프로그래밍 언어이다. 본 논문에서는 LOGO와 두리틀의 활용 비교를 통하여 두리틀을 소개하고, 두리틀을 이용한 기하와 함수의 교수-학습을 위하여 연구자가 고안한 기하판과 좌표판, 삼각함수판의 활용 방안을 제안하고, 그 교수-학습에서 발생하는 문제점을 해결하기 위한 몇 가지 아이디어를 제안하고자 한다.

  • PDF

현대 연극에 나타난 언어의 위기 및 그 한계 (The function of language and its limitations in the Modern theater)

  • 양기찬
    • 인문언어
    • /
    • 제8집
    • /
    • pp.79-93
    • /
    • 2006
  • The modern play is going through a change that is differentiating it from the plays of yesterday. The importance of narration through language, specifically that of words spoken on stage as a means of communication is being replaced by images and minimalism of words. The narration that depended on spoken words today depends more on the images that are conjured on stage. This movement shows also the very development of stage and its craft in the domain of theater and especially holds true in the avant-garde theaters of today. The avant-garde theater, in trying to duplicate the reality does not confine itself to oratory rhetorics that we see in the traditional plays of the past but expresses itself by mimicking the reality to the utmost possible.

  • PDF

신조어 자동 추출 방법론과 신어 조사 도구의 개발 (Methodology and Implementation of Detecting Tool for New Words Occurring in Korean Document)

  • 이상곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.271-276
    • /
    • 2009
  • 신조어 조사용 프로그램은 웹에 실시간으로 등록되는 언론 기사를 수집하는 웹 에이전트를 개발하여 텍스트를 추출하고, 간단한 어휘 분석을 통하여 국어사전에 등록된 표제어와 이미 연구자가 발견한 기존의 신조어를 제외하고, 현대의 사회상을 잘 표현하는 새로 생성된 신조어를 추출하는 작업을 하는 도구이다. 인터넷의 언론 사이트에서 규칙적인 URL 패턴을 발견하고 뉴스 기사를 수집한다. HTML 소스 분석을 통하여 언론 기사만을 추출하여 국어 전공자가 신어를 찾아내는 작업을 도와주는 조사 도구를 설계하고 구현하였다.

  • PDF