• 제목/요약/키워드: Universal language

검색결과 179건 처리시간 0.025초

Enhancing LoRA Fine-tuning Performance Using Curriculum Learning

  • Daegeon Kim;Namgyu Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.43-54
    • /
    • 2024
  • 최근 언어모델을 활용하기 위한 연구가 활발히 이루어지며, 큰 규모의 언어모델이 다양한 과제에서 혁신적인 성과를 달성하고 있다. 하지만 실제 현장은 거대 언어모델 활용에 필요한 자원과 비용이 한정적이라는 한계를 접하면서, 최근에는 주어진 자원 내에서 모델을 효과적으로 활용할 수 있는 방법에 주목하고 있다. 대표적으로 학습 데이터를 난이도에 따라 구분한 뒤 순차적으로 학습하는 방법론인 커리큘럼 러닝이 주목받고 있지만, 난이도를 측정하는 방법이 복잡하거나 범용적이지 않다는 한계를 지닌다. 따라서, 본 연구에서는 신뢰할 수 있는 사전 정보를 통해 데이터의 학습 난이도를 측정하고, 이를 다양한 과제에 쉽게 활용할 수 있는 데이터 이질성 기반 커리큘럼 러닝 방법론을 제안한다. 제안방법론의 성능 평가를 위해 국가 R&D 과제 전문 문서 중 정보통신 분야 전문 문서 5,000건, 보건의료전문 문서 데이터 4,917건을 적용하여 실험을 수행한 결과, 제안 방법론이 LoRA 미세조정과 전체 미세조정 모두에서 전통적인 미세조정에 비해 분류 정확도 측면에서 우수한 성능을 나타냄을 확인했다.

다언어주의와 언어교육정책 (Mutilingualism and Language Education Policy)

  • 김양순
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.321-326
    • /
    • 2020
  • 우리는 이 연구에서 다언어주의 맥락에서의 지속가능한 언어교육정책을 고찰하고자 한다. 인구의 다수가 다언어적이므로 다언어구사자들이 기준이 되는 다언어정책이 교육에서 우리가 채택할 수 있는 최선의 방법이다. 전통적으로 다언어사회였던 미국의 언어교육정책을 분석하여 한국사회의 언어교육정책에 관한 시사점을 모색하고자 한다. 다언어교육정책의 채택 동기와 정당성을 지속가능성, 정체성, 공정성, 세계영어, 기계번역, 그리고 보편문법이라는 6 가지 다른 관점에서 분석한다. 언어정책의 모델로 미국에서는 영어플러스(영어+n) 정책을 제안하며, 유사하게 한국에서는 한국어플러스(한국어+n) 정책을 언어교육현장에서의 최선의 언어정책모델로 제안한다. 이러한 플러스(+n)정책은 모국어와 해당국가의 다언어주의를 형성하는 다른 외래어 둘 다의 유창성을 목표로 하며 이때 다언어정책은 이중언어정책도 포함한다. 특히 4차 산업혁명시대의 맥락인 다양성과 융합의 시대에 언어다양성과 다언어정책은 해결해야할 문제가 아니라 보호되고 유지되어야할 권리이며 자산으로 간주되어야하고 언어교육정책 또한 다언어주의의 관점에서 다루어져야 한다.

한자(漢字)의 언어적 특성과 『논어(論語)』 읽기 (The linguistic characteristics of Chinese character and Reading for the Analects of Confucius)

  • 김상래
    • 한국철학논집
    • /
    • 제30호
    • /
    • pp.191-225
    • /
    • 2010
  • 이 논문은 한자(漢字)의 다의성(多義性)과 품사(品詞)의 비결정성(非決定性)에 초점을 맞추어 "논어(論語)" 해독을 시도하였다. 먼저, 이 글은 한자가 인간과 세계에 대한 문제를 표현하는 사유의 언어(다른 말로 철학언어)로서 제 기능을 할 수 있는가? 는 물음에 대한 본격적인 논의를 전개하였다. 16세기 마테오 리치는 보편적인 '표의문자체(ideographic script)'의 가능성을 한자에서 발견하려고 노력함으로써 이 물음에 긍정적인 답변을 제시하였다. 반면, 헤겔과 하이데거 등은 한자는 첫째, 전치사와 관사가 없는 언어체계이며, 둘째, 이중의미, 반대의미를 표시하는 단어가 없으며, 셋째, 어형변화 없이 어순에 의해서만 의미를 표현, 전달하기 때문에 복잡한 인간의 사유와 엄밀한 논리를 표현하는 철학 언어로서 부적합하다고 주장한다. 그러나 카시러와 울만, 소쉬르, 그리고 데리다 등의 언어관을 경유하면서, 우리는 헤겔과는 다른 입장에서 한자의 사유언어로서의 기능을 발견할 가능성을 확인한다. 서양의 언어체계와 달리 한자는 언제나 개별적으로 존재하는 단어들의 의미 보다 문맥에서의 언어 기능이 보다 중요하다. 한자는 고유의 품사를 감추고, 다른 문자들과의 관계망 속에서 어떤 사건과 사물의 의미를 표현하면서 자신의 본색을 드러낸다. 한자는 이른바 '불가결정성(indecidability)'의 언어인 것이다. 이러한 한자의 다의성과 품사의 부재는 바로 '불가결정성'에 기인한다. 이렇게 본다면, 비록 전치사, 관사, 어형변화, 품사 등을 결여하는 있는 문자체계일지라도 '다의(多義)'의 특성을 지닌 한자는 인간의 복잡한 사유를 나름의 방식으로 표현하는 철학언어로서 충분한 기능을 할 수 있는 것이다. 이를 토대로 "논어(論語)"읽기의 다양성을 담보할 수 있을 것이다.

UDC의 적용분야에 관한 연구 (An Analysis of the Applicable Fields of UDC)

  • 이창수
    • 한국도서관정보학회지
    • /
    • 제35권4호
    • /
    • pp.1-21
    • /
    • 2004
  • 이 연구는 UDC의 최근동향을 보다 체계적으로 이해하는데 도움이 되고자 UDC의 역사적 배경과 그 분류표의 유지관리 및 개정, 그리고 UDC가 최근에 어떻게 적용되고 있는지에 대하여 살펴보았다. UDC는 1905년이래 발전을 거듭하여, 현재 UDCC가 관리를 하며 전자적으로 이용가능 한 MRF를 매년 갱신함으로 써 최신성을 유지하고 있다. UDC는 기호의 생략정도에 따라 표준판, 확장판, 간략판으로 출판하고 있으며, 온라인 상에서도 UDC를 이용할 수 있다. UDC는 현재 서가배열, SDI 서비스, 서지의 주제별탐색, 교환언어로서 또는 인터넷상에서의 주제 게이트웨이와 메타데이터, 자동분류 등에 적용되고 있다.

  • PDF

미국 원주민 문학과 보편성 문제-실코의 『의식』을 중심으로 (Native American Literature and the Question of Universality Focusing on Silko's Ceremony)

  • 김지영
    • 영미문화
    • /
    • 제14권2호
    • /
    • pp.97-125
    • /
    • 2014
  • This paper delves into the question of universality in Native American Literature focusing on Leslie Marmon Silko's Ceremony, exploring some different definitions of universality and looking at the work in the light of these definitions. In this paper I proposed four possible definitions or faces of universality applicable to the narrative of the oppressed people. Firstly, the colonizers indoctrinate their colonized persons with the colonialists' beliefs through the process of assimilation purposefully imposed in the name of universality. In Ceremony Rocky and Emo are the victims of assimilation including militarization. Secondly, the colonized people hold on to their traditional values in face of colonizers' universalism. In Ceremony Tayo shows an attachment to tribal stories in opposition to whites' lies. Thirdly, the colonized can get together by sharing experiences of violence, occupation, and loss of their land and language, forming a bond of "commonality" among them. In Ceremony the story of a medicine man, Betonie, suggests oneness of victims against the evil power of destroyers represented by nuclear bombs. Fourthly and lastly, the universal consists in the subject's trial and practice attempting to achieve universalism against the existing order, not in the stipulation defining what is universal. In the story Tayo endeavors to retrieve his cattle by transgressing whites' property and makes a hole in the established dichotomy of whites and Indians. In sum, Ceremony as a minor literature shows the developmental aspects of universality, culminating in Tayo's refusal to assimilate himself to whites' lies.

딥러닝을 이용한 법률 분야 한국어 의미 유사판단에 관한 연구 (Deep Learning Based Semantic Similarity for Korean Legal Field)

  • 김성원;박광렬
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.93-100
    • /
    • 2022
  • 기존의 데이터 검색 방법으로는 키워드 중심의 검색 방법이 주로 사용되나, 이는 전문적인 용어가 많이 쓰이는 법률 분야의 검색 방법으로는 적합하지 않다. 이에 대해 본 논문에서는 법률 분야의 효과적인 데이터 검색 방안을 제안한다. 법률 도메인의 자연어처리 분야에서 문장 간의 유사성을 판단하는 데 최적화된 임베딩 방법에 관하여 서술한다. 법률문장을 TF-IDF를 이용하여 키워드 기반으로 임베딩하거나 Universal Sentence Encoder를 이용하여 의미 기반으로 임베딩을 한 후, BERT모델을 결합하여 법률 분야에서 문장 간 유사성을 검사하여 데이터를 검색하는 최적의 방안을 제안한다.

보편적 학습 설계에 근거한 영어과 디지털 교과서 개선 방안 (Prospective Changes of English Digital Textbook Based on the Universal Design for Learning)

  • 김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제15권7호
    • /
    • pp.674-683
    • /
    • 2015
  • 본 연구의 목적은 보편적 학습 설계 준거를 제시하고 이 준거를 활용하여 현재 실험학교에서 운용되고 있는 영어과 디지털교과서를 분석함에 있다. 보편적 학습 설계 준거를 기준으로 디지털 교과서가 학년과 학급급간에 의사소통기능별로 어떠한 양상을 보이고 있는지를 분석하여 디지털 교과서의 개선 방향을 모색하고자 한다. 디지털 교과서의 분석 결과를 살펴보면 우선 학습자들 중에 언어적 적성이 있는 학생들에게 친화적인 환경으로 구성되어 있고 다른 적성의 학생들은 불리하게 구성되어 있어서 이를 보완할 필요가 있다. 어휘의 계열성은 학년이 올라감에 따라서 적절하게 복잡도가 증가하고 있으나 통사적 복잡성은 중학교에서 갑자기 문장당 어휘수가 급격하게 올라가면서 보편적 학습 설계 준거를 만족시키지 못하고 있어서 이에 대한 보완이 시급하다. 서책형 교과서와 달리 디지털 교과서는 멀티미디어 자원의 통합이 용이하고 볼륨의 제한을 받지 않기 때문에 근본적으로 디지털 교과서를 구성할 때에 이를 사용하는 학습자들이 가진 언어적 적성 외에 다양한 적성을 고려할 필요가 있다.

청각장애인을 위한 의사소통 시스템 디자인 연구 (A Study on the Communication System Design for Auditory Disabled)

  • 양승호;송지원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1172-1175
    • /
    • 2009
  • 본 연구는 청각장애인들의 통신기기에 대한 요구를 발견하고 이를 제품 및 인터페이스 개발에 반영함으로써 청각장애인들의 의사소통에 대한 문제를 해결하고자 한 디자인 연구이다. 청각장애인들과 통역사들에 대한 3회의 FGI를 통하여 청각장애인들의 일상생활에서의 의사소통 방법, 의사소통을 위한 도구의 사용, 그리고 소통에 대한 요구 등을 이해하고, 이들의 효과적인 의사소통을 가능하게 하는 방법 및 체계를 제안하였다. 이를 바탕으로 의사소통 시스템을 제안하고, 원격 통역서비스 및 전화 중개통역 서비스를 포함한 청각장애인과 건청인간의 실시간 의사소통을 효과적으로 지원할 수 있는 의사소통 시스템의 기능적 측면, 수화영상통화와 디지털 필담 및 문자 메시지에서 청각장애인들의 의사소통의 특성을 반영하여 디자인된 인터페이스의 측면, 그리고 수화영상통화 및 청각장애인들의 일상생활에서 발생되는 문제점들을 해소하기 위한 도구의 하드웨어 디자인 측면에서 청각장애인들의 요구사항을 반영하기 위한 디자인 대안의 탐색이 이루어졌다. 제안된 디자인 안은 사용자 평가를 통하여 청각장애인들의 요구에 부합함을 검증하고 개발을 위한 디자인의 구체화 단계에 있다.

  • PDF

영어의 수의적 주어 현상의 인지적 양상 (A Cognitive Aspect of Optional Subjecthood in English)

  • 송홍기;문승철
    • 인지과학
    • /
    • 제18권1호
    • /
    • pp.35-56
    • /
    • 2007
  • 이 논문의 목표는 첫째, 고대, 중세, 현대 영어에 나타나는 수의적 주어 현상을 다양한 문헌에 기초하여 기술적으로 자세히 고찰하고 역사적 변화에 대한 동기를 살펴보며, 둘째, 최근 영어사 연구에서 큰 역할을 하고 있는 인지적 제약(constraints)에 기반하여 수의적 주어 현상의 역사적 변화에 대한 원리적인 설명을 하는 것이다. 영어사에서 두 유형의 주어 생략-영 주어(pro) 탈락과 등위절 주어-이 고대, 중세, 및 현대 영어에 나타났는데, 고대 영어는 풍부한 굴절 체계의 영향으로 영주어 탈락과 등위절 주어 생략이 다 같이 나타났고, 굴절이 많이 약화된 중세영어에는 여전히 이 두 현상이 나타났으나 발생정도가 점점 감소 추세였으며, 따라서 소유격과 대명사를 제외하고는 굴절이 상실된 현대 영어에서는 영주어 탈락과 등위절 주어 생략 그 자체가 거의 사라지게 되었다. 이 논문에서는 영어발달사적 관점에서 고대, 중세, 현대 영어의 주어 생략현상이 문법적 측면에서 세 가지 제약들의 위계(hierarchy) 변화로 발생하였고, 형태적 측면에서는 굴절체계의 변화로 발생하였음을 보였다.

  • PDF

언어상대성 원칙의 역사 인식론적 토대 -문화 언어학을 위한 서설- (Epistemologico-Historic Foundations of Linguistic Relativity)

  • 김성도
    • 인문언어
    • /
    • 제2권1호
    • /
    • pp.7-42
    • /
    • 2002
  • This paper reexamines ideas about linguistic relativity in the light of new interest in the theoretical climate. The original idea is based on the incommensurability of the semantic structures of different languages. On this view, language, thought, culture are deeply interconnected, so that each language might be associated with it a distinctive world view. Throughout this work I utilize the historico-epistemological standpoint to dissect the conceptual structure of this principle. In the introduction I will of for a justification of choice of the theme. Section 1 will address some essential definition of the linguistic principle and insist on the necessity to elaborate a typological spectrum of relativism and universalism. In the second section some important landmarks of linguistic relativity were marked from Plato to Humboldt via Condillac and Herder. 1 will subdivide the relativity hypothesis into 3 theses which are interlated. In the final section the epistemological structure of the linguistic principle will be analysed in some detail by providing my exposition of Sapir-Whorf hypothesis. By way of conclusion I will present the works of Wierzbicka who demonstrated the lexicons of different languages suggest different conceptual universes. By rejecting analytical tools derived from the English language she proposed instead a natural semantic metalanguage based on lexical universals, which is made up of universal semantic primitives. In this paper we attempted to construct a general problematics of linguistic relativity, focolizing on the Sapir-Whorf hypothesis. We devided this very problematic question into its ontological and epistemological dimensions. In particular the ambivalance of Whorf's relativity is discussed in some detail. Also, an archeological survey of this subtle question on the relation between language, thinking and culture was provided. (from Aristotle to Humboldt, via Condillac and Nitzche). In conclusion this investigation underlines the necessity of preparing the cultural linguistics to enlarge the scope of contempory linguistics.

  • PDF