• 제목/요약/키워드: Language Training

검색결과 685건 처리시간 0.024초

거대언어모델에 대한 원자력 안전조치 용어 적용 가능성 평가 (A Training Feasibility Evaluation of Nuclear Safeguards Terms for the Large Language Model (LLM))

  • 윤성호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.479-480
    • /
    • 2024
  • 본 논문에서는 원자력 안전조치 용어를 미세조정(fine tuning) 알고리즘을 활용해 추가 학습한 공개 거대 언어모델(Large Language Model, LLM)이 안전조치 관련 질문에 대해 답변한 결과를 정성적으로 평가하였다. 평가 결과, 학습 데이터 범위 내 질문에 대해 학습 모델은 기반 모델 답변에 추가 학습 데이터를 활용한 낮은 수준의 추론을 수행한 답변을 출력하였다. 평가 결과를 통해 추가 학습 개선 방향을 도출하였으며 저비용 전문 분야 언어 모델 구축에 활용할 수 있을 것으로 보인다.

  • PDF

Domain-Adaptation Technique for Semantic Role Labeling with Structural Learning

  • Lim, Soojong;Lee, Changki;Ryu, Pum-Mo;Kim, Hyunki;Park, Sang Kyu;Ra, Dongyul
    • ETRI Journal
    • /
    • 제36권3호
    • /
    • pp.429-438
    • /
    • 2014
  • Semantic role labeling (SRL) is a task in natural-language processing with the aim of detecting predicates in the text, choosing their correct senses, identifying their associated arguments, and predicting the semantic roles of the arguments. Developing a high-performance SRL system for a domain requires manually annotated training data of large size in the same domain. However, such SRL training data of sufficient size is available only for a few domains. Constructing SRL training data for a new domain is very expensive. Therefore, domain adaptation in SRL can be regarded as an important problem. In this paper, we show that domain adaptation for SRL systems can achieve state-of-the-art performance when based on structural learning and exploiting a prior model approach. We provide experimental results with three different target domains showing that our method is effective even if training data of small size is available for the target domains. According to experimentations, our proposed method outperforms those of other research works by about 2% to 5% in F-score.

분산 음성인식 시스템의 성능향상을 위한 음소 빈도 비율에 기반한 VQ 코드북 설계 (A VQ Codebook Design Based on Phonetic Distribution for Distributed Speech Recognition)

  • 오유리;윤재삼;이길호;김홍국;류창선;구명완
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.37-40
    • /
    • 2006
  • In this paper, we propose a VQ codebook design of speech recognition feature parameters in order to improve the performance of a distributed speech recognition system. For the context-dependent HMMs, a VQ codebook should be correlated with phonetic distributions in the training data for HMMs. Thus, we focus on a selection method of training data based on phonetic distribution instead of using all the training data for an efficient VQ codebook design. From the speech recognition experiments using the Aurora 4 database, the distributed speech recognition system employing a VQ codebook designed by the proposed method reduced the word error rate (WER) by 10% when compared with that using a VQ codebook trained with the whole training data.

  • PDF

러시아 사할린 지역의 언어 환경과 한국어교육 문제 연구 (A study on Language Environment and Korean Language Education problems in Sakhalin, Russia)

  • 조현용;이상혁
    • 한국어교육
    • /
    • 제23권1호
    • /
    • pp.257-282
    • /
    • 2012
  • Sakhalin, Russia is a very specific area for Korean language education. The imposed separation and isolation in this region means the language in Sakhalin is mixed with South Korean, North Korean, Gyeongsang Province dialect, Japanese, and Russian. Scrutiny of the use of the actual language of Sakhalin Koreans is needed, and it is required in supporting Korean language education. In this study, I will cover: 1. Approach should differ depending on the situation of Korean, foreigners, Korean Language School(Hangeul Hakgyo) and Korean classes in local Schools. 2. Tailor-made textbooks for Sakhalin are required. 3. Korean textbooks to match local circumstances are needed. There should be a basic writing text written by a local Korean department professor and supervision or modification, supplements from Korean language education researchers in Korea. 4. Enlarged Korean training programs are needed. Furthermore, if Korean and Russian university students are to study in Korea, there should be programs offering a dual degree among other things. 5. Methodical, overall examination of overseas Korean regions like Sakhalin is necessary. Also in the case of far east Russia, connectivity between Vladivostok, Khabarovsk and Sakhalin needs to be strengthened.

멀티미디어 수화 콘텐츠의 Semantic Logic 플랫폼 연구 (A Study on Semantic Logic Platform of multimedia Sign Language Content)

  • 정회준;박대우;한경돈
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.199-206
    • /
    • 2009
  • 초고속 인터넷의 발달로 멀티미디어 수화 콘텐츠가 청각장애인의 수화교육에 활용되고 있다. 수화교육에서 사용되는 대부분 콘텐츠는 한글단어에 대한 수화표현을 수화동영상으로 보여주는 내용이다. 수화를 처음 배우거나, 수화에 익숙하지 않은 사용자들은 수화특성을 이해하기 어렵고, 수화표현에 어려움을 나타내고 있다. 본 논문에서는 온라인에서 수화표현을 학습하기 위해서 수화가 가지고 있는 특성을 참고하고, Semantic Logic을 적용한 멀티미디어 동영상기반의 수화 콘텐츠 모형에 대한 플랫폼 설계를 연구하고자 한다.

Considerations Regarding the Application of IMO Maritime English Model Course 3.17 in Korean Contexts

  • Choi, Seung-Hee;Park, Jin-Soo
    • 한국항해항만학회지
    • /
    • 제40권5호
    • /
    • pp.299-304
    • /
    • 2016
  • The importance of clear and effective communication at sea has been greatly emphasized due to the increase in multiculturalism on board both ocean-going and coastal vessels, and the necessity of systematic English training based on 'Knowledge, Understanding, and Proficiency' specified in STCW has also been recognized. With these growing needs in mind, the International Maritime Organization (IMO) updated the Maritime English (ME) Model Course 3.17 in 2015 by providing guidelines on language education within two separate categories, General Maritime English (GME) and Specialized Maritime English (SME). The IMO is now attempting to create a new, global framework of ME education and training, and this this new course model must first be thoroughly understood in order to explore the ways to apply the modified version into the context of current ME education in Korea and to design an updated language curriculum. Therefore, the general structural features of the new model course will be explained in this paper, and the course focus set by IMO and to be considered and/or adopted by the Republic of Korea will be closely examined. Finally, suggestions will be made on how to implement this revised model course in practice with the following focus: the development of localized curriculum for GME and SME; the provision of practical teaching guidance through relevant online and offline materials for class and self-study; and the establishment of qualification guidelines and a teaching support system for language teachers in maritime and language education.

국제 스포츠 행사를 위한 영어교육 방안 (English Education for International Sports Events)

  • 김지은;유호
    • 한국콘텐츠학회논문지
    • /
    • 제15권6호
    • /
    • pp.589-596
    • /
    • 2015
  • 본 연구는 (1) 2018 평창 동계 올림픽 영어 교육 준비 실태를 파악하고 (2) 영어 교육 활성화를 위한 영어 교육 프로그램에 대한 요구를 파악하여, 국제 스포츠행사를 위한 효과적인 영어교육 방안을 모색하는 것을 목적으로 하였다. 이를 위하여 국제스포츠 행사 교육 관리 관계자와 전화 인터뷰를 하거나 자료를 제공받았고 그 결과, 조직위에서는 2018 평창동계올림픽대회 관계자 영어 교육 프로그램을 진행 중이며, 강릉시에서는 글로벌리더나 통역봉사단 등을 대상으로 하는 교육과 일반 시민을 대상으로 하는 교육으로 나누어 언어 교육을 진행하고 있다는 것을 알 수 있었다. 또한 강릉시 글로벌리더 양성과정에 참여하고 있는 학습자들과 최근 국제 스포츠 행사에 자원봉사자로 참여한 26명을 대상으로 국제 스포츠 행사 영어 교육을 위한 설문을 한 결과, 국제 스포츠 행사와 관련된 내용을 가르치는 영어교육 수업이나 이에 가장 적합한 수업 방법에 대한 요구가 크다는 것을 알 수 있었다, 따라서 본 연구에서는 영어 잘하는 사람들을 최대한 잘 활용하기 위해 DB구축을 체계적으로 잘하고, 이들이 선발된 이후에는 단기간 동안 본인이 맡은 봉사 직무에 바로 활용할 수 있는 영어교육을 제공받을 수 있도록 해야 할 것이며, 이를 위해서는 이에 적합한 교수법과 교수 내용을 개발할 필요가 있다고 제언한다.

추가 사전학습 기반 지식 전이를 통한 국가 R&D 전문 언어모델 구축 (Building Specialized Language Model for National R&D through Knowledge Transfer Based on Further Pre-training)

  • 유은지;서수민;김남규
    • 지식경영연구
    • /
    • 제22권3호
    • /
    • pp.91-106
    • /
    • 2021
  • 최근 딥러닝 기술이 빠르게 발전함에 따라 국가 R&D 분야의 방대한 텍스트 문서를 다양한 관점에서 분석하기 위한 수요가 급증하고 있다. 특히 대용량의 말뭉치에 대해 사전학습을 수행한 BERT(Bidirectional Encoder Representations from Transformers) 언어모델의 활용에 대한 관심이 높아지고 있다. 하지만 국가 R&D와 같이 고도로 전문화된 분야에서 높은 빈도로 사용되는 전문어는 기본 BERT에서 충분히 학습이 이루어지지 않은 경우가 많으며, 이는 BERT를 통한 전문 분야 문서 이해의 한계로 지적되고 있다. 따라서 본 연구에서는 최근 활발하게 연구되고 있는 추가 사전학습을 활용하여, 기본 BERT에 국가 R&D 분야 지식을 전이한 R&D KoBERT 언어모델을 구축하는 방안을 제시한다. 또한 제안 모델의 성능 평가를 위해 보건의료, 정보통신 분야의 과제 약 116,000건을 대상으로 분류 분석을 수행한 결과, 제안 모델이 순수한 KoBERT 모델에 비해 정확도 측면에서 더 높은 성능을 나타내는 것을 확인하였다.

웹 기반 그림동화 활용 포괄적 언어교수 프로그램의 효과 (The Effectiveness of a Comprehensive Language Teaching Program Using Web-Based Picture Books)

  • 박수진;주은희
    • 아동학회지
    • /
    • 제27권4호
    • /
    • pp.81-102
    • /
    • 2006
  • This study investigated the effects on young children's vocabulary and reading ability of the comprehensive language-teaching program using web-based picture books. The comprehensive language program was put into operation for 9 weeks with a classroom teacher who had in-service training for this program. The language course for the 23 children in the control group consisted only of ordinary language activities using teacher-made picture cards. Test results analyzed by t-test showed that the 25 children in the experimental group gained more than the control group on reading attitude including the concept of reading, accuracy, verbal expression, participation, contents and originality. Also, the ability to read a fairy tale aloud increased in the experimental group.

  • PDF

청각장애 아동의 청능발달과 언어발달간의 상관관계 연구 (The Study for Correlation Among Auditory Development and Language Development of Children with Hearing Impairment)

  • 박상희;권영주
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.255-261
    • /
    • 2003
  • The purpose of this study was to investigate correlation of auditory development and language development of children with hearing impairment Eighteen subjects with severe or profound hearing loss participated in this study. They were 22-to 55-month-olds who had hearing parents with no additional disabling conditions. The test material was the Meaningful Auditory Integration Scale (MAIS) and MacArthur Communicative Development Inventory-Korea (MCDI-K). A Pearson Correlation Coefficient was determined through a statistical analysis. The results followed as; firstly there was a strong correlation between auditory development and receptive language development. Secondly, there was a strong correlation between receptive language development and expressive language development. Finally, there was a strong correlation between auditory development and education onset time. Therefore, auditory training is important method for auditory rehabilitation and education onset time is important variation for auditory development.

  • PDF