• 제목/요약/키워드: language training

검색결과 689건 처리시간 0.022초

The Parallel Corpus Approach to Building the Syntactic Tree Transfer Set in the English-to- Vietnamese Machine Translation

  • Dien Dinh;Ngan Thuy;Quang Xuan;Nam Chi
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.382-386
    • /
    • 2004
  • Recently, with the machine learning trend, most of the machine translation systems on over the world use two syntax tree sets of two relevant languages to learn syntactic tree transfer rules. However, for the English-Vietnamese language pair, this approach is impossible because until now we have not had a Vietnamese syntactic tree set which is correspondent to English one. Building of a very large correspondent Vietnamese syntactic tree set (thousands of trees) requires so much work and take the investment of specialists in linguistics. To take advantage from our available English-Vietnamese Corpus (EVC) which was tagged in word alignment, we choose the SITG (Stochastic Inversion Transduction Grammar) model to construct English- Vietnamese syntactic tree sets automatically. This model is used to parse two languages at the same time and then carry out the syntactic tree transfer. This English-Vietnamese bilingual syntactic tree set is the basic training data to carry out transferring automatically from English syntactic trees to Vietnamese ones by machine learning models. We tested the syntax analysis by comparing over 10,000 sentences in the amount of 500,000 sentences of our English-Vietnamese bilingual corpus and first stage got encouraging result $(analyzed\;about\;80\%)[5].$ We have made use the TBL algorithm (Transformation Based Learning) to carry out automatic transformations from English syntactic trees to Vietnamese ones based on that parallel syntactic tree transfer set[6].

  • PDF

다문화가정 맞춤형 영양교육 프로그램과 운영시스템 개선을 위한 질적 연구 : 프로그램 제공자 측면 (Qualitative Study on Improvement of Operating System and Tailored Nutrition Education Program for Marriage Immigrants to Korea: Program Providers' Perspective)

  • 조미영;황지윤
    • 대한지역사회영양학회지
    • /
    • 제22권4호
    • /
    • pp.323-335
    • /
    • 2017
  • Objectives: The purpose of this study is to analyze the current status of nutrition education programs for multicultural families and to provide policy suggestions for improvement. Methods: In-depth interviews of a total of 21 multicultural experts were conducted; 15 people were interviewed individually, while 6 people were interviewed in groups of three. Results: In-depth interviews revealed various problems related to the operation of nutrition education programs. The causes of problems were analyzed and categorized as four factors: systemic, practical, environmental and cultural. As for the systematic factors, insufficient linkage between related organizations and duplicate performance of several projects were identified as concerns Establishment of a control tower and strengthening the linkage among the related organizations may be needed to address this concern. With regard to practical factors, the study identified that language barriers, and lack of nutritional education media and tools translated into multicultural languages were limiting factors. These limitations the development of nutrition education materials that aretranslated into multiple languages, implementation of education programs that are different from the Korean education, and by providing interpreters. As for the environmental factors, low educational level and poor nutritional knowledge of multicultural women made it difficult for them to understand the contents of the education. Demonstration, practical training and urgent education on pregnancy and childbirth nutrition were identified as needs to address these concerns. Withregard to cultural factors, food culture conflict with Korean families, and difficulties in home practices were detected as concerns. Participants in the study suggested that getting education with family and facilitation of weekend and nighttime programs health of this community. Conclusions: Further studies are needed to adopt more effective and efficient nutrition intervention to promote the healthy eating of the married immigrant women based on the study results.

STW를 이용한 웹 문서 장르 분류에 관한 연구 (A Research for Web Documents Genre Classification using STW)

  • 고병규;오군석;김판구
    • 정보화연구
    • /
    • 제9권4호
    • /
    • pp.413-422
    • /
    • 2012
  • 웹 문서의 지속적인 증가로 인해 텍스트 기반, Page Rank 등의 방법으로 한 연구들이 증가하고 있다. 특히 웹 문서 내 URL 정보, HTML Tag 정보 등을 활용하는 연구들이 다시 주목을 받고 있다. 따라서 웹 문서 장르 분류를 위해 앞서 언급한 웹 문서 내 특징 요소들을 바탕으로 본 논문에서는 STW(Semantic Term Weight)를 적용하여 웹 문서 장르 분류하는 연구를 기술한다. 웹 문서 장르 분류에 사용되는 데이터 셋은 학습 문서와 테스트 문서로 구성되고, SVM 알고리즘을 사용하여 웹 문서 분류 실험을 수행한다. 학습 과정을 위해 20-Genre-collection corpus 내 1,000여개의 문서를 선정하여 SVM 알고리즘을 통해 학습하였고, 테스트 과정에서 사용된 데이터 셋은 KI-04 corpus를 사용하였다. 테스트 과정 후 STW를 사용한 실험과 STW를 사용하지 않은 실험으로 분류하여 정확도를 측정하였다. 또한 이를 바탕으로 1,212개의 테스트 문서를 분류하였다. 그 결과 STW를 사용한 실험 이 그렇지 않은 실험 보다 약 10.2% 높은 정확도를 보였다.

중국인 학습자의 한국어 장애음 청취와 조음 특성 - Kalvin과 Praat을 활용한 음성 실험을 바탕으로 - (Characteristics of the Listening and Pronunciation of Korean Obstruents of Chinese Learners -Based on the Phonetic Experiments Using Kalvin and Praat-)

  • 김선정;정효정
    • 비교문화연구
    • /
    • 제27권
    • /
    • pp.497-523
    • /
    • 2012
  • Characteristics of the Listening and Pronunciation of Korean Obstruents of Chinese Learners -Based on the Phonetic Experiments Using Kalvin and Praat- This study aims at investigating the characteristics of confrontation in three ways, lax/ fortis/ aspirated consonants, in Korean obstruents through experimental phonetic analysis for the Chinese Korean language learners. On one hand, as a result of comparing Korean and Chinese obstruent systems, there is no big difference regarding the articulatory location. On the other hand, in regards to the articulatory method there is a difference. In a Korean obstruent system, the confrontation presented in three ways by the strength of aspiration. On the contrary, the Chinese obstruent system showed confrontation in two ways by the existence of aspiration. To examine the difficulty of the learners caused by the above-mentioned reason objectively, this paper studied the relationship between input and output of sound through the experimental phonetic analysis such as Kalvin and Praat. To research the input of sound, the listening ability of the learners was examined by 'Choosing Consonant' among the Menu of Kalvin. As a result of that experiment, many errors were shown. They recognized the fortis as lax in the area of affricates and plosives. In the area of fricatives, they recognized affricatives as fricatives. To investigate the output of sound, the section of aspiration and the section of friction of a plosive, an affricate and a fricative in Praat, were expressed numerically. The learners' VOT of lax and affricate represented that lax was pronounced close to the fortis, and the VOT of fricatives was not shown the section of aspiration and friction clearly, and also the result showed that they pronounced a fricative like affricative-aspirated one. The result shows that the learners' pronunciation is related to the listening ability. The consequence is caused by the characteristics of the difference between Korean obstruents and Chinese ones. If the training pronunciation is conducted based on above result, it would be a better methodology in teaching Korean.

제7차 초등학교 교육과정 교과서의 환경 관련 내용 분석 (The Analysis of Contents Related to Environmental Education in the Elementary School Textbooks of 7th Korea National Curriculum)

  • 최영분;노경임;민병미
    • 한국환경교육학회지:환경교육
    • /
    • 제15권1호
    • /
    • pp.115-124
    • /
    • 2002
  • The purpose of this research is to analyze the contents related to environmental education(EE) in the elementary school textbooks for the following areas: well-balanced EE, and development of EE curriculum/teachers' guide in elementary school level. For the purpose of this analysis, elementary school teachers, education administrators and EE specialists were involved. Eleven content areas of EE, namely: natural environment, artificial environment, population, industrialization, natural resources, pollution, environmental conservation, environment sanitation, environment ethics, environmentally sound and sustainable development(ESSD), and daily li(e as a consumer, were analyzed. The results of the analysis are as follows: 1. There are total 1,140 contents related to EE in the elementary school textbooks of 7th Korea National Curriculum. 2. The textbooks of grade 6 contain the most number of EE contents, while the least number is in the textbooks of grade 3. 3. The subject that includes EE contents equally in its textbooks is social studies, and the subjects that relate a lot to EE are Korean language, science, and social studies respectively. 4. The content areas that are included a lot in textbooks are' natural environment', 'pollution', and' environmental conservation' respectively, while the contents of 'population','industrialization', 'ESSD' are included to a lesser degree. The content area most frequently mentioned in the textbooks is 'pollution', and the number of the contents are increasing along with the grade level. 5. Generally, the content areas of 'population', 'industrialization', and 'natural resources' are reflected in the textbooks to a lesser degree than others. 'Industrialization' is not included in the textbooks of grade 2, while 'population' is not included in ones of grade 4. According to the result, more concern about balanced EE in content areas is needed at the elementary school level. Similar studies tot K and secondary school levels are needed. The developmental study of EE guide book and teacher training for teaching EE using the book are also recommended.

  • PDF

병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구 (Filter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering)

  • 문현석;박찬준;어수경;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-7
    • /
    • 2021
  • 최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다.

국내 공공영상아카이브 관리 체계 마련을 위한 과제 프랑스 INA FRAME 영상아카이브 국제연수 참가를 통해 살펴본 해외 동향 분석 (Analysis on the Global Trends for the Preservation of Public Audiovisual Heritage and the Urgent Tasks for Korea Public Audiovisual Heritage Preservation)

  • 최효진
    • 기록학연구
    • /
    • 제58호
    • /
    • pp.95-145
    • /
    • 2018
  • 커뮤니케이션 언어로서 텍스트보다 사진, 이미지, 영상 등 비(非)텍스트 기록의 중요성이 커지고 있다. 이에 따라 국내 기록관리 유관 기관과 전문가들 또한 이미지 기록의 특수성에 적합한 기록관리 체계 마련의 필요성에 공감하고 있다. 이 글은 2018 국제 영상기록 관리연수(INA Frame)에 참가한 경험을 토대로 국내 영상기록관리 체계 마련을 위해 고민해야 할 지점들을 정리한 글이다. 특히 국가적 차원에서 관리해야 할 대상을 단순한 영화, 방송, 문화콘텐츠 등을 포괄하는 다양한 유형의 콘텐츠에서 더 나아가 '공공영상문화유산'의 개념정립의 필요성에 대해 역설하였다. 또한, 관련 제도 인프라 정비, 기관 또는 거버넌스 설계 등과 같은 '기반구축'에 해당하는 여러 과제들을 검토하여 이 선결과제들이 향후 국내에서 안정적인 '공공영상문화유산' 관리체계 마련으로 이어져야 함을 강조한다.

조현병 환자 간호 시뮬레이션 교육에 관한 융합연구 : 체계적 문헌고찰 (Convergence Study of Nursing Simulation Training for Patient with Schizophrenia: A Systematic Review)

  • 김선경;엄미란;김외남
    • 산업융합연구
    • /
    • 제17권2호
    • /
    • pp.45-52
    • /
    • 2019
  • 본 연구는 조현병 환자 간호 시뮬레이션 교육 중재 연구들에 대한 문헌고찰을 통해 중재의 구체적 내용을 알아보고 그들의 융합적 효과를 확인하기 위해 시행되었다. 4개의 데이터베이스 검색을 통해 확인된 226편의 문헌 중 선정기준에 부합하는 11편을 최종 선택하였다. 5편의 질적연구, 5편의 양적연구, 1편의 혼합설계가 포함되었다. 시뮬레이션에 표준화환자, 역할극, 시뮬레이터, 가상현실 기술이 활용되었고 대부분의 연구에서(63.6%) 표준화환자를 활용한 시뮬레이션이 이루어졌다. 효과평가에 연구마다 다른 변수가 측정되었으며 자신감, 지식, 학습자기효능감, 교육만족도, 자기주도학습이 측정되었다. 향후 조현병환자간호의 고난도와 복잡성을 고려한 결과변수의 선정 및 측정을 통해 시뮬레이션 교육의 효과성을 입증할 수 있도록 잘 설계된 연구가 지속 되어야 할 것이다.

블랜디드러닝(Blended Learning)활용방안 - NHK「NEWS WEB EASY」를 중심으로 - (Utilization Plan of Blended Learning - Focused on NHK「NEWS WEB EASY」-)

  • 유미선
    • 한국융합학회논문지
    • /
    • 제10권5호
    • /
    • pp.119-124
    • /
    • 2019
  • 본 연구의 목적은 일본어 중급 단계 학습자들에게 NHK"NEWS WEB EASY"라는 온라인 사이트를 소개하고, 오프라인 수업에서 "NEWS WEB EASY"의 기사를 활용한 수업설계방안을 통해 블랜디드러닝의 효과적인 방법을 제안하는 것이다. 본고에서는 "NEWS WEB EASY"를 활용한 블랜디드러닝을 통하여 첫째, 다양한 어휘 학습능력을 배양하고. 둘째, 다양한 분야의 기사를 통해 일본문화 및 일본사정을 익히고. 셋째, 기사별 리스닝 파일을 통해 자연스럽게 리스닝 트레이닝을 실시하고, 넷째, 후리가나가 없는 파일을 학습자들에게 배포, 검색하게 함으로 한자 읽기연습 및 어휘실력 향상에 도움을 주고. 다섯째, 낭독연습을 통하여 스피킹 실력을 향상시키는 방법에 대하여 제시하였다. "NEWS WEB EASY"를 활용한 학습을 통해 어렵다는 선입견으로 접할 수 없었던 뉴스기사를 학습함에 따라 일본을 이해하고 일본어 실력향상에 많은 도움이 되었다는 사실을 알 수 있었다.

음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech (Text-to-speech with linear spectrogram prediction for quality and speed improvement)

  • 윤혜빈
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.71-78
    • /
    • 2021
  • 인공신경망에 기반한 대부분의 음성 합성 모델은 고음질의 자연스러운 발화를 생성하기 위해 보코더 모델을 사용한다. 보코더 모델은 멜 스펙트로그램 예측 모델과 결합하여 멜 스펙트로그램을 음성으로 변환한다. 그러나 보코더 모델을 사용할 경우에는 많은 양의 컴퓨터 메모리와 훈련 시간이 필요하며, GPU가 제공되지 않는 실제 서비스 환경에서 음성 합성이 오래 걸린다는 단점이 있다. 기존의 선형 스펙트로그램 예측 모델에서는 보코더 모델을 사용하지 않으므로 이 문제가 발생하지 않지만, 대신에 고품질의 음성을 생성하지 못한다. 본 논문은 뉴럴넷 기반 보코더를 사용하지 않으면서도 양질의 음성을 생성하는 Tacotron 2 & Transformer 기반의 선형 스펙트로그램 예측 모델을 제시한다. 본 모델의 성능과 속도 측정 실험을 진행한 결과, 보코더 기반 모델에 비해 성능과 속도 면에서 조금 더 우세한 점을 보였으며, 따라서 고품질의 음성을 빠른 속도로 생성하는 음성 합성 모델 연구의 발판 역할을 할 것으로 기대한다.