• 제목/요약/키워드: 프랑스어

검색결과 71건 처리시간 0.025초

어원 정보를 이용한 외래어의 자동 원어 복원 (Automatic Back-Transliteration with Word Origin Information)

  • 이상율;강인수;나승훈;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.54-60
    • /
    • 2003
  • 음차 표기된 외래어로부터 원어를 복원하는 문제는 원어의 발음정보를 이용한 통계적인 방법을 많이 사용한다. 하지만 지금까지의 연구들은 대부분 영어단어만을 그 대상으로 하였기 때문에 '도쿄(Tokyo)', '하인리히(Hinrich)'와 같이 어원이 영어가 아닌 단어들의 복원에는 좋은 결과를 보여주지 못했다. 이러한 문제를 해결하기 위하여 한글로 표기된 외래어의 어원을 판단할 수 있는 방법을 찾아내고, 이 방법을 통해 외래어를 어원별로 분리하여 학습모델을 구축함으로써 다양한 어원을 가진 외래어들의 복원 정확률을 높이고자 하였다. 위의 방식으로 구현된 시스템은 영어, 일본어, 중국어, 프랑스어의, 서로 다른 4개의 어원을 가진 데이터의 복원 실험에서 기존의 방식에 비해 13%의 성능 향상을 보였다.

  • PDF

부트스트래핑 기반의 단어-임베딩 투영 학습에 의한 대역어 사전 구축 (Bootstrapping-based Bilingual Lexicon Induction by Learning Projection of Word Embedding)

  • 이종서;왕지현;이승진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.462-467
    • /
    • 2020
  • 대역사전의 구축은 저자원 언어쌍 간의 기계번역의 품질을 높이는데 있어 중요하다. 대역사전 구축을 위해 기존에 제시된 방법론 중 단어 임베딩을 기반으로 하는 방법론 대부분이 영어-프랑스어와 같이 형태적 및 구문적으로 유사한 언어쌍 사이에서는 높은 성능을 보이지만, 영어-중국어와 같이 유사하지 않은 언어쌍에 대해서는 그렇지 못하다는 사실이 널리 알려져 있다. 본 논문에서는 단어 임베딩을 기반으로 부트스트래핑을 통해 대역사전을 구축하는 방법론을 제안한다. 제안하는 방법론은 소량의 seed 사전으로부터 시작해 반복적인 과정을 통해 대역사전을 자동으로 구축하게 된다. 이후, 본 논문의 방법론을 이용해 한국어-영어 언어쌍에 대한 실험을 진행하고, 기존에 대역사전 구축 용도로 많이 활용되고 있는 도구인 Moses에 사용된 방법론과 F1-Score 성능을 비교한다. 실험 결과, F1-Score가 약 42%p 증가함을 확인할 수 있었으며, 초기에 입력해준 seed 사전 대비 7배 크기의 대역사전을 구축하였다.

  • PDF

프랑스학 교육 분야의 디지털 학습지원 매체 활용에 관한 연구 (A Study on the Utilization of Digital Learning Support Tools in the Field of French Studies Education)

  • 김연주
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.685-695
    • /
    • 2023
  • 이 연구는 프랑스학 교육 분야에서 디지털 학습지원 매체가 실제적으로 어떻게 적용되고 있는지 활용 현황을 파악하고 시사점을 도출하여 향후 연구 방향을 모색하는 데 목적을 두었다. 이를 위해 프랑스학 교육 분야에서의 학습 과정별 디지털 매체가 어떻게 활용되었는지 검토하였으며, 최근 대두되고 있는 챗GPT의 활용은 외국어와 교육분야까지 확장하여 학습에 직접적 적용 현황을 확인하였다. 이상의 문헌 검토 결과, 첫째, 프랑스학 교육 분야에서는 디지털 학습지원 매체의 적용은 다소 제한적이었다. 주로 '온라인 수업 매체', '수업 전 학습', '효율적 학습 및 상호작용' 그리고 '자기주도적 학습'의 과정에 디지털 학습지원 매체를 선별적으로 활용하고 있는 것으로 나타났다. 특히 교수·학습 과정에서 '효율적 학습 및 상호작용'을 위하여 다양한 디지털 학습지원 매체가 활용되는 현황을 확인할 수 있었다. 둘째, 챗GPT의 경우, 프랑스학 교육 분야에서는 아직 연구가 진행되지 않은 것으로 나타났으며, 타 교육 분야에서 학습 과정의 실제적 적용에 관한 매우 소수의 연구가 진행되고 있었다. 챗GPT는 교수·학습자료의 개발과 학습 전 과정 및 평가, 그리고 학습자의 자기주도적 학습 측면 등 활용범위가 매우 넓고 학습자들의 긍정적 효과가 보고되었지만, 정보의 질, 출처 및 신뢰도 등의 측면에서는 윤리적 문제점도 함께 보고되고 있었다. 따라서 향후 국내 프랑스학 교육 분야에서는 이를 바탕으로 대학의 교수·학습 상황에 적합한 교육적 적용 및 그 효과 검증 그리고 디지털 학습지원 매체와 범 학문적 융합의 방향으로 이루어져야 할 필요가 있다.

지식 기반 프랑스어 발음열 생성 시스템 (A knowledge-based pronunciation generation system for French)

  • 김선희
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.49-55
    • /
    • 2018
  • This paper aims to describe a knowledge-based pronunciation generation system for French. It has been reported that a rule-based pronunciation generation system outperforms most of the data-driven ones for French; however, only a few related studies are available due to existing language barriers. We provide basic information about the French language from the point of view of the relationship between orthography and pronunciation, and then describe our knowledge-based pronunciation generation system, which consists of morphological analysis, Part-of-Speech (POS) tagging, grapheme-to-phoneme generation, and phone-to-phone generation. The evaluation results show that the word error rate of POS tagging, based on a sample of 1,000 sentences, is 10.70% and that of phoneme generation, using 130,883 entries, is 2.70%. This study is expected to contribute to the development and evaluation of speech synthesis or speech recognition systems for French.

발음평가용 멀티미디어 시스템 구현을 위한 구어 프랑스어의 음향학적 단서 (Acoustic Cues in Spoken French for the Pronunciation Assessment Multimedia System)

  • 이은영;송미영
    • 음성과학
    • /
    • 제12권3호
    • /
    • pp.185-200
    • /
    • 2005
  • The objective of this study is to examine acoustic cues in spoken French for the assessment of pronunciation which is necessary to realization of the multimedia system. The corpus is composed of simple expressions which consist of the French phonological system include all phonemes. This experiment was made on 4 male and female French native speakers and on 20 Korean speakers, university students who had learned the French language more than two years. We analyzed the recorded data by using spectrograph and measured comparative features by the numerical values. First of all, we found the mean and the deviation of all phonemes, and then chose features which had high error frequency and great differences between French and Korean pronunciations. The selected data were simplified and compared among them. After we judged whether the problems of pronunciation in each Korean speaker were either the utterance mistake or the interference of mother tongue, in terms of articulatory and auditory aspects, we tried to find acoustic features as simplified as possible. From this experiment, we could extract acoustic cues for the construction of the French pronunciation training system.

  • PDF

코퍼스 기반 프랑스어 텍스트 정규화 평가 (Corpus-based evaluation of French text normalization)

  • 김선희
    • 말소리와 음성과학
    • /
    • 제10권3호
    • /
    • pp.31-39
    • /
    • 2018
  • This paper aims to present a taxonomy of non-standard words (NSW) for developing a French text normalization system and to propose a method for evaluating this system based on a corpus. The proposed taxonomy of French NSWs consists of 13 categories, including 2 types of letter-based categories and 9 types of number-based categories. In order to evaluate the text normalization system, a representative test set including NSWs from various text domains, such as news, literature, non-fiction, social-networking services (SNSs), and transcriptions, is constructed, and an evaluation equation is proposed reflecting the distribution of the NSW categories of the target domain to which the system is applied. The error rate of the test set is 1.64%, while the error rate of the whole corpus is 2.08%, reflecting the NSW distribution in the corpus. The results show that the literature and SNS domains are assessed as having higher error rates compared to the test set.

실제 발화 상황에서 프랑스어와 한국어의 음절구조 비교 (A Comparative Study of Syllable Structures between French and Korean in Real Utterances)

  • 이은영
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.237-248
    • /
    • 2003
  • This paper compares the syllable structure of French and Korean analyzing the speech data of these two languages recorded during the actual speech. Reference to the syllable structure of French is made from F. Wioland's research data. As for the Korean data, the primary data are drawn from the 30-minute radio interview in which two male TV anchors in their early 60s talk to each other. The secondary source of the data is collected by having the primary data replicated by the two male announcers in their early 20's broadcasting in the university ra야o station of KAIST. With reference to the data collected in French and Korean, this paper provides the statistical frequency of each type of syllable structure in each language through the acoustic analysis of the spectrograms and renders a phonetic account of the characteristics of each syllable type in the two languages. Also discussed in this paper is the distributional condition in which each syllable structure is laid out in the speech context.

  • PDF

CSL를 이용한 한국인의 프랑스어 운율학습 방안 (A Learning Method of French Prosodic Rhythm for Korean Speakers using CSL)

  • 이은영;이문규;이정현
    • 음성과학
    • /
    • 제6권
    • /
    • pp.83-101
    • /
    • 1999
  • The aim of this study is to provide a learning method of prosodic rhythm for Taegu North Kyungsang Korean speakers to learn French rhythm more effectively. The rhythmic properties of spoken French and Taegu North Kyungsang Korean dialect are different from each other. Therefore, we try to provide a basic rhythmic model of the two languages by dividing into three parts: syllable, rhythmic unit and accent, and intonation. To do so, we recorded French of Taegu Kyungsang Korean speakers, and then analysed and compared the rhythmic properties of Korean and French by spectrograph. We tried to find rhythmic mistakes in their French pronunciation, and then established a learning model to modify them. After training with the CSL Macro learning model, we observed the output result. However, although learners understand the method we have proposed, an effective method which is possible by repeating practice must be arranged to be actually used in direct verbal communications in a well-developed learning programme. Hence, this study may play an important role at the level of preparation in the setting of an effective rhythmic learning programme.

  • PDF

어휘 풍부성 평가에 대한 계량언어학적 연구 (프랑스어 텍스트를 중심으로) (A Quantitative Linguistic Study for the Appreciation of the Lexical Richness)

  • 배희숙
    • 음성과학
    • /
    • 제7권3호
    • /
    • pp.139-149
    • /
    • 2000
  • Studying language by the quantitative linguistic method is not a recent development. Lately however, the interest in the quantitative linguistics has increased according to the demand on communication between human and human or between human and machine. We are required to transfer the system of the natural language onto machine. This requires the study of quantitative linguistics because we are unable to seize the characters of the tiny linguistic units and their structure in an intuitive way. In fact, the quantitative linguistics treats the internal structure of the language by the relation between the linguitic units and their quantitative characters. It is natural then that there is this growing interest in quantitative linguistics. In addition, Korean linguists take interest in the quantitative linguistics, although quantitative linguistics in Korea is not advanced by the level of the statistical analysis. Therefore, this present study shows how statistics can be applied in the field of linguistics through the two texts written in French: Lovers of the Subway and Our life's A. B. C.

  • PDF

억양의 시각화를 통한 프랑스어의 억양학습 (Learning French Intonation with a Base of the Visualization of Melody)

  • 이정원
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.63-71
    • /
    • 2003
  • This study aims to experiment on learning French intonation, based on the visualization of melody, which was employed in the early sixties to reeducate those with communication disorders. The visualization of melody in this paper, however, was used to the foreign language learning and produced successful results in many ways, especially in learning foreign intonation. In this paper, we used the PitchWorks to visualize some French intonation samples and experiment on learning intonation based on the bitmap picture projected on a screen. The students could see the melody curve while listening to the sentences. We could observe great achievement on the part of the students in learning intonations, as verified by the result of this experiment. The students were much more motivated in learning and showed greater improvement in recognizing intonation contour than just learning by hearing. But lack of animation in the bitmap file could make the experiment nothing but a boring pattern practices. It would be better if we can use a sound analyser, as like for instance a PitchWorks, which is designed to analyse the pitch, since the students can actually see their own fluctuating intonation visualized on the screen.

  • PDF