• 제목/요약/키워드: Frequency of vocabulary usage

검색결과 5건 처리시간 0.017초

Vocabulary Analyzer Based on CEFR-J Wordlist for Self-Reflection (VACSR) Version 2

  • Yukiko Ohashi;Noriaki Katagiri;Takao Oshikiri
    • 아시아태평양코퍼스연구
    • /
    • 제4권2호
    • /
    • pp.75-87
    • /
    • 2023
  • This paper presents a revised version of the vocabulary analyzer for self-reflection (VACSR), called VACSR v.2.0. The initial version of the VACSR automatically analyzes the occurrences and the level of vocabulary items in the transcribed texts, indicating the frequency, the unused vocabulary items, and those not belonging to either scale. However, it overlooked words with multiple parts of speech due to their identical headword representations. It also needed to provide more explanatory result tables from different corpora. VACSR v.2.0 overcomes the limitations of its predecessor. First, unlike VACSR v.1, VACSR v.2.0 distinguishes words that are different parts of speech by syntactic parsing using Stanza, an open-source Python library. It enables the categorization of the same lexical items with multiple parts of speech. Second, VACSR v.2.0 overcomes the limited clarity of VACSR v.1 by providing precise result output tables. The updated software compares the occurrence of vocabulary items included in classroom corpora for each level of the Common European Framework of Reference-Japan (CEFR-J) wordlist. A pilot study utilizing VACSR v.2.0 showed that, after converting two English classes taught by a preservice English teacher into corpora, the headwords used mostly corresponded to CEFR-J level A1. In practice, VACSR v.2.0 will promote users' reflection on their vocabulary usage and can be applied to teacher training.

基于汉语语料库的中韩词典词汇释义的准确性研究 - 以D3H1区的词汇为中心

  • 곽준화
    • 중국학논총
    • /
    • 제65호
    • /
    • pp.23-38
    • /
    • 2020
  • The dictionary is the most important tool for every Chinese learner to confirm the meaning and usage of words. Therefore, accuracy of headword's interpretation in the dictionary is crucial. This study aims to discuss the accuracy and the adequacy of headwords' interpretation in the Chinese-Korean dictionary through the Chinese corpus and Baidu. The scope of this study are 3000 words in the D3H1 region. According to the research results, the main problems of the vocabulary in this region can be divided into three categories: the first is the problem of lexical interpretation, the second is the problem of missing interpretation, and the third is other problems. In the D3H1 area, there are a total of 719 low-frequency vocabularies, and 54 headword's interpretations are not accurate or appropriate. This study is a detailed investigation and analysis of the problems of these 54 vocabularies.

외국인을 위한 한글맞춤법 시안 연구 (A Study on Hangeul Orthography Guidelines for Foreigners)

  • 한재영
    • 한국어교육
    • /
    • 제28권4호
    • /
    • pp.273-296
    • /
    • 2017
  • This study focuses on a review of Hangeul orthography guidelines in Korean language regulations. It is indispensable to revise the guidelines thoroughly because it has been more than 80 years since a unified plan of Korean orthography was established in 1933, which the current orthography is based on. Also, it has been approximately 30 years since 1989, when the current guidelines were issued and promulgated. The viewpoint towards this review reflects the requirements by education fields of Korean as a foreign language and modern Korean users. Hangeul orthography consists of six clauses, along with an appendix regarding punctuation marks: 1) general rules, 2) consonants and vowels, 3) related to sounds, 4) about forms, 5) spacing between words, and 6) miscellaneous. This paper examined individual clauses and specific usages of the clauses, in terms of Korean as a foreign language. Based on the review, this paper suggests the following tasks in order to establish a draft of Hangeul orthography for foreigners. A. Among the individual clauses, some clauses that embody vocabulary education aspects should be addressed in a Korean dictionary, and deleted in Hangeul orthography guidelines. B. The clauses of Hangeul orthography guidelines should be edited for revision and substitution where necessary. C. The usage of individual clauses should be replaced with more appropriate examples aligned with everyday conversation. D. In order to establish 'Hangeul orthography for foreigners', linguists should continuously review several chapters and the appendix of Hangeul orthography, such as components about forms, spacing between words, miscellaneous, and punctuation marks. The purpose of this review is to pursue the simplicity of Hangeul orthography guidelines and the practicality in terms of reflecting more realistic examples. This review contributes to facilitate Korean language usage not only for non-native learners, but also native users.

'디지털 분석 도구를 활용한 문학 연구 : 라클로의 『위험한 관계Les liaisons dangereuses』를 중심으로 (Literary Research Using Digital Analysis Tools: A Case Study of 『Dangerous Liaisons』)

  • 류선정;유은순
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.173-180
    • /
    • 2024
  • 본 연구는 디지털 분석 도구를 활용하여 서간체 형식의 18세기 리베르탱 소설의 걸작으로 꼽히는 『위험한 관계』를 대상으로 '리베르티나주(libertinage)'를 둘러싼 이성과 감정의 문제를 계량적으로 분석하였다. 첫째, Voyant과 LIWC 22의 사용 단어 빈도수 분석을 통해 리베르티나주가 'love'와 'time'과 같은 키워드로 발현되었음을 확인하였다. 둘째, Voyant의 'Contexts' 기능을 통해 발몽이 투르벨 부인에게 보낸 편지들과 메르퇴유 부인에게 보낸 편지들은 모두 'love'를 중심 테마로 하고 있지만, 전자에서는 감정적 어휘들이, 후자에서는 전략적 어휘들이 더 많이 사용된 것을 확인하였다. 그리고 메르퇴유가 보낸 편지에서 가장 많이 사용된 어휘는 'time'으로서 'love'보다 빈도수가 더 높은 것을 확인하였다. 셋째, LIWC 22를 이용하여 주요 인물들이 주고받은 편지들을 대상으로 인물별, 각부별 '분석적 사고(analytic thinking)'와 '감정적 어조(emotional tone)'를 각각 측정하고 분석하였다. 이상의 분석 결과들은 『위험한 관계』가 18세기 프랑스의 계몽주의 시대 때 배척의 대상이었던 '감정'이라는 문제에 천착하고 있는 작품임을, 그리고 루소의 『신 엘로이즈』처럼 낭만주의를 예고하는 작품임을 뒷받침하는 중요한 근거로서 유의미할 것이다.

재난안전 용어사전 구축을 위한 미디어별 어휘 사용 양상 비교 (Comparing the Usages of Vocabulary by Medias for Disaster Safety Terminology Construction)

  • 이정은;김태영;오효정
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권6호
    • /
    • pp.229-238
    • /
    • 2018
  • 재난사건의 신속한 대응은 다양한 분야의 재난안전 유관기관들이 유기적으로 관계함으로써 가능하며, 이 때 사용되는 재난용어의 표준화는 필수적이다. 따라서 재난안전 분야의 전문 용어사전 구축은 각 유관기관 간의 의사소통 및 국민에게 명확한 정보 전달을 위해 수반되는 핵심 요소이다. 더불어 효율적인 용어사전 구축을 위해서는 구축 대상 용어의 우선순위 선정이 필요하다. 본 연구에서는 구체적인 용어사전 구축방향의 설정을 위하여 용어 사용 주체로 대표되는 미디어를 각각 용어사전, 뉴스미디어, 소셜미디어로 선정하고 어휘의 사용 양상을 비교하였다. 이를 위해 각 미디어에서 수집된 어휘 자원을 바탕으로 미디어별 동시 출현 양상 및 빈도 가중치 분석을 통하여 어휘의 분포를 시각화하였다. 분석 결과를 통해 어휘의 사용 양상에 따라 용어사전의 구축대상이 될 수 있는 어휘의 유형을 4가지로 분류하고, 구축대상 기준별 용어사전 구축의 우선순위 방향성을 제안하였다.