• Title/Summary/Keyword: 외래어 표기

Search Result 47, Processing Time 0.021 seconds

Transliteration Correction Method using Korean Alphabet Viable Prefix (한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법)

  • Kwon, Soon-Ho;Kwon, Hyuk-Chul
    • The KIPS Transactions:PartB
    • /
    • v.18B no.2
    • /
    • pp.87-92
    • /
    • 2011
  • In Korean documents, there are diverse spellings of transliterated foreign loanwords. This fact diminishes the performance of information retrieval systems in that a foreign word can be recognized differently, which is to say, as two or several different words. Thus, information retrieval systems require preprocessing to correct nonstandard loanword spellings prior to searching and recognizing corresponding equivalent words. This paper proposes a method that improves precision and processing efficiency using the Korean alphabet's viable prefix, which prunes a virtual tree from which candidate loanwords are created.

Equivalent Writing of Loanwords Detection Method based on Korean Alphabet Confusion Matrix (한국어 자모 혼동행렬 기반 유사 외래어 표기 검출 기법)

  • Kwon, Soonho;Kwon, Hyuk-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.433-436
    • /
    • 2010
  • 최근 한국어 문서에는 한국어뿐만 아니라 외래어 표기 등이 혼합되어 사용되고 있다. 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보검색 시스템의 성능 저하의 원인이 된다. 따라서 정보검색 시스템의 성능 향상을 위해 여러 외래어 표기를 같은 개념으로 인식하는 시스템이 필요하다. 본 논문에서는 한국어 자모 혼동행렬을 기반으로 한 유사 외래어 표기 검출 기법을 제안한다. 제안한 기법에 따라 유사 외래어 표기를 검출해줌으로써 정보검색 시스템의 성능을 향상할 수 있다.

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

  • 이재성;최기선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

The reasons why it is good to write Chinese loanwords in Korean instead of Chinese characters and Hànyǔ pīnyīn (중국의 외래어 표기를 한자와 병음 대신 한글로 쓰면 좋은 이유 증명)

  • TaeChoong Chung
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.639-643
    • /
    • 2022
  • 한글이 우수한 글자라는 의견에 세계 대부분의 학자들이 동의하고 있다. 한글 자모의 단순성과 직교성(규칙성)으로 인해 표현할 수 있는 발음의 수도 제일 많고 읽고 쓰고 배우기도 쉽다는 점을 누구나 인정하기 때문이다. 구한말과 1950년대에 중국도 한글표기를 사용할 뻔 했다는 이야기도 있다. 그러나 그들은 한자를 사용하되 단순화 하는 방법과 병음을 사용하는 것으로 결론이 났고 현재 그렇게 사용하고 있다. 그런데 중국인들이 외래어를 다루는 것을 보면 많이 고생한다는 생각이 든다. 외래어 표기를 한글로 사용한다면 외래어를 위한 한자 단어를 만들 필요가 없고 외래어를 표현하고 배우고 읽고 쓰는데 훨씬 더 효과적으로 할 수 있고, 원음 재현율이 매우 개선된다. 또한' 글자의 길이가 짧아지고 더 멀리서도 인식되는 장점도 있다. 본 논문은 그것을 보여준다. 본 논문에서는 영어 원단어, 한국어 표기, 중국어 표기, 병음 표기, 중국어 발음 한글 표기 등을 비교해서 한글이 유리함을 보여주고자 한다. 결론적으로 외국단어를 한자나 한자의 병음으로 표현하는 것보다 한글로 표현하는 것이 중국어를 사용하는 모든 사람들에게 큰 도움이 될 것이다. 물론 그들이 한글을 읽고 쓰는 것을 배우는 부담은 있지만 몇일만 배우면 평생의 문제를 해결하게 되는 문제이므로 큰 부담은 아니라고 본다.

  • PDF

Automatic Detection and Extraction of Transliterated Foreign Words Using Hidden Markov Model (은닉 마르코프 모델을 이용한 음차표기된 외래어의 자동인식 및 추출 기법)

  • 오종훈;최기선
    • Korean Journal of Cognitive Science
    • /
    • v.12 no.3
    • /
    • pp.19-28
    • /
    • 2001
  • In this paper, we describe an algorithm for transliterated foreign word extraction in Korean language. In the proposed method we reformulate the transliterated foreign word extraction problem as a syllable-tagging problem such that each syllable is tagged with a transliterated foreign syllable tag or a pure Korean syllable tag. Syllable sequences of Korean strings ale modeled by Hidden Markov Model whose state represents a character with binary marking to indicate whether the character forms a Korean word or not. The proposed method extracts a transliterated foreign word with high recall rate and precision rate. Moreover, our method shows good performance even with small-sized training corpora.

  • PDF

Emotion and Sensibility Comparison between Loanword and Hangul Label in Fashion Industry (의류 패션산업에서 순한글과 외래어 용어에 대한 감성비교)

  • Yoon, Yongju;Na, Youngjoo
    • Science of Emotion and Sensibility
    • /
    • v.18 no.1
    • /
    • pp.79-94
    • /
    • 2015
  • The purpose of this study is to analyze the emotion and sensibility of fashion words in terms of words types, such as loanword and Korean words, Hangul in fashion product label and fashion manufacturing industry. We surveyed 200 persons in their 20s using the questionnaire on the stimulus of product tag label and fashion words with 15 adjectives. Based on daily usage of foreign words in fashion market, we selected 1 item label in 3 forms: 1) Hangul label written in loan words 2) Label written in English and 3) Label written in Hangul and 3 fashion words in 2 forms 1) loanword and 2) Hangul. And the label types and fashion words were analyzed and investigated in terms of consumer's sensibility, preferences and estimated product price. The results are following: consumers preferred loanword label than Hangul label, and they preferred loanword in English than that in Korean. They evaluated loanword more positively, such as refinement, gorgeous and elegant, etc. and estimated the product price of loanword label as higher. But in the sensibility of 'familiar' and 'stability', Hangul label was not significantly different to loanword written in Hangul. That is, label written in English is the highest in all the evaluation, and loanword label written in Hangul is next, and Hangul label showed the lowest result. Consumers showed the evaluation differently between loanwords and Hangul according to their degree in fashion involvement. Consumers of high fashion involvement evaluated the sensibilities of 'refinement', 'elegant', and 'gorgeous' of loanwords as higher, whereas they had tendency to evaluate the sensibilities of 'familiar' and 'stability' of Hangul as higher or similar.

A Study on the Management of Loanwords (외래어 관리에 관한 연구)

  • 한유선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.19-22
    • /
    • 2000
  • 학문이 발달하고 시대가 변하면서 발생한 새로운 개념이 외국에서 우리나라로 들여오면서 그에 대응하는 우리말인 외래어가 생성된다. 학문의 발전과 교류가 점차 빠르게 이루어지면서 외래어의 수는 급증하고 있는 실정이다. 그러나 끊임없이 증가하고 있는 외래어를 체계적으로 관리하지 못하고 있어 외래어를 효율적으로 사용하지 못하며 여러 문제가 발생하고 있다. 본고에서는 외래어의 정의와 표기법 및 문제점에 대해 알아보고 외래어 관리 방안에 대해 연구하였다.

  • PDF

Suggestion for Mineral Species Name 1: Metallic Mineral (광물명에 대한 제언 1: 금속광물)

  • Cho, Hyen Goo;Koo, Hyo Jin
    • Journal of the Mineralogical Society of Korea
    • /
    • v.32 no.2
    • /
    • pp.145-150
    • /
    • 2019
  • As the spirit of reconciliation between the two Koreas ripens, the integration of mineral names is required in preparing the reunification between the South and North Koreas. Currently, mineral names in Korean do not adopt the guideline for romanization of Korean that was proposed by the National Institute of the Korean Language (NIKL), and different names are often used for an identical mineral species. Here, for mineral names in Korean, we suggest using (1) the suffix, "$s{\breve{o}}k$", both for metallic and non-metallic minerals, (2) names in the NIKL example-list if available, (3) the suffix "$s{\breve{o}}k$" for minerals whose names are based on the names of persons or localities.

<2>인쇄매체에 잘못 표기되는 외래어 언제까지 이대로 둘것인가

  • Park, Do-Yeong
    • 프린팅코리아
    • /
    • s.24
    • /
    • pp.106-109
    • /
    • 2004
  • 인쇄관련 언론매체를 보면 놀랍게도 일본어로 표기된 단어를 많이 발견할 수 있다. 하리꼬미, 베다, 고마, 돔보, 도지, 구와에, 돈땡, 모루동, 후렉소, 아지로, 도무송, 싸바리, 단보루 등이 대표적으로 많이 쓰이고 있다. 필자는 자신들의 영역에서 외래어를 순화하지 않고 사용하는 것을 보면서 안타까움을 금할 수 없다. 또한 일본어를 음역하여 견당, 습수, 정합, 노광, 타발, 사양, 중철, 소부, 돗판, 매엽, 하지, 상지 등 우리말에도 없는 것을 계속 사용하고 있는 것은 가슴아픈 일이다. 뿐만 아니라 영문 발음과 한글 표기가 정확하지 않은 것도 많다. 이에 시급히 바꾸어야 할 용어를 정리해 본다. 용어의 나열은 가 나 다 순으로 하되 먼저 잘못 표기된 용어를 적고 이어서 시정 또는 권장 용어를 나타내었다. 이해하기 어려운 것은 내용 설명을 덧붙였다.

  • PDF

Analysis of Mistakes Made in Using Loan Words in Domestic Hairstyling-related Academic Papers (국내 헤어 논문 외래어 오류 실태 분석)

  • Lee, Young-a;Lee, Jae-sook
    • Journal of Digital Convergence
    • /
    • v.17 no.1
    • /
    • pp.449-456
    • /
    • 2019
  • This study attempted to improve the quality of hairstyling-related studies and provide basic data for future studies on hairstyling terms through analysis of cosmetology-related loan words used in hairstyling theses among recent cosmetology papers. For data collection to derive valid conclusions, the signatures of a total of 1,980 academic papers collected after typing in the keyword 'Hair' at the Research Information Sharing Service (http://www.riss.kr) were analyzed. The results show that researchers in hairstyling seem not to pay close attention to the correct use of foreign loan words. Therefore, the study results would be very helpful to the development of future cosmetology studies. The correct notation and use of foreign loanwords should be further encouraged.