• Title/Summary/Keyword: 중국어

Search Result 252, Processing Time 0.03 seconds

PR페이지 - 어도비·구글, 한·중·일어 동시 지원 무료 서체 출시

  • 대한인쇄문화협회
    • 프린팅코리아
    • /
    • v.13 no.8
    • /
    • pp.99-99
    • /
    • 2014
  • 어도비는 지난 7월 16일 한국어를 비롯해 중국어, 일본어, 라틴어, 그리스어, 키릴 자모까지 지원하는 오픈 소스 서체 '본고딕(Source Han Sans)'을 출시했다. '본고딕' 오픈 소스서체를 사용하면 글로벌 사용자를 대상으로 한 인쇄물이나 웹 파일을 만들 때 언어에 상관없이 하나의 통일된 서체를 사용할 수 있다.

  • PDF

Common Pronunciation Errors Made by Koreans Learning Chinese (중국어 학습에서 나타나는 한국인의 발음오류)

  • Tsie Ciao;Lee Hyun Bok
    • Proceedings of the KSPS conference
    • /
    • 1996.10a
    • /
    • pp.275-276
    • /
    • 1996
  • Koreans learning Mandarin Chinese are faced with serious pronunciation errors in vowels, consonants and tones, etc. Most of these pronunciation errors are found to be due the transference of the native Korean phonetic habits. Following are some of the most common pronunciation errors encountered by Koreans learning Chinese.

  • PDF

Multilingual Named Entity Recognition with Limited Language Resources (제한된 언어 자원 환경에서의 다국어 개체명 인식)

  • Cheon, Min-Ah;Kim, Chang-Hyun;Park, Ho-min;Noh, Kyung-Mok;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

A Study on Semi-Automatic Construction of Verb Patterns for a Korean-Chinese MT System (한중 기계번역 시스템을 위한 동사구 패턴 반자동 확장 방안 연구)

  • Hong, Mun-Pyo;Ryu, Cheol;Kim, Young-Kil;Park, Sang-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.273-278
    • /
    • 2003
  • 본 논문에서는 한-중 기계번역 시스템에서 사용되는 한중 동사구 패턴의 반자동 생성을 위한 방법론을 제안한다. 한중 동사구 패턴은 한국어와 중국어간의 변환을 위한 정보를 제공할 뿐만 아니라, 한국어의 구문분석과 중국어의 생성을 위해 중요한 정보를 제공하는 고급 언어자원이다. 본 논문에서 제시하는 새로운 패턴 반자동확장 방안은 기존의 한중 동사구 패턴으로부터 대역어 정보를 이용하여 새로운 동사구 패턴을 생성해내는 방법이다. 본 방법론은 시스템 개발 초기에 일반적으로 이루어지는 사전기반 패턴 구축이 끝난 후, 패턴의 커버리지 문제를 해결하기 위해 실용적으로 적용할 수 있는 방법론으로서, 한국어와 중국어 같이 활용 가능한 대역 코퍼스가 아직 많지 않은 경우에 효과적이다. 본 논문에서 제시한 방법론은 실험 결과 67.15%의 정확률과 4.58배의 패턴 확장률을 나타냈다.

  • PDF

Multilingual Named Entity Recognition with Limited Language Resources (제한된 언어 자원 환경에서의 다국어 개체명 인식)

  • Cheon, Min-Ah;Kim, Chang-Hyun;Park, Ho-min;Noh, Kyung-Mok;Kim, Jae-Hoon
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

Segmentation of Long Chinese Sentences using Comma Classification (쉼표의 자동분류에 따른 중국에 장문분할)

  • Jin Me-Ixun;Kim Mi-Young;Lee Jong-Hyeok
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.5
    • /
    • pp.470-480
    • /
    • 2006
  • The longer the input sentences, the worse the parsing results. To improve the parsing performance, many methods about long sentence segmentation have been reserarched. As an isolating language, Chinese sentence has fewer cues for sentence segmentation. However, the average frequency of comma usage in Chinese is higher than that of other languages. The syntactic information that the comma conveys can play an important role in long sentence segmentation of Chinese languages. This paper proposes a method for classifying commas in Chinese sentences according to the context where the comma occurs. Then, sentences are segmented using the classification result. The experimental results show that the accuracy of the comma classification reaches 87.1%, and with our segmentation model, the dependency parsing accuracy of our parser is improved by 5.6%.

Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition (Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식)

  • Cheon, Min-Ah;Kim, Chang-Hyun;Park, Ho-Min;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.167-171
    • /
    • 2018
  • 개체명 인식은 문서에서 인명, 지명, 기관명 등의 고유한 의미를 나타내는 단위인 개체명을 추출하고, 추출된 개체명의 범주를 결정하는 작업이다. 최근 개체명 인식과 관련된 연구는 입력 데이터의 앞, 뒤를 고려하기 위한 Bi-RNNs와 출력 데이터 간의 전이 확률을 이용한 CRFs를 결합한 방식을 기반으로 다양한 변형의 심층학습 방법론이 제안되고 있다. 그러나 대부분의 연구는 입력 단위를 단어나 형태소로 사용하고 있으며, 성능 향상을 위해 띄어쓰기 정보, 개체명 사전 자질, 품사 분포 정보 등 다양한 정보를 필요로 한다는 어려움이 있다. 본 논문은 기본적인 학습 말뭉치에서 얻을 수 있는 문자 기반의 입력 정보와 Multi-Head Attention을 추가한 Bi-GRU/CRFs을 이용한 다국어 개체명 인식 방법을 제안한다. 한국어, 일본어, 중국어, 영어에 제안 모델을 적용한 결과 한국어와 일본어에서는 우수한 성능(한국어 $F_1$ 84.84%, 일본어 $F_1$ 89.56%)을 보였다. 영어에서는 $F_1$ 80.83%의 성능을 보였으며, 중국어는 $F_1$ 21.05%로 가장 낮은 성능을 보였다.

  • PDF

A Study on Web Identity of Online Education Contents for Foreign Languages -Focused on Foreign Language Education in English, Japanese and Chinese) (온라인 외국어 교육 콘텐츠의 웹 아이덴티티 연구 -영어, 일어, 중국어 교육을 중심으로)

  • Kim, Mirea;Hwang, Jung-Hye
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.493-498
    • /
    • 2006
  • 본 연구에서는 온라인 상에서 대학학위 과정 교육을 목적으로 제작된 외국어 콘텐츠의 웹 아이덴티티 규명의 필요성과 규명된 웹 아이덴티티와 학습동기유발간의 상관관계를 연구하는데 중점을 둔다. 본 연구에서 채택된 외국어 교육 콘텐츠는 타 교육 분야보다 각 민족 언어의 아이덴티티가 시각적으로 재현되는 방식이 다양하다는 점에서 연구대상으로 부각되었다. 본 연구는 기존에 제시된 바 있는 웹 아이덴티티 분석 기준에서 출발하여 온라인 교육 콘텐츠 측면에서 이를 적용 및 재해석하고, 온라인 교육 콘텐츠 의 웹 아이덴티티 기준을 추가하였다. 따라서, 본 연구는 4년제 학사 학위를 수여하는 국내 0 사이버대학교의 외국어 교육 콘텐츠(영어, 일어, 중국어)의 사례를 웹 아이덴티티를 구현하는 세부 요소--시각디자인측면, 사운드측면, 인터페이스측면--에 맞추어 분석을 시도하였다. 또한 웹 아이덴티티가 적용된 각 외국어 교육 콘텐츠의 교육 효과 획득을 위한 학습동기유발 효과와의 상관관계를 알기 위하여 웹 아이덴티티가 적용, 제작된 외국어 교육 콘텐츠와 웹 아이덴티티가 적용되지 않은 채 제작된 외국어 교육 콘텐츠 간의 주의력, 관련성, 자신감, 만족감 등 학습동기유발 효과를 비교하는 설문 조사를 진행하였다. 이를 통해 온라인 외국어 교육 콘텐츠에 있어서 웹 아이덴티티의 개발과 적용이 외국어 교육 효과를 높이는 학습동기유발에 유의미한 역할을 한다는 것이 확인되었다.

  • PDF

A Study on the Teaching Method of Korean Pronunciation for the Chinese Learners (중국인 초급 학습자의 한국어 발음 교육 연구 - 자음과 모음을 중심으로 -)

  • Jiang, Fei
    • Korean Educational Research Journal
    • /
    • v.40 no.2
    • /
    • pp.35-56
    • /
    • 2019
  • This study is concentrated to search for the effective teaching method of Korean pronunciation as one of Korean language teaching for the chinese. Pronunciation is the most basic factor in the use of language. pronunciation is the basic factor for learners to judge the fluency and accuracy of the target language in the process of communication. but people usually learn the second- language when they are adults, who are surely influenced by mother language. Therefore, it is the main purpose of this thesis to seek vocal sound system and phonological phenomena in Korean and Chinese and figure out the common and difference of these two languages through contrastive analysis.

  • PDF