• Title/Summary/Keyword: 일본어

Search Result 361, Processing Time 0.037 seconds

The Role of Script Type in Janpanese Word Recognition:A Connectionist Model (일본어의 단어인지과정에서 표기형태의 역할:연결주의 모형)

  • ;阿部純
    • Korean Journal of Cognitive Science
    • /
    • v.2 no.2
    • /
    • pp.487-513
    • /
    • 1990
  • The present paper reviews experimental finding such as kanji stroop effect, kana superiority effect in naming task, kanji superiority effect in lexical devision task, and the different pattern of facilitatory priming effect in repetition priming task. Most of the experimental findings indicate that kana script and kanji script are processed independently and modularly. These indications are also consistent with the basic observations on Japanese dyslexics. A connectionist model named JIA(Japanese Interactive Activation)is proposed which is a revision of interactive activation model proposed by McClelland & Rumelhart(1981). The differences between the two models are as follows. Firstly, JIA has a kana module and kanji module at letter level. Secondly, JIA adopts script-specific interconnections between letter-level nodes and word-level nodes:word nodes receive larger activation from the script consistent letter-level nodes. JIA successfully explains all the experimental findings and many cases of Japanese dyslexia. A computer program which simulates JIA model was written and run.

Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition (Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식)

  • Cheon, Min-Ah;Kim, Chang-Hyun;Park, Ho-Min;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.167-171
    • /
    • 2018
  • 개체명 인식은 문서에서 인명, 지명, 기관명 등의 고유한 의미를 나타내는 단위인 개체명을 추출하고, 추출된 개체명의 범주를 결정하는 작업이다. 최근 개체명 인식과 관련된 연구는 입력 데이터의 앞, 뒤를 고려하기 위한 Bi-RNNs와 출력 데이터 간의 전이 확률을 이용한 CRFs를 결합한 방식을 기반으로 다양한 변형의 심층학습 방법론이 제안되고 있다. 그러나 대부분의 연구는 입력 단위를 단어나 형태소로 사용하고 있으며, 성능 향상을 위해 띄어쓰기 정보, 개체명 사전 자질, 품사 분포 정보 등 다양한 정보를 필요로 한다는 어려움이 있다. 본 논문은 기본적인 학습 말뭉치에서 얻을 수 있는 문자 기반의 입력 정보와 Multi-Head Attention을 추가한 Bi-GRU/CRFs을 이용한 다국어 개체명 인식 방법을 제안한다. 한국어, 일본어, 중국어, 영어에 제안 모델을 적용한 결과 한국어와 일본어에서는 우수한 성능(한국어 $F_1$ 84.84%, 일본어 $F_1$ 89.56%)을 보였다. 영어에서는 $F_1$ 80.83%의 성능을 보였으며, 중국어는 $F_1$ 21.05%로 가장 낮은 성능을 보였다.

  • PDF

A Study on the Algorithm Development for Speech Recognition of Korean and Japanese (한국어와 일본어의 음성 인식을 위한 알고리즘 개발에 관한 연구)

  • Lee, Sung-Hwa;Kim, Hyung-Lae
    • Journal of IKEEE
    • /
    • v.2 no.1 s.2
    • /
    • pp.61-67
    • /
    • 1998
  • In this thesis, experiment have performed with the speaker recognition using multilayer feedforward neural network(MFNN) model using Korean and Japanese digits . The 5 adult males and 5 adult females pronounciate form 0 to 9 digits of Korean, Japanese 7 times. And then, they are extracted characteristics coefficient through Pitch deletion algorithm, LPC analysis, and LPC Cepstral analysis to generate input pattern of MFNN. 5 times among them are used to train a neural network, and 2 times is used to measure the performance of neural network. Both Korean and Japanese, Pitch coefficients is about 4%t more enhanced than LPC or LPC Cepstral coefficients.

  • PDF

DaHae: Japanese Morphological Analyzer for Japanese to Korean Machine Translation (DaHae: 일한 기계번역을 위한 일본어 형태소 분석기)

  • Yuh, Sang-Hwa;Jung, Han-Min;Chang, Won;Kim, Tae-Wan;Hwang, Do-Sam;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.195-207
    • /
    • 1995
  • 일본어는 한자, 히라가나, 가다가나 등 다양한 종류의 문자를 사용하며 이들의 혼용 비율이 매우 높아 띄어쓰기를 하지 않아도 문서의 가독성을 유지한다. ICOT 사전, EDR 사전, ATLAS I/JK사전 등 기존의 전자 사전에서 복합 자종의 표제어가 차지하는 비율(한자+히라가나의 표제어 제외)은 평균 8.8%로 그 수가 매우 작다. 따라서, 문장 내에서 자종의 변화는 단어를 구분하는 하나의 delimiter로 이용될 수 있다. 본 시스템에서는 형태소 분석의 전단계로 전처리기를 두어 자종정보(character type information)에 의한 fragment 분리 및 예외 단어, 정형표현 처리를 수행하며 각 fragment 의 형태소 분석 방법을 제시한다. 형태소 분석기는 전처리기의 처리 결과를 입력받아 각각의 fragment를 전처리기가 제시한 분석 방법에 따라 분석하여 입력 문장의 가능한 모든 분석을 추출한다. 이 방법은 불필요한 사전 탐색과 접속 체크 회수를 줄여 분석 성능을 향상시킨다.

  • PDF

Construction of Internet Public Library Asia (아시아 인터넷 공공 도서관(Internet Public Library Asia) 구축에 관한 연구)

  • 이원숙;일본명;일본명;일본명;일본명
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.13 no.2
    • /
    • pp.59-73
    • /
    • 2002
  • Libraries, not only research libraries but also public libraries, have been fundamentally affected by the immense spread of the Internet and the World Wide Web. Many public libraries have their Web pages, through which they are providing their new and conventional services. There are also web sites which provide library-like services. This paper shows an experimental project named Internet Public Library Asia, which provides information in multiple languages of information resources published in Chinese, Japanese and Korean languages. This paper firstly overviews how traditional public libraries have been affected by the Internet. Then, it describes a few aspects from the viewpoint of crucial library function on the Internet and also from the viewpoint of Asian resources and users. This paper secondly proposes a model to serve information about valuable resources published in multiple Asian languages, and then shows the metadata schema and a few software tools developed for IPL-Asia The name of IPL is borrowed from Internet Public Library based at University of Michigan, since it is, in part, a collaborative activity with the IPL in Michigan. The metadata schema is defined based both on Dublin Core and IEEE LOM and adapted for parallel description in the four languages, i. e. , Chinese, Japanese, Korean and English. The software tools provide functions to support collaboration among people engaged in development of metadata database and metadata editing. These tools have been developed based on the XML technologies.

  • PDF

A Korean Morphological Analyzer CBKMA and A Index Word Extractor CBKMA/IX (한국어 형태소 분석기 CBKMA와 색인어 추출기 CBKMA/IX)

  • Kim, Nam-Churl;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.50-59
    • /
    • 1999
  • 본 논문은 한국어 형태소 분석기 CBKMA와 이 CBKMA를 이용한 색인어 추출기 CBKMA/IX를 소개하고, 각각의 특징들에 대해서 설명한다. CBKMA는 음절 정보를 이용하는 분석 알고리즘과, 효율적인 사전구성을 이용한 형태소 분석기로서, 과다한 분석 후보의 생성을 줄임으로써 처리 속도를 향상시켰다. 수행시 필요로 하는 컴퓨터 자원은 Main Memory 약 4Mb정도로, 작은 규모의 시스템에서도 수행이 가능한 특징을 갖는다. CBKMA/IX는 CBKMA의 형태소 분석 기능을 이용하는 색인어 자동 추출기로서, 처리 속도 향상을 위하여 대분류 수준의 품사 태그만을 이용한다. 또한 CBKMA의 분석 기능에 색인어 추출을 위해 불용어 사전, 사용자 키워드 사전 처리 부분과, 복합명사와 미등록어 분석 부분 및 한자어, 일본어 등에 대한 처리를 강화시켰다. 특히 비소설류 자료의 분석시 좋은 성능을 발휘한다.

  • PDF

Utilization Plan of Blended Learning - Focused on NHK「NEWS WEB EASY」- (블랜디드러닝(Blended Learning)활용방안 - NHK「NEWS WEB EASY」를 중심으로 -)

  • Yu, Mi Sun
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.5
    • /
    • pp.119-124
    • /
    • 2019
  • The purpose of this study is to introduce the NHK"NEWS WEB EASY"online site to intermediate level learners of Japanese language, and to teach effective methods of Blended Learning through the lesson planning method using "NEWS WEB EASY" Suggesting. First, this paper helped students cultivate various vocabulary learning ability through Blended Learning using "NEWS WEB EAS Y", Second, helped them learn about Japanese culture and Japan through various articles, Third, helped them naturally perform listening training through listening files, Fourth, helped them practice reading Kanji and improve vocabulary skills by distributing the files without Furigana to them for search, and Fifth, showed them how to improve speaking ability by reading practice through learning using "NEWS WEB EASY". We could learn the fact that the study helped students a lot understand Japan and improve their Japanese ability by learning news articles that they could not come across due to prejudice through learning using "NEWS WEB EASY".

A Processing of Progressive Aspect "te-iru" in Japanese-Korean Machine Translation (일한기계번역에서 진행형 "ている"의 번역처리)

  • Kim, Jeong-In;Mun, Gyeong-Hui;Lee, Jong-Hyeok
    • The KIPS Transactions:PartB
    • /
    • v.8B no.6
    • /
    • pp.685-692
    • /
    • 2001
  • This paper describes how to disambiguate the aspectual meaning of Japanese expression "-te iru" in Japanese-Korean machine translation Due to grammatical similarities of both languages, almost all Japanese- Korean MT systems have been developed under the direct MT strategy, in which the lexical disambiguation is essential to high-quality translation. Japanese has a progressive aspectual marker “-te iru" which is difficult to translate into Korean equivalents because in Korean there are two different progressive aspectual markers: "-ko issta" for "action progressive" and "-e issta" for "state progressive". Moreover, the aspectual system of both languages does not quite coincide with each other, so the Korean progressive aspect could not be determined by Japanese meaning of " te iru" alone. The progressive aspectural meaning may be parially determined by the meaning of predicates and also the semantic meaning of predicates may be partially reshicted by adverbials, so all Japanese predicates are classified into five classes : the 1nd verb is used only for "action progrssive",2nd verb generally for "action progressive" but occasionally for "state progressive", the 3rd verb only for "state progressive", the 4th verb generally for "state progressive", but occasIonally for "action progressive", and the 5th verb for the others. Some heuristic rules are defined for disambiguation of the 2nd and 4th verbs on the basis of adverbs and abverbial phrases. In an experimental evaluation using more than 15,000 sentances from "Asahi newspapers", the proposed method improved the translation quality by about 5%, which proves that it is effective in disambiguating "-te iru" for Japanese-Korean machine translation.translation quality by about 5%, which proves that it is effective in disambiguating "-te iru" for Japanese-Korean machine translation.anslation.

  • PDF

Constructions of Double Accusative in Korean & Japanese (한국어(韓國語)의 이중대격구문(二重對格構文)과 일본어(日本語)의 이중대격구문(二重對格構文)의 문제(問題))

  • Kang, Yong-Hee
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.169-174
    • /
    • 1998
  • 한국어(韓國語)의 격조사(格助詞)와 일본어(日本語)의 격조사(格助詞)의 유사성(類似性)과 상이성(相異性)에 관한 연구(硏究)는 많지만 격조사(格助詞)와 단문(單文)의 통사적(統辭的) 제약(制約)에 관한 연구(硏究)는 미비하다. 본 연구(硏究)에서는 이중대격구문(二重對格構文)의 관점(觀点)에서 양국언어(兩國言語)의 통사적(統辭的) 상이점(相異点)과 분포(分布)의 차이(差異)를 명백(明白)히 밝히며, 일본(日本)의 한국(韓日) 기계번역(機械飜譯) 시스템에서의 처리(處理)와 오역(誤譯)의 처리(處理)를 고찰(考察) 하는 것을 목적(目的)으로 한다.

  • PDF