• Title/Summary/Keyword: 이중언어처리

Search Result 77, Processing Time 0.025 seconds

The Searching of Korean Words Using Double Trie (이중 트라이를 이용한 한국어 단어 검색)

  • Kim, Cheol-Su;Bae, Woo-Jeong;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.113-118
    • /
    • 1994
  • 한국어 정보처리를 효율적으로 수행하기 위해서는 단어의 검색시간을 최소화하여야 한다. 그러나 기존의 방법들은 단어의 삽입과 삭제가 불가능하거나 검색시간이 길다는 단점을 가지고 있다. 본 논문에서는 탐식시간을 최소화하기 위해서 이중 배열을 가지는 이중 트라이를 이용하여 음절 및 자소단위의 검색방법에 관하여 논의한다. 검색시간에 있어서는 음절단위의 방법이 자소단위의 방법보다 빠르지만 기억장소는 자소단위의 방법이 음절단위의 방법보다 효율적이다. 자소단위의 방법에서 하나의 트라이를 여러개로 분할하여 저장함으로써 기억장소를 절반으로 줄일 수 있어 기억장소를 보다 효율적으로 이용할 수 있다.

  • PDF

An Analysis of Korean Domestic Research Trend in English Education and Bi- lingualism of Young Children (유아교육 및 아동학 관련 국내 학회지에 발표된 영어교육/이중언어발달 관련 논문분석)

  • Ahn, Eun Suk;Kim, Yeon Ha
    • Korean Journal of Childcare and Education
    • /
    • v.5 no.1
    • /
    • pp.81-101
    • /
    • 2009
  • This study analyzed a total of 37 studies about bi-lingulism and English education as a foreign language published in 8 academic journals in early childhood education or child development fields. Research topics, participants, methods, and variables in the studies were categorized and descriptively analyzed. The research findings which had been statistically investigated were also summarized. The most frequently studied research topics were children's development and English education program exposure, actual conditions of English education in preschool settings and effectiveness of specific English programs for preschool children. However, children's home characteristics were seldom included as research variables and no research investigated so called English preschools. Several studies reported that bi-lingual children may have different language development paths from mono-lingual children but they eventually have comparable language abilities to mono-lingual children. Also some studies reported that, when learning English as a foreign language in school settings, older children can handle more information regarding English than younger children, resulting in better outcomes of older children. Exposure to two languages in early childhood seems to contribute to young children's meta linguistic awareness but the long term effect of English education in early childhood should be further studied. Several English education programs for preschool settings were developed and the effectiveness were investigated. Even though most of them reported that their programs were effective to children's English ability or interests, the results should be carefully interpreted because their research designs and methods were not rigorous.

  • PDF

Grapheme-to-Phoneme Conversion Regularity Effects among Late Korean-English Bilinguals (후기 한국어-영어 이중언어화자의 자소-음소 변환 규칙에 따른 영어 규칙성 효과)

  • Kim, Dahee;Baik, Yeonji;Ryu, Jaehee;Nam, Kichun
    • Korean Journal of Cognitive Science
    • /
    • v.26 no.3
    • /
    • pp.323-355
    • /
    • 2015
  • This study examined grapheme-to-phoneme regularity effect among late Korean-English bilinguals by using whole word level task (lexical processing) and two meta-phonological tasks(sub-lexical processing): [1] English word naming task(whole word level), [2] rhyme judgement task(rhyme level), and [3] phoneme deletion task(phoneme level). Forty-three late Korean-English bilinguals participated in all three tasks. In these tasks, participants showed better performance in regular word conditions compared to irregular word conditions, demonstrating a clear English regularity effect. Post-hoc correlational analysis revealed strong correlation between word naming task and rhyme judgement task, which is different from the results reported with English monolinguals. The contradicting results might be due to the relevantly low English proficiency level among late Korean-English bilingual speakers. In conclusion, this study suggests that late Korean-English bilinguals make use of L2 grapheme-to-phoneme conversion (GPC) rule when reading L2 English words.

Developing a Korean sentiment lexicon through BPE (BPE를 활용한 한국어 감정사전 제작)

  • Park, Ho-Min;Cheon, Min-Ah;Nam-Goong, Young;Choi, Min-Seok;Yoon, Ho;Kim, Jae-Kyun;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.510-513
    • /
    • 2019
  • 감정분석은 텍스트에서 나타난 저자 혹은 발화자의 태도, 의견 등과 같은 주관적인 정보를 추출하는 기술이며, 여론 분석, 시장 동향 분석 등 다양한 분야에 두루 사용된다. 감정분석 방법은 사전 기반 방법, 기계학습 기반 방법 등이 있다. 본 논문은 사전 기반 감정분석에 필요한 한국어 감정사전 자동 구축 방법을 제안한다. 본 논문은 영어 감정사전으로부터 한국어 감정사전을 자동으로 구축하는 방법이며, 크게 세 단계로 구성된다. 첫 번째는 한영 병렬 말뭉치를 이용한 한영 이중언어 사전을 구축하는 단계이고, 두 번째는 한영 이중언어 사전을 통한 한영 이중언어 그래프를 생성하는 단계이며, 세 번째는 영어 단어의 감정값을 한국어 BPE의 감정값으로 전파하는 단계이다. 본 논문에서는 제안된 방법의 유효성을 보이기 위해 사전 기반 한국어 감정분석 시스템을 구축하여 평가하였으며, 그 결과 제안된 방법이 합리적인 방법임을 확인할 수 있었으며 향후 연구를 통해 개선한다면 질 좋은 한국어 감정사전을 효과적인 방법으로 구축할 수 있을 것이다.

  • PDF

Processing of Inflectional forms for the French-Korean Collocational Database (불-한 연어 데이터베이스 구축을 위한 굴절 정보의 처리)

  • Yoon, Ae-Sun;Jeong, Hwi-Woong;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.267-272
    • /
    • 2001
  • 구(phrase) 단위 또는 문장(sentence) 단위의 연어(collocation) 정보는 자연언어 처리를 위한 단일어 또는 이중어 데이터베이스를 구축할 수 있는 중요한 기초 자료가 될 뿐 아니라, 외국어 학습에서도 어휘 단계를 넘어선 학습 자료를 제공할 수 있다. 불어는 굴절 언어(inflectional language)로서 기본형 대 굴절형의 비율이 약 1:9 정도로 비교적 굴절 비율이 높은 언어다. 또한 불어 표제어 중 95% 이상을 차지하는 불어의 동사, 명사, 형용사 중 상당한 비율이 암기해야 할 목록(list)이라는 특성을 갖기 때문에 검색과 학습에 있어 오류가 지속적으로 일어나는 부분이다. 표제어의 검색의 경우 불어 굴절 현상을 지원하는 전자 사전이 개발되어 있지만 아직까지 연어 정보에서 굴절형을 지원할 수 사전 또는 데이터베이스는 개발되어 있지 않다. 본 연구의 목적은 전자 사전과 형태소 분석기를 이용하여 굴절형 처리를 지원할 수 있는 불-한 연어 데이터베이스를 구축하는데 있다. 이를 위해 부산대학교 언어정보 연구실에서 개발한 불어 형태소 분석기 Infection와 불-한 전자 사전 Franco를 사용하였으며, 지금까지 구축된 불-한 연어 정보는 94,965 개이다. 본 고에서는 두 정보를 이용하여 불어 굴절형 정보를 분석 및 생성하는 방식 및 불-한 연어 데이터베이스 구조를 살펴 본다.

  • PDF

Dual Translation Imitating Brain-To-Brain Coupling for Better Encoder Representations (더 좋은 인코더 표현을 위한 뇌 동기화 모방 이중 번역)

  • Choi, GyuHyeon;Kim, Seon Hoon;Jang, HeonSeok;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.333-338
    • /
    • 2019
  • 인코더-디코더(Encoder-decoder)는 현대 기계 번역(Machine translation)의 가장 기본이 되는 모델이다. 인코딩은 마치 인간의 뇌가 출발어(Source language) 문장을 읽고 이해를 하는 과정과 유사하고, 디코딩은 뇌가 이해한 의미를 상응하는 도착어(Target language) 문장으로 재구성하는 행위와 비슷하다. 그렇다면 벡터로 된 인코더 표현은 문장을 읽고 이해함으로써 변화된 뇌의 상태에 해당한다고 볼 수 있다. 사람이 어떤 문장을 잘 번역하기 위해서는 그 문장에 대한 이해가 뒷받침되어야 하는 것처럼, 기계 역시 원 문장이 가진 의미를 제대로 인코딩해야 향상된 성능의 번역이 가능할 것이다. 본 논문에서는 뇌과학에서 뇌 동기화(Brain-to-brain coupling)라 일컫는 현상을 모방해, 출발어와 도착어의 공통된 의미를 인코딩하여 기계 번역 성능 향상에 도움을 줄 수 있는 이중 번역 기법을 소개한다.

  • PDF

A Computational Treatment of Word Order and Case Assignment in Korean (한국어의 어순과 격 할당에 대한 전산적 처리)

  • Lee, Ki-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.431-438
    • /
    • 2001
  • 일반적으로 한국어 문장에서 명사는 용언의 항가(valency)에 의해 격이 할당된다. 그러한 이유로, 한국어는 용언이 문장 끝에 온다는 일반적인 제약 이외에는 그 어순이 비교적 자유롭다. 그러나 격 할당과 자유 어순에 대한 여러 가지 비규칙적인 현상들 때문에 문장 분석이나 생성에 문제가 일어난다. 예를 들면, "나 머리 아프다"에서처럼 명사에 격조사가 표시되지 않고 문장이 생성될 수도 있고, "은/는"이나 "도"와 같은 특수조사와 결합할 때는 그 격이 드러나지도 않는다. 어순의 경우, "물이 얼음이 되었다"=/= "얼음이 물이 되었다" 에서처럼 주격이 이중으로 나타나면 어순이 자유롭지 않는 반면, 용언의 어미가 문장 종결형일 때에는 "어서 가자 백두산으로"에서처럼 용언이 문미에 오지 않을 수도 있다. 이 논문은 한국어의 어순과 격 할당에 관한 이러한 문제를 어떻게 처리할 것인가를 보이는 것이 그 목적이다. 문제를 가급적 명시적으로 해결하기 위하여, 본 논문은 문장 분석과 생성에 대한 규칙과 제약 조건들을 형식화하고 문장 처리 과정에서 일어나는 격 할당과 어구 결합 및 배열 과정을 malaga라는 프로그래밍 언어로 구현하여 실험할 것이다.

  • PDF

Generating a Korean Sentiment Lexicon Through Sentiment Score Propagation (감정점수의 전파를 통한 한국어 감정사전 생성)

  • Park, Ho-Min;Kim, Chang-Hyun;Kim, Jae-Hoon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.2
    • /
    • pp.53-60
    • /
    • 2020
  • Sentiment analysis is the automated process of understanding attitudes and opinions about a given topic from written or spoken text. One of the sentiment analysis approaches is a dictionary-based approach, in which a sentiment dictionary plays an much important role. In this paper, we propose a method to automatically generate Korean sentiment lexicon from the well-known English sentiment lexicon called VADER (Valence Aware Dictionary and sEntiment Reasoner). The proposed method consists of three steps. The first step is to build a Korean-English bilingual lexicon using a Korean-English parallel corpus. The bilingual lexicon is a set of pairs between VADER sentiment words and Korean morphemes as candidates of Korean sentiment words. The second step is to construct a bilingual words graph using the bilingual lexicon. The third step is to run the label propagation algorithm throughout the bilingual graph. Finally a new Korean sentiment lexicon is generated by repeatedly applying the propagation algorithm until the values of all vertices converge. Empirically, the dictionary-based sentiment classifier using the Korean sentiment lexicon outperforms machine learning-based approaches on the KMU sentiment corpus and the Naver sentiment corpus. In the future, we will apply the proposed approach to generate multilingual sentiment lexica.

Movie Revies Sentiment Analysis Considering the Order in which Sentiment Words Appear (감성 단어 등장 순서를 고려한 영화 리뷰 감성 분석)

  • Kim, Hong-Jin;Kim, Dam-Rin;Kim, Bo-Eun;Oh, Shin-Hyeok;Kim, Hark-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.313-316
    • /
    • 2020
  • 감성 분석은 문장의 감성을 분석해 긍정 또는 부정으로 분류하는 작업을 의미한다. 문장에 담긴 감성을 파악해야 하기 때문에 문장 전체를 이해하는 것이 중요하다. 그러나 한 문장에 긍정과 부정의 이중 극성이 동존하는 문장은 감성 분석에 혼동이 생길 수 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 단어의 감성 점수 예측을 통해 감성 단어 등장 순서를 고려한 감성 분석 모델을 제안한다. 또한 최근 다양한 자연어 처리 분야에서 좋은 성능을 보이는 사전 학습 언어 모델을 활용한다. 실험 결과 감성 분석 정확도 90.81%로 기존 모델들에 비해 가장 좋은 성능을 보였다.

  • PDF

운영체계 소프트웨어

  • Gang, Seok-Yeol
    • ETRI Journal
    • /
    • v.8 no.2
    • /
    • pp.83-91
    • /
    • 1986
  • 컴퓨터의 많은 응용에 따라 분산처리, 실시간처리, 고장감내처리 등에 대해 운영체계의 연구가 많이 되어왔다. 본고는 한국형 전전자교환기인 TDX-1 시스팀에서 사용된 TDXOS의 실현과 그 특성에 관해 서술하였다. TDXOS는 고실시간처리(Hard real time processing)와 분산처리, 컴퓨터의 이중화, 과부하제어, 실시간 디버거(Debugger) 들을 실현하였으며 뱅크(Bank)시스팀 형태의 메모리 관리기법이 사용되었다. 특히, 소형 마이크로프로세서(Z80) 및 어셈블리 언어에 최적의 동작 환경을 제공하도록 설계되어 실시간의 효율이 최대화되었다.

  • PDF