• 제목/요약/키워드: 이중언어

검색결과 246건 처리시간 0.025초

중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출 (Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA)

  • 김정태;김창현;천민아;김재훈;김재환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출 (Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA)

  • 김정태;김창현;천민아;김재훈;김재환
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

등급 재현율: 이중언어 사전 구축에 대한 평가 방법 (Rated Recall: Evaluation Method for Constructing Bilingual Lexicons)

  • 서형원;권홍석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.146-151
    • /
    • 2013
  • 이중언어 사전 구축 방법을 평가하는 방법에는 정확률, 재현율, MRR(Mean Reciprocal Rank) 등이 있다. 이들 방법들은 평가 집합에 있는 대역어를 정확하게 찾는 것에 초점을 맞추고 있다. 그러나 어떤 대역어가 얼마나 많이 사용되는지는 전혀 고려하지 않는다. 즉 자주 사용되는 대역어를 빨리 찾을 수 있는 방법이 좋은 방법이라고 말할 수 있다. 이와 같은 문제를 해결하기 위해서 본 논문에서는 이중언어 사전 구축의 새로운 평가 방법인 등급 재현율을 제안한다. 등급 재현율(rated recall)은 대역어가 학습 말뭉치에 나타난 정도를 반영하는 재현율이며, 자주 사용되는 대역어를 얼마나 정확하게 찾는지를 파악할 수 있는 좋은 측도이다. 본 논문에서는 문맥벡터와 중간언어를 이용한 이중언어 사전 구축 시스템의 성능을 평가하고 기존의 방법과 비교 분석하였다.

  • PDF

한국어-영어 이중언어자의 영어 산출 구조 분석 (English-Production Structures of Korean-English Bilinguals)

  • 신승식;염은영;정찬섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.128-141
    • /
    • 1996
  • 한국어-영어 이중언어자와 비이중언어자인 한국 대학생들을 대상으로 두 언어 처리의 독립성과 영어 처리의 사고 억제 과정을 알아보기 위해서 두 개의 산출실험을 실시하였다. 실험 1에서는 한국어와 영어로 산출 과제를 준 후에 한국어, 영어 단어에 대한 어휘 판단 과제를 하였다. 이중언어자는 한국어-영어 처리 체계가 분리되어 있어서 산출 언어와 목표 단어의 언어가 바뀐 경우에 단어 판단시간이 더 길 것으로 예상하였으나 유의미한 결과는 나오지 않았다. 비이중언어자는 영어 산출 후에 한국어, 영어 단어에 대한 판단 시간이 모두 느려졌으며 이것은 영어 산출에 많은 심적 자원을 소모하였기 때문이라고 해석하였다. 실험2에서는 영어로만 1분간 산출 과제를 주고 20초씩 나눈 세 구간에서 발화된 단어 수를 측정하였다. 이중언어자는 세 번째 구간에서 유의미하게 발화된 단어수가 감소하였지만 비이중언어자는 세 구간에서 발화된 단어수가 비슷하였다. 이것을 영어 산출시의 처리 부담과 관련하여 논하였다.

  • PDF

이중언어자와 한국 대학생의 문장 유형별 영어 통사처리 특성 조사 (Syntax Process in English Sentence Types : Comparison between Korean-English Bilinguals and Korean Non-bilinguals)

  • 박진한;오창영;염은영;정찬섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.123-127
    • /
    • 1996
  • 영어와 한국어의 통사구조의 차이로 인하여, 이중언어자와 비이중언어자인 한국 대학생의 영어 문장 유형에 따른 통사 처리에 있어 차이가 있을 것이다. 네가지 영어 문장 유형, 수동태, 관계사절, 물주구문, 가정법 구문 등으로 문장 완성 과제를 실험하여 이중언어자와 비이중언어자의 문장완성 시간과 오류율을 측정하였다. 실험 결과 비이중언어자인 한국 대학생은 다른 문장 유형에 비하여 물주구문에서의 통사처리 수행에 있어 이중언어자와 유의한 차이를 보였다. 이로부터 이중언어자와 한국 대학생의 영어 문장의 통사 정보처리의 자동화 및 어순효과 정보와 생물 주어(word animacy)구문 단서, 즉 대부분의 주어는 살아있는 사물의 명사로 이루어져 있다는 단서(Gass, l987)의 사용에 대하여 논의하였다.

  • PDF

fMRI에 나타난 모국어와 외국어로서의 한국문자와 중국문자의 차이 (Two Languages in One Brain Shown by fMRI: Orthography Specific Effects in L2)

  • 이동훈;이홍재;문찬홍;유재욱;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.216-221
    • /
    • 2002
  • 본 연구는 문자 규칙 심층성이 다른 문자체계인 한국어와 중국어의 차이가 이중언어화자의 모국어 처리와 외국어 처리에서 각각 어떤 대뇌 활성화의 차이를 가져오는지 fMRI (functional Magnetic Resonance Imaging)를 이용하여 살펴보았다. 중국어 (Ll)-한국어(L2) 이중언어화자 및 한국어(Ll)-중국어(L2) 이중언어화자를 제 2언어 습득시기에 따라 초기 및 후기 이중언어화자로 구분하여 모국어 차이와 습득시기에 따른 영향을 알아보았다. 실험 1에서는 어휘 판단 과제(lexical decision task)를 실시하였고, 실험 2에서는 의미 판단 과제(semantic decision task)를 각각 실시하였다. 어휘판단과제를 사용한 실험 1의 결과는 음운처리와 관련된 좌반구 SMG(supramarginal gyrus), 하두정소엽(inferior parietal lobule, BA 39, 40)에서 중국어-한국어 초기 및 후기이중언어화자의 경우, 한국어 조건에서 보다 많은 활성화를 보였으나, 한국어-중국어 화자의 경우 활성화가 나타나지 않았다. 철자처리에 관련된 방추상회(fusiform gyrus, BA 37, 19) 영역에서는 중국어-한국어 화자뿐만 아니라, 한국어-중국어 인중언어화자의 경우도 중국어 조건에서 보다 많은 활성화를 보였다. 실험 2에서 사용한 의미판단과제의 경우, 중국어-한국어 이중언어화자의 경우 어휘판단과제를 사용한 실험 1의 결과에서 보고된 한국어 특정적인 반응, 즉 SMG영역에서의 활성화의 증가가 실험 2에서는 나타나지 않았다. 그러나 한국어-중국어 이중언어화자의 경우, 실험 1에서 나타난 것과 같이 철자처리 혹은 의미처리와도 관련된다고 보고되는 방추상회(fusiform gyrus)등의 영역 유의미한 차이를 나타났다. 이는 어휘 판단과제와 의미판단과제가 유도하는 뇌 활성화 양상이 다름을 시사한다. 종합해 볼 때, 이중언어화자의 뇌 영상 연구에서 어휘수준에서는 거의 공통적인 활성화를 보인다는 개략적 수준의 연구 결과를 넘어, 음운처리 및 철자처리와 같은 어휘접근 수준에서는 이중언어화자들의 뇌 활성화가 다르게 일어남을 보여주고 있다. 따라서 이중언어 화자의 뇌 기전을 밝히기 위해서도 보다 개략적 수준을 넘어 언어처리의 세부적인 수준에 따른 접근이 필요함을 시사한다.

  • PDF

이중언어 통로 형성을 위한 청음특성 보강학습 원리

  • 진용옥
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.164-166
    • /
    • 2003
  • 모국어와 영어의 2중 언어 통로 모국어 통로, 4-6개월 태아의 내이 형성에서 시작, 탯줄과 수도청음 주파수 8khz로 학습됨, 모국어=어머니 언어특질에 맞춰진 처음 인지구조 이중언어통로와 영어학습 원리, 모국어 기반의 새로운 언어 통로 형성, 모국어와 원 어민 언어 특질의 정합 (중략)

  • PDF

중간언어 문맥벡터의 정제를 통한 이중언어 사전 구축의 성능개선 (Enhancing Performance of Bilingual Lexicon Extraction through Refinement of Pivot-Context Vectors)

  • 권홍석;서형원;김재훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권7호
    • /
    • pp.492-500
    • /
    • 2014
  • 본 논문은 중간언어 기반 이중언어 사전 구축 방법에서 문맥벡터의 정제 방법을 제안한다. 중간언어 기반 이중언어 사전 구축 방법은 두 언어 간의 사전이나 병렬말뭉치 등 언어 자원이 부족한 언어쌍에 매우 효과적인 방법이다. 본 논문은 두 가지 정제 방법을 통해서 성능을 개선한다. 첫 번째 방법은 양방향 번역확률을 통하여 문맥벡터를 정제하였고 두 번째 방법은 품사 정보를 이용하여 문맥벡터를 정제하였다. 본 논문은 두 개의 서로 다른 언어 쌍으로 한국어-스페인어 그리고 한국어-프랑스어 양방향에 대해서 각각 이중언어 사전을 추출하는 실험을 하였다. 높은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 48.5%를, 상위 20에서 최대 88.5%의 정확도를 얻었고, 낮은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 26.5%를, 상위 20에서 최대 66.5%의 성능을 보였다.

한국어-영어 이중언어 화자의 사용 언어, 문맥, 언어 능숙도에 따른 기본 주파수 변화 (Changes in fundamental frequency depending on language, context, and language proficiency for bilinguals)

  • 윤소망;목소라;윤정선;한지윤;임동선
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.9-18
    • /
    • 2019
  • 본 연구에서는 영어-한국어 이중언어 화자의 평균 기본주파수를 분석하여 언어 및 과제에 따른 차이가 있는지 살펴보고, 거주년수 및 언어 능숙도에 따라 언어 간 평균 기본주파수 상이한지 실펴보고자 하였다. 본 연구의 대상자는 영어권 나라에 7년 이상 거주한 한국어-영어 균형적 이중언어 집단 총 28명(남녀 각각 14명, 균형적 이중언어집단), 언어 노출기간 및 언어 능숙도에 차이를 두기 위해 추가로 모집한 영어권 나라 거주년수 3년 이하인 한국어 우세 이중언어 집단 총 20명(남녀 각각 10명, 한국어 우세 이중언어 집단)이다. 이들은 한국어와 영어로 읽기 및 자발화 과제를 수행하였고 Praat을 통해 녹음한 음성파일의 평균 기본주파수를 분석하였다. 이후 각 성별 내 언어 ${\times}$ 과제 이원 배치 분산 분석(two-way repeated ANOVA) 및 집단 ${\times}$ 언어의 이원 혼합 분산 분석(two-way mixed ANOVA)을 실시하였다. 그 결과, 언어 및 과제에 따라 균형적 이중언어 집단의 남녀 대상군 별로 상이한 결과가 나타났다. 여성의 경우 한국어보다 영어의 평균 기본주파수가 유의하게 높았으며(p=.003), 자발화과제보다 읽기 과제에서 평균 기본주파수가 유의하게 높았다(p=.002). 그러나 남성의 경우, 어떠한 조건에서도 유의한 결과가 나타나지 않았다. 두 번째로, 언어 능숙도에 따른 집단 간 비교에서 여성 대상자들에서만 언어 간 기본주파수 변화가 통계적으로 유의하게 나타났다(p=.000). 즉, 한국어 읽기 과제에서 평균 기본주파수가 영어 읽기 과제보다 유의하게 높았다. 그러나 언어 능숙도에 따른 평균 기본주파수의 변화는 통계적으로 유의하지 않았다(p=.830). 남성 대상자의 경우는 어떤 조건에서도 유의한 결과는 없었다. 결과적으로, 이중언어 화자의 언어 간 평균 기본주파수의 변화는 언어의 능숙도와 관계없이 성별에 따라 상이하게 나타났으며 본 연구를 바탕으로 언어 간 평균 주파수의 차이가 해부생리학적 요인이나 언어학적 요인보다도 사화문화적인 요인에 의한 것임을 생각해 볼 수 있도록 한다.

이중언어와 문장 처리 전략: 한국어-중국어 이중언어자의 전략후행전이 (Bilingualism and Processing Strategies: Backward Transfer in Korean-Chinese Bilinguals)

  • Lee, Kwee-Ock;Jun, Jong-Sup;Park, Hye-Won;Ahn, Jung-Ok
    • 인지과학
    • /
    • 제14권4호
    • /
    • pp.21-31
    • /
    • 2003
  • 이 논문은 한국어-중국어(=KC) 이중언어자의 문장 처리 전략을 실험적으로 연구하여 한국어 단일언어자의 문장 처리 전략과 비교함으로써 (1) KC 이중 언어에 나타나는 문장 처리 전략의 전반적 특징을 밝히고, (2) 제 1 언어 처리 전략과 제 2 언어 처리 전략 간의 간섭이 이중 언어 발달에 영향을 줄 수 있음을 보이는 것을 목적으로 한다. 이를 위해 우리는 중국 연변 조선족 집거촌의 만 3세부터 성인에 이르는 다양한 연령 집단에서 166 명의 피험자를 모집하여 실시간 주어/행동주 판정 실험을 실시하였다 (cf. Liu, Bates & Li, 1992). 실험 결과를 한국어 단일언어자 대상의 이전 연구와 비교하여 다음 결론에 도달하였다. 첫째, 한국어 단일언어 아동은 3-4세 경 생물성 (animacy)에 근거해 문장의 주어/행동주를 판별하는 반면, KC 이중언어 아동은 생물성 전략 이외에도 어순 전략을 많이 활용한다. 둘째. KC 이중언어자가 주어/행동주 판별에 형태소를 활용하는 시기는 10세 이후로 한국어 단일언어 아동의 5세 경과 비교하여 많이 늦다. 셋째, 한국어 단일언어자 성인은 형태소 전략을 최우선적으로 활용하는 반면, KC 이중언어자는 성인이 되어서도 형태소 전략 이외에 생물성 전략과 어순 전략을 적극적으로 활용한다. KC 이중언어자의 언어 수행은 생물성과 어순이 중요한 중국어의 영향을 받은 것으로 보이며, 이는 Liu, Bates & Li (1992)가 제안하는 조기이중언어자의 전략 후행 전이를 지지하는 결과라 할 수 있다.

  • PDF