• 제목/요약/키워드: 언어와 비언어

검색결과 1,700건 처리시간 0.027초

한국어 구문 분석과 문장 생성을 위한 범주 문법 적용의 몇 가지 원칙 (Some Application Principles of Categorial Grammars for Korean Syntactic Analysis and Sentence Generation)

  • 송도규;차건회;박재득
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-359
    • /
    • 1997
  • 주로 영어, 불어 등의 형상적 언어(configurational languages)의 구문 분석을 위해 개발된 범주 문법은 문장 구성 성분의 문장 내의 위치가 대체적으로 고정적이며 통사 기능이 그 위치로서 할당 되는 형상적 언어의 통사적인 특성에 따라 방향성의 개념을 도입하였다. 그러나 이 방향성 개념은 문장 구성 성분의 문장 내의 위치가 비교적 자유로운 한국어 등의 비형상적 언어(non-configurational languages)에 그대로 적용하기에는 많은 무리가 따른다. 심지어 형상적 언어에 적용하는 경우에도 도치나 외치된 문장 또 격리된 구조(unbounded dependency constructions)가 있는 문장들도 적절히 분석해 내지 못한다. 이런 이유로 본고에서는 범주 문법에 도입되어 있는 방향성을 재고하고 아울러 한국어 구문 분석과 문장 생성을 위한 범주 문법 적용상의 다섯 원칙을 제안한다.

  • PDF

문화차이에 따른 상호 행동 의미의 차이가 e-Learning에서 학습자에게 미치는 영향 (Influence of the Meaning of the Mutual Action in the Cultural Differences of the Learners in e-Learning)

  • 신상규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.1015-1017
    • /
    • 2015
  • 본 연구는 서로 다른 문화간에 e-Learning과 같은 학습 시스템을 제공할 때, 학습 제공자의 문화적 차이에 의한 비언어적 행동이 학습자에게 미치는 영향에 대해 다루고 있다. 지금까지 사회언어학적인 관점에서 서로 다른 문화간의 언어행동에 관한 연구는 있었지만 비디오 학습이나 웹과 같이 원거리에서 이루어지는 학습 지원 시스템에서의 언어행동에 관한 연구는 없었다. 본 연구에서는 행동언어학적인 관점에서 이루어진 연구를 바탕으로, 한국인과 일본인을 대상으로 하여 실제 강의가 이루어지는 동안 언어행동의 문화적 차이가 미치는 영향과 그 결과를 검증했다.

발도르프 프로그램을 준용한 중도입국 청소년의 이중언어 교수-학습 방안 (Bilingual Teaching-Learning Plan for Migrant Youths Based on the Waldorf Program)

  • 문경임
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.161-164
    • /
    • 2019
  • 한국 사회는 빠르게 다문화 사회로 진입되고 있어 인구 구성과 집단이 다양해 질것으로 전망하고 있다. 다양한 형태의 가족 중 중도입국 청소년들의 비율이 점점 증가하고 있다. 대부분의 중도입국 청소년들은 준비가 전혀 이루어진 않은 상태에서 우리나라에 입국하는 실정이므로 언어장벽에서 진로장벽에 이르기 까지 매우 취약한 여건과 불안정한 환경에 처해 있는 것이다. 이를 해결하는 방안으로 국가나 지방자치단체는 물론 각급 교육기관에서 다양한 프로그램으로 서비스가 지원되고 있으나 사업 간의 중복성과 일부 비효율적인 전달체계와 운영, 예산과 인력 낭비로 인하여 효과성을 낮추는 경향이 있다. 본 논문에서는 중도입국 청소년들의 발달주기, 학령주기, 한국어 구사 능력에 따라 개인의 능력에 따른 맞춤형 언어교육으로 올바르게 성장하도록 도움을 주는 방안을 제시한다. 제시한 내용은 이중언어 교육방법과 발도르프 교육 프로그램을 준용한 교수-학습 방안이다.

  • PDF

무작위 문장 삽입 노이징을 적용한 BART 기반의 한국어 문서 추상 요약 (BART with Random Sentence Insertion Noise for Korean Abstractive Summarization)

  • 박주홍;권홍석;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.455-458
    • /
    • 2020
  • 문서 요약은 입력 문서의 핵심 내용을 파악하여 짧고 간결한 문장으로 나타내는 과정이다. 최근에는 문서 요약을 위해 사전 학습된 언어 모델을 이용하는 방식이 여럿 제안되고 있지만, 이러한 언어 모델들은 문서 요약의 특성을 고려하지 않고 설계된 입력 노이즈 방식을 사용하는 한계점이 있다. 본 논문에서는 한국어 문서 추상 요약에 사전 학습 언어 모델인 BART를 도입하고, 입력 문서에 무작위 문장을 삽입하는 노이징 방식을 추가하여 문서 추상 요약 모델의 언어 이해 능력을 향상시키는 방법론을 제안한다. 실험 결과, BART를 도입한 문서 요약 모델의 결과는 다른 요약 모델들의 결과에 비해 전반적으로 품질 향상을 보였으며, BART와 함께 무작위 문장을 삽입하는 노이징 방법은 적은 비율로 삽입하는 경우 추가적인 성능 향상을 보였다.

  • PDF

아바타수어 서비스를 위한 한국수어 스크립트 기술 (A Script Format of Korean Sing Language for Animated Signing Avatar Service)

  • 이한규;최지훈;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.456-458
    • /
    • 2020
  • 한국수화언어(한국수어)는 농인들이 사용하는 언어이며, 농인이라 함은 청각장애를 가진 사람으로서 한국수어를 일상어로 사용하는 사람을 말한다. 수어를 하나의 언어로써 다른 언어로의 번역 또는 상호번역을 위하여 기계학습 기반의 기술이 연구개발 되고 있으나, 수어는 영상 기반의 언어이고 한국수어의 문법 및 사전체계의 구축이 진행 중인 이유로 한국수어의 번역기술은 상대적으로 다른 이종언어 간의 번역기술에 비하여 발전속도가 느리다. 본 논문에서는 한국어를 한국수어로 번역하여 표현하기 위하여 필요한 수어 스크립트 포맷 및 데이터 인터페이스 규격을 제안한다.

  • PDF

마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환 (Unpaired Korean Text Style Transfer with Masked Language Model)

  • 배장성;이창기;황정인;노형종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.391-395
    • /
    • 2021
  • 텍스트 스타일 변환은 입력 스타일(source style)로 쓰여진 텍스트의 내용(content)을 유지하며 목적 스타일(target style)의 텍스트로 변환하는 문제이다. 텍스트 스타일 변환을 시퀀스 간 변환 문제(sequence-to-sequence)로 보고 기존 기계학습 모델을 이용해 해결할 수 있지만, 모델 학습에 필요한 각 스타일에 대응되는 병렬 말뭉치를 구하기 어려운 문제점이 있다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행하는 방법들이 연구되고 있다. 이 연구들은 주로 인코더-디코더 구조의 생성 모델을 사용하기 때문에 입력 문장이 가지고 있는 내용이 누락되거나 다른 내용의 문장이 생성될 수 있는 문제점이 있다. 본 논문에서는 마스크 언어 모델(masked language model)을 이용해 입력 텍스트의 내용을 유지하면서 원하는 스타일로 변경할 수 있는 텍스트 스타일 변환 방법을 제안하고 한국어 긍정-부정, 채팅체-문어체 변환에 적용한다.

  • PDF

간결한 한글 프로그래밍 언어 "새싹" (A Concise Korean Programming Language "Sprout")

  • 천준석;강도훈;김건우;우균
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.496-503
    • /
    • 2015
  • 현재 사용되고 있는 대부분의 프로그래밍 언어는 영어를 기반으로 제작되어 있다. 이러한 점은 비영어권 국가에서 프로그래밍 언어를 배우는 데 장벽이 된다. 완전하게 자국어로 만들어진 프로그래밍 언어가 있다면 프로그래밍의 교육비용이 많이 줄게 될 뿐만 아니라 학생들도 더 많은 흥미를 느끼게 될 것이다. 그러나 자국어를 바탕으로 한 프로그래밍 언어 설계는 큰 주목을 받지 못했으며 발표된 연구 결과도 많지 않다. 그 원인은 한편으로 프로그래밍 언어가 너무 빠르게 발전하고 있기 때문이며 다른 한편으로는 소스코드보다 프로그램의 효율성이 더 강조되어 왔기 때문이다. 하지만 자국어를 바탕으로 프로그래밍 언어를 설계하는 것은 하찮은 문제가 아니며 특히 프로그래밍 교육 측면에서 매우 중요하다. 사실 한글 프로그래밍 언어 분야에는 적잖은 연구 결과가 있었지만 실제로 한글 언어가 실제로 교육에 사용된 사례는 드물다. 이 논문에서는 배우기 쉬운 한글 프로그래밍 언어인 새싹을 소개한다. 새싹의 간결성을 입증하기 위해 두 개의 실험을 수행하였다. 첫째, 새싹으로 작성된 프로그램과 다른 한글 프로그래밍 언어로 작성된 프로그램의 크기를 비교하였다. 둘째, 새싹 언어 자체의 크기를 C나 Python 등 널리 사용되는 언어의 크기와 비교하였다. 실험 결과 새싹으로 작성된 프로그램의 크기는 다른 한글 프로그래밍 언어로 작성된 프로그램보다 평균 10% 더 간결하였다. 또한, 새싹 언어의 크기는 널리 사용되는 언어보다 평균 24% 간결하였다.

언어창조성과 춈스키 문법 비판 (Linguistic Productivity and Chomskyan Grammar: A Critique)

  • Bong-rae Seok
    • 인문언어
    • /
    • 제1권1호
    • /
    • pp.235-251
    • /
    • 2001
  • 춈스키의 언어 이론에 따르면, 인간은 무한한 수의 어법에 맞는 문장을 말하고 이해할 수 있다. 언어 창조성이라고 하는 이러한 능력은 이상화된 언어 능력을 전제한다. 사람들이 실제로 언어를 사용하여 의사 소통을 할 때는 단기 기억이나 주의 집중이라는 인지 능력의 한계로 인해 이러한 창조성에 많은 제약이 따른다. 하지만 언어의 창조성은 이러한 언어 실행 능력과는 관계없는 순수 언어 능력을 고려할 때 이해된다고 춈스키는 주장한다. 충분한 시간과 기억 능력이 보장된다면, 인간 언어능력이 제약될 이유가 없다. 언어 창조성은 마치 덧셈을 하는 인간의 능력과 비교된다. 국민학교 산수를 공부한 학생은 덧셈을 할 수 있다. 덧셈 능력이 인간의 마음에 자리를 잡으면 어떤 숫자를 놓고도 덧셈을 할 수 있다. 물론 실제로 엄청난 숫자를 덧셈하는 데는 문제가 많다. 하지만 충분한 시간과 연필과 종이가 있다면 원칙상 어떤 숫자를 놓고도 덧셈을 할 수 있다. 본 논문에서는 필자는 이러한 언어 능력이 필요 이상 이상화되었음을 중앙 삽입형 문장들을 고찰함으로써 지적하고자 한다. 중앙 삽입형 문장 (center embedded sentences) 또는 양파 문장 (onion sentences) 들은 이상화된 언어능력의 측면에서는 문법적일지 모르지만 실제로 사람들은 이 문장들을 거의 사용하고 있지 않으며 거의 이해하고 있지도 않는 문장들이다. 그 이유는, 춈스키에 의하면, 비언어적 인지 능력의 제약 때문이다. 기억력이나 주의 집중력이 모자라서 그런 문장을 잘 쓰지 않지만 그런 조건이 따라 주면 그런 문장들이 무엇을 뜻하는 지 다 알 수 있다는 것이다. 따라서 이 문법적인 문장을 사용하지 않는다는 것이 언어 창조성에 대한도전이 될 수 없다고 그는 주장한다. 필자는 이 문장들이 단순한 단기 기억이나 주의 집중의 문제가 아니라 실제로 인간 언어 능력의 제약을 보여 줄 수 있는 인지적 조건들을 보여 주고 있다고 생각한다. 따라서 인간의 언어 능력이 무한수의 문장을 구성하고 이해할 수 있다는 주장은 언어 능력의 인지적 제약을 고려하지 못한 주장이다.

  • PDF

사전 학습된 한국어 언어 모델의 보정 (Calibration of Pre-trained Language Model for Korean)

  • 정소영;양원석;박채훈;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.243-248
    • /
    • 2020
  • 인공 신경망을 통한 심층 학습 모델의 발전은 컴퓨터 비전, 자연언어 이해 문제들에서 인간을 뛰어넘는 성능을 보이고 있다. 특히 트랜스포머[1] 기반의 사전 학습 모델은 질의응답, 대화문과 같은 자연언어 이해 문제에서 최근 높은 성능을 보이고 있다. 하지만 트랜스포머 기반의 모델과 같은 심층 학습 모델의 급격한 발전 양상에 비해, 이의 동작 방식은 상대적으로 잘 알려져 있지 않다. 인공 신경망을 통한 심층 학습 모델을 해석하는 방법으로 모델의 예측 값과 실제 값이 얼마나 일치하는지를 측정하는 모델의 보정(Calibration)이 있다. 본 연구는 한국어 기반의 심층학습 모델의 해석을 위해 모델의 보정을 수행하였다. 그리고 사전 학습된 한국어 언어 모델이 문장이 내포하는 애매성을 잘 파악하는지의 여부를 확인하고, 완화 기법들을 적용하여 문장의 애매성을 확신 수준을 통해 정량적으로 출력할 수 있도록 하였다. 또한 한국어의 문법적 특징으로 인한 문장의 의미 변화를 모델 보정 관점에서 평가하여 한국어의 문법적 특징을 심층학습 언어 모델이 잘 이해하고 있는지를 정량적으로 확인하였다.

  • PDF

반복학습법에 의해 작성한 N-gram 언어모델을 이용한 연속음성인식에 관한 연구 (Continuous Speech Recognition Using N-gram Language Models Constructed by Iterative Learning)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국음향학회지
    • /
    • 제19권6호
    • /
    • pp.62-70
    • /
    • 2000
  • 일반적으로 통계적 언어모델의 확률을 추정하는 방법은 대량의 텍스트 데이터로부터 출현빈도가 높은 단어를 선택하여 사용하고 있다. 하지만 특정 태스크에서 적용할 언어모델의 경우 시간적, 비용적 측면을 고려할 때 대용량의 텍스트의 사용은 비효율적일 것이다. 본 논문에서는 특정 태스크에서 사용하기 위해 소량의 텍스트 데이터로부터 효율적인 언어모델을 작성하는 방법을 제안한다. 즉, 언어모델을 작성할 때 출현빈도가 낮은 단어의 빈도를 개선하기 위해 같은 문장을 반복하여 학습에 참가시키므로 단어의 발생확률을 좀 더 강건하게 하였으며 제안된 언어모델을 이용하여 3명이 발성한 항공편 예약관련 200문장에 대하여 연속음성인식 실험을 수행하였다. 인식실험 결과, 반복학습에 의해 작성한 언어모델을 이용한 경우가 반복학습 적용 전에 비하여 평균 20.4%의 인식률 향상을 보였다. 또한 기존의 문맥자유문법을 이용한 시스템과 비교하여 인식률이 평균 13.4% 향상되어 제안한 방법이 시스템에 유효함을 확인하였다.

  • PDF