• 제목/요약/키워드: 제2언어로서의 한국어

검색결과 51건 처리시간 0.022초

현행 KS 완성형 한글 코드의 문제점 (Issues in KS Complete Type Hangul Code)

  • 김충회
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.21-28
    • /
    • 1989
  • 국내에 컴퓨터가 처음 도입된 이후부터 컴퓨터의 한글 처리 문제는 '과연 컴퓨터에서 한글 처리가 가능할까?'하는 의구심에서부터 시작하여 그동안 한글 처리 방식이 각양각색으로 N 바이트나, 3 바이트, 7 비트 2 바이트 완성형, 8 비트 2 바이트 완성형, 8 비트 2 바이트 조합형이니 하여 난립하여 왔다. 이로 말미암아 소프트웨어의 호환은 물론 한글 문서의 호환마저 불가능하여 사용자가 겪는 불편이란 이루 말할 수 없을 뿐 아니라 정보화시대에 정보 교환을 가로막는 장애 요소로 등장하게 된 것이다. 이런 배경 속에서 자연스럽게 한글 코드의 표준화의 중요성을 인식하게 되어 정부에서는 1987년 3월 '정보 교환용 부호에 관한 한글 공업 규격' (KS C-5601-1987)을 새로 정하게 되었다. 그러나 한글의 가장 뛰어난 조합에 의한 확장성을 무시한 '2 바이트 완성형'을 채택 2,350 자의 한글로 제한을 해 놓았기 때문에 제 나라 국어도 재대로 표현할 수 없는 절름발이 한글이 되고 말았다. 이와 같은 결합이 있는 한글을 이제 교육용 컴퓨터에서까지 채택함에 이르러 우리의 지혜를 모아야 할 때라고 생각하면서 문제를 제기하고자 한다.

  • PDF

대규모 언어 모델 및 인컨텍스트 러닝을 활용한 수치 추론 데이터셋 증강 (Numerical Reasoning Dataset Augmentation Using Large Language Model and In-Context Learning)

  • 황예찬;임진수;이영준;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델의 인컨텍스트 러닝과 프롬프팅을 활용하여 수치 추론 태스크 데이터셋을 효과적으로 증강시킬 수 있는 방법론을 제안한다. 또한 모델로 하여금 수치 추론 데이터의 이해를 도울 수 있는 전처리와 요구사항을 만족하지 못하는 결과물을 필터링 하는 검증 단계를 추가하여 생성되는 데이터의 퀄리티를 보장하고자 하였다. 이렇게 얻어진 증강 절차를 거쳐 증강을 진행한 뒤 추론용 모델 학습을 통해 다른 증강 방법론보다 우리의 방법론으로 증강된 데이터셋으로 학습된 모델이 더 높은 성능을 낼 수 있음을 보였다. 실험 결과 우리의 증강 데이터로 학습된 모델은 원본 데이터로 학습된 모델보다 모든 지표에서 2%p 이상의 성능 향상을 보였으며 다양한 케이스를 통해 우리의 모델이 수치 추론 학습 데이터의 다양성을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

융합적 관점에서 본 병원 사인시스템 다중언어 표기 현황 조사 - 부산 및 경남지역 의료기관을 중심으로 - (A Field Research on Multi-Language Sign System in Hospital at the Point of View in Convergent Study - Focused on General Hospital in Busan and South Gyeongsang Province -)

  • 박한나;백진경
    • 한국과학예술포럼
    • /
    • 제37권1호
    • /
    • pp.87-97
    • /
    • 2019
  • 본 연구는 최근 몇 년간 빠르게 성장하는 국제간의 의료관광 및 외국인 환자 유치의 추세에 따라 국내 의료현황을 파악하고자 하는 것에서 시작하였다. 그 중, 국내 수도인 서울에 이어 외국인 환자 유치율 2위를 차지하고 있는 부산의 경우, 지난 8년간, 외국인 환자가 426%가량 증가하는 등 상당한 활성화가 되어있으며, 해상을 통해 입국한 러시아 환자 등의 다국적인 구성이 특징이다. 또한 부산권인 경남지역 중 김해와 창원은 외국인 거주자 수로 경남 도내 1위, 2위를 차지하고 있으며 다양한 외국인노동자들이 거주하고 있다. 종합병원과 같은 의료기관에서는 병원 내 길 찾기가 용이하여야 한다. 또한, 한국어, 영어, 중국어, 혹은 러시아어가 포함된 다양한 언어의 정보를 하나의 매개체 안에 전달해야 하는 공간이다. 이를 바탕으로 본 연구에서는 우리나라 언어에 미숙한 외국인들이 병원을 방문하였을 때 제시된 사인시스템에서 인지를 함에 있어서 쉽게 이해할 수 있도록 도와주는 융합적인 정보 전달을 목적으로 한다. 따라서 본 논문은 국내 제 2의 도시인 부산광역시 소재 대학병원 의료기관 6곳(A, B, C, D, E, F)과 부산권이면서 외국인 거주 비율이 높은 경상남도 김해시 의료기관(G, H), 창원시 대학병원 의료기관(R, J)등 총 10곳을 대상으로 사인시스템(유도사인, 안내사인, 실간판)의 현황을 파악하고 현재 적용되고 있는 다중언어 표기 실태 조사를 이행하였다. 연구결과 및 내용은 다음과 같다. 첫째, 사인시스템 디자인을 분석한 결과는 대체적으로 어두운 회색 및 채도가 높은 파란색 혹은 흰색의 바탕색을 적용한 후 서체는 무채색의 고딕체를 사용, 화살표 및 픽토그램으로 포인트 효과를 주어 일반적인 병원 사인시스템 디자인을 도입하고 있는 것으로 파악되었다. 둘째, 다중언어 실태의 결과는 주로 한국어, 영어와 같이 2가지의 언어만을 사인시스템에 도입하고 있는 곳과 지리적인 위치에 따라 한국어, 영어, 중국어, 러시아어와 같은 4가지의 언어를 적용시킨 곳도 조사되었다. 그러나 대부분의 의료기관은 현재 2가지의 언어(한국어, 영어)만이 적용되어져 있는 상황에 따라 영어권 나라가 아닌 타 국가의 외국인 환자들에게는 언어적인 측면에서 다소 불편한 점이 초래될 수 있다고 판단되었다. 이러한 연구결과를 바탕으로 추후에는 병원 사인시스템 다중언어 사용에서 외국인 사용자 뿐만 아니라 내국인들도 고려한 디자인을 제안하는 연구가 필요하다.

대명사 해결에 미치는 통사단서 및 맥락의 역할

  • 방희정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.112-119
    • /
    • 1990
  • 본 연구에서는 글이해시의 참조관계 처리과정에서 맥락이 어떤 역할을 하며 다른 통사단서와는 어떤 관계를 갖는지를 대명사 해결을 중심으로 조사했다. 실험 1에서는 대용어 문장의 국소적 맥락에 의한 촉진효과가 관찰되었다. 그러나 맥락과 통사단서간의 상호작용으로 맥락 촉진효과는 통사적 명료조건에서보다는 애매조건에서 더 강하게 나타났다. 실험 2에서는 국소적 맥락정보가 없더라도 선행글의 전체주제적 맥락정보가 촉진제 역할을 하는 것으로 밝혀졌다. 또한 전체주의적 맥락이 주어지는 경우 글의 표면구조적 특성에 따른 위치효과가 나타나지 않았다. 즉 두 개의 실험을 통해 대명사 해결에 미치는 통사단서의 효과가 일부 지지되었으며, 특히 맥락효과는 국소적, 총체적 수준에서 모두 일관되게 입증되었다.

  • PDF

한국어 수분류사 어휘의미망 KorLexClas 1.5 (KorLexClas 1.5: A Lexical Semantic Network for Korean Numeral Classifiers)

  • 황순희;권혁철;윤애선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.60-73
    • /
    • 2010
  • 본 연구의 목적은 한국어 수분류사 체계를 설정하고, 수분류사와 공기명사 간 의미관계 정보를 제공하는 한국어 수분류사 어휘의미망 "KorLexClas 1.5"의 정보구조와 구축방식을 소개하는 데 있다. KorLex 명사, 동사, 형용사, 부사가 영어 워드넷(Princeton WordNet)을 기반으로 참고구축 방식으로 개발된 것에 비해, KorLexClas 1.0버전과 이를 확장한 1.5버전은 직접구축 방식으로 개발하였다는 점에서, 수분류사의 계층구조와 언어단위 간 의미관계 설정은 매우 방대한 시간과 정교한 구축 방식을 요구한다. 따라서 작업의 효율성을 기함과 동시에, 구축된 어휘의미망의 신뢰성 및 확장성을 높이기 위해, (1) 다양한 기구축 언어자원을 활용하되 상호 검증하는 절차를 거치고, (2) 부분문장 분석방법을 이용하여, 수분류사 및 공기명사 목록을 확장하며, (3) 언어학적 준거를 기준으로 수분류사의 계층구조를 설정하고, (4) 수분류사와 공기명사 간 의미관계 정보를 제공하되 확장성을 확보하기 위해, KorLexNoun 1.5에 '최하위 공통상 위노드(LUB : Least Upper Bound)'를 설정하는 방식을 택한다. 이러한 특성을 가진 KorLexClas 1.5는 기계번역을 비롯한 한국어정보처리의 제 분야에 응용될 수 있다.

한국어교육에서의 형태초점교수법 연구: 비판적 검토 (Research on Form-focused Instruction in Korean Language Education: A Critical Review)

  • 최선희;김대희
    • 한국융합학회논문지
    • /
    • 제8권2호
    • /
    • pp.269-276
    • /
    • 2017
  • 본 연구의 목적은 한국어 교육에서의 형태초점교수법의 효과를 검증하기 위하여 지금까지 행해진 실증적 연구를 비판적 시각으로 검토하는 것이다. 이 목적을 달성하기 위해 다수의 논문 데이터베이스를 검색하여 총 66개의 논문을 찾았으며, 이중 실증적 자료를 제시한 12개의 논문을 연구대상으로 채택하였다. 채택된 논문들을 연구 참여자, 목표 문법, 처치, 측정, 효과성을 기준으로 분석하였다. 전반적으로 형태초점교수법에 속하는 다양한 교수 전략들은 한국어를 제2언어로 가르치는데 효과가 있는 것으로 나타났다. 본 연구의 결과는 형태초점 교수법에 영향을 미치는 요인을 파악하는 데 필요한 체계를 제공할 것이며, 또한 선행 연구의 메타 분석에 필요한 정보를 제공할 것이다.

지각적 표현에 기초한 비음 인식에 관한 연구 (Nasal Consonants Recognition Based on the Perceptual Representation)

  • 김기철;조정완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.120-125
    • /
    • 1989
  • 음성 신호에는 언어정보이외에 여러 요인에 의한 정보가 포함되어 있어서, 문자와 일대일로 대응되는 분절을 정확하게 검출하기가 어렵다. 본 연구에서는 선형 예측계수 (LPC) 스펙트럼의 첨두 부분을 강조한 이진 (binary) 스펙트럼을 제안하고, 이를 바탕으로 음의 안정영역과 천이영역을 통합하여 음향특징을 추출하고자 한다. 각 영역의 특징은 이진 스펙트럼을 누적하여 구하며, 통합적인 특징은 각 영역의 특징을 결합한 관계적 특징으로 나타낸다. 제 2 차 포르만트 주파수의 궤적을 관계적 특징으로 하여, 양순 비음과 치조 비음을 구별한 결과, 모음의 문맥과 화자에 비교적 독립적인 인식결과를 얻을 수 있었다. 또한 이진 스펙트럼이 원래의 스펙트럼에 포함된 정보를 유지하는지 검토하기 위해, 같은 거리척도 (distance measure) 에 의해 인식 실험한 결과 이진 스펙트럼의 성능이 오히려 우수하게 나타났으며, 관계적 이진 스펙트럼의 경우 화자에 따른 변화가 더욱 적었다. 음성에 백색 잡음 (Gaussian white noise)을 더하여 잡음음성 (noisy speech) 을 만든 뒤, 같은 방법으로 실험한 결과도 유사한 인식결과를 얻을 수 있어 제안된 이진 스펙트럼의 유효성을 확인하였다.

  • PDF

DPR의 효과적인 하드 네거티브 샘플링을 통한 효율적인 대조학습 방법 (Efficient contrastive learning method through the effective hard negative sampling from DPR)

  • 박성흠;김홍진;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.348-353
    • /
    • 2022
  • 최근 신경망 기반의 언어모델이 발전함에 따라 대부분의 검색 모델에서는 Bi-encoder를 기반으로한 Dense retrieval 모델에 대한 연구가 진행되고 있다. 특히 DPR은 BM25를 통해 정답 문서와 유사한 정보를 가진 하드 네거티브를 사용하여 대조학습을 통해 성능을 더욱 끌어올린다. 그러나 BM25로 검색된 하드 네거티브는 term-base의 유사도를 통해 뽑히기 때문에, 의미적으로 비슷한 내용을 갖는 하드 네거티브의 역할을 제대로 수행하지 못하고 대조학습의 효율성을 낮출 가능성이 있다. 따라서 DRP의 대조학습에서 하드 네거티브의 역할을 본질적으로 수행할 수 있는 문서를 샘플링 하는 방법을 제시하고, 이때 얻은 하드 네거티브의 집합을 주기적으로 업데이트 하여 효과적으로 대조학습을 진행하는 방법을 제안한다. 지식 기반 대화 데이터셋인 MultiDoc2Dial을 통해 평가를 수행하였으며, 실험 결과 기존 방식보다 더 높은 성능을 나타낸다.

  • PDF

Clicker를 활용한 한국어 교실 상호 작용 증진 방안 연구 (A Study on Method for Promoting Interaction in L2 Classroom Using Clickers)

  • 류혜진
    • 한국어교육
    • /
    • 제25권1호
    • /
    • pp.53-82
    • /
    • 2014
  • This study aims to find the method to promote interaction in L2 classrooms. Active interaction between learner-to-learner and learner-to-teacher in L2 classroom plays an important role in language acquisition. In light of this, L2 classroom would benefit with the help of learning tools such as Clickers which helps learners to express their level of understanding during the process of learning itself. This is because the anonymity of Clickers allows learners to express their needs without the social risks associated with speaking up in the class. It allows for an evaluative feedback loop where both learners and teachers understand the level of progress of the learners, better enabling classrooms to adapt to the learners' needs. Eventually this tool promotes participation from learners, This is in turn, believed to be effective in fostering classroom interaction, allowing learning to take place in a more comfortable yet vibrant way. This study is finalized by presenting the result of an experiment conducted to verify the effectiveness of this approach when teaching pragmatic aspect of the Korean expressions with similar semantic functions. As a result of the research, the learning achievement of learners in the experimental group was found higher than the learners' in a control group. Analyzing the data collected from a questionnaire given to the learners, the study presented data suggesting that this approach increased the scope of interactivity in the classroom, thus enhancing more active participation among learners. This active participation in turn led to a marked improvement in their communicative abilities.

중국계 결혼이주여성의 자녀 모어 교육에 관한 연구 (Second Language Acquisition for Children of Korean and Chinese Multicultural Family)

  • 이춘양;박미숙
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.367-375
    • /
    • 2018
  • 본 연구의 목적은 중국계 결혼이주여성들이 자신의 모국어인 중국어를 자녀들에게 제2언어로 교육하지 못하는 원인을 그들의 경험을 통하여 탐색하고 이에 대한 개선방안을 제시하는 것이다. 이를 위해 2017년 3월부터 2017년 6월까지 한국 거주한지 10년 이상 된 중국인 결혼이주여성 4명을 대상으로 심층인터뷰를 하고 그 내용을 분석하였다. 분석한 결과 결혼이주여성들이 자녀들에게 자신의 모국어를 교육하지 못하는 요인은 크게 네 가지로 나타났다. 첫째, 결혼이주여성 자신이 한국 환경에 적응하기 바빠 어려서부터 자녀에게 모어 가르치는 것을 소홀히 하였다. 둘째, 자녀들이 한국에서 살아가야하기 때문에 중국어보다 한국어교육에 더 많이 신경 쓰고 있었다. 셋째, 어머니 나라의 부정적인 인식 때문에 어머니의 모어를 배우려하지 않았다. 넷째, 한국인들의 부정적인 인식 때문에 당당하게 자신의 언어와 문화를 교육 시킬 수 없었다. 이와 같은 결과를 통하여 결혼이주여성들이 자녀들에게 모어를 가르쳐줄 수 있는 학습기회와 환경을 마련되길 기대한다.