• 제목/요약/키워드: 언어성

검색결과 4,737건 처리시간 0.034초

한국어 언어 모델의 정치 편향성 검증 및 정량적 지표 제안 (Measurement of Political Polarization in Korean Language Model by Quantitative Indicator)

  • 김정욱;김경민;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-21
    • /
    • 2022
  • 사전학습 말뭉치는 위키백과 문서 뿐만 아니라 인터넷 커뮤니티의 텍스트 데이터를 포함한다. 이는 언어적 관념 및 사회적 편향된 정보를 포함하므로 사전학습된 언어 모델과 파인튜닝한 언어 모델은 편향성을 내포한다. 이에 따라 언어 모델의 중립성을 평가할 수 있는 지표의 필요성이 대두되었으나, 아직까지 언어 인공지능 모델의 정치적 중립성에 대해 정량적으로 평가할 수 있는 척도는 존재하지 않는다. 본 연구에서는 언어 모델의 정치적 편향도를 정량적으로 평가할 수 있는 지표를 제시하고 한국어 언어 모델에 대해 평가를 수행한다. 실험 결과, 위키피디아로 학습된 언어 모델이 가장 정치 중립적인 경향성을 나타내었고, 뉴스 댓글과 소셜 리뷰 데이터로 학습된 언어 모델의 경우 정치 보수적, 그리고 뉴스 기사를 기반으로 학습된 언어 모델에서 정치 진보적인 경향성을 나타냈다. 또한, 본 논문에서 제안하는 평가 방법의 안정성 검증은 각 언어 모델의 정치적 편향 평가 결과가 일관됨을 입증한다.

  • PDF

빌헬름 폰 훔볼트의 언어사상 (W. v. Humboldt′s Thought)

  • 안정오
    • 인문언어
    • /
    • 제6권
    • /
    • pp.77-108
    • /
    • 2004
  • 훔볼트의 언어관을 테마별로 요약하면 다음과 같이 도표로 나타낼 수 있다. 언어생성 : 언어원형 \$\longrightarrow$ 에네르게이아, 내적언어형식 \$\longrightarrow$ 유추와 통합 \$\longrightarrow$ 언어본질 사회성/화용성 \$\longrightarrow$ 언어적 세계관 =민족 \$\longrightarrow$ 번역의 문제 \$\longrightarrow$ 언어와 사고 훔볼트에서 언어문제는 먼저 생성문제로부터 출발해야 한다. 그의 생성관을 이해할 때 언어의 본질이 이해되고 그리고 언어의 생성과정을 통하여 문법과 하드웨어적인 언어형태를 이해할 수 있다. 그리고 나서 그 언어의 사용처인 사회와의 관계를 조망하면서 민족의 필요성과 언어의 화용성이 동시에 풀리게 된다. 각기 다른 민족의 언어는 다른 세계관을 형성하는데 그 세계관이 즉 민족이다. 이렇게 언어는 상이한 환경과 문화에서 생성 발전됨으로 각각 다른 현상은 음의 현상이나 외관의 현상이 아니고 세계관의 상이성에서 기인하므로 절대 서로 서로 완전한 번역을 불가능하다. 이런 언어는 결국에는 민족의 언어를 통해 개인으로 넘어가고 개인은 각각 자신만의 언어를 가지게된다. 그래서 훔볼트가 말하는 개별성과 보편성의 문제에서 민족마다의 차이점을 그는 개별성으로 이해하기도 하지만 실은 각 개인의 개별성의 의미도 포함하고 있다.

  • PDF

언어지식 획득 과정에서의 수렴성 보장에 관한 연구 (Researches on the Convergence of Linguistic Knowledge Acquisition Process)

  • 이현아;박재득;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.416-420
    • /
    • 1997
  • 다양한 응용 목적의 대규모 실용적 언어지식 구축을 위해서는 한국어의 모든 언어현상을 수용할 수 있는 이상적인 언어지식(optimal linguistic knowledge) 획득을 목표로 연구해 나가야 한다. 본 연구에서 언어지식의 획득은 주어진 말뭉치의 분석을 통해 이루어진다. 주어진 말뭉치에서 새로운 언어현상이 발견되었을 경우, 기존의 언어지식은 새로운 언어현상을 수용할 뿐만 아니라 기존에 발견되었던 언어현상도 함께 수용할 수 있도록 바뀌어져야 한다. 이러한 변화의 원칙이 보장되어야만 언어지식의 양적 확장과 함께 질적 확장을 이룰 수 있다. 본 연구에서는 언어지식의 질적 확장을 언어지식의 수렴성이라고 정의하고 수렴성 보장을 위한 방법론을 연구한다. 수렴성 보장을 위해서는 먼저 언어지식 획득과정이 공정화, 자동화되어야 하고 언어지식이 변화할 때 수렴을 확인하는 과정이 필요하다. 수렴을 확인하기 위하여 구문구조 데이터베이스와 역사전(Inverted Dictionary)을 이용하는 방법을 제안한다. 지금까지는 언어지식의 양적 확장에만 치중해 왔으나 본 연구에서 제안된 방법으로 언어지식이 구축된다면 질적 확장도 함께 도모할 수 있을 것으로 기대된다.

  • PDF

fMRI에 반영된 다중언어화자의 L1, L2, L3 어휘 정보처리 특성과 대뇌 활성화 영역의 관련성 (Relations of multilingual's L1, L2, L3 lexical processing and cerebral activation areas in fMRI)

  • 남기춘;이동훈;오현금;유재욱
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.313-316
    • /
    • 2002
  • 본 연구에서는 기능적 자기공명 영상법(functional magnetic resonance imaging)을 이용하여, 한국어, 일어, 프랑스어, 영어 등 여러 언어를 구사할 수 있는 다중언어화자들을 대상으로 각 언어에 따른 대뇌 언어처리 과정을 알아보고, 그 처리과정이 해당언어의 유창성, 습득시기에 따라 어떻게 달라지는지를 알아보았다. 실험 결과, 언어처리에 있어 핵심적인 역할을 하는 것으로 보고되는 Broca 영역은 언어의 이해와 산출 과정에 모두 관계된 것으로 보이며, 언어의 산출과정에는 언어의 이해과정에 관계되는 영역외에 조음과정에 따른 영역의 활성화가 보고되었다. 또한 언어습득시기와 유창성에 따른 각 언어의 활성화를 살펴보면, 유창성이 높을수록 대뇌 활성화는 줄어들며, 유창성이 낮은 언어조건에서는 언어처리 영역의 활성화 수준이 높아지며 또한 우반구 및 전전두회(prefrontal gyrus)의 활성화가 높아지는 것이 보인다.

  • PDF

독일어와 한국어를 비교한 언어 유형적 분석 (Sprachtypologische Fehleranalyse - Im Vergleich der deutschen und koreanischen Sprache -)

  • 박진길
    • 한국독어학회지:독어학
    • /
    • 제7집
    • /
    • pp.1-24
    • /
    • 2003
  • 우리는 지금까지 독일어와 한국어 두 언어간의 오류분석을 논의해 왔다. 특히 언어유형학적인 측면에서 몇 가지 오류유형과 분석을 시도했다. 그 결과는 대체로 다음과 같이 요약될 수 있다. 독일어와 한국어가 서로 근본적으로 상반되는 언어현상과 더불어 약간의 공통성을 나타내며 일정한 유형을 나타낸다. 이는 두로 인간의 언어습득장치에 기인된 언어습득의 결정주의(Determinismus)에서 비롯될 것이다. 언어특성/문제의 체계성/규칙성 또는 일관성은 이를 반영한다. 거대한 언어자료 중에 극히 미미한 일부, 즉 언어최소량를 정복함으로써 그 효용성을 극대화할 수 있는 것은 매우 중요한 의미를 지닌다. 이를 연구 이용하는 경우에는 엄청난 효과와 가능성을 기대할 수 있을 것이다. (1) 독일어와 한국어의 학습 및 오류분석에서 가장 핵심적인 것은 언어유형학적으로 드러난 언어특성, 즉 전치성(독일어/영어)과 후치성(한국어)이다. 이를 토대로 형성된 대립적인 면과 공통적인 문제를 체계화하는 것이 역시 오류분석 문제의 관건이다. 또한 독일어가 아직 후치성 언어(한국어(TXV))에서 출발해서 전치성 언어(영어(SVX))로 발전/변화해 가는 과정, 즉 중간단계인 TVX에 머물고 있다는 사실이 중요한 의미를 지닌다. 즉 그들의 대극성과 유사성을 연결하는 실마리로 볼 수 있기 때문이다. (2) 일치(Kongruenz)/상관(Korrelation) 및 반복(Wiederholung) 현상, 그리고 격변화와 인칭변화 현상은 어순문제와 더불어 형태론적 문제를 통해 문법적인 확인수단으로 작용한다. 이들은 대부분 체계적/구조적으로 나타나기 때문에 학습자는 흔히 같은 유형에서 반복적으로 오류를 범하기 마련이다. 이를 극복하기 위해서 언어 유형학적 오류분석을 이해하고 또한 이를 통해 오류를 줄이거나 예방하는 학습이 필요하다. (3) 명사가 한정사구 안에서 성/수/격에 따라 변화하는 것과 동사가 동사구에서 주어의 인칭/수에 따라 인칭변화 하는 것은 우리 한국인에게는 아주 이색적인 현상이다. 이는 양면적인 수식구조에 대한 확인수단 및 원자가에 의한 강력한 형식위주 언어인 독일어와 전위적인 단일 수식구조와 부정형 동사를 특성으로 형성된 핵/최소문 언어간의 필연적인 적응관계 및 결과라고 볼 수 있다. 이 두 가지 유형 역시 언어특성에 따라 도식화/공식화 할 수 있다. (4) 괄호현상, 즉 으뜸머리(Hauptkopf)가 버금머리(Nebenkopf)와 분리하는 것은 우리 한국인에게는 아주 이색적인 언어현상이다. 한국어에는 머리의 이동이 없기 때문이다. 긴 구문에서 버금머리를 잊어버리거나 실수하는 것은 모든 괄호구문에서 예견되는 결과이다. 그러나 이는 정치성과 후치성 언어간의 전이 과정으로 이해될 수 있다. 으뜸머리가 원래의 자리를 박차고 소속 구/문의 앞자리로 도약한 것처럼 느껴지기 때문이다. (5) 전치 및 후치 수식이 유동적으로 작용하는 독일어는 전치 수식만으로 고정된 한국어보다 복잡하지만 균형적인 언어구조이다. 이러한 수식구조에서 한국인은 흔히 형태 및 어순에서, 그리고 번역에서 오류를 범하고 만다. (6) 그러나 가장 중요한 것은 아는 것을 제대로 이용하는 문제이다. 모국어/L2를 자유로이 말하고 쓸 때까지, 즉 언어습득에는 일체이 문법이나 도표/도식을 이용할 필요가 없다는 사실이다. 이는 17세기 서구의 이성주의 철학자들의 한결같은 경고이다. 오늘날 초고속 과학문명에서 더욱 빛을 발하는 것은 당연한 결과이다. 한 언어 속에 들어있는 문법체계를 익혀 가는 것이 곧 언어습득 과정이지만, 이를 달성하는 가능성 내지 첩경은 실제적인 언어자료와 체험이지 결코 문법이나 추상적인 개념적 접근이 아님을 웅변하고 있기 때문이다. 핵심적인 문제는 모국어교육에서도 최대 장점인 대화를 통한 언어연습/대화 기회를 최대한 보장하는 데 있다. 또한 언어간섭 현상을 조장하는 분위기를 막아야 할 것이다. 이러한 의미에서 교수법 개발이 외국어/L2 성공의 관건일 것이다. (7) 언어학습에서 오류를 극복하는 데는 일차적인 실제 상황에 부합하는 대화적인 연습, 그리고 효과적인 언어자료 접촉, 즉 독서와 모방이 중요하다. 이차적이고 직접적인 것은 통사(Syntax) 및 형태론(Morphologie)를 익힐 수 있는 말/문을 끊임없이 익히는 일이다. 이것이 또한 언어최소량을 충족시켜 언어습득에 이르는 첩경이다. 자연 생태적인 모국어 학습 또는 조정 및 제도적인 언어학습에서도 실제상황에 어긋나는 문법적인 체계에 얽매이는 도식 및 도표 위주의 텟스트는 일시적인 기대일 뿐이다. 인간의 언어습득장치를 이해하지 못한 결과이기 때문이다. 문법적인 개념위주 접근은 상당한 설명이 필요해서 절박한 자료와 체험까지 앗아가기 마련이다. 더구나 이를 위해 수준을 무시하고 모국어로 일관하여 벙어리와 문맹을 자초하는 것은 참으로 어리석은 일이다. 지식 정보화 시대 및 세계화 시대에는 무엇보다도 교육 및 언어정책이 국가 발전의 원동력이다. 특히 영어를 비롯한 외국어 학습능력과 학습방법은 매우 중요하다. 학습자에게 말하고 쓰는 기본 능력을 보장하는 것이 급선무이다. 이를 위한 작업의 하나가 바로 언어간의 오류분석일 것이다. 언어의 습득과 활용이 체계적이듯이 오류분석 역시 상당히 체계적이다. 그래서 인간의 언어습득과 언어습득장치를 두고 결정론(Determinismus)이 지배적이다. 이러한 의미에서 언어습득의 3대 요소, 즉 언어습득장치를 구비한 인간으로 태어나고, 해당 언어를 통한 일관된 언어체험/학습으로 언어최소량을 충족해야 한 언어를 정복할 수 있다는 것은 결정적인 사실이다. 학생고객에게 다가서는 책임교육으로 교육개방에 대비하는 일 역시 시대적인 상황이요 또한 결정적인 단계임엔 틀림이 없을 것이다.

  • PDF

교차 언어 문서 검색에서 질의어의 중의성 해소 방법 (Word Sense Disambiguation in Query Translation of CLTR)

  • 강인수;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.52-58
    • /
    • 1997
  • 정보 검색에서는 질의문과 문서를 동일한 표현으로 변환시켜 관련성을 비교하게 된다. 특히 질의문과 문서의 언어가 서로 다른 교차 언어 문서 검색 (CLTR : Cross-Language Text Retrieval) 에서 이러한 변환 과정은 언어 변환을 수반하게 된다. 교차 언어 문서 검색의 기존 연구에는 사전, 말뭉치, 기계 번역 등을 이용한 방법들이 있다. 일반적으로 언어간 변환에는 필연적으로 의미의 중의성이 발생되며 사전에 기반한 기존 연구에서는 다의어의 중의성 의미해소를 고려치 않고 있다. 본 연구에서는 질의어의 언어 변환시 한-일 대역어 사전 및 카도가와 시소러스 (각천(角川) 시소러스) 에 기반한 질의어 중의성 해소 방법과 공기하는 대역어를 갖는 문서에 가중치를 부여하는 방법을 제안한다. 제안된 방법들은 일본어 특허 문서를 대상으로 실험하였으며 5 %의 정확도 향상을 얻을 수 있었다.

  • PDF

객체지향 실시간 시뮬레이션 언어 NRCL (Object-Oriented Real-Time Language NRCL)

  • 이은영;최성운;이강선
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2000년도 추계학술대회 논문집
    • /
    • pp.198-203
    • /
    • 2000
  • NRCL(NaRae Hardware Control Language)은 C++ 기반의 산업용 객체 지향 실시간 언어이다. NRCL은 멀티태스킹이 가능하며, 이벤트 위주(Event-Driven) 방식의 가벼운 언어이다. 언어를 가볍게 만들기 위해 NRCL은 태스크를 최소 단위의 객체(컴포넌트)로 정의하였으며, 스케줄러(메시지 처리기)를 통해 우선 순위 방식으로 태스크들을 활성화시킨다. 본 논문에서는 효율적인 실시간 시뮬레이터 작성을 위한 객체지향 실시간 언어 NRCL을 제안하고, NRCL을 통한 재사용성, 이식성, 확장성, 유지 보수성을 보인다.

  • PDF

후천성 뇌손상 환자의 화용언어와 집행기능 간 상관성 (Correlation between Pragmatic Language and Executive Function in Patients with Acquired Brain Injury)

  • 이미숙
    • 한국콘텐츠학회논문지
    • /
    • 제16권5호
    • /
    • pp.58-67
    • /
    • 2016
  • 후천성 뇌손상(ABI) 환자의 인지-언어 능력은 하위 영역 간 상호작용의 맥락에서 고려되어야 하는데, 특히 화용언어는 통합적 인지 처리를 관장하는 집행기능과 직결된다. 본 연구에서는 ABI 환자를 대상으로 화용언어와 집행기능 간의 상관성을 규명하고자 하였다. 이를 위해 만 55세 이상의 ABI 환자군 35명(뇌졸중에 의한 실어증 21명, TBI 14명)을 대상으로 화용언어와 집행기능 관련 5개 하위 과제를 평가하였다. 그 결과, 실어증 집단은 비유언어 이해 및 기능/상징언어가 실행화 과제와 유의한 상관성을 보였고, TBI 집단은 모든 과제 간에 유의한 상관성이 있었다. 실어증 집단의 비유언어 이해는 실행화, 그리고 TBI 집단의 비유언어 표현과 기능/상징언어는 각각 계획화와 실행화를 가장 잘 예측하는 과제였다. 본 연구를 통해 ABI 이후의 인지-언어적 중재 시 상호 보완적으로 활용할 수 있는 화용언어 및 집행기능 과제들을 제시할 수 있었다.

프로그래밍 언어의 다원성과 상호운영성의 실증적 분석 (An Empirical Study of Diversity and Interoperability of Programming Languages)

  • 고봉석;이병철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.304-309
    • /
    • 2017
  • 둘 이상의 프로그래밍 언어로 상호 작용하는 프로그램을 작성하고 사용하는 경우가 증가하고 있으나 그 무결점성을 확보하기는 어렵다. 프로그램 오류의 원인과 결과가 서로 다른 언어의 코드와 데이터에 존재할 경우 오류 제거의 난이도가 높아지고 Java Native Interface(JNI) 및 Python/C와 같은 프로그램 언어 인터페이스를 잘못 사용하여 새로운 종류의 프로그램 오류가 발생하기 때문이다. 프로그램 언어 상호 작용 오류를 해결하기 위한 프로그램 분석 기법과 도구가 활발히 연구 개발되었으나 이들을 평가하기 위한 프로그램 언어, 프로그램 언어 인터페이스 및 오류들의 실재성에 대한 고찰이 부족한 상황이다. 본 논문에서는 적지 않은 사용자를 가지는 우분투 소프트웨어 생태계 내에서 프로그래밍 언어의 다원성과 상호운영성을 실증적으로 조사하여 다중 언어 프로그래밍 연구의 실재성과 연구의 타당성을 실제 데이터 기반으로 확립하고자 한다.

인지체계속의 언어기능 (The Language Faculty in Cognitive System)

  • 문경환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.61-64
    • /
    • 1989
  • 언어 연구에 관한 방법론은 단위구조적(modular) 접근방법과 총체론적(holistic) 접근방법으로 대별될 수 있다. 전자는 인지체계가 독자적 인지단위로 나뉘어져 있으며 그 중 하나가 언어기능임을 가정하고 있다. 즉 언어는 언어기능과 여타 인지단위로 상호작용함으로써 성립된다고 가정하는 것이다. 이에 비해 후자는 언어가 총체로서의 인지체계의 소산임을 가정하며, 따라서 언어기능이란 존재를 부정한다. 이러한 총체론적 언어이론에서는 신체의 구조가 보이는 단위구 조성과 심적 수조의 총체성 사이의 "불균형"을 어떻게 설명할 것인가의 의문이 제기된다. 이 글에서는 단위 구조설의 내용이 간략히 소개된다. 언어기능을 이루고 있는 보편문법 및 개별문법의 개념이 논의되는 가운데, 과거에도 그랬고 현재에도 계속 논란의 대상이 되고 있는 이른바 "문법성"의 개념이 중점적으로 다루어진다. 문법성과 허용성이 별개의 개념일진대, 문법적이면서도 허용되지 않은 문장이 있을 수 있고, 비문법적이면서도 허용되는 문장도 있을 수 있어야 한다. 이 후자의 경우도 실제로 존재함이 보여질 것이다.

  • PDF