• 제목/요약/키워드: 존재의 언어

검색결과 711건 처리시간 0.026초

한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안 (Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions)

  • 김재민;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

김수영 시의 '언어-문자' 이미지와 '에크리튀르'의 정치학 (A Study on 'Language-Letter' images and politics of 'écriture' in Kim, Soo-Yung's poems)

  • 이찬
    • 비교문화연구
    • /
    • 제26권
    • /
    • pp.173-200
    • /
    • 2012
  • 이 논문은 김수영 시에 나타난 "말", "언어", "활자", "글자", "책", "서책", "서적" 등과 같은 '언어-문자' 이미지에 주목하여, 그것들의 배경을 이루는 '에크리튀르'의 의미소와 정치학을 규명하고자 했다. 이러한 의제의 초점은 김수영 시를 언어학적이거나 수사학적 차원에서 접근하고 있는 대부분의 논문들이 지니는 한계와 문제점을 해결하려는 과정 속에서 마련되었다. 그것들의 가장 큰 문제점은 지엽적이고 세부적인 언어 용법으로 김수영 시의 분석과 해석을 제한하고 있는 데서 발생한다. 곧 그의 시에서 매우 빈번하게 나타나는 '언어-문자' 이미지에 대한 총체적인 해석의 틀을 제시하지 못할 뿐만 아니라, 그것에 대한 철학적이고 이론적인 해명이나 사회 정치적 담론 분석의 차원에서도 난점을 드러내고 있다는 것이다. 이 논문은 이러한 문제점을 해결하기 위해 김수영 시에 드러난 "말"과 "언어" 이미지에 대해서는 하이데거의 '존재론적 사유'에 입각하여 해명하려 했으며, "활자", "글자", "붓"에 대해서는 데리다가 제시했던 '원초적 글쓰기' 개념을 통해 새롭게 해석하고자 했다. 나아가 "책", "서책", "서적" 등과 같은 이미지에 대해서는 바이우의 '진리의 윤리학'과 데리다의 '에크리튀르'라는 문제틀을 함께 도입하여 김수영의 시를 '에크리튀르의 정치학'이라는 말로 새롭게 명명하고자 했다.

내용과 의미 -데이빗슨의 의미론은 비트겐슈타인적인가?- (CONTENT AND MEANING)

  • 김선희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.96-110
    • /
    • 1994
  • 인간은 사고하는 존재, 그리고 언어를 사용하는 존재라는 사실은 바로 인간이 지향적 주체라는 것을 보여주는 두가지 특징적 측면이다. 즉 심성내용과 의미는 지향적 대상의 두 축이라고 할 수 있다. 그런데 데이빗슨은 자비(charity) 혹은 합리성(rationality)이라는 동일한 원리에 기초하여 내용과 의미의 통일적 이론을 모색한 철학자이다. 이 논문에서는 데이빗슨의 내용과 의미의 이론을 반(反)데카르트적 관점으로 해석함으로써 데이빗슨 철학이 갖는 비트겐슈타인적 경향을 검토한다. 즉 데이빗슨의 내용과 의미론을 비트겐슈타인적 시각에서 조명하고 둘 사이에 어떤 연속성과 차이가 있는지를 논의함으로써, 데카르트 전통의 지향성 개념을 모색하는 새로운 지향성 개념을 모색하는 것이 이 논문의 목표이다.

  • PDF

클라우드 컴퓨팅에서 BPEL 분석 및 검증을 위한 Onion 언어로의 변환 (Transformation of BPEL to Onion Language for Analysis and Verification of BPEL in Cloud Computing)

  • 최재홍;온진호;이문근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1255-1258
    • /
    • 2012
  • 클라우드 컴퓨팅에서 사용되는 웹 서비스들은 워크플로우에 따라 서비스가 설계되어 조합된다. 대표적인 웹서비스 명세언어인 BPEL의 검증방법에는 Petri nets, Abstract State Machine(ASM), BPE-Calculus 등이 존재한다. 하지만 기존의 방법은 설계와 검증이 분리되어 있어 일관성이 부족하고, 시각화 문제, 동일성, 시간에 대한 제약조건의 문제점이 존재한다. 이에 대한 해결방안으로 이동성, 재구성성, 동일성, 시간속성 등의 새로운 분석 방법을 제시하는 Onion 언어가 제안되었다. 본 논문은 BPEL로 명세된 서비스를 Onion 시스템에 적용시키기 위한, 변환 과정에 대해서 다룬다. 이에 대한 과정으로 BPEL의 액티비티를 Onion으로 변환하고, 워크플로우 패턴을 적용하여, 3 가지 패턴을 Onion OVL로 변환을 적용하였다. 이를 통하여 BPEL을 Onion OVL로 변환하는데 문제가 없음을 보였으며, 효율적인 표현이 가능함을 보였다. 추후 Onion 시스템의 컴포넌트로 적용하여, BPEL로 작성된 서비스를 Onion 시스템을 통해 분석/검증할 수 있다.

인공 신경망을 이용한 한국어 문장단위 운율 발생에 관한 연구 (A study on the Prosody Generation of Korean Sentences using Artificial Neural networks)

  • 이일구;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.105-108
    • /
    • 1999
  • TTS(Text-To-Speech) 시스템 합성음성의 자연감을 개선하기 위해 하나의 언어에 대해 존재하는 운율 법칙을 정확히 구현해야 한다. 존재하는 운율 법칙을 추출하기 위해서는 방대한 분량의 언어 자료 구축이 필요하다. 그러나 이 방법은 존재하는 운율 현상이 포함된 언어자료에 대해 완벽한 운율을 파악할 수 없으므로 합성음성의 질을 좋게 할 수 없다. 본 논문은 한국어 음성의 운율을 학습하기 위해 2개의 인공 신경망을 제안한다. 하나의 신경망으로 문장의 각 음소에 대한 피치 변화를 학습시키는 것이며, 다른 하나는 에너지 변화를 학습하도록 하였다. 신경망은 BP 신경망을 이용하며 11개의 음소를 나타내기 위해 11개의 입력과, 중간 음소의 피치와 에너지 변화곡선을 근사하는 다항식 계수를 출력하도록 하였다. 신경망시스템의 학습과 평가에 앞서, 음성학적 균형잡힌 고립단어를 기반으로 의미있는 문장을 구성하였다. 문장을 남자 화자로 하여금 읽게 하고 녹음하여 음성 DB를 구축하였다. 음성 DB에 대해 각 음소의 운율 정보를 수집하여 신경망에 맞는 목표 패턴과 훈련 패턴을 작성하였다. 이 목표 패턴은 회귀분석을 통한 추세선을 이용해 피치와 에너지에 대한 2차 다항식계수로 구성하였다. 본 논문은 목표패턴에 맞는 신경망을 학습시켜 좋은 결과를 얻었다.

  • PDF

소프트웨어 보안약점 분석을 위한 바이너리 코드-중간언어 변환기에 관한 연구 (A Study of The Binary Code to Intermediate Language Translator for Analysis of Software Weakness)

  • 이태규;임정호;백도우;손윤식;정준호;고광만;오세만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.276-279
    • /
    • 2017
  • 오늘날 사회 전반적인 부분에서 소프트웨어의 비중은 지속적으로 증가하고 있다. 또한 소프트웨어는 점차 대규모화되고 있고 동시에 개인의 중요한 정보 등을 다루는 경우도 매우 늘어나고 있기에 소프트웨어의 보안성 검증은 매주 중요한 문제이다. 그러나 소스코드가 존재하지 않는 라이브러리의 경우 보안성 검증은 매우 어려운 문제로, 이를 해결하기 위해 바이너리 내에 존재하는 보안약점을 검사하기 위한 기술의 개발이 매우 요구되는 상황이며, 이를 위해 중간언어를 활용하여 보안약점을 분석하는 기술이 활발히 논의되고 있다. 본 논문에서는 바이너리 코드내에 존재하는 보안약점을 효과적으로 분석하기 위해서 바이너리 코드로부터 보안약점 분석에 효과적인 중간언어로 변환하는 시스템을 제안한다.

언어 변환을 위한 설계 방법 (Design Method for Language Translation)

  • 박주열;곽동규;고방원;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.553-557
    • /
    • 2008
  • 현재 컴퓨터 응용프로그램을 개발하기 위해 많은 프로그래밍 언어가 존재한다. 사용자는 사용 목적에 따라 그에 맞는 새로운 프로그래밍 언어를 학습하고 사용한다. 그러나 프로그래밍 언어를 학습하고 사용하기 위해서는 많은 시간과 노력이 필요하기 때문에 사용자의 언어 학습의 비용과 시간을 줄이기 위해 두 언어간에 변환을 가능하게 해주는 방법이 필요하다. 본 논문에서는 기존의 어휘 분석, 구문 분석 등의 여러 단계를 거치는 방법과는 다른 토큰 매핑 테이블과 XML로 기술한 변환 규칙을 통한 새로운 언어 변환을 위한 설계 방법을 제시함으로써 재사용성과 생산성을 높일 수 있는 것으로 기대된다.

  • PDF

발화 음성을 기반으로 한 감정분석 시스템 (Context sentiment analysis based on Speech Tone)

  • 정준혁;박수덕;김민승;박소현;한상곤;조우현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.1037-1040
    • /
    • 2017
  • 현재 머신러닝과 딥러닝의 기술이 빠른 속도로 발전하면서 수많은 인공지능 음성 비서가 출시되고 있지만, 발화자의 문장 내 존재하는 단어만 분석하여 결과를 반환할 뿐, 비언어적 요소는 인식할 수 없기 때문에 결과의 구조적인 한계가 존재한다. 따라서 본 연구에서는 인간의 의사소통 내 존재하는 비언어적 요소인 말의 빠르기, 성조의 변화 등을 수치 데이터로 변환한 후, "플루칙의 감정 쳇바퀴"를 기초로 지도학습 시키고, 이후 입력되는 음성 데이터를 사전 기계학습 된 데이터를 기초로 kNN 알고리즘을 이용하여 분석한다.

소외계층 학생의 컴퓨팅 사고력 분석 (A Study on Computational thinking of Disadvantaged students)

  • 이은경;김성원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.399-400
    • /
    • 2022
  • 일반 학생과 소외계층 학생은 컴퓨팅 기기에 대한 접근성은 큰 차이가 존재하지 않지만, 컴퓨팅 기기를 활용하는 역량에서는 큰 차이가 존재한다. 이러한 문제는 소외계층과 일반 학생 사이에 컴퓨팅 사고력 차이를 유발하였으며, 공교육에서 이루어지는 소프트웨어 교육의 효과 차이를 초래하였다. 이러한 문제를 해결하기 위하여 본 연구에서는 소외계층의 컴퓨팅 사고력을 분석하는 연구를 진행하였다. 소외계층 학생을 대상으로 설문 조사를 진행하고, 설문 결과를 요인에 따라 분석하는 연구를 진행하였다. 연구 결과, 소외계층 학생은 학교급이나 성별에 따른 컴퓨팅 사고력의 차이는 존재하지 않았다. 반면에 경험한 프로그래밍 언어에 따른 컴퓨팅 사고력의 차이가 나타났다. 특히, 소외계층 학생은 프로그래밍 언어 경험이 많을수록 컴퓨팅 사고력이 높은 것을 확인할 수 있었다.

  • PDF

프로그래밍 언어의 다원성과 상호운영성의 실증적 분석 (An Empirical Study of Diversity and Interoperability of Programming Languages)

  • 고봉석;이병철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.304-309
    • /
    • 2017
  • 둘 이상의 프로그래밍 언어로 상호 작용하는 프로그램을 작성하고 사용하는 경우가 증가하고 있으나 그 무결점성을 확보하기는 어렵다. 프로그램 오류의 원인과 결과가 서로 다른 언어의 코드와 데이터에 존재할 경우 오류 제거의 난이도가 높아지고 Java Native Interface(JNI) 및 Python/C와 같은 프로그램 언어 인터페이스를 잘못 사용하여 새로운 종류의 프로그램 오류가 발생하기 때문이다. 프로그램 언어 상호 작용 오류를 해결하기 위한 프로그램 분석 기법과 도구가 활발히 연구 개발되었으나 이들을 평가하기 위한 프로그램 언어, 프로그램 언어 인터페이스 및 오류들의 실재성에 대한 고찰이 부족한 상황이다. 본 논문에서는 적지 않은 사용자를 가지는 우분투 소프트웨어 생태계 내에서 프로그래밍 언어의 다원성과 상호운영성을 실증적으로 조사하여 다중 언어 프로그래밍 연구의 실재성과 연구의 타당성을 실제 데이터 기반으로 확립하고자 한다.