• Title/Summary/Keyword: 존재의 언어

Search Result 711, Processing Time 0.035 seconds

Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions (한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안)

  • Jaemin Kim;Dong-Kyu Chae
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

A Study on 'Language-Letter' images and politics of 'écriture' in Kim, Soo-Yung's poems (김수영 시의 '언어-문자' 이미지와 '에크리튀르'의 정치학)

  • Lee, Chan
    • Cross-Cultural Studies
    • /
    • v.26
    • /
    • pp.173-200
    • /
    • 2012
  • This paper examines ${\acute{e}}pist{\acute{e}}m{\grave{e}}$ of ${\acute{e}}criture$ and its politics in Kim, Soo-Yung's poems, focusing on 'language-letter' images such as "speech", "language", "printing type", "letter", "brush", "book" and so on. While the previous papers fail to present the overall framework of analysis on 'language-${\acute{e}}criture$' images and to show political dimensions of discourse analysis, this paper tries to overcome these limitations. It explains images of 'speech' and 'language' on the basis of Heidegger's ontological thought, and analyzes writing-images such as 'type', 'letters' using Derrida's concepts of 'archi-${\acute{e}}criture$' and '${\acute{e}}criture$'. It also gives a new name to multiple images of 'book' in his poems as 'politics of ${\acute{e}}criture$' based on problematic such as Badiou's 'ethics of truths' and Derrida's '${\acute{e}}criture$'.

CONTENT AND MEANING (내용과 의미 -데이빗슨의 의미론은 비트겐슈타인적인가?-)

  • Kim, Sun-Hie
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.96-110
    • /
    • 1994
  • 인간은 사고하는 존재, 그리고 언어를 사용하는 존재라는 사실은 바로 인간이 지향적 주체라는 것을 보여주는 두가지 특징적 측면이다. 즉 심성내용과 의미는 지향적 대상의 두 축이라고 할 수 있다. 그런데 데이빗슨은 자비(charity) 혹은 합리성(rationality)이라는 동일한 원리에 기초하여 내용과 의미의 통일적 이론을 모색한 철학자이다. 이 논문에서는 데이빗슨의 내용과 의미의 이론을 반(反)데카르트적 관점으로 해석함으로써 데이빗슨 철학이 갖는 비트겐슈타인적 경향을 검토한다. 즉 데이빗슨의 내용과 의미론을 비트겐슈타인적 시각에서 조명하고 둘 사이에 어떤 연속성과 차이가 있는지를 논의함으로써, 데카르트 전통의 지향성 개념을 모색하는 새로운 지향성 개념을 모색하는 것이 이 논문의 목표이다.

  • PDF

Transformation of BPEL to Onion Language for Analysis and Verification of BPEL in Cloud Computing (클라우드 컴퓨팅에서 BPEL 분석 및 검증을 위한 Onion 언어로의 변환)

  • Choe, Jae-Hong;On, Jin-Ho;Lee, Moon-Kun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1255-1258
    • /
    • 2012
  • 클라우드 컴퓨팅에서 사용되는 웹 서비스들은 워크플로우에 따라 서비스가 설계되어 조합된다. 대표적인 웹서비스 명세언어인 BPEL의 검증방법에는 Petri nets, Abstract State Machine(ASM), BPE-Calculus 등이 존재한다. 하지만 기존의 방법은 설계와 검증이 분리되어 있어 일관성이 부족하고, 시각화 문제, 동일성, 시간에 대한 제약조건의 문제점이 존재한다. 이에 대한 해결방안으로 이동성, 재구성성, 동일성, 시간속성 등의 새로운 분석 방법을 제시하는 Onion 언어가 제안되었다. 본 논문은 BPEL로 명세된 서비스를 Onion 시스템에 적용시키기 위한, 변환 과정에 대해서 다룬다. 이에 대한 과정으로 BPEL의 액티비티를 Onion으로 변환하고, 워크플로우 패턴을 적용하여, 3 가지 패턴을 Onion OVL로 변환을 적용하였다. 이를 통하여 BPEL을 Onion OVL로 변환하는데 문제가 없음을 보였으며, 효율적인 표현이 가능함을 보였다. 추후 Onion 시스템의 컴포넌트로 적용하여, BPEL로 작성된 서비스를 Onion 시스템을 통해 분석/검증할 수 있다.

A study on the Prosody Generation of Korean Sentences using Artificial Neural networks (인공 신경망을 이용한 한국어 문장단위 운율 발생에 관한 연구)

  • 이일구;민경중;강찬구;임운천
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.105-108
    • /
    • 1999
  • TTS(Text-To-Speech) 시스템 합성음성의 자연감을 개선하기 위해 하나의 언어에 대해 존재하는 운율 법칙을 정확히 구현해야 한다. 존재하는 운율 법칙을 추출하기 위해서는 방대한 분량의 언어 자료 구축이 필요하다. 그러나 이 방법은 존재하는 운율 현상이 포함된 언어자료에 대해 완벽한 운율을 파악할 수 없으므로 합성음성의 질을 좋게 할 수 없다. 본 논문은 한국어 음성의 운율을 학습하기 위해 2개의 인공 신경망을 제안한다. 하나의 신경망으로 문장의 각 음소에 대한 피치 변화를 학습시키는 것이며, 다른 하나는 에너지 변화를 학습하도록 하였다. 신경망은 BP 신경망을 이용하며 11개의 음소를 나타내기 위해 11개의 입력과, 중간 음소의 피치와 에너지 변화곡선을 근사하는 다항식 계수를 출력하도록 하였다. 신경망시스템의 학습과 평가에 앞서, 음성학적 균형잡힌 고립단어를 기반으로 의미있는 문장을 구성하였다. 문장을 남자 화자로 하여금 읽게 하고 녹음하여 음성 DB를 구축하였다. 음성 DB에 대해 각 음소의 운율 정보를 수집하여 신경망에 맞는 목표 패턴과 훈련 패턴을 작성하였다. 이 목표 패턴은 회귀분석을 통한 추세선을 이용해 피치와 에너지에 대한 2차 다항식계수로 구성하였다. 본 논문은 목표패턴에 맞는 신경망을 학습시켜 좋은 결과를 얻었다.

  • PDF

A Study of The Binary Code to Intermediate Language Translator for Analysis of Software Weakness (소프트웨어 보안약점 분석을 위한 바이너리 코드-중간언어 변환기에 관한 연구)

  • Lee, Tae-Gue;Lim, Jung-Ho;Baik, Do-Woo;Son, Yunsik;Jeong, Junho;Ko, Kwangman;Oh, Seman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.276-279
    • /
    • 2017
  • 오늘날 사회 전반적인 부분에서 소프트웨어의 비중은 지속적으로 증가하고 있다. 또한 소프트웨어는 점차 대규모화되고 있고 동시에 개인의 중요한 정보 등을 다루는 경우도 매우 늘어나고 있기에 소프트웨어의 보안성 검증은 매주 중요한 문제이다. 그러나 소스코드가 존재하지 않는 라이브러리의 경우 보안성 검증은 매우 어려운 문제로, 이를 해결하기 위해 바이너리 내에 존재하는 보안약점을 검사하기 위한 기술의 개발이 매우 요구되는 상황이며, 이를 위해 중간언어를 활용하여 보안약점을 분석하는 기술이 활발히 논의되고 있다. 본 논문에서는 바이너리 코드내에 존재하는 보안약점을 효과적으로 분석하기 위해서 바이너리 코드로부터 보안약점 분석에 효과적인 중간언어로 변환하는 시스템을 제안한다.

Design Method for Language Translation (언어 변환을 위한 설계 방법)

  • Park, Ju-Yeol;Kawk, Dong-Guy;Ko, Bang-Won;Yoo, Chae-Woo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.553-557
    • /
    • 2008
  • 현재 컴퓨터 응용프로그램을 개발하기 위해 많은 프로그래밍 언어가 존재한다. 사용자는 사용 목적에 따라 그에 맞는 새로운 프로그래밍 언어를 학습하고 사용한다. 그러나 프로그래밍 언어를 학습하고 사용하기 위해서는 많은 시간과 노력이 필요하기 때문에 사용자의 언어 학습의 비용과 시간을 줄이기 위해 두 언어간에 변환을 가능하게 해주는 방법이 필요하다. 본 논문에서는 기존의 어휘 분석, 구문 분석 등의 여러 단계를 거치는 방법과는 다른 토큰 매핑 테이블과 XML로 기술한 변환 규칙을 통한 새로운 언어 변환을 위한 설계 방법을 제시함으로써 재사용성과 생산성을 높일 수 있는 것으로 기대된다.

  • PDF

Context sentiment analysis based on Speech Tone (발화 음성을 기반으로 한 감정분석 시스템)

  • Jung, Jun-Hyeok;Park, Soo-Duck;Kim, Min-Seung;Park, So-Hyun;Han, Sang-Gon;Cho, Woo-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.1037-1040
    • /
    • 2017
  • 현재 머신러닝과 딥러닝의 기술이 빠른 속도로 발전하면서 수많은 인공지능 음성 비서가 출시되고 있지만, 발화자의 문장 내 존재하는 단어만 분석하여 결과를 반환할 뿐, 비언어적 요소는 인식할 수 없기 때문에 결과의 구조적인 한계가 존재한다. 따라서 본 연구에서는 인간의 의사소통 내 존재하는 비언어적 요소인 말의 빠르기, 성조의 변화 등을 수치 데이터로 변환한 후, "플루칙의 감정 쳇바퀴"를 기초로 지도학습 시키고, 이후 입력되는 음성 데이터를 사전 기계학습 된 데이터를 기초로 kNN 알고리즘을 이용하여 분석한다.

A Study on Computational thinking of Disadvantaged students (소외계층 학생의 컴퓨팅 사고력 분석)

  • Lee, Eunkyoung;Kim, Seong-Won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.399-400
    • /
    • 2022
  • 일반 학생과 소외계층 학생은 컴퓨팅 기기에 대한 접근성은 큰 차이가 존재하지 않지만, 컴퓨팅 기기를 활용하는 역량에서는 큰 차이가 존재한다. 이러한 문제는 소외계층과 일반 학생 사이에 컴퓨팅 사고력 차이를 유발하였으며, 공교육에서 이루어지는 소프트웨어 교육의 효과 차이를 초래하였다. 이러한 문제를 해결하기 위하여 본 연구에서는 소외계층의 컴퓨팅 사고력을 분석하는 연구를 진행하였다. 소외계층 학생을 대상으로 설문 조사를 진행하고, 설문 결과를 요인에 따라 분석하는 연구를 진행하였다. 연구 결과, 소외계층 학생은 학교급이나 성별에 따른 컴퓨팅 사고력의 차이는 존재하지 않았다. 반면에 경험한 프로그래밍 언어에 따른 컴퓨팅 사고력의 차이가 나타났다. 특히, 소외계층 학생은 프로그래밍 언어 경험이 많을수록 컴퓨팅 사고력이 높은 것을 확인할 수 있었다.

  • PDF

An Empirical Study of Diversity and Interoperability of Programming Languages (프로그래밍 언어의 다원성과 상호운영성의 실증적 분석)

  • Ko, Bongsuk;Lee, Byeongcheol
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.5
    • /
    • pp.304-309
    • /
    • 2017
  • Programmers use multiple languages to reuse legacy code best suited to their problems. However, it is quite challenging to develop error-free multilingual programs because new types of bugs occur since misunderstanding about language interfaces such as Java Native Interface (JNI) and Python/C. There is a considerable amount of research to overcome multilingual program bugs and errors but these researches have less consideration about substantiality of programming languages, language interfaces, and bugs to evaluate their analyses and tools. In this paper, we have identified and establish substantiality of multilingual programming research with empirical study about diversity and interoperability of programming languages in Ubuntu software ecosystem based on real-world statistical data.