• Title/Summary/Keyword: 언어와 비언어

Search Result 1,710, Processing Time 0.029 seconds

Implementation of a Hangul Programming Language "Sprout" Supporting Object-Oriented Programming (객체 지향을 지원하는 한글 프로그래밍 언어 "새싹" 구현)

  • Kang, Dohun;Oh, Junghan;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.35-38
    • /
    • 2015
  • 컴퓨터 보급률의 증가로 소프트웨어에 관한 관심이 높아지게 되었고, 이는 초중등학생에게 프로그래밍을 가르치는 계기가 되었다. 하지만 대부분의 프로그래밍 언어는 영어로 구성되어 있어 영어 능력이 부족한 초중등학생이 사용하기에 부담되는 것이 사실이다. 그래서 비영어권 국가에서는 모국어로 된 프로그래밍 언어를 개발해왔다. 한국에서는 몇몇 한글 프로그래밍 언어가 개발되었지만, 현재까지 사용되고 있는 언어가 거의 없다. 또한, 객체 지향을 지원하는 한글 프로그래밍 언어가 거의 없다. 우리는 프로그래밍을 처음 배우는 초보자들이 영어를 모르더라도 객체 지향 개념을 쉽게 사용할 수 있도록 도와주는 한글 프로그래밍 언어 새싹을 개발하였다. 새싹을 통해 객체 지향 개념을 쉽게 습득함으로써 나중에 영어로 된 프로그래밍 언어를 배워야 할 때에서 더 쉽게 배울 수 있을 것이다.

Comparative Analysis of Language Model Performance in News Domain Summarization (언어 모델의 뉴스 도메인 요약 성능 비교 분석)

  • Sangwon Ryu;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF

A Study on Language Modeling for Korean Legal Text Processing (한국어 법률 텍스트 처리를 위한 언어 모델링 연구)

  • Ye-Jee Kang;Fei Li;Yeon-Ji Jang;Hye-Rin Kang;Seo-Yoon Park;Han-Saem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.300-304
    • /
    • 2022
  • 본 논문은 한국어 법률 텍스트 처리를 위해 세 가지 서로 다른 사전 학습 모델을 미세 조정하여 그 성능을 평가하였다. 성능을 평가하기 위해 타겟 판결 요지에 대한 판결 요지 후보를 추출하여 판결 요지 간의 유사도를 계산하였다. 또한 유사도를 바탕으로 추출된 판결 요지가 실제 법률 전문가와 일반 언어학자의 직관에 부합하는지 판단하기 위해 정성적 평가를 진행하였다. 그 결과 법률 전문가가 법률 전문 지식이 없는 일반 언어학자에 비해 판결 요지 간 유사도를 낮게 평가하였는데 법률 전문가가 법률 텍스트의 유사성을 판단하는 기준이 기계와 일반 언어학자와는 달라 전문가 자문에 기반한 한국어 법률 AI 모델 개발의 필요성을 확인하였다. 최종 연구 결과로 한국어 법률 AI 프레임워크를 제안하였다.

  • PDF

Artificial Intelligence and the meaning of language - focusing on the meaning of language in Wittgenstein's philosophy - (인공지능과 언어의 의미 - 비트겐슈타인의 '언어의 의미'를 중심으로 -)

  • Park, Jeong-sik;Jeong, Chang-rok
    • Journal of Korean Philosophical Society
    • /
    • v.143
    • /
    • pp.141-164
    • /
    • 2017
  • Artificial intelligence may be said like a human being. What is different thing between artificial intelligence and human intelligence? The people think that the artificial intelligence understands the meaning of the word to see artificial intelligence saying. However, it is different that artificial intelligence is identified as understanding a human being. We apply Wittgenstein's philosophy to this problem whether the artificial intelligence understands a meaning of language. We think that the artificial intelligence does not understand a live meaning of human life.

Llama2 Cross-lingual Korean with instruction and translation datasets (지시문 및 번역 데이터셋을 활용한 Llama2 Cross-lingual 한국어 확장)

  • Gyu-sik Jang;;Seung-Hoon Na;Joon-Ho Lim;Tae-Hyeong Kim;Hwi-Jung Ryu;Du-Seong Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.627-632
    • /
    • 2023
  • 대규모 언어 모델은 높은 연산 능력과 방대한 양의 데이터를 기반으로 탁월한 성능을 보이며 자연어처리 분야의 주목을 받고있다. 이러한 모델들은 다양한 언어와 도메인의 텍스트를 처리하는 능력을 갖추게 되었지만, 전체 학습 데이터 중에서 한국어 데이터의 비중은 여전히 미미하다. 결과적으로 이는 대규모 언어 모델이 영어와 같은 주요 언어들에 비해 한국어에 대한 이해와 처리 능력이 상대적으로 부족함을 의미한다. 본 논문은 이러한 문제점을 중심으로, 대규모 언어 모델의 한국어 처리 능력을 향상시키는 방법을 제안한다. 특히, Cross-lingual transfer learning 기법을 활용하여 모델이 다양한 언어에 대한 지식을 한국어로 전이시켜 성능을 향상시키는 방안을 탐구하였다. 이를 통해 모델은 기존의 다양한 언어에 대한 손실을 최소화 하면서도 한국어에 대한 처리 능력을 상당히 향상시켰다. 실험 결과, 해당 기법을 적용한 모델은 기존 모델 대비 nsmc데이터에서 2배 이상의 성능 향상을 보이며, 특히 복잡한 한국어 구조와 문맥 이해에서 큰 발전을 보였다. 이러한 연구는 대규모 언어 모델을 활용한 한국어 적용 향상에 기여할 것으로 기대 된다.

  • PDF

The Influence of Instructor's Non-verbal Communication on College Student's Emotional Presence, Rapport and Learning Satisfaction (교수자의 비언어적 커뮤니케이션이 대학생의 감성적 실재감, 라포 및 학습만족도에 미치는 영향)

  • Song, Yun-Hee
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.10
    • /
    • pp.259-267
    • /
    • 2020
  • Teaching and learning is based on communication between instructors and learners. In addition to instructor's verbal communication in the classrooms, non-verbal communication plays an important role. There is growing concerned about instructor's non-verbal communication affecting the learning process and learning outcomes. Based on the literature research student's emotional presence and rapport were used variables of learning process, and learning satisfaction was used as a variable of learning outcome to see the relationship of instructor's non-verbal communication. Data was collected from 378 students at A university in Gyeonggi-do and K university in Daejeon. The data was analyzed through structural equations modeling. As a result of the study, instructor's non-verbal communication had a positive impact on emotional presence and rapport. Emotional presence had a significant influence on rapport and learning satisfaction positively, and rapport had a positive effect on learning satisfaction. Instructors should be able to recognize the role of non-verbal communication in the classes as well as be able to use it appropriately. This study could be used as basic data onto the use of non-verbal communication in university classrooms.

A Study on the Construction of Specialized NER Dataset for Personal Information Detection (개인정보 탐지를 위한 특화 개체명 주석 데이터셋 구축 및 분류 실험)

  • Hyerin Kang;Li Fei;Yejee kang;Seoyoon Park;Yeseul Cho;Hyeonmin Seong;Sungsoon Jang;Hansaem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.185-191
    • /
    • 2022
  • 개인정보에 대한 경각심 및 중요성 증대에 따라 텍스트 내 개인정보를 탐지하는 태스크가 주목받고 있다. 본 연구에서는 개인정보 탐지 및 비식별화를 위한 개인정보 특화 개체명 태그셋 7개를 고안하는 한편 이를 바탕으로 비식별화된 원천 데이터에 가상의 데이터를 대치하고 개체명을 주석함으로써 개인정보 특화 개체명 데이터셋을 구축하였다. 개인정보 분류 실험에는 KR-ELECTRA를 사용하였으며, 실험 결과 일반 개체명 및 정규식 바탕의 규칙 기반 개인정보 탐지 성능과 비교하여 특화 개체명을 활용한 딥러닝 기반의 개인정보 탐지가 더 높은 성능을 보임을 확인하였다.

  • PDF

A nonvocal communication system for emotional expression of characters in 2D games (2D 게임 캐릭터의 감정표현을 위한 비언어적 커뮤니케이션 시스템 제안)

  • Hong, Soo-Hyeon;Lee, Young-Suk;Lee, Mi-Young
    • Journal of Digital Contents Society
    • /
    • v.12 no.3
    • /
    • pp.397-407
    • /
    • 2011
  • Characters' nonvocal communication plays an essential role in delivering lines and expressing emotions. A character in a game is represented with its nonvocal behavior combined with a large number of lines. In this paper, characters' nonvocal communication behaviors are categorized and analyzed. Furthermore, characters' gestures and movements are designed with bones for character gesture generation in 2D games. Besides, characters' movements are visualized. In brief, a nonvocal communication system for emotional expression of characters in 2D games is proposed.

The Processing System of English for Korean: Focused on the Interaction with Native Language Processing (한국인의 영어처리의 기제: 모국어처리와의 상호작용을 중심으로)

  • 이창환;강봉경
    • Korean Journal of Cognitive Science
    • /
    • v.15 no.2
    • /
    • pp.43-53
    • /
    • 2004
  • The purpose of this study was to investigate the role of phonology in lexical access of bilingual processing for Korean-English bilinguals. Four experiments have been conducted in order to adjudicate the nonselective lexical access hypothesis, which argues simultaneous phonological activation of two bilingual languages, and the selective lexical access hypothesis. which argues phonological activation of only one bilingual language. The results showed that the Korean target word processing was significantly affected by the phonological manipulation of the English target word(Exp. 2). Similarly, the English target word processing showed the tendencies that it is affected by the phonological manipulation of the Korean prime word(Exp. 2). This results indicates that the phonological information of another bilingual language is automatically activated when we process one of bilingual languages, and the process of English which is the second language for most Korean, is phonologically activated.

  • PDF

Extracting Korean-English Parallel Sentences based on Measure of Sentences Similarity Using Sequential Matching of Heterogeneous Language Resources (이질적인 언어 자원의 순차적 매칭을 이용한 문장 유사도 계산 기반의 위키피디아 한국어-영어 병렬 문장 추출 방법)

  • Cheon, Juryong;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.127-132
    • /
    • 2014
  • 본 논문은 위키피디아로부터 한국어-영어 간 병렬 문장을 추출하기 위해 이질적 언어 자원의 순차적 매칭을 적용한 유사도 계산 방법을 제안한다. 선행 연구에서는 병렬 문장 추출을 위해 언어 자원별로 유사도를 계산하여 선형 결합하였고, 토픽모델을 이용해 추정한 단어의 토픽 분포를 유사도 계산에 추가로 이용함으로써 병렬 문장 추출 성능을 향상시켰다. 하지만, 이는 언어 자원들이 독립적으로 사용되어 각 언어자원이 가지는 오류가 문장 간 유사도 계산에 반영되는 문제와 관련이 적은 단어 간의 분포가 유사도 계산에 반영되는 문제가 있다. 본 논문에서는 이질적인 언어 자원들을 이용해 순차적으로 단어를 매칭함으로써 언어 자원들의 독립적인 사용으로 각 자원의 오류가 유사도에 반영되는 문제를 해결하였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용함으로써 관련이 적은 단어의 분포가 반영되는 문제를 해결하였다. 실험을 통해, 언어 자원들을 이용해 순차적으로 매칭한 유사도 계산 방법은 선행 연구에 비해 F1-score 48.4%에서 51.3%로 향상된 성능을 보였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용한 방법은 약 10%에서 34.1%로 향상된 성능을 얻었다. 마지막으로, 제안한 유사도 방법들을 결합함으로써 선행연구의 51.6%에서 2.7%가 향상된 54.3%의 성능을 얻었다.

  • PDF