• Title/Summary/Keyword: 언어적 요소

Search Result 1,014, Processing Time 0.032 seconds

A study of Corpus Annotation for Aspect Based Sentiment Analysis of Korean financial texts (한국어 경제 도메인 텍스트 속성 기반 감성 분석을 위한 말뭉치 주석 요소 연구)

  • Seoyoon Park;Yeonji Jang;Yejee Kang;Hyerin Kang;Hansaem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.232-237
    • /
    • 2022
  • 본 논문에서는 미세 조정(fine-tuning) 및 비지도 학습 기법을 사용하여 경제 분야 텍스트인 금융 리포트에 대해 속성 기반 감성 분석(aspect-based sentiment analysis) 데이터셋을 반자동적으로 구축할 수 있는 방법론에 대한 연구를 수행하였다. 구축 시에는 속성기반 감성분석 주석 요소 중 극성, 속성 카테고리 정보를 부착하였으며, 미세조정과 비지도 학습 기법인 BERTopic을 통해 주석 요소를 자동적으로 부착하는 한편 이를 수동으로 검수하여 데이터셋의 완성도를 높이고자 하였다. 데이터셋에 대한 실험 결과, 극성 반자동 주석의 경우 기존에 구축된 데이터셋과 비슷한 수준의 성능을 보였다. 한편 정성적 분석을 통해 자동 구축을 동일하게 수행하였더라도 기술의 원리와 발달 정도에 따라 결과가 상이하게 달라짐을 관찰함으로써 경제 도메인의 ABSA 데이터셋 구축에 여전히 발전 여지가 있음을 확인할 수 있었다.

  • PDF

Component Analysis for Constructing an Emotion Ontology (감정 온톨로지의 구축을 위한 구성요소 분석)

  • Yoon, Ae-Sun;Kwon, Hyuk-Chul
    • Korean Journal of Cognitive Science
    • /
    • v.21 no.1
    • /
    • pp.157-175
    • /
    • 2010
  • Understanding dialogue participant's emotion is important as well as decoding the explicit message in human communication. It is well known that non-verbal elements are more suitable for conveying speaker's emotions than verbal elements. Written texts, however, contain a variety of linguistic units that express emotions. This study aims at analyzing components for constructing an emotion ontology, that provides us with numerous applications in Human Language Technology. A majority of the previous work in text-based emotion processing focused on the classification of emotions, the construction of a dictionary describing emotion, and the retrieval of those lexica in texts through keyword spotting and/or syntactic parsing techniques. The retrieved or computed emotions based on that process did not show good results in terms of accuracy. Thus, more sophisticate components analysis is proposed and the linguistic factors are introduced in this study. (1) 5 linguistic types of emotion expressions are differentiated in terms of target (verbal/non-verbal) and the method (expressive/descriptive/iconic). The correlations among them as well as their correlation with the non-verbal expressive type are also determined. This characteristic is expected to guarantees more adaptability to our ontology in multi-modal environments. (2) As emotion-related components, this study proposes 24 emotion types, the 5-scale intensity (-2~+2), and the 3-scale polarity (positive/negative/neutral) which can describe a variety of emotions in more detail and in standardized way. (3) We introduce verbal expression-related components, such as 'experiencer', 'description target', 'description method' and 'linguistic features', which can classify and tag appropriately verbal expressions of emotions. (4) Adopting the linguistic tag sets proposed by ISO and TEI and providing the mapping table between our classification of emotions and Plutchik's, our ontology can be easily employed for multilingual processing.

  • PDF

Durational Aspects of Korean: An experimental phonetic study (우리말 소리의 길이: 실험음성학적 연구)

  • Zhi, Min-Je;Choi, Un-Cheon;Kim, Sang-Hun
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.119-130
    • /
    • 1993
  • 우리말의 표준말에서는 모음의 장단이 낱말의 뜻을 가르는 음운론적 기능을 갖는다. 그러나, 소리의 길이는 음운론적인 장단 뿐 아니라 앞뒤의 소리, 초점, 소리의 위치, 말의 속도 등과 같은 여러 음성언어학적 요소에 의해 결정되어 그 언어의 고유한 리듬을 이룬다. 이 글에서는 우리말 소리의 길이에 영향을 미치는 주요변수를 실험음성학적 결과와 함께 살펴본다.

  • PDF

An Observation of the Visual Language and the Visual Technology according to the Media Technology (미디어테크놀로지의 발전에 따른 시각언어와 시각테크놀로지의 고찰)

  • 신청우
    • Archives of design research
    • /
    • v.17 no.2
    • /
    • pp.15-22
    • /
    • 2004
  • Recent complex visual culture is the visual world widely magnified according to the images like image, graphics, photograph, movie, and television, etc. by the development of digital technology. Because it conveys meanings and contents inserting sound and letters, it may have multimedia character conveying and communicating information beyond general language and letters. The vision for various images at that time is inseparably connected with language. And imaginative order of image and vision are composed of special way in culture and history. Language is different in society, culture, and history. Accordingly, if visual experience is communicated with language partially, it is difficult to have university. So, role of linguistic order plays an important role in forming and defining the social and cultural differences among the visual systems. Historically various visual and optical devices with this visual language have influenced a lot. These visual technologies are concrete and physical practice determining a way to get together with the subject and the visible object in the visible world. The visual language is connected with dimension like these symbols of images and the dimension like visual technologies to series of historical physical and institutional practices. It determines social visual mode toward object world in one of visual system. Accordingly, this study is to understand visual language with social and historical character according to the changed concept and characters as development of media technology. And it is to explain it in view of visual language as a dimension of symbol and visual technology of institutional and physical practice. After all, it cannot explain the effect on the function and visual mode of visual technology as its technical element only. It also cannot separate with the practice with coherent discourse and the physical and institutional practice. The possibility, technical element of technology contains, does not realize as it is but the effect is always communicated in the social veins and realized with a restriction.

  • PDF

A Study on UCCA for Korean Semantic Analysis (Universal conceptual cognitive annotation(UCCA) 주석 체계의 한국어 적용 연구)

  • Oh, Tae-Hwan;Han, Ji-Yoon;Choe, Hyon-Su;Park, Seok-Won;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.353-356
    • /
    • 2019
  • 본 논문은 Universal conceptual cognitive annotation(보편 개념 인지 주석, 이하 UCCA)를 한국어에 적용하는 방안에 대해 제시하였다. 우선 기존의 한국어 의미 분석 체계들의 장단점을 살펴본 뒤, UCCA가 가지고 있는 상대적인 장점들을 소개하였다. UCCA는 모든 언어에 대하여 일관적인 기술을 하려는 Meaning representation framework의 하나로, 보편언어적인 의미 분석 체계를 가지고 있다. 본고는 주석 단위와 문법적 요소의 관점에서 한국어의 특성을 반영하여 UCCA를 한국어에 적용하는 방안을 검토하였다.

  • PDF

A Thesaurus for Korean Language (YDK-Term : 한국어 용언의 다국어 통합정보사전)

  • Choi, Yon-Jun;Hwang, Do-Sam;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.321-326
    • /
    • 1998
  • 통합정보사전은 각종 자연언어처리 시스템에 있어서 고도의 언어처리 및 성능향상을 위한 필수 요소이며, 아무리 좋은 언어 처리 도구와 처리 알고리즘이라도 계산언어학에 근거한 양질의 체계적인 전자사전이 없는 한 이의 실용화는 불가능하다. 기존에 출판되어 있는 사전은 자연언어처리 및 이해의 관점에서 개발된 사전이 아니며, 자연언어처리 도구 및 응용시스템에 사용되는 사전은 목적에 따라 각기 다른 체계에 의해 구축되어 있어 이용하는데 있어서 비효율적이다. 따라서, 고도의 언어처리 및 이해를 목적으로 한 체계적이며 과학적인 방법론을 이용하여 형태소, 구문, 의미정보 등 각종 정보가 통합된 통합정보사전의 개발이 반드시 필요하다. 본 논문에서는 다국어 통합정보사전 구축을 위한 한국어 용언의 통합정보사전을 설계한다. 이를 위해 사전구축 방법론을 정립하고, 정립된 방법론을 바탕으로 하여 통합 정보사전의 개발을 위한 통합정보사전 개발 시스템을 설계하고 구현하였다.

  • PDF

A Case Analysis of Study on Verbal Interaction during the Math Class of a Special Classroom (특수학급 수학 수업에서 나타난 언어적 상호작용 사례 분석)

  • Hong, Jae-Young
    • Journal of the Korea Convergence Society
    • /
    • v.8 no.8
    • /
    • pp.215-224
    • /
    • 2017
  • The purpose of this study was to analyze the cases of verbal interactions occurring during the mathematics lessons taught in middle school special classes in order to examine the elements and types of verbal interactions that occur between the teachers and students. Data were collected and analyzed for the sessions on geometric units that formed part of the mathematics lessons routinely implemented in the special classes. The analysis showed that the teachers initiated 237 (84.1%) of the 291 instances of verbal linguistic interactions. A total of 240 teachers' questions were analyzed, and questions in the area of knowledge occurred the most frequently, at 160 times (66.7%). A total of 617 student responses were analyzed, and short answers occurred the most frequently, at 367 times (59.5%). Teacher feedback occurred 581 times in total, and correct/incorrect (simple) feedback occurred the most frequently, at 234 times (40.3%). A total of 237 verbal interactions were observed between the teachers and children, and the I (RF) type (one teacher question, one student response, and one instance of teacher feedback) occurred most frequently, at 83 times (35.0%).

The categorization process of convergence products: rule-based? or similarity-based? (융합제품의 범주화과정: 규칙기반? 외형적 유사성기반?)

  • Yoon, Chal-Hyuk;Peon, So-Yeon;Kim, Gwi-Gon
    • Journal of Digital Convergence
    • /
    • v.10 no.11
    • /
    • pp.279-285
    • /
    • 2012
  • This study classified the categorization process of convergence products as a rule-based and a similarity-based categorization process. And we examined that how the categorization process was determined according to information types(visual vs. visual + verbal) about the components of two prototypes before convergence and thinking styles(holistic vs. analytic). The result of this study showed: (1) The rule-based categorization process appeared more in case of visual information with verbal information than only visual information. (2) Analytic thinkers chose a rule-based categorization process more than holistic thinkers. These findings provide the theoretical and practical implications to comprehend the categorization process of convergence products and the judgement for consideration set from various convergence products.

Ubiscript: A Language for Ubiquitous Service Integration (유비스크립트: 유비쿼터스 서비스 통합을 위한 언어)

  • Lee, Min-Kyu;Han, Dong-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10a
    • /
    • pp.269-270
    • /
    • 2007
  • 유비쿼터스 환경에서는 사용자가 컴퓨터 및 네트워크의 존재를 의식하지 않는 상태에서 다양한 서비스를 이용하게 된다. 주변에 있는 PC, 냉장고, TV, 자동차 등의 모든 기기에 프로세서가 내장되고 네트워크가 연결되어 특정한 서비스를 제공하기 위해 함께 동작하게 된다. 이러한 장치와 서비스들을 연동하기 위한 현재의 솔루션은 클라이언트-서버 방식의 분산 컴퓨팅 모델이다. 각각의 장치가 원격 프로시듀어 흑은 원격 객체의 형태로 서버를 제공하고 이들을 하나의 클라이언트가 시나리오대로 그것들을 호출함으로써 응용을 완성할 수 있다. 하지만, 이러한 분산 컴퓨팅 모델을 지원하는 프로그래밍 환경으로는 다음과 같은 한계가 있다. 첫째, 소프트웨어 배치(deployment) 문제가 발생한다. 수 많은 시나리오를 생각해 볼 수 있는 유비쿼터스 환경에서는 특정 장치를 공장에서 생산하여 출고할 때 어떤 서버 소프트웨어가 미리 설치되어야 하는지는 가늠할 수 없는 문제이다. 둘째, 성능 문제가 발생할 수 있다. 각 장치의 함수를 호출하는 것은 대부분 원격 함수(remote procedure)이므로 한번 호출하는데 상당한 자원이 소요된다. 하지만, 시나리오를 구현하기 위해서는 특정 장치의 함수를 여러 번 호출해야 되는 상황이 자주 연출된다. 이러한 상황을 피하여 성능을 향상 시키기 위해서는 각 장치에 요구되는 부문 시나리오가 한번에 호출로 처리될 수 있어야 한다. 셋째, 유지 보수 문제가 발생할 수 있다 하나의 서비스가 여러 개의 서버 프로그램과 클라이언트 프로그램으로 구성되기 때문에 한번 업그레이드를 할 때 모든 구성 요소들이 모두 버전 업이 되어야 한다. 넷째, 유비쿼터스 환경에 적합한 추상화 개념의 부재를 들 수 있다. 다양한 장치, 웹서비스 및 데이터 들이 연동되어 하나의 서비스 시나리오를 구현함에 있어서 현재의 프로그래밍 언어는 높은 수준의 추상화 개념을 제공하지 못하고 있다. 본 연구에서는 모바일 코드 기술을 프로그래밍 언어에 적용하여 유비쿼터스 환경에서의 다양한 장치들과 서비스들을 손쉽게 통합하여 애플리케이션 시나리오를 구현할 수 있는 새로운 프로그래밍 언어인 유비스크립트(ubiscript)를 제안한다. 유비스크립트에서는 모바일 코드의 개념을 통해서 앞서 언급한 유비쿼터스 컴퓨팅 환경에서의 문제점을 해결하고자 하였다. 모바일 코드에서는 프로그램 코드가 네트워크를 통해서 컴퓨터를 이동하면서 수행되는 개념인데, 이는 물리적으로 떨어져있으면서 네트워크로 연결되어 있는 다양한 컴퓨팅 장치가 서로 연동하기 위한 모델에 가장 적합하다. 이는 기본적으로 배포(deploy)라는 단계가 필요 없게 되고, 새로운 버전의 프로그램이 작성될지라도 런타임에 코드가 직접 이동하게 되므로 버전 관리의 문제도 해결된다. 게다가 원격 함수를 매번 호출하지 않고 한번 이동된 코드가 원격지에서 모두 수행을 하게 되므로 성능향상에도 도움이 된다. 장소 객체(Place Object)와 원격 스코프(Remote Scope)는 앞서 설명한 특징을 직접적으로 지원하는 언어 요소이다. 장소 객체는 모바일 코드가 이동해서 수행될 계산 환경(computational environment)에 대한 레퍼런스이다. 원격 스코프는 원격지의 컴퓨터에 존재하는 계산 환경의 스코프(scope)를 로컬 계산 환경에 적용할 수 있도록 하는 언어 요소이다. 유비쿼터스 컴퓨팅 환경에서의 장치와 서비스들을 연동하기에는 현재의 프로그래밍 모델은 배포, 유지 보수, 성능 등의 문제점을 안고 있다. 본 연구에서는 모바일 코드 개념을 도입한 새로운 프로그래밍 언어인 유비스크립트를 제안하여 이러한 문제점들을 극복하고자 하였다. 유비스크립트에서는 유비쿼터스 환경을 직접적으로 표현할 수 있도록 새로운 언어 요소인 장소 객체와 원격 스코프 개념을 도입하였고, 프로토타입과 가상의 시나리오 구현을 통하여 기존의 프로그래밍 언어보다 유비쿼터스 환경에 더 적합하고, 단순하며 생산성이 우수하다는 것을 확인하였다.

  • PDF

Automatic Compiler Generator for Visual Languages using Semantic Actions based on Classes (클래스 기반의 의미수행코드 명세를 이용한 시각언어 컴파일러 자동 생성)

  • 김경아
    • Journal of Korea Multimedia Society
    • /
    • v.6 no.6
    • /
    • pp.1088-1099
    • /
    • 2003
  • The syntax-directed translation using semantic actions is frequently used in construction of compiler for text programming languages. it is very useful for the language designers to develop compiler back-end using a syntax structure of a source programming language. Due to the lack of the integrated representation method for a parse tree node and modeling method of syntax structures, it is very hard to construct compiler using syntax-directed translation in visual languages. In this Paper, we propose a visual language compiler generation method for constructing a visual languages compiler automatically, using syntax-directed translation. Our method uses the Picture Layout Grammar as a underlying grammar formalism. This grammar allows our approach to generate parser efficiently u sing And-Or-Waiting Graph and encapsulating syntax definition as one unit. Unlike other systems, we suggest separating the specification and the generation of semantic actions. Because of this, it provides a very efficient method for modification.

  • PDF