• Title/Summary/Keyword: 한글표현

Search Result 514, Processing Time 0.026 seconds

An Automated Essay Scoring Pipeline Model based on Deep Neural Networks Reflecting Argumentation Structure Information (논증 구조 정보를 반영한 심층 신경망 기반 에세이 자동 평가 파이프라인 모델)

  • Yejin Lee;Youngjin Jang;Tae-il Kim;Sung-Won Choi;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.354-359
    • /
    • 2022
  • 에세이 자동 평가는 주어진 에세이를 읽고 자동으로 평가하는 작업이다. 본 논문에서는 효과적인 에세이 자동 평가 모델을 위해 Argument Mining 작업을 사용하여 에세이의 논증 구조가 반영된 에세이 표현을 만들고, 에세이의 평가 항목별 표현을 학습하는 방법을 제안한다. 실험을 통해 제안하는 에세이 표현이 사전 학습 언어 모델로 얻은 표현보다 우수함을 입증했으며, 에세이 평가를 위해 평가 항목별로 다른 표현을 학습하는 것이 보다 효과적임을 보였다. 최종 제안 모델의 성능은 QWK 기준으로 0.543에서 0.627까지 향상되어 사람의 평가와 상당히 일치한다.

  • PDF

A Study on the Construction of Korean Hate Speech Corpus: Based on the Attributes of Online Toxic Comments (한국어 혐오 표현 코퍼스 구축 방법론 연구: 온라인 악성 댓글에 나타나는 특성을 중심으로)

  • Cho, Won Ik;Moon, Jihyung
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.298-303
    • /
    • 2020
  • 온라인 공간에서 특정인, 혹은 특정 집단의 사람들을 대상으로 한 혐오 표현은 당사자에게 정신적 고통을 미칠 뿐 아니라 이를 보는 이에게도 간접적인 불쾌함을 유발한다. 이에 관한 문제의식은 사회적으로 공감대가 형성된 바 있지만, 아직 한국어에서는 많은 연구들이 혐오 표현 자체의 논의에 집중하고 있으며, 이는 실제로 관찰되는 혐오 표현들의 자동 탐지 및 예방에는 효과적인 정보를 제공하지 못하는 것이 사실이다. 이에 우리는 실제 온라인 댓글들을 탐구하여 혐오, 모욕 및 사회적 편견을 탐지할 수 있는 모델 학습에 필요한 코퍼스 구축 가이드라인을 제작하였다. 구체적인 사례를 동반한 가이드라인과 크라우드소싱을 바탕으로 약 9천 3백 문장 가량의 코퍼스를 구축하였으며, 해당 데이터에 관한 개요와 함께 우리의 접근 방식이 어떤 점에서 기존의 담론과 연관되어 있는지에 대한 분석을 제시한다.

  • PDF

Evaluation of Language Model Robustness Using Implicit Unethical Data (암시적 비윤리 데이터를 활용한 언어 모델의 강건성 평가)

  • Yujin Kim;Gayeon Jung;Hansaem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.633-637
    • /
    • 2023
  • 암시적 비윤리 표현은 명시적 비윤리 표현과 달리 학습 데이터 선별이 어려울 뿐만 아니라 추가 생산 패턴 예측이 까다롭다. 고로 암시적 비윤리 표현에 대한 언어 모델의 감지 능력을 기르기 위해서는 모델의 취약성을 발견하는 연구가 반드시 선행되어야 한다. 본 논문에서는 암시적 비윤리 표현에 대한 표기 변경과 긍정 요소 삽입이라는 두 가지 변형을 통해 모델의 예측 변화를 유도하였다. 그 결과 모델이 야민정음과 외계어를 사용한 언어 변형에 취약하다는 사실을 발견하였다. 이에 더해 이모티콘이 텍스트와 함께 사용되는 경우 텍스트 자체보다 이모티콘의 효과가 더 크다는 사실을 밝혀내었다.

  • PDF

A Study on the configuration of Hangul Concrete Poetry in the typographic point of view (타이포그래피적 관점에서 본 한글구체시의 조형성에 관한 연구 -고원의 한글구체시를 중심으로-)

  • 이민영
    • Archives of design research
    • /
    • v.15 no.3
    • /
    • pp.259-270
    • /
    • 2002
  • In 1995, When people read a poem, the image that a poet intends to convey to readers shows in various colors according to the status of their emotion. Poetry is a bridge as well as a text, which connects this world and the poet's world. In such relationship, the communication through Types occurs. The realm of application of modern typography is widening due to the development of the Internet and mass media, and the ways of expression of which are changing with the help of lots of softwares. So, the modern typography is re-born as an organic language which is alive, breathing. Therefore, Types has the structural character similar to that of Typography, which is a language of image, creating today's movement, time, and space. The already existing poetry contains meanings but has a descriptive structures. On contrary, compared with the former, the type appeared in Hangul Concrete Poetry., itself is a poem in another realm due to the formality native to Hangul, and which appears in non-linear structure. So, in this thesis, I will analyze the formality and non-linear structure of Hangul Typography in order to widen the realm of research on typography, which is a very meaningful trial to visualize the literature.

  • PDF

Hangil Design and Oullim, the Great Harmony (한글 디자인과 어울림)

  • 안상수
    • Archives of design research
    • /
    • v.17 no.3
    • /
    • pp.383-392
    • /
    • 2004
  • Oullim is Vital principle Which allows humanity to continue its inherent culture. By proposing the evaluative authority of the creative significance of the invention of Hangul and its formation and superiority from the stand point of Oullim, I would like to focus on Hangul's creative significance on the grounds of 'broadly profound design'. The ideas of Hunminchongum's invention id based on the philosophy of Great Absolute. The philosophy of Great Absolute is natural phenomenon and metaphysical understanding of cosmology. But King Sejong could keep a good balance between identity and practicality. It is a high value of Hangul. The main idea of design is seeking for principle of nature and systematical vitality. King Sejong also put this main idea of design in practice for inventing Hunminchongum. In the process, Oullim appeared as an essential function for the Great Design.

  • PDF

포인트 / XML 기반의 수식 및 표현 및 처리 : MathML

  • Jo, Hyeon-Ju
    • Digital Contents
    • /
    • no.12 s.91
    • /
    • pp.74-79
    • /
    • 2000
  • 데이터베이스에서 기초정보로 포함되는 여러가지 수학 기호와 수식은 일반 문자들과는 다른 독특한 처리 방법을 필요로 한다. 워드프로세서에 포함되어 있는 수식 편집기가 이런 기능을 처리하는 대표적 예인데, 과학기술분야에서는 이전부터 TeX과 Tex의 매크로 패키지인 LaTeX의 규칙이 많이 이용되고 있다. 이외에도 한글의 수식편집기에도 사용되는 eqn, SGML계열의 수식 DTD등 수식표현을 위한 문법은 여러가지가 있다. 과학기술분야의 출판물이나 학술지 제공 서비스는 웹상으로 옮겨가는 추세이며, 다양한 애플리케이션간의 데이터 교환 언어로 XML이 부상하고 있다.

  • PDF

An Implementation of Pencil-like Computer (연필 컴퓨터의 구현)

  • 변정용
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.37-41
    • /
    • 1998
  • 정보사회의 주 도구인 컴퓨터에서 한글처리의 불완전함으로 인하여 한국인의 사고 체계는 부분적으로 제약을 받고 있다. 이것은 지적 노동 생산성을 저해할 뿐만 아니라 컴퓨터로 표현할 수 없는 글자는 장기적으로 사용이 뜸해져서 결국 사라지게 될 수도 있다. 본 논문은 컴퓨터가 한국인의 사고력을 높여주고 지적 노동 생산성을 극대화할 도구가 될 수 있도록 마치 연필로 글을 쓸 때처럼 자유스럽게 글자를 임의로 조합할 수 있게 하는데 역점을 가지고, 이를 위하여 훈민정음 원리를 적용하여 천지자연의 글자를 표현한다는 원리를 구현함으로써 연필 컴퓨터에 관한 한 가지 구현을 하였다.

  • PDF

PoMEN based Latent One-Class SVM (PoMEN 기반의 Latent One-Class SVM)

  • Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.8-11
    • /
    • 2012
  • One-class SVM은 데이터가 존재하는 영역을 추출하고, 이 영역을 서포트 벡터로 표현하며 표현된 영역 밖의 데이터들은 아웃라이어(outlier)로 간주된다. 본 논문에서는 데이터 포인트마다 숨겨진 변수(hidden variable) 혹은 토픽이 있다고 가정하고, 이를 반영하기 위해 PoMEN에 기반한 Latent One-class SVM을 제안한다. 실험결과 Latent One-class SVM이 대부분의 구간에서 One-class SVM 보다 성능이 높았으며, 특히 높은 정확율을 요구하는 경우에 더욱 효과적임을 알 수 있었다.

  • PDF

The Recognition and Normalization of Korean Temporal Expression for Question-Answering System (질의-응답 시스템을 위한 한국어 시간 표현의 인식 및 정규화)

  • Yoon, Do-Sang;Lee, Do-Gil;Chung, Hoo-Jung;Rim, Hea-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.46-52
    • /
    • 2004
  • 본 논문에서는 질의-응답 시스템의 질의에서 많이 나타나는 시간 표현을 인식하고, 인식한 시간 표현에 대해서 정규화 하는 방법을 제안한다. 본 논문에서 사용하는 질의-응답 시스템의 도메인은 TV방송 스케줄, 날씨 정보이며, 이러한 도메인에서는 시간 표현이 매우 빈번하게 사용되기 때문에 질의에 나타나는 시간 표현을 정확하게 인식해서 정규화 하는 것이 중요하다. 제안하는 방법은 시간 표현을 의미와 기능에 따라 분류하고 각 유형마다 적절한 인식 및 정규화 기법을 사용한다. 질의에서 시간 표현은 시간 개체명 태거. 품사 태거, 시간 파서를 사용하여 인식하고, 시간 추론기와 시간 표현 사전을 이용하여 정규화 한다. TV방송 스케줄과 날씨 정보 도메인의 280개 질의에서 184개의 시간표현을 이용하여 평가한 결과, 시간 표현의 인식과 정규화는 각각 93%와 96%의 정확률, 97%와 93%의 재현율을 보였다.

  • PDF

Hangeul Stem Extraction Algorithm for Text Mining Based on Natural Language Processing (자연어 처리 기반 텍스트 마이닝을 위한 한글 어간 추출 알고리즘)

  • Choi, Ki-won;Choi, Seong-hun;Jo, Sang-hyeon;Kim, Hee-cheol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.05a
    • /
    • pp.718-721
    • /
    • 2017
  • Natural language processing, which is the basis of text mining, differs depending on the type of language. Especially, Hangeul, which has relatively high freedom of expression compared to other languages, has various forms of words depending on the use of ending. The part that does not change in these various forms of words is called the stem. For effective text mining, it is essential to extract words and unify various types of words. Therefore, this paper proposes an extraction algorithm for Hangul word for effective text mining of Hangul document.

  • PDF