• Title/Summary/Keyword: 언어 분석

Search Result 4,670, Processing Time 0.031 seconds

Statistical Korean Spoken Language Understanding System for Dialog Processing (대화처리를 위한 통계기반 한국어 음성언어이해 시스템)

  • Roh, Yoon-Hyung;Yang, Seong-II;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.215-218
    • /
    • 2012
  • 본 논문에서는 한국어 대화 처리를 위한 통계기반 음성언어이해 시스템에 대해 기술한다. 음성언어이해시스템은 대화처리에서 음성 인식된 문장으로부터 사용자의 의도를 인식하여 의미표현으로 표현하는 기능을 담당한다. 한국어의 특성을 반영한 실용적인 음성언어이해 시스템을 위해서 강건성과 적용성, 확장성 등이 요구된다. 이를 위해 본 시스템은 음성언어의 특성상 구조분석을 하지 않고, 마이닝 기법을 이용하여 사용자 의도 표현을 생성하는 방식을 취하고 있다. 또한 한국어에서 나타나는 특징들에 대한 처리를 위해 자질 추가 및 점규화 처리 등을 수행하였다. 정보서비스용 대화처리 시스템을 대상으로 개발되고 있고, 차량 정보서비스용 학습 코퍼스를 대상으로 실험을 하여 문장단위 정확률로 약 89%의 성능을 보이고 있다.

  • PDF

QUANTITATIVE STUDY ON KOREAN MORPHEMES IN JOURNAL EDITORIALS (한국어 형태소의 계량언어학적 연구 -신문 사설을 중심으로-)

  • Bae, Hee-Sook;Shi, Jeong-Kon;Paik, Hae-Seung;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.17-24
    • /
    • 2001
  • 말뭉치 기반 언어 연구에서 균형성은 매우 중요하게 대두되는 문제이다. 말뭉치의 균형성을 맞추려면 여러 유형의 말뭉치가 갖는 언어적 특성을 고려하여야 한다. 그러나 계량언어학적방법으로 접근한 한국어 말뭉치의 유형별 언어 연구는 아직 미미하다. 본 연구는 언론 매체의 주요 부분인 신문의 사설을 말뭉치로 구성하여 그 언어적 특성을 살펴보고자 한다. 계량언어학의 전형적 방법에 따라 계량화 작업을 먼저 다루고, 이어 신중한 계량화 작업으로 얻어진 자료를 조사 분석하였다.

  • PDF

한글 프로그래밍 언어(한글 포트란)의 설계에 관한 연구

  • Jeong, Sun-Yeong;Heo, Yong-Do;Baek, Du-Gwon;Hwang, Jong-Seon
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.32-38
    • /
    • 1990
  • 한글 프로그래밍 언어는 새로운 개념에 의해 설계되어야 하는데 그에 따른 많은 문제점이 발생하게 된다. 따라서 한글 프로그래밍 언어를 설계할 때 문제가 되는 한글의 구조적 특징, 동사가 문장의 마지막 뒤에 나오는 Postfix 적 특징, 한글의 특이한 데이타 구조 및 조사라는 첨가어가 붙으므로 인한 렉시칼 문제점등을 구조적으로 분석하고 여기에 맞는 한글 프로그래밍 언어를 개발하여야 한다. 그러나 이러한 모든 조건에 맞는 한글 프로그래밍 언어를 개발하는 것은 쉬운 일이 아니며 상당한 시간을 요하는 일이므로 본 논문에서는 과학기술용에 가장 많이 사용되는 FORTRAN 언어를 택하여 일차적으로 그 명령어를 한글화하였다.

  • PDF

Comparative Analysis of Language Model Performance in News Domain Summarization (언어 모델의 뉴스 도메인 요약 성능 비교 분석)

  • Sangwon Ryu;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF

Wanda Pruning for Lightweighting Korean Language Model (Wanda Pruning에 기반한 한국어 언어 모델 경량화)

  • Jun-Ho Yoon;Daeryong Seo;Donghyeon Jeon;Inho Kang;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.437-442
    • /
    • 2023
  • 최근에 등장한 대규모 언어 모델은 다양한 언어 처리 작업에서 놀라운 성능을 발휘하고 있다. 그러나 이러한 모델의 크기와 복잡성 때문에 모델 경량화의 필요성이 대두되고 있다. Pruning은 이러한 경량화 전략 중 하나로, 모델의 가중치나 연결의 일부를 제거하여 크기를 줄이면서도 동시에 성능을 최적화하는 방법을 제시한다. 본 논문에서는 한국어 언어 모델인 Polyglot-Ko에 Wanda[1] 기법을 적용하여 Pruning 작업을 수행하였다. 그리고 이를 통해 가중치가 제거된 모델의 Perplexity, Zero-shot 성능, 그리고 Fine-tuning 후의 성능을 분석하였다. 실험 결과, Wanda-50%, 4:8 Sparsity 패턴, 2:4 Sparsity 패턴의 순서로 높은 성능을 나타냈으며, 특히 일부 조건에서는 기존의 Dense 모델보다 더 뛰어난 성능을 보였다. 이러한 결과는 오늘날 대규모 언어 모델 중심의 연구에서 Pruning 기법의 효과와 그 중요성을 재확인하는 계기가 되었다.

  • PDF

An Analysis of the Uses of External Representations in Matter Units of 7th-Grade Science Digital Textbooks Developed Under the 2015 Revised National Curriculum (2015 개정 교육과정에 따른 중학교 1학년 디지털교과서의 물질 단원에서 나타난 외적 표상의 활용 실태 분석)

  • Song, Nayoon;Hong, Juyeon;Noh, Taehee
    • Journal of the Korean Chemical Society
    • /
    • v.64 no.6
    • /
    • pp.416-428
    • /
    • 2020
  • This study analyzed the uses of external representations presented in the matter units of the 7th-grade science digital textbooks developed under the 2015 revised national curriculum. The level, form, presentation, and interactivity of external representations presented in 5 types of digital textbooks were analyzed. As for the level, the macroscopic level of representations was mainly presented. The macroscopic level and microscopic level of representations were presented together in the particle description. As for the form, visual-verbal and visual-nonverbal representations were usually presented across the board. Very few audial-verbal and audial-nonverbal representations were presented. Visual-verbal and audial-verbal representations were mostly presented in formal form, and visual-nonverbal representations were mostly presented in illustration without movement. The presentation of representations was analyzed in three aspects. First, visual-verbal and visual-nonverbal representations were mainly presented together and none of audial-verbal and visual-nonverbal representations were presented together. When the representations of the audial-verbal, visual-nonverbal, and visual-verbal were presented together, some of the information presented in audial-verbal representations was repeatedly presented in the visual-verbal representations. Second, audial-nonverbal representations not related to learning content were presented along with other representations. Third, there were few cases of arranging visual-verbal and visual-nonverbal representations on the next pages. Audialverbal and visual-nonverbal representations were always presented synchronized. As for the interactivity, the manipulation level was mainly presented in the main area, and the feedback level was mainly presented in the activity area. The adaptation level and the communication level of interactivity were presented very few. Based on the results, the implications for the direction of constructing digital textbooks were discussed.

The Effects of Nonverbal Communication of Fast Food Restaurant Servers on Customer Loyalty - Focusing on Customer Emotion and Self-Identification - (패스트푸드업체 서비스종사원의 비언어적 커뮤니케이션이 고객충성도에 미치는 영향 - 고객감정과 자아동일시를 중심으로 -)

  • Yoo, Young-Jin;Park, Yi-Kyung
    • Culinary science and hospitality research
    • /
    • v.22 no.3
    • /
    • pp.166-182
    • /
    • 2016
  • This study intended to verify the impact of non-verbal communication of servers in the service industry on the affective path among customer's positive emotion, self-identification, and loyalty(behavioral and attitudinal loyalty). The data of 397 customers of typical fast food restaurants in Busan and Gyeongsangbuk-do area were analyzed with SPSS and AMOS, and the hypotheses were verified through structural equation model after frequency analysis, as well as exploratory and confirmatory factor analysis. According to the empirical analysis, all three components of server non-verbal communication in the service industry, body language, pseudo language, and body appearance, in respective order, had positive (+) influences on the positive emotion of customers. In addition, customer emotion had a positive (+) influence on brand self-identification. Finally, self-identification had a positive (+) influence on behavior loyalty and attitudinal loyalty. This study suggested practical implications and logical implications in the course of developing emotional loyalty for restaurant companies.

Aspects of Language Use in Newspaper Articles: A Corpus Linguistic Perspective (신문 기사의 언어 사용 양상: 코퍼스언어학적 접근)

  • Song, Kyung-Hwa;Kang, Beom-Mo
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.4
    • /
    • pp.255-269
    • /
    • 2006
  • The purpose of this study is to analyze newspaper articles from corpus linguistic point of view. We used a large corpus of newspaper articles built from <21st century Sejong Project> and counted occurrences of certain expressions. A newspaper article is divided into the headline, the lead and the body. We tried to figure out how to measure the characteristics of indication and compression which are typical to headlines. Then, we focused on the differences between the headline and the lead. finally, we analyzed the sentence structure and measured the ratio of the frequency of common nouns in the body. This study verifies the existing stylistic theories of newspapers and shows new aspects of language use in newspaper articles. Texts like newspaper articles are the results of human language processing and they in turn affect the development of cognitive ability of language.

  • PDF

Analysis on the Chatting Language of Elementary School Students (초등학생들이 사용하는 채팅 언어의 분석)

  • Ceong, Hee-Taek;Jeong, Yeong-Sun
    • Journal of The Korean Association of Information Education
    • /
    • v.9 no.1
    • /
    • pp.99-112
    • /
    • 2005
  • In this research, we analyze chatting language of elementary school students, present the properties which are a result of this analysis and propose the method to solve it. Analysis on the chatting language considering organic relation of sentences is classified into syntactic, semantic and statistical characteristics. As a result of analysis, new characteristics is discovered writing by the way children pronounce their words, writing by switching the order of syllable's frontal and rear ends, inarticulate conversation of the other man. To minimize language misuse and to establish a chatting culture that is favorable to the development of children's emotional development, we propose the methods of computer system.

  • PDF

A Survey of the Scheme of Data Type and Variables Inference for Intermediate Language Generation from Binary Code (중간언어 생성을 위한 바이너리 코드 자료형 및 변수 추론 기술 조사 분석)

  • Min, Ye Sul;Jung, Hyunoh;Son, Yunsik;Jeong, Junho;Ko, Kangman;On, Seman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.283-286
    • /
    • 2017
  • 소프트웨어 내제되어 있는 보안약점과 보안취약점으로 인해 사회적으로 많이 비용이 발생함에 따라 안전한 소프트웨어를 개발하고자하는 요구가 증가하고 있다. 최근 바이너리 코드에 내제된 보안약점을 분석하기 위해서 중간코드를 이용하여 정적분석을 수행하는 다양한 연구가 진행되고 있다. 중간 언어를 사용함으로 실행환경에 따라 달라지는 바이너리 코드가 중간언어로만 변환이 된다면 동일한 형태의 보안약점 분석기술을 통해 효과적인 수행이 가능하다. 이 기술의 핵심은 바이너리 코드로부터 얼마나 코드내의 자료형 및 변수를 재구성하여 중간언어로 변환하는 것이다. 본 논문에서는 이와 같은 바이너리 코드로부터 보안약점 분석을 위한 중간언어 변환시 효과적으로 자료형 및 변수 등에 관한 정보를 재구성하는 기법들에 대해서 조사 분석하였다.