• Title/Summary/Keyword: 언어 사용 점수

Search Result 125, Processing Time 0.027 seconds

The Relationship between Syntactic Complexity Indices and Scores on Language Use in the Analytic Rating Scale (통사적 복잡성과 분석적 척도의 언어 사용 점수간의 관계 탐색)

  • Young-Ju Lee
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.5
    • /
    • pp.229-235
    • /
    • 2023
  • This study investigates the relationship between syntactic complexity indices and scores on language use in Jacobs et al.(1981)' analytic rating scale. Syntactic complexity indices obtained from TAASSC program and 440 essays written by EFL students from the ICNALE corpus were analyzed. Specifically, this study explores the relationship between scores on language use and Lu(2011)'s traditional syntactic complexity indices, phrasal complexity indices, and clausal complexity indices, respectively. Results of the stepwise regression analysis showed that phrasal complexity indices turned out to be the best predictor of scores on language use, although the variance in scores on language use was relatively small, compared with the previous study. Implications of the findings of the current study for writing instruction (i.e., syntactic structures at the phrase level) were also discussed.

Comparative Analysis of Language Model Performance in News Domain Summarization (언어 모델의 뉴스 도메인 요약 성능 비교 분석)

  • Sangwon Ryu;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF

Easy-First Deep Biaffine Attention for Korean Dependency Parsing (Easy-First Deep Biaffine Attention을 이용한 한국어 의존 파싱)

  • Hong, Seung-Yean;Na, Seung-Hoon;Shin, Jong-Hoon;Kim, Young-kil
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.30-33
    • /
    • 2019
  • 기존의 그래프 기반 파서는 문장의 가능한 모든 트리를 찾고 가장 높은 점수를 갖는 트리를 취하는 방식이다. 하지만 점수를 계산하는데 있어서 노드 정보만을 사용하기 때문에 트리 구조의 특성을 반영하지 못하는 단점이 있다. 이를 위해 본 논문에서는 사전 학습된 모델에서 단어 간의 점수를 얻어 높은 점수를 가지는 단어를 미리 결정하고 결정된 의존성을 통해 부분 트리 만든다. 만들어진 부분 트리 정보를 사용하여 트리 구조의 특성을 반영할 수 있도록 하였다.

  • PDF

Evaluation of Generative AI's Understading of Hate Speech Using Appropriateness Conditions (적정성 조건을 활용한 생성 AI의 혐오 화행 이해 평가)

  • Kang Joeun;Kim Yujin;Kim Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.95-100
    • /
    • 2023
  • 끊임없이 재생산되는 혐오 표현의 정확한 탐지를 위해서는 혐오란 무엇인가에 대한 본질적인 이해가 필요하다. 본 연구에서는 화용론에서 사용되는 적정성 조건이라는 분석 틀을 활용하여 모델이 '혐오하기' 화행을 어떻게 인식하고 있는지 평가하고자 했다. 혐오 화행의 적정성 조건을 명제 내용 조건, 예비 조건, 성실성 조건, 본질 조건으로 나누어 분석하였으며, 이를 진위형, 연결형, 단답형, 논술형 문항으로 구성했다. 그 결과 모든 문항 유형에서 50점이 넘는 점수를 받았으나 비교적 고차원인 사고 능력을 측정하는 단답형과 논술형 문항 유형의 점수가 가장 낮게 나타났다.

  • PDF

How are they layerwisely 'surprised', KoBERT and KR-BERT? (KoBERT와 KR-BERT의 은닉층별 통사 및 의미 처리 성능 평가)

  • Choi, Sunjoo;Park, Myung-Kwan;Kim, Euhee
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.340-345
    • /
    • 2021
  • 최근 많은 연구들이 BERT를 활용하여, 주어진 문맥에서 언어학/문법적으로 적절하지 않은 단어를 인지하고 찾아내는 성과를 보고하였다. 하지만 일반적으로 딥러닝 관점에서 NLL기법(Negative log-likelihood)은 주어진 문맥에서 언어 변칙에 대한 정확한 성격을 규명하기에는 어려움이 있다고 지적되고 있다. 이러한 한계를 해결하기 위하여, Li et al.(2021)은 트랜스포머 언어모델의 은닉층별 밀도 추정(density estimation)을 통한 가우시안 확률 분포를 활용하는 가우시안 혼합 모델(Gaussian Mixture Model)을 적용하였다. 그들은 트랜스포머 언어모델이 언어 변칙 예문들의 종류에 따라 상이한 메커니즘을 사용하여 처리한다는 점을 보고하였다. 이 선행 연구를 받아들여 본 연구에서는 한국어 기반 언어모델인 KoBERT나 KR-BERT도 과연 한국어의 상이한 유형의 언어 변칙 예문들을 다른 방식으로 처리할 수 있는지를 규명하고자 한다. 이를 위해, 본 연구에서는 한국어 형태통사적 그리고 의미적 변칙 예문들을 구성하였고, 이 예문들을 바탕으로 한국어 기반 모델들의 성능을 놀라움-갭(surprisal gap) 점수를 계산하여 평가하였다. 본 논문에서는 한국어 기반 모델들도 의미적 변칙 예문을 처리할 때보다 형태통사적 변칙 예문을 처리할 때 상대적으로 보다 더 높은 놀라움-갭 점수를 보여주고 있음을 발견하였다. 즉, 상이한 종류의 언어 변칙 예문들을 처리하기 위하여 다른 메커니즘을 활용하고 있음을 보였다.

  • PDF

Maximally Efficient Syntactic Parsing with Minimal Resources (최소자원 최대효과의 구문분석)

  • Shin, Hyo-Pil
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.242-248
    • /
    • 1999
  • 이 논문은 지역적 동사구 분할에 바탕을 두고 서술어가 문말에 위치하는 언어에 특성에서 기인하는 속성을 반영하는 부분적 그러나 빠른 구문분석에 관해 논한다. 즉 완벽성 보다는 신속함 그리고 신뢰에 바탕을 둔 새로운 한국어 구문분석에 대해 논의한다. 기존의 문법이론 대신 한국어의 형태적 통사적 특성에 기인한, 성분들의 분할(partitions)에 의한 단위 (chunks) 분석방법을 제안한다. 근간은 동사구 장벽(VP-barrier) 알고리즘이며, 이 알고리즘은 한 문장안에서의 다양한 동사의 파생접사에 의해 형성되는 관형화, 명사화, 부사화 등의 파생구조와 내포된 동사구(인용문, 종속문 등)에 의해 형성되는 지역적 동사구내에서 그 성분들의 논리적인 분할을 구성하고 다시 그 다음 요소와 체계적으로 결합하는 관계로 확장하여 가능한 구조들을 생성한다. 다시 언어의존적인 발견적 규칙(heuristics)들을 점수화하여 가장 높은 점수의 단위구조를 적격한 구조로 선택한다. 이 방법은 하위범주화 및 의미정보를 사용하지 않는, 빠른 구문분석이 요구되는 시스템을 위해 고안되었으며, 집단적인 노력이 아닌 개인적인 노력 및 최소의 자원으로도 최대의 효과를 얻을 수 있다는데 그 의의가 있다.

  • PDF

The Effects of 'Activity Program for Effective Storytelling' on Empathic Ability and Language Teaching Efficacy of Story Grandmother ('효과적인 이야기전달을 위한 활동 프로그램'이 이야기할머니와 유아 간의 공감능력 및 언어교수효능감에 미치는 영향)

  • Kim, Hyung-Sook;Hong, Myung-Soon;Kim, Rae-Eun
    • Journal of Convergence for Information Technology
    • /
    • v.10 no.12
    • /
    • pp.245-255
    • /
    • 2020
  • The purpose of this study was to investigate effects of 'activity program for effective storytelling' on the empathic ability and language teaching efficacy of a story grandmother. The subjects were 51 beautiful story grandmothers in Gangwon, Gyeongsangdo and Seoul. The research tools used the emotional empathy scale of Jeon(2003), and language teaching efficacy scale of Kim and Lee(2011). As for the research procedure, from March 06 to July 27, 2017, an 'activity program for effective storytelling' was conducted. For data analysis, a t-test of the corresponding sample was conducted to find the difference between the pre- and post-scores of the two variables. As a result of the study, first, the cognitive empathy ability between the story grandmother and the young children after applying the 'activity program for effective storytelling' was higher than that of the dictionary. Second, the language teaching efficacy between the story grandmother and the young children after applying the 'activity program for effective storytelling' was higher than that of the dictionary. Therefore, the 'activity program for effective storytelling' suggests that there is a positive effect on improving the cognitive empathic ability and language teaching efficacy of the story grandmothers.

Hallucination Detection for Generative Large Language Models Exploiting Consistency and Fact Checking Technique (생성형 거대 언어 모델에서 일관성 확인 및 사실 검증을 활 용한 Hallucination 검출 기법)

  • Myeong Jin;Gun-Woo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.461-464
    • /
    • 2023
  • 최근 GPT-3 와 LLaMa 같은 생성형 거대 언어모델을 활용한 서비스가 공개되었고, 실제로 많은 사람들이 사용하고 있다. 해당 모델들은 사용자들의 다양한 질문에 대해 유창한 답변을 한다는 이유로 주목받고 있다. 하지만 LLMs 의 답변에는 종종 Inconsistent content 와 non-factual statement 가 존재하며, 이는 사용자들로 하여금 잘못된 정보의 전파 등의 문제를 야기할 수 있다. 이에 논문에서는 동일한 질문에 대한 LLM 의 답변 샘플과 외부 지식을 활용한 Hallucination Detection 방법을 제안한다. 제안한 방법은 동일한 질문에 대한 LLM 의 답변들을 이용해 일관성 점수(Consistency score)를 계산한다. 거기에 외부 지식을 이용한 사실검증을 통해 사실성 점수(Factuality score)를 계산한다. 계산된 일관성 점수와 사실성 점수를 활용하여 문장 수준의 Hallucination Detection 을 가능하게 했다. 실험에는 GPT-3 를 이용하여 WikiBio dataset 에 있는 인물에 대한 passage 를 생성한 데이터셋을 사용하였으며, 우리는 해당 방법을 통해 문장 수준에서의 Hallucination Detection 성능이 baseline 보다 AUC-PR scores 에서 향상됨을 보였다.

Analysis of the Previous Appointment Examinations for Informatics·Computer Secondary Teachers (정보·컴퓨터 중등교사 임용시험의 기출문항 분석)

  • Kang, Oh-Han
    • The Journal of Korean Association of Computer Education
    • /
    • v.21 no.4
    • /
    • pp.29-37
    • /
    • 2018
  • In this paper, questions from the last three years' appointment examinations for secondary teachers for informatics computer subjects are classified in a way to fit thirteen basic mandatory courses, for which the composition of scores and the number of questions tested were examined. Of these thirteen basic mandatory courses, questions from six basic mandatory courses with high frequency of assessment were analyzed on their score composition based on the evaluation area. In addition, questions testing knowledge in C language were analyzed separately. The results show scores for the curriculum content subjects ranged from 0% to 17.1%, and the ratio of questions tested from curriculum content subjects 0% to 15.8%. In addition, questions from three courses showed a large deviation in scores for each year. Second, the score composition based on the evaluation area showed a large discrepancy, ranging from 0% to 52.0%. Lastly, the questions tested on the C language exhibited high score on average at 33%. Based on the results from the analysis, this study proposed plans to improve ways to evaluate test takers' aptitude.

Expansion Function Point Model for Measurement of Size for Web-Page (웹 페이지 규모 측정을 위한 기능점수모형의 확장)

  • 박상훈;노재우;류성열
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.259-261
    • /
    • 2003
  • 소프트웨어 시스템의 규모 측정은 소프트웨어 개발에 필요한 비용을 산정하거나 필요한 인력 투입. 기간의 산정 등의 중요한 지표가 된다. 1990년대 후반 급격한 인터넷의 발달로 인해 다양한 기술과 웹 사이트가 등장하였다. 기존의 소프트웨어의 규모를 측정하기 위한 방법은 LOC와 기능점수(Function Point)가 있다. 그러나 LOC는 프로그래밍 언어에 의존적이므로 웹 페이지 규모를 측정하기는 한계가 있다. 따라서 웹 페이지 규모를 측정하기 위해 기능점수분석을 사용한다. 본 논문에서는 동일한 웹 페이지를 기존의 기능점수모형과 확장된 기능점수모형으로 분석하여 그 결과를 비교하고 미비점을 보완한다. 또한 다양한 웹 페이지들의 규모를 측정하기 위하여 기존 기능점수분석모형에 추가 조정 인자를 기술하고 확장된 기능점수모형을 제안한다.

  • PDF