• 제목/요약/키워드: summarization

검색결과 378건 처리시간 0.023초

자연어 처리 인공지능 기술을 활용한 생활기록부 작성 효율성 제고 향상 연구 (A Study on the Improvement of the Efficiency of School Report Documentation Using Artificial Intelligence Technology in Natural Language Processing)

  • 서정호;김웅
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.409-412
    • /
    • 2022
  • 본 논문에서는 대입수시전형에서 생활기록부 입력은 대한민국 입시를 결정하는 매우 중요한 평가자료이다. 30명의 교사를 대상으로 실시한 설문조사를 통해서 교사들이 생활기록부를 작성하는데 가장 많이 참고하는 자료로는 수행평가 결과물, 발표내용, 보고서, 감상문 등의 학습 결과물(90%), 학생들이 작성한 자기평가서(73.3%), 관찰 평가지(50%)로 나타났으며, 80%(24명)의 교사들이 생활기록부를 작성하는데 고충을 겪고 있음을 확인할 수 있었다. 교사들이 느끼는 고충의 원인으로는 학생들의 개인별 특성 파악이 어려워 차별성있게 작성하는 것(76.7%)을 가장 힘들어 하였고, 작성해야 할 많은 수의 학생(60%), 문구를 만드는데 대해 부담(86.7%)을 느끼는 것으로 나타났다. 이 과정에서 교사의 전문성 뿐만 아니라 기계적이고 반복적인 작업도 많이 요구되고 있기 때문에, 생활기록부를 작성하는데에 도움을 줄 수 있는 프로그램 개발이 필요하다고 고안을 내었다. 교사들 역시 반복적이고 일률적인 생활기록부 작성에 도움을 줄 수 있는 프로그램이 있다면 유용하게 활용할 것이라는 응답이 90%였다. 따라서 본 연구에서 자연어 처리 인공지능 기술을 활용하여 교사들이 생활기록부를 작성하는데 있어 기계적이고 단순한 작업을 도와 주는 프로그램 개발에 대한 연구의 필요성을 제시하였다. 제안하는 프로그램은 학생들의 탐구보고서, 토론, 발표, 감상문 등의 생화기록부 작성 참고자료들을 텍스트로 변환하고 추상요약(Abstractive Summarization)을 통해 교사들이 효율적으로 작성하는데 활용될 수 있도록 설계하였다. 연구 결과 생활기록부 작성 참고자료를 텍스트로 변환하는 것과 추상요약을 할 수 있는 개방형 데이터셋까지는 확보하였다. 추상요약을 구현하는 방법에 대해서는 보다 심도 있는 추가연구가 필요하였다. 이를 통해 교사들이 교육 본질에 더욱 충실할 수 있는 환경을 마련하고, 내실 있는 생활기록부 작성이 공교육 신뢰 제고에 밑바탕이 되고자 한다.

  • PDF

음악요약 생성에 관한 연구 (A Study on Music Summarization)

  • 김성탁;김상호;김회린;최지훈;이한규;홍진우
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.3-14
    • /
    • 2006
  • 음악요약이란 주어진 음악 컨텐츠에서 가장 중요하고 특징적인 한 부분이나 여러 부분들을 제공하는 것을 말한다. 음악요약 기술에는 크게 두 가지 종류의 음악요약을 위한 기술들이 연구되고 있다. 음악 컨텐츠 내에서 반복되는 구간을 음악요약으로 제공하는 기술과 특정이 다른 부분들의 일정구간을 모두 제공하는 기술이 있다. 본 논문에서는 두 가지 종류의 음악요약을 제공하는 알고리즘들을 제안하고 평가하였다. 반복되는 구간을 음악요약으로 제공하는 다중 레벨 벡터양자화를 이용한 알고리즘은 고정된 길이와 최적의 길이를 가지는 음악요약을 제공하는 알고리즘들을 객관적인 방법으로 성능을 평가하였고, 음악 내에서 특정이 다른 부분들을 일정부분씩 취합하여 제공하는 2-D 유사도 행렬과 k-mean 알고리즘을 이용하는 집단화 방법을 이용한 방법의 평가는 주관적인 평가인 MOS 테스트로 평가하였다. 다중 레벨 벡터양자화를 이용한 음악요약을 제공하는 알고리즘에서 고정된 길이의 음악요약을 제공하는 알고리즘은 사람이 직접 요약한 결과와 제안한 방법으로 구한 요약과의 중첩도 (Overlapping Ratio)를 이용한 결과 기존의 방법들이 42.2% 와 47.3% 임에 비해 제안된 방법은 67.1%로 높은 성능을 보여주었고, 최적의 길이를 가지는 음악요약을 제공하는 알고리즘은 음악에 따라 다른 길이를 가지는 반복되는 부분의 포함 정도를 나타내는 최적 중첩비율 (Optimal Overlapping Ratio) 을 측정한 결과 고정된 길이를 가지는 음악요약 보다 최적의 길이로 음악마다 다른 길이 의 반복되는 부분을 효과적으로 표현함을 알 수 있었다. 집단화 방법을 이용한 알고리즘은 두 가지 질문들 (제공된 세그먼트들 중 특정이 비슷한 것의 개수, 제공된 세그먼트들 중 같은 구조에 속하는 것의 개수)을 이용한 MOS 테스트에서 우수한 결과를 보여주었다. 환자에서 완전관해를 보였고, 원격전이와 국소재발이 각각 2명과 1명에서 관찰되었다. 결론: SMART를 사용한 IMRT를 도입하여 임상적으로나 선량측정상 이하선의 기능 보존이 가능하였으며, 또한 생물학적으로 더욱 효과적일 것으로 생각되었다 향후 정확한 종양억제 효과와 만기 독성을 알기 위해서는 추가적인 연구대상과 추적관찰이 필요하다고 생각한다.ty modulated radiation therapy, IMRT)를 이용한 최근의 결과와 비교하여 CK를 이용한 정위 방사선 치료는 생존율 측면에서 비슷하거나 나은 결과를 보였다. 또한 심각한 부작용은 관찰되지 않았으며 짧은 기간의 치료로 환자에게 편의를 제공할 수 있어 결과적으로 삶의 질을 향상시킬 수 있을 것이다. 따라서, 이 새로운 치료 방법은 국소 진행된, 절제 불가능한 췌장암 환자에서 심각한 부작용 없는 효과적인 치료가 될 것으로 생각된다. 또한 계획용 표적 체적은 CK 치료의 유용한 예후 인자로 사용될 것이다.인위적 활동에 의한 부분이 높은 것으로 추정되었다.가>에는 이 시교의 외면적인 따스함과 내면적인 정(情)과 성(性)의 부드러움이 적고. 그 반대로 풍간하여 지절사정(指切事情)함이 강하였던 모양이다. 풍간하여 사정(事情)을 매몰차게 지적하여 논평하였음을 퇴계는 '완세불공(玩迷不恭)'이라고 판단했을 것이다. 장육당은 청(淸)과 탁(濁)이 있음을 알지 못하고. 그것의 분별도 하지 못하는 세상 사람들을 완농(玩弄)하였다. 그러므로 그는 진환(塵 )에서 초연(超然)했던 것이다. 천석고황(泉石膏 )으로 태평성대(太平聖代)에 사시가흥(四時佳興)을 한가지로 하는 퇴계와는 그래서 다르다. 퇴계는 순풍(淳風)과 어진 인성(人性)을 긍정하였기에 만족하고. '고인(古人)의 녀던 길'을 끊임없이 행(行)하고자 하였다. 여기에서 '완세불공(玩世不恭)'과 '온유돈후(溫柔敦厚)'가 판별되어진다.

COMPARATIVE ANALYSIS OF STATION BLACKOUT ACCIDENT PROGRESSION IN TYPICAL PWR, BWR, AND PHWR

  • Park, Soo-Yong;Ahn, Kwang-Il
    • Nuclear Engineering and Technology
    • /
    • 제44권3호
    • /
    • pp.311-322
    • /
    • 2012
  • Since the crisis at the Fukushima plants, severe accident progression during a station blackout accident in nuclear power plants is recognized as a very important area for accident management and emergency planning. The purpose of this study is to investigate the comparative characteristics of anticipated severe accident progression among the three typical types of nuclear reactors. A station blackout scenario, where all off-site power is lost and the diesel generators fail, is simulated as an initiating event of a severe accident sequence. In this study a comparative analysis was performed for typical pressurized water reactor (PWR), boiling water reactor (BWR), and pressurized heavy water reactor (PHWR). The study includes the summarization of design differences that would impact severe accident progressions, thermal hydraulic/severe accident phenomenological analysis during a station blackout initiated-severe accident; and an investigation of the core damage process, both within the reactor vessel before it fails and in the containment afterwards, and the resultant impact on the containment.

Online-Based Local Government Image Typology: A Case Study on Jakarta Provincial Government Official YouTube Videos

  • Pratama, Arif Budy
    • Journal of Contemporary Eastern Asia
    • /
    • 제16권1호
    • /
    • pp.1-21
    • /
    • 2017
  • The Jakarta Provincial Government utilizes the YouTube channel to interact with citizens and enhance transparency. The purpose of this study is to explore online perceptions of local government image perceived by online audiences through the YouTube platform. The concepts of organizational image and credibility in the political image are adapted to analyze online public perceptions on the Jakarta Provincial Government image. Using the video summarization approach on Three hundred and forty-six official YouTube videos, which were uploaded from 1 March 2016 to 31 May 2016, and content analysis of Eight thousand two hundred and thirty-seven comments, this study shows both political and bureaucratic image emerge concurrently in the Jakarta Provincial Government case. The typology model is proposed to describe and explain the four image variations that occurred in the case study. Practical recommendations are suggested to manage YouTube channel as one of the social media used in the local government context.

TextRank 알고리즘과 주의 집중 순환 신경망을 이용한 하이브리드 문서 요약 (Hybrid Document Summarization using a TextRank Algorithm and an Attentive Recurrent Neural Networks)

  • 정석원;이현구;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.47-50
    • /
    • 2017
  • 문서 요약은 입력 문서가 가진 주제를 유지하면서 크기가 축약된 새로운 문서를 생성하는 것이다. 문서 요약의 방법론은 크게 추출 요약과 추상 요약으로 구분된다. 추출 요약의 경우 결과가 문서 전체를 충분히 대표하지 못하거나 문장들 간의 호응이 떨어지는 문제점이 있다. 최근에는 순환 신경망 구조의 모델을 이용한 추상 요약이 활발히 연구되고 있으나, 이러한 방법은 입력이 길어지는 경우 정보가 누락된다는 문제점을 가지고 있다. 본 논문에서는 이러한 단점들을 해소하기 위해 추출 요약으로 입력 문서의 중요한 일부 문장들을 선별하고 이를 추상 요약의 입력으로 사용했을 때의 성능 변화를 관찰한다. 추출 요약을 통해 원문 대비 30%까지 문서를 요약한 후 요약을 생성했을 때, ROUGE-1 0.2802, ROUGE-2 0.1294, ROUGE-L 0.3254의 성능을 보였다.

  • PDF

Definition Sentences Recognition Based on Definition Centroid

  • 김권양
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.813-818
    • /
    • 2007
  • This paper is concerned with the problem of recognizing definition sentences. Given a definition question like "Who is the person X?", we are to retrieve the definition sentences which capture descriptive information correspond variously to a person's age, occupation, of some role a person played in an event from the collection of news articles. In order to retrieve as many relevant sentences for the definition question as possible, we adopt a centroid based statistical approach which has been applied in summarization of multiple documents. To improve the precision and recall performance, the weight measure of centroid words is supplemented by using external knowledge resource such as Wikipedia and redundant candidate sentences are removed from candidate definitions. We see some improvements obtained by our approach over the baseline for 20 IT persons who have high document frequency.

비음수 행렬 인수분해를 이용한 일반적 문서 요약 (Generic Text Summarization Using Non-negative Matrix Factorization)

  • 박선;이주홍;안찬민;박태수;김재우;김덕환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.469-472
    • /
    • 2006
  • 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)를 이용하여 문장을 추출하여 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 문장추출에 사용되는 의미 특징(semantic feature)이 비 음수 값을 갖기 때문에 잠재의미분석에 비해 문서의 내용을 정확하게 요약한다. 또한, 적은 계산비용을 통하여 쉽게 요약 문장을 추출할 수 있는 장점을 갖는다.

  • PDF

문서 구조 정보를 이용한 확률 모델 기반 자동요약 시스템 (An Automatic Summarization System Based On a Probabilistic Model Using Document Structure Information)

  • 장동현;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.15-22
    • /
    • 1997
  • 인터넷과 정보 서비스 기술의 발달로 일반 대중에게 제공되는 정보의 양은 기하급수적으로 증가하고 있는 추세지만 사용자가 원하는 정보를 얻기는 더욱 어려워지고 있으며, 필요한 정보를 찾은 경우에도 그 양이 많기 때문에 전체적인 내용을 파악하는 데 많은 시간을 소비하게 된다. 이러한 문제를 해결하고자 본 연구에서는 통계적 모델을 사용하여 문서로부터 문장을 추출한 후 요약문을 작성하여 사용자에게 제시하는 시스템을 개발하였다. 문서 요약 시스템의 구축을 위하여 사용된 방법은 문서 집합으로부터 중요 문장을 추출한 후 이로부터 요약문에 나타날 수 있는 특성(feature)과 중요 단어를 학습하여 학습된 내용을 이용하여 요약문을 하는 방법이다. 시스템 개발 및 평가를 위해 사용된 문서는 정보 과학 분야의 논문 모음이며 이를 학습 데이터와 실험 데이터로 구분한 후 학습 데이터로부터 필요한 정보를 얻고 실험 데이터로 평가하였다.

  • PDF

텍스트 이해 모델에 기반한 정보 검색 시스템 (Text Undestanding System for Summarization)

  • 송인석;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

Information Extraction and Sentence Classification applied to Clinical Trial MEDLINE Abstracts

  • Hara, Kazuo;Matsumoto, Yuji
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.85-90
    • /
    • 2005
  • In this paper, firstly we report experimental results on applying information extraction (IE) methodology to the task of summarizing clinical trial design information in focus on ‘Compared Treatment’, ‘Endpoint’ and ‘Patient Population’ from clinical trial MEDLINE abstracts. From these results, we have come to see this problem as one that can be decomposed into a sentence classification subtask and an IE subtask. By classifying sentences from clinical trial abstracts and only performing IE on sentences that are most likely to contain relevant information, we hypothesize that the accuracy of information extracted from the abstracts can be increased. As preparation for testing this theory in the next stage, we conducted an experiment applying state-of-the-art sentence classification techniques to the clinical trial abstracts and evaluated its potential in the original task of the summarization of clinical trial design information.

  • PDF