• 제목/요약/키워드: news text

검색결과 382건 처리시간 0.034초

영한 기계 번역에서 미가공 텍스트 데이터를 이용한 대역어 선택 중의성 해소 (Target Word Selection Disambiguation using Untagged Text Data in English-Korean Machine Translation)

  • 김유섭;장정호
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.749-758
    • /
    • 2004
  • 본 논문에서는 미가공 말뭉치 데이터를 활용하여 영한 기계번역 시스템의 대역어 선택 시 발생하는 중의성을 해소하는 방법을 제안한다. 이를 위하여 은닉 의미 분석(Latent Semantic Analysis : LSA)과 확률적 은닉 의미 분석(Probabilistic LSA : PLSA)을 적용한다. 이 두 기법은 텍스트 문단과 같은 문맥 정보가 주어졌을 때, 이 문맥이 내포하고 있는 복잡한 의미 구조를 표현할 수 있다 본 논문에서는 이들을 사용하여 언어적인 의미 지식(Semantic Knowledge)을 구축하였으며 이 지식은 결국 영한 기계번역에서의 대역어 선택 시 발생하는 중의성을 해소하기 위하여 단어간 의미 유사도를 추정하는데 사용된다. 또한 대역어 선택을 위해서는 미리 사전에 저장된 문법 관계를 활용하여야 한다. 본 논문에서는 이러한 대역어 선택 시 발생하는 데이터 희소성 문제를 해소하기 위하여 k-최근점 학습 알고리즘을 사용한다. 그리고 위의 두 모델을 활용하여 k-최근점 학습에서 필요한 예제 간 거리를 추정하였다. 실험에서는, 두 기법에서의 은닉 의미 공간을 구성하기 위하여 TREC 데이터(AP news)론 활용하였고, 대역어 선택의 정확도를 평가하기 위하여 Wall Street Journal 말뭉치를 사용하였다. 그리고 은닉 의미 분석을 통하여 대역어 선택의 정확성이 디폴트 의미 선택과 비교하여 약 10% 향상되었으며 PLSA가 LSA보다 근소하게 더 좋은 성능을 보였다. 또한 은닉 공간에서의 축소된 벡터의 차원수와 k-최근점 학습에서의 k값이 대역어 선택의 정확도에 미치는 영향을 대역어 선택 정확도와의 상관관계를 계산함으로써 검증하였다.젝트의 성격에 맞도록 필요한 조정만을 통하여 품질보증 프로세스를 확립할 수 있다. 개발 된 패키지의 효율적인 활용이 내조직의 소프트웨어 품질보증 구축에 투입되는 공수 및 어려움을 줄일 것으로 기대된다.도가 증가할 때 구기자 열수 추출 농축액은 $1.6182{\sim}2.0543$, 혼합구기자 열수 추출 농축액은 $1.7057{\sim}2.1462{\times}10^7\;J/kg{\cdot}mol$로 증가하였다. 이와 같이 구기자 열수 추출 농축액과 혼합구기자 열수 추출 농축액의 리올리지적 특성에 큰 차이를 나타내지는 않았다. security simultaneously.% 첨가시 pH 5.0, 7.0 및 8.0에서 각각 대조구의 57, 413 및 315% 증진되었다. 거품의 열안정성은 15분 whipping시, pH 4.0(대조구, 30.2%) 및 5.0(대조구, 23.7%)에서 각각 $0{\sim}38.0$$0{\sim}57.0%$이었고 pH 7.0(대조구, 39.6%) 및 8.0(대조구, 43.6%)에서 각각 $0{\sim}59.4$$36.6{\sim}58.4%$이었으며 sodium alginate 첨가시가 가장 양호하였다. 전체적으로 보아 거품안정성이 높은 것은 열안정성도 높은 경향이며, 표면장력이 낮으면 거품형성능이 높아지고, 비점도가 높으면 거품안정성 및 열안정성이 높아지는 경향이 있었다.protocol.eractions between application agents that are developed using different

토픽 모델링을 활용한 한국의 창업생태계 트렌드 변화 분석 (Analysis on Dynamics of Korea Startup Ecosystems Based on Topic Modeling)

  • 손희영;이명종;변영조
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.315-338
    • /
    • 2022
  • 1986년, 한국은 국가발전의 주축인 중소기업 창업지원을 위한 법 제도를 마련하였다. 이를 기반으로 지난 30여년간 창업정책의 수립 및 발전을 거듭하여 매년 100만 개가 넘는 신규 창업기업이 설립되는 역동적인 창업생태계를 구축하였다. 국가의 정책 방향과 사회, 경제, 문화 등의 외부환경 영향, 그리고 창업지원의 역사를 주요 이슈별로 분석하여 도출된 핵심문장 또는 키워드는 시대별 지원의 특징과 국가지원의 중심내용 등을 확인하는 데 매우 유용하다. 본 연구는 한국의 창업생태계 트렌드 변화를 분석하기 위해 1991년부터 2020년 12월까지 30년간의 언론기사에서 '창업', '벤처', '스타트업' 키워드가 포함된 118만여 건을 추출하고 네트워크 분석과 토픽 모델링을 활용하였다. 분석결과, 한국의 창업생태계 트렌드는 기업 및 산업육성, 확산 그리고 규제 완화, 활황 등, 정부 중심으로 스타트업 생태계의 변화와 발전이 이루어졌음을 파악할 수 있었으며, 다빈도 키워드 분석결과, 생태계 구성요인 간의 연계 활동을 통하여 기업가적인 생산성이 창출되었다. 생산성 창출의 주요 요인으로 한국은 대기업의 휴대폰 산업 발전과 이와 관련된 콘텐츠 스타트업의 성장, 인터넷과 쇼핑몰 중심의 플랫폼 기업의 발전, 그리고 청년창업과 글로벌 진출, 모바일과 인터넷 인프라 중심의 창업기업육성 노력 등으로 파악할 수 있었다. 본 연구는 30년간의 언론기사를 텍스트마이닝과 토픽 모델링을 활용하여 트렌드를 도출하였다. 이는 선행연구가 기존 정부와 정책의 변경 시기를 기준으로 트렌드 변화를 분석한 것과 달리, 언론기사의 키워드와 토픽 변화를 기준으로 창업생태계의 트렌드 변화를 분석하였다는 점에서 학술적 의의뿐만 아니라, 30년 간의 창업생태계 변화 및 주요이슈를 조명해 봄으로써 향후 창업지원의 방향성을 예측할 수 있는 실무적 시사점을 제공하였다.

조선시대 한글 간찰과 이메일의 상투적 표현 고찰 (A Study on Conventional Expression of Hangul Ganchal and Email)

  • 전병용
    • 동양고전연구
    • /
    • 제49호
    • /
    • pp.431-459
    • /
    • 2012
  • 본고의 목적은 조선시대 한글 간찰과 이메일을 대상으로 상투적인 표현을 비교 분석하는 데 있다. 상투적 표현은 일반적으로 서두(書頭) 부분과 결말(結末) 부분에서 두드러지게 쓰인다. 서두에서는 호칭(呼稱)과 안부인사(安否人事)에서, 결말(結末)에서는 결말인사(結末人事)와 결구(結句)에서 많이 쓰인 것을 알 수 있었다. 인편(人便)을 통해 주고받던 조선시대 한글 간찰의 피봉(겉봉)에는 대부분 수신자(受信者)의 정보만 담기는데, 간찰의 전달자(傳達者)가 발신자(發信者)와 수신자(受信者)를 잘 아는 사람이기에 굳이 발신자의 상세한 정보를 피봉에 쓸 필요가 없기 때문이다. 호칭 상투적 표현의 경우, 비칭(卑稱)에서는 '~에게' 형이, 존칭(尊稱)에서는 '~께' 형이 간찰과 이메일에서 두루 쓰이고 있음을 확인하였다. 계절인사는 간찰이나 이메일 모두에서 상투적 표현으로 자리 잡지 못했음을 확인하였다. 안부인사는 [수신자 안부 + 발신자 안부]의 구성을 보이는데, 간찰에서는 이 구성이 상투적 표현으로 잘 드러나지만, 이메일의 경우는 상투적 표현으로 [수신자 안부]만 어느 정도 드러나고 [발신자 안부]는 상투적 표현으로 자리 잡지 못하였으며 생략되는 일도 흔하였다. 결말에서는 간찰의 경우, [결말 인사 + 결구]의 구성에서 상투적 표현이 잘 드러나지만, 이메일의 경우, 상투적 표현이 자리 잡지 못하였으며 생략되는 일도 흔하였다. 결론적으로 상투적 표현은 간찰의 경우, 16세기 <순언>에서 고유어 중심의 표현이 자리 잡기 시작하였으며 17세기 <현언>에서는 답보상태를 보이다가 19세기 <징언>에서는 한문 간찰의 영향을 강하게 받아 보수적 표현으로 퇴행하였다고 말할 수 있다. 이메일에서는 전반적으로 상투적 표현이 사라지고 있음을 확인할 수 있었다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

문헌정보학과 WWW홈페이지의 필요성과 준비에 관한 연구- 한국과 북미주 지역 대학을 중심으로 -

  • 박일종
    • 한국도서관정보학회지
    • /
    • 제24권
    • /
    • pp.413-448
    • /
    • 1996
  • Nowadays, the World Wide Web (WWW) has become an important resource of timely information for the information-related people such as information scientists, librarians, and students in Library and Information Sciences area. They are information professionals who navigate the information on the internet. Also, they need to be information providers who build a WWW homepage. This paper is a study of the necessity, preparation, and building WWW Homepage files for school of Library and Information Sciences in the age of competition among disciplines. It is particularly focused on the colleges and universities in Republic of Korea (ROK) and North America area. The purpose of this study is to provide various kinds of reference information to prepare a homepage in the future as utilizing information on the internet effectively. Even though a Web page was necessary for a school of Library and Information Sciences to show news, and introduce the purpose of the disciplines and the curriculum of the school, and the professors of a class etc., it was not well-prepared yet in ROK. However, a web page was used well enough and prosperous in North America area (Canada, the United States, and Puerto Rico) comparatively. Those web pages were analyzed and studied to prepare for a good designing of homepages for school of Library and Information Sciences in Korea and for the age of competition among disciplines in this paper. Suggestions for designing a good homepage and guidelines for preparing a best one were studied after both reviewing literature and utilizing experiences by the author who currently serves in the School of Library and Information Sciences in Keimyung University and builds homepage for the school. As a result, the major suggestions are ; premiered, and they are as follows: (1) English version of a homepage is necessary, (2) Provide a multimedia presentation about the nature of a school (3) Incorporate a place to let people make suggestions on the contents (of a homepage), (4) Bear in mind that potential users must be familiar with abbreviations you used, (5) Absolutely do not use abbreviations that may make the content more difficult to understand, (6) Add a feature on the every single page that will take the user back to the main page, (7) Use clear, short and well-structured sentences and remember to divide text into paragraphs, (8) Date with a creation or modification date in the homepage to indicate the updated date, (9) Being a multimedia environment, use colors effectively (the guidelines were also suggested), and (10) Put colleges' name into the title of bookmarks to find out them easily.

  • PDF

점진적 EM 알고리즘에 의한 잠재토픽모델의 학습 속도 향상 (Accelerated Loarning of Latent Topic Models by Incremental EM Algorithm)

  • 장정호;이종우;엄재홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권12호
    • /
    • pp.1045-1055
    • /
    • 2007
  • 잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.

장비점검 일지의 비정형 데이터분석을 통한 고장 대응 효율화 사례 연구 (Unstructured Data Analysis using Equipment Check Ledger: A Case Study in Telecom Domain)

  • 주연진;김유신;정승렬
    • 인터넷정보학회논문지
    • /
    • 제21권1호
    • /
    • pp.127-135
    • /
    • 2020
  • 비정형 데이터의 수집, 분석 그리고 활용에 대한 필요성이 대두되고 있지만 여전히 비정형 데이터를 효과적으로 활용하지 못하고 있는 실정이다. 본 연구에서는 국내 유수 이동통신 기업의 통신 시설장비 점검 시스템에 기록된 비정형데이터를 분석하여 장비고장 대응과 예방에 적극 활용할 수 있는 기반을 만들고자 하였고, 약 220만 건의 작업일지 데이터를 텍스트 마이닝을 통해 구조화/정형화 하였다. 이를 위해 장비 고장과 관련된 4가지 분석 프레임, 고장인지, 고장원인, 고장대상, 조치결과를 구성하였고 분석 결과로는 크게 3가지의 효율화 방안과 관련한 인사이트를 얻을 수 있었다. 첫 번째로는 신속한 조치를 통한 시간 단축을 도모하고, 두 번째로는 고장장비 Unit 수요를 예측하고, 마지막으로 현장 출동의 최소화를 지원할 수 있을 것으로 기대되었다. 결론적으로, 본 사례연구는 통신시설 장비 고장 대응을 위해 데이터 분석 대상을 정형 데이터뿐만 아니라 장비일지라는 비정형 빅데이터로도 범위를 확장했으며, 이를 분석에 활용하기 위해 처음으로 텍스트 마이닝을 시도를 했다는데 의의를 가진다. 또한 N사는 정형 데이터 뿐 만아니라 년 80만 건씩 축적되던 비정형 데이터의 활용 가치를 확인할 수 있던 기회를 가졌으며, 향후 비정형 데이터의 활용 방안에 대한 발전방향 그리고 추후의 정형 데이터와의 연계 분석 방안 등에 대한 가이드를 확보할 수 있었다.

조선시대 한글 편지의 전달 양상 고찰 (A Study on the Delivery Pattern of Korean letters during the Joseon Dynasty)

  • 전병용
    • 동양고전연구
    • /
    • 제69호
    • /
    • pp.419-450
    • /
    • 2017
  • 본 연구는 조선시대 한글 편지의 전달 양상을 분석함으로써 근대적인 우편 제도 발달의 단초를 찾아보는 것이다. 조선시대 편지 전달의 문제점은 전달의 지체성(遲滯性), 인편의 부정기성(不定期性), 전달의 부정확성, 전달자에 대한 불신성(不信性), 전달의 고비용성(高費用性) 등이라 할 수 있는데 대부분 전달의 체계성 결여에서 비롯된 것들이다. 구체적인 논의 진행을 위하여 편지의 전달 방식과 전달자의 성격을 기준에 따라 나누어 분석하였다. 전달 방식은 전달 수단의 공사(公私) 여부에 따라 공인편(公人便)과 사인편(私人便)으로 나누었고, 전달 단계의 다단(多段) 여부에 따라 일단계전달(一段階傳達)과 다단계 전달(多段階傳達)로 나누었으며, 전달의 왕복(往復) 여부에 따라 편도전달(片道傳達)과 왕복전달(往復傳達)로 나누어 분석하였다. 전달 방식의 양상 분석 결과, 공인편, 다단계 전달, 편도 전달 방식이 근대 우편제도의 배달 방식으로 이어졌을 것으로 추정되었다. 개화기에 우체사라는 공적 기관에 의해 다단계 편도 전달의 시스템으로 발전하였다는 의미이다. 전달자의 특성은 구두(口頭) 전달 여부에 따라 구두 전달, 편지와 구두 전달, 편지 전달로 나누었고, 송신자와의 관계(關係) 여부에 따라 관계인(關係人) 전달과 비관계인(非關係人) 전달로 나누었으며, 전담(專擔) 여부에 따라 인편(人便) 전달과 전인(專人) 전달로 나누어 분석하였다. 전달자 양상의 분석 결과, '편지 전달', '비관계인 전달', '전인 전달'의 특성이 우체사의 체전부의 역할로 일정 부분 계승되었을 것으로 추정하였다.

현대 한국 여성의 여가문화에 대한 담론 변화 연구 - 1960-2010년대 신문 기사의 의미연결망 분석을 중심으로 - (A discourse analysis for Korean women's leisure culture from 1960s to the present - Application of semantic network analysis)

  • 차민경
    • 문화경제연구
    • /
    • 제21권2호
    • /
    • pp.197-229
    • /
    • 2018
  • 본 연구는 현대 한국 여성의 여가에 대한 사회적 인식을 시대별로 분석, 여성들이 여가 문제에 있어 어떤 이데올로기 갈등을 겪어왔는지 그 사회적, 문화적 맥락을 종합적으로 분석하여 향후 여성의 여가향유 환경 개선을 위한 의미 있는 시사점을 도출하고자 하였다. 이를 위해 본 연구는 여성 여가에 대해 다룬 총 4,614개의 언론 기사의 652,513개의 단어를 '의미연결망' 기법을 활용하여 분석하였다. 연구결과, 1960년대에는 '현대화'와 '현모양처' 이데올로기가 혼재된 양상을 보였고, 1970년대에는 전통적 현모양처에 뿌리를 두되 부업을 통해 가정 경제에 기여하는 희생적인 여성의 모습을 미덕화 했다. 1980년대 여성의 고등교육과 사회진출 증가로 '현대 여성 이데올로기'가 강조되었으나, 이 시기부터 여성 여가 문제에 있어 '현모양처' 이데올로기와의 본격적 갈등이 시작된다. 여성의 지위가 향상된 1990년대에는 오히려 두 이데올로기의 갈등이 심화된 양상을 보였고, 2000년대에도 이러한 갈등은 지속되며 오히려 이데올로기 갈등 사이에서 여성은 자신의 여가를 희생하는 경향을 보였다. 2010년대에는 두 이데올로기 간의 갈등이 여전한 가운데, 쉽게 소비할 수 있는 여가상품의 증가로 자투리 시간을 활용한 스낵컬쳐 여가를 선호하는 양상을 보이게 되었다.

뉴스 빅데이터를 통해 검토한 대학교육의 토픽 분석 (A Topic Analysis of College Education Using Big Data of News Articles)

  • 양지연;구정호
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.11-20
    • /
    • 2021
  • 본 연구는 신문기사 빅데이터를 통해 대학교육 관련 보도의 토픽을 추출하고, 토픽별 특징 및 신문사별 보도양상을 분석한다. 2016년-2021년 상반기 주요 중앙지와 지역지의 기사를 빅카인즈를 통해 추출하였고, 잠재디리슐레할당을 이용하여 총 9개의 토픽을 발견하였다. 토픽1과 토픽3은 교육에 대한 대학지원사업에 관련된 것이나 토픽3은 지역대학에 초점이 맞추어져 있다. 토픽2는 코로나19 이후 대학교육, 토픽4는 교수-학습법, 토픽5는 정부정책, 토픽6은 고교교육기여대학 지원사업, 토픽7은 대학교육 비전, 토픽8은 국제화, 토픽9는 입시 등을 논하고 있다. 조선일보, 경향신문, 한겨레는 코로나19 이후 강의, 정부정책 관련, 대학교육에 대한 기사와 논평을 많이 보도한 반면 동아일보, 중앙일보, 한라일보, 부산일보, 대전일보, 경인일보는 대학지원사업, 고교교육기여대학 지원사업 등 광고·홍보성 기사가 상대적으로 많았다. 2016년부터의 관련기사를 신문사별 뿐 아니라, COVID-19 발생 전후로도 분석하여 관련 보도의 토픽 차이를 살펴볼 수 있었다. 사회적으로 주요 관심 사항인 대학교육이 언론에 어떻게 보도되고 있는지 확인함으로써 미래의 대학교육 정책 방향과 미디어의 순기능과 역기능 등 언론의 역할에 대해 고찰할 필요가 있음을 시사한다.