• 제목/요약/키워드: Topic Keywords

검색결과 378건 처리시간 0.314초

자연어 처리 기술을 활용한 인구 고령화 관련 토픽 분석 (Analysis of Topics Related to Population Aging Using Natural Language Processing Techniques)

  • 박현정;이태민;임희석
    • 한국IT서비스학회지
    • /
    • 제23권1호
    • /
    • pp.55-79
    • /
    • 2024
  • Korea, which is expected to enter a super-aged society in 2025, is facing the most worrisome crisis worldwide. Efforts are urgently required to examine problems and countermeasures from various angles and to improve the shortcomings. In this regard, from a new viewpoint, we intend to derive useful implications by applying the recent natural language processing techniques to online articles. More specifically, we derive three research questions: First, what topics are being reported in the online media and what is the public's response to them? Second, what is the relationship between these aging-related topics and individual happiness factors? Third, what are the strategic directions and implications for benchmarking discussed to solve the problem of population aging? To find answers to these, we collect Naver portal articles related to population aging and their classification categories, comments, and number of comments, including other numerical data. From the data, we firstly derive 33 topics with a semi-supervised BERTopic by reflecting article classification information that was not used in previous studies, conducting sentiment analysis of comments on them with a current open-source large language model. We also examine the relationship between the derived topics and personal happiness factors extended to Alderfer's ERG dimension, carrying out additional 3~4-gram keyword frequency analysis, trend analysis, text network analysis based on 3~4-gram keywords, etc. Through this multifaceted approach, we present diverse fresh insights from practical and theoretical perspectives.

텍스트 마이닝 기법을 이용한 정보시스템 분야 연구 동향 분석 (Exploring Dynamics of Information Systems Research Trend Using Text Mining Approach)

  • 안정국;김소담;김희웅
    • 경영정보학연구
    • /
    • 제18권3호
    • /
    • pp.73-96
    • /
    • 2016
  • 최근 정보통신기술(Information and Communication Technology) 및 사물인터넷 시대가 도래함에 따라 융복합 환경에 따른 다양한 기술의 발전이 이루어지고 있다. 이에 따라 관련 학문에 대한 이론 및 활용 기술에 대한 관심이 고조되고 있는 상황이다. 이러한 패러다임의 변화는 학문들 간의 급격한 융복합 현상을 초래하였으며, 특히 정보시스템학(Information Systems)은 이러한 변화를 선도해 왔다. 정보시스템학은 다른 학문들과의 관계에 있어서 분화적(Divergence) 역할에서 나아가 융합적(Convergence) 역할까지 수행하고 있으나, 이러한 연구 동향에 관한 연구는 부족한 실정이다. 따라서, 본 연구에서는 시간 경과에 따른 정보시스템의 연구동향을 비교 분석하여 핵심 개념들을 살펴봄으로써 향후 정보시스템학 연구의 방향에 대한 시사점을 찾고자 한다. 구체적으로, 1980년부터 2015년까지의 경영 정보학의 상위 국제저널 48,102개의 논문제목, 저자, 초록, 키워드 분석을 통해 저자들의 공동 연구 네트워크 분석 및 연구 토픽 추출 결과를 연대별로 비교 분석하여 시각화하였다. 본 연구의 결과가 정보시스템 분야의 연구자들에게 정보시스템의 정체성에 대한 폭넓은 이해와 향후 연구 방향에 대한 새로운 시사점을 주기를 기대한다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

연구주제 분석을 통한 한국창작무용 경향 탐색 : 텍스트 마이닝의 적용 (Exploring the Trend of Korean Creative Dance by Analyzing Research Topics : Application of Text Mining)

  • 유지영;김우경
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권6호
    • /
    • pp.53-60
    • /
    • 2020
  • 이 연구는 현상의 흐름과 연구의 경향이 맥락적으로 일치한다는 가정을 바탕에 두고 있다. 이에 텍스트 마이닝을 활용하여 한국창작무용 연구의 주제 분석을 통해 춤의 경향을 탐색하는 것에 목적이 있다. 이에 논문 검색 웹사이트에 구축되어 있는 616편의 논문제목에서 1,291개의 단어를 분석하였다. 데이터의 수집 및 정제, 분석은 모두 R 3.6.0 SW을 사용하였다. 연구결과 첫째, 2000년대 이전에는 시대를 나타내는 키워드가 높은 빈도를 나타내었으나 교육 및 신체훈련 측면에서의 한국창작무용 연구유형도 발견되었다. 둘째, 2000년대 이후에는 무용단의 공연활동과 관련된 키워드의 빈도가 높게 나타났으나 최승희가 여전히 한국창작무용 연구에서 중요한 위치에 있다는 것이 확인되었다. 셋째, 한국창작무용 연구의 전체 연구주제를 분석한 결과 '근대시대 최승희의 예술', '현대 전통의 수용 양상과 가치', '전통춤의 안무적 표현 및 활용', '국립무용단의 공연 활동', '시대별 춤 표현', '교육 프로그램의 적용'으로 총 6개의 토픽이 추출되었다. 이 중 '근대시대 최승희의 예술'에 관한 연구가 가장 높은 비중을 차지하고 있는 것으로 나타났다. 넷째, 2000년을 기준으로 상승하고 있는 Hot 토픽은 '국립무용단의 공연 활동'과 '전통춤의 안무적 표현 및 활용'으로 나타났다. 그러나 최근 국립무용단의 공연 기조가 '전통을 기반으로 한 현대화'를 표방하고 있으므로 2000년대 이후 한국창작무용의 경향이 전통춤을 모티프로 한 안무적 표현과 그 활용에 공통적으로 집중되어 있음이 확인되었다. 다섯째, 2000년을 기준으로 하락하고 있는 Cold 토픽은 '시대별 춤 표현'에 관한 연구로 나타났다. 이것은 한국창작춤의 장르적 정착 이후 다양한 춤 스타일의 혼재에 따른 경향으로 연구에 대한 관심도 역시 저하된 것으로 판단되었다.

텍스트 마이닝을 활용한 지역 특성 기반 도시재생 유형 추천 시스템 제안 (Suggestion of Urban Regeneration Type Recommendation System Based on Local Characteristics Using Text Mining)

  • 김익준;이준호;김효민;강주영
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.149-169
    • /
    • 2020
  • 현 정부의 주요 국책사업 중 하나인 도시재생 뉴딜사업은 매년 100 곳씩, 5년간 500곳을대상으로 50조를 투자하여 낙후된 지역을 개발하는 것으로 언론과 지자체의 높은 이목이 집중되고 있다. 그러나, 현재 이 사업모델은 면적 규모에 따라 "우리동네 살리기, 주거정비지원형, 일반근린형, 중심시가지형, 경제기반형" 등 다섯 가지로 나뉘어 추진되어 그 지역 본래의 특성을 반영하지 못하고 있다. 국내 도시재생 성공 키워드는 "주민 참여", "지역특화" "부처협업", "민관협력"이다. 성공 키워드에 따르면 지자체에서 정부에게 도시재생 사업을 제안할 때 지역주민, 민간기업의 도움과 함께 도시의 특성을 정확히 이해하고 도시의 특성에 어울리는 방향으로 사업을 추진하는 것이 가장 중요하다는 것을 알 수 있다. 또한 도시재생 사업 후 발생하는 부작용 중 하나인 젠트리피케이션 문제를 고려하면 그 지역 특성에 맞는 도시재생 유형을 선정하여 추진하는 것이 중요하다. 이에 본 연구는 '도시재생 뉴딜 사업' 방법론의 한계점을 보완하기 위해, 기존 서울시가 지역 특성에 기반하여 추진하고 있는 "2025 서울시 도시재생 전략계획"의 도시재생 유형을 참고하여 도시재생 사업지에 맞는 도시재생 유형을 추천하는 시스템을 머신러닝 알고리즘을 활용하여 제안하고자 한다. 서울시 도시재생 유형은 "저이용저개발, 쇠퇴낙후, 노후주거, 역사문화자원 특화" 네 가지로 분류된다 (Shon and Park, 2017). 지역 특성을 파악하기 위해 총 4가지 도시재생 유형에 대해 사업이 진행된 22개의 지역에 대한 뉴스 미디어 10만여건의 텍스트 데이터를 수집하였다. 수집된 텍스트를 이용하여 도시재생 유형에 따른 지역별 주요 키워드를 도출하고 토픽모델링을 수행하여 유형별 차이가 있는 지 탐색해 보았다. 다음 단계로 주어진 텍스트를 기반으로 도시재생 유형을 추천하는 추천시스템 구축을 위해 텍스트 데이터를 벡터로 변환하여 머신러닝 분류모델을 개발하였고, 이를 검증한 결과 97% 정확도를 보였다. 따라서 본 연구에서 제안하는 추천 시스템은 도시재생 사업을 진행하는 과정에서 신규 사업지의 지역 특성에 기반한 도시재생 유형을 추천할 수 있을 것으로 기대된다.

발명영재교육에 관한 학술연구 동향 분석 (An Analysis of the Trends in Academic Research on Invention Gifted Education)

  • 이민혜
    • 국제교류와 융합교육
    • /
    • 제3권1호
    • /
    • pp.1-28
    • /
    • 2023
  • 이 연구에서는 발명영재교육의 국내 연구들의 양적 경향성을 살펴보고 이들 연구분석에서 내재적 의미와 연결속성을 파악하여 향후 발전 방안을 모색하기 위한 기초자료를 제공하고자 수행하였다. 이를 위하여 한국학술연구정보원(RISS)에서 '발명영재교육' 으로 논문을 검색하여 등재후보지 이상의 국내 학술논문 97편을 최종 선정하고, 발행년도, 저자구성, 연구자 소속과 소재지역, 발행 학술지 등 연구일반에 관한 SPSS로 기술적 통계분석을 수행하고, 학술논문의 키워드를 이용하여 상위출현빈도, N-gram, 연결·매개중심성을 살펴보았다. 발명영재교육 학술논문으로 확인된 2007년 이후 증가세를 보이던 추세가 제3차 영재교육진흥종합계획 시기를 정점으로 이후 다시 감소세를 나타냈다. 저자 특성를 기술적 통계분석한 결과, 논문 절반이 공동으로 발표되었고 그 다음으로 다수, 단독의 저자구성을 보이고 있었다. 단독으로 발행된 논문은 연구자 소속이 대학, 연구소, 초등학교, 중학교 소속으로 확인되었고, 협력적 논문은 신진 연구자와 전문 연구자가 협력하는 연구, 전문 연구자 간 협력 연구가 다수였으며, 신진 연구자 간 협력적 연구는 1편에 그쳤다. 발명영재교육 논문이 발표된 지역과 학술지를 살펴볼 때, 일부 지역이나 학술지에 집중되어 있었고, 편차가 매우 크게 나타났다. 학술논문 키워드를 이용한 언어네트워크 분석 결과 상위 출현성을 보인 의미 있는 키워드는 창의, 프로그램 등이 확인되었고, 동출현성이 높은 키워드 쌍은 발명영재-창의이었다. 상위의 연결중심성 키워드는 창의, 문제해결·개발·기업 등이 다른 연구주제로 확장하기 위한 중개자 역할을 하며 다양한 주제로 확장 가능한 연구주제로 작용하고 있었다. 매개중심성의 경우 창의, 창의적, 프로그램, 효과 등이 높은 매개중심성을 보여 다른 키워드를 상호매개하거나 중재시키는 역할을 하는 중요한 키워드임을 알 수 있었다. 이러한 연구 결과를 통해 발명영재교육의 발전을 위한 국가정책적 대책이 마련될 필요가 있으며, 영재교육에 대한 사회적 책무성을 높이는 한편, 교사의 전문성을 신장할 수 있는 발명생태문화를 조성할 필요성을 제기하였다.

항공산업 미래유망분야 선정을 위한 텍스트 마이닝 기반의 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for the Aviation Industry)

  • 김현정;조남옥;신경식
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.65-82
    • /
    • 2015
  • 최근 경제적 사회적 부가가치를 창출할 수 있는 유망분야를 선정하여 국가 전략 및 정책 수립 시 반영하기 위해 미래 핵심 이슈를 발견하고 트렌드를 분석하는 것에 대한 관심이 급증하고 있다. 기존에는 미래의 핵심 기술이나 이슈를 발견하고 트렌드 분석을 통해 미래유망분야를 선정하는 연구를 위해 문헌 조사 또는 전문가 평가와 같은 정성적 연구방법이 사용되어 왔다. 그러나 이 연구방법은 대량의 정보로부터 결과를 도출하는데 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 가치가 반영될 가능성이 존재한다. 이와 같은 한계점을 보완하고자 최근 국토교통, 안전, 정보통신기술 등 다양한 분야에서 미래유망분야를 선정하기 위하여 정성적 연구방법에 텍스트 마이닝과 같은 정량적 연구방법을 상호 보완적으로 활용하는 방식으로 트렌드 분석을 수행하는 연구 방법론의 패러다임 변화가 시도되고 있다. 본 연구는 항공산업 전반적인 분야에 빅데이터 분석 방법인 텍스트 마이닝 기법을 적용하여 항공 분야의 연구동향을 파악하고 미래유망분야를 전망하였다. 텍스트 마이닝 기법 중하나인 토픽 분석을 이용하여 항공산업 전반적인 분야의 문서 집합 내 잠재된 토픽을 추출하고, 연도별로 핵심 토픽의 추이를 분석하였다. 분석 결과 항공산업의 미래유망분야로 항공안전정책, 항공운임(저가항공), 그리고 친환경 고연비 연료가 도출되었다. 본 연구결과는 분석 대상을 논문에 한정하여 수행하였다는 한계점이 존재하나, 항공산업 분야의 핵심 이슈를 도출하기 위하여 텍스트 마이닝 기반의 트렌드 분석에 대한 활용가능성을 제시하고, 미래유망분야를 선정하기 위한 정량적인 분석 방법론의 전형을 마련하였다는 점에서 의의가 있다.

2011년 전후의 과학교육분야에서의 융합교육 연구동향의 변화 탐색 (Exploring the Research Trend Changes on Convergence Education of Before and After 2011 in Science Education)

  • 송영욱;백성혜
    • 한국과학교육학회지
    • /
    • 제40권5호
    • /
    • pp.531-542
    • /
    • 2020
  • 이 연구의 목적은 과학교육분야에서 꾸준히 지속해 오고 있는 융합교육을 선행연구와 비교를 통해 2011년 이후 융합교육 연구동향의 변화를 알아보고자 하였다. 과학교육분야의 융합교육관련 논문 발행 편수, 연구대상, 연구내용, 주제연계를 선행연구와 비교 분석하고, 최근 연구동향을 알아보는 네트워크 분석방법을 활용하여 융합교육의 변화를 알아보았다. 과학교육분야에서 융합교육관련 논문 편수는 8.0%이상 꾸준하게 발행되었으며 2012년부터 증가했다가 다시 2015년부터 낮아지고 2017년부터 다시 서서히 증가하는 경향성이 나타났다. 연구대상은 초등학생 대상이 높은 반면 중학생, 고등학생, 대학생 대상은 낮았다. 현직 교사는 증가한 반면에 예비 교사는 감소했고, 문헌과 일반은 다소 증가하였다. 연구내용에서 효과연구는 감소한 반면에 개발연구는 증가했으며, 이론 및 인식연구는 비슷하였다. 주제연계에서 과학 내 연계는 23.9%이고, 과학 외 연계는 76.1%이며, 과학 외 연계에서 공학·기술, 예술 연계가 높았다. 네트워크 분석에서 초등, 과학, STEAM, 프로그램 단어는 출현빈도가 높은 동시에 다른 단어들과 함께 등장하여 네트워크를 주도하고 있었다. 융합교육 연구동향에 대한 교육적 함의는 앞으로 과학교육분야에서 융합교육은 지속될 것이며, 교육 현장에 뿌리를 내리기 위해서는 중등학생을 대상으로 하는 연구가 더욱 활발히 이루어져야 한다는 것이다. 또한 STEAM 중심의 프로그램 개발 및 효과에 대한 연구에서 벗어나 융합교육의 철학적 근거 및 이론적 확립을 위한 연구가 늘어날 필요가 있다.

R 매핑을 이용한 인공지능의 교육적 활용 탐색 -국외 문헌 분석을 중심으로- (Exploring the Educational Use of Artificial Intelligence based on R mapping - Focusing on Foreign Publication Analysis Results -)

  • 김형욱;문성윤
    • 정보교육학회논문지
    • /
    • 제24권4호
    • /
    • pp.313-325
    • /
    • 2020
  • 최근의 혁신적 기술 진보를 배경으로 지능정보사회의 핵심기술인 머신러닝, 딥러닝을 비롯한 인공지능 기술이 비약적으로 발전하면서 인공지능의 교육적 활용에 대한 관심과 필요성이 높아지고 있다. 이에 교육부에서도 인공지능 기술에 기반한 지능정보사회를 대비하여 인공지능 역량 강화 교육을 교육 현장에 도입하는 제 1차 정보교육 종합계획을 발표하였다. 이에 본 연구에서는 인공지능의 교육적 활용 가능성을 탐색하기 위해 Web of Science(WoS)에서 인공지능의 교육적 활용과 관련된 국외 논문 416편의 자료를 수집하였다. 수집한 자료를 대상으로 R 프로그램의 bibliometrix 패키지를 활용하여 국가별 연구현황과 연구 주제, 인용횟수, 저자 등록 키워드 네트워크 분석을 실시하였다. 이를 통해 현재 해외에서 이루어지는 있는 인공지능의 교육적 활용에 대한 연구 동향을 알 수 있었다. 본 연구의 결과를 토대로 인공지능 역량 강화 교육을 위한 정보교육 과정에서 연구되어야 할 주제와 방향성에 대한 시사점 얻을 수 있을 것으로 보인다.

사회학 분야의 연구데이터 특성과 지적구조 규명에 관한 연구 (An Investigation on Characteristics and Intellectual Structure of Sociology by Analyzing Cited Data)

  • 최형욱;정은경
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.109-124
    • /
    • 2017
  • 여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 'Sociology'로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 'Sociology'로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.