• 제목/요약/키워드: Keyword network analysis

검색결과 494건 처리시간 0.034초

토픽 모델링 기반 한국 노인의 행복과 불행 이슈 분석 (A Topic Modeling Approach to the Analysis of Seniors' Happiness and Unhappiness in Korea)

  • 문동지;연다인;김희웅
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.139-161
    • /
    • 2018
  • 한국이 빠르게 고령화 사회에서 고령사회로 진입함에 따라 성공적인 노화, 노후 생활이 개인뿐만 아니라 사회적으로도 관심을 받고 있다. 이에 본 연구는 노인의 행복과 불행 관련된 신문 기사를 통해 전체적인 이해와 더불어 제안을 하기 위한 목적으로 연구를 진행했다. 노인의 행복과 불행에 관련된 기존 연구는 연구대상의 특성상 인터뷰 혹은 인터뷰를 동반한 설문조사의 방법론을 사용해 영향요인을 재확인하거나, 단일효과를 검증하는데 머물렀다. 또한 노인의 행복과 불행에 영향을 미치는 중요한 요인 파악과 더불어 정부, 기업, 가정 및 기타 사회 복지기관으로 분류하여 실증적인 행복 증진, 불행 경감 방안을 제시한 연구가 이루어지지 않았다. 따라서 본 연구는 Alderfer의 ERG 이론을 기반으로 검색어를 선정해 18년간(수집 기간: 2001. 08~2018. 02) 온라인 신문기사를 총 211,309건(행복: 200,246건, 불행: 11,063건)을 수집하여 연구를 진행했다. 분석결과 행복 관련 토픽은 연금, 사회 인프라, 건강, 공동체, 복지, 문화생활, 성공적인 노후, 봉사, 종교, 귀농으로 도출되었고, 불행 관련 토픽은 노인 우울, 복지 부족, 종교 의지, 질병, 은퇴 후 소득, 문화, 봉사, 역사적 사건, 예술, 가족 단절로 나타났다. 추가로 토픽 네트워크 분석을 통하여 각 토픽의 키워드 사이의 네트워크를 시각화했다. 따라서 본 연구는 결과를 통한 실현 가능한 제안을 했다는 점을 시사한다.

연관규칙 기반 동시출현단어 분석을 활용한 기술경영 연구 주제 네트워크 분석 (Exploring the Research Topic Networks in the Technology Management Field Using Association Rule-based Co-word Analysis)

  • 전익진;이학연
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.101-126
    • /
    • 2016
  • 본 연구는 동시출현단어(co-word) 분석을 이용하여 기술경영 분야의 연구 주제 네트워크를 구축하고, 핵심 연구 주제 및 연구 주제 간 상호연관관계를 도출한다. 동시출현 빈도수의 정규화를 통해 키워드 간 유사성을 도출하여 무방향 네트워크를 분석하는 기존 연구들과는 달리 본 연구는 연관규칙분석(association rule)을 통해 키워드 간 신뢰도(confidence)를 도출하여 유방향 네트워크 분석을 수행한다. 2011~2014년 기술경영 분야 9개 국제 학술지에 게재된 2,456개의 논문의 저자키워드를 대상으로 빈도수 상위 200개 키워드를 추출하고, 주제(THEME), 방법(METHOD), 분야(FIELD)의 세 가지 유형으로 키워드를 분류한다. 각 유형별 일원(one-mode) 네트워크를 구축하여, 함께 많이 연구가 이루어진 키워드들을 찾아내고, 핵심 키워드를 도출한다. 또한 두 가지 유형의 키워드 간의 이원(two-mode) 네트워크를 구축하여, 연구 주제별로 함께 많이 활용된 방법 및 대상 분야를 탐색한다. 본 연구 결과는 최근 성숙기에 접어든 기술경영 분야의 연구 흐름 및 지식 구조를 키워드 수준에서 구체적으로 제시함으로써, 기술경영 분야 연구자들의 연구 주제 탐색 및 연구방향 설계에 활용될 수 있을 것으로 기대된다.

빅데이터와 사회연결망 기법을 이용한 '노인 이미지' 분석 ('Elderly image' Analysis Using Big Data and Social Networking Techniques)

  • 한선보;이현심
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.253-263
    • /
    • 2016
  • 빅데이터와 사회연결망 분석기법을 이용하여 사회적 이슈인 '노인 이미지'를 분석 하였다. '노인' 키워드를 입력하여 텍스트마이닝 기법으로 추출된 단어를 분석한 결과 대중의 트렌드를 대표하는 카페, 블로그 등의 매체를 통해 본 노인 이미지는 '어르신'이라는 단어를 가장 많이 사용하고 있었다. 상위 10위 빈도수를 보인 단어를 이용하여 노인의 이미지를 표현하면, "노인은 사회의 존경을 받는 어르신이며 돈을 벌기위해 자격증을 따려고 하고 건강을 챙기며 고령에도 불구하고 100세까지 건강하게 일을 하기를 원하는 어르신"으로 정리되었다. 본 연구는 방대한 양의 데이터를 수집하여 이를 사회연결망 기법으로 분석함으로써 사회적 담론을 포함한 거시적 수준의 '노인 이미지' 분석을 통해 기존의 분석방법과 차별화하고자 하였다. 대중이 느끼는 노인에 대한 이미지가 '어르신'으로 긍정적으로 표현되는 것을 볼 때, 현재 추진하는 노인정책의 방향이 바람직한 방향으로 평가 받고 있다고 할 수 있으며, 한편으로는 그렇게 평가받기를 원하는 대중의 '욕구'를 느낄 수 있었다. 따라서 향후에 적용할 노인 정책 방향은, 노인들이 사회적 역할을 감당하여 사회에서 '필요한 존재'로 인식될 수 있도록 하는 정책이 우선되어야 한다. 또한 건강을 유지하고 활동할 수 있는 일자리 창출과 복지, 소외에 대한 대책 등의 우선순위가 반영된 노인 정책을 추진할 것을 제언하였다.

해외 목록학 연구동향 및 지적구조 분석 (A Study on Analysis of Research Trends and Intellectual Structure in the Overseas Cataloging Research)

  • 이지원;이성숙
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.367-387
    • /
    • 2024
  • 본 연구는 새로운 표준과 규칙의 제정이 이루어지고 또한 향후 예고되어 있음으로 큰 변화의 과정을 거치고 있는 목록학에 있어 그동안 연구가 거의 없었던 해외 연구들의 최근 동향과 지적 구조를 규명하고자 하였다. 이를 위해 2010년 이후 14년간 발행된 논문 680편을 수집한 후, 이로부터 전처리를 거쳐 추출한 1,942개의 저자 키워드를 분석해보았다. 주요 분석 결과는 다음과 같다. 첫째, 해외 목록학 연구는 2017년 이후 주목할만한 성장세를 보이고 있었다. 둘째, 상위빈도 연구주제는 편목, 메타데이터, RDA, 대학도서관, 전거 제어, 링크드 데이터, FRBR, 목록, LCSH, 도서관, 온라인목록이었다. 셋째, 연구주제들은 크게 도서관 목록의 전통적인 부분과 관련된 것과 최근 들어 더욱 활발하게 논의가 진행되고 있는 주제인 전거제어와 협동편목, RDA, 링크드데이터와 관련된 2개의 군집으로 나눌 수 있었고, 이를 14개 소군집으로 세분하여 분석하였다. 넷째, 키워드 군집 14개의 성장지수와 표준 성과지수를 살펴본 결과, 하나의 군집을 제외하고는 학문 분야의 성장의 측면에서 모두 성장을 나타내는 수치를 보여주었다. 본 연구는 향후 국내 학계와 현장을 위한 목록의 발전 양상 예측하기 위한 기초자료 및 관련 교육에 유용하게 활용될 수 있다는 점에서 그 의의가 있다.

빅데이터를 통해 본 한국사회의 미래: 언론사 뉴스기사와 사회과학 학술논문의 '미래사회' 관련 키워드 분석 (Forecasting the Future Korean Society: A Big Data Analysis on 'Future Society'-related Keywords in News Articles and Academic Papers)

  • 김문조;이왕원;이혜수;서병조
    • 정보화정책
    • /
    • 제25권4호
    • /
    • pp.37-64
    • /
    • 2018
  • 본 연구는 빅데이터 분석을 통해 한국사회의 미래를 예견해보고자 한 것이다. 이러한 목적을 위해 일차적으로 국내 127개 주요 언론사의 뉴스기사(매체지) 및 사회과학 우수학술지 논문초록(학술지) DB에서 '미래사회' 관련 텍스트를 선정한 후, 해당 기사의 제목 및 논문 키워드로부터 주제어를 추출하였다. 추출한 핵심 주제어의 출현 빈도, 연도별 추세 및 주제어/연관어 연결망구조에 의거해 한국사회의 미래적 관심사를 탐지한 결과, 매체지의 미래 관심사는 '경제', '정치', '과학기술', 학술지의 그것은 '심리', '직무', '문화' 관련 사항들이 주축을 이루고 있음이 확인되었다. 여기에 $J{\ddot{u}}rgen$ Habermas의 '체계와 생활세계(system and life-world)' 개념틀을 적용하면, 매체지와 학술지의 미래 관심은 각기 '체계' 및 '생활세계' 범주에 집중되어 있다는 결론에 이르게 된다. 이 같은 미래 관심사의 분화 양상에 착안해 사회적 도전 과제들을 상이한 여건이나 가치들 간의 불일치의 소산으로 인식하는 '부조화론(mismatch theory)'을 미래연구를 위한 대안적 패러다임으로 제시함으로써, 절대적 혹은 상대적 빈곤 문제에 천착해 온 미래사회의 인식 수준을 한 단계 높이고자 한다.

텍스트마이닝 기법을 활용한 사용후핵연료 건식처리기술 관련 언론 동향 분석 (Analysis of media trends related to spent nuclear fuel treatment technology using text mining techniques)

  • 정지송;김호동
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.33-54
    • /
    • 2021
  • 최근 4차 산업혁명, 코로나로 인한 뉴노멀 시대의 도래 등을 계기로 인공지능, 빅데이터 연구와 같은 언택트 관련 기술의 중요성이 더욱 급상하고 있다. 각 종 연구 분야에서는 이러한 연구 트렌드를 따라가기 위한 융합적 연구가 본격적으로 시행되고 있으나 원자력 분야의 경우 자연어 처리, 텍스트마이닝 분석 등 인공지능 및 빅데이터 관련 기술을 적용한 연구가 많이 수행되지 않았다. 이에 원자력 연구 분야에 데이터 사이언스 분석기술의 적용 가능성을 확인해보고자 본 연구를 수행하였다. 원자로 연료로 사용된 뒤 배출되는 사용후핵연료 인식 동향 파악에 대한 연구는 원자력 산업 정책에 대한 방향을 결정하고 산업정책 변화를 사전에 대응할 수 있다는 측면에서 매우 중요하다. 사용후핵연료 처리기술은 크게 습식 재처리 방식과 건식 재처리 방식으로 나뉘는데, 이 중 환경 친화적이고 핵비확산성 및 경제성이 높은 건식재처리 기술인 '파이로프로세싱'과 그 연계 원자로 '소듐냉각고속로'의 연구개발에 대한 재평가가 현재 지속적으로 검토되고 있다. 따라서 위와 같은 이유로, 본 연구에서는 사용후핵연료 처리기술인 파이로프로세싱에 대한 언론 동향 분석을 진행하였다. 사용후핵연료 처리기술인 '파이로프로세싱' 키워드를 포함하는 네이버 웹 뉴스 기사 전문의 텍스트데이터를 수집하여 기간에 따라 인식변화를 분석하였다. 2016년 발생한 경주 지진, 2017년 새 정부의 에너지 전환정책 시행된 2010년대 중반 시기를 기준으로 전, 후의 동향 분석이 시행되었고, 빈도분석을 바탕으로 한 워드 클라우드 도출, TF-IDF(Term Frequency - Inverse Document Frequency) 도출, 연결정도 중심성 산출 등의 분석방법을 통해 텍스트데이터에 대한 세부적이고 다층적인 분석을 수행하였다. 연구 결과, 2010년대 이전에는 사용후핵연료 처리기술에 대한 사회 언론의 인식이 외교적이고 긍정적이었음을 알 수 있었다. 그러나 시간이 흐름에 따라 '안전(safety)', '재검토(reexamination)', '대책(countermeasure)', '처분(disposal)', '해체(disassemble)' 등의 키워드 출현빈도가 급증하며 사용후핵연료 처리기술 연구에 대한 지속 여부가 사회적으로 진지하게 고려되고 있음을 알 수 있었다. 정치 외교적 기술로 인식되던 사용후핵연료 처리기술이 국내 정책의 변화로 연구 지속 가능성이 모호해짐에 따라 언론 인식도 점차 변화했다는 것을 확인하였다. 이러한 연구 결과를 통해 원자력 분야에서의 사회과학 연구의 지속은 필수불가결함을 알 수 있었고 이에 대한 중요성이 부각되었다. 또한, 현 정부의 원전 감축과 같은 에너지 정책의 영향으로, 사용후핵연료 처리기술 연구개발에 대한 재평가가 시행되는 이 시점에서 해당 분야의 주요 키워드 분석은 향후 연구 방향 설정에 기여할 수 있을 것이라는 측면에서 실무적 의의를 갖는다. 더 나아가 원자력 공학 분야에 사회과학 분야를 폭넓게 적용할 필요가 있으며, 국가 정책적 변화를 고려해야 원자력 산업이 지속 가능할 것으로 사료된다.

빅데이터 분석 서비스 지원을 위한 지능형 웹 크롤러 (Intelligent Web Crawler for Supporting Big Data Analysis Services)

  • 서동민;정한민
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.575-584
    • /
    • 2013
  • 빅데이터 분석을 위해 활용되는 데이터로는 뉴스, 블로그, SNS, 논문, 특허 그리고 센서로부터 수집된 데이터 등 매우 다양한 유형의 데이터가 있다. 특히, 신뢰성 있는 데이터를 실시간 제공하는 웹 문서의 활용이 점차 확산되고 있다. 그리고 빅데이터의 활용이 다양한 분야로 점차 확산되고 웹 데이터가 매년 기하급수적으로 증가하면서 웹 문서를 자동으로 수집하는 웹 크롤러의 중요성이 더욱 커지고 있다. 하지만, 기존 크롤러들은 일부 사이트에서 수집된 웹 문서에 포함된 URL만을 기반으로 웹 문서를 수집하기 때문에 사이트 전체 웹 문서를 수집할 수 없는 문제를 가진다. 또한, 수집된 웹 문서에 대한 정보를 효율적으로 관리하지 못하기 때문에 중복된 웹 문서를 수집하는 문제를 가진다. 그래서 본 논문에서는 웹 사이트의 RSS와 Google Search API를 통해 기존 웹 크롤러의 문제를 해결하고 RMI와 NIO을 활용해 서버와 클라이언트간 네트워크 연결을 최소화해 빠른 크롤링 기능을 제공하는 분산형 웹 크롤러를 제안한다. 또한, 제안하는 웹 크롤러는 웹 문서를 구성하는 태그들에 대한 키워드 유사도 비교를 통해, 분석에 활용되는 중요 콘텐츠만을 자동 추출하는 기능을 제공한다. 마지막으로, 기존 웹 크롤러와 제안하는 크롤러의 성능 평가 결과를 통해 제안하는 웹 크롤러의 우수성을 입증한다.

한국 영재교육 연구의 현황 및 성과: 2003-2012 (Comprehensive Review of Research Publications on Gifted Education in Korea : 2003-2012)

  • 이상희;최선일
    • 영재교육연구
    • /
    • 제25권6호
    • /
    • pp.881-904
    • /
    • 2015
  • 본 연구의 목적은 영재교육을 실질적으로 추진하기 위하여 마련된 제1, 2차 영재교육진흥종합계획 시기인 2003년도부터 2012년도까지 10년간의 영재교육 연구, 동향 및 연구보고서를 분석함으로써 영재교육 관련 연구 성과와 경향 및 흐름을 분석하고, 향후 영재교육 연구의 방향성을 모색하는 것이다. 이를 위하여 본 연구에서는 네이버 전문정보 사이트와 한국학술정보원 학술연구정보서비스에서 영재를 키워드로 하여 자료를 수집하였으며, 총 182종 1,696편의 학술지 논문, 총 138편의 박사학위 논문, 총 1,470편의 석사학위 논문, 75개 기관 총 798편의 동향 및 연구보고서를 연구 자료로 활용하여 분석하였다. 분석을 위하여 학술지 및 학위 논문과 동향 및 연구보고서를 크게 연구대상, 영재분류, 연구주제, 연구방법을 중심으로 살펴보았다. 연구 결과, 2003년부터 2012년까지의 영재교육 학술지 논문과 학위 논문은 주로 초 중등학생을 대상으로, 수학 과학 분야의 영재들을 중심으로, 교육과정 및 프로그램을 주제로, 양적연구의 방법으로 연구가 진행되어 왔음을 파악할 수 있다. 연구 결과와 관련하여 영재교육 10년간의 연구 성과가 도출되었으며, 향후 국내 영재교육 연구를 위한 시사점을 제안하고자 한다.

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.

텍스트 마이닝과 딥러닝을 활용한 암호화폐 가격 예측 : 한국과 미국시장 비교 (The Prediction of Cryptocurrency on Using Text Mining and Deep Learning Techniques : Comparison of Korean and USA Market)

  • 원종관;홍태호
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.1-17
    • /
    • 2021
  • 본 연구에서는 한국과 미국의 대표적인 거래소인 빗썸과 코인베이스의 비트코인 가격을 ARIMA와 순환 신경망(Recurrent Neural Network)을 이용해 예측하고, 이후 각 국가의 뉴스 기사를 이용해 분리 학습에 기반한 separated RNN 모형을 제안한다. separated RNN 모형은 학습 데이터를 가격의 추세 변화 점을 기준으로 분리해 학습시킨 후, 추세 변화점 별 뉴스 데이터를 활용해 용어 기반 사전을 구축한다. 이후 용어 기반 사전과 평가 데이터 기간의 뉴스 데이터를 이용해 예측할 데이터의 가격 추세 변화 점을 찾아낸 후, 매칭되는 모형을 적용해 예측 결과를 산출한다. 2017년 5월 22일부터 2020년 9월 16일까지의 가격 데이터를 사용해 분석한 결과, 제안된 separated RNN을 이용해 예측한 결과가 한국과 미국의 비트코인 가격 예측 모두에서 순환 신경망(RNN)을 이용해 예측한 결과보다 높은 예측 성과를 보였다. 본 연구는 시계열 예측 기법의 한계를 뉴스 데이터를 이용한 추세 변화 점 탐색을 통해 극복할 수 있고, 성과 향상을 위한 추후 다양한 시계열 예측 기법 및 추세 변화 점 탐색을 위한 다양한 텍스트 마이닝 기법을 적용해볼 필요가 있음을 시사한다.