• 제목/요약/키워드: 동시단어 분석

검색결과 188건 처리시간 0.026초

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.

대학 교양교육 주제영역의 계량적 분석연구 (An Informetric Analysis of Topics in University's General Education)

  • 최상희
    • 한국비블리아학회지
    • /
    • 제26권4호
    • /
    • pp.245-262
    • /
    • 2015
  • 대학의 교양교과 주제가 다양한 영역으로 분화되고 복합적인 주제로 융합되면서 점차 교양교육의 주제를 파악하는 것이 어려워지고 있다. 이 연구의 목표는 A 대학의 교양교육과정으로 개설되어 있는 교과목의 주제적 영역을 계량정보학적으로 분석하여 시각화하는 것이다. 분석을 위하여 수집된 계획서는 총 214개이며 분석에 적용된 요소는 교과목명, 교과개요, 목표, 주별 수업계획이다. 분석 대상에서 추출된 주제어는 모두 278종이며 총 8개의 주제 클러스터로 군집화 되었다. 주제 클러스터간 관계를 네트워크기법으로 분석한 결과 개인적 영역, 사회적 영역으로 나뉘어지는 것으로 나타났다. 개인적 영역은 다시 14개 하위 주제 클러스터로, 사회적 영역은 11개 하위 주제 클러스터로 분류되었다. 개인적 영역에서는 '언어', '과학', '인성'이 주요 주제 클러스터로 파악되었고 사회적 영역에서는 '다문화' 주제 클러스터가 4개의 다른 주제 클러스터와 다각적인 관계를 맺고 있는 것으로 분석되었다. 주제 네트워크로 교양교과목의 주제 영역을 분석한 방법은 교양교육을 강화하고 개선하거나 대학도서관이 교양교육을 위한 장서개발을 하는데 필요한 기초자료를 생산하는 목적으로 활용될 수 있을 것이다.

토픽 모델링을 활용한 도서관, 기록관, 박물관간의 연구 주제 분석 (Analysis of Research Topics among Library, Archives and Museums using Topic Modeling)

  • 김희섭;강보라
    • 한국도서관정보학회지
    • /
    • 제50권4호
    • /
    • pp.339-358
    • /
    • 2019
  • 본 연구의 목적은 광의의 측면에서 지식정보제공이라는 공동의 임무를 수행하는 도서관, 기록관, 박물관간의 협력 플랫폼 구축에 관한 연구의 동향을 토픽 모델링을 통하여 파악하기 위한 것이다. 연구의 목적을 달성하기 위하여 Scopus로부터 이들 세 기관을 동시에 다루는 논문 637편의 서지정보를 수집하였다. 수집된 서지정보 중에서 초록을 대상으로 NetMiner V.4를 통하여 총 5,218개의 단어를 추출한 후 토픽모델링 분석하였으며, 그 결과는 다음과 같다. 첫째, tf-idf의 가중치에 따른 단어출현 빈도를 분석한 결과 '보존(Preservation)'이 가장 높게 나타났으며, 둘째, LDA(Latent Dirichlet Allocation) 알고리즘을 통한 토픽모델링 분석결과 13개의 주제 영역이 도출되었다. 셋째, 13개의 주제 영역을 네트워크로 표현한 결과 '리포지터리 구축(Repository Construction)'을 중심으로 기관간의 협력, 정보자원 보존을 위한 환경 구축, 정부차원에서의 제도와 정책 발굴, 정보자원의 생애주기, 정보자원의 전시, 정보자원의 검색 등이 서로 밀접한 관련성을 가진 것으로 나타났다. 넷째, 13개의 주제 영역의 연도별 동향을 살펴보면, 1998년 이전의 연구는 제도와 정책 발굴, 정보자원의 검색, 정보자원의 생애주기 등과 같이 특정 주제에 한정된 반면, 그 이후의 연구는 보다 다양한 주제를 다룬 것으로 분석되었다.

딥러닝 기반 소셜미디어 한글 텍스트 우울 경향 분석 (A Deep Learning-based Depression Trend Analysis of Korean on Social Media)

  • 박서정;이수빈;김우정;송민
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.91-117
    • /
    • 2022
  • 국내를 비롯하여 전 세계적으로 우울증 환자 수가 매년 증가하는 추세이다. 그러나 대다수의 정신질환 환자들은 자신이 질병을 앓고 있다는 사실을 인식하지 못해서 적절한 치료가 이루어지지 않고 있다. 우울 증상이 방치되면 자살과 불안, 기타 심리적인 문제로 발전될 수 있기에 우울증의 조기 발견과 치료는 정신건강 증진에 있어 매우 중요하다. 이러한 문제점을 개선하기 위해 본 연구에서는 한국어 소셜 미디어 텍스트를 활용한 딥러닝 기반의 우울 경향 모델을 제시하였다. 네이버 지식인, 네이버 블로그, 하이닥, 트위터에서 데이터수집을 한 뒤 DSM-5 주요 우울 장애 진단 기준을 활용하여 우울 증상 개수에 따라 클래스를 구분하여 주석을 달았다. 이후 구축한 말뭉치의 클래스 별 특성을 살펴보고자 TF-IDF 분석과 동시 출현 단어 분석을 실시하였다. 또한, 다양한 텍스트 특징을 활용하여 우울 경향 분류 모델을 생성하기 위해 단어 임베딩과 사전 기반 감성 분석, LDA 토픽 모델링을 수행하였다. 이를 통해 문헌 별로 임베딩된 텍스트와 감성 점수, 토픽 번호를 산출하여 텍스트 특징으로 사용하였다. 그 결과 임베딩된 텍스트에 문서의 감성 점수와 토픽을 모두 결합하여 KorBERT 알고리즘을 기반으로 우울 경향을 분류하였을 때 가장 높은 정확률인 83.28%를 달성하는 것을 확인하였다. 본 연구는 다양한 텍스트 특징을 활용하여 보다 성능이 개선된 한국어 우울 경향 분류 모델을 구축함에 따라, 한국 온라인 커뮤니티 이용자 중 잠재적인 우울증 환자를 조기에 발견해 빠른 치료 및 예방이 가능하도록 하여 한국 사회의 정신건강 증진에 도움을 줄 수 있는 기반을 마련했다는 점에서 의의를 지닌다.

국내 오픈액세스 분야의 지적구조 분석에 관한 연구 (A Study on the Intellectual Structure of Domestic Open Access Area)

  • 신주은;김성희
    • 한국문헌정보학회지
    • /
    • 제55권2호
    • /
    • pp.147-178
    • /
    • 2021
  • 본 연구에서는 국내 오픈액세스 분야의 지적구조 분석을 위해 동시출현단어 분석을 시행하였다. KCI와 RISS를 통해 수집한 국내 오픈액세스 관련 연구물 124편의 논문을 분석 대상으로 선정했으며, 제목과 초록에서 총 1,157개의 키워드를 추출하였다. 선정된 키워드를 대상으로 네트워크 분석을 시행하여 3개 영역과 20개 세부 군집으로 구분하여 제시하였다. 패스파인더 네트워크를 통해 키워드들의 지적 관계를 시각화하였으며, 가중 네트워크를 위한 중심성 분석을 통해 핵심 키워드를 확인하였다. 다음으로 군집분석을 실시하여 5개의 군집을 도출하고, 다차원 축적 지도상에 표시함으로써 키워드 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구 결과는 국내 오픈액세스 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 앞으로 국내 오픈액세스 연구의 방향성을 예측하는데 기초 자료로 활용할 수 있을 것으로 기대한다.

무인항공기 기술진화 탐색 및 유망기술 발굴 연구 (Research Technology Evolution of UAV(Unmanned Aerial Vehicle) and to Prospect Promising Technology)

  • 주성현
    • 항공우주시스템공학회지
    • /
    • 제13권6호
    • /
    • pp.80-89
    • /
    • 2019
  • 효과적인 유망기술 발굴을 위해 미래 사회 변화를 전망하고, 미래기술 도출 방법론 및 프로세스 개선 연구가 필요하며, 연구소·기업에서 기술기획에 활용할 기초자료의 필요성이 꾸준히 대두되고 있다. 따라서 본 연구는 국내 무인항공기산업과 같은 신성장동력산업의 국제적 기술 경쟁력 확보와 시장성 확보 및 산업성장이 가능한 미래유망 기술을 도출하는 방법론을 제시하는 것이다. 이에 본 연구는 KrKwic, Excel, NetMiner등의 분석툴을 활용하여 무인항공기산업 분야의 특허데이터를 대상으로 동시출현 단어를 활용한 소셜네트워크분석과 하위그룹분석, 인지지도분석 방법을 제시하였다. 이를 통해, 무인항공기산업 분야의 기술진화를 탐색하고 유망기술을 예측하는 방법을 제시하였다. 그 결과, '체계연동/통합 기술', '시험평가/감항인증 기술', '항공전자 기술', '비행제어 기술', '피아식별 기술', '비행통제 시스템 기술', '지원장비 기술' 등은 향후 유망한 기술로 선정하여 집중 투자할 필요성이 큰 기술이라 볼 수 있었다.

스마트공장에 관한 체계적 문헌 분석: 국내 학술 경향 연구 (A Systematic Literature Review on Smart Factory Research: Identifying Research Trends in Korean Academia)

  • 김기범;이정우
    • 디지털융복합연구
    • /
    • 제18권11호
    • /
    • pp.59-71
    • /
    • 2020
  • 본 연구에서는 스마트공장에 대한 국내학술연구의 경향을 분석하고 향후 연구방향을 제시하였다. 체계적 문헌 연구방법으로 한국연구재단 등재지와 등재후보지를 검색하여 144개의 분석대상 논문을 선정 후 분석하였으며, 비블리오메트릭 분석법으로 VOSviewer를 활용한 동시 출현 단어 분석을 실시하였다. 분석 결과, 국내 스마트공장 연구는 자동화, 지능화, 빅데이터 기술 분야와 운영시스템, 개념화 연구, 해외 사례 및 정책의 6개의 분야로 나누어 진행되고 있는 것을 찾아내었다. 사물인터넷은 스마트공장의 핵심기술이자 핵심어로 거의 모든 연구들에서 다루어지고 있었으며, 서비스화에 관한 연구는 숫자가 상대적으로 적어서 앞으로 보강이 필요한 것으로 보였다. 보안기술 연구는 타 분야와 연계성이 부족하여 향후 상호 연계한 융합 연구가 필요한 것으로 파악되었다. 본 연구의 결과는 향후 개별 연구의 위상을 정립하고 연구분야를 찾아내는 데에 도움이 될 수 있을 것이다.

토픽 모델링 분석을 통한 수학교육 연구 주제 분석 (Analysis of trends in mathematics education research using text mining)

  • 진미르;고호경
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제33권3호
    • /
    • pp.275-294
    • /
    • 2019
  • 본 연구는 최근 수학교육 연구 논문들의 연구 동향을 파악하기 위하여 2016년 이후의 수학교육 학술지 논문들을 대상으로 텍스트마이닝 기법 중 토픽 모델링과 트랜드 분석 기법을 활용하여 분석을 실시하였다. 분석 결과 빈도수가 높은 단어들을 조합하여 5개의 토픽을 추출하였으며 이를 통해 최근 활발히 이루어지고 있는 수학교육 연구 주제들을 파악할 수 있었다. 이는 다시 기 수행된 동향 연구들과 차이점과 유사한 점들을 도출할 수 있었는데, 이와 같은 동향 분석을 통해 최근 연구자들이 수학교육 연구에서 중요시 여기는 관점을 읽어 나감과 동시에 향후 주목하여야할 연구 주제 및 방향에 대한 시사점을 제공한다.

사회과학 중독연구 분야의 지적구조에 관한 네트워크 분석 : 2019년도 KCI 등재 논문을 기반으로 (Network Analysis of the Intellectual Structure of Addiction Research in Social Sciences: Based on the KCI Articles Published in 2019)

  • 이세림;전종설
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.21-37
    • /
    • 2021
  • 본 연구는 동시출현단어 네트워크 분석을 활용하여 사회과학 중독 분야의 국내 최신 연구 경향을 반영하는 지적구조를 규명하고자 했다. KCI 데이터베이스에서 연구시작일 기준 최신 1년인 2019년에 발간된 중독 주제의 논문 총 172건을 수집하여 총 432개의 키워드를 추출하였다. 이후 Bibexcel, COOC, WNET, NodeXL 프로그램을 통해 네트워크 분석을 실시했다. 연구 결과, 중독 유형, 연구대상, 연구방법, 연구변수 관련 키워드가 나타났으며 20개 군집을 파악했다. 또한 세부적으로 전역중심, 지역, 매개 중심 네트워크 분석을 통해 각 키워드 간 관계를 살펴보고 논의했다. 이를 통해 스마트폰 중독을 중심으로 하는 최신 이슈를 분석하고, 향후 보완되어야 할 관계 중독, 음식 중독, 일 중독 주제영역의 연구와 실천에 대한 기초자료 및 시사점을 제공했다. 그리고 마약 중독의 범죄와의 관련성, 알코올 중독에서의 가족의 관련성, 도박 중독에서의 동기의 관련성 및 질적연구의 필요성 등에 대해 논의하였다.

디지털 보존 관련 학술연구 및 교과 주제분석 (Analysis on Topics of Digital Preservation Researches and Courses)

  • 정의연;최상희
    • 한국문헌정보학회지
    • /
    • 제53권3호
    • /
    • pp.25-43
    • /
    • 2019
  • 디지털 자원의 급속한 증가에 따라 디지털 보존 및 디지털 큐레이션에 대한 관심이 높아지고 있다. 이 연구는 디지털 보존과 디지털 큐레이션과 관련된 국외논문과 미국, 영국, 아일랜드, 캐나다, 뉴질랜드의 대학 기록관리 과정의 교과를 대상으로 제목 키워드 프로파일링 기법 및 네트워크 분석을 통해 논문 및 교과의 핵심 주제영역을 도출하고 논문 및 교과의 내용을 살펴보고자 하였다. 분석결과 논문 및 교과의 핵심 주제영역은 논문은 아카이브 시스템 영역, 교과는 큐레이션 교육 및 업무 영역이 주요 영역으로 나타났다. 논문 및 교과 내용분석에 있어서는 논문에서는 전략설계, 교과에서는 기록관리업무가 주요 내용으로 나타났으며 공통적으로 디지털 자원의 포맷이 중요한 이슈로 출현하였다.