• 제목/요약/키워드: 토픽 모델링

검색결과 555건 처리시간 0.028초

소상공인 연구 동향 분석 (Investigating the Trends of Research for the Small Business Owners)

  • 방미현;이영민
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.73-80
    • /
    • 2022
  • 본 연구는 지난 20여 년간의 국내 소상공인 선행연구 280편을 주제어 네트워크와 LDA 토픽 모델링 분석을 통해 종합적으로 분석하고, 학계에서의 전반적인 시각과 동향을 살펴보았다. 핵심 주제어는 서로 상충 되지만 안정적이고 지속적인 성장을 위해서 필수적인 요소인 '영업'과 '보호'를 선정하였고, 7개의 토픽(토픽 1: 창업, 토픽 2: 디지털, 토픽 3: 세제, 토픽 4: 역량, 토픽 5: 상생, 토픽 6: 규제, 토픽 7: 자금)을 도출하였다. 분석 결과를 토대로, 소상공인들의 지속적인 성장과 발전을 위한 디지털 성숙도 향상의 필요성을 제기하였고, 소상공인들의 직면한 경제적 타격 문제 해결을 위해 범부처 차원의 대응과 새로운 정권 이후에도 존속될 수 있는 기능 수행 조직의 안정성을 제시하였다. 또한, 장기적, 신속성, 세밀성, 새로운 방식으로의 정부 지원 방향에 대한 주목과 선 허용 후, 규제를 하는 네거티브 방식으로의 유연한 접근을 제언하였다.

토픽 모델링 기반 뉴스기사 분석을 통한 서울시 이슈 도출 (Identifying Seoul city issues based on topic modeling of news article)

  • 권민지
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.11-13
    • /
    • 2019
  • 대중들에게 정보를 빠르고 정확하게 제공하는 대표 매체인 뉴스 기사는 일 평균 1만 5천 건 이상이 보도되고 있다. 특정 주제 또는 분야에 대한 전반적인 동향을 파악하고자 대량의 텍스트 데이터를 수집하여 텍스트 마이닝(Text mining)과 머신러닝 등을 적용하는 연구들이 활발하게 수행되고 있다. 본 연구에서는 서울시의 이슈 및 문제를 파악하고자 약 5년간 뉴스 기사를 수집하여 키워드 분석 및 토픽 모델링을 적용하였다. 분석 결과 5년간의 뉴스 기사에서 빈번하게 출현하는 키워드들을 도출하였고 연도별로 도출된 키워드들을 비교분석하였다. 또한 토픽 모델링 적용 결과 뉴스 기사를 구성하는 20개의 주제를 도출하였으며 이를 기반으로 서울시의 주요 이슈들을 파악할 수 있다. 본 연구는 연도별, 분야별 세부 내용 및 시계열 분석, 다른 도시들의 이슈 및 문제를 도출하는데 활용될 것으로 기대된다.

  • PDF

토픽 모델링을 이용한 유사 시청 사용자 그룹핑 및 TV 프로그램 추천 알고리듬 (Topic modeling based similar user grouping and TV program recommendation for Smart TV)

  • 표신지;김은희;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.117-120
    • /
    • 2012
  • 본 논문에서는 토픽 모델링 기반 TV 프로그램 유사 시청 사용자 그룹핑 및 이를 이용한 TV 프로그램 콘텐츠 추천 알고리듬을 제안하였다. 제안 기술은 토픽 모델링 기법 중 Latent Dirichlet Allocation(LDA) 방법을 이용하여 TV프로그램 시청 기록 내에서 은닉된 유사 사용자들을 그룹핑하고 이러한 유사 시청 사용자 그룹 정보를 이용하여 사용자에게 선호 TV 프로그램 콘텐츠를 자동으로 추천하는 알고리듬이다. 제안된 자동 추천 알고리듬의 성능평가를 위해 실제 TV 시청기록 데이터를 이용하여 훈련 기간과 검증 기간을 나누어 훈련 기간 동안 제안한 알고리듬을 이용하여 사용자 개인에 대한 추천 TV 프로그램 콘텐츠 목록을 생성하여 검증 기간 동안에 실제 추천된 TV프로그램을 얼마나 시청했는지를 측정하여 추천 정확도를 검증하였다.

  • PDF

토픽 모델링을 활용한 한국콘텐츠학회 논문지 연구 동향 탐색 (An Exploratory Research Trends Analysis in Journal of the Korea Contents Association using Topic Modeling)

  • 석혜은;김수영;이연수;조현영;이수경;김경화
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.95-106
    • /
    • 2021
  • 본 연구의 목적은 한국콘텐츠학회 논문지에 게재된 9,858건의 논문을 대상으로 토픽 모델링을 활용하여 지난 20년간 연구동향을 탐색함으로써 콘텐츠 연구개발에서의 주요 토픽을 도출하고 학술적 발전방향을 제공하는데 있다. 추출된 토픽의 신뢰성과 타당성을 확보하기 위해 양적 평가기법 뿐만 아니라 정성적 기법을 단계적으로 적용하여 연구자들이 합의한 수준의 말뭉치가 생성될 때까지 이를 반복적으로 수행하였으며 이에 따른 구체적인 분석 절차를 제시하였다. 분석 결과 8개의 핵심 토픽이 추출되었다. 이는 한국콘텐츠학회가 특정 학문 분야를 한정하지 않고 다양한 분야의 융·복합 연구 논문을 발간하고 있음을 보여준다. 또한 2012년 이전 상반기에는 공학기술 분야 토픽 비중이 상대적으로 높게 나타난 반면, 2012년 이후 하반기에는 사회과학 분야 토픽 출현 비중이 상대적으로 높게 나타났다. 구체적으로 '사회복지' 토픽은 상반기 대비 하반기에 약 4배수 증가세가 나타났다. 토픽별 추세분석을 통해 추세선의 변곡점이 나타난 특정 시점에 주목하여 해당 토픽의 연구동향에 영향을 미친 외적 변인을 탐색하였고 토픽과 외적 변인 간 관련성을 파악하였다. 본 연구결과가 국내 콘텐츠 관련 연구 개발 및 산업 분야에서 진행되고 있는 활발한 논의를 진행하는데 시사점을 제공할 수 있기를 기대한다.

오픈소스 프로젝트의 토픽 모델링을 통한 잠재결함 분석 연구 (Analysis of Potential Bugs using Topic Model of Open Source Project)

  • 이정빈;이택;인호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.551-552
    • /
    • 2017
  • 하나의 프로젝트에는 다양한 기능과 역할을 가진 소스코드가 존재한다. 그러나 기존 정적 분석 도구들은 이러한 특성을 고려하지 않고, 모든 소스코드에 동일한 탐색 정책과 우선순위를 적용하고 있다. 본 연구에서는 오픈소스 프로젝트로부터 수집한 소스코드들을 토픽모델링을 이용하여 특정 토픽으로 분류하고, 분류된 토픽에 해당되는 코드 안에서 높은 영향력을 갖는 잠재결함(Potential Bug)의 특징을 분석하였다. 이 결과를 바탕으로 개발자에게 개발 중인 소스코드의 특성에 따라 어떤 잠재결함에 더 우선순위를 두어야 하는지에 대한 지침을 제공할 수 있다.

코로나19 보도와 정파적 의제설정: 토픽모델링과 설문조사 연결분석 (News Coverage on COVID-19 and Partisan Agenda-setting: An Analysis of Topic Modeling Results and Survey Data)

  • 차채영;왕위시앙;이종혁
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.86-98
    • /
    • 2022
  • 본 연구는 코로나19 보도에 있어 보수와 진보 언론의 의제를 확인하고, 각 언론이 정치성향이 같은 수용자에 미치는 정파적 의제설정 효과를 검증했다. 이를 위해 조선일보, 중앙일보, 동아일보, 한겨레신문, 경향신문의 코로나19 관련 기사 5,286건을 수집했고, 진보-중도-보수 응답자 1,067명의 설문조사 데이터를 분석했다. 이어서 본 연구진은 LDA 토픽모델링을 활용해 의제를 추출하고, 설문조사 응답자들의 의제 중요도 인식과 상관관계를 분석했다. 연구 결과, 언론 의제로는 감염, 백신, 경제위기 등 15개 토픽이 나타났으며, 보수와 진보 언론 사이에 주요 의제의 차이가 드러났다. 한편, 보수 언론은 보수 응답자는 물론 진보 응답자에게도 의제설정 영향력을 발휘했지만, 진보 언론은 진보 응답자에게 유의미한 영향을 미치지 못했다. 본 연구는 토픽모델링과 설문조사를 결합해 의제설정 효과를 검증하는 새로운 방식을 선보여, 의제설정 연구의 방법론적 확장에 기여했다.

사회여론에 대한 법관의 인식: 법관 대상 FGI에 대한 근거이론 분석과 토픽 모델링 비교 (Judges' Perception of Public Opinion: Comparing Grounded Theory and Topic Modeling in Analyzing Focused Group Interview with Judges)

  • 강태경
    • 한국심리학회지:법
    • /
    • 제13권1호
    • /
    • pp.23-52
    • /
    • 2022
  • 본 연구에서는 현직 법관 24명을 대상으로 법관들이 재판과 관련하여 사회여론을 어떻게 개념화하는지와 사회여론에 대해 어떤 태도를 취하는지에 대한 초점 집단 면접(FGI)을 실시하고, 인터뷰 내용에 대한 근거이론적 분석과 구조적 토픽 모델링(STM)을 수행하였다. 근거이론적 분석 결과에 따르면, 연구 참여자들은 사회상규, 사회통념, 법감정, 국민정서를 여론과 개념적으로 구분하였고, 여론을 특정한 법적 쟁점이나 사건에 대한 일시적이고 감정적인 반응과 정책에 대한 지속적인 의견으로 구분하여 이해하였다. 그리고 사건의 종류나 법적 쟁점에 따라 여론이나 사회통념에 대해 다른 태도를 취하는 것으로 나타났다. 토픽 모델링 결과는 근거이론적 분석 결과와 상당한 유사성을 보였고, 특정 토픽의 발현 가능성은 연구 참여자들의 담당 사건 종류에 따라 통계적으로 유의미한 차이를 보였다.

토픽 모델링을 이용한 해방기 아동상 연구 - 「어린이신문」을 중심으로 - (A Study on Children's Images during the Liberation Period Using Topic Modeling: With a focus on The Children's News)

  • 장석은;이혜은
    • 한국비블리아학회지
    • /
    • 제33권3호
    • /
    • pp.157-178
    • /
    • 2022
  • 본 연구는 해방기에 간행된 아동신문인 「어린이신문」에 나타난 아동상을 탐색하는 데 목적이 있다. 이를 위해 현전하지 않는 제34호를 제외하고, 1945년 12월 1일의 창간호부터 1947년 12월 13일의 제86호를 대상으로 빈도 분석, 토픽 모델링, 시계열 분석을 수행하였다. 빈도 분석 결과 나라, 학교, 가정과 연관이 있는 키워드가 자주 나타났고, 토픽 모델링을 통해서는 '애국심을 가진 아동상', '과학적 소양을 지닌 아동상', '예술적 소양을 지닌 아동상', '사회적 존재로서의 아동상'이 도출되었다. 시계열 분석 결과 「어린이신문」이 발간된 해방 초기에는 애국 관련 토픽의 비중이 높았으나 과학, 예술과 같은 주제의 비율이 점차 높아지는 것을 볼 때, 아동상이 다양화되었다는 것을 확인할 수 있었다.

사용자 경험과 서비스 평가의 변화에 관한 연구 - 넷플릭스 앱 리뷰 토픽 모델링을 통해 (A study of changes in user experience and service evaluation - Topic modeling of Netflix app reviews)

  • 유선영;노미진;김양석;한무명초
    • 스마트미디어저널
    • /
    • 제12권6호
    • /
    • pp.27-34
    • /
    • 2023
  • 코로나19로 인해 넷플릭스 사용량이 증가하면서 사용자들의 넷플릭스 서비스 경험도 함께 증가하였다. 이에 본 연구는 코로나19 대유행 전후 넷플릭스 사용자 경험과 서비스 변화를 살펴보기 위하여, 넷플릭스 리뷰 데이터를 기반으로 토픽 모델링 분석을 수행하고자 한다. Google Play Scraper 라이브러리를 사용하여 구글 플레이 스토어 내의 넷플릭스 앱 리뷰 데이터를 수집하여, 코로나19 대유행 전후 앱 리뷰 기반의 토픽 모델링을 활용하여 키워드 차이를 살펴보았다. 분석 결과 넷플릭스 앱 기능, 넷플릭스 콘텐츠, 넷플릭스 서비스 이용, 넷플릭스 총평이라는 4가지 토픽으로 나타났다. 사용자 경험이 증가한 코로나19 대유행 이후 사용자들은 더 다양하고 세부적인 키워드를 사용하여 리뷰를 작성하는 경향을 보였다. 본 연구는 넷플릭스 리뷰 데이터를 활용하여 사용자들의 의견을 분석하여 코로나19 대유행 전·후 넷플릭스 서비스의 사용자 경험 변화를 보여주므로, 향후 치열한 OTT 서비스 시장에서의 경쟁력 강화를 위한 가이드 라인으로 활용할 수 있을 것이다.

빈도 분석 및 토픽모델링을 활용한 수학 교과에서 기초학력 관련 연구 동향 분석 (An Analysis of Research Trends on Basic Academic Abilities in Mathematics with Frequency Analysis and Topic Modeling)

  • 조미경
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권4호
    • /
    • pp.615-633
    • /
    • 2023
  • 본 연구는 수학 교과에서 기초학력 및 학습부진에 관련한 연구가 나아갈 방향을 제안하고자 2023년 8월까지의 국내 연구 동향을 분석하였다. 이를 위해 국내 연구 197편의 국문 초록을 자료로 수집하여 빈도 분석 및 LDA 기반 토픽모델링을 실시하였다. 연구결과, 첫째, TF 및 TF-IDF 기준으로 '학업성취', '영향', '효과', '변인'은 모두 상위권에 위치하였다. 둘째, LDA 기반 토픽모델링을 실시한 결과, 기초학력 미달 발생 원인, 수학 학습부진학생의 학습 실태, 수학 학습부진학생 지도 교사의 전문성, 수학 학습부진학생 지원 프로그램, 국가수준 학업성취도 평가 결과로 5개 토픽이 도출되었다. 이러한 결과를 바탕으로 향후 수학 교과의 기초학력 및 학습부진에 관한 연구가 나아가야 할 방향으로 학습부진학생의 성장에 초점을 둔 연구, 수학 교과에서 학습지원을 필요로 하는 학생에게 제공하는 프로그램을 체계화하는 연구, 수학 교과에서 학습지원대상학생을 지도하기 위한 교사의 전문성 신장에 관한 연구 등을 제안하였다.