• 제목/요약/키워드: 토픽모델

검색결과 176건 처리시간 0.027초

팬데믹에 따른 소비자의 피부 관련 관심 영역 변화 분석: 구조적 토픽모델링을 중심으로 (Analyzing Changes in Consumers' Interest Areas Related to Skin under the Pandemic: Focusing on Structural Topic Modeling)

  • 김나경;박지원;문형빈
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.173-192
    • /
    • 2024
  • 최근 뷰티 산업은 급격한 성장과 혁신으로 빠르게 발전하였으며, 코로나19 팬데믹으로 인한 마스크 착용 및 비대면 생활의 증가와 같은 생활 양식 변화에 따라 새로운 전환을 겪고 있다. 본 연구는 온라인상에 나타난 소비자의 피부에 대한 의견을 분석하여 코로나19 팬데믹 이후 뷰티 산업의 변화를 수요 측면에서 이해하고자 하였다. 이를 위해 2017년부터 2022년까지 소셜 미디어에 게재된 게시글 중 '피부 고민'을 포함한 96,908개의 게시글을 수집하고 이를 구조적 토픽모델에 적용하여 피부 관련 주제를 도출하였다. 분석 결과, 소비자가 고민하고 있는 피부 관련 주제는 총 22개로 구분될 수 있음을 확인하였으며, 이들 주제는 크게 뷰티 제조업, 뷰티 서비스업·연관산업, 피부고민, 기타 등 4가지 유형으로 구분될 수 있었다. 또한 본 연구는 분석 기간을 코로나19 팬데믹의 확산 양상을 기준으로 7개 단계로 나누고 각 토픽의 비중이 어떻게 변화하는지를 상승, 하강, 일정, 진동으로 구분하여 보았다. 코로나19 팬데믹 전과 후 시점에 대하여 주제별 비중의 변화 양상을 분석한 결과, 피부 고민 중 피부 트러블(여드름)과 이와 관련된 제품(스팟패치)은 상승 분야로, 뷰티 연관산업 중 성형외과와 한의원은 하강 분야로, 뷰티 제조업 중 수분 마스크팩, 메이크업 제품은 큰 변화가 없는 일정 분야로 나타났다. 또한 코로나 발생기간 내에서 팬데믹이 최고조에 달한 시기에는 바디케어 제품과 관련된 토픽이 급증하는 것을 확인할 수 있었다. 본 연구의 결과는 뷰티 산업의 수요 변화에 대응하여 기업이 제품 개발, 마케팅 전략을 수립하는 데에 활용될 수 있으며, 팬데믹 발생 시 정부가 경제적 지원 정책을 수립하는 경우 정책 추진의 근거로서도 활용될 수 있을 것으로 기대된다.

트위터 기반의 트렌드 뉴스 추천 기법 (Trend-based Trend News Recommendation Scheme)

  • 김대용;김대훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.1038-1039
    • /
    • 2013
  • 최근 스마트폰의 사용이 보편화되면서 많은 양의 온라인 뉴스가 다양한 경로를 통하여 서비스되고 있다. 한편, 실시간으로 제공되는 뉴스의 양이 방대해지면서, 언론사에서 톱 뉴스로 제공하는 토픽과 달리, 실제 사용자들에게 화제가 되고 있는 토픽을 선별하는 데 어려움이 있다. 많은 사용자들이 실생활에서 작성하고 공유하는 트위터는 실제 사람들 사이에 화제가 되고 있는 토픽을 담고 있는 경우가 많다. 이러한 트렌드를 뉴스와 연계시키면 화제가 되는 트렌드 뉴스를 사용자에게 제공할 수 있다. 본 논문에서는 클라이언트-서버 모델을 기반으로 실시간으로 사용자 트위터를 분석하여 추출된 트렌드를 기반으로 관련 뉴스를 검색하여 제공하는 시스템을 제안한다. 클라이언트를 통해 수집한 트위터 단문에서 서버는 화제가 되고 있는 트렌드를 추출하고, 이를 기반으로 Google 등을 통해 관련 뉴스를 검색하여 클라이언트에게 전달한다. 이 모든 과정을 실시간으로 제공하기 위한 알고리즘을 제안하고 프로토타입 시스템을 통하여 그 성능을 평가한다.

텍스트 마이닝을 이용한 리빙랩 연구동향 분석 (Research Trend Analysis on Living Lab Using Text Mining)

  • 김성묵;김영준
    • 디지털융복합연구
    • /
    • 제18권8호
    • /
    • pp.37-48
    • /
    • 2020
  • 본 연구는 텍스트 마이닝을 활용하여 리빙랩 연구의 동향을 파악하고 연구 방향 정립에 필요한 함의를 도출하고자 하였다. 리빙랩 관련 연구가 발표되기 시작한 2011년부터 2019년 11월까지의 논문 166편의 키워드와 초록을 대상으로 네트워크 분석 및 토픽 모델링 기법을 사용하여 분석하였다. 키워드 중 혁신, 지역, 사회, 기술, 스마트시티 등의 출현빈도가 높았고, 중심도 분석결과 현재까지 리빙랩 연구가 혁신, 사회, 기술, 개발, 사용자 등의 키워드를 중심으로 이루어짐을 파악하였다. 토픽 모델링 결과 지역혁신과 사용자지원, 정부 사회정책사업, 스마트시티 플랫폼구축, 기업기술혁신모델 및 시스템전환 참여 등 5개 토픽을 추출하였으며 토픽을 이어주는 키워드는 혁신, 기술, 사용자, 참여인것으로 분석하였다. 2017년 KNoLL 출범 후 토픽별 비중은 고른 분포로 연구 주제가 다양화됨을 확인하였다. 텍스트마이닝을 이용한 리빙랩 연구동향 분석과 방향 제시는 연구와 정책방향 수립에 유용한 자료를 제공할 수 있다.

국내 간호전문직관 연구 주제 동향: 텍스트네트워크분석과 토픽모델링의 융합 (Trends in the Study of Nursing Professionals in Korea: A Convergence Study of Text Network Analysis and Topic Modeling)

  • 박찬숙
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.295-305
    • /
    • 2021
  • 본 연구의 목적은 국내에서 발표된 간호전문직관 연구 주제 동향을 양적 내용분석을 통해 탐색하는 것이다. 연구방법은 학술논문수집, 단어 정제 및 추출, 자료 분석의 절차를 수행하였다. 351편의 논문을 수집하여 영문초록에서 단어를 추출하여 텍스트네트워크를 개발하였고, 네트워크분석과 토픽모델링을 융합하여 자료를 분석하였다. 연구결과 핵심 주제는 간호사, 간호전문직관, 간호학생, 간호, 전문직자아개념, 보건의료인, 만족, 임상역량, 자기효능감 등이었다. 토픽모델링을 통해 간호사 전문직관, 간호학생 전문직관, 간호전문직 정체성, 간호역량의 토픽그룹을 파악하였다. 시간이 흘러도 핵심 주제는 변화가 없었지만, 1990년대 역할갈등, 윤리적 가치, 2000년대 셀프리더십, 사회화, 2010년대 임상실습스트레스, 지지체계와 같은 주제들이 부상하였다. 결론적으로 본 연구를 통해 국내에서 임상간호사와 간호학생의 간호전문직관과 이에 영향을 미치는 요소들에 대한 연구가 활발하게 발표되고 있었으나, 간호전문직관 형성 및 향상에 효과적인 다차원적인 중재 전략을 모색한 연구는 부족하였음을 알 수 있었다.

다중 네트워크 분석과 토픽 모델링을 이용한 임진왜란 시기 사료에 관한 연구 (A Study on the Imjin War's Historical Materials with Multi-layer Network Analysis and Topic Modeling)

  • 조현철;송민
    • 한국비블리아학회지
    • /
    • 제33권1호
    • /
    • pp.167-198
    • /
    • 2022
  • 융합 과학 연구가 활성화되며 인문학에서도 디지털 인문학(Digital Humanities) 연구가 장려되고 있다. 이에 본 연구는 역사 데이터에 텍스트마이닝과 개체계량학 연구 방법을 적용한 시론(試論) 연구를 제안하고자 하였다. 선조실록(宣祖實錄)·선조수정실록(宣祖修正實錄), 난중잡록(亂中雜錄), 징비록(懲毖錄)을 활용하였으며, 사료(史料)에서 주제 변화와 공통 개체를 탐색하기 위해서 네트워크 분석과 DMR 토픽모델을 사용하였다. 분석 결과를 통해서 텍스트 데이터에 대한 계량 분석의 활용 가능성 확인, 특정 주제의 시기적 변화, 인물 개체 간 미발견 관계를 제시함으로써 연구의 확장 가능성을 제안할 수 있었다.

소스코드 주제를 이용한 인공신경망 기반 경고 분류 방법 (Warning Classification Method Based On Artificial Neural Network Using Topics of Source Code)

  • 이정빈
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권11호
    • /
    • pp.273-280
    • /
    • 2020
  • 자동화된 정적분석 도구는 소스 코드상에 잠재된 결함을 개발자들이 적은 노력으로 빠르게 찾을 수 있도록 도와준다. 하지만 이러한 정적분석 도구는 수정할 필요가 없는 오탐지 경고들을 무수하게 발생시킨다. 본 연구에서는 소스코드 블록의 토픽 모델을 이용한 인공신경망 기반의 경고 분류 기법을 제안한다. 소프트웨어 변경 관리 시스템으로부터 버그를 수정한 리비전들을 수집하고, 개발자들로부터 수정된 코드 블록들을 추출한다. 토픽 모델링을 이용하여 수집된 코드 블록의 토픽 분포 값을 구하고, 코드 블록의 리비전 간 경고들의 삭제 여부를 표현하는 이진데이터를 인공신경망의 입력 값과 출력 값으로 사용하여 심층 학습을 수행한다. 그 결과, 인공신경망 기반의 분류 모델이 높은 예측 성능으로 진성 또는 오탐지 경고를 분류하였다.

디지털 인문학 분야의 국내외 연구 동향 분석 (An Analysis on Research Trends of Digital Humanities)

  • 정유경
    • 정보관리학회지
    • /
    • 제37권2호
    • /
    • pp.311-331
    • /
    • 2020
  • 본 연구의 목적은 디지털 인문학 분야의 국내외 주요 연구의 동향을 살펴보고 비교 분석하는 데 있다. 기존의 디지털 인문학 동향에 관한 연구들은 해외의 주요 연구사례와 국가정책, 발전 방향 등을 검토하는 연구들로, 디지틸 인문학 분야의 세부 연구주제 및 하위 분야를 파악하는 것과는 거리가 있었다. 본 연구에서는 국내외 학술 문헌의 계량서지적 분석을 통해 디지털 인문학 분야의 지적 구조를 살펴보고자 한다. 이를 위해 Web of Science와 RISS로부터 2020년 3월까지 출판된 디지털 인문학 관련 국내외 학술 문헌을 수집하여 분석에 사용하였다. 이 자료들을 대상으로 구조적 토픽모델을 적용하여 세부 주제들을 살펴보았으며, 이 주제들의 시계열적 추이를 파악하였다. 분석결과, 국내외 공통적으로 인문학 기반의 융합 연구들이 수행되었으며, 주로 사료의 디지털화가 주된 연구의 관심사였다. 국내는 문화콘텐츠와 스토리텔링 관련된 연구주제가 두드러지게 나타났으며, 해외는 디지털화된 자료의 제공 측면에서 문헌정보학 관련 주제들이 주목을 받는 것으로 나타났다. 이를 통해 국내의 디지털 인문학 분야의 연구 공백을 파악하고 연구주제 확장이 가능한 영역들을 제안하였다.

토픽 모델과 소셜 네트워크를 이용한 개발자 추천방법 (A Developer Recommendation Technique Based on Topic Model and Social Network)

  • 양근석;장도;이병정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.557-568
    • /
    • 2014
  • 최근 소프트웨어 규모가 더욱 커지고 복잡해지고 있다. 하루에도 수많은 버그 리포트들이 버그저장소에 전송 되어 개발자들의 업무가 늘어나고 있다. 이러한 버그 리포트들을 적절한 개발자에게 전달하여 빠르고 정확하게 소프트웨어의 결함이 수정되어야 하는데, 많은 버그 리포트들이 적절하지 않는 개발자에게 배정되어 다른 개발자에게 다시 재배정 되는 경우가 빈번하게 일어나고 있다. 이것은 배정자가 전송받은 버그 리포트들을 정확히 이해하지 못했거나, 또는 모든 개발자들의 능력을 바르게 파악하지 못해 발생한다. 이것은 소프트웨어 유지보수에 개발자의 시간과 노력을 많이 필요하게 한다. 이러한 문제를 해결하기 위해 본 연구에서는 버그 리포트와 관련된 토픽을 찾아내고, 토픽 내 개발자들의 소셜 네트워크 관계를 분석해서 적절한 개발자를 추천하는 기법을 제안한다. 그리고 공개 소스 프로젝트를 이용한 개발자 추천에 대한 성능비교 실험을 통하여 본 연구에서 제안한 방법이 효과적이라는 것을 보인다.

텍스트 마이닝 기반의 데이터 분석 웹 애플리케이션 (Data Analysis Web Application Based on Text Mining)

  • 길완제;김재웅;박구락;이윤열
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.103-104
    • /
    • 2021
  • 본 논문에서는 텍스트 마이닝 기반의 토픽 모델링 웹 애플리케이션 모델을 제안한다. 웹크롤링 기법을 활용하여 키워드를 입력하면 요약된 논문 정보를 파일로 저장할 수 있고 또한 키워드 빈도 분석과 토픽 모델링 등을 통해 연구 동향을 손쉽게 확인해볼 수 있는 웹 애플리케이션을 설계하고 구현하는 것을 목표로 한다. 제안 모델인 웹 애플리케이션을 통해 프로그래밍 언어와 데이터 분석 기법에 대한 지식이 부족하더라도 논문 수집과 저장, 텍스트 분석을 경험해볼 수 있다. 또한, 이러한 웹 시스템 개발은 기존의 html, css, java script와 같은 언어에 의존하지 않고 파이썬 라이브러리를 활용하였기 때문에 파이썬을 기반으로 데이터 분석과 머신러닝 교육을 수행할 경우 프로젝트 기반 수업 교육 과정으로 채택이 가능할 것으로 기대된다.

  • PDF

한국어 뉴스 헤드라인의 토픽 분류에 대한 실증적 연구 (An Empirical Study of Topic Classification for Korean Newspaper Headlines)

  • 박제윤;김민규;오예림;이상원;민지웅;오영대
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.287-292
    • /
    • 2021
  • 좋은 자연어 이해 시스템은 인간과 같이 텍스트에서 단순히 단어나 문장의 형태를 인식하는 것 뿐만 아니라 실제로 그 글이 의미하는 바를 정확하게 추론할 수 있어야 한다. 이 논문에서 우리는 뉴스 헤드라인으로 뉴스의 토픽을 분류하는 open benchmark인 KLUE(Korean Language Understanding Evaluation)에 대하여 기존에 비교 실험이 진행되지 않은 시중에 공개된 다양한 한국어 라지스케일 모델들의 성능을 비교하고 결과에 대한 원인을 실증적으로 분석하려고 한다. KoBERT, KoBART, KoELECTRA, 그리고 KcELECTRA 총 네가지 베이스라인 모델들을 주어진 뉴스 헤드라인을 일곱가지 클래스로 분류하는 KLUE-TC benchmark에 대해 실험한 결과 KoBERT가 86.7 accuracy로 가장 좋은 성능을 보여주었다.

  • PDF