• 제목/요약/키워드: Topics Modeling analysis

검색결과 443건 처리시간 0.023초

신문기사 빅데이터를 활용한 친환경 섬유의 추이에 관한 연구 (The Trends of Eco-Friendly Textiles Using Big Data from Newspaper Articles)

  • 조남범;이충권
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.95-107
    • /
    • 2024
  • 환경에 친화적인 제품과 서비스의 개발은 시대적인 트렌드가 되었고, 경제적 가치를 가진 친환경 섬유의 개발과 활용은 새로운 비즈니스 모델로서 주목받고 있다. 친환경 섬유에 대한 동향을 분석하고 추이를 파악하는 것은 기업, 정부, 소비자 등 다양한 이해관계자들에게 중요한 정보와 인사이트를 제공하여 지속가능한 성장에 도움을 줄 수 있다. 이에 본 연구는 2000년부터 2023년 6월까지 섬유패션 분야를 주로 다루는 신문의 기사데이터를 수집하여 분석을 진행하였다. '친환경 섬유'라는 키워드가 포함된 기사 총 12,331건을 수집하였고, 추출된 데이터에서 형태소 분석을 진행 후 연도별 토픽을 알아보기 위해 잠재 디리클레 할당과 동적 토픽 모델링 분석을 수행하였다. 연구 결과는 섬유산업의 지속 가능한 발전을 위한 전략적 지침과 인사이트를 제공함으로써, 친환경 섬유의 연구와 개발, 그리고 상용화를 촉진함에 있어서 도움이 될 것으로 기대된다.

LDA 토픽 모델링을 활용한 무선이어폰 소비자 구매 의도 및 만족도 비교 분석: 쿠팡에서의 삼성과 애플 무선이어폰 리뷰를 중심으로 (Wireless Earphone Consumers Using LDA Topic Modeling Comparative Analysis of Purchase Intention and Satisfaction: Focused on Samsung and Apple wireless earphone reviews in Coupang)

  • 영덩톨;강태구
    • 산업융합연구
    • /
    • 제21권8호
    • /
    • pp.23-33
    • /
    • 2023
  • 소비자 리뷰분석은 제품 개발, 고객 만족, 경쟁 우위 및 효과적인 마케팅을 위해 중요하다. 무선이어폰 사용 증가는 생활 방식의 성장과 함께 2026년까지 457억 달러에 이를 것으로 예상된다. 따라서 시장의 성장과 중요성을 고려하여, 애플과 삼성의 무선이어폰에 대한 소비자 리뷰를 분석하였다. 본 연구에서는 쿠팡에서 판매되고 있는 애플, 삼성의 무선이어폰 리뷰 11,320건을 수집하여 텍스트마이닝의 빈도, 감성, LDA 토픽 모델 분석을 통해 소비자의 구매의도를 분석하고 소비자 만족도를 분석에 대한 결과를 도출하였다. 토픽 모델링 결과 16개 토픽이 도출되어, 음질, 연결, 쇼핑몰 서비스, 구매의도, 배터리, 배송, 가격 등으로 분류되었다. 브랜드 비교 결과 삼성은 선물 목적으로 구매를 많이 하였고, 가격에 긍정 감정이 높았고, 애플은 배터리, 음질, 연결, 서비스, 배송에 대한 긍정 감정이 높은 결과로 나타났다. 본 연구의 결과는 제조업, 소매업, 마케터 및 소비자를 포함한 고객 만족도, 품질 및 시장 동향에 대한 개선과 통찰력을 얻을 수 있는 연구 결과로 관련 산업의 자료로 활용될 수 있을 것이다.

데이터 마이닝을 이용한 국내외 사서 채용 동향 분석 (A Study on the Trends of Librarian Recruitment in Korea and Overseas Using Data Mining)

  • 채하영;이지수
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.201-228
    • /
    • 2023
  • 본 연구는 국내외 사서 채용 동향을 분석하기 위해 수행되었다. 연구 대상으로 국내데이터는 인터넷 포털 사이트인 "사서e마을"에 게시된 사서 채용 공고를 총 489개를 수집하였고, 해외데이터는 "ALAJobList"에서 6,600개의 자료를 수집하였다. 기간은 2020년 1월부터 2022년 8월까지이며 수집된 데이터를 대상으로 지역 분포도 분석, 빈도 분석, 토픽모델링을 수행하였다. 연구 결과, 채용 공고의 지역분포도는 국내데이터에서 서울이 280건으로 가장 많았으며, 해외데이터는 캘리포니아(California)가 662건으로 상위로 도출되었다. 빈도분석 결과, 국내데이터의 담당업무에서는 '관리' 23.42% 키워드가 높게 나왔고, 자격요건은 '자격증' 16.61%이 가장 많은 비율을 차지했다. 해외데이터의 담당업무에서는 'LibraryService' 8.72% 비율이 높게 나왔으며, 자격요건은 'CommunicationSkills' 10.13% 키워드가 가장 높은 순위에 위치함을 확인했다. 토픽모델링에서는 국내외 담당업무, 자격요건으로 나눠 총 4가지의 영역을 살펴보았다. 분석 결과, 국내외 채용 공고에서 도출된 사서의 담당업무 및 자격요건이 미국도서관협회(ALA) 및 한국도서관협회 등 주요 도서관 관련 협회에서 제시한 핵심 역량과 연관이 있음을 확인하였다.

토픽 모델링을 이용한 시뮬레이션 연구 동향 분석 (Trend Analysis using Topic Modeling for Simulation Studies)

  • 나상태;김자희;정민호;안주언
    • 한국시뮬레이션학회논문지
    • /
    • 제25권3호
    • /
    • pp.107-116
    • /
    • 2016
  • 시뮬레이션의 활용범위와 기법이 나날이 다양해지면서 시뮬레이션의 최신 연구 동향을 분석하고 이를 대학 교육과 연구에 적용하는 노력이 요구된다. 기존에는 트렌드 분석을 위해 문헌조사 또는 전문가 평가와 같은 정성적인 연구방법이 주로 사용되었으나 이런 방법들은 많은 시간과 비용이 소요될 뿐만 아니라 전문가의 주관적인 관점이 반영될 가능성이 있다. 본 연구에서는 객관적 분석을 위해 국내 학술 논문에 대하여 토픽분석을 포함한 정량적 분석을 실시하였다. 그 결과 국내에서는 시뮬레이션이 전기전자 분야에서 가장 활발하게 활용된다는 사실을 발견하였다. 또한 사회 과학에서는 교육 및 오락의 목적으로도 활용됨을 알 수 있었다. 이 연구 결과는 국내 시뮬레이션 연구와 한국 시뮬레이션 학회가 어떤 방향으로 발전할지를 예측하는 데 도움이 된다. 본 연구결과는 시뮬레이션 활용 연구 분야의 핵심 토픽을 도출하기 위하여 텍스트마이닝 기반의 트렌드분석에 대한 활용 가능성을 제시하고, 텍스트마이닝이 미래예측 키워드를 도출하는 유용한 방법임을 증명하였으며, 전문가들의 정성적인 자료를 보조하는 정량적인 자료분석 방법으로 유용할 것으로 기대된다.

잠재디리클레할당 분석을 이용한 '노인일자리' 관련 신문기사 토픽분석 (Topic Modeling of Newspaper Articles on Government 'Senior job program' via Latent Dirichlet Allocation.)

  • 이소정
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.537-546
    • /
    • 2020
  • 본 연구는 노인일자리사업의 사회적 논의구조를 분석하기 위해 대표적인 대중매체인 신문기사에서 다루어지는 노인일자리 관련 주요 토픽들과 시계열적 특성을 분석하였다. 이를 위해 뉴스 통합 데이터베이스인 빅카인즈에 수록된 11개 중앙지와 8개 경제지의 노인일자리사업 관련 기사 1107개에 대해 잠재디리클레할당 방법을 이용한 토픽분석을 실시해 언론 기사에 내재된 노인일자리사업의 잠재토픽을 추출하였다. 분석결과 노인일자리사업에 대한 일반적 정보전달, 지자체 사업 홍보, 노후생활, 고용효과, 시장연계 등 5개의 잠재토픽이 추출되었는데 2015년까지 대부분의 언론기사가 일반적 정보전달과 지자체 사업홍보에 국한되어 있어 노인일자리사업의 정체성에 대한 사회적 논의가 형성되지 못하였음을 알 수 있었던 반면 2015년 이후부터 노인일자리사업의 소득, 안전 등 노후생활 효과 관련 주제가 다루어지는 비중이 증가했으며 특히 문재인 정부 출범이후 고용효과와 관련된 기사가 압도적인 비중을 차지하게 되었음을 발견할 수 있었다. 본 연구는 이러한 결과에 근거해 향후 노인일자리사업의 질적측면 및 고용효과 측면을 증진시킬 수 있는 방안에 대한 고민의 필요성과 고용프레임 이외의 대안적 프레임 제시의 필요성을 제안하였다.

토픽모델링을 이용한 교육정책 키워드 기반 소셜미디어 분석 (Social Media Analysis Based on Keyword Related to Educational Policy Using Topic Modeling)

  • 정진명;박영호;김우주
    • 인터넷정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.53-63
    • /
    • 2018
  • 정보를 전달하고 여론을 형성하는 전통적인 매스미디어의 기능이 ICT 기술의 발전으로 소셜미디어를 통해 정보와 의견을 공유하는 환경으로 급격하게 변해 왔으며, 그 영향력을 더욱 강화시키고 있다. 즉, 일반 대중들이 소셜미디어를 통해 정치 사회 경제 변화에 대한 여론을 생산하고 공유하는 여론의 영향력이 갈수록 커지고 있는 것이 확인되고 있으며, 그 변화는 선거활동과 같은 정치 분야에서 활용되고 있다. 소셜미디어를 활용해서 대중들의 의사를 파악하고, 반영하기 위한 노력은 정치 영역뿐만 아니라 공공 영역에서도 활발하게 이루어지고 있다. 본 논문은 교육분야 정책과정에서 소셜미디어 기반 여론을 활용하기 위한 가능성을 탐색하는 것을 목적으로 한다. 이를 위해 교육정책 중 소프트웨어교육에 관한 키워드를 중심으로 데이터를 수집하고, 문서의 주요 토픽과 토픽별 출현 확률, 토픽 트렌드를 분석하였다. 그 결과 '국내 컴퓨터 교육 시간'토픽이 전체의 43.99%를 차지하였으며, '프라임 사업 선정' 토픽이 36.81%, '인공지능 프로그램'토픽이 7.94%의 출현 확률을 나타내어, 대중의 소프트웨어교육 정책에 대한 주요 관심도를 파악할 수 있었다. 또한, 시기별 토픽 추세 및 연관성 있는 토픽간의 트렌드 비교 분석을 통하여 동일한 주제의 정책이라도 교육과정의 시기와 정책의 대상에 따라 유연한 정책수립이 필요하다는 시사점을 도출할 수 있었다.

소셜 Q&A 사이트의 질문 분석을 통한 청소년의 성 정체성(sexual identity) 고민에 대한 이해 (Understanding Sexual Identity-related Concerns through the Analysis of Questions on a Social Q&A Site)

  • 주영준;남서진;이다정;이용정
    • 한국도서관정보학회지
    • /
    • 제51권4호
    • /
    • pp.101-119
    • /
    • 2020
  • 본 연구는 소셜 Q&A 사이트인 네이버 지식iN에서 성 정체성과 관련된 질문들을 분석하여 질문의 중심이 되는 주제를 추출하고 구체적인 고민들에 대해 이해하는 것이 목적이다. 이를 위해 네이버 지식iN에서 2010년부터 9년간 작성된 2,120개의 관련 질문들을 수집한 후, 자연어 처리와 정보 검색 방법을 사용하여 질문들의 주제와 고민들을 추출하고 분석하였다. 분석결과, 주요 주제는 인간관계, 성 정체성 의심, 성적 지향, 감정 및 관계, 성 정체성 고민 등으로 나타났다. 나아가 사용자들은 주로 1) 일반적인 성 정체성, 2) 성적 지향, 3) 성 정체성에 대한 부정적 인식, 4) 감정 고백, 커밍아웃, 동성애, 5) 미래, 이성 관계, 군대에 대한 우려, 6) 성 정체성 혼란을 겪는 이유 등과 관련된 고민을 하고 있었다. 본 연구는 성 정체성에 대한 실제적 고민들을 수집하여 토픽 모델링 기법을 통해 정보 요구를 도출하였으며 exact match와 tf-idf 기반의 검색 방법을 비교함으로써 문헌정보학 분야의 방법론적 확장을 시사했다. 또한 특정 관심사에 대한 온라인 커뮤니티 이용자들의 정보요구 및 정보탐색행태를 관찰함으로써 정보행위분야의 학문적 성숙에도 기여했다.

비정형 빅데이터를 이용한 COVID-19 주요 이슈 분석 (Analysis of Major COVID-19 Issues Using Unstructured Big Data)

  • 김진솔;신동훈;김희웅
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.145-165
    • /
    • 2021
  • 2019년 12월 말, 전 세계를 혼란에 빠트린 코로나바이러스감염증-19(COVID-19)의 팬데믹이 시작되었다. 이러한 위기를 극복하고 피해를 최소화하기 위해 정부와 기관에서는 기존의 정책지원 효과를 극대화하고 변화하는 사회를 반영한 전방위적 대응책 마련이 필요하다. 사회적으로 부각되는 논제와 관심사항의 주제를 파악하기 위해, 본 연구는 소셜미디어의 빅데이터를 통해 코로나19와 관련된 주요 생각, 태도, 감정 등을 파악한다. 특히 정부의 대응에 관한 대중의 견해를 알기 위해 '정부 대응방향'을 기준으로 시기를 나누어 분석을 진행했다. 분석에 활용한 데이터는 네이버를 통해 2019년 12월 31일부터 2020년 12월 12일까지 수집되었다. 또한, 분석을 위해 텍스트마이닝 기법 중 TF-IDF 키워드 추출과 LDA 토픽모델링을 활용하였다. 그 결과, 8개의 코로나19 관련 주요 이슈가 도출되었으며, 이러한 이슈 사항과 주요 키워드를 기반으로 해당 분야에서의 코로나19 및 감염병 대응 정책 전략을 제시하였다. 본 연구는 코로나19 팬데믹과 같은 위기상황에 정부와 관련 기관이 국민의 필요와 요구에 따른 정확한 대응책을 마련하는 데 기초자료를 제공했다는 점에서 의의를 가진다.

스포츠시설에 관한 연구 동향 분석: SCOPUS DB를 중심으로 (Analysis on Research Trends in Sport Facilities: Focusing on SCOPUS DB)

  • 김일광;박성택;박수선;김미숙;박종철
    • 산업융합연구
    • /
    • 제19권6호
    • /
    • pp.11-19
    • /
    • 2021
  • 본 연구의 목적은 "스포츠시설" 관련 국내외 연구의 동향을 탐색적으로 파악하여 향후 연구 방향을 모색하는 데 있다. 이를 위해 2016년부터 2020년까지 SCOPUS DB에서 "스포츠시설"이 포함된 논문의 초록을 수집하였으며, 그 결과 총 1,801편이 자료 분석에 사용되었다. 자료 분석 수행을 위해 LDA 기반 토픽 모델링 기법과 TD-IDF 기법을 활용하였으며, Tagxedo를 활용한 워드클라우드 분석을 수행하였다. 분석 결과, 8가지 토픽이 최적으로 결정되었으며, 각 토픽의 주요 키워드로는 "sports", "facilities", "health", "physical", "data" 및 "using" 등이 도출되었다. 이를 통해 최근에 국내외적으로 스포츠시설과 관련하여 신체활동, 건강 및 시설 이용 등을 주제로 한 연구들이 활발하게 이루어져 왔음을 확인할 수 있었다. 이는 최근 SCOPUS 논문들은 건강 증진과 삶의 질 향상 등과 같은 스포츠시설의 도구적 가치에 주목하고 있음을 의미한다. 따라서, 건강한 삶을 위해 스포츠시설을 이용하는 참여자들에게 도움이 될 수 있는 다양한 연구들이 향후 지속적으로 수행되어야 할 것이다.

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천 (Automatic TV Program Recommendation using LDA based Latent Topic Inference)

  • 김은희;표신지;김문철
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-283
    • /
    • 2012
  • 다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.