• 제목/요약/키워드: Topic modeling analysis

검색결과 694건 처리시간 0.021초

소셜 Q&A 사이트의 질문 분석을 통한 청소년의 성 정체성(sexual identity) 고민에 대한 이해 (Understanding Sexual Identity-related Concerns through the Analysis of Questions on a Social Q&A Site)

  • 주영준;남서진;이다정;이용정
    • 한국도서관정보학회지
    • /
    • 제51권4호
    • /
    • pp.101-119
    • /
    • 2020
  • 본 연구는 소셜 Q&A 사이트인 네이버 지식iN에서 성 정체성과 관련된 질문들을 분석하여 질문의 중심이 되는 주제를 추출하고 구체적인 고민들에 대해 이해하는 것이 목적이다. 이를 위해 네이버 지식iN에서 2010년부터 9년간 작성된 2,120개의 관련 질문들을 수집한 후, 자연어 처리와 정보 검색 방법을 사용하여 질문들의 주제와 고민들을 추출하고 분석하였다. 분석결과, 주요 주제는 인간관계, 성 정체성 의심, 성적 지향, 감정 및 관계, 성 정체성 고민 등으로 나타났다. 나아가 사용자들은 주로 1) 일반적인 성 정체성, 2) 성적 지향, 3) 성 정체성에 대한 부정적 인식, 4) 감정 고백, 커밍아웃, 동성애, 5) 미래, 이성 관계, 군대에 대한 우려, 6) 성 정체성 혼란을 겪는 이유 등과 관련된 고민을 하고 있었다. 본 연구는 성 정체성에 대한 실제적 고민들을 수집하여 토픽 모델링 기법을 통해 정보 요구를 도출하였으며 exact match와 tf-idf 기반의 검색 방법을 비교함으로써 문헌정보학 분야의 방법론적 확장을 시사했다. 또한 특정 관심사에 대한 온라인 커뮤니티 이용자들의 정보요구 및 정보탐색행태를 관찰함으로써 정보행위분야의 학문적 성숙에도 기여했다.

비정형 빅데이터를 이용한 COVID-19 주요 이슈 분석 (Analysis of Major COVID-19 Issues Using Unstructured Big Data)

  • 김진솔;신동훈;김희웅
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.145-165
    • /
    • 2021
  • 2019년 12월 말, 전 세계를 혼란에 빠트린 코로나바이러스감염증-19(COVID-19)의 팬데믹이 시작되었다. 이러한 위기를 극복하고 피해를 최소화하기 위해 정부와 기관에서는 기존의 정책지원 효과를 극대화하고 변화하는 사회를 반영한 전방위적 대응책 마련이 필요하다. 사회적으로 부각되는 논제와 관심사항의 주제를 파악하기 위해, 본 연구는 소셜미디어의 빅데이터를 통해 코로나19와 관련된 주요 생각, 태도, 감정 등을 파악한다. 특히 정부의 대응에 관한 대중의 견해를 알기 위해 '정부 대응방향'을 기준으로 시기를 나누어 분석을 진행했다. 분석에 활용한 데이터는 네이버를 통해 2019년 12월 31일부터 2020년 12월 12일까지 수집되었다. 또한, 분석을 위해 텍스트마이닝 기법 중 TF-IDF 키워드 추출과 LDA 토픽모델링을 활용하였다. 그 결과, 8개의 코로나19 관련 주요 이슈가 도출되었으며, 이러한 이슈 사항과 주요 키워드를 기반으로 해당 분야에서의 코로나19 및 감염병 대응 정책 전략을 제시하였다. 본 연구는 코로나19 팬데믹과 같은 위기상황에 정부와 관련 기관이 국민의 필요와 요구에 따른 정확한 대응책을 마련하는 데 기초자료를 제공했다는 점에서 의의를 가진다.

스포츠시설에 관한 연구 동향 분석: SCOPUS DB를 중심으로 (Analysis on Research Trends in Sport Facilities: Focusing on SCOPUS DB)

  • 김일광;박성택;박수선;김미숙;박종철
    • 산업융합연구
    • /
    • 제19권6호
    • /
    • pp.11-19
    • /
    • 2021
  • 본 연구의 목적은 "스포츠시설" 관련 국내외 연구의 동향을 탐색적으로 파악하여 향후 연구 방향을 모색하는 데 있다. 이를 위해 2016년부터 2020년까지 SCOPUS DB에서 "스포츠시설"이 포함된 논문의 초록을 수집하였으며, 그 결과 총 1,801편이 자료 분석에 사용되었다. 자료 분석 수행을 위해 LDA 기반 토픽 모델링 기법과 TD-IDF 기법을 활용하였으며, Tagxedo를 활용한 워드클라우드 분석을 수행하였다. 분석 결과, 8가지 토픽이 최적으로 결정되었으며, 각 토픽의 주요 키워드로는 "sports", "facilities", "health", "physical", "data" 및 "using" 등이 도출되었다. 이를 통해 최근에 국내외적으로 스포츠시설과 관련하여 신체활동, 건강 및 시설 이용 등을 주제로 한 연구들이 활발하게 이루어져 왔음을 확인할 수 있었다. 이는 최근 SCOPUS 논문들은 건강 증진과 삶의 질 향상 등과 같은 스포츠시설의 도구적 가치에 주목하고 있음을 의미한다. 따라서, 건강한 삶을 위해 스포츠시설을 이용하는 참여자들에게 도움이 될 수 있는 다양한 연구들이 향후 지속적으로 수행되어야 할 것이다.

스마트도시 구현을 위한 시민참여의 역할과 방향에 관한 연구 (Civic Participation in Smart City : A Role and Direction)

  • 남우민;박건철
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.79-86
    • /
    • 2022
  • 본 연구는 스마트도시 구축과정에서 시민참여 활성화를 위한 연구동향을 파악하고자 한다. 이를 바탕으로 스마트도시에서 시민참여의 역할과 방향을 제시하고 시민참여를 유인할 수 있는 정책적·산업적·학술적·방향성을 제시하는데 있다. 전 세계적으로 급격하게 진행되는 도시화와 도시인구 증가로 교통, 환경, 에너지 등 각종사회 문제가 도시를 중심으로 확산 및 심화되고 있다. 세계 각국은 이런 도시문제 해결 및 지속가능한 발전을 이루기 위해 스마트도시를 도입하고 있다. 최근에는 인프라 확대 등 스마트도시 건설을 위한 기존의 하향식(Top-Down) 도시계획 방식에서 벗어나 시민들이 직·간접적으로 도시건설 과정에 참여 및 상호작용할 수 있는 상향식(Bottom-Up) 방식으로의 접근이 경주되고 있다. 한편, 국내에서도 국가전략관점에서 스마트도시 건설이 추진되고 있지만, 스마트도시에 대한 일반 시민의 인식과 참여는 낮은 것으로 나타나고 있다. 이런 상황을 극복하기 위해 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 연구가 시급한 상황이다. 따라서 본 연구에서는 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 전략모색을 위해 Scopus DB에서 'Smart City'와 'Participation(Engagement)'가 동시에 포함된 문헌 995건을 수집 후 토픽모델링 기법을 활용하여 관련 연구주제를 유형화하고, 연구동향을 분석하였다. 이를 통해 스마트도시에서 시민참여에 관한 연구방향을 이해하고, 향후 관련 연구에 대한 방향성을 제시하는 근거자료로 활용될 수 있을 것으로 기대된다.

해양공간계획 연구동향 분석 연구: 토픽 모델링을 중심으로 (A Study on the Trends in the Studies on Marine Spatial Planning: Focusing on Topic Modeling)

  • 황규원;장아름;이문숙
    • 해양환경안전학회지
    • /
    • 제27권7호
    • /
    • pp.954-966
    • /
    • 2021
  • 최근 전세계적으로 해양공간계획을 수립하고 공간활용 측면에서 다양한 용도를 포괄하고, 법제도화를 통해 공간관리를 추진하고 있다. 또한 해양공간에서 발생되는 다양한 활동과 해양공간의 이용 범위와 강도가 확대되고 있는 가운데, 이해관계자 간 갈등 저감과 합리적인 공간관리수단으로써 해양공간계획의 중요성이 증대되고 있다. 이와 더불어 해양공간계획 관련 연구는 양적 성장과 다양한 연구 분야에서 수행되고 있다. 이 연구의 목적은 해양공간계획 관련 연구동향을 탐색하고 최근 10년간 연구주제의 변화와 이슈 키워드를 분석하고자 한다. 연구대상은 2010년부터 2020년까지 해양공간계획을 핵심 주제어로 포함하는 연구문헌을 대상으로 키워드를 분석하였다. 분석방법은 단어출현빈도, 워드 클라우드 등 출현강도를 기반으로 핵심 이슈를 발굴하고, 키워드를 중심으로 토픽과 연계된 5개 키워드를 추출하여 핵심 주제 도출하였다. 연구결과 정책수립 측면에서 정책수준단계(PRL)를 적용하여 원칙개발, 제도화, 정책검증 등 시기별 핵심 주제가 변화를 확인하였다. 국내연구는 의사결정도구로서 연구와 방법적용을 중심으로 수행되고 있으며, 향후 연구의 양적 성장과 질적 다변화를 통해 현재 시행초기의 해양공간계획이 실제 해양공간의 통합적 관리 및 조정 역할이 가능한 제도로의 정착을 기대한다.

디지털 전환의 미래사회 위험이슈 및 정책적 대응 방향: 인공지능을 중심으로 (A Study on Risk Issues and Policy for Future Society of Digital Transformation: Focusing on Artificial Intelligence)

  • 구본진
    • 기술혁신연구
    • /
    • 제30권1호
    • /
    • pp.1-20
    • /
    • 2022
  • 디지털 전환(digital transformation)은 디짓화(digitisation)와 디지털화(digitalisation)의 경제적 및 사회적 효과를 의미한다. 디지털 전환은 경제/사회 발전 및 삶의 편의성을 향상시키는 유용한 도구로 작용하지만 부정적 영향(개인정보 오남용, 윤리문제 야기, 사회적 격차 심화 등)을 미칠 수도 있는 양면성을 보유하고 있다. 한편 정부는 산업 경쟁력 및 기술 패권 확보 등을 위하여 디지털 전환 촉진정책은 적극적으로 추진하고 있는 반면, 디지털 전환 관련 위험이슈에 대한 이해와 이를 방지할 수 있는 정책 추진에는 상대적으로 소극적인 상황이다. 이에 본 연구는 디지털 전환이 초래할 수 있는 미래사회 위험이슈를 Embedded Topic Modeling 방법론 기반의 언론기사 빅데이터 정량분석으로 체계화 및 구체화하고, 정책적 대응 방향을 제시하였다. 이를 위하여 먼저 주요국의 디지털 전환 역기능 세부 이슈들을 규명하였다. 다음으로 디지털 전환의 핵심 기술인 인공지능을 중심으로 주요국과 한국의 디지털 전환 역기능 세부이슈를 구체화하고, 비교분석하였다. 아울러 분석결과들을 종합하여 향후 정부의 디지털 전환 역기능 대응 정책 수립 방향을 제시하였다. 분석 결과에 근거한 정책적 함의는 다음과 같다. 첫째, 디지털 전환의 역기능은 기술 분야에만 한정되어 나타나지 않고 국가안보 및 사회 전반에 영향을 미치기 때문에 정부는 디지털 전환의 순기능 촉진뿐만 아니라 역기능 대응을 위한 정책도 마련해야 한다. 둘째, 디지털 전환의 미래사회 위험 세부이슈들은 국가에 따라 상이하게 나타나므로 정부는 국가적/사회적 맥락을 고려하여 디지털 전환 역기능 대응 정책을 수립해야 한다. 마지막으로 정부는 이해관계자들의 혼선을 최소화할 수 있도록 디지털 전환 역기능 대응 정책의 큰 방향을 설정하고, 실효성 있는 정책 수단을 마련해야 한다.

스마트 관광 활성화를 위한 트립어드바이저 애플리케이션 리뷰 분석 : 토픽 모델링을 중심으로 (Analyzing TripAdvisor application reviews to enable smart tourism : focusing on topic modeling)

  • 이유나;한무명초;유선영;소미기;노미진
    • 스마트미디어저널
    • /
    • 제12권8호
    • /
    • pp.9-17
    • /
    • 2023
  • 정보통신의 발달과 스마트 기기의 발전 및 보급 향상은 관광 형태의 변화를 야기하였고, 이후 스마트 관광이라는 개념이 등장하였다. 이에 스마트 관광 정책 및 설문에 관한 연구가 진행되고 있으나 애플리케이션 리뷰에 관한 연구는 미비한 편이다. 본 연구는 구글 플레이 스토어 내 스마트 관광 분야의 대표적인 애플리케이션인 트립어드바이저 애플리케이션 리뷰 데이터를 수집하여 LDA(Latent Dirichlet Allocation) 토픽 모델링을 통해 사용 용도와 사용자 만족을 파악하고자 한다. 분석 결과 4개의 토픽이 도출되었으며 2개의 토픽에서는 긍정적인 평가를 나머지 2개의 토픽에서는 부정적인 평가를 하고 있었다. 사용자들은 해당 애플리케이션의 숙박 및 관광 명소 추천 시스템에 만족하고 있음을 알 수 있었으며 검색 시 설정한 필터가 적용되지 않거나 업데이트 후 리뷰가 게시되지 않음에 불편을 겪고 있음을 알 수 있었다. 이에 다양한 추천 카테고리를 애플리케이션에 추가하여 사용자에게 다양한 경험을 제공하는 것이 만족도 향상에 도움이 될 것으로 기대된다. 또한 필터 기능을 포함한 애플리케이션 문제를 파악하여 애플리케이션 환경 점검과 해당 기능 오류 개선을 한다면 사용자 만족도를 향상시킬 수 있을 것으로 기대된다.

RFE-SHAP을 활용한 온라인 리뷰를 통한 고객 만족도 예측 (Prediction of Customer Satisfaction Using RFE-SHAP Feature Selection Method)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.325-345
    • /
    • 2023
  • 본 연구는 온라인 리뷰를 이용하여 고객 만족도를 예측하는 새로운 접근 방식을 제안한다. LDA 주제 모델링과 결합된 RFE-SHAP 기능 선택 방법을 활용하여 고객 만족도에 큰 영향을 미치는 주요 기능을 식별하여 예측 분석을 개선했다. 먼저 Random Forest 알고리즘의 경우, 초기 28개 입력변수에서 14개의 변수를 최적 하위 집합으로 추출했다. 제안된 방법에서 Random Forest 모델의 성과는 84%로 확인 되었으며 변수가 많은 모델에서 흔히 발생하는 과적합을 방지하였다. 또한 품질, 착용감, 내구성 등과 같은 리뷰의 특정 요소들이 패션 산업 내에서 소비자 만족도를 증진시키는 중요한 역할을 한다는 사실을 밝혀냈다. 본 연구는 예측 결과를 설명할 때 선택한 각 기능이 고객 만족도에 어떻게 영향을 미치는지에 대한 자세한 설명을 제공하고 고객이 가장 중요하게 생각하는 측면에 대한 세부적인 보기를 제공한다. 본 연구의 공헌도는 다음과 같다. 첫째, 전자상거래 분석 분야 내에서 예측 모델링을 강화하고 특성 중심적인 접근법을 소개함으로써 방법론을 개선하였다. 이는 고객 만족도 예측의 정확도를 높일 뿐만 아니라 예측 모델에서의 변수 선택에 대한 새로운 접근을 제시한다. 둘째, 특히 의류 부문에서 전자상거래 플랫폼에 구체적인 통찰력을 제공한다. 품질, 사이즈, 내구성 등 고객 리뷰의 어떤 부분이 만족도에 가장 큰 영향을 미치는지 강조함으로써, 기업들이 제품과 서비스를 맞춤화 할 수 있는 전략적 방향을 제시한다. 이러한 목표 지향적인 개선은 고객의 쇼핑 경험을 개선하고, 만족도를 향상시키면서 충성도를 이끌어낼 수 있을 것으로 기대한다.

중등학교 가정과교사 임용시험의 핵심 키워드 탐색: 내용 분석과 텍스트 네트워크 분석을 중심으로 (Exploring the Core Keywords of the Secondary School Home Economics Teacher Selection Test: A Mixed Method of Content and Text Network Analyses)

  • 박미정;한주
    • Human Ecology Research
    • /
    • 제60권4호
    • /
    • pp.625-643
    • /
    • 2022
  • The purpose of this study was to explore the trends and core keywords of the secondary school home economics teacher selection test using content analysis and text network analysis. The sample comprised texts of the secondary school home economics teacher 1st selection test for the 2017-2022 school years. Determination of frequency of occurrence, generation of word clouds, centrality analysis, and topic modeling were performed using NetMiner 4.4. The key results were as follows. First, content analysis revealed that the number of questions and scores for each subject (field) has remained constant since 2020, unlike before 2020. In terms of subjects, most questions focused on 'theory of home economics education', and among the evaluation content elements, the highest percentage of questions asked was for 'home economics teaching·learning methods and practice'. Second, the network of the secondary school home economics teacher selection test covering the 2017-2022 school years has an extremely weak density. For the 2017-2019 school years, 'learning', 'evaluation', 'instruction', and 'method' appeared as important keywords, and 7 topics were extracted. For the 2020-2022 school years, 'evaluation', 'class', 'learning', 'cycle', and 'model' were influential keywords, and five topics were extracted. This study is meaningful in that it attempted a new research method combining content analysis and text network analysis and prepared basic data for the revision of the evaluation area and evaluation content elements of the secondary school home economics teacher selection test.

키워드 네트워크 분석을 활용한 글로벌가치사슬(GVCs) 연구동향 분석 (A Study on Global Value Chains(GVCs) Research Trends Based on Keyword Network Analysis )

  • 박현용;최영준;이가은
    • 무역학회지
    • /
    • 제45권5호
    • /
    • pp.239-260
    • /
    • 2020
  • This research was conducted on 176 GVCs-related research papers listed in the Index of Korean Academic Writers. The analysis methodology used the keyword network analysis methodology of big data analysis. For the comprehensive analysis of research trends, the research trends through word frequency (TF), important topic (TF-IDF), and topical modeling were analyzed in 176 papers. In addition, the research period of GVCs was divided into the early stages of the first study (2003-2014), the second phase of the study (2015-2017), and the third phase of the study (2018-2020). According to the comprehensive analysis, the GVCs research was conducted with the keyword 'value added' as the center, focusing on the keywords of export (trade), Korea, business, influence, and production. Major research topics were 'supporting corporate cooperation and capacity building' and 'comparative advantage with added value of overseas direct investment'. According to the analysis of major period-specific research trends, GVCs were studied in the early stages of the first phase of the study with global value chain trends and corporate production strategies. In the second research propulsion period, research was done in terms of trade value added. In the recent third phase of the study, small and medium-sized enterprises actively participated in the global value chain and actively researched ways to support the government. Through this study, the importance of the global value chain has been confirmed quantitatively and qualitatively, and it is recognized as an important factor to be considered in the strategy of enhancing industrial competitiveness and entering overseas markets. In particular, small and medium-sized companies' participation in the global value chain and support measures are being presented as important research topics in the future.