• 제목/요약/키워드: topic mining

검색결과 503건 처리시간 0.027초

뉴스와 소셜 데이터를 활용한 텍스트 기반 가짜 뉴스 탐지 방법론 (Text Mining-based Fake News Detection Using News And Social Media Data)

  • 현윤진;김남규
    • 한국전자거래학회지
    • /
    • 제23권4호
    • /
    • pp.19-39
    • /
    • 2018
  • 최근 가짜 뉴스가 분야를 막론하고 전 세계에서 주목을 받고 있으며, 현대경제연구원에서는 이러한 가짜 뉴스로 인한 피해 규모가 연간 약 30조 900억원에 달하는 것으로 추산하였다. 정부에서는 "가짜 뉴스 찾기"를 주제로 "인공지능 R&D 챌린지" 대회를 개최하여 가짜 뉴스를 가려낼 인공지능 원천기술 개발에 대한 첫 걸음을 내딛고 있으며, 민간 차원에서도 다양한 분야에서 팩트 체크 서비스가 제공되고 있다. 학계에서도 가짜 뉴스를 탐지하기 위한 시도가 전문가 기반, 집단지성 기반, 인공지능 기반, 시맨틱 기반 등으로 활발하게 이루어지고 있다. 하지만 이러한 시도는 조작의 정밀도가 높을수록 뉴스 자체에 대한 분석만으로 진위 여부를 식별하기가 더욱 어렵다는 한계를 경험하고 있으며, 가짜 뉴스 탐지 모델의 정확도가 과평가된 경향을 보이고 있다. 따라서 본 연구에서는 가짜 뉴스 탐지 모델 정확도의 공정성을 확보하고, 뉴스의 내용뿐만 아니라 해당 뉴스에 대한 반응으로 자연적으로 발생한 광범위한 소셜 데이터를 활용하여 뉴스의 진위 여부를 판정하는 방안을 제안하고자 한다.

텍스트 마이닝 방법론과 메신저UI를 활용한 융합연구 촉진을 위한 연구자 및 연구 분야 추천 시스템의 제안 (Researcher and Research Area Recommendation System for Promoting Convergence Research Using Text Mining and Messenger UI)

  • 양낙영;김성근;강주영
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제27권4호
    • /
    • pp.71-96
    • /
    • 2018
  • Purpose Recently, social interest in the convergence research is at its peak. However, contrary to the keen interest in convergence research, an infrastructure that makes it easier to recruit researchers from other fields is not yet well established, which is why researchers are having considerable difficulty in carrying out real convergence research. In this study, we implemented a researcher recommendation system that helps researchers who want to collaborate easily recruit researchers from other fields, and we expect it to serve as a springboard for growth in the convergence research field. Design/methodology/approach In this study, we implemented a system that recommends proper researchers when users enter keyword in the field of research that they want to collaborate using word embedding techniques, word2vec. In addition, we also implemented function of keyword suggestions by using keywords drawn from LDA Topicmodeling Algorithm. Finally, the UI of the researcher recommendation system was completed by utilizing the collaborative messenger Slack to facilitate immediate exchange of information with the recommended researchers and to accommodate various applications for collaboration. Findings In this study, we validated the completed researcher recommendation system by ensuring that the list of researchers recommended by entering a specific keyword is accurate and that words learned as a similar word with a particular researcher match the researcher's field of research. The results showed 85.89% accuracy in the former, and in the latter case, mostly, the words drawn as similar words were found to match the researcher's field of research, leading to excellent performance of the researcher recommendation system.

태평양동맹(Pacific Alliance)과 한국의 경제협력에 관한 연구 (A Study on Economic Cooperation between Korea and Pacific Alliance)

  • 박종석
    • 아태비즈니스연구
    • /
    • 제11권4호
    • /
    • pp.303-315
    • /
    • 2020
  • Purpose - The purpose of this study is to analyze Korea's trade relations centered on the Pacific Alliance (PA), a major economic integration in Latin America, and identify its problems and suggest measures that can be taken by the government and corporations to reinforce economic cooperation. Design/methodology/approach - To improve the level of contribution of the study, an empirical analysis is necessary. However, due to limited data access, the study will approach the topic of trade relations between Korea and the PA with various statistics and literature. Findings - First, there is an urgent need for changes in import-export goods between Korea and the PA, as trade is focused on specific items. Second, although foreign direct investment from Korea to the PA is centered in manufacturing and mining industries, there should be different investment strategies by countries and industries. Third, it is necessary to reinforce commercial cooperation. Korea currently has Free Trade Agreements with Chile, Peru, and Columbia, but not with Mexico, the largest trading partner among the PA. Therefore, Korea must take active measures to sign an FTA with Mexico, which has been put on hold. Research implications or Originality - Latin America has the most thriving market when it comes to Free Trade Agreements worldwide. With the official establishment of the Pacific Alliance (PA) in 2012, the economic integration of Latin America faced entirely new circumstances. Reinforcing economic cooperation with the PA is extremely important for Korea in terms of entering and dominating the Latin American market. However, there is still a lack of research on the Pacific Alliance, and corporations that aim to enter the Latin American market face difficulties due to lack of information. By investigating the Pacific Alliance and its prospects and analyzing the trade relations with Korea, this study will provide strategic measures for corporations that wish to enter the Latin American market.

Native API 빈도 기반의 퍼지 군집화를 이용한 악성코드 재그룹화 기법연구 (Malicious Codes Re-grouping Methods using Fuzzy Clustering based on Native API Frequency)

  • 권오철;배성재;조재익;문종섭
    • 정보보호학회논문지
    • /
    • 제18권6A호
    • /
    • pp.115-127
    • /
    • 2008
  • Native API(Application Programming Interfaces)는 관리자 권한에서 수행되는 system call의 일종으로 관리자 권한을 획득하여 공격하는 다양한 종류의 악성코드를 탐지하는데 사용된다. 이에 따라 Native API의 특징을 기반으로한 탐지방법들이 제안되고 있으며 다수의 탐지방법이 교사학습(supervised learning) 방법의 기계학습(machine learning)을 사용하고 있다. 하지만 Anti-Virus 업체의 분류기준은 Native API의 특징점을 반영하지 않았기 때문에 교사학습을 이용한 탐지에 적합한 학습 집합을 제공하지 못한다. 따라서 Native API를 이용한 탐지에 적합한 분류기준에 대한 연구가 필요하다. 본 논문에서는 정량적으로 악성코드를 분류하기 위해 Native API를 기준으로 악성코드를 퍼지 군집화하여 재그룹화하는 방법을 제시한다. 제시하는 재그룹화 방법의 적합성은 기계학습을 이용한 탐지성능의 차이를 기존 분류방법을 결과와 비교하여 검증한다.

Analysis of Research Topics and Trends on COVID-19 in Korea Using Latent Dirichlet Allocation (LDA)

  • Heo, Seong-Min;Yang, Ji-Yeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.83-91
    • /
    • 2020
  • 본 연구에서는 DBpia에 등록된 코로나19 관련 논문을 대상으로 연구 토픽을 밝히고 연구 변화 추세를 검토한다. 잠재 디리슐레 할당(Latent Dirichlet Allocation) 알고리즘을 적용한 결과, 7개의 연구 토픽을 도출하였고, 각 토픽은 "International Dynamics", "Technology & Security", "Psychological Impact", "Biomedical-Related", "Economic Impact", "Online Education", "Religion-Related"에 관한 내용이었다. 또한 다범주 로짓모형을 사용하여 연구 토픽의 추세 변화를 살펴본 결과, 2020년 6월 전에는 국제적 역학관계 및 생물 의학 관련 논문이 주를 이루었다면, 이후에는 다양한 분야로 연구 주제가 확대되었다. 특히 경제적인 영향, 온라인 교육, 심리적인 영향에 관한 연구가 꾸준히 증가함을 확인할 수 있었다. 이러한 결과는 향후 코로나19 관련 공동 연구의 가이드 라인을 제시하고, 활발한 연구 활동을 위한 기초자료로 활용될 수 있을 것이다.

챗봇 데이터에 나타난 우울 담론의 범주와 특성의 이해 (Understanding the Categories and Characteristics of Depressive Moods in Chatbot Data)

  • 진효진;정찬이;백금희;차지영;최정회;차미영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권9호
    • /
    • pp.381-390
    • /
    • 2022
  • 자연어처리 기술과 비대면 문화의 확산과 더불어 챗봇의 사용 증가세가 가파르며, 챗봇의 용도 또한 일상 대화와 소비자 응대를 넘어서 정신건강을 위한 용도로 확장하고 있다. 챗봇은 익명성이 보장된다는 점에서 사용자들이 우울감에 관해 이야기하기 적합한 서비스이다. 그러나 사용자가 작성한 문장들을 분석해 우울 담론의 유형과 특성을 파악하는 연구들은 주로 소셜 네트워크 데이터를 대상으로 했다는 한계점이 존재하며, 실제 환경에서 사용되는 챗봇과 상호작용한 데이터를 분석한 연구는 찾아보기 힘들다. 이 연구에서는 챗봇-사람의 상호작용 데이터에서 무작위로 추출한 '우울'과 관련된 대화 데이터를 토픽 모델링 방법과 텍스트마이닝 기법으로 분석하여 채팅에서의 우울 관련 담론의 특성을 파악하였다. 또한, 챗봇에서 빈번히 나타나는 '우울' 담론의 범주와 트위터 '우울' 담론의 범주의 차이점을 비교하였다. 이를 통해 챗봇 데이터의 '우울' 대화만의 특징을 파악하고, 적절한 심리지원 정보를 제공하는 챗봇 서비스를 위한 시사점과 향후 연구 방향에 대해 논의한다.

디지털 마케팅 해외 연구 동향: SCOPUS DB를 중심으로 (The Trend of Digital Marketing Overseas Research: Focusing on SCOPUS DB)

  • 이기혁;강보현
    • 산업융합연구
    • /
    • 제20권11호
    • /
    • pp.11-17
    • /
    • 2022
  • 디지털 기술의 발달은 우리의 일상생활과 기업의 마케팅 환경에 많은 변화를 주고 있다. 이에 본 연구에서는 디지털 마케팅의 최근 해외 연구 동향을 파악하는데 있다. 이를 위해 외국 학술 데이터베이스인 SCOPUS를 활용하여 디지털 마케팅의 연구 동향을 파악하고자 한다. 분석결과, 디지털 마케팅 논문은 2013년 이후 지속적으로 증가를 하고 잇는 것으로 나타났다. 또한 토픽모델링 분석결과 총 6개의 주제중에서 2번과 4번 토픽이 유사한 것으로 나타났으며, 주요한 토픽으로는 digital, marketing, research 등으로 나타났다. 본 연구의 결과는 연구자와 기업의 실무자들에게 디지털 마케팅 연구동향에 대한 정보를 제공하였다는 점에서 의의를 가지고 있다. 또한 본 연구결과는 기업의 마케터들이 디지털 마케팅의 중요성을 인지하고 활용하는데 실무적인 시사점을 제공한다.

빅데이터를 활용한 젠트리피케이션 상권의 장소성 분류와 특성 분석 -서울시 14개 주요상권을 중심으로- (Classifying and Characterizing the Types of Gentrified Commercial Districts Based on Sense of Place Using Big Data: Focusing on 14 Districts in Seoul)

  • 김영재;박인권
    • 지역연구
    • /
    • 제39권1호
    • /
    • pp.3-20
    • /
    • 2023
  • 본 연구는 젠트리피케이션이 발생한 상권의 장소성을 파악하여 상권의 확장과 쇠퇴 속에서 장소성의 구체적인 모습을 유형화하고 유형별 특징을 분석하는 것을 목적으로 한다. 소셜 미디어를 통해 수집된 대용량 문서를 활용하여 위계적 군집분석을 시행하였으며, 지역별 장소성을 인지적 차원의 <경험>과 실재적 차원의 <상권특성>으로 구분하여 상권 군집별 특성을 확인하였다. 이를 위해 잠재 디리클레 할당(Latent Dirichlet Allocation: LDA) 토픽모델링 기법과 서울시 우리마을가게 상권분석서비스를 통해 수집된 상권별 매출액 통계자료를 활용하였다. 분석 결과 서울시 젠트리피케이션 상권은 고유한 특성을 가진 '연극 상권', '전통문화 상권', '여성 미용 상권', '고급음식점 및 의료서비스 상권', '트렌디 상권'으로 분류되는 것으로 나타났다. 연구의 결과를 바탕으로 보다 효율적이고 지역별 특색에 맞는 상업정책들을 시행할 수 있을 것으로 기대한다.

저궤도 위성통신 분야의 ICT 디지털 전환과 데이터 융합 생태계 조성을 위한 SNS 감성분석과 니드마이닝 (SNS Sentiment Analysis and Needmining for ICT Digital Transformation and Data Convergence Ecosystem Establishment in LEO Satellite Communications)

  • 이병희;김태현
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권12호
    • /
    • pp.347-356
    • /
    • 2023
  • 최근 우크라이나-러시아간 전쟁에서 저궤도 위성통신이 큰 진가를 발휘하였고, 우리나라도 2023년 5월 성공적인 누리호 발사로 저궤도 위성통신 서비스의 발판을 마련하고 본격적인 민간 우주시대 경쟁에 돌입하였다. 본 논문은 저궤도 위성통신 분야의 ICT 디지털 전환과 데이터 융합 생태계 조성을 위해 세계적인 SNS의 하나인 레딧에서 글을 가져와서 이용자의 감성분석을 수행하고, 이용자의 니즈를 파악하고자 니드마이닝을 통해 니즈 관련 문장을 추출하여 토픽모델링을 수행하여 토픽을 분류하고 이들 토픽에 따라 실행계획을 마련하고자 한다. 본 연구가 저궤도 위성통신 분야에서 새로운 비즈니스 모델의 개발과 혁신, 디지털 정보격차 해소 및 사회적 문제 해결, 지속 가능한 디지털 전환 및 소프트 파워 향상에 기여하는데 정책적 자료로 활용되기를 기대한다.

Classifying Social Media Users' Stance: Exploring Diverse Feature Sets Using Machine Learning Algorithms

  • Kashif Ayyub;Muhammad Wasif Nisar;Ehsan Ullah Munir;Muhammad Ramzan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.79-88
    • /
    • 2024
  • The use of the social media has become part of our daily life activities. The social web channels provide the content generation facility to its users who can share their views, opinions and experiences towards certain topics. The researchers are using the social media content for various research areas. Sentiment analysis, one of the most active research areas in last decade, is the process to extract reviews, opinions and sentiments of people. Sentiment analysis is applied in diverse sub-areas such as subjectivity analysis, polarity detection, and emotion detection. Stance classification has emerged as a new and interesting research area as it aims to determine whether the content writer is in favor, against or neutral towards the target topic or issue. Stance classification is significant as it has many research applications like rumor stance classifications, stance classification towards public forums, claim stance classification, neural attention stance classification, online debate stance classification, dialogic properties stance classification etc. This research study explores different feature sets such as lexical, sentiment-specific, dialog-based which have been extracted using the standard datasets in the relevant area. Supervised learning approaches of generative algorithms such as Naïve Bayes and discriminative machine learning algorithms such as Support Vector Machine, Naïve Bayes, Decision Tree and k-Nearest Neighbor have been applied and then ensemble-based algorithms like Random Forest and AdaBoost have been applied. The empirical based results have been evaluated using the standard performance measures of Accuracy, Precision, Recall, and F-measures.