• 제목/요약/키워드: Reddit

검색결과 12건 처리시간 0.025초

Age and Gender in Reddit Commenting and Success

  • Finlay, S. Craig
    • Journal of Information Science Theory and Practice
    • /
    • 제2권3호
    • /
    • pp.18-28
    • /
    • 2014
  • Reddit is a large user generated content (USG) website in which users form common interest groups and submit links to external content or text posts of user-created content. The web site operates on a voting system whereby registered users can assign positive or negative ratings to both submitted content and comments made to submitted content. While Reddit is a pseudonymous site, with users creating usernames but providing no biographical data, an informal survey posted to a large shared interest community yielded 734 responses including age and gender of users. This provided a large amount of contextual biographical data with which to analyse user profiles at the first level of Computer Mediated Discourse Analysis (CMDA), articulated by Susan Herring. The results indicate that older Reddit users both formulate more complex writing and enjoy more success when rated by other users. Gender data was incomplete and as such only tentative results could be proposed in that regard.

Reddit 소셜미디어를 활용한 ChatGPT에 대한 사용자의 감정 및 요구 분석 (Analysis of Users' Sentiments and Needs for ChatGPT through Social Media on Reddit)

  • 나혜인;이병희
    • 인터넷정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.79-92
    • /
    • 2024
  • ChatGPT는 생성형 인공지능(Generative AI) 기술을 활용한 대표적인 챗봇으로서 과학기술 영역뿐만 아니라 사회, 경제, 산업, 문화 등 당양한 분야에서 유용하게 활용되고 있다. 본 연구는 글로벌 소셜미디어 레딧(Reddit)을 활용해 ChatGPT에 대한 사용자의 감정과 요구에 대한 탐색적인 분석을 수행한다. 이를 위해, 2022년 12월부터 2023년 8월까지의 댓글 10,796건을 수집하여 키워드 분석, 감성 분석, 니드마이닝(Needmining) 기반 토픽모델링을 실시하였다. 분석 결과, ChatGPT에 대한 댓글에서 출현 빈도가 가장 높은 단어는 "time"으로 답변의 신속성, 시간 효율성, 생산성 향상을 강조한 것으로 나타났다. 사용자들은 ChatGPT에 대해 신뢰와 기대의 감정과 동시에 사회적 영향에 대한 두려움과 분노의 감정을 표현하였다. 또한, 토픽모델링 분석을 통해 잠재적 니즈(Needs)를 포함한 14개의 주제를 도출하였고, 사용자들이 특히 ChatGPT에 대한 교육적 활용과 사회적 영향에 많은 관심을 보였다. 또한, ChatGPT와 관련된 언어모델, 직업, 정보, 의료, 서비스, 게임, 규제, 에너지, 윤리적 문제 등 다양한 주제들이 논의된 것을 알 수 있었다. 분석 결과를 바탕으로 사용자들의 요구를 반영하여 향후 실행계획의 방향을 제시하였다. 본 연구는 향후 ChatGPT를 이용하여 제품과 서비스를 개선하고, 새로운 서비스 플랫폼 기획 단계에서 유용한 정보를 제공할 것으로 기대된다.

In the Log Cabin with My Favorite Player: Appreciating Traditional American Masculinity Through Homoerotic Language in Baseball Fandom

  • Shin, Hyerin;Jie, Sue Hyun
    • 미국학
    • /
    • 제42권1호
    • /
    • pp.133-159
    • /
    • 2019
  • On the website r/NYYankees, a sub-forum ("subreddit") of Reddit is devoted to the Major League Baseball team New York Yankees, with its predominantly male users showing their appreciation for baseball heroes by expressing erotic desires towards the players. When a player performs well, the subreddit is filled with admiration of desires to become the player's intimate lover-explicitly expressed by "male" fans. This paper explains the phenomenon of young male fans' desire for the now-lost model of traditional masculinity of domination and control, displayed in the context of baseball players' dominant performances. The discrepancy between a fan's non-homosexual real-world self and his homoerotic language on the subreddit is explained using the "performative fandom" theory, developed by Osborne and Coombs borrowing Butler's notion of performativity. This paper suggests how this desire for traditional masculinity serves as recognition to the collapse of masculinity in the modern American society.

토픽모델링을 활용한 한국과 미국의 산업수학 이슈 비교 (Comparison of Industrial Mathematics Issues between Korea and the US Using Topic Modeling)

  • 김성연
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.30-45
    • /
    • 2022
  • 본 연구에서는 텍스트마이닝을 활용해 한국과 미국의 온라인 뉴스와 포럼에서 산업수학과 관련한 이슈를 파악하고, 그 결과를 비교 분석하였다. 이를 위해 한국의 주요 포털 사이트인 네이버의 뉴스 기사, 클리앙의 게시글과 댓글, 그리고 미국의 New York Times와 CNN의 뉴스 기사, Reddit의 게시글과 댓글에서 산업수학과 관련한 텍스트 데이터를 수집하여 구조적 토픽모델링 분석을 수행하였다. 주요 분석결과는 다음과 같다. 첫째, 한국의 뉴스는 산업수학의 필요성과 정부의 지원 측면에 대해, 미국에서는 산업수학이 활용되는 다양한 분야에 대해 다루는 것으로 나타났다. 둘째, 한국에서는 온라인 뉴스와 포럼에서 각기 다른 주제로 동일한 개수의 이슈가 나타났지만, 미국에서는 온라인 포럼보다 뉴스 기사에서 더 많은 이슈를 다루고 있는 것으로 나타났다. 이를 토대로 한국에서 산업수학이 정착하는 데 있어 연구자들에게는 학술적, 그리고 정부에는 실무적 시사점을 제시하였다.

SNS 여론과 주가지수의 상관관계 분석 (Correlation Analysis Between Online Public Opinion and Stock Price)

  • 김현지;오성주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.394-395
    • /
    • 2023
  • "이성적이며 이상적인 합리적 인간"을 가정하는 기존 경제학의 이론이 항상 실제 상황과 일치하지는 않는 것으로 알려져 있다. 이의 대안으로 나온 행동경제학은, 인간의 경제적 의사결정에 심리, 인지, 감정, 사회문화적 배경 등이 영향을 미친다고 본다. 본 연구에서는 행동경제학에 의거하여, 개인의 감정과 경험이 경제적 의사결정에 영향을 미치는지 여부를 빅데이터 모델을 활용하여 분석하였다. SNS 여론으로는 Reddit, 주가지수로는 S&P 500 을 선정하였다. 수집한 텍스트 데이터를 전처리와 감정분석을 통해 독립변수 값으로 사용했고, 주가지수 등락의 방향성을 종속변수로 사용하여 로지스틱 모형을 구성했다. 모델을 활용하여 분석한 결과 Public sentiment 와 Market sentiment 간 양의 상관관계를 확인할 수 있었다. 또한, lag 를 설정하는 모델이 정확도가 더욱 높음을 확인해, 기존 경제학의 EMH 와 대립되는 바를 확인할 수 있었다. 하지만 최적의 lag 산정을 위해, 더 광범위한 데이터를 바탕으로 한 후속연구가 필요하다.

트랜스포머 기반 MBTI 성격 유형 분류 연구 : 소셜 네트워크 서비스 데이터를 중심으로 (Research on Transformer-Based Approaches for MBTI Classification Using Social Network Service Data)

  • 정재준;임희석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.529-532
    • /
    • 2023
  • 본 논문은 소셜 네트워크 이용자의 텍스트 데이터를 대상으로, 트랜스포머 계열의 언어모델을 전이학습해 이용자의 MBTI 성격 유형을 분류한 국내 첫 연구이다. Kaggle MBTI Dataset을 대상으로 RoBERTa Distill, DeBERTa-V3 등의 사전 학습모델로 전이학습을 해, MBTI E/I, N/S, T/F, J/P 네 유형에 대한 분류의 평균 정확도는 87.9181, 평균 F-1 Score는 87.58를 도출했다. 해외 연구의 State-of-the-art보다 네 유형에 대한 F1-Score 표준편차를 50.1% 낮춰, 유형별 더 고른 분류 성과를 보였다. 또, Twitter, Reddit과 같은 글로벌 소셜 네트워크 서비스의 텍스트 데이터를 추가로 분류, 트랜스포머 기반의 MBTI 분류 방법론을 확장했다.

  • PDF

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.

소셜미디어 분석을 통한 전고체 배터리 감성분석과 이슈 탐색 (Sentiment Analysis and Issue Mining on All-Solid-State Battery Using Social Media Data)

  • 이지연;이병희
    • 한국콘텐츠학회논문지
    • /
    • 제22권10호
    • /
    • pp.11-21
    • /
    • 2022
  • 전고체 배터리는 차세대 배터리의 유력 후보 중 하나로 특히 미래 전기차 산업을 이끌 핵심 부품으로 주목받고 있다. 본 연구에서는 글로벌 소셜미디어인 레딧(Reddit)의 전고체 배터리 관련 댓글 10,280건을 분석하여 전고체 배터리와 관련된 정책 이슈 및 대중의 관심사를 파악한다. 수집된 글로벌 데이터에 빈도분석, 연관규칙분석, 토픽모델링 등 텍스트마이닝 기법과 감성분석을 적용하여 세계적 동향을 읽고, 이를 우리 정부의 전고체 배터리 발전전략과 비교 및 관련 국가R&D의 정책적 방향을 제시하고자 한다. 분석 결과, 2016년부터 2021년까지의 전고체 배터리 이슈에 대한 전반적인 감성은 긍정이 50.5%, 부정이 39.5%로 긍정인 것으로 나타났다. 또한 세부 감성을 분석한 결과, 대중들은 전고체 배터리에 대해 신뢰와 기대를 가지고 있음과 동시에 해결되지 않은 기술적 문제들에 대한 두려움과 우려의 감정이 공존함을 알 수 있었다. 본 연구에서는 전고체 배터리와 관련된 핵심 이슈 도출을 위한 텍스트마이닝 분석 방법을 적용하였고, 정부 정책 분석을 바탕으로 한 하향식 접근방법과 대중의 인식을 분석하는 상향식 접근방법을 수용하여, 보다 포괄적인 동향 분석 방법을 제시하였다.

Social Media Mining Toolkit (SMMT)

  • Tekumalla, Ramya;Banda, Juan M.
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.16.1-16.5
    • /
    • 2020
  • There has been a dramatic increase in the popularity of utilizing social media data for research purposes within the biomedical community. In PubMed alone, there have been nearly 2,500 publication entries since 2014 that deal with analyzing social media data from Twitter and Reddit. However, the vast majority of those works do not share their code or data for replicating their studies. With minimal exceptions, the few that do, place the burden on the researcher to figure out how to fetch the data, how to best format their data, and how to create automatic and manual annotations on the acquired data. In order to address this pressing issue, we introduce the Social Media Mining Toolkit (SMMT), a suite of tools aimed to encapsulate the cumbersome details of acquiring, preprocessing, annotating and standardizing social media data. The purpose of our toolkit is for researchers to focus on answering research questions, and not the technical aspects of using social media data. By using a standard toolkit, researchers will be able to acquire, use, and release data in a consistent way that is transparent for everybody using the toolkit, hence, simplifying research reproducibility and accessibility in the social media domain.

국가R&D와 소셜 데이터를 활용한 수소연료전지 기술마이닝과 감성분석 (Technology Mining and Sentiment Analysis on Hydrogen Fuel Cell Using National R&D and Social Data)

  • 이병희;최정우;김태현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.341-343
    • /
    • 2022
  • 온실가스 배출 문제가 세계적인 현안으로 부각되면서 수소를 에너지원으로 사용하는 수소경제가 주목받고 있다. 수소연료전지는 수소경제의 구성요소 중 하나로, 수소를 활용해 열과 전기를 생산하며 에너지 변환 효율이 높이는데 장점이 있다. 본 연구는 세계적인 온라인 커뮤니티인 레딧(Reddit)에서 수집한 수소연료전지와 관련된 소셜 데이터를 텍스트마이닝과 감성분석 기법으로 분석하였다. 분석 결과 9,211건의 댓글을 LDA(Latent Dirichlet Allocation)을 이용해 4개의 토픽 그룹으로 분류할 수 있었다. 이 중 수소연료전지와 관련이 높은 그룹을 선정해 STM(Structural Topic Model) 분석으로 10개 토픽을 추출하였고, 기후 환경, 수소 산업, 수소 차와 관련 있는 토픽 3개를 발견할 수 있었다. 이 연구 결과를 통해 수소연료전지의 세계적으로 실제적인 내용을 빠르고 효과적으로 파악하여 수소연료전지에 대한 예측하고, 우리나라의 수소연료전지 관련 국가R&D의 정책적 방향을 제시하고자 한다.