• 제목/요약/키워드: 소셜 데이터 분석

검색결과 740건 처리시간 0.029초

소셜미디어를 통한 직원의 기업전망 평가와 고용증가와의 상관성 : 잡플래닛 기업전망을 대상으로 (Employee's Business Outlook Disclosed Through Social Media And Employment Growth : The Case of Jobplanet)

  • 김병수;강주영
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.9-21
    • /
    • 2022
  • 최근 소셜미디어의 사용 확대는 사회, 경제, 정치, 문화 등 여러 방면에서 이용자들의 의견을 실시간으로 표현할 수 있는 계기가 되었고, 기업에 관한 다양한 정보를 제공하는 플랫폼들이 많이 늘어났다. 그중에서 2008년 미국에서 시작된 글래스도어(Glassdoor.com)는 기업의 전현직 직원이 자신이 근무한 기업의 처우를 평가하고 기업의 성장성에 관한 전망을 제공하고 있다. 이러한 플랫폼은 취업 또는 이직하려는 구직자에 필요한 정보를 제공하는 효용성이 있다. 이 외에도 여러 연구에서 이러한 플랫폼을 통해 제공되는 기업의 정보가 투자자에게도 유용하다는 점이 밝혀지고 있다. 본 연구에서는 국내에서 글래스도어와 대표적으로 유사한 기능을 하는 플랫폼인 잡플래닛(Jobplanet)에서 제공되는 직원들의 기업성장 전망이 실재 기업성장을 예측하는 예측력이 있는지 파악하였다. 잡플래닛에서 제공되는 전망과 에프앤가이드에서 받은 기업의 재무지표 데이터를 취합하여 패널데이터로 구성한 뒤 고정효과 모형 회귀분석을 이용하여 분석하였다. 그 결과 긍정적인 전망을 받은 회사가 부정적인 전망을 받은 회사보다 고용증가율이 더 높은 것으로 나타났다. 전망이 중립인 경우에도 전망이 부정적인 회사보다 고용증가율이 더 높은 것으로 나타났다.

국가 정책에 대한 언론과 SNS 반응의 감성 분석 연구 -아동 수당, 출산 장려금 정책을 중심으로- (A Study on Sentiment Analysis of Media and SNS response to National Policy: focusing on policy of Child allowance, Childbirth grant)

  • 윤혜민;최은정
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.195-200
    • /
    • 2019
  • 스마트폰, 태블릿 등의 이동 통신 기기와 PC 이용이 확장됨에 따라 인터넷 상에서 데이터가 기하급수적으로 수집되고 있다. 또한 SNS의 발전으로 인해 이용자 간의 자유로운 의사소통과 여러 분야의 정보를 공유할 수 있어 다양한 다량의 의견들이 빅데이터 형태로 쌓이고 있다. 이에 따라 빅데이터 분석 기법을 사용하여 일반 사람들의 반응과 언론사의 뉴스 기사 반응의 차이를 알아보는 기법이 대두되고 있다. 본 논문에서는 아동 수당과 출산 장려금에 대해 SNS에서 나타난 대중들의 반응과 언론사의 반응을 분석하였다. 이를 위해 일정 기간 동안 트위터에 올라온 이용자들의 글을 수집하고 뉴스 기사를 크롤링하여 감성 분석을 진행하였다. 이를 통해 SNS에 나타나는 대중의 의견과 언론사 뉴스의 반응을 비교하여 대중과 언론이 국가 정책에 대한 반응의 차이를 비교 분석하였다.

루씬을 이용한 빅데이터 인덱싱 및 검색시스템의 설계 및 구현 (A Design and Development of Big Data Indexing and Search System using Lucene)

  • 김동민;최진우;우종우
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.107-115
    • /
    • 2014
  • 최근 소셜 미디어 사용의 증가, 산업간 융합의 확대, 다양한 스마트 기기의 보급을 통한 인터넷의 이용이 증가하면서 수많은 데이터를 발생시키고 있다. 이들 데이터들은 크기가 매우 크고, 형식이 다양하며, 순환속도가 매우 빨라 기존의 데이터 처리기술만으로는 관리와 분석이 어려운 실정이다. 즉, 수십 테라에 이르는 데이터의 폭증 및 데이터의 다양화에 따라 빠르게 분석하는 기술이 미흡하며, 이러한 문제점들을 해결하기 위한 새로운 기술적 방안이 절실히 요구되고 있다. 이러한 빅데이터의 처리기술에 대한 많은 연구가 최근 활성화 되고 있으며, 본 연구에서는 이러한 관점에서 빅데이터 플랫폼의 효과적인 인덱싱 엔진의 설계 및 구현에 관하여 기술한다. 즉, 기존의 데이터 처리기술의 범위를 초과하는 대규모의 데이터 집합을 효율적으로 관리하고, 인덱싱을 통한 검색속도의 향상으로 데이터 분석 시 소요되는 시간 단축을 연구목표로 한다. 본 연구의 실험을 위해서는 대규모 SNMP(Simple Network Management Prtocool) 로그 데이터를 사용하였으며, 효율적 데이터의 인덱싱을 통한 빠른 검색으로 데이터 분석시의 시간을 최대한 단축하고자 하였다. 또한 분석된 데이터의 표현의 가시화를 통하여 사용자의 데이터 분석에도 도움이 될 것으로 기대한다.

하이퍼엣지 예측 작업에서 네거티브 샘플링 기술의 성능 분석 (Performance Evaluation of Negative Sampling Methods in a Hyperedge Prediction Task)

  • 이다은;유송경;고윤용;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.527-530
    • /
    • 2024
  • 하이퍼그래프(hypergraph)는 실세계의 여러 객체가 함께 형성하는 복잡한 그룹 관계를 하이퍼엣지(hyperedge)로 정보 손실 없이 모델링할 수 있는 새로운 데이터 구조이다. 하이퍼엣지 예측(hyperedge prediction task)이란 하이퍼그래프로 표현된 실세계 네트워크에서 아직 관찰되지 않은 그룹관계 혹은 미래에 발생할 가능성이 높은 관계를 예측하는 것으로, 단백질 상호작용 분석(PPI), 추천시스템, 소셜 네트워크 분석 등 다양한 응용 분야에서 활용된다. 그러나, 하이퍼엣지 예측은 심각한 데이터 희소성 문제로 정확한 예측이 어렵다는 근본적인 한계를 지닌다. 이러한 한계를 완화하기 위해 다양한 네거티브 샘플링(negative sampling) 기술이 활용될 수 있는데, 아직까지 각 샘플링 기술이 하이퍼엣지 예측 정확도에 미치는 효과에 대해 충분히 연구되지 않았다. 본 논문에서는 하이퍼엣지 예측에 활용되는 다양한 네거티브 샘플링 방법의 효과를 분석한다. 실험 결과를 통해, 네거티브 샘플링 기법과 포지티브와 네거티브 하이퍼엣지 수의 비율에 따른 정확도 변화 양상을 분석한다.

빅 데이터 기반 호텔고객 평판 분석에 관한 연구 (A Study on Hotel Customer Reputation Analysis based on Big Data)

  • 공효순;송은지
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권2호
    • /
    • pp.219-225
    • /
    • 2014
  • 현대는 기업 간의 경쟁이 날로 심화되어 가고 있는 가운데 효율적인 경영을 위해서는 시시각각으로 변하는 고객의 니즈를 파악하여야 하기 때문에 그 어느 때 보다도 고객피드백이 필요한 시대이다. 최근 스마트 폰의 출현과 트위터, 페이스북과 같은 SNS의 발달로 실시간으로 다양한 고객의 목소리가 증가하면서 고객의 피드백을 파악하기 위해 이러한 빅 데이터를 이용 하는 것이 매우 효율적인 방법으로 부상하고 있다. 빅 데이터의 데이터 수집과 분석은 버즈(Buzz) 모니터링이라는 시스템을 통해 이루어지고 있다. 본 연구에서는 고객자체가 기업의 자산이며 서비스 산업의 대표라 할 수 있는 호텔기업의 CRM을 위한 방법으로 고객의 피드백을 파악하기 위해 빅 데이터를 활용하는 방법을 제안한다. 실제 국내 3개의 대표적인 특급호텔을 대상으로 빅 데이터를 이용하여 버즈모니터링 시스템을 통해 얻은 호텔고객평판 사례를 제시하여 그 결과를 분석하고 시사점을 고찰해 본다.

준지도학습을 통한 세부감성 어휘 구축 (Fine-grained Sentiment Lexicon Construction via Semi-supervised Learning)

  • 조요한;오효정;이충희;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-38
    • /
    • 2013
  • 소셜미디어를 통한 여론분석과 브랜드 모니터링에 대한 요구가 증가하면서, 빅데이터로부터 감성을 분석하는 기술에 대한 필요가 늘고 있다. 이를 위해, 본 논문에서는 단순 긍/부정 감성이 아닌 20종류의 세분화된 감성을 분석하기 위한 감성어휘 구축 알고리즘을 제시한다. 감성어휘 구축을 위해서는 준지도학습을 사용하였으며, 도메인에 특화되지 않은 일반 감성어휘를 구축하도록 학습되었다. 학습된 감성어휘를 인물, 스마트기기, 정책 등 다양한 도메인의 트위터 데이터에 적용하여 세부감성을 분석한 결과, 알고리즘의 특성상 재현율이 낮다는 한계를 가지고 있었으나, 대부분의 감성에 대해 높은 정확도를 지닌 감성어휘를 구축할 수 있었고, 감성을 직간접적으로 나타내는 표현들을 학습할 수 있었다.

  • PDF

BERT 언어 모델을 이용한 감정 분석 시스템 (Sentiment Analysis System by Using BERT Language Model)

  • 김택현;조단비;이현영;원혜진;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.975-977
    • /
    • 2020
  • 감정 분석은 문서의 주관적인 감정, 의견, 기분을 파악하기 위한 방법으로 소셜 미디어, 온라인 리뷰 등 다양한 분야에서 활용된다. 문서 내 텍스트가 나타내는 단어와 문맥을 기반으로 감정 수치를 계산하여 긍정 또는 부정 감정을 결정한다. 2015년에 구축된 네이버 영화평 데이터 20 만개에 12 만개를 추가 구축하여 감정 분석 연구를 진행하였으며 언어 모델로는 최근 자연어처리 분야에서 높은 성능을 보여주는 BERT 모델을 이용하였다. 감정 분석 기법으로는 LSTM(Long Short-Term Memory) 등 기존의 기계학습 기법과 구글의 다국어 BERT 모델, 그리고 KoBERT 모델을 이용하여 감정 분석의 성능을 비교하였으며, KoBERT 모델이 89.90%로 가장 높은 성능을 보여주었다.

지능형 학습 시스템을 위한 메타데이터 모형 분석 및 설계 연구 (A Study on Analysis and Design of Metadata Model for Intelligent e-Learning System)

  • 장진철;홍성용;이문용
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2011년도 동계학술대회
    • /
    • pp.211-217
    • /
    • 2011
  • 소셜 네트워크 서비스의 부각과 다매체 환경에서의 사용자 참여 확대와 같은 최근 IT 기술 환경의 변화로 이러닝 시스템 역시 다양한 환경에서 변화하고 있다. 메타데이터는 시스템 간의 상호운용성을 위한 데이터의 규약이며, 이러닝 메타데이터는 국내외 기판에 의해 표준화가 이루어지고 있으나, 주변 환경의 다양한 변화를 고려하는 메타데이터 요소의 제안이 요구되는 상황이다. 본 논문에서는 지능형 학습 시스템을 위한 메타데이터 모형을 분석 및 설계하는 방법을 연구 제안하고, 표준 메타데이터인 KEM 3.0을 기반으로 향후 필요할 것으로 예상되는 메타데이터 요소의 요구사항을 도출하였다. 도출된 요구사항을 바탕으로 요구사항을 중요도에 따라 분류할 수 있는 카노 모형에 따라 3-Layer 모델로 설계하였다. 향후 본 논문의 모형 설계를 기반으로 이러닝 기술 환경의 변화를 반영한 지능형 학습 시스템을 개발하여 국제적 표준화로 발전되기를 기대한다.

  • PDF

텍스트 마이닝 기반의 이슈 관련 R&D 키워드 패키징 방법론 (Methodology for Issue-related R&D Keywords Packaging Using Text Mining)

  • 현윤진;윌리엄;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.57-66
    • /
    • 2015
  • 빅데이터 기술에 대한 관심이 급증함에 따라, 소셜 미디어를 통해 유통되는 방대한 양의 비정형 데이터를 분석하고자 하는 시도가 활발히 이루어지고 있다. 이에 따라서 텍스트 형태의 비정형 데이터 분석을 통해 의미 있는 정보를 찾고자 하는 시도가 비즈니스 영역뿐 아니라, 정치, 경제, 문화 등 다양한 영역에서 이루어지고 있다. 특히 최근에는 여러 현안 및 이슈들을 발굴하여 이를 의사결정에 활용하고자 하는 시도가 활발히 이루어지고 있다. 이처럼 빅데이터 분석을 통해 국가현안이나 이슈를 발굴하고자 하는 시도가 꾸준히 이루어져왔음에도 불구하고, 국가현안 및 이슈로부터 이와 관련된 R&D 문서를 효율적으로 제공하는 방안은 마련되지 않고있다. 이는 사용자들이 인식하는 현안 키워드와 실제 사용되는 R&D 키워드 사이의 이질성이 존재하기 때문이다. 따라서 현안 및 R&D키워드간의 이질성을 극복하기 위한 중간 장치가 필요하며, 이 중간 장치를 통해 각 현안 키워드와 R&D 키워드간에 적절한 대응이 이루어져야 한다. 이를 위해 본 연구에서는 (1) 현안 키워드 추출을 위한 하이브리드 방법론, (2) 현안 대응 R&D 정보 패키징 방법론, 그리고 (3) R&D 관점에서의 연관 현안 네트워크 구축 방법론의 총 세 가지 방법론을 제안한다. 제안하는 방법론은 텍스트 마이닝, 소셜네트워크 분석, 그리고 연관 규칙 마이닝 등의 데이터 분석 기법들을 활용하여 수행하였으며, 그 결과, (1)에 의한 키워드 보강률은 42.8%로 나타났으며, (2)의 경우, 현안 키워드와 R&D 키워드간 다수의 연관 규칙이 나타났다. (3)의 경우는 현재 진행 중에 있으며, 향후 가시적 성과를 낼 수 있을 것으로 예상된다.

소셜미디어 어낼리틱스 기반 서비스품질 평가: 항공산업을 중심으로 (Service Quality Evaluation based on Social Media Analytics: Focused on Airline Industry)

  • 한명기;최병구
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.157-181
    • /
    • 2022
  • 항공산업의 경쟁이 치열해짐에 따라 효과적인 항공사 서비스 품질 측정은 주요 과제 중 하나가 되었다. 특히 빅데이터 어낼리틱스가 새로운 연구 패러다임으로 각광받게 됨에 따라 소비자가 직접 작성한 온라인 리뷰 분석을 통한 항공사 서비스 품질 측정 연구들이 새롭게 시도되고 있다. 그러나 이러한 연구들은 리뷰 제목을 분석에 활용하지 않았다는 점, 학습 데이터 셋 구축을 위한 레이블링(labeling)에 있어 사람의 개입이 많이 요구되는 지도 학습(supervised learning)에 의존한다는 점, 서비스 품질 차원 분류에 있어 항공사 특성을 고려하지 못한다는 점 등이 문제로 지적되고 있다. 기존 연구의 한계를 극복하기 위해 본 연구에서는 제목과 본문을 포함한 온라인 리뷰 전체를 자가학습(self-training)과 감성 분석을 활용해 AIRQUAL 서비스 품질 차원으로 분류함으로써 객관적이고 정교한 서비스 품질측정을 시도하였으며 이를 기반으로 서비스 품질 차원이 서비스 만족도에 미치는 영향을 파악하였다. 분석 결과 온라인 리뷰로부터 AIRQUAL의 다섯 가지 서비스 품질 차원을 효과적으로 추출할 수 있었으며 각 서비스 품질 차원은 모두 서비스 만족도에 유의한 영향을 미치는 것으로 나타났다. 나아가 리뷰 제목이 서비스 만족도에 미치는 영향 또한 유의한 것으로 파악되었다. 본 연구는 항공산업의 특성을 반영한 서비스 품질 차원 측정 및 이의 효과에 대한 분석이라는 측면에서 학문 및 실무적 의의가 있다.