• 제목/요약/키워드: Social Analytics

검색결과 126건 처리시간 0.022초

텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법론 (Mapping Categories of Heterogeneous Sources Using Text Analytics)

  • 김다솜;김남규
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.193-215
    • /
    • 2016
  • 최근 다양한 소셜 네트워크 서비스의 증가로 인해 사용자들은 각자의 목적 및 취향에 따라 여러 매체를 동시에 이용하는 경향을 보이고 있다. 또한 특정 주제에 대한 정보를 수집할 때에도 소셜 네트워크 서비스, 인터넷 뉴스, 블로그 등 여러 매체를 동시에 활용하는 것이 일반적이다. 하지만 다양한 매체를 통해 유통되는 문서들은 서로 유사한 주제, 심지어는 동일한 내용을 다루더라도 각 매체 별 정책 및 기준에 따라 각기 다른 카테고리로 관리되고 있으며, 이는 이종 매체를 아우르는 범위에서 특정 카테고리에 대한 탐색을 수행하고자 하는 시도에 걸림돌로 작용하고 있다. 이러한 제약을 극복하기 위해, 본 연구에서는 기존 매체 고유의 카테고리 체계는 그대로 유지하면서 이종 매체 간 카테고리 매핑을 수행하는 방법을 제시한다. 즉, 개별 문서를 다양한 매체의 관점에서 재분류하고 이러한 결과를 문서에 2차원 레이블로 저장함으로써, 이종 매체에 속한 다양한 문서들을 마치한 매체에 속한 것과 같이 동일한 카테고리 기준으로 탐색할 수 있는 논리적 장치를 제안한다. 본 논문에서는 국내 인터넷 뉴스 포털 사이트 두 곳의 뉴스 기사 6,000건에 대해 제안 방법론을 적용한 실험을 통해 각 기사에 매체와 카테고리 정보로 구성된 2차원 레이블을 부여하였으며, 매체 간, 지도 학습과 준지도 학습 간, 동질 학습 데이터와 이질학습 데이터 간의 정확도 비교 실험을 수행하였다. 특히 매우 흥미롭게도, 일부 카테고리에서 이질 학습 데이터를 사용한 준지도 학습의 분류 정확도가 지도 학습 및 동질 학습 데이터를 사용한 준지도 학습의 분류 정확도보다 높게 나타나는 현상을 발견하였다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

How Did the COVID-19 Pandemic Affect Mobility, Land Use, and Destination Selection? Lesson from Seoul, Korea

  • Lee, Jiwon;Gim, Tae-Hyoung Tommy;Park, Yunmi;Chung, Hyung-Chul;Handayani, Wiwandari;Lee, Hee-Chung;Yoon, Dong Keun;Pai, Jen Te
    • 토지주택연구
    • /
    • 제14권4호
    • /
    • pp.77-93
    • /
    • 2023
  • COVID-19 팬데믹은 정부의 예방 및 통제 조치, 사람들의 위험 인식의 변화, 그리고 생활 방식의 변화를 통해 상당한 사회적 변화를 가져왔다. 특히, 정부의 방역정책과 도시공간의 잠재적 감염 위험에 대한 우려는 교통수단과 도시공간에 대한 선호를 크게 변화시켰다. 이러한 변화는 COVID-19 팬데믹이후에도 도시 공간에 지속적인 영향을 미치거나 새로운 형태로 변화할 수 있다. 따라서 본 연구는 코로나19 범유행에 따른 도시민의 이동수단 선호와 도시공간 이용 변화를 분석하여 도시공간이 현재와 미래의 감염병에 적응할 수 있는 회복탄력성과 잠재력을 탐색하고자 한다. 본 고는 이동 수단과 도시 공간에 대한 전반적인 선호도가 팬데믹 이전, 팬데믹 중, 팬데믹 종료에 따라 유의미하게 차이가 있다는 것을 확인하였다. 팬데믹 기간 동안 안전하다고 인식되는 개인 소유 차량과 녹지 공간을 제외하고는 전반적인 이동수단과 도시 공간에 대한 선호도가 감소하였다. 특히, 이동수단과 도시 공간에 대한 유행 중 선호도는 팬데믹 전에 비해 5배 가량 낮게 나타났다. 팬데믹 당시 긍정적으로 인식되었던 녹지 공간과 의료시설이 팬데믹 이전 선호도 수준으로 돌아올 것으로 예상되나, 다른 도시 공간 요소들은 뉴노멀을 맞이한 것으로 보인다. 본 결과는 코로나19 팬데믹이 도시민의 이동 수단과 도시 공간 선호에 큰 영향을 미쳤음을 시사한다.

직원을 위한 내부마케팅이 기업의 시가 총액 변동률에 미치는 영향 분석: 잡플래닛 기업 리뷰를 중심으로 (An Analysis of the Internal Marketing Impact on the Market Capitalization Fluctuation Rate based on the Online Company Reviews from Jobplanet)

  • 최기철;이상용
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.39-62
    • /
    • 2018
  • 컴퓨터 연산능력의 향상과 데이터를 수집하고 가공해 분석이 가능하도록 데이터를 정형화 시키는 기술이 발달함에 따라, 소셜미디어 및 인터넷 공간에서 생산되는 다양한 텍스트 데이터를 수집하고 그것을 분석하는 시도가 늘고 있다. 본 연구는 이와 같은 기술의 발전과 새롭게 시도되고 있는 분석법을 활용해 텍스트 데이터를 분석하여 과거에 설문조사 방법을 통해 확인했던 "내부마케팅"의 효과를 기존과는 다른 방식으로 확인해 보고자 하였다. 이와 같은 분석을 위해, 전/현직자들이 해당 기업의 구직자들에게 기업의 리뷰를 제공하는 플랫폼 잡플래닛(www.jobplanet.co.kr)의 리뷰 데이터를 웹크롤러를 생성하여 약 4만 건을 수집하였다. 또한 수집된 비정형 데이터를 정형화하기 위한 형태소 분석을 진행하여 명사만을 추출한 후, 미리 생성해 놓은 단어주머니에 들어있는 단어와 같을 경우 그 숫자를 세어 분류화를 진행하였다. 분류화된 내부마케팅 영역별 단어 수의 변화를 독립변수로, 시가총액 변동률을 종속변수로 활용하여, 내부마케팅과 시가총액간의 관계를 확인하고자 하였다. 그 결과, 대부분의 기존 연구와는 다르게 내부마케팅의 효과는 제한적인 영역에서만 기업의 성과에 긍정적인 영향을 미치며 대부분의 환경에서는 음의 영향을 미치는 것으로 나타났다. 산업군으로 나누었을 때, 제조업에서는 여성지원과 교육 훈련 부문에서 기업성과에 긍정의 영향을 미치는 것으로 나타났으나, 유통업에서는 직원 복지, 일-가정 양립 그리고 바이오/제약 업종에서는 직원 복지, 일-가정 양립, 사내 커뮤니케이션 그리고 보상 부문에서 모두 기업성과에 음의 영향을 미치는 것으로 나타났다. 또한 기업의 규모가 크고 역사가 오래된 기업에서는 직원 복지가 기업성과에 악영향을 미치는 것으로 나타났으나, 교육 훈련 부문에서는 종속변수에 긍정적 영향을 미치는 것을 확인할 수 있었으며, 기업의 규모가 작고 역사가 짧은 기업에서는 직원 복지, 사내 커뮤니케이션 그리고 일-가정 양립에서 종속변수와 음의 관계를, 여성지원 에서는 종속변수와 양의 관계를 갖는 것으로 나타났다. 본 연구는 이러한 결과들을 분석하여 이론적 의미뿐만 아니라, 실무적 함의를 제시하고자 하였다.

기업의 SNS 마케팅 활동이 이용자 행동에 미치는 영향: 페이스북 팬페이지 애널리틱스를 중심으로 (The Effect of Corporate SNS Marketing on User Behavior: Focusing on Facebook Fan Page Analytics)

  • 전형준;서봉군;박도형
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.75-95
    • /
    • 2020
  • 소셜네트워크서비스(SNS)의 성장과 함께 다양한 형태의 SNS가 등장했다. 상호작용성, 정보 교류, 엔터테인먼트 등 다양한 이용 동기를 바탕으로 SNS 이용자 또한 빠르게 증가하는 추세이다. 그중 페이스북은 대표하는 SNS 채널로서 기업에서도 페이스북 페이지를 활용해 홍보 채널로 활용하기 시작했다. 이를 위해 운영 초기, 기업은 팬 수 확보에 나섰고 그 결과 최근 기업 페이스북 팬 수는 많게는 수백만에 이를 정도로 늘어났다. 기업의 목표는 팬 수 확보를 넘어 콘텐츠를 통해 고객에게 기업 브랜드 이미지를 재고하고, 나아가 소통하는 수단으로 활용하고 있다. 이를 평가하는 주요 수치가 바로 본 연구의 종속변수에 해당하는 페이스북의 '좋아요', '댓글', '공유', '클릭 수' 등이다. 해당 수치 달성을 위해 콘텐츠 제작에 대한 고민이 선행되어야 하는데, 본 연구에서는 콘텐츠 제작 고려 사항을 3가지로 나눠 독립변수를 구성하였다. 콘텐츠 소재, 콘텐츠 구조, 메시지 스타일 등이 페이스북의 이용자 행동에 미치는 영향을 회귀분석을 이용해 분석하였다. 종속변수의 경우, 콘텐츠상에 모든 이용자의 행동 '전체 클릭 수'로 설정하였다. 본 연구에서는 각 독립 변수를 기존 연구 문헌을 통해 정의하고, 종속변수에 미치는 영향을 분석하였는데, '전체 클릭 수'의 경우, '자사연관', '실생활 관여도', '격식 x 관여도' 등의 변수가 유의미한 영향을 갖는 것으로 나타났다. 연구 결과를 통해, 콘텐츠 목적에 따른 최적화된 콘텐츠 전략을 제시함으로써, 기업 페이스북 운영자와 콘텐츠 제작자의 운영, 제작 전략에 기여할 수 있을 것으로 보인다.

뉴스기사를 이용한 소비자의 경기심리지수 생성 (Construction of Consumer Confidence index based on Sentiment analysis using News articles)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.1-27
    • /
    • 2017
  • 경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.