• 제목/요약/키워드: Social Analytics

검색결과 124건 처리시간 0.023초

실업률 예측을 위한 인터넷 검색 정보의 활용 (Application of Web Query Information for Forecasting Korean Unemployment Rate)

  • 권치명;황성원;정재운
    • 한국시뮬레이션학회논문지
    • /
    • 제24권2호
    • /
    • pp.31-39
    • /
    • 2015
  • 실업은 개인의 경제적 활동뿐 아니라 사회적 문제와 관련되어 있기 때문에 많은 국가들은 실업률을 낮추기 위해 다양한 정책을 추진하고 있다. 기존의 실업 실태 조사 방식에서는 조사시간 지연으로 인해 실업률 자료 확보에 많은 시간이 소요된다. 시의 적절한 실업 정책을 개발하기 위해서는 신속하고 정확한 실업 예측 관련 자료를 확보하는 것이 중요한 문제이다. 이러한 문제를 개선하기 위해 최근에 인터넷 검색 정보를 활용한 분석 기법이 제안되고 있다. 본 연구는 우리나라의 실업률을 예측하는데 인터넷 검색 정보가 어떤 영향을 미치는가를 조사하였다. 선택한 검색어 중에서 '실업급여' 검색어의 트렌드는 실업률과 상당히 높은 상관관계를 보여 주었다. 본 연구는 네이버 트렌드에서 제공하는 인터넷 검색어 정보를 시계열 자료의 분석에 널리 사용되는 ARIMA 모형에 추가하여 검색 정보의 활용이 실업률 예측력에 미치는 영향을 분석하였다. 예측모형의 선택 기준으로 제시되는 예측치의 평균 제곱 오차와 예측 오차 측면에서 실업 관련 인터넷 검색어를 활용한 모형이 그렇지 않은 모형보다 우수한 것으로 나타났다. 이러한 결과는 실업률 예측에 있어서 검색 정보의 활용 가능성을 제시하고 있으며 향후 더 많은 연구가 필요할 것으로 판단된다.

빅데이터 분석을 위한 한국어 SentiWordNet 개발 방안 연구 : 분노 감정을 중심으로 (The Study of Developing Korean SentiWordNet for Big Data Analytics : Focusing on Anger Emotion)

  • 최석재;권오병
    • 한국전자거래학회지
    • /
    • 제19권4호
    • /
    • pp.1-19
    • /
    • 2014
  • 빅데이터 내에 존재하는 감정 정보를 추출하여 사용자들이 특정 대상에 대하여 갖고 있는 인식이 어떠한지를 파악하고자 하는 노력이 활발히 이루어지고 있다. 상품, 영화, 그리고 사회적 이슈 등에 대한 문장을 분석하여 사람들이 해당 주제에 어떠한 견해를 가지고 있는지를 분석하고 측정하여 구체적인 선호도를 알아내는 것이다. 문장에서 드러나는 감정 정도를 얻기 위해서는 감정어휘의 목록과 정도값을 제시할 수 있는 감정어휘사전이 필요하므로 본 연구에서는 감정어휘를 발견하는 방법과 이들의 정도값을 결정하는 문제를 다룬다. 기본적인 방법은 기초 감정어휘의 목록 수집과 이들의 정도값은 선행연구 결과와 직접 설문 방식을 이용하고, 확장된 목록의 수집과 정도값은 사전의 표제어 설명부(glosses)를 이용해 추론하는 것이다. 그 결과 발견된 감정어휘는 전형성을 띠고 있는 기본형 감정어휘, 기본형 감정어휘의 gloss에 사용된 확장형 1단계 1층위 감정어휘, 비 감정어휘 중 gloss에 기본형 또는 확장형 감정어휘를 가지고 있는 확장형 2단계 1층위 감정어휘, gloss의 gloss에 기본형 또는 확장형 감정어휘가 사용된 확장형 2단계 2층위 감정어휘의 네 종류로 나뉜다. 그리고 확장형 감정어휘의 정도값은 기본형 감정어휘의 정도값을 기초로 문형의 가중치와 강조승수를 적용하여 얻었다. 실험 결과 AND, OR 문형은 내포된 어휘의 감정 정도값을 평균내는 가중치를, Multiply 문형은 정도 부사어의 종류에 따라 1.2~1.5의 가중치를 갖는 것으로 파악되었다. 또한 NOT 문형은 사용된 어휘의 감정 정도를 일정 정도로 낮추어 역전시키는 것으로 추정된다. 또한 확장형 어휘에 적용되는 강조승수는 1층위에서 2, 2층위에서 3을 갖는 것으로 예상된다.

개인정보보호 기술 수용행동에 영향을 미치는 요인에 대한 연구 (An Investigation of Users' Privacy Protection Behaviors: Factors Affecting Privacy Protection Technology Adoption)

  • 최보미;박민정;채상미
    • 경영정보학연구
    • /
    • 제17권3호
    • /
    • pp.77-94
    • /
    • 2015
  • 정보를 공유하는데 중요한 매체로 인터넷이 활용되면서, 사용자들은 온라인 공간에서 자신의 정보를 포함한 수많은 정보를 생산하고 공유하고 있다. 온라인 상에서 개인정보를 공유하면서 사회적인 관계의 강도를 강화시키는 등 여러 이점이 있다. 하지만 이면에는 이렇게 공유된 정보가 오용되는 경우 개인정보 침해라는 부정적인 결과를 낳기도 한다. 비록 많은 기업과 정부가 개인정보보호를 위한 노력을 하고 있지만, 기술의 발전으로 인해 개인정보를 이용해 사이버 범죄나 해킹이 되는 경우를 완벽히 방어하기 어려운 것이 현실이다. 개인정보보호는 기업과 정부의 역할의 관점에서 연구가 진행되고 있지만, 사용자의 개인 관점에서 개인정보보호 행동에 대한 연구는 미약하며 이에 대한 연구의 필요성을 가진다. 본 연구는 인터넷 사용자의 개인정보보호 행동과 온라인의 환경적 요인간의 영향 관계를 밝히는 것이 목적이다. 특히, 본 연구에서는 사용자 개인이 자신의 정보를 보호를 위한 정보보호 기술을 수용 행동에 초점을 맞춘다. 본 연구 결과에 따르면, 온라인 상의 사용자가 개인정보보호를 위한 행동은 정부의 개인정보보호 법률과 정 방향의 영향 관계를 가진다. 또한 만약 사용자가 온라인 서비스를 이용할 때 익명을 사용하는 경우 사용자는 개인정보보호를 위한 행동에 정 방향의 영향 관계를 가진다. 더 자세한 결과와 공헌도는 본 논문에 기술하였다.

포스트코로나시대 융합인재양성을 위한 정책방향연구 (A Study on the Policy Directions for the Development of Skill Convergence in the Post-COVID19 Era)

  • 김은비;조대연;노경란;오석영;박기범;류성창;김종윤
    • 한국융합학회논문지
    • /
    • 제12권3호
    • /
    • pp.247-259
    • /
    • 2021
  • 본 연구에서는 포스트코로나 시대를 주도할 교육과 인재양성을 위해 미래 사회를 대비할 수 있는 교육 방향을 모색하고자 한다. 이를 위해 빅데이터 분석을 통해 포스트코로나 인재상을 알아본 후 도출된 포스트코로나 인재상을 바탕으로 전문가 집단의 인터뷰와 델파이 조사를 통해 포스트코로나 시대 도래에 따른 이슈를 도출하고 이를 토대로 '포스트코로나시대 융합인재양성을 위한 정책방향'을 모색하고자 하였다. 연구결과는 다음과 같다. 첫째, 빅 데이터 분석과 온라인 인터뷰 분석을 통해 융합, ICT 활용 능력, 창의성, 자기주도학습 능력, 리더십을 COVID 19 이후 시대에 인재역량으로 보았다. 둘째, 디지털 교육 시스템의 혁신, 취약계층에 대한 지원, 학급당 학생 수 감소가 새로운 인재육성을 위한 교육 이슈로 보았으며 셋째, COVID 19 이후 시대의 인재 육성에 대한 교육 방향 중 가장 중요한 정책은 융합 인재 양성이었다. 융합은 서로 분리된 것들을 연결함으로써 새로운 가치를 창조하기 때문에 매우 중요한 이슈라고 볼 수 있다. 본 연구는 포스트코로나 시대를 대비한 인재양성 및 이를 위한 교육, 훈련에 필요한 기반을 마련하고 기초자료를 제시하는데 의의가 있다.

모바일 간편 결제 서비스 활성화 전략 : 토픽 모델링과 PEST - SWOT 분석 방법론을 기반으로 (Proposal of Promotion Strategy of Mobile Easy Payment Service Using Topic Modeling and PEST-SWOT Analysis)

  • 박성우;김세형;강주영
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.365-385
    • /
    • 2022
  • 간편 결제 서비스는 간편 인증 수단을 이용한 결제 및 송금 서비스이다. 코로나 19로 인해 온라인 거래가 증가하면서 간편 결제 서비스 이용이 증가하고 있다. 이와 함께 네이버페이, 카카오페이, 토스와 같은 전자금융업이 간편 결제 시장의 경쟁 구도를 다각화하고 있다. 해외의 핀테크 기업인 PayPal과 Alibaba는 자국 내 독보적인 점유율을 보유하고 있지만, 국내 간편 결제 시장은 독보적인 점유율을 차지하고 있는 업체가 없어 경쟁이 심화되고 있다. 본 연구에서는 간편 결제 시장 참여자를 전자금융업자, 휴대폰 제조업자, 금융회사로 분류하고, 각 업종의 대표적인 서비스들에 대해 SWOT 분석을 진행하였다. 구글 플레이스토어 실 사용자 후기를 토픽모델링 기법을 사용하여 분석하였고, 긍정 토픽을 강점으로 부정 토픽을 약점으로 활용하였다. 또한, 뉴스 기사를 P(정치), E(경제), S(사회), T(기술)로 나누어 토픽모델링을 진행하여 간편 결제 서비스에 대한 기회와 위협을 도출하였다. 본 연구를 통해 간편 결제 시장 참여자가 자사의 서비스 역량을 확인할 수 있도록 하고, 서비스별로 간편 결제 시장에서 우위를 점할 수 있는 서비스 활성화 전략을 제안하고자 한다.

소셜 빅 데이터 분석을 통한 미용분야 대학생 창업지원 정책에 관한 연구 -탐색적 데이터 분석법을 기반으로- (Study on the Policy of Supporting University Students in the Beauty Field through Social Big Data Analysis: Based on exploratory data analytics)

  • 윤미연;박남훈
    • 한국응용과학기술학회지
    • /
    • 제39권6호
    • /
    • pp.853-863
    • /
    • 2022
  • 본 연구에서는 미용분야 창업 활성화를 위해 소셜 빅데이터 분석을 탐색적 데이터 분석(EDA)을 기반으로 하여 2019년부터 2021년 동안 각 년도별로 기간을 구분하여 '미용창업'에 대한 수요 변화와 감정 및 의미 차이의 특징적인 패턴을 도출하고자 하였다. '미용창업' 키워드를 주제로 연관된 검색어를 추출한 결과 창업에 필요한 전문적인 창업교육 보다는 미용관련 기술을 배울 수 있는 기관이나 자격증에 더 많은 관심을 보였으며, 이는 정부 및 지자체에서 여러 가지 창업지원 정책들이 마련되고 있음에도 불구하고 여전히 전문적인 창업교육의 중요성을 인식하지 못하고 있는 것으로 파악할 수 있으며, 이에 대한 대안으로 미용분야 창업을 성공적으로 이루기 위한 전공별 맞춤형 창업교육 프로그램을 개발하는 것이 필요할 것으로 사료된다. 탐색적 데이터 분석을 통해 가설을 설정하고 전통적인 확증적 데이터 분석(CDA)을 결합하여 가설을 검증한다. 미용 창업을 위한 탐색적 데이터 분석 방법이 존재한 적은 없으며, 정식 창업교육의 필요성을 언급하기보다는 미용창업에 대한 관심 변화와 예비창업자의 요구사항을 탐색적 데이터로 분석한다면 맞춤형 창업 프로그램 개발에 도움이 될 것이라고 확신한다.

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

인공지능 기술에 관한 가트너 하이프사이클의 네트워크 집단구조 특성 및 확산패턴에 관한 연구 (Structural features and Diffusion Patterns of Gartner Hype Cycle for Artificial Intelligence using Social Network analysis)

  • 신선아;강주영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.107-129
    • /
    • 2022
  • 기술경쟁이 심화되고 있는 오늘날 신기술에 대한 선도적 위치의 선점이 중요하다. 선도적 위치의 선점과 적정시점에 기술 획득·관리를 위해 이해관계자들은 지속적으로 기술에 대한 탐색활동을 수행한다. 이를 위한 참고 자료로서 가트너 하이프 사이클(Gartner Hype Cycle)은 중요한 의미가 있다. 하이프 사이클은 기술수명주기(S-curve)와 하이프 수준(Hype Level)을 결합하여 새로운 기술에 대한 대중의 기대감을 시간의 흐름에 따라 나타낸 그래프이다. 새로운 기술에 대한 기대는 기술사업화뿐만 아니라 연구개발 투자의 정당성, 투자유치를 위한 기회의 발판이 된다는 점에서 연구개발 담당자 및 기술투자자의 관심이 높다. 그러나 산업계의 높은 관심에 비해 실증분석을 시도한 선행연구는 다양하지 못하다. 선행문헌 분석결과 데이터 종류(뉴스, 논문, 주가지수, 검색 트래픽 등)나 분석방법은 한정적이었다. 이에 본 연구에서는 확산의 주요한 채널이 되어가고 있는 소셜네트워크서비스의 데이터를 활용하여 'Gartner Hype Cycle for Artificial Intelligence, 2021'의 단계별 기술들에 대한 집단구조(커뮤니티)의 특성과 커뮤니티 간 정보 확산패턴을 분석하고자 한다. 이를 위해 컴포넌트 응집규모(Component Cohesion Size)를 통해 각 단계별 구조적 특성과 연결중심화(Degree Centralization)와 밀도(Density)를 통해 확산의 방식을 확인하였다. 연구결과 기술을 수용하는 단계별 집단들의 커뮤니케이션 활동이 시간이 지날 수록 분절이 커지며 밀도 역시 감소함을 확인하였다. 또한 새로운 기술에 대한 관심을 촉발하는 혁신태동기 집단의 경우 정보확산을 촉발하는 외향연결(Out-degree) 중심화 지수가 높았으며, 이후의 단계는 정보를 수용하는 내향연결(In-degree) 중심화 지수가 높은 것으로 나타났다. 해당 연구를 통해 하이프 사이클에 관한 이론적 기초를 제공할 것이다. 또한 인공지능기술에 대한 기술관심집단들의 기대감을 반영한 정보확산의 특성과 패턴을 소셜데이터를 통해 분석함으로써 기업의 기술투자 의사결정에 새로운 시각을 제공할 것이다.

텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법론 (Mapping Categories of Heterogeneous Sources Using Text Analytics)

  • 김다솜;김남규
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.193-215
    • /
    • 2016
  • 최근 다양한 소셜 네트워크 서비스의 증가로 인해 사용자들은 각자의 목적 및 취향에 따라 여러 매체를 동시에 이용하는 경향을 보이고 있다. 또한 특정 주제에 대한 정보를 수집할 때에도 소셜 네트워크 서비스, 인터넷 뉴스, 블로그 등 여러 매체를 동시에 활용하는 것이 일반적이다. 하지만 다양한 매체를 통해 유통되는 문서들은 서로 유사한 주제, 심지어는 동일한 내용을 다루더라도 각 매체 별 정책 및 기준에 따라 각기 다른 카테고리로 관리되고 있으며, 이는 이종 매체를 아우르는 범위에서 특정 카테고리에 대한 탐색을 수행하고자 하는 시도에 걸림돌로 작용하고 있다. 이러한 제약을 극복하기 위해, 본 연구에서는 기존 매체 고유의 카테고리 체계는 그대로 유지하면서 이종 매체 간 카테고리 매핑을 수행하는 방법을 제시한다. 즉, 개별 문서를 다양한 매체의 관점에서 재분류하고 이러한 결과를 문서에 2차원 레이블로 저장함으로써, 이종 매체에 속한 다양한 문서들을 마치한 매체에 속한 것과 같이 동일한 카테고리 기준으로 탐색할 수 있는 논리적 장치를 제안한다. 본 논문에서는 국내 인터넷 뉴스 포털 사이트 두 곳의 뉴스 기사 6,000건에 대해 제안 방법론을 적용한 실험을 통해 각 기사에 매체와 카테고리 정보로 구성된 2차원 레이블을 부여하였으며, 매체 간, 지도 학습과 준지도 학습 간, 동질 학습 데이터와 이질학습 데이터 간의 정확도 비교 실험을 수행하였다. 특히 매우 흥미롭게도, 일부 카테고리에서 이질 학습 데이터를 사용한 준지도 학습의 분류 정확도가 지도 학습 및 동질 학습 데이터를 사용한 준지도 학습의 분류 정확도보다 높게 나타나는 현상을 발견하였다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.