• 제목/요약/키워드: Text Mining Method

검색결과 451건 처리시간 0.025초

온라인 뉴스 제목 분석을 통한 특정 장소 이벤트 성과 예측을 위한 형태소 분석 방법 (A Morphological Analysis Method of Predicting Place-Event Performance by Online News Titles)

  • 최석재;이재웅;권오병
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.15-32
    • /
    • 2016
  • 공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다. 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스 기사가 갖는 특성이 반영될 수 있도록 기사 검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다. 그 결과 70.6%의 성공률로 성과를 예측하여 다른 비교 대상 분석 방법과 분명한 차이를 보였다. 도출된 이벤트 성과 예측 정보는 이벤트를 준비하는 기관 및 업체에서 예상 수요량을 결정할 때 도움을 줄 수 있을 것이다.

정치 PR 전략으로서의 SNS 메시지 : 21대 총선을 중심으로 (SNS Message as an Political PR Campaign Strategy: Focusing on the 21st General Election)

  • 차영란
    • 한국콘텐츠학회논문지
    • /
    • 제20권9호
    • /
    • pp.208-223
    • /
    • 2020
  • 이번 2020년 4.15에 치른 21대 총선에서는 코로나 19와 맞물리면서 선거 캠페인으로써의 SNS에 대한 중요성이 더욱 두드러졌다. 이에 본 연구에서는 선거 캠페인으로서의 SNS 전략을 수립하기 위해 다양한 연구를 진행하였다. 본 연구는 선거 캠페인 도구로서의 SNS(페이스북, 트위터, 유튜브) 활동을 살펴보고자 2020년 제21대 국회의원 선거 기간 동안에 서울시 종로구 후보인 이낙연 후보와 황교안 후보의 SNS상의 메시지에 관한 내용 분석을 실시하였다. 자료 수집은 각 후보들의 공식계정의 올라온 글들을 위주로 분석했으며 조사방법은 R 프로그램을 활용하여 텍스트 분석을 했으며, 텍스트 분석 중 워드 클라우드, 비교 분석, q-graph 분석, LDA, STM 분석 등을 사용하였다. 그리고 분석결과는 상관관계 분석을 통하여 통계적으로 유의미한지를 확인하였다. 연구 결과 이낙연 후보의 선거 내용을 살펴보면 코로나, 국민, 문제, 위기, 고통, 지혜 등이 있는데, 이는 코로나로 인한 위기 문제를 지혜를 짜내어 극복해야 한다는 메시지를 나타내고 있다. 반면 황교안 후보의 선거 내용은 문재인, 정권, 살리다, 조국, 심판, 경제 등이 있는데, 이는 현재의 문재인 정권과 조국에 대한 심판과 더불어 나라를 살려야 한다는 메시지를 전달하고 있다. 그리고 정치홍보 관점에서 이낙연 후보는 칭송(acclaim)을 많이 하였고 반면에 황교안 후보는 공격(attack)을 많이 하였으며, 메시지 논제는 두 후보 모두 이미지보다는 정책에 대한 부분을 강조하였다.

셀슈머(Sell-sumer)로 진화한 인플루언서의 새로운 유형과 소셜미디어에서의 세일즈 전략 (Sell-sumer: The New Typology of Influencers and Sales Strategy in Social Media)

  • 신하진;김수림;홍만의;황봄님;양희동
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.217-235
    • /
    • 2021
  • 전 세계 인구의 49%가 소셜미디어 플랫폼을 사용하면서 소셜미디어 내에서의 소통과 콘텐츠 공유가 그 어느때보다 활발해지고 있다. 이러한 환경 속에서 1인미디어 시장이 빠른 속도로 성장하고 여론을 형성하면서 셀슈머(Sell-summer)라는 새로운 트렌드가 등장했다. 본 연구는 인플루언서의 상업적/비상업적 키워드의 주제 집중도와 상업적 포스팅의 비율이 매출에 미치는 영향 분석하여 제품 카테고리별 인플루언서의 새로운 유형을 정의하였다. 이는 소셜미디어 내에서 활동하는 인플루언서가 셀슈머로 변모하며 구사하는 새로운 세일즈 전략에 도움이 될 것으로 희망한다. 본 연구의 방법은 파이썬 환경에서 인플루언서의 상업적/비상업적 포스팅으로 분류하고, 이를 KoNLPy를 이용하여 텍스트 마이닝 한 후 FastText 기반 단어 간의 유사도를 계산하였다. 그 결과, 인플루언서의 상업적 포스팅의 키워드 주제 집중도가 높을수록(narrow) 매출이 높아진다는 것을 확인하였다. 또한, 군집분석을 통해 제품 카테고리별 인플루언서 유형을 4가지로 분류하고 매출에 따른 집단 간의 차이가 유의함을 확인하였다. 즉, 본 연구의 시사점은 소셜미디어에서 활동하는 인플루언서들과 이를 마케팅 도구로 활용하고자 하는 마케터들에게 소셜미디어 세일즈 전략의 실증적인 해법을 제시할 수 있을 것이다.

스타트업 관련 최근 국내 연구 동향: 연구 변수들에 대한 소셜 네트워크 분석을 중심으로 (Recent Domestic Research Trend Over Startups: Focusing on the Social Network Analysis of Research Variables)

  • 길창민;양동우
    • 벤처창업연구
    • /
    • 제17권2호
    • /
    • pp.81-97
    • /
    • 2022
  • 본 연구는 스타트업 관련 국내 등재 논문들에 활용된 변수들을 분석하여 스타트업 관련 최근 연구 동향을 파악하고자 함이 목적이다. 대상 논문은 스타트업을 제목에 포함한 국내 등재 논문으로서 스타트업이라는 용어를 제목에 포함한 2013년 첫 등재 논문부터 2020년까지의 논문 108편이다. 본 연구의 분석방법은 전체 변수들에 대하여 클러스터링 및 빈도 분석을 실시하고, 유의한 관계를 가지는 변수들 간 텍스트 네트워크 분석을 진행하는 것으로 구성되어 있다. 텍스트 네트워크 분석을 위한 시각화툴은 Gephi를 활용하였다. 변수들에 대하여 분석한 결과는 첫째, 독립변수는 주로 스타트업의 내부적 요인에 대한 것과 외부적 환경에 대한 변수들로 구성되어 있지만, 초기 기업의 특성, 조직의 혁신성 등 스타트업의 특성으로 인하여 주로 내부적 요인, 예컨대 기업내부역량, 마케팅4P전략, 기업가정신, 협력방법, 변혁적 리더십, 기업특성, 린스타트업전략, 사내커뮤니케이션, 가치지향성, 과업갈등, 관계갈등, 지식공유 등에 대한 분석이 비중을 더 많이 차지한다는 점이다. 둘째, 종속변수는 주로 성과에 관련한 것으로서 상위 개념으로 클러스터링 하면 재무적 성과와 비재무적 성과로 크게 분류할 수 있다. 즉 스타트업은 매출 등 재무적 성과가 본격적으로 나타나기 어려운 상황이므로 재무적 성과뿐만 아니라 비재무적 성과, 예컨대 경영성과, 팀성과, SCM성과 등에 대한 관심이 높음을 알 수 있다. 본 연구를 통해서 알 수 있는 점은 스타트업을 주제로 한 등재 논문수가 많지 않은 상황임에도 불구하고 특정한 연구주제보다는 다양한 주제들에 대한 접근이 이뤄지고 있다는 것이다. 예컨대, 최신 트렌드를 반영하는 주제들도 등장하는데, 린스타트업전략, 크라우드펀딩, 인플루언서, 액셀러레이터 등은 시대상을 반영하는 주제라고 할 수 있다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

기업개성이 직원의 직무만족과 기업 이직률의 관계에 미치는 영향 : 잡플래닛 기업 리뷰를 중심으로 (Impact of Corporate Personality on the Relationship between Job Satisfaction and Turnover Rate : Based on the Corporate Review of Job-Planet)

  • 안병대;최진욱;서용무
    • 한국IT서비스학회지
    • /
    • 제19권3호
    • /
    • pp.35-56
    • /
    • 2020
  • The purpose of this study is to measure corporate personality by analyzing the internal employees' corporate reviews and to identify the impact of the representative corporate personality on the relationship between job satisfaction of internal employees and the turnover rate of the company. To this end, we first created a dictionary of words representing the corporate personality with a Word2vec method based on words explaining five corporate personalities, such as reliability, initiative, practicality, activism, and femininity, obtained from the preceding study. Next, we analyzed reviews which were written by internal employees on their companies to measure the score of corporate personality at a review level, aggregated the review level scores for each company to calculate the company level score of corporate personality, and assigned to each company the corporate personality with the maximum score among the five such scores. Also, job satisfaction and turnover rate were measured from internal employees' corporate evaluation scores and the percentage of former employees of each company who left a review on the company, respectively. This study collected datasets of corporate reviews, employee information, and corporate information from Job-Planet from 2014 to 2017, conducted a technical statistic check and correlation analysis to confirm the suitability of the datasets, and performed linear regression analysis to evaluate the research model and verify hypotheses. As a result of the analysis, the job satisfaction of the internal staff has a significant negative impact on the corporate's turnover rate. In addition, companies having a personality of reliability, initiative and femininity also showed a significant cause-and-effect relationship between job satisfaction and turnover rate and among them, job satisfaction of companies having a personality, initiative, showed a greater impact on turnover rate. In sum, we not only proposed a novel method of measuring corporate personality, but also showed that corporates need to identify its corporate personality and to utilize a different strategy to reduce their employee's turnover rate depending on the corporate personality.

API 통계 기반의 워드 클라우드를 이용한 악성코드 분석 기법 (Malware Analysis Mechanism using the Word Cloud based on API Statistics)

  • 유성태;오수현
    • 한국산학기술학회논문지
    • /
    • 제16권10호
    • /
    • pp.7211-7218
    • /
    • 2015
  • 악성코드는 하루 평균 수만 건 이상이 발생하고 있으며, 신종 악성코드의 수는 해마다 큰 폭으로 증가하고 있다. 악성코드를 탐지하는 방법은 시그니쳐 기반, API 흐름, 문자열 등을 이용한 다양한 기법이 존재하지만 대부분의 탐지 기법들은 악성코드를 우회하는 공격 기법으로 인해 신종 악성코드를 탐지하는데 한계가 있다. 따라서 신종 악성코드를 효율적으로 탐지하기 위한 연구가 많이 진행되고 있다. 그중 시각화 기법을 통한 연구가 최근 활발하게 이루어지고 있으며, 악성코드를 직관적으로 파악할 수 있으므로 대량의 악성코드를 효율적으로 탐지하고 분석할 수 있다는 장점이 있다. 본 논문에서는 악성코드와 정상파일에서 Native API 함수를 추출하고 해당 Native API가 악성코드에서 발생하는 확률에 따라서 F-measure 실험을 통해 가중치의 합을 결정하고, 최종적으로 가중치를 이용하여 워드 클라우드에서 텍스트의 크기로 표현되는 기법을 제안한다. 그리고 실험을 통해 악성코드와 정상파일에서 사용하는 Native API의 가중치에 따라서 악성코드를 판단할 수 있음을 보인다. 제안하는 방식은 워드 클라우드를 이용하여 Native API를 시각적으로 표현함으로써 파일의 악성 유무를 판단하고, 직관적으로 악성코드의 행위를 분석할 수 있다는 장점이 있다.

온라인 구전과 마케팅 성과의 다이나믹스 연구 : 모바일 게임 앱 리뷰를 중심으로 (The Dynamics of Online word-of-mouth and Marketing Performance : Exploring Mobile Game Application Reviews)

  • 김인규;차성수
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.36-48
    • /
    • 2020
  • 본 연구는 모바일앱 온라인 리뷰의 구전내용의 다이나믹스(Dynamics)를 확인하기 위해 내용분석을 실시하였다. 이를 통해 모바일앱 구전 단어 간의 관계를 알아보고 모바일앱 특성에 따라 분류하여 비교 조사하였다. 분석대상은 게임 앱 카테고리 내 10개의 앱으로 선정하였다. 수집된 해당 모바일앱 리뷰는 꾸준한 인기를 가진 Trend형 게임앱과 짧은 인기를 보인 Fad형 게임앱, 무료앱, 유료앱으로 분류하였다. 이후 형태소 분석 등 전처리 과정을 거친 데이터를 기반으로 텍스트마이닝과 Word2Vec 분석을 시도하였다. 연구결과, 앱 리뷰의 양은 순위변동과 상관관계에 있는 것으로 나타났다. 그러나 초기 10일간 변화는 상관관계가 낮거나 없는 것으로 나타났다. 이는 출시 직후 앱개발사의 단기 마케팅활동이 순위를 형성하는데 영향을 주기 때문으로 판단된다. 꾸준한 인기를 얻은 Trend형 게임앱과 짧은 인기를 얻은 Fad형 게임앱 간 리뷰내용의 다이나믹스(Dynamics)도 확인할 수 있었다.

텍스트 마이닝을 통한 키워드 추출과 머신러닝 기반의 오픈소스 소프트웨어 주제 분류 (Keyword Extraction through Text Mining and Open Source Software Category Classification based on Machine Learning Algorithms)

  • 이예슬;백승찬;조용준;신동명
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제14권2호
    • /
    • pp.1-9
    • /
    • 2018
  • 오픈소스를 사용하는 사용자 및 기업의 비중이 지속적으로 증가하고 있다. 국외뿐만 아니라 국내에서의 오픈소스 소프트웨어 시장 규모가 급격하게 성장하고 있다. 하지만 오픈소스 소프트웨어의 지속적인 발전에 비해서, 오픈소스 소프트웨어 주제 분류에 대한 연구 거의 이루어지지 않고 있으며 소프트웨어의 분류 체계 또한 구체화되어 있지 않다. 현재는 사용자가 주제를 직접 입력하거나 태깅하는 방식을 사용하고 있으며 이에 따른 오 분류 및 번거로움이 존재한다. 또한 오픈소스 소프트웨어 분류에 대한 연구는 오픈소스 소프트웨어 평가, 추천, 필터링등의 기반 연구로 이용될 수 있다. 따라서 본 연구에서는 머신러닝 모델을 사용하여 오픈소스 소프트웨어를 분류하는 기법에 대하여 제안하고, 머신러닝 모델 별 성능 비교를 제안한다.

Selection of Key Management Targets for Claim Causes through Relational Analysis on the Causes of Change Order Claims

  • Min, Kwang-Ho;Ko, Gun-Ho;Jin, Chengquan;Hyun, Chang-Taek;Han, Sang-Won
    • 국제학술발표논문집
    • /
    • The 7th International Conference on Construction Engineering and Project Management Summit Forum on Sustainable Construction and Management
    • /
    • pp.281-290
    • /
    • 2017
  • As various stakeholders are involved in construction projects, disputes between the parties are more likely to occur, which is a very important issue for the participants in the projects. Claims in construction projects, however, are very complex and thus difficult to manage. In particular, as the cause of a claim in the preceding stage that has not been resolved in a timely manner has an effect on the cause of a claim in the following stage, it is difficult to find a point of compromise regarding a claim caused by the relationship between the causes that occur in the preceding and following stages. In this regard, this study sought to examine the rules for the generation of change order claims, which occur most frequently among the construction claims, and thus to select the key management targets through the analysis of the relationship between the causes of claims arising in the preceding and following stages for the efficient management of claims. It is expected that the use of rules for the generation of change order claims as well as of representative and similar cases will help the construction practitioners in judging claims, considering the relationships among the causes of the claims. Meanwhile, in this study, association analysis was conducted regarding the causes of the occurrence of change order claims in a design-build delivery method, and therefore, it is necessary to verify the effectiveness of the method when applied to other delivery methods.

  • PDF