• 제목/요약/키워드: Blog Post

검색결과 29건 처리시간 0.019초

웹게시판에서 가상온도를 이용한 게시글의 인기 예측 (Predicting the Popularity of Post Articles with Virtual Temperature in Web Bulletin)

  • 김수도;김소라;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.19-29
    • /
    • 2011
  • 블로그는 사용자에게 자신의 의견을 표현하고 다른 사람들의 의견을 수렴할 수 있는 자유로운 의사표현 네트워크를 제공한다. 어떤 글은 사회적, 정치적 이슈를 몰고 다니기도 하며 또 어떤 글은 사용자의 관심을 끌지 못하고 지나가기도 한다. 글이 작성된 초기에 향후 얼마나 인기를 얻을지 예측한다는 것은 글의 저자, 블로거, 광고회사 그리고 웹호스팅 모두에게 흥미로울 것이다. 인기를 예측하기 위한 다양한 연구들이 진행되어 왔지만 대부분의 연구들이 사용자간의 상호연관성에 기반하고 있고 정확한 값으로 표현하는데 높은 에러율을 발생하고 있다. 본 논문에서는 블로그에 글이 작성된 초기에 향후 글의 인기를 예측하기 위해 조회수를 사용하여 글의 인기를 4타입(explosion, hot, warm, cold)의 가상 온도로 예측하는 방법을 제안한다. 먼저 글의 포화시점을 정의하고, 초기 조회수와 포화시점 조회수의 관계를 통해 포화시점 조회수를 예측하는 모델링 공식을 유도하였다. 예측된 포화시점 조회수를 이용하여 글의 인기를 4타입의 가상 온도로 표현하였다. 초기 관찰기간에 따라 예측 정확률이 결정되고 있다. 실험결과 30분 이후부터 MAPE(Mean Absolute Percentage Error)가 30%이하로 낮아졌지만, explosive 타입의 경우 초기 조회수로 예측하기 힘들었다. explosive를 제외한 hot, warm, cold 타입에서는 30분후부터 86%이상의 평균 예측 정확률을 보여주며, 70분후부터는 90%이상의 평균 예측 정확률을 보여주고 있었다.

소셜미디어 데이터 분석을 활용한 COVID-19 전후 박쥐의 인식변화 연구 (A Study on the Perception Change of Bats after COVID-19 by Social Media Data Analysis)

  • 이주경;김벼리;김선숙
    • 환경영향평가
    • /
    • 제31권5호
    • /
    • pp.310-320
    • /
    • 2022
  • 본 연구는 국내 최대 소셜 네트워크인 블로그 글을 대상으로 텍스트마이닝 및 네트워크 분석을 통해 COVID-19 발생 후 '박쥐'에 대한 대중들의 인식 변화를 파악하였다. 국내에서 COVID-19 발생전 2019년부터 2020년까지 9,241건의 네이버 블로그 글을 수집하였다. 수집된 자료는 파이썬(Python)과 NetMiner 4.3.2으로 분석하였고, 시기별로 도출된 키워드와 키워드 간 연관성을 통해 박쥐에 대한 대중들의 인식을 심층적으로 분석하였다. 분석결과, 2020년 박쥐 키워드의 출현 빈도는 2019년에 비해 25배 이상 증가하였고, 중심성 수치 또한 3배 이상 증가되었다. 네트워크 분석 결과, '박쥐'에 대한 인식은 COVID-19 발생전과 후 차이를 나타냈다. COVID-19 이전에 박쥐는 야생동물의 한 종(Species)으로 인식되는 경향성이높았던 반면, COVID-19 발생 초기인 2020년 상반기에는 전염병 및 건강 분야와 연관시켜 인간사회를 위협할 수 있는 존재로 강하게 인식하였고, 하반기에는 생태 및 문화 유형 비중이 높아지면서 박쥐에 대한 관심영역이 확장된 것을 확인하였다. 본 연구는 COVID-19 발생 이후 질병 숙주로서 박쥐의 잠재적인 영향에 대한 대중들의 관심과 인식 변화에 대한 정보를 제공함으로써 질병연구의 확장과 공중보건 관리, 미래감염병 대응을 위한 방향을 제시하였다.

소셜미디어 빅데이터의 개체명 인식을 활용한 옥외 힐링 장소 인식 분석 (Outdoor Healing Places Perception Analysis Using Named Entity Recognition of Social Media Big Data)

  • 성정한;이경진
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.90-102
    • /
    • 2022
  • 최근 힐링에 대한 관심이 증가함에 따라 힐링을 콘셉트로 하는 옥외 공간이 조성되고 있다. 보다 전문적이고 심층적인 옥외 힐링 장소 계획·설계·디자인을 위해 88,155건의 블로그 게시글 텍스트 데이터를 개체명 인식하여 텍스트 마이닝을 진행했다. 옥외 힐링 장소의 인식과 특징을 파악을 위해 출현 빈도 분석과 응집 분석을 진행하였다. 선행연구 고찰을 통해 힐링 장소의 6가지 요소를 도출하였으며, 시간과 인원을 추가한 총 8가지 요소를 통해 인식과 특성을 살펴보았다. 분석 결과 사람들은 힐링 장소를 방문하는 데 있어 장소적요소, 시간적요소, 사회적요소, 활동요소를 인원, 식물, 색상·형태, 심리적 요소보다 중요하게 생각하였다. 상위 출현 키워드를 통해 여러 가지 인식과 특성을 파악할 수 있었다. 응집 분석 결과를 통해 장소적요소, 시간적요소, 사회적요소의 키워드들이 응집되어 나타나 주로 어떤 장소, 어떤 시간대, 누구와 함께 방문하는지 구체적으로 살펴볼 수 있었다. 연구를 통해 실제 사람들이 작성한 인식 데이터를 대량 분석하여 힐링 장소의 인식과 특성을 도출하였으며, 계획과 마케팅적으로 활용할 수 있는 구체적인 요소가 나타남을 확인했다.

토픽모델링을 활용한 도시림의 문화서비스 수요 특성 분석 (A Study on the Demand for Cultural Ecosystem Services in Urban Forests Using Topic Modeling)

  • 김지영;손용훈
    • 한국조경학회지
    • /
    • 제50권4호
    • /
    • pp.37-52
    • /
    • 2022
  • 본 연구의 목적은 북한산국립공원에 대한 네이버 블로그 포스트 및 LDA 토픽모델링을 활용하여 이용자 인식 및 경험 가치에 기반한 도시림의 문화서비스 수요 특성을 분석하고 공간적 평가 가능성을 검토하는 것이다. 연구에서는 블로그 포스트에 대한 토픽모델링의 결과를 바탕으로 북한산국립공원 문화서비스와의 관련성 여부와 공간평가 지표로서 활용 가능성 여부를 고려한 검토과정을 거쳐, 최종적으로 도시림의 문화서비스 공간평가 지표를 도출하였다. 구체적으로 토픽분석을 통해 도출된 총 21개의 토픽을 해석하고, 생태계서비스에 대한 MA(Millennium Ecosystem Assessment)의 문화서비스 분류체계에 기반하여 총 13개의 문화서비스 관련 토픽을 도출하였다. 이는 전체 문서의 72.7%에 해당하였다. 토픽의 내용으로는 '산행 휴양 활동' 유형(23.7%), '관광·편익시설과 연계한 간접이용가치'(12.4%), '일상적 간접이용가치'(10.7%), '영감 활동'(11.2%), '계절성이 있는 휴양 활동'(6.2%), '자연 감상 및 정적 휴양 활동'(4.3%), '문화유산 가치'(3.7%), 와 관련한 7개 유형의 문화서비스로 해석하였다. 다음으로 13개의 문화서비스 관련 토픽에 대해, 도시림으로서의 특성과 공간적 평가 가능성을 검토하여 최종적으로 도시림 문화서비스에 대한 총 8개 평가지표를 도출하였다. 본 연구의 결과는 기존의 문화서비스 평가에서 많이 사용되던 MA의 생태계서비스 분류체계가 현장을 반영하지 못하는 한계를 극복하고자 국내 사정에 맞는 도시림의 문화서비스의 평가지표를 범주화했다는 점에서 의미가 있다. 또한 연구에서는 대용량의 이용자 인식 및 경험 자료를 활용하여 문화서비스의 수요를 해석하고 도출하는 방법론을 제시했다는 점에서 의의가 있다.

Effect of Online Word of Mouth on Product Sales: Focusing on Communication-Channel Characteristics

  • Jeon, Jaihyun;Lim, Taewook;Kim, Byung-Do;Seok, Junhee
    • Asia Marketing Journal
    • /
    • 제21권2호
    • /
    • pp.73-98
    • /
    • 2019
  • As information and communication technology continue its remarkable development, the exchange of information online becomes as prevalent and frequent as face-to-face communication in daily life. Therefore, the management and application of WOM (word of mouth) practices will become more important than ever to companies. Currently, there are various types of communication channels for online WOM, and each channel has its own unique traits. Most of the previous research studies online WOM by examining the information inside a single communication channel, but this research chooses two different communication channels and analyzes the effects of online WOM with each channel's unique characteristics. More specifically, this research focuses on the expectation that the effects of information from Twitter and blogs on product sales may differ because Twitter and blogs, two different communication channels for online WOM, have their own unique traits. Our particular aim is to perform an in-depth examination on the effects of communication channel's volume and valence on product sales, two important attributes of online WOM. Furthermore, while most of the empirical research focuses on online WOM and analyzes its effect on markets of temporary experience goods, such as movies and books, this research highlights focuses on the automobile market, a durable goods market. The results of our analysis are as follows: First, regarding blogs, a positive valence significantly and positively affects the sales of products, and this result indicates that consumers are influenced more by the emotional aspect of a product presented in a post than by the number of blog posts. Second, regarding Twitter, the volume of online WOM significantly and positively affects sales, an indication that as the number of posts increase, the sales increase. Through this research, we suggest that even those firms that sell durable goods can increase sales through the management and application of online WOM. Moreover, according to the characteristics of communication channels, the effects of online WOM on sales differ. As a practical implication of this research, we suggest that companies can and should create marketing strategies appropriate to their targeted communication channels.

사용자 그룹별 과학기술정보 서비스 수요 분석 (Study on the Science & Technology Information Service Needs Corresponding to the Scientists and Engineers Group Characteristics)

  • 정혜주;윤정선
    • 정보관리연구
    • /
    • 제43권4호
    • /
    • pp.143-167
    • /
    • 2012
  • 본 연구에서는 사용자 그룹별 과학기술정보 서비스 수요를 파악하기 위한 조사 분석을 실시하였다. 설문에서는 20가지 과학기술정보서비스에 대한 필요도, 인적교류를 위해 필요한 개인정보, 다른 사람과 공유할 수 있는 정보가 조사되었다. KOSEN 사용자 1,013명이 설문에 참여하였으며, 응답자의 소속기관, 직업, 최종학위, 연령에 따라 분산분석을 실시하였다. 빈도분석 결과 동향분석, 논문, 연구보고서, 특허, 지식질의, 채용정보, 프로젝트공고, 실험방법, 학회정보, 해외유학/Post-Doc정보에 대한 수요가 높았으며, 멘토링, 커뮤니티, 블로그 서비스를 제외한 모든 서비스가 사용자 그룹별 유의한 차이가 나타나는 것을 알 수 있었다. 과학기술자들이 상호 교류를 위해 필요하다고 생각하는 인적 정보로는 전문분야, 논문/연구실적, 경력사항, 소속기관, 직업, 최종학위, 학력사항 순으로 응답하였고 사용자 그룹별 필요하다고 생각하는 인적 정보는 부분적으로 차이가 있었다. 또한 응답자의 97%가 자신이 보유한 과학기술정보를 다른 사람들과 공유할 의사가 있다고 답변하였고 논문, 발표자료(ppt), 보고서, 실험방법, 이미지 순으로 공유 의사를 표시하였다. 본 연구 결과는 과학기술자들을 위한 사용자 중심 맞춤형 서비스를 개발하는데 유용한 정보로 활용될 수 있으며 향후 미래 과학기술정보 서비스의 방향을 설정하는 데에도 도움이 되리라 기대된다.

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론 (Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System)

  • 김지현;이종서;이명진;김우주;홍준석
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.137-152
    • /
    • 2012
  • 인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.

지자체 사이버 공간 안전을 위한 금융사기 탐지 텍스트 마이닝 방법 (Financial Fraud Detection using Text Mining Analysis against Municipal Cybercriminality)

  • 최석재;이중원;권오병
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.119-138
    • /
    • 2017
  • 최근 SNS는 개인의 의사소통뿐 아니라 마케팅의 중요한 채널로도 자리매김하고 있다. 그러나 사이버 범죄 역시 정보와 통신 기술의 발달에 따라 진화하여 불법 광고가 SNS에 다량으로 배포되고 있다. 그 결과 개인정보를 빼앗기거나 금전적인 손해가 빈번하게 일어난다. 본 연구에서는 SNS로 전달되는 홍보글인 비정형 데이터를 분석하여 어떤 글이 금융사기(예: 불법 대부업 및 불법 방문판매)와 관련된 글인지를 분석하는 방법론을 제안하였다. 불법 홍보글 학습 데이터를 만드는 과정과, 데이터의 특성을 고려하여 입력 데이터를 구성하는 방안, 그리고 판별 알고리즘의 선택과 추출할 정보 대상의 선정 등이 프레임워크의 주요 구성 요소이다. 본 연구의 방법은 실제로 모 지방자치단체의 금융사기 방지 프로그램의 파일럿 테스트에 활용되었으며, 실제 데이터를 가지고 분석한 결과 금융사기 글을 판정하는 정확도가 사람들에 의하여 판정하는 것이나 키워드 추출법(Term Frequency), MLE 등에 비하여 월등함을 검증하였다.