• 제목/요약/키워드: BLOGs

검색결과 316건 처리시간 0.021초

빅데이터를 통한 내국인의 '한식' 인식 연구 : 텍스트마이닝과 의미연결망 중심으로 (A study on the Domestic Consumer's Perception of "Hansik" with Big Data Analysis : Using Text Mining and Semantic Network Analysis)

  • 박경원;윤희경
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.145-151
    • /
    • 2020
  • 한국의 국가 브랜드 중 하나인 '한식'에 대한 내국인 소비자 인식 파악을 위해 검색어 '한식'으로 데이터 수집을 진행하였다. 분석 프로그램 텍스톰(Textom3.5)을 사용하여 2018년 11월 1일부터 2019년 10월 31일까지의 네이버 블로그와 뉴스 데이터를 수집하였다. 빈도 분석과 TF-IDF 분석 결과, 한식의 인식에서 '뷔페'가 가장 중요한 부분을 차지했다. 스타 셰프의 방송 콘텐츠가 한식의 인식에 영향을 미치고 있었으며, '퓨전화'와 '고급화' 등 한식에 대한 인식이 비단 전통성에 머무르고 있지만은 않음을 알 수 있었다. UCINET6와 NetDraw를 활용한 CONCOR 분석 결과, 다양한 식문화의 클러스터, 방송에 출연한 고급 레스토랑의 클러스터, 한식 브랜드 클러스터, 한식 뷔페의 클러스터가 형성되었다. 한식의 연상 이미지 강화를 위한 방안으로 뷔페 메뉴의 다양성을 차용한 한식 개발, 고급화된 한식 홍보를 위한 미디어 노출, 간편식 수요에 대한 마케팅적 시각과 콘텐츠 개발을 제안하는 바이다.

웹 기반 소셜 네트워크에서 시맨틱 관계 추론 및 시각화 (Inferring and Visualizing Semantic Relationships in Web-based Social Network)

  • 이승훈;김지혁;김흥남;조근식
    • 지능정보연구
    • /
    • 제15권1호
    • /
    • pp.87-102
    • /
    • 2009
  • 최근 Web 2.0 발달과 더불어 블로그나 온라인 카페 등 웹 상의 네트워크화 된 정보 공간에 사용자가 자신의 개인적인 정보를 자유롭게 게재할 수 있도록 하는 서비스가 증가하면서, 이 사용자들 간의 관계에 초점을 맞춘 소셜 네트워크 분야의 연구가 활발히 이루어지고 있다. 이와 같은 사용자들은 단순히 사회적인 측면뿐만 아니라 교육, 정치, 경제 등의 다양한 분야의 가상의 커뮤니티를 형성함으로서 현대 사회의 주요한 한 부분으로 자리매김하고 있다. 하지만 많은 소셜 네트워크 서비스가 정보자원을 컴퓨터가 처리할 수 있는 의미적인 정보로 표현하고 있지 않기 때문에 서로 다른 도메인 간에 공유와 재사용이 제대로 이루어지지 않고 있다. 또한 사회적 개체들 간의 관계가 명확하게 정의되어 있지 않아 알려져 있지 않은 의미적 관계를 발견해내는 소셜 네트워크 분석에 어려움이 있다. 본 논문에서는 가상 커뮤니티의 사용자들이 업로드 한 사진 데이터를 이용하여 사진 속의 개체나 소유자들 간의 사회적 관계를 분석하기 위해 시맨틱 웹 기반의 소셜 네트워크 분석 시스템을 제안한다. 온톨로지를 기반으로 사진에서 추출된 얼굴 개체간의 관계와 이미 인맥 관계를 형성하고 있는 사람들의 정보적 연결성을 명확하게 정의하고 도메인 규칙을 활용하여 의미 있는 사회적 연결 관계를 추론한다. 최종적으로 이를 그래프로 시각화하여 사용자에게 제공함으로써 온라인 상에서 형성된 커뮤니티 내에서 효율적인 소셜 네트워크 분석(Social Network Analysis)을 도모하고 이를 기반으로 다양한 응용 분야에 활용하는 방법을 모색한다.

  • PDF

지리적 공간과 장치 정보를 사용한 개선된 트윗 봇 검출 (Improved Tweet Bot Detection Using Geo-Location and Device Information)

  • 이알찬;서고은;신원용;김동건;조재희
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2878-2884
    • /
    • 2015
  • 온라인 소셜 네트워크 서비스 중 하나인 트위터는 가장 보편적으로 사용되는 마이크로 블로그인데, 트위터의 개방적 구조로 인해 자동화 프로그램인 트윗 봇이 많이 생성되고 있다. 이 트윗 봇은 적법한 봇과 악성 봇으로 분류되는데, 이 중 악성 봇은 일반 사용자들에게 많은 양의 스팸 정보나 유해한 컨텐츠를 배포하기 때문에 트윗 봇을 검출하는 작업은 반드시 필요하다. 기존 연구에서는 시간적 정보를 활용하여 사람과 트윗 봇을 분류하였다. 본 논문에서는 먼저 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 정보를 활용하여 트위터 사용자들의 정확한 위치를 알아낸다. 그리고, 각 사용자의 공간 변수에 대한 엔트로피 값 및 사용자의 장치 정보를 사용하여 새로운 봇 검출 알고리즘을 제안한다. 주요 결과로써, 시간 정보만을 이용한 기존 연구결과보다 각 신뢰도별 봇 검출 확률 및 거짓 경보 확률이 모두 우수하게 나타난다.

텍스트 문서 기반의 감성 인식 시스템 (An Emotion Scanning System on Text Documents)

  • 김명규;김정호;차명훈;채수환
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.433-442
    • /
    • 2009
  • 요즈음 인터넷을 통해 물건을 구매하는 경향이 증가하고 있다. 또한 물건을 구매한 소비자는 리뷰, 댓글, 비평 또는 블로그 등의 형식으로 온라인에 그들의 사용 후기를 작성한다. 또한 작성된 사용 후기부터 많은 구매자들은 물건을 구매하기 전에 자신이 구입하고자 하는 물건에 대한 정보를 얻는다. 따라서 회사나 공공기관은 대중이 다른 사람의 의견에 관심을 기울인다는 점 때문에 대중의 의견을 수집하고 분석할 필요성에 직면하였다. 그러나 온라인상에 댓글이 너무 많고, 중복적이면서 짧은 경향이 있다. 이러한 환경 속에서 텍스트 문서의 감성을 인식하는 시스템의 필요성이 대두되었다. 텍스트로부터 작성자의 의견이나 주관적인 생각을 추출할 수 있게 영어에서는 단어에 속성이 주어진 GI와 LKB가 있으나 한글은 아직 속성이 주어진 사전이 존재하지 않는다. 이 논문에서는 한글 품사 중 4개의 품사(명사, 동사, 형용사, 부사)에 속성을 주었다. 그리고 학습 군을 만들어서 감성 단어의 패턴을 구성하고, 문장에서 단어 사이의 공기관계를 구성하여 학습 시켰다. 이 학습을 바탕으로, SO-PMI을 이용하여 문서를 긍정과 부정 2가지 극성을 분류하고, 4개의 품사(명사, 동사, 형용사, 부사)를 각각 조합하여 최상의 조건을 구하였다. 마지막으로 사용자 인터페이스를 통해 새로운 감성 표현, 구성형식, 단어 연관성을 반자동적으로 삽입하고 교정할 수 있는 시스템을 설계하였다.

  • PDF

아동·청소년 대상 성범죄 팩션영화의 사회적 역할 탐색: 텍스트 마이닝 기법을 활용한 수용자 감정반응 분석 (Social Roles of Child Sexual Crime Faction Films: Text Mining Analysis of Audiences' Emotional Reactions)

  • 김호경;권기석
    • 한국산학기술학회논문지
    • /
    • 제18권6호
    • /
    • pp.662-672
    • /
    • 2017
  • 아동 청소년 대상 성범죄는 꾸준히 증가 추세에 있지만 실효적인 예방 전략을 수립하기는 역부족이다. 사회문제를 고발하는 영화는 관심을 증폭시키고 조속한 대응방안을 촉구하여 사회변화를 이끌어낸다. 본 연구는 텍스트 마이닝 기법을 활용하여 <도가니>, <소원>, 그리고 <한공주>를 중심으로 아동 청소년 대상 성범죄 팩션영화에 대한 수용자의 반응을 살펴보았다. 영화 개봉 이전 네이버 블로그 총 2,727개를 분석한 결과 사건을 설명하는 사실적인 단어가 빈번하게 등장하였고, 영화 개봉 이후 리뷰 코멘트 총 3,000개를 분석한 결과 감정적인 단어가 주로 언급되었다. 각 영화별로 긍정 부정형의 감정 범주와 정도에 있어서도 차이가 나타났다. <도가니>의 경우 '화나다'와 함께 '억울하다'와 같은 부정적 감정표현이 강한 단어들의 빈도가 높았다. <한공주>도 부정형의 감정단어만이 등장하였지만 '슬프다'는 감정이 가장 많이 등장하고 부정형 강도가 다소 약한 단어들이 뒤를 이었다. <소원>에는 긍정형의 감정표현인 '좋다' 범주가 유일하게 등장하였다. 즉 영화가 개봉되기 이전 수용자는 사건에 대해 객관적인 정보위주로 인식한 반면, 영화를 관람한 이후에는 주관적인 감정과 느낌을 표현하였다. 동일주제를 다루고 있지만, <도가니>는 폭발적인 분노를 일으켰고 사회변화를 이끄는 시민 참여적 움직임을 결성시켰다. 그 결과 성폭력 범죄에 대한 처벌을 강화하는 법률안이 처리되어 시행되는 계기를 마련하였다. 사회 고발적 팩션영화에 대한 수용자의 상이한 감정반응을 파악하고, 향후 사회변화를 이끄는 팩션영화의 방향성에 대해 논의하였다는 점에서 연구의 의의가 있다. 또한 텍스트마이닝을 활용하여 감정포현을 분석한 결과를 바탕으로, 향후 영화에 대한 다양한 감정표현을 위계적으로 분류하는 작업의 필요성이 제기된다.

빅데이터와 사회연결망 기법을 이용한 '노인 이미지' 분석 ('Elderly image' Analysis Using Big Data and Social Networking Techniques)

  • 한선보;이현심
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.253-263
    • /
    • 2016
  • 빅데이터와 사회연결망 분석기법을 이용하여 사회적 이슈인 '노인 이미지'를 분석 하였다. '노인' 키워드를 입력하여 텍스트마이닝 기법으로 추출된 단어를 분석한 결과 대중의 트렌드를 대표하는 카페, 블로그 등의 매체를 통해 본 노인 이미지는 '어르신'이라는 단어를 가장 많이 사용하고 있었다. 상위 10위 빈도수를 보인 단어를 이용하여 노인의 이미지를 표현하면, "노인은 사회의 존경을 받는 어르신이며 돈을 벌기위해 자격증을 따려고 하고 건강을 챙기며 고령에도 불구하고 100세까지 건강하게 일을 하기를 원하는 어르신"으로 정리되었다. 본 연구는 방대한 양의 데이터를 수집하여 이를 사회연결망 기법으로 분석함으로써 사회적 담론을 포함한 거시적 수준의 '노인 이미지' 분석을 통해 기존의 분석방법과 차별화하고자 하였다. 대중이 느끼는 노인에 대한 이미지가 '어르신'으로 긍정적으로 표현되는 것을 볼 때, 현재 추진하는 노인정책의 방향이 바람직한 방향으로 평가 받고 있다고 할 수 있으며, 한편으로는 그렇게 평가받기를 원하는 대중의 '욕구'를 느낄 수 있었다. 따라서 향후에 적용할 노인 정책 방향은, 노인들이 사회적 역할을 감당하여 사회에서 '필요한 존재'로 인식될 수 있도록 하는 정책이 우선되어야 한다. 또한 건강을 유지하고 활동할 수 있는 일자리 창출과 복지, 소외에 대한 대책 등의 우선순위가 반영된 노인 정책을 추진할 것을 제언하였다.

레이싱 모델 폐지에 관한 현대인의 감성 탐색 (Exploration on Modern People's Emotion regarding Abolition of Racing Model)

  • 정상필
    • 디지털융복합연구
    • /
    • 제18권11호
    • /
    • pp.571-579
    • /
    • 2020
  • 본 연구는 2018년 2월 F1의 레이싱 모델 제도 폐지 발표에 대한 현대인의 감성을 탐색하는 데 목적이 있었다. 이를 위하여 댓글 저널리즘을 바탕으로 레이싱 모델 제도 폐지와 관련된 블로그 15건, 카페 글 10건, 유튜브 영상 1건, 그리고 이 세 온라인 콘텐츠에 달린 429개의 댓글에 대한 해석적 텍스트 분석을 하였다. 레이싱 모델 제도 폐지에 대한 댓글 분석 결과로써 가장 높은 빈도를 기록한 범주는 반 페미니즘 정서이며, 이는 다시 페미니스트/여성에 대한 혐오, 페미니즘 비판, 여성의 적은 여성이라는 관념의 재확인 등으로 세분되었다. 이 외에도 직업을 박탈당한 레이싱 모델들에 대한 동정 정서, 유사업종에 대한 형평성 요구, 남녀의 공간적 분리, 레이싱 모델 폐지 찬성 담론 등이 발견되었다. 이와 같은 결과는 레이싱 모델에 대한 사회적 이미지가 기존 여권주의에서 근거하고 있는 성 상품화의 개념을 벗어나 보다 개방된 직업으로서 인정받고 있다는 현대인의 감성을 보여주고 있으며, 이를 통해 레이싱 모델이 성 상품화가 아닌 보통의 직업으로서 존중받을 수 있는 계기가 되기를 기대한다.

소셜 빅 데이터를 활용한 자살검색 요인 다변량 분석 (Multivariate Analysis of Factors for Search on Suicide Using Social Big Data)

  • 송태민;송주영;안지영;진달래
    • 보건교육건강증진학회지
    • /
    • 제30권3호
    • /
    • pp.59-73
    • /
    • 2013
  • Objectives: The study is aimed at examining the individual reasons and regional/environmental factors of online search on suicide using social big data to predict practical behaviors related to suicide and to develop an online suicide prevention system on the governmental level. Methods: The study was conducted using suicide-related social big data collected from online news sites, blogs, caf$\acute{e}$s, social network services and message boards between January 1 and December 31, 2011 (321,506 buzzes from users assumed as adults and 67,742 buzzes from those assumed as teenagers). Technical analysis and development of the suicide search prediction model were done using SPSS 20.0, and the structural model, nd multi-group analysis was made using AMOS 20.0. Also, HLM 7.0 was applied for the multilevel model analysis of the determinants of search on suicide by teenagers. Results: A summary of the results of multivariate analysis is as follows. First, search on suicide by adults appeared to increase on days when there were higher number of suicide incidents, higher number of search on drinking, higher divorce rate, lower birth rate and higher average humidity. Second, search on suicide by teenagers rose on days when there were higher number of teenage suicide incidents, higher number of search on stress or drinking and less fine dust particles. Third, the comparison of the results of the structural equation model analysis of search on suicide by adults and teenagers showed that teenagers were more likely to proceed from search on stress to search on sports, drinking and suicide, while adults significantly tended to move from search on drinking to search on suicide. Fourth, the result of the multilevel model analysis of determinants of search on suicide by teenagers showed that monthly teenagers suicide rate and average humidity had positive effect on the amount of search on suicide. Conclusions: The study shows that both adults and teenagers are influenced by various reasons to experience stress and search on suicide on the Internet. Therefore, we need to develop diverse school-level programs that can help relieve teenagers of stress and workplace-level programs to get rid of the work-related stress of adults.

소셜 빅데이터를 활용한 담배 위험 예측 (Predicting tobacco risk factors by using social big data)

  • 송태민;송주영;천미경
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권5호
    • /
    • pp.1047-1059
    • /
    • 2015
  • 본 연구는 국내의 블로그, 카페, SNS 등 인터넷을 통해 수집된 소셜 빅데이터를 데이터마이닝 분석 기법을 적용하여 우리나라 국민의 담배에 대한 위험요인을 예측하고자 하였다. 주요분석 결과는 다음과 같다. 첫째, 온라인상에 '담뱃값인상'이 언급될 경우 담배에 대한 일반군 (negative)이 58.6%에서 74.8%로 증가하며, '폐암'이 언급될 경우 73.1%로 증가하는 것으로 나타났다. 둘째, 담뱃값인상 이후 담배에 대한 위험군 (positive)은 5.6% 감소하고, 일반군은 6.1% 증가한 것으로 나타났다. 셋째, 'FCTC, 담뱃값인상, 금연관련법, 흡연규제, 금연광고, 금연사업'과 관련된 정책이 온라인상에 많이 언급될수록 담배에 대한 위험군이 감소하는 것으로 나타났다. 마지막으로 '금연약, 금연패치, 금연껌'이 온라인 상에 언급될수록 담배에 대한 위험군이 감소하나, '전자담배와 보조제'가 온라인상에 언급될수록 담배에 대한 위험군을 증가시키는 것으로 나타났다.

웹게시판에서 가상온도를 이용한 게시글의 인기 예측 (Predicting the Popularity of Post Articles with Virtual Temperature in Web Bulletin)

  • 김수도;김소라;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.19-29
    • /
    • 2011
  • 블로그는 사용자에게 자신의 의견을 표현하고 다른 사람들의 의견을 수렴할 수 있는 자유로운 의사표현 네트워크를 제공한다. 어떤 글은 사회적, 정치적 이슈를 몰고 다니기도 하며 또 어떤 글은 사용자의 관심을 끌지 못하고 지나가기도 한다. 글이 작성된 초기에 향후 얼마나 인기를 얻을지 예측한다는 것은 글의 저자, 블로거, 광고회사 그리고 웹호스팅 모두에게 흥미로울 것이다. 인기를 예측하기 위한 다양한 연구들이 진행되어 왔지만 대부분의 연구들이 사용자간의 상호연관성에 기반하고 있고 정확한 값으로 표현하는데 높은 에러율을 발생하고 있다. 본 논문에서는 블로그에 글이 작성된 초기에 향후 글의 인기를 예측하기 위해 조회수를 사용하여 글의 인기를 4타입(explosion, hot, warm, cold)의 가상 온도로 예측하는 방법을 제안한다. 먼저 글의 포화시점을 정의하고, 초기 조회수와 포화시점 조회수의 관계를 통해 포화시점 조회수를 예측하는 모델링 공식을 유도하였다. 예측된 포화시점 조회수를 이용하여 글의 인기를 4타입의 가상 온도로 표현하였다. 초기 관찰기간에 따라 예측 정확률이 결정되고 있다. 실험결과 30분 이후부터 MAPE(Mean Absolute Percentage Error)가 30%이하로 낮아졌지만, explosive 타입의 경우 초기 조회수로 예측하기 힘들었다. explosive를 제외한 hot, warm, cold 타입에서는 30분후부터 86%이상의 평균 예측 정확률을 보여주며, 70분후부터는 90%이상의 평균 예측 정확률을 보여주고 있었다.