• 제목/요약/키워드: 소셜 마이닝

검색결과 216건 처리시간 0.023초

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

토픽 모델링을 이용한 댓글 그래프 기반 소셜 마이닝 기법 (A Reply Graph-based Social Mining Method with Topic Modeling)

  • 이상연;이건명
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.640-645
    • /
    • 2014
  • 인터넷 상에서 많은 사람들은 사용자 간의 의사소통과 정보 공유, 사회적 관계를 생성하기 위한 방법으로 소셜 네트워크 서비스를 이용한다. 그 중 대표적인 트위터는 하루에 수백만 건의 소셜 데이터가 발생하기 때문에 수집되고 있는 데이터의 양이 엄청나다. 이 방대한 양의 데이터로부터 의미 있는 정보를 추출하는 소셜 마이닝이 집중적으로 연구되고 있다. 트위터는 일반적으로 유용한 정보 혹은 공유하고자 하는 내용을 팔로잉-팔로워 관계를 이용해 쉽게 전달하고 리트윗할 수 있다. 소셜 미디어에서 트윗 데이터에 대한 토픽 모델링은 이슈를 추적하기 위한 좋은 도구이다. 짧은 텍스트 기반인 트윗 데이터의 제한점을 극복하기 위해, 사용자를 노드로 사용자간 댓글과 리트윗 메시지의 여부를 간선으로 하는 그래프 구조를 갖는 댓글 그래프의 개념을 소개한다. 토픽 모델링의 대표적인 방법인 LDA 토픽 모델이 짧은 텍스트 데이터에 대해 비효율적인 것을 보완하기 위한 방법으로, 이 논문에서는 짧은 문서의 수를 줄이고 마이닝 결과의 질을 향상시키기 위한 댓글 그래프를 사용하는 토픽 모델링 방법을 소개한다. 제안한 모델은 토픽 모델링 방법으로 LDA 모델을 사용하였으며, 7일간 수집한 트윗 데이터에 대한 실험 결과를 보인다.

신조어 감성사전 기반의 소셜미디어 감성분석 시스템 (Emotion Analysis System for Social Media using Sentiment Dictionary including newly created word)

  • 신판섭;오한민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.225-226
    • /
    • 2019
  • 오피니언 마이닝은 온라인 문서의 감성을 추출하여 분석하는 기법이다. 별도의 여론조사 없이 감성을 분석 가능하므로, 최근 활발한 연구 분야이다. 그러나 소셜미디어에는 신조어 등이 많이 포함되어 있어 기존 감성분석 시스템으로는 정확한 분석이 어려울 뿐만 아니라, 복합적인 감성에 대한 분석을 내리기에 불리하다. 이에 본 연구에서는 직관적인 감성모델을 제안하고 SNS에서 주목받는 다양한 신조어를 수용한 감성단어사전을 구축한 후, 이를 적용하여 소셜미디어에 나타나는 복합적인 감성을 분석하는 감성분석시스템을 설계한다.

  • PDF

소셜 네트워크 서비스 기반 마이닝을 이용한 실시간 랜섬웨어 위험도 분석 시스템 설계 (Design of a Real-time Risk Analysis System for Ransomware Using Mining based on Social Network Service)

  • 나재호;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.254-256
    • /
    • 2017
  • 본 논문에서는 소셜 네트워크 서비스 중 트위터를 마이닝하여 실시간으로 랜섬웨어 위험도 분석을 하는 시스템을 설계한다. 이를 위해 2017년 5월 12일에 가장 피해가 컸던 워너크라이 랜섬웨어를 중심으로 5월 10일에서 20일 사이의 트윗 데이터를 마이닝하고, 기존 시스템인 구글 트렌드와의 유사성을 비교 실험하여 트윗 데이터의 가치를 확인한다. 마지막으로 제안하는 시스템에 대한 향후 연구주제를 제시한다.

나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법 (Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification)

  • 김정인;박상진;김형주;최준호;김한일;김판구
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.51-59
    • /
    • 2020
  • 인터넷의 발달과 스마트폰의 보급으로 인하여 그에 따른 소셜 미디어 문화가 형성됨에 따라 PC통신부터 지금까지 소셜 미디어 신조어가 그 문화로 자리 잡아가고 있다. 소셜 미디어의 등장과 사람들의 가교역할을 해주는 스마트폰의 보급화로 신조어가 생기고 빈번하게 사용되고 있는 추세이다. 신조어의 사용은 다양한 문자 제한 메신저의 문제점을 해결하고 짧은 문장을 사용하여 데이터를 줄이는 등 많은 장점을 가지고 있다. 그러나 신조어에는 사전적인 의미가 없으므로 데이터 마이닝 기술이나 빅데이터와 같은 연구에서 사용되는 알고리즘의 성능 저하와 연구에 제약사항이 발생한다. 따라서 본 논문에서는 웹 크롤링을 통해 텍스트 데이터를 추출하고, 텍스트 마이닝과 오피니언 마이닝을 통해 의미부여 및 단어들에 대한 감정적 분류를 통한 문장의 오피니언 파악을 진행하고자 한다. 실험은 다음과 같이 3단계로 진행하였다. 첫째, 소셜 미디어에서 새로운 단어를 수집하여 수집된 단어는 긍정적이고 부정적인 학습을 받게 하였다. 둘째, 표준 문서를 사용하여 감정적 가치를 도출하고 검증하기 위해 TF-IDF를 사용하여 데이터의 감정적 가치를 측정하기 위해 명사 빈도수를 측정한다. 신조어와 마찬가지로 분류된 감정적 가치가 적용되어 감정이 표준 언어 문서로 분류되는지 확인하였다. 마지막으로, 새로 합성된 단어와 표준 감정적 가치의 조합을 사용하여 장비 기술의 비교분석을 수행하였다.

광고 캠페인의 소셜 네트워크 확산 구조에 대한 연구 (How do advertisements spread on social networks?)

  • 김유나;한상필
    • 디지털융복합연구
    • /
    • 제16권8호
    • /
    • pp.161-167
    • /
    • 2018
  • 본 연구의 목적은 광고 캠페인이 소셜 네트워크에서 어떻게 확산되고 있으며, 광고의 핵심 요인인 광고모델이 확산에 어떤 역할을 하는지 그 패턴과 양상을 살펴보기 위한 것이다. 본 연구 목적을 달성하기 위해 국내 맥주 브랜드인 '클라우드(Kloud)'를 수집 키워드로 하여 텍스트마이닝과 소셜 네트워크 분석을 실시하였다. 구체적으로 '클라우드' 광고의 영향이 어떻게 SNS에 나타나는지 살펴보기 위해, '설현'이 광고모델로 처음 등장한 'Good Body' 광고 집행 이후 2달 간 네이버 블로그와 카페의 소셜 데이터를 수집하여 분석하였다, 그 결과, 광고 이후 클라우드에 대해 '?고 트렌디한 스타일', '맥주 브랜드', '맥주와 어울리는 음식', '럭셔리한 맥주 음용 장소', '여가 트렌드', 'SNS 활동' 등으로 인식하는 것으로 나타났다. 또한 클라우드 광고 모델 '설현' 역시 모델 이미지를 브랜드에 전이시키는 동시에 광고의 USP 및 브랜드명을 잘 전달하고 있는 것으로 나타나, 광고 모델이 소셜 미디어 상에서 광고와 브랜드의 확산에 영향을 주는 주요 요인임을 확인할 수 있었다. 본 연구는 소셜 네트워크 분석을 이용하여 광고 캠페인의 SNS 상의 확산 구조와 패턴을 밝혀냄으로써 광고 캠페인의 효율적인 운영 관리에 실무적인 기여를 했다는 의의를 갖는다.

의약품 시맨틱 소셜네트워크와 이미지 매칭을 이용한 스마트폰 기반의 Cyber Medicine Guider 연구 (A Study of Cyber Medicine Guider based on Smart Phone using Medicine Semantic Social Network and Image Matching)

  • 김수경;안기홍
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.64-66
    • /
    • 2010
  • 본 연구는 모바일 플랫폼 기반의 서비스 콘텐츠 제공을 위해 온톨로지와 텍스트 마이닝 및 소셜 네트워크기술을 융합한 시맨틱 소셜 네트워크 기술과 이미지 매칭 기술을 이용하여 주변의 의약품에 대한 정확한 정보를 획득하고 이를 사용자의 병증에 적용할 수 있는지에 대한 지식을 제공하고 스마트폰의 아바타와 컴퓨터 기반 대화를 진행하여 사용자의 병증에 대한 가진단을 제공하는 Cyber Medicine Guider를 연구하여 스마트폰 플랫폼 기반의 서비스 지향적 지능형 컨텐츠의 가능성을 제시하고자 한다.

  • PDF

소셜 빅데이터 마이닝 기반 실시간 랜섬웨어 전파 감지 시스템 (Real-Time Ransomware Infection Detection System Based on Social Big Data Mining)

  • 김미희;윤준혁
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권10호
    • /
    • pp.251-258
    • /
    • 2018
  • 파일을 암호화시켜 몸값을 요구하는 악성 소프트웨어인 랜섬웨어는 빠른 전파력과 지능화로 더욱 위협적이 되고 있다. 이에 빠른 탐지 및 위험 분석이 요구되고 있지만, 실시간 분석 및 보고가 미비한 상태이다. 본 논문에서는 실시간 분석이 가능하도록 소셜 빅데이터 마이닝 기술을 활용하여 랜섬웨어 전파 감지 시스템을 제안한다. 본 시스템에서는 트위터 스트림을 실시간 분석하여 랜섬웨어와 관련된 키워드를 가진 트윗을 크롤링한다. 또한 뉴스피드 분석기를 통해 뉴스서버를 크롤링하여 랜섬웨어 관련 키워드를 추출하고, 보안업체의 서버나 탐색 엔진을 통해 뉴스나 통계데이터를 추출한다. 수집된 데이터는 데이터 마이닝 알고리즘으로 랜섬웨어 감염 정도를 분석한다. 2017년 전파가 많이 되었던 워너크라이와 록키 랜섬웨어 감염전파 시 관련 트윗의 수와 구글 트렌드(통계 정보) 정보, 관련 기사를 비교하여 트윗을 이용한 본 시스템의 랜섬웨어 감염 탐지 가능성을 보이고, 엔트로피와 카이-스퀘어 분석을 통해 제안 시스템 성능을 보인다.

텍스트마이닝을 통한 고용허가제 트렌드 분석과 정책 제안 : 텍스트마이닝과 소셜네트워크 분석을 중심으로 (A Trend Analysis and Policy proposal for the Work Permit System through Text Mining: Focusing on Text Mining and Social Network analysis)

  • 하재빈;이도은
    • 융합정보논문지
    • /
    • 제11권9호
    • /
    • pp.17-27
    • /
    • 2021
  • 본 연구에서는 고용허가제에 대한 이슈와 국민적 인식을 확인하고 정책을 제언하기 위해 소셜데이터를 기반으로 한 텍스트마이닝 기법을 활용하고자 하였다. 이를 위해 2020년 1월부터 2020년 12월까지 1년 동안 온라인상에서 '고용허가제'가 언급되는 6,217개의 문서의 텍스트 1,453,272개를 텍스톰(Textom)을 통해 수집하여 텍스트마이닝과 소셜네트워크 분석을 수행하였다. 데이터 상위 키워드 빈도, TF-IDF(Term Frequency - Inverse Document Frequency) 분석, 연결중심성 분석으로 언급량이 많은 키워드 100개를 도출하였으며, 일자리 문제, 정책과정의 중요성, 산업관점의 경쟁력, 외국인근로자 생활 개선을 주요한 키워드로 구성하였다. 또한, 의미연결망 분석을 통해 '고용정책'과 같은 주요인식과 '국제협력', '노동자 인권', '법률', '외국인 채용', '기업 경쟁력', '이주민 문화', '외국인력 관리'와 같은 주변인식을 파악하였다. 끝으로 고용허가제에 관한 정책 수립과 관련 연구를 진행하는데 있어서 고려해야 할 요소를 제안하였다.

BPAF2.0: 프로세스기반 소셜 네트워크 마이닝을 위한 비즈니스 프로세스 분석로그 포맷의 확장 표준 (BPAF2.0: Extended Business Process Analytics Format for Mining Process-driven Social Networks)

  • 전명훈;안현;김광훈
    • 한국통신학회논문지
    • /
    • 제36권12B호
    • /
    • pp.1509-1521
    • /
    • 2011
  • 비즈니스 프로세스 및 워크플로우 기술의 국제표준화기구인 WfMCl)에서는 최근 비즈니스 프로세스 인텔리전스 마이닝 분야에 대한 산업체의 관심이 증가함에 따라 프로세스 실행이벤트로그 표준포맷인 비즈니스 프로세스 분석로그 포맷, BPAF2) 1.0을 공식적으로 발표한 바 있다. 즉, 비즈니스 프로세스 인텔리전스 마이닝 기술은 비즈니스 프로세스 모델의 실행이벤트로그로부터 제어흐름, 데이터흐름, 역할흐름, 수행자흐름 등의 흐름중심의 인텔리전스와 최근에 관심이 집중되는 프로세스기반 소셜네트워크, 소속성네트워크 등의 관계중심의 인텔리전스를 마이닝하는 일련의 알고리즘들과 분석기법들로 구성되는데 현재의 표준포맷인 BPAF 1.0은 비즈니스 프로세스의 제어흐름 인텔리전스 마이닝에 초점 맞추고 있어 최근에 관심이 집중되는 관계중심의 인텔리전스 마이닝을 지원할 수가 없다. 따라서, 본 표준화 논문에서는 제어흐름 인텔리전스 이외에 데이터흐름, 역할흐름, 수행자흐름의 흐름 중심 인텔리전스 뿐만 아니라 프로세스기반 소셜네트워크, 소속성 네트워크의 관계중심 인텔리전스의 마이닝을 지원할 수 있도록 기존의 BPAF 1.0 표준포맷을 확장한 BPAF 2.0 표준포맷을 제안한다. 특히, 본 논문에서 제안하는 BPAF 2.0은 한국정보통신기술협회 표준총회의 e 비즈니스 프로젝트 그룹을 통한 국내 표준안의 기반기술이 될 뿐 만 아니라 BPAF 1.0을 제정한 WfMC 국제표준화기구의 국제 표준안의 확장에 기여할 것이라고 판단한다.