• 제목/요약/키워드: 이슈 추출

검색결과 279건 처리시간 0.031초

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

연관 어휘 추출을 통한 질의어 관련 이슈 탐지 (Query Related Issue Detection using Related Term Extraction)

  • 김제상;김동성;조효근;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-136
    • /
    • 2013
  • 근래 트위터와 페이스북 등의 SNS(Social Network Service)에서 일반 대중의 관심사나 트렌드 등의 이슈를 탐지하는 많은 연구가 이루어지고 있다. 본 논문에서는 검색어에 대한 연관 어휘 추출을 통해 검색어에 연관된 이슈나 화제를 트위터에서 추출하기 위한 방법을 제안한다. 본 논문에서는 연관성이 높은 단어는 서로 가깝게 발생할 것으로 기대하고, 단어 간 거리가 가까울수록, 공기빈도가 높을수록 커지는 단어연관도 계산법을 제안한다. 연관도 값이 임계치를 넘는 어휘를 연관 어휘로 보고 네트워크의 형태로 관련 이슈를 제시한다.

  • PDF

사회적 핵심 이슈 키워드 정보를 활용한 채팅 프로그램 개발 (Development of chatting program using social issue keyword information)

  • 윤경섭;정원혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.307-310
    • /
    • 2020
  • 본 논문에서 이슈 키워드 추출을 위해 텍스트 마이닝(Text Mining) 기술을 요구한다. 사회적 이슈 키워드를 추출하기 위해 키워드 수집 모델이 되는 사이트에서 크롤링(crawling)을 수행한 뒤, 형태소 단위 의미있는 단어를 수집하기 위해 형태소 분석(morphological analysis)을 수행한다. 한국어 형태소 분석을 위해 파이썬의 코엔엘파이(KoNLPy) 패키지를 활용한다. 형태소 분석을 통해 나뉘어진 단어에서 통계를 내어 이슈 키워드 추출한다. 이슈 키워드를 뒷받침할 연관 단어를 분석하기 위해 단어 임베딩(Word Embedding)을 수행한다. 단어 임베딩 수행을 위해 Word2Vec 모델 중 Skip-Gram 방법론을 적용하여 연관 단어를 분석하도록 개발하였다. 웹 소켓(Web Socket) 통신을 통한 채팅 프로그램의 상단에 분석한 이슈 키워드와 연관 단어를 출력하도록 개발하였다.

  • PDF

키워드 가중치를 이용한 뉴스 기사에서의 이슈 키워드 자동 추출 시스템 (Automatic Keyword Extraction in News Articles for Trend Tracking)

  • 김미지;이재원;장달원;이종설
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.150-152
    • /
    • 2018
  • 본 논문에서는 포털 사이트에 게재된 뉴스 기사 집합에서 이슈가 된 키워드들을 자동으로 추출하는 시스템을 소개한다. 포털 사이트에서 사용하는 기존의 키워드 추출 시스템은 검색 횟수를 기반으로 하고 있으며, 뉴스 기사에서 단어 간의 상대적 중요성을 반영하지 못하고, 외부로부터 영향을 받아 순위 조작과 같은 문제점을 수반할 수 있다. 제안하는 시스템에선 TF-IDF 모델을 사용하여 단어 간의 상대적인 중요성에 기반하고, 추출된 키워드들의 시각적 변화를 반영하여 이슈 키워드를 추출한다. 제안한 시스템의 효용성 확인을 위해 58,996 개의 정치 뉴스 기사를 수집하였으며, TF-IDF 기반의 제안 방식과 TF 기반의 기존 방식을 비교하였다. 제안한 시스템이 기존 방식보다 시간에 따른 정치 뉴스의 이슈 변화를 분석하는 데 효과적인 것을 확인하였다.

  • PDF

LiveTwitter: 트위터 기반 핫이슈 검색 시스템 (LiveTwitter: Hot Issue Search system Based on Twitter)

  • 성병기;오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-182
    • /
    • 2010
  • 트위터, 페이스북 등의 소설 네트워크가 이슈가 되는 사건에 의견을 표시하는 수단으로 많이 활용되고 있다. 본 논문에서는 이슈 키워드 추출 및 트위터와 유투브에 기반한 실시간 검색 시스템을 구현한다. 본 시스템에서는 가장 최근 신문 기사들의 제목과 스니핏을 이용하여 이슈가 되는 키워드를 실시간으로 추출하여 사용자들에게 보여주고 트위터와 유투브 OpenAPI를 이용하여 추출된 키워드에 대한 컨텐츠들을 실시간으로 사용자들에게 보여준다, 본 시스템을 통해서 이슈가 되는 사건에 대한 실시간 반응을 찾을 수 있다.

  • PDF

FOAF및 소셜 네트워크 분석을 이용한 핫 이슈 추출 기법 (Hot issue extraction method using FOAF and Social Network Analysis)

  • 왕청;손종수;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.531-534
    • /
    • 2010
  • 웹 2.0의 적극적인 도입에 따라 소셜 네트워크 기반 커뮤니티 사이트에서는 관련된 콘텐츠를 적절하게 추천하는 것은 중요한 문제로 부각되고 있으며 이로 인해 사용자들의 동향 및 이슈 추출 기법이 중요하게 작용하고 있다. 이러기 위해서 지금까지의 연구에서는 콘텐츠에 포함된 키워드 매칭 방법을 이용하고 있으나 사용자들 간의 연결 관계와 키워드의 중요도를 고려하지 못하고 있다. 본 논문에서는 FOAF 기반의 소셜 네트워크와 del.icio.us에서 제공하는 소셜 북마크 데이터를 기초로 소셜네트워크 분석을 보이며 이를 통한 사용자들 사이에서 중요하게 부각되는 핫 이슈를 추출하는 방법을 제안한다. 본 논문에서 제안하는 핫 이슈 추출 방법을 활용하면 사용자들의 관심 분야 동향파악을 효율적으로 수행할 수 있으며 이를 통해 맞춤형 마케팅 및 콘텐츠 추천이 가능해 진다.

웹 미디어 데이터를 이용한 이슈 예측 시스템 설계 (Designing issue prediction system using web media data)

  • 윤현노;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.501-503
    • /
    • 2019
  • IT 기술의 발달에 따라 다양한 웹 미디어의 데이터가 기하급수적으로 증가하고 있으며 이는 비정형 형태의 빅 데이터로 활용도가 매우 높다. 그 중 인터넷 뉴스나 SNS 등은 시간의 흐름에 따라 다양한 이슈들이 서로 영향을 주며 발생, 결합, 분화, 소멸된다. 본 논문에서는 인터넷상에서 발생하는 비정형 데이터들을 수집하여 텍스트 마이닝을 통해 글의 주요이슈 키워드, 카테고리, 날짜 등을 추출한다. 추출한 데이터를 일정 기간별로 나누어 이슈 매핑을 통해 이슈간의 상관관계를 분석한다. 나아가 LSTM 또는 GRU를 이용한 딥러닝을 통해 앞으로의 이슈를 예측하는 시스템 설계를 제안한다.

SNS를 이용한 잠재적 광고 키워드 추출 시스템 설계 및 구현 (Design and Implementation of Potential Advertisement Keyword Extraction System Using SNS)

  • 서현곤;박희완
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.17-24
    • /
    • 2018
  • 빅데이터 처리 분야에서 중요한 이슈 중 하나는 인터넷의 주요 키워드를 추출하고 이것을 이용하여 필요한 정보를 가공하는 것이다. 현재까지 제안된 대부분의 키워드 추출 방법들은 대형 포털 사이트의 검색기능을 기반으로 이미 게시된 글이나 작성된 문서 또는 고정된 내용에 기반하고 있다. 본 논문에서는 SNS에 게시되는 다양한 이슈, 대화, 관심 분야, 의견 등 동적인 메시지를 기반으로 이슈 키워드 및 연관 키워드를 추출하여 잠재적 쇼핑 연관 키워드 광고 마케팅에 도움을 주는 시스템(KAES: Keyword Advertisement Extraction System based on SNS)을 개발한다. KAES 시스템은 특정 계정 리스트를 작성하여 SNS에서 빈도수가 가장 많은 핵심 키워드 및 연관 키워드를 추출한다.

카이제곱 통계량을 이용한 이슈 단어 추출 (Issue Word Extraction Using Chi-square Statistics)

  • 신준수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.225-227
    • /
    • 2014
  • 최근 온라인 뉴스는 대중의 관심사 및 트렌드에 따라서 다양한 종류의 기사들이 작성된다. 이러한 관심사 및 트렌드는 시간의 흐름에 따라 계속 변한다. 본 논문에서는 온라인 뉴스의 기사 제목을 이용하여 시간에 따라 변하는 관심사 및 트렌드와 관련된 단어를 추출하는 방법을 제안한다. 특정 기간 별 출현하는 뉴스들을 하나의 카테고리로 가정하고 자질 선택 방법에서 널리 사용되는 카이제곱 통계량을 이용하여 각 카테고리의 주요 단어를 추출한다. 실험 결과 특정 기간 별 관심사 및 트렌드와 관련된 단어들이 출현하는 것을 확인하였다.

  • PDF

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.