• 제목/요약/키워드: LDA기법

검색결과 212건 처리시간 0.031초

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

평점 기반 추천시스템을 위한 토픽 모델 협업필터링 (Collaborative Filtering Using Topic Models for Rating Based Recommender Systems)

  • 김광섭;정호경;이현종;김형준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.381-383
    • /
    • 2012
  • 협업필터링은 지금까지 많은 추천시스템 연구에서 비교대상이 되거나 더 좋은 추천시스템 방법론을 개발하기 위해서 응용되고 있다. 일반적으로 협업필터링 기법은 명시적으로 관찰된 사용자들의 행동을 기반하는 방법이다. 본 연구에서는 LDA(Latent Dirichlet Allocation)을 이용해 사용자와 추천 대상이 되는 아이템의 숨겨진 특성을 추출하고, 이를 협업필터링기법에 응용했다. 영화 추천시스템 구축을 위한 실험에서, 사용자의 선호도는 다양한 영화 장르를 선호하는 비율로 나타난다는 가정(사용자기반)과 영화 또한 장르의 비율로 표현이 된다는 가정(아이템기반)을 했다. 이러한 가정을 토대로 사용자 사이와 영화 사이 간의 유사도를 정의하고, 협업필터링에 적용했을 때, 전통적인 협업필터링 기법보다 뛰어난 결과를 얻을 수 있었다.

트위터 분석을 이용한 카테고리별 실시간 트렌드 추출 기법 (Real-time Category Trend Extraction Scheme based on Twitter Analysis)

  • 나병진;김용성;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1581-1584
    • /
    • 2015
  • 최근 소셜 네트워크 서비스상의 데이터를 실시간으로 분석하여 의미있는 정보를 찾아내기 위한 연구가 활발하게 진행되고 있다. 특히, 스마트폰과 같은 스마트 디바이스를 이용하는 많은 사용자들이 실시간으로 발생하는 이벤트를 소셜 네트워크상에 게재하고 서로 공유하면서, 대중들이 관심을 가지는 토픽의 경우 굉장히 빠르게 확산되는 경향을 보이고 있다. 본 논문에서는 이러한 SNS의 특성을 토대로 트위터상의 트윗을 분석하여 여러 분야의 토픽들을 카테고리별로 분류하고, 카테고리별 트렌드를 추출하여 실시간으로 시각화하는 기법을 제안한다. 이를 위해, 트위터를 기반으로 SVM 분류 알고리즘과 Twitter-LDA를 통하여 트윗을 분야별로 분류하고, 각각의 트렌드를 이루는 대표적인 키워드를 선출하여 이를 기반으로 실시간 트렌드를 추출한다. 제안하는 기법의 성능을 평가하기 위해, 분류 특징 선택의 신뢰도를 측정한다.

온라인 리뷰를 활용한 관광지 키워드 추출 기법 - 토픽 모델링과 Markov Chain (Keyword Extraction Technique for Attractions using Online Reviews - Topic Modeling and Markov Chain)

  • 김명선;이강우;임지원;홍순구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.521-523
    • /
    • 2021
  • 관광 분야에서 온라인 리뷰의 중요성이 커지고 있다. 온라인 리뷰의 텍스트 데이터는 파악이 어렵다. 이에 본 연구에서는 특정 관광지에 대한 온라인 리뷰 텍스트 데이터가 나타내는 전반적인 의견을 직관적으로 도출하는 방법에 대해 알아보고자, 토픽 모델링과 Markov Chain을 시행했다. '해운대'에 대한 온라인 리뷰를 수집한 후, LDA와 BTM을 활용하여 주제를 도출하고, Markov Chain을 시각화하여 키워드 간의 관계와 전체적인 평가 내용을 확인했다. 사용된 기법은 각자 특징적인 결과를 제시했기 때문에 다양한 기법을 상보적으로 이용하기를 제안하였다.

텍스트마이닝 기법을 이용한 모바일 피트니스 애플리케이션 주요 요인 분석 : 사용자 경험 관점 (An Analysis on Key Factors of Mobile Fitness Application by Using Text Mining Techniques : User Experience Perspective)

  • 이소현;김진솔;윤상혁;김희웅
    • 한국IT서비스학회지
    • /
    • 제19권3호
    • /
    • pp.117-137
    • /
    • 2020
  • The development of information technology leads to changes in various industries. In particular, the health care industry is more influenced so that it is focused on. With the widening of the health care market, the market of smart device based personal health care also draws attention. Since a variety of fitness applications for smartphone based exercise were introduced, more interest has been in the health care industry. But although an amount of use of mobile fitness applications increase, it fails to lead to a sustained use. It is necessary to find and understand what matters for mobile fitness application users. Therefore, this study analyze the reviews of mobile fitness application users, to draw key factors, and thereby to propose detailed strategies for promoting mobile fitness applications. We utilize text mining techniques - LDA topic modeling, term frequency analysis, and keyword extraction - to draw and analyze the issues related to mobile fitness applications. In particular, the key factors drawn by text mining techniques are explained through the concept of user experience. This study is academically meaningful in the point that the key factors of mobile fitness applications are drawn by the user experience based text mining techniques, and practically this study proposes detailed strategies for promoting mobile fitness applications in the health care area.

소형 액체로켓엔진 인젝터의 분무패턴 분석 (Spray Pattern Analysis of the Injector in a Small Liquid-Rocket Engine)

  • 정훈;김진석;김정수;박정;김성초;장기원
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2006년도 제27회 추계학술대회논문집
    • /
    • pp.146-149
    • /
    • 2006
  • 단일액체추진제 하이드라진 추력기의 인젝터로부터 발생하는 분무 특성을 파악하기 위해 입자영상유속계 및 레이저 도플러 유속계 기법을 적용하였다. 입자영상유속계를 이용하여 순간 평면 이미지를 획득하고 이 영상 자료를 통해 압력에 따른 분무정도 및 인젝터 분무성능을 판단하였다. 영상 이미지에서 누락된 분무 입자의 속도 및 입경 계측을 위해 레이저 도플러 유속계 계측방법을 적용하였다. 계측된 두 실험결과를 비교함으로써 분무 특성에 대한 명확한 이해 뿐만 아니라 인젝터 설계 변수 도출이 본 연구의 목적이다.

  • PDF

토픽 모형 및 사회연결망 분석을 이용한 한국데이터정보과학회지 영문초록 분석 (Analysis of English abstracts in Journal of the Korean Data & Information Science Society using topic models and social network analysis)

  • 김규하;박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.151-159
    • /
    • 2015
  • 이 논문에서는 텍스트마이닝 (text mining) 기법을 이용하여 한국데이터정보과학회지에 게재된 논문의 영어초록을 분석하였다. 먼저 다양한 방법을 통해 단어-문서 행렬 (term-document matrix)을 생성하고 이를 사회연결망 분석 (social network analysis)을 통해 시각화하였다. 또한 토픽을 추출하기 위한 방법으로 LDA (latent Dirichlet allocation)와 CTM (correlated topic model)을 사용하였다. 토픽의 수, 단어-문서 행렬의 생성방법에 따라 엔트로피 (entropy)를 통해 토픽 추출 모형들의 성능을 비교하였다.

토픽모델을 이용한 전력반도체 패키징 기술 동향 연구 (A Study on Technology Trend of Power Semiconductor Packaging using Topic model)

  • 박근서;최경현
    • 마이크로전자및패키징학회지
    • /
    • 제27권2호
    • /
    • pp.53-58
    • /
    • 2020
  • 전기자동차용 전력반도체 패키징 기술에 대한 분석을 수행하였다. 비정형 데이터인 특허들을 수집하여 유효특허를 도출하여 LDA 기법을 적용한 토픽모델링을 수행하였다. 20개의 토픽으로 분류하였고 각 토픽별 추출된 단어를 통해 기술에 대한 정의를 내렸다. 각 토픽의 대한 동향분석을 위해 연도별 빈도수에 대한 회귀분석을 통해 토픽별 Hot토픽과 Cold 토픽을 도출하여 전력반도체 패키징 기술의 동향을 분석하였다. Hot 토픽의 기술로는 내전압에 따른 패키지 구조 기술과 입출력 관련 제어 기술, 방열기술을 도출하였고 Cold 토픽 기술로는 인덕턴스 저감기술이 도출되었다.

얼굴인식 기술동향 (Face Recognition: A Survey)

  • 문현준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 3부
    • /
    • pp.172-177
    • /
    • 2008
  • 생체 인식은 개인의 고유한 생체 정보를 획득하여 개인 식별에 이용하는 기술로, 그중 얼굴 인식은 사용자의 편의성과 비강제성이라는 장점이 있는 응용기술로 평가 받고 있다. 본 논문에서는 얼굴인식 기술동향을 살펴보고 얼굴 영역 추출, 특정 추출, 매칭을 포함한 시스템에 대해 논한다. 얼굴 영역 추출에는 얼굴 형판 정합 방법과 얼굴 요소의 검출에 의한 방법을, 특정 추출에서는 PCA 와 LDA 등의 방법을, 그리고 매칭을 통한 인증 단계에서는 최근접 분류기를 소개한다. 다양한 얼굴 인식 기법들이 제시됨에 따라 공인된 성능 평가 방법이 필요하게 되는데, 대용량 표준 얼굴 DE의 구축과 얼굴 인식 성능 평가 방법 개발의 필요성을 제시한다. 향후 얼굴인식 시스템에서는 조명, 자세, 표정의 변화를 어떻게 보정하여 인식 할 것인가 하는 것이 연구되어야 할 핵심 분야로서 3차원 얼굴 영상 복원 기술을 통한 해결방법을 살펴본다.

  • PDF

텍스트마이닝을 활용한 Covid-19 기간 동안의 항공산업 관련 키워드 트렌드 분석 (Keyword trends analysis related to the aviation industry during the Covid-19 period using text mining)

  • 최동현;송보미;박다현;이성우
    • 한국산업정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.115-128
    • /
    • 2022
  • 본 연구는 Covid-19 팬데믹이 항공산업에 미친 영향과 동향을 살펴보고자 국내 뉴스 기사 데이터를 활용하여 키워드 트렌드 분석을 진행하였다. 데이터 수집을 위하여 Covid-19 발생 기준으로 전, 후 각 6개월의 기간을 나누어 '항공사' 키워드를 중심으로 관련 기사들을 추출하였다. 이후 기간별 동시 출현 빈도를 파악한 후 LDA 기법을 이용하여 토픽 모델링을 진행하였으며, Covid-19의 진행 동향과 토픽 패턴과의 관계 분석을 통해 상황에 따른 주요 토픽을 도출하였다. 이러한 결과를 활용하여 Covid-19와 같이 범세계적으로 영향을 주는 전염병이 발생할 경우 그 추이에 따라 항공산업에 미치는 영향을 예측할 수 있는 기초자료로 활용될 수 있을 것으로 기대된다.