• 제목/요약/키워드: topic extraction

검색결과 123건 처리시간 0.031초

토픽 모델링을 이용한 댓글 그래프 기반 소셜 마이닝 기법 (A Reply Graph-based Social Mining Method with Topic Modeling)

  • 이상연;이건명
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.640-645
    • /
    • 2014
  • 인터넷 상에서 많은 사람들은 사용자 간의 의사소통과 정보 공유, 사회적 관계를 생성하기 위한 방법으로 소셜 네트워크 서비스를 이용한다. 그 중 대표적인 트위터는 하루에 수백만 건의 소셜 데이터가 발생하기 때문에 수집되고 있는 데이터의 양이 엄청나다. 이 방대한 양의 데이터로부터 의미 있는 정보를 추출하는 소셜 마이닝이 집중적으로 연구되고 있다. 트위터는 일반적으로 유용한 정보 혹은 공유하고자 하는 내용을 팔로잉-팔로워 관계를 이용해 쉽게 전달하고 리트윗할 수 있다. 소셜 미디어에서 트윗 데이터에 대한 토픽 모델링은 이슈를 추적하기 위한 좋은 도구이다. 짧은 텍스트 기반인 트윗 데이터의 제한점을 극복하기 위해, 사용자를 노드로 사용자간 댓글과 리트윗 메시지의 여부를 간선으로 하는 그래프 구조를 갖는 댓글 그래프의 개념을 소개한다. 토픽 모델링의 대표적인 방법인 LDA 토픽 모델이 짧은 텍스트 데이터에 대해 비효율적인 것을 보완하기 위한 방법으로, 이 논문에서는 짧은 문서의 수를 줄이고 마이닝 결과의 질을 향상시키기 위한 댓글 그래프를 사용하는 토픽 모델링 방법을 소개한다. 제안한 모델은 토픽 모델링 방법으로 LDA 모델을 사용하였으며, 7일간 수집한 트윗 데이터에 대한 실험 결과를 보인다.

An Efficient Implementation of Key Frame Extraction and Sharing in Android for Wireless Video Sensor Network

  • Kim, Kang-Wook
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권9호
    • /
    • pp.3357-3376
    • /
    • 2015
  • Wireless sensor network is an important research topic that has attracted a lot of attention in recent years. However, most of the interest has focused on wireless sensor network to gather scalar data such as temperature, humidity and vibration. Scalar data are insufficient for diverse applications such as video surveillance, target recognition and traffic monitoring. However, if we use camera sensors in wireless sensor network to collect video data which are vast in information, they can provide important visual information. Video sensor networks continue to gain interest due to their ability to collect video information for a wide range of applications in the past few years. However, how to efficiently store the massive data that reflect environmental state of different times in video sensor network and how to quickly search interested information from them are challenging issues in current research, especially when the sensor network environment is complicated. Therefore, in this paper, we propose a fast algorithm for extracting key frames from video and describe the design and implementation of key frame extraction and sharing in Android for wireless video sensor network.

A HANDY SPECTROGRAPH AND ITS APPLICATION IN ASTRONOMICAL EDUCATION

  • SONG, IN-OK
    • 천문학논총
    • /
    • 제30권2호
    • /
    • pp.757-759
    • /
    • 2015
  • I use a common educational spectrographic device (SV2100R) in order to obtain astronomical spectra after inventing a new adaptor for telescopes. Experimental classes and learning projects in schools and public outreach are well established regarding imaging and photometry observations. However, experiments using astronomical spectrographs are rather hard to find because the procedures of spectral extraction and wavelength calibration is less convenient. SV2100R is a 1D CCD array and thus has the advantage of not requiring spectral extraction. In addition, basic wavelength calibration is preformed by the the provided software. It was adapted to a 12-inch reflecting telescope in the Korea Science Academy of KAIST in Busan and a spectrum of the bright object, Arcturus, was successfully obtained. This means one can provide educational programs on the topic of astronomical spectra. A few suggested projects are presented.

유전자 알고리즘을 활용한 부실예측모형의 구축 (A GA-based Rule Extraction for Bankruptcy Prediction Modeling)

  • Shin, Kyung-shik
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.83-93
    • /
    • 2001
  • 기업부실예측은 과거로부터 많은 연구가 이루어진 분야로, 주로 통계기법에 의한 분류예측문제로 다루어져 왔다. 최근에는 인공신경망, 의사결정나무 등 비선형성을 반영할 수 있는 인공지능 기법을 적용한 연구가 많이 수행되고 있다. 본 연구에서는 최적화에 주로 활용하는 인공지능 기법인 유전자 알고리즘을 규칙추출을 통한 기업부실예측 모형의 개발에 적용하고, 활용가능성을 검증하였다.

  • PDF

아이디어 마이닝 분야에서 문헌과 웹페이지의 아이디어 발췌에 대한 연구 (A Study on Extracting Ideas from Documents and Webpages in the Field of Idea Mining)

  • 이태영
    • 정보관리학회지
    • /
    • 제29권1호
    • /
    • pp.25-43
    • /
    • 2012
  • 일반적인 문헌/문서나 웹페이지에서 창조에 도움이 되는 아이디어와 준아이디어를 색출하기 위하여 아이디어 마이닝 기법을 적용하였다. 아이디어 마이닝과 의견 마이닝 및 논제 신호 마이닝에서 사용하는 발췌 기법으로 웹 페이지, 문헌, 문서 등에 포함되어 있는 아이디어를 발췌하였다. 발췌 기법을 (1) 결정적 단서 어구, (2) 단서 멀티미디어, (3) 문맥 신호, 및 (4) 담화 구절 방법으로 정리하여 7가지 아이디어 유형 -사상, 계획, 의견, 글, 그림, 소리, 공식 별로 실험하였다. 각 기법들의 효율성은 재현율과 정확률을 혼합한 F 측정값으로 판단하였고 (1), (3), (4) 방법은 대체로 긍정적인 평가를 얻었다. 특히, 결정적 단서 어구는 아이디어 적출에 문맥 신호는 준아이디어 추출에 효과적인 것으로 판단되었다.

6단계 상향식 방법에 의한 국방 온톨로지 추출 (Extraction of Military Ontology Using Six-Step Bottom-up Approach)

  • 나민영;양경용
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.17-26
    • /
    • 2009
  • 국방 분야에서 기존에 구축된 정보시스템은 대부분 대용량의 정보처리 등 단순한 정보처리 중심이었기 때문에 정보의 지적인 수행 능력이나 지식의 표현기술에 대한 능력은 부족한 실정이다. 따라서 기존의 국방정보시스템이 효율적 정보검색 및 관리를 가능케 하는 지능형 국방정보시스템으로 변화되기 위해서는 지식 구축의 핵심이 되는 국방 온톨로지 구축이 필수적이다. 본 논문에서는 6단계 상향식 방법을 이용한 온톨로지 추출 방안을 기술하고, 이를 국방교육훈련 분야에 적용하여 국방 온톨로지 프로토타입을 추출한 후 대표적인 온톨로지 개발 툴인 $Prot\acute{e}g\acute{e}$를 이용하여 구현하였다.

모바일 환경에서 사용자 정보를 이용한 스토리 생성 방법 (Story Generation Method using User Information in Mobile Environment)

  • 홍진표;차정원
    • 인터넷정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.81-90
    • /
    • 2013
  • 모바일 기기는 사용자가 늘 지니고 다니기 때문에 사용자의 주변 환경이나 행동 양상에 대한 매우 유용한 정보를 얻을 수 있다. 본 논문에서는 이들 정보를 하루 단위로 수집하여 하룻동안에 있었던 사용자의 행동에 대한 주제를 추출하고 이를 이용해 자동으로 일기를 생성하는 방법을 제안한다. 이를 위해 (1) 모바일 기기에서 사용자 행동 양상에 대한 정보를 모두 수집하고 (2) 수집한 정보로부터 개체명과 주제 연관 정보를 추출해 사용자가 그 날 있었던 일에 대한 주제를 추출한다. (3) (2)의 결과로부터 주제와 연관된 사건인 에피소드를 결정하고 (4) 문장 템플릿을 이용하여 문장을 생성한 후, 주제별 혹은 시간별로 스토리를 구성한다. 본 논문에서 제안한 방법은 기존의 방법보다 간단하기 때문에 모바일 기기 내에서도 수행이 가능하므로 개인 정보를 유출할 수 있는 문제를 최소화 할 수 있다. 또한, 본 논문에서는 문장의 형태로 정보를 제공하기 때문에 보다 많은 정보를 표현할 수 있다. 그리고 문장 생성 과정에 생성되는 주제 정보는 사용자의 행동 양상을 파악하는 자료로 이용할 수 있으므로 이를 바탕으로 한 사용자 맞춤형 서비스를 제공하는데 도움을 줄 수 있을 것으로 기대된다.

LDA 기반 사용자 감정분석을 위한 문서 토픽 추출 시스템에 대한 연구 (A Study on the Document Topic Extraction System for LDA-based User Sentiment Analysis)

  • 안윤빈;김학영;문용현;황승연;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.195-203
    • /
    • 2021
  • 최근 IT 분야의 주요 기술인 빅데이터는 다양한 산업 분야로 확장되고 있으며 활용 방안에 대한 연구가 활발하게 진행 중이다. 대부분의 인터넷 산업 분야에서 사용자 리뷰는 이용자가 상품 구매를 결정하는 데 많은 도움을 준다. 그러나 방대한 제품 리뷰에서 긍정, 부정적 의미와 도움이 되는 리뷰를 선별하는 과정은 제품 구매 결정에 있어 많은 시간을 요구한다. 따라서 본 논문에서는 빅데이터 분석 기술인 LDA를 이용해 키워드를 분석 및 종합하여 사용자에게 의미 있는 정보를 제공하는 시스템을 설계하고 구현한다. 문서 토픽 추출을 위해 본 연구에서는 국내 도서 산업을 도메인으로 데이터를 크롤링하고, 빅데이터 분석을 실시한다. 이를 통해 사용자 리뷰의 토픽 및 감정단어를 바탕으로 상품에 대한 종합적인 정보를 제공함으로써 구매자에게 도움을 주고 나아가 리뷰 현황 분석을 통해 상품의 전망 또한 파악할 수 있다.

워라밸 이슈 비교 분석: 한국과 미국 (Comparative Analysis of Work-Life Balance Issues between Korea and the United States)

  • 이소현;김민수;김희웅
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제28권2호
    • /
    • pp.153-179
    • /
    • 2019
  • Purpose This study collects the issues about work-life balance in Korea and United States and suggests the specific plans for work-life balance by the comparison and analysis. The objective of this study is to contribute to the improvement of people's life quality by understanding the concept of work-life balance that has become the issue recently and offering the detailed plans to be considered in respect of individual, corporate and governmental level for society of work-life balance. Design/methodology/approach This study collects work-life balance related issues through recruit sites in Korea and United States, compares and analyzes the collected data from the results of three text mining techniques such as LDA topic modeling, term frequency analysis and keyword extraction analysis. Findings According to the text mining results, this study shows that it is important to build corporate culture that support work-life balance in free organizational atmosphere especially in Korea. It also appears that there are the differences against whether work-life balance can be achieved and recognition and satisfaction about work-life balance along type of company or sort of working. In case of United States, it shows that it is important for them to work more efficiently by raising teamwork level among team members who work together as well as the role of the leaders who lead the teams in the organization. It is also significant for the company to provide their employees with the opportunity of education and training that enables them to improve their individual capability or skill. Furthermore, it suggests the roles of individuals, company and government and specific plans based on the analysis of text mining results in both countries.

Improvement of recommendation system using attribute-based opinion mining of online customer reviews

  • Misun Lee;Hyunchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.259-266
    • /
    • 2023
  • 본 논문에서는 속성기반 오피니언 마이닝(ABOM)을 적용한 협업 필터링의 정확도 성능을 개선할 수 있는 알고리즘을 제안한다. 실험을 위해 국내 스마트폰 사용자의 스마트폰 앱에 대한 총 1,227건의 온라인 소비자 리뷰 데이터가 분석에 사용되었다. KKMA(꼬꼬마)분석기를 이용하여 형태소 분석 및 KOSAC를 사용하여 감성어 분석 후 LDA 토픽 모델링을 사용하여 속성 추출한 가중치 값을 부여한 리뷰별로 토픽 모델링 결과를 이용하여 협업필터링의 평점과 감성스코어의 평점을 합산한 평균값 정확도 오차를 계산한 통계모형 성능 평가인 MAE, MAPE, RMSE를 사용하였다. 실험을 통해 추천 알고리즘 중 전통적인 협업필터링과 LDA 속성 추출과 감성분석을 결합한 속성기반 오피니언 마이닝(Aspect-Based Opinion Mining, ABOM) 기법을 결합하여 온라인 고객의 앱 평점(APP_Score) 대한 정확도를 예측하였다. 분석 결과 전통적인 협업필터링을 구현한 평점의 정확도 보다 속성기반 오피니언 마이닝 CF를 적용한 평점의 예측 정확도가 더 우수한 것으로 나타났다.