• 제목/요약/키워드: Topic modelling

검색결과 55건 처리시간 0.028초

토픽모델링을 활용한 4차 산업혁명의 주요 이슈 분석

  • 전정환;서용윤
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.1321-1321
    • /
    • 2017
  • Recently the attention to the 4th industrial revolution has been increasing. In the 4th industrial revolution era, the boundaries of physical space, digital space, and biological space are becoming blurred since the active convergence between various fields There are a lot of issues on the 4th industrial revolution such as artificial intelligence, internet of thing, big data, and cyber physical system. Accordingly, this study aims to analyse the main issues of the 4th industrial revolution. Data mining such as topic modelling method is used for the analysis. This study is expected to be helpful for the researcher and policy maker of the 4th industrial revolution.

  • PDF

Stock Forecasting Using Prophet vs. LSTM Model Applying Time-Series Prediction

  • Alshara, Mohammed Ali
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.185-192
    • /
    • 2022
  • Forecasting and time series modelling plays a vital role in the data analysis process. Time Series is widely used in analytics & data science. Forecasting stock prices is a popular and important topic in financial and academic studies. A stock market is an unregulated place for forecasting due to the absence of essential rules for estimating or predicting a stock price in the stock market. Therefore, predicting stock prices is a time-series problem and challenging. Machine learning has many methods and applications instrumental in implementing stock price forecasting, such as technical analysis, fundamental analysis, time series analysis, statistical analysis. This paper will discuss implementing the stock price, forecasting, and research using prophet and LSTM models. This process and task are very complex and involve uncertainty. Although the stock price never is predicted due to its ambiguous field, this paper aims to apply the concept of forecasting and data analysis to predict stocks.

Predicting the Saudi Student Perception of Benefits of Online Classes during the Covid-19 Pandemic using Artificial Neural Network Modelling

  • Beyari, Hasan
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.145-152
    • /
    • 2022
  • One of the impacts of Covid-19 on education systems has been the shift to online education. This shift has changed the way education is consumed and perceived by students. However, the exact nature of student perception about online education is not known. The aim of this study was to understand the perceptions of Saudi higher education students (e.g., post-school students) about online education during the Covid-19 pandemic. Various aspects of online education including benefits, features and cybersecurity were explored. The data collected were analysed using statistical techniques, especially artificial neural networks, to address the research aims. The key findings were that benefits of online education was perceived by students with positive experience or when ensured of safe use of online platforms without the fear cyber security breaches for which recruitment of a cyber security officer was an important predictor. The issue of whether perception of online education as a necessity only for Covid situation or a lasting option beyond the pandemic is a topic for future research.

이차원 수리-역학적 연계해석 시 유도배수 모델링 방법에 따른 수치해석적 비교연구 (A numerical comparative study on induced drainage modelling in 2D hydro-mechanical coupled analysis)

  • 유광호
    • 한국터널지하공간학회 논문집
    • /
    • 제10권1호
    • /
    • pp.91-104
    • /
    • 2008
  • 터널의 경우 안정성을 정량적으로 평가하기 위해 안전율 개념이 제안된 바 있다. 이는 역학적 해석의 범주에 한정된 것으로 수리 역학적(hyro-mechanical) 연계해석의 범주에서는 해석 모델링의 복잡성으로 인해 안전율 개념이 적용된 연구는 극히 드문 실정이다. 최근 들어 수리-역학적 연계해석에 관한 연구가 활발히 진행되고 있다. 본 연구에서는 해저 터널의 안전율을 정확히 산정하기 위해 수리-역학적 연계해석 시 유도배수 모델링 방법을 비교 분석하였다. 수치해석 시 터널 내부로 유도배수하는 방법으로는 숏크리트 수리특성을 조절하는 유도배수 방법과 집수정을 이용한 유도배수 방법이 고려되었다. 두 방법의 비교를 위해 암반등급, 숏크리트 두께, 암반 수리특성에 대하여 민감도 분석을 수행하였고, 연구 결과 해저터널의 수리-역학적 연계해석 시 집수정을 이용한 유도배수 방법을 사용하는 것이 터널의 안정성을 검토하는 데에 보다 신뢰성이 높은 것으로 나타났다.

  • PDF

An Exploratory Analysis of Online Discussion of Library and Information Science Professionals in India using Text Mining

  • Garg, Mohit;Kanjilal, Uma
    • Journal of Information Science Theory and Practice
    • /
    • 제10권3호
    • /
    • pp.40-56
    • /
    • 2022
  • This paper aims to implement a topic modeling technique for extracting the topics of online discussions among library professionals in India. Topic modeling is the established text mining technique popularly used for modeling text data from Twitter, Facebook, Yelp, and other social media platforms. The present study modeled the online discussions of Library and Information Science (LIS) professionals posted on Lis Links. The text data of these posts was extracted using a program written in R using the package "rvest." The data was pre-processed to remove blank posts, posts having text in non-English fonts, punctuation, URLs, emails, etc. Topic modeling with the Latent Dirichlet Allocation algorithm was applied to the pre-processed corpus to identify each topic associated with the posts. The frequency analysis of the occurrence of words in the text corpus was calculated. The results found that the most frequent words included: library, information, university, librarian, book, professional, science, research, paper, question, answer, and management. This shows that the LIS professionals actively discussed exams, research, and library operations on the forum of Lis Links. The study categorized the online discussions on Lis Links into ten topics, i.e. "LIS Recruitment," "LIS Issues," "Other Discussion," "LIS Education," "LIS Research," "LIS Exams," "General Information related to Library," "LIS Admission," "Library and Professional Activities," and "Information Communication Technology (ICT)." It was found that the majority of the posts belonged to "LIS Exam," followed by "Other Discussions" and "General Information related to the Library."

디지털 정보격차 관련 국내 연구 동향 분석 (Research Trend Analysis of Digital Divide in South Korea)

  • 고정현;강우진;이종욱
    • 한국도서관정보학회지
    • /
    • 제52권4호
    • /
    • pp.179-203
    • /
    • 2021
  • 본 연구의 목적은 디지털 정보격차 관련 국내 연구의 주요 이슈와 경향을 살펴보는 것이다. 이를 위해 2003년부터 2020년까지의 관련 논문 488건을 대상으로 연도별 논문 건수과 학술지 주제 영역을 분석하였으며, 추가적으로 토픽모델링과 단어네트워크 분석을 통해 연구 주제를 파악하였다. 분석 결과를 살펴보면, 첫째, 2007년까지 논문 건수가 증가하다가 이후 10년간 증감을 반복한 후 2019년부터 급증하는 것으로 나타났으며, 둘째, 사회과학, 복합학, 공학, 예술체육학 등 다양한 학문분야에서 연구가 이뤄지고 있으나, 최근 연구를 주도하는 분야는 사회과학과 복합학 분야인 것으로 나타났다. 셋째, 토픽모델링과 단어 네트워크 분석을 통해 연구의 주제는 '지역 간 디지털 정보격차', '장애인 디지털 정보격차', '디지털 정보격차의 기술적 환경', '디지털 정보 활용과 영향 격차', '디지털 정보격차의 법·제도적 환경', '노인 디지털 정보격차' 등 6개로 분류되었다. 넷째, 최근 들어 '디지털 정보 활용과 영향 격차', '디지털 정보격차의 기술적 환경'에 관련된 주제가 관심을 많이 받고 있는 것으로 나타났다.

토픽 모델링을 이용한 트위터 데이터의 공간 분포 패턴 분석 (Spatial Distribution Patterns of Twitter Data with Topic Modeling)

  • 우현지;김영훈
    • 한국지역지리학회지
    • /
    • 제23권2호
    • /
    • pp.376-387
    • /
    • 2017
  • 본 연구는 트위터를 대상으로 트윗 공간 데이터에서 지리적 의미를 탐색하기 위한 방법을 모색하였다. 트윗 공간 데이터의 구축 과정 및 지리적 분석의 프레임워크를 정립하고 지리적 연구 방법론을 제안하였다. 이를 위해 본 연구는 제주도의 GPS 좌표 참조 트윗(geotweet)을 대상으로 트윗의 내용적 특성과 트윗 발생 위치의 공간 분포 특성을 확인하였다. 제주도 좌표 참조 트윗에서는 지명 또는 장소명이 많이 출현하였는데, 이는 자신의 위치를 알리고자하는 의도로 파악하였다. 트윗의 공간 분포는 제주공항을 중심으로 한 일부 관광지 주변으로 핫스팟이 확인되었고, 이는 제주도 유동인구 핫스팟과 유사한 패턴을 보였다. 주제 중심의 트윗 분석을 위해 본 연구에서는 토픽 모델링 알고리즘을 이용하여 분석하였다. 분석 결과, 주제의 지리적 위치와 트윗의 내용은 서로 관련이 있음을 알 수 있었다. 마지막으로 본 연구는 토픽 모델링 분석을 통해 방대한 트윗 데이터의 내용에 상응하는 지역 분포 특성을 직관적으로 확인하는데 유용하게 활용될 수 있다는 것을 확인하였다.

  • PDF

국가해양력시스템의 구조모델화에 관한 연구 (A Study on the Structural Modelling of National Maritime Power System)

  • 임봉택;이철영
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 1999년도 추계학술대회논문집
    • /
    • pp.153-161
    • /
    • 1999
  • For composing the structure model of national maritime power system by system structural modelling, in this study, the 50 basic factors are selected by survey of the extensive and thorough literatures on maritime, sea, maritime power and sea power. And the basic factors are classified into 36 component factors by cluster method. The 9 attributes are extracted by the application of the principle component analysis method, one of the factor analysis method in system engineering, to component factors. We defined the attributes composing the national maritime power system by integration the result of this study and existed our studies relate to this topic. Which are showed in table 8. and we showed the structure model of national maritime power system in figure 3. In table 8, the 9 attributes are as follows: the fundamental power of maritime, shipping and port power, naval power, fishing power, shipbuilding power, the power of ocean research and development, dependency on seaborne trade, the protection power of ocean environment and the will and inclination of government.

빅데이터 분석을 활용한 사용자 경험 평가 방법론 탐색 : 아마존 에코에 대한 온라인 리뷰 분석을 중심으로 (Exploration of User Experience Research Method with Big Data Analysis : Focusing on the Online Review Analysis of Echo)

  • 황해정;심혜린;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.517-528
    • /
    • 2016
  • 이 연구는 이미 실생활에서 사용되고 있으나 이에 대한 실증적 사용자 경험 조사가 부족한 사물인터넷 기반 제품에 대한 새로운 사용자 경험 방법론을 탐색해보고자 진행되었다. 지금까지의 사용자 경험에 대한 연구가 주로 설문이나 관찰 방법 등을 통해 이루어져 온 것과 달리 본 연구에서는 사물인터넷 기반 제품 중 지능형 에이전트인 아마존 에코(Echo)를 대상으로 사용자들의 온라인 리뷰를 분석하는 빅데이터 분석 기법을 활용하여 사용자 경험을 살펴보았다. 토픽 모델링 분석 결과, 에코의 기능, 음성 인터랙션, 지속적인 기능 개선과 관련된 사용 경험 요인들이 도출되었다. 또한 회귀분석결과 지속적인 기능 개선이 만족도에 가장 큰 영향을 미치는 것으로 나타났다. 연구의 의의는 사용자 경험을 제고할 수 있는 지능형 사물인터넷 제품 연구방법으로서 빅데이터 분석방법론 활용 가능성을 제시한 점이다.

Grid Based Nonpoint Source Pollution Load Modelling

  • Niaraki, Abolghasem Sadeghi;Park, Jae-Min;Kim, Kye-Hyun;Lee, Chul-Yong
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2007년도 GIS 공동춘계학술대회 논문집
    • /
    • pp.246-251
    • /
    • 2007
  • The purpose of this study is to develop a grid based model for calculating the critical nonpoint source (NPS) pollution load (BOD, TN, TP) in Nak-dong area in South Korea. In the last two decades, NPS pollution has become a topic for research that resulted in the development of numerous modeling techniques. Watershed researchers need to be able to emphasis on the characterization of water quality, including NPS pollution loads estimates. Geographic Information System (GIS) has been designed for the assessment of NPS pollution in a watershed. It uses different data such as DEM, precipitation, stream network, discharge, and land use data sets and utilizes a grid representation of a watershed for the approximation of average annual pollution loads and concentrations. The difficulty in traditional NPS modeling is the problem of identifying sources and quantifying the loads. This research is intended to investigate the correlation of NPS pollution concentrations with land uses in a watershed by calculating Expected Mean Concentrations (EMC). This work was accomplished using a grid based modelling technique that encompasses three stages. The first step includes estimating runoff grid by means of the precipitation grid and runoff coefficient. The second step is deriving the gird based model for calculating NPS pollution loads. The last step is validating the gird based model with traditional pollution loads calculation by applying statistical t-test method. The results on real data, illustrate the merits of the grid based modelling approach. Therefore, this model investigates a method of estimating and simulating point loads along with the spatially distributed NPS pollution loads. The pollutant concentration from local runoff is supposed to be directly related to land use in the region and is not considered to vary from event to event or within areas of similar land uses. By consideration of this point, it is anticipated that a single mean estimated pollutant concentration is assigned to all land uses rather than taking into account unique concentrations for different soil types, crops, and so on.

  • PDF