• Title/Summary/Keyword: Big6 model

Search Result 311, Processing Time 0.024 seconds

XAI 기법을 이용한 리뷰 유용성 예측 결과 설명에 관한 연구 (Explainable Artificial Intelligence Applied in Deep Learning for Review Helpfulness Prediction)

  • 류동엽;이흠철;김재경
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.35-56
    • /
    • 2023
  • 정보통신 기술의 발전에 따라 웹 사이트에는 수많은 리뷰가 지속적으로 게시되고 있다. 이로 인해 정보 과부하 문제가 발생하여 사용자들은 본인이 원하는 리뷰를 탐색하는데 어려움을 겪고 있다. 따라서, 이러한 문제를 해결하여 사용자에게 유용하고 신뢰성 있는 리뷰를 제공하기 위해 리뷰 유용성 예측에 관한 연구가 활발히 진행되고 있다. 기존 연구는 주로 리뷰에 포함된 특성을 기반으로 리뷰 유용성을 예측하였다. 그러나, 예측한 리뷰가 왜 유용한지 근거를 제시할 수 없다는 한계점이 존재한다. 따라서 본 연구는 이러한 한계점을 해결하기 위해 리뷰 유용성 예측 모델에 eXplainable Artificial Intelligence(XAI) 기법을 적용하는 방법론을 제안하였다. 본 연구는 Yelp.com에서 수집한 레스토랑 리뷰를 사용하여 리뷰 유용성 예측에 관한 연구에서 널리 사용되는 6개의 모델을 통해 예측 성능을 비교하였다. 그 다음, 예측 성능이 가장 우수한 모델에 XAI 기법을 적용하여 설명 가능한 리뷰 유용성 예측 모델을 제안하였다. 따라서 본 연구에서 제안한 방법론은 사용자의 구매 의사결정 과정에서 유용한 리뷰를 추천할 수 있는 동시에 해당 리뷰가 왜 유용한지에 대한 해석을 제공할 수 있다.

생성적 적대 신경망과 딥러닝을 활용한 이상거래탐지 시스템 모형 (Fraud Detection System Model Using Generative Adversarial Networks and Deep Learning)

  • 김예원;유예림;최홍용
    • 경영정보학연구
    • /
    • 제22권1호
    • /
    • pp.59-72
    • /
    • 2020
  • 인공지능이 다루기 어려운 개념에서 아주 익숙한 도구로 자리매김 하고 있다. 이와 더불어 금융권에서도 인공지능 기술을 도입하여 기존 시스템의 문제점을 개선하고자 하는 추세이며, 그 대표적인 예가 이상거래탐지 시스템(Fraud Detection System, FDS)이다. 결제 수단의 다양화 및 전자금융거래의 증가에 따라 치밀해져 가는 사이버 금융사기(Fraud)를 기존의 규칙기반 FDS로는 탐지하기 어려워지고 있다. 이를 극복하기 위해 딥러닝 기술을 적용하여 이상거래 탐지율을 향상시키고, 이상행위에 즉각 대응하며, 탐지 결과의 반영을 자동화하고자 하는 시도가 이루어지고 있다. 딥러닝 FDS 구축에서 핵심 문제는 데이터 불균형과 이상거래 패턴의 변동이다. 본 논문에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)을 활용한 오버샘플링 기법을 통해 데이터 불균형 문제를 개선하고, 이상거래 분류기로써 심층 신경망(Deep Neural Network, DNN)과 합성곱 신경망(Convolutional Neural Network, CNN)을 적용하여 이러한 문제를 개선하고자 하였다. 실험 결과, GAN 오버샘플링이 이상거래 데이터의 불균형 문제를 개선하는데 효과를 보였으며, WGAN이 가장 높은 개선 효과가 있음을 확인하였다. 또한 제안 FDS 모형의 AUC가 0.9857로 랜덤포레스트 FDS 모형에 비해 약 6.5% 향상되어, 딥러닝이 이상거래 탐지에 뛰어난 성능을 가짐을 입증하였다. 더불어 딥러닝 모형 중 DNN은 CNN에 비해 오버샘플링의 효과를 더 잘 반영함을 확인하였다.

경제충격 시기의 한계소비성향 분석 - FIML 마코프-스위칭 모형 이용 (Marginal Propensity to Consume with Economic Shocks - FIML Markov-Switching Model Analysis)

  • 윤재호;이주형
    • 한국산학기술학회논문지
    • /
    • 제15권11호
    • /
    • pp.6565-6575
    • /
    • 2014
  • 본 논문에서 Hamilton의 마코프-스위칭 모형을 연립방정식으로 확장한 FIML 마코프-스위칭 모형을 제시해 보았다. 본 논문의 FIML 마코프-스위칭 모형을 LIML 마코프-스위칭 모형 등과 비교하면 LIML 마코프-스위칭 모형은 FIML 마코프-스위칭 모형의 특별한 경우이며 FIML 마코프-스위칭 모형은 연립방정식으로 확장된 일반화된 모형 형태를 띄게 된다. 본 논문의 FIML 마코프-스위칭 모형을 Campbell and Mankiw 소비함수에 적용해 본 결과, 2008년 부동산 거품 붕괴와 같은 경제충격 시기의 한계소비성향은 매우 민감도가 높아진다는 것을 알 수 있다.

An Ensemble Approach to Detect Fake News Spreaders on Twitter

  • Sarwar, Muhammad Nabeel;UlAmin, Riaz;Jabeen, Sidra
    • International Journal of Computer Science & Network Security
    • /
    • 제22권5호
    • /
    • pp.294-302
    • /
    • 2022
  • Detection of fake news is a complex and a challenging task. Generation of fake news is very hard to stop, only steps to control its circulation may help in minimizing its impacts. Humans tend to believe in misleading false information. Researcher started with social media sites to categorize in terms of real or fake news. False information misleads any individual or an organization that may cause of big failure and any financial loss. Automatic system for detection of false information circulating on social media is an emerging area of research. It is gaining attention of both industry and academia since US presidential elections 2016. Fake news has negative and severe effects on individuals and organizations elongating its hostile effects on the society. Prediction of fake news in timely manner is important. This research focuses on detection of fake news spreaders. In this context, overall, 6 models are developed during this research, trained and tested with dataset of PAN 2020. Four approaches N-gram based; user statistics-based models are trained with different values of hyper parameters. Extensive grid search with cross validation is applied in each machine learning model. In N-gram based models, out of numerous machine learning models this research focused on better results yielding algorithms, assessed by deep reading of state-of-the-art related work in the field. For better accuracy, author aimed at developing models using Random Forest, Logistic Regression, SVM, and XGBoost. All four machine learning algorithms were trained with cross validated grid search hyper parameters. Advantages of this research over previous work is user statistics-based model and then ensemble learning model. Which were designed in a way to help classifying Twitter users as fake news spreader or not with highest reliability. User statistical model used 17 features, on the basis of which it categorized a Twitter user as malicious. New dataset based on predictions of machine learning models was constructed. And then Three techniques of simple mean, logistic regression and random forest in combination with ensemble model is applied. Logistic regression combined in ensemble model gave best training and testing results, achieving an accuracy of 72%.

A Hybrid Multi-Level Feature Selection Framework for prediction of Chronic Disease

  • G.S. Raghavendra;Shanthi Mahesh;M.V.P. Chandrasekhara Rao
    • International Journal of Computer Science & Network Security
    • /
    • 제23권12호
    • /
    • pp.101-106
    • /
    • 2023
  • Chronic illnesses are among the most common serious problems affecting human health. Early diagnosis of chronic diseases can assist to avoid or mitigate their consequences, potentially decreasing mortality rates. Using machine learning algorithms to identify risk factors is an exciting strategy. The issue with existing feature selection approaches is that each method provides a distinct set of properties that affect model correctness, and present methods cannot perform well on huge multidimensional datasets. We would like to introduce a novel model that contains a feature selection approach that selects optimal characteristics from big multidimensional data sets to provide reliable predictions of chronic illnesses without sacrificing data uniqueness.[1] To ensure the success of our proposed model, we employed balanced classes by employing hybrid balanced class sampling methods on the original dataset, as well as methods for data pre-processing and data transformation, to provide credible data for the training model. We ran and assessed our model on datasets with binary and multivalued classifications. We have used multiple datasets (Parkinson, arrythmia, breast cancer, kidney, diabetes). Suitable features are selected by using the Hybrid feature model consists of Lassocv, decision tree, random forest, gradient boosting,Adaboost, stochastic gradient descent and done voting of attributes which are common output from these methods.Accuracy of original dataset before applying framework is recorded and evaluated against reduced data set of attributes accuracy. The results are shown separately to provide comparisons. Based on the result analysis, we can conclude that our proposed model produced the highest accuracy on multi valued class datasets than on binary class attributes.[1]

BERTopic 모델을 이용한 항공사 서비스에서 지각된 고객가치가 고객 만족도에 미치는 영향 분석 (The Effect of Perceived Customer Value on Customer Satisfaction with Airline Services Using the BERTopic Model)

  • 정의주;이병현;이청용;김재경
    • 지식경영연구
    • /
    • 제24권3호
    • /
    • pp.95-125
    • /
    • 2023
  • 항공산업의 급격한 성장으로 인해 많은 항공사가 생기면서 고객들이 항공사를 선택할 때 고려하는 요소가 늘어나고 있다. 이에 따라 항공사는 고품질의 서비스와 차별화된 경험적 가치를 제공하여 고객가치를 높이고 있다. 초기 고객가치 연구는 제품 및 서비스에 대한 효용성의 관점에서 비용과 편익 간의 상충관계로 간주하고 실용적 가치 중심으로 이루어졌지만, 최근에는 경험적 측면의 가치의 중요성이 주목받았다. 그러나 경험적 측면의 가치는 제품이나 서비스 상황에 따라 고객가치를 구성하는 요소가 변화되기 때문에 제품이나 서비스에 대한 고객의 선호도를 충분히 나타내는 특정 맥락에서 조사해야 한다. 또한, 고객가치는 고객이 의사결정을 내릴 때 큰 영향을 미치므로 항공사는 고객가치를 구성하는 요소를 정확하게 이해하는 것이 필요하다. 따라서 본 연구에서는 항공 전문 웹사이트인 스카이트랙스(Skytrax)에서 고객이 작성한 리뷰와 평점을 수집하고 BERTopic 모델을 활용하여 고객가치에 대한 요소를 도출하였다. 분석 결과, 항공사에서 고객가치를 구성하는 9가지 요소를 파악하였으며 이 중 6가지 요소가 고객 만족도와 영향을 미침을 확인하였다. 이를 통해 본 연구는 고객가치의 세분화된 파악을 가능하게 하는 새로운 방법론을 제안하고, 항공사에 구체적인 서비스 품질 향상을 위한 방향을 제시한다는 의의와 시사점을 가진다.

건설사업관리(CM)에서의 6시그마(${\sigma}$) 적용 조건 분석을 통한 추진 모델 구축 (Process Model for 6 Sigma(${\sigma}$) in Construction Management(CM))

  • 김창교;이재석;전재열
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2006년도 정기학술발표대회 논문집
    • /
    • pp.478-482
    • /
    • 2006
  • 국내 기업들은 치열한 국제경쟁력에서 시장의 선도적 위치를 확보하기 위하여 가격 및 품질 우위 전략을 꾸준히 추진하고 있다. 건설산업에서도 건설시장 개방에 따른 해외기업들과의 경쟁 상황에 놓이게 되면서 기업의 경영전략, 방향 및 핵심결정요소들에 대한 연구에 여념이 없으며, 따라서 무엇보다도 기업의 경쟁력 강화가 중요한 우선순위에 오르게 된다. 이러한 기업의 경쟁력 강화를 위하여 많은 기업으로부터 큰 관심을 유도하고 있는 기법이 6시그마(Sigma) 기법이다. 6 시그마 기법의 선행 연구들은 제조업과 서비스업을 대상으로 수행된 것이 대부분이다. 건설업과 관련한 연구는 6시그마의 도입 및 고찰 단계에 머물러 있으며, 실제 도입은 "S건설" 1개사만 도입하여 적용하고 있기 때문에 그 적용 성과에 대하여는 한계를 가질 수밖에 없다. 그렇지만 상기에 언급한 것처럼 시장 환경의 급격한 변화에 따른 국제 경쟁력 확보를 위하여 6시그마 도입은 필수적이라 판단하고, 이에 대한 논리적 타당성의 전개 및 이를 검증하기 위한 설문조사를 통하여 건설깅버의 6시그마 적용 가능성을 확인함으로서 6시그마 도입 적용의 한계성을 극복하는 것이 본 연구의 목적이라고 할 것이다.

  • PDF

열가압성형도재 코어의 가시광선 투과율에 관한 연구 (A study on the visible wave of transmittance pressable ceramic core)

  • 정인호;이상덕;남상용
    • 대한치과기공학회지
    • /
    • 제34권1호
    • /
    • pp.1-9
    • /
    • 2012
  • Purpose: The purpose of this study was to investigate the transmittance differences of pressable ceramic core due to thickness within the visible light spectrum. Methods: 36 specimens were divided into 2 groups (0.6mm, 0.8mm) which have each 3 specimens. The size of specimens was 10mm high and 10mm wide. The transmittance of specimens are measured by spectrophotometer Model Cary 500 that can measure infrared-ray, visible wave and ultraviolet-ray. Results: The results shows that there was no significant difference between specimen's thickness(0.6mm, 0.8mm) and transmittance. Conclusion: The individual's color perception is personal and there are numerous factors that influence on it. In general, human eye can perceive the color of thing only within visible light spectrum but in this experiment through spectrophotometer there was no big difference between specimen's thickness(0.6mm, 0.8mm) and transmittance. To sum up, The most important factors were a layed porcelain structure and its thickness rather than core thickness in the porcelain crown. Also, When making all ceramic core with dead pulp (nervous treatment tooth) when used as a restorative esthetic think is more efficient to improve.

Structures of a Solar Filament Observed with FISS on 2010 July 29

  • 송동욱;채종철
    • 천문학회보
    • /
    • 제36권1호
    • /
    • pp.38.2-38.2
    • /
    • 2011
  • In general, solar filaments are divided into two parts; one spine and several barbs. Barbs are seen as if they protrudes from the spine. Until now there are many controversies about the structures of a barb and spine. Recently, New Solar Telescope was installed at Big Bear Solar Observatory. Its clear aperture is about 1.6m and it is the largest telescope among ground-based solar telescopes. Fast Imaging Solar Spectrograph (FISS) developed by SNU and KASI was also installed in a vertical optical table in Coude room of the 1.6m NST. It is simultaneously able to record two lines; $H{\alpha}$ and Ca II 8542A lines. On 2010 July 29, we observed a portion of a solar filament located in northern hemisphere with FISS and it had a well-developed barb. And we also observed a potion of a spine. In order to analyze the data, we used the cloud model and obtained physical quantities of the solar filament. Temperature of the solar lament ranged between 4500K and 12000K and non-thermal velocity ranged between 3km/s and 6.5km/s. By comparing physical quantities of a barb and spine, we try to understand these structures of the solar filament.

  • PDF

SWAT과 MODSIM-DSS 모형을 연계한 금강유역의 농업용수 공급능력 평가 (Assessment of Agricultural Water Supply Capacity Using MODSIM-DSS Coupled with SWAT)

  • 안소라;박근애;김성준
    • 대한토목학회논문집
    • /
    • 제33권2호
    • /
    • pp.507-519
    • /
    • 2013
  • 본 연구에서는 SWAT 모형과 MODSIM-DSS 모형을 이용하여 금강유역(9,865 $km^2$)의 농업용수 공급능력을 평가하고자 하였다. 하천유역 네트워크 물수지 모형인 MODSIM-DSS를 이용하여 금강유역을 14개의 소유역으로 구분하고 다목적댐과 농업용 수리시설을 고려한 물수지 네트워크를 소유역별로 구성하여 물수지 분석을 수행하였다. MODSIM-DSS의 유역별 유입량(공급량) 자료는 SWAT 모형의 소유역별 유출결과를 사용하였다. SWAT 모형의 신뢰성 있는 유출량 보정을 위해 금강유역 내 위치하는 2개의 다목적댐(용담, 대청)의 실측 방류량을 이용하여 댐 운영모의를 고려하여 모형의 보정(2005~2007)과 검증(2008~2010)을 실시하였다. 이후 MODSIM-DSS를 이용하여 8개년(2004~2011) 동안의 물수지 분석을 수행한 결과 과거 실제로 가뭄이 발생했던 기간인 2006년, 2008년, 2009년에 농업용수 부족량이 평년에 비해 많이 발생하는 것으로 나타났으며, 부족량은 각각 282 $10^6m^3$, 286 $10^6m^3$, 329 $10^6m^3$로 분석되었다. 유역평균 농업용수 공급능력이 86.4%인데 비해 2006년, 2008년, 2009년에 각각 81.6%, 81.5%, 78.5%로 농업용수 공급능력이 떨어지는 것을 알 수 있었다.