• Title/Summary/Keyword: 회귀분석기법

Search Result 1,082, Processing Time 0.031 seconds

Sentiment Analysis for Public Opinion in the Social Network Service (SNS 기반 여론 감성 분석)

  • HA, Sang Hyun;ROH, Tae Hyup
    • The Journal of the Convergence on Culture Technology
    • /
    • v.6 no.1
    • /
    • pp.111-120
    • /
    • 2020
  • As an application of big data and artificial intelligence techniques, this study proposes an atypical language-based sentimental opinion poll methodology, unlike conventional opinion poll methodology. An alternative method for the sentimental classification model based on existing statistical analysis was to collect real-time Twitter data related to parliamentary elections and perform empirical analyses on the Polarity and Intensity of public opinion using attribute-based sensitivity analysis. In order to classify the polarity of words used on individual SNS, the polarity of the new Twitter data was estimated using the learned Lasso and Ridge regression models while extracting independent variables that greatly affect the polarity variables. A social network analysis of the relationships of people with friends on SNS suggested a way to identify peer group sensitivity. Based on what voters expressed on social media, political opinion sensitivity analysis was used to predict party approval rating and measure the accuracy of the predictive model polarity analysis, confirming the applicability of the sensitivity analysis methodology in the political field.

인공 신경망 기법을 이용한 제지공정의 지절 원인 분석

  • 이진희;이학래
    • Proceedings of the Korea Technical Association of the Pulp and Paper Industry Conference
    • /
    • 2001.04a
    • /
    • pp.168-168
    • /
    • 2001
  • 제지공정의 지절 현상은 많은 공정 변수들이 복합적으로 작용하여 발생하는 가장 큰 공정 트러블 중의 하나이다. 지절은 생산량 감소 뿐만 아니라 발생 후 공정의 복구 와 정리, 생산재가동 및 공정의 재안정화를 위해 많은 시간과 비용, 그리고 노력이 투 입되어야 하므로 공정의 효율과 생산성을 크게 저하시키는 요인이다. 그러나 지절 현상 의 복잡성 때문에 이에 대해 쉽게 접근하거나 해결하지 못하고 있는 것이 현실이지만 그 필요성은 더욱 더 증대되고 있다. 본 연구에서는 최근 들어 각종 산업분야에서 복잡 한 공정상의 결점 발견 및 진단에 효과적이라고 인정받고 있는 예측 분석기법인 인공 신경망(artificial neural network) 시율레이션과 일반적인 통계기법 중의 하나인 주성분 분석을 이용하여 제지 공정의 지절 현상의 검토 가능성을 타진하였다. 인공신경망이란 인간두뇌에서 일어나는 자극-반응-학습과정을 모사하여 현실세계에 존재하는 다양한 현상들의 업력벡터와 출력상태 간의 비선형 mapping올 컴퓨터 시율 레이션을 통하여 분석하고자 하는 기법으로, 여러 가지 현상들을 학습을 통해서 인식하 는 신경망 내의 신경단위들이 병렬처리에 의해 많은 양의 자료에 대한 추론이나 판단 을 신속하고 정확하게 해주는 특징이 있으며 실시간 패턴인식이나 분류 응용분야에도 매우 매력적으로 이용되고 있는 방법이다. 이러한 인공 신경망 기법 중에서도 본 연구 에서는 퍼셉트론의 한계점을 극복하기 위하여 입력총과 출력층에 한 개 이상의 은닉층 ( (hidden layer)을 사용하여 다층 네트워으로 구성하고, 모든 입력패턴에 대하여 발생하 는 오차함수를 최소화하는 방향으로 연결강도를 조정하는 back propagation 학습 알고 리즘을 사용하였다. 지절의 원인으로 추정 가능한 공정인자들을 변수로 하여 최적의 인 공신경망을 구축하기 위해 학습률과 모멘트 상수의 변화 및 은닉층의 수와 출력층의 뉴런 수를 조절하는 동의 작업을 거쳐 네트워크의 정확도가 높은 인공신경망을 설계하 였다. 또한 이러한 인공신경망과의 비교분석을 위해 동일한 공정 데이터들올 이용하여 보편적으로 사용하는 통계기법 중의 하나인 주성분회귀분석을 실시하였다. 주성분 분석은 여러 개의 반응변수에 대하여 얻어진 다변량 자료의 다차원적인 변 수들을 축소, 요약하는 차원의 단순화와 더불어 서로 상관되어있는 반응변수들 상호간 의 복잡한 구조를 분석하는 기법이다. 본 발표에서는 공정 자료를 활용하여 인공신경망 과 주성분분석을 통해 공정 트러블의 발생에 영향 하는 인자들을 보다 현실적으로 추 정하고, 그 대책을 모색함으로써 이를 최소화할 수 있는 방안을 소개하고자 한다.

  • PDF

A Survey on the Critical Success Factors of Knowledge Management Using AHP (AHP 분석을 이용한 지식경영 실천 요소의 중요도에 관한 실증적 연구)

  • 이영수;박준아;정광식;김진우
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.85-94
    • /
    • 1999
  • 지식경영을 효과적으로 수행하기 위해서 기업은 지식경영을 구성하고 있는 요소를 정확히 이해할 필요가 있고, 이러한 중요 요소에 따라 투자가 이루어져야 한다. 본 연구는 지식경영의 중요 요소들을 제시함으로써, 앞으로 지식경영을 계획하고 있는 기업이 효과적으로 지식경영을 추진할 수 있는 활동 지침 및 투자 방향을 제시하고자 한다. 이를 위해, 본 연구에서는 각종 국내외 지식경영 관련 문헌에서 논의된 사항을 중심으로, 지식경영을 구성하는 30개의 중요요소를 추출하고, 분석계층도(AHP)를 이용하여 지식경영을 달성하기 위한 요소들을 위계적 구조로 정리하고, 최종단계에서 238개의 지식경영 구현의 평가기준을 마련하였다. 또한 실제로 지식경영 구현 요소들의 상대적 중요성을 파악하기 위해, 먼저 국내에서 지식경영을 추진하고 있거나 관심을 보이고 있는 48개 기업의 담당자 및 관련 부서원을 대상으로 설문조사를 실시하였고, 동시에 지식경영을 실제로 수행하고 있는 13개 기업의 담당자를 대상으로 각 기업에서 추진하고 있는 지식경영의 현황 파악을 위해 지식경영 실천의 평가기준에 대한 설문을 실시하였다. 이 두 가지 설문 조사 결과를 종합해 볼 때, 기업에서는 지식경영 구현 요소 중에서 인프라 내의 프로세스와 프로세스를 구성하는 지식의 활용과 전파 등이 중요하다고 인식하고 있는 반면, 실제로는 인프라 내의 정보기술과 프로세스를 구성하는 다른 한 축인 지식의 창출과 축적 면에 투자가 이루어진 것으로 나타났다. 이 외에도 지식화, 성과와 가치의 연계 그리고 지식의 가시화 등의 요소들은 상대적 중요도 인식과는 반대로 지식경영 추진에 있어 외면당하고 있는 것으로 나타났다. 따라서 본 연구는 지식 경영의 이러한 불균형을 시정할 수 있는 방향으로 앞으로의 투자가 수행되어야 할 것을 제안하고 있다. 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.(ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projects including scientific and technological effects. Since the HAN projects consists of 18 subprograms, it is difficult In evaluate all the subprograms

  • PDF

Stochastic Properties of Water Quality Variation in Downstream Part of Han River (한강 하류부의 수질변동에 대한 추계학적 특성(II) - 특히 뚝도 및 노량진 지점의 DO, 탁도, 수온의 변동을 중심으로 -)

  • 이홍근
    • Water for future
    • /
    • v.15 no.4
    • /
    • pp.13-29
    • /
    • 1982
  • 본 논문은 제15권 제3호(1982년 9월)의 제(I)보에 이어 기재되는 제(II)보이다. 제(I)보에서는 1. 서론 2. 분석기법과 수질모형의 이론, 3. 분석자료의 목차 순으로서 연구의 내용과 이론적 근거와 분석에 필요한 자료를 정리하여 제시하였다. 본 연구의 목적은 노량진 및 뚝도 지점의 DO, 탁도, 수온등의 특정수질에 대하여 (1) 수질의 주기성 발견, (2) 수질변동의 특성파악, (3) 시별 DO에 대한 자기 회귀모형의 추론, (4) 일별 DO에 대한 ARIMA 모형의 적용평가에 대한 것이다.

  • PDF

A Literature Review on the Commuting Behaviors and Urban Spatial Characteristics (통행행태와 도시공간특성에 관한 이론적 고찰)

  • Seo, Jong Gook
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2015.11a
    • /
    • pp.175-185
    • /
    • 2015
  • 본 연구에서는 TOD는 대중교통수단의 분담율 제고가 목적인데 이를 위한 정책대안의 모색에 필요한 새로운 분석기법을 제시하였다. 교통수단의 결정요인은 개인 특성과 라이프스타일 그리고 도시공간특성인데 이 요인들은 상호의존적으로 복합적 결합작용은 한다. 또한 개인과 그룹 및 지역 특성은 서로 다른 차원에서 상호의존성을 갖는다. 전통적 회귀분석과는 달리 위계적 분석모형은 요인들 간의 상호의존성과 복합결합적 영향관계를 규명하는 장점이 있다. 이러한 분석 기법에 의한 결과는 보다 효율적인 TOD정책 대한의 모색에 많은 기여를 할 것으로 기대된다.

  • PDF

Customer Churning Analysis by Using Data Mining in Credit Card Market (신용카드 시장에서 데이터마이닝을 이용한 이탈고객 분석)

  • 이건창;정남호;신경식
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.421-444
    • /
    • 2001
  • 최근 데이터 마이닝 기법이 주목받고 있는 이유 중의 가장 큰 이유는 자사가 보유하고 있는 고객의 특성을 파악함으로써 기존의 고객을 효과적으로 유지·관리할 수 있도록 지원하기 때문이다. 특히 고객 보유율 5% 신장이 수익률 120% 증대를 가져오는 것으로 보고되고 있는 신용카드 업계에서는 신규고객을 확보하는 것 만큼 기존 고객을 유지·관리하는 것이 중요하다. 특히, 신용카드를 발급 받고 거의 사용하지 않은 고객이나 쉽게 이탈하는 고객을 판별하는 것은 신용카드사의 입장에서는 비용절감 차원에서 매우 중요하다. 그러나 아직까지 어떠한 속성을 보유하고 있는 고객이 쉽게 이탈하는지를 판별할 수 있는 연구는 거의 진행되지 않았다. 이에 본 인구에서는 데이터마이닝 기법 중 널리 알려진 인공신경망, 로지스틱 회귀분석, C5.0 방법을 이용하여 신용카드 시장에서의 고객현황에 대하여 분석하고자 한다. 이를 위하여 본 연구에서는 모 신용카드사의 최근 4년간 (97넌 3월 이후) 가입고객 및 이탈고객을 대상으로 실증분석을 실시하였다. 분석결과 신용카드 시장에서 카드를 지속적으로 보유하고 있는 고객과 이탈하는 고객을 구분하는 속성이 존재함을 발견하였고, 이를 바탕으로 신용카드사가 수립해야 할 마케팅 전략을 제시하였다.

  • PDF

A Study on Regionalization of Parameters for Sacramento Continuous Rainfall-Runoff Model Using Watershed Characteristics (유역특성인자를 활용한 Sacramento 장기유출모형의 매개변수 지역화 기법 연구)

  • Kim, Tae-Jeong;Jeong, Ga-In;Kim, Ki-Young;Kwon, Hyun-Han
    • Journal of Korea Water Resources Association
    • /
    • v.48 no.10
    • /
    • pp.793-806
    • /
    • 2015
  • The simulation of natural streamflow at ungauged basins is one of the fundamental challenges in hydrology community. The key to runoff simulation in ungauged basins is generally involved with a reliable parameter estimation in a rainfall-runoff model. However, the parameter estimation of the rainfall-runoff model is a complex issue due to an insufficient hydrologic data. This study aims to regionalize the parameters of a continuous rainfall-runoff model in conjunction with a Bayesian statistical technique to consider uncertainty more precisely associated with the parameters. First, this study employed Bayesian Markov Chain Monte Carlo scheme for the estimation of the Sacramento rainfall-runoff model. The Sacramento model is calibrated against observed daily runoff data, and finally, the posterior density function of the parameters is derived. Second, we applied a multiple linear regression model to the set of the parameters with watershed characteristics, to obtain a functional relationship between pairs of variables. The proposed model was also validated with gauged watersheds in accordance with the efficiency criteria such as the Nash-Sutcliffe efficiency, index of agreement and the coefficient of correlation.

A Review of Statistical Methods in the Korean Journal of Orthodontics and the American Journal of Orthodontics and Dentofacial Orthopedics (대한치과교정학회지(KJO)와 미국교정학회지(AJODO)에서 사용된 통계기법의 비교분석 및 고찰(1999-2003))

  • Lim, Hoi-Jeong
    • The korean journal of orthodontics
    • /
    • v.34 no.5 s.106
    • /
    • pp.371-379
    • /
    • 2004
  • The purpose of this study was to investigate the changes and types of statistical methods used in the Korean Journal of Orthodontics (KJO) and the American Journal of Orthodontics and Dentofacial Orthopedics (AJODO) from )999 to 2003. The frequency of use, transitions, assumption check of statistical methods and types of advanced statistical methods were examined from each journal. The study consisted of 247 articles published in the KJO and randomly chosen 50 articles per year which were original articles and used statistical methods T-test, analysis of variance(ANOVA), correlation analysis, nonparametric analysis. regression analysis chi-square test. factor analysis, were the order of statistical methods most frequently used in the KJO, while t-test. ANOVA, nonparametric analysis, correlation analysis, regression analysis, chi-square test. factor analysis. were the order of statistical methods used in the AJODO The changes of statistical methods observed in the KJO were not significant $(X^2=17.4\;p=0.5881)$ but the changes observed in the AJODO was seen to be significant $(x^2=42.4,\;p=0.0397)$ Some of the studies examined had overlooked the assumptions of the statistical methods employed. Data investigation such as outlier should be performed before analysis and alternative statistical approaches are applied for a small sample size. Types of advanced statistical methods were factor analysis and discriminant analysis in the KJO and Intention-To-Treat (ITT) analysis in clinical trials through multi-center, survival analysis and Generalized Estimating Equations (GEE) in the AJODO. Appropriate analysis approaches and interpretations should be applied for the correlated and repeated measurements of the orthodontic data set.

A Suggestion of the Modified Weighting Values of the RMR Parameters Using a Multiple Regression Analysis on Rock Slopes (암반사면을 대상으로 다변량 수량화 기법을 응용한 RMR 인자의 수정 가중치 제안)

  • Chae Byung-Gon;Kim Kwang-Sik;Cho Yong-Chan;Seo Yong-Seok
    • The Journal of Engineering Geology
    • /
    • v.16 no.1 s.47
    • /
    • pp.85-96
    • /
    • 2006
  • This study was conducted to suggest a method to determine weighting values of each parameter of the RMR system considered with geologic characteristics of a study area. This study reviewed the weighting values of the RMR system for the Cretaceous sedimentary rocks distributed in Ulsan area. Based on the data of field survey at the study area, a multiple regression analysis was used to set up an optimal weighting values of the RMR parameters. For the multiple regression analysis, each parameter of the RMR and the slope gradient were regarded as the independent variable and the dependent variable, respectively. The analysis result suggested a modified weighting values of the RMR parameters as follows; 30 for the intact strength of rock; 18 for RQD; 8 for spacing of discontinuities; 32 for the condition of discontinuities; and 12 for ground water.

A Study on The Regional Variation of Hypertension Medication Rate (고혈압 약물치료율의 지역 간 변이에 관한 연구)

  • Seok, Hyang-Sook;Kang, Sung-Hong
    • Journal of Digital Convergence
    • /
    • v.11 no.9
    • /
    • pp.255-265
    • /
    • 2013
  • The purpose of this study was to identify the variation factors of hypertension medication rate between regions and to use them as a basic data for establishment of hypertension management business plan which is customized by region. The data were collected from community health survey, National Statistics Office and National Health Insurance Corporation, and were analyzed using the geographically weighted regression. As the result of analysis, the factors that influenced the hypertension medication rate between regions were subjective recognition rate of health level, the rate of medical aid client and the number of health facility per one hundred thousand of population. According to the geographically weighted regression, the total of 230 regional regression models composed of major variables which affected the hypertension medication rate were calculated. However, this study has several limitations that the explanatory power of model is not high and others. Therefore, a follow-up study which is based on the actual data of compliance with hypertension medication will be necessary.