• Title/Summary/Keyword: 로지스틱 회귀모델

Search Result 190, Processing Time 0.03 seconds

A Study of the Nonlinear Characteristics Improvement for a Electronic Scale using Multiple Regression Analysis (다항식 회귀분석을 이용한 전자저울의 비선형 특성 개선 연구)

  • Chae, Gyoo-Soo
    • Journal of Convergence for Information Technology
    • /
    • v.9 no.6
    • /
    • pp.1-6
    • /
    • 2019
  • In this study, the development of a weight estimation model of electronic scale with nonlinear characteristics is presented using polynomial regression analysis. The output voltage of the load cell was measured directly using the reference mass. And a polynomial regression model was obtained using the matrix and curve fitting function of MS Office Excel. The weight was measured in 100g units using a load cell electronic scale measuring up to 5kg and the polynomial regression model was obtained. The error was calculated for simple($1^{st}$), $2^{nd}$ and $3^{rd}$ order polynomial regression. To analyze the suitability of the regression function for each model, the coefficient of determination was presented to indicate the correlation between the estimated mass and the measured data. Using the third order polynomial model proposed here, a very accurate model was obtained with a standard deviation of 10g and the determinant coefficient of 1.0. Based on the theory of multi regression model presented here, it can be used in various statistical researches such as weather forecast, new drug development and economic indicators analysis using logistic regression analysis, which has been widely used in artificial intelligence fields.

신경망 모형의 초기가중치 최적화 방법에 관한 연구

  • Jo, Yong-Jun;Lee, Yong-Gu
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.19-24
    • /
    • 2003
  • 신경망은 적용 다양성과 제약조건의 최소성, 강력한 예측성, 범용성, 근사성 등 많은 장점을 지니고 있으나 초기 가중치의 할당에 따라 모델 생성의 Performance와 예측의 결과가 달라지게 되는 단점을 지니고 있다. 이런 신경망의 초기 가중치에 따른 단점을 보안하기 위해 통계적 알고리즘의 접목을 통해 Hybrid된 신경망 보완 알고리즘을 제시하고자 하였다. 논문을 위한 기본 가정으로 신경망의 가장 기본인 SLP 알고리즘을 바탕으로 활성함수에 가장 일반적으로 사용되는 Sigmoid 활성함수를 이용하였을 때, 초기 가중치로 기존의 임의 난수 생성 방식이 아닌 통계적 로지스틱 회귀분석의 계수값(mle)을 제시하여 이를 초기치로 사용한 경우와 그렇지 않은 경우의 예측 정확성과 수렴의 Performance정도를 비교하여 가장 효과적인 초기치 방법을 제시하고자 하였다.

  • PDF

Do language models know the distinctions between men and women? An insight into the relationships between gender and profession Through "Fill-Mask" task (언어모델도 남녀유별을 아는가? - 'Fill-Mask' 태스크로 보는 성별과 직업의 관계)

  • Fei Li;Choi Jaehyeon;Kim Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.3-9
    • /
    • 2022
  • 본연구는 한국어 언어모델 트레이닝 단계에서 자주 사용되는 Fill-Mask 태스크와 직업 관련 키워드로 구성되는 각종 성별 유추 템플릿을 이용해 한국어 언어모델에서 발생하는 성별 편향 현상을 정량적으로 검증하고 해석한다. 결과를 봤을 때 현재 직업 키워드에서 드러나는 성별 편향은 각종 한국어 언어모델에서 이미 학습된 상태이며 이를 해소하거나 차단하는 방법을 마련하는 것이 시급한 과제이다.

  • PDF

실시간 CRM을 위한 분류 기법과 연관성 규칙의 통합적 활용;신용카드 고객 이탈 예측에 활용

  • Lee, Ji-Yeong;Kim, Jong-U
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.06a
    • /
    • pp.135-140
    • /
    • 2007
  • 이탈 고객 예측은 데이터 마이닝에서 다루는 주요한 문제 중에 하나이다. 이탈 고객 예측은 일종의 분류(classification) 문제로 의사결정나무추론, 로지스틱 회귀분석, 인공신경망 등의 기법이 많이 활용되어왔다. 일반적으로 이탈 고객 예측을 위한 모델은 고객의 인구통계학적 정보와 계약이나 거래 정보를 입력변수로 하여 이탈 여부를 목표변수로 보는 형태로 분류 모델을 생성하게 된다. 본 연구에서는 고객과의 지속적인 접촉으로 발생되는 추가적인 사건 정보를 활용하여 연관성 규칙을 생성하고 이 결과를 기존의 방식으로 생성된 분류 모델과 결합하는 이탈 고객 예측 방법을 제시한다. 제시한 방법의 유용성을 확인하기 위해서 특정 국내 신용카드사의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 제시된 방법이 기존의 전통적인 분류 모델에 비해서 향상된 성능을 보이는 것을 확인할 수 있었다. 제시된 예측 방법의 장점은 기존의 이탈 예측을 위한 입력 변수들 이외에 고객과 회사간의 접촉을 통해서 생성된 동적 정보들을 통합적으로 활용하여 예측 정확도를 높이고 실시간으로 이탈 확률을 갱신할 수 있다는 점이다.

  • PDF

A Study on the Development of Anomaly Detection Prediction Model for Deep Learning-Based Drilling Equipment (딥러닝 기반 시추장비 이상 예측 및 진단 모델 개발 연구)

  • Han, Dong-Kwon;Kim, Min-Soo;Kwon, Sun-Il;Choi, Jung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.404-407
    • /
    • 2021
  • 석유개발 현장에서 시추장비의 고장으로 인한 장비교체 및 시추시간 증가는 막대한 비용소모를 발생시킨다. 본 논문은 딥러닝 기반의 시추장비 중 드릴비트의 동력을 구동시키는 디젤엔진의 고장 요소를 분류하고 이 요소에 따른 고장여부를 판별하는 딥러닝 기반의 이상 예측 및 진단 모델을 개발하였다. 또한 제안한 모델의 우수성을 확인하기 위해 로지스틱 회귀분석 분류모델과의 예측성능 비교분석도 수행하였다.

Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis (Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스)

  • Park, Min-hee;Cho, Young-bok;Kim, So Young;Park, Jong-bae;Park, Jong-hyock
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.22 no.10
    • /
    • pp.1277-1286
    • /
    • 2018
  • In this paper, we provide flexible scalability of computing resources in cloud environment and Apache Hadoop based cloud environment for analysis of public medical information big data. In fact, it includes the ability to quickly and flexibly extend storage, memory, and other resources in a situation where log data accumulates or grows over time. In addition, when real-time analysis of accumulated unstructured log data is required, the system adopts Hadoop-based analysis module to overcome the processing limit of existing analysis tools. Therefore, it provides a function to perform parallel distributed processing of a large amount of log data quickly and reliably. Perform frequency analysis and chi-square test for big data analysis. In addition, multivariate logistic regression analysis of significance level 0.05 and multivariate logistic regression analysis of meaningful variables (p<0.05) were performed. Multivariate logistic regression analysis was performed for each model 3.

Development of River Recreation Index Model by Synthesis of Water Quality Parameters (수질인자의 합성에 의한 하천 레크리에이션 지수 모델의 개발)

  • Seo, Il Won;Choi, Soo Yeon
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.34 no.5
    • /
    • pp.1395-1408
    • /
    • 2014
  • In this research, a River Recreation Index Model (RRIM) was developed to provide sufficient information on the water quality of rivers to the public in order to secure safety of publics. River Recreation Index (RRI) is an integrated water quality information for recreation activities in rivers and expressed as the point from 0 to 100. The proposed RRIM consisted of two sub models: Fecal Coliform Model (FCM) and Water Quality Index Model (WQIM). FCM predicted Fecal Coliform Grade (FCG) using a logistic regression and WQIM synthesized water quality parameters of, DO, pH, turbidity and chlorophyll a into Water Quality Index (WQI). FCG and WQI were integrated into RRI by the integrating algorithm. The proposed model was applied to upstream of Gangjeong Weir in Nakdong River, and compared with Real Time Water Quality Index (RTWQI) which is the existing water quality information system for recreation use. The results show that calculated RRI reflected change of integrated water quality parameters well. Especially chlorophyll a showed Pearson correlation coefficient -0.85 with RRI. Also, RRIM produced more conservative index than RTWQI because RRI was calculated considering uncertainty of water quality criteria. Further, RRI showed especially low values when fecal coliform was predicted as low grade.

A Study on Accident Prediction Models for Chemical Accidents Using the Logistic Regression Analysis Model (로지스틱회귀분석 모델을 활용한 화학사고 사상사고 예측모형 개발 연구)

  • Lee, Tae-Hyung;Park, Choon-Hwa;Park, Hyo-Hyeon;Kwak, Dae-Hoon
    • Fire Science and Engineering
    • /
    • v.33 no.6
    • /
    • pp.72-79
    • /
    • 2019
  • Through this study, we developed a model for predicting chemical accidents lead to casualties. The model was derived from the logistic regression analysis model and applied to the variables affecting the accident. The accident data used in the model was analyzed by studying the statistics of past chemical accidents, and applying independent variables that were statistically significant through data analysis, such as the type of accident, cause, place of occurrence, status of casualties, and type of chemical accident that caused the casualties. A significance of p < 0.05 was applied. The model developed in this study is meaningful for the prevention of casualties caused by chemical accidents and the establishment of safety systems in the workplace. The analysis using the model found that the most influential factor in the occurrence of casualty in accidents was chemical explosions. Therefore, there is an urgent need to prepare countermeasures to prevent chemical accidents, specifically explosions, from occurring in the workplace.

Prediction Model for Unpaid Customers Using Big Data (빅 데이터 기반의 체납 수용가 예측 모델)

  • Jeong, Jaean;Lee, Kyouhwan;Jung, Hoekyung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.7
    • /
    • pp.827-833
    • /
    • 2020
  • In this paper, to reduce the unpaid rate of local governments, the internal data elements affecting the arrears in Water-INFOS are searched through interviews with meter readers in certain local governments. Candidate data affecting arrears from national statistical data were derived. The influence of the independent variable on the dependent variable was sampled by examining the disorder of the dependent variable in the data set called information gain. We also evaluated the higher prediction rates of decision tree and logistic regression using n-fold cross-validation. The results confirmed that the decision tree can find more accurate customer payment patterns than logistic regression. In the process of developing an analysis algorithm model using machine learning, the optimal values of two environmental variables, the minimum number of data and the maximum purity, which directly affect the complexity and accuracy of the decision tree, are derived to improve the accuracy of the algorithm.

Pose Estimation Techniques for Humanoid Characters in FPS Gaming Environments (인간 캐릭터 포즈 식별: FPS 게임에서의 포즈 추정 기법)

  • Youjung Han;Minseop Lee;Minsu Cha;Jiyoung Woo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.29-30
    • /
    • 2024
  • 본 논문은 Krafton의 PUBG: BATTLEGROUNDS 게임에서 플레이어 분류를 목표로 하며, 포즈 추정기술을 사용하여 일반 플레이어와 봇을 구분한다. 이는 게임에서 직접 수집한 비디오 데이터를 기반으로 하며, 다음과 같은 두 가지 접근 방식을 제안한다. 첫 번째 방법은 동작 시퀀스 분석을 통해, 사용자의 특정동작 패턴을 식별하고 로지스틱 회귀 모델을 활용해 사용자 유형을 분류한다. 두 번째 방법은 YOLO-pose 모델을 사용하여 비디오 데이터에서 키포인트를 추출하고, 이를 LSTM 모델에 적용하여 프레임별로 사용자의 유형을 분류한다. 이러한 이중 접근 방식은 게임의 공정성과 사용자 경험을 향상시키는 새로운 도구를 제공하며, 보다 안전한 게임 환경에 기여할 수 있다. 이 연구는 게임 산업뿐만 아니라 보안 및 모니터링 분야에서도 동작 분석에 대한 혁신적인 접근 방식으로 활용될 잠재력을 가지고 있다.

  • PDF