• 제목/요약/키워드: 로지스틱판별분석

검색결과 74건 처리시간 0.023초

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

기술력평가 자료를 이용한 중소벤처기업 파산예측 판별모형에 관한 연구 (A Study on Predicting Bankruptcy Discriminant Model for Small-Sized Venture Firms using Technology Evaluation Data)

  • 성웅현
    • 기술혁신학회지
    • /
    • 제9권2호
    • /
    • pp.304-324
    • /
    • 2006
  • 재무분석가들은 기업의 파산에 양향을 미치는 예측변수를 탐색하기 위해서 상당한 연구가 수행되어 왔다. 그러나 기술지향적 중소벤처기업은 일반적으로 역사적 재무자료가 부족하고, 기술경쟁력 수준에 따라 잠재적인 고성장과 고위험이 존재한다. 본 논문에서는 재무자료 대신에 기술력평가 자료를 이용하여 파산을 예측하기 위해서 파산예측 판별모형을 제안하였고, 모형의 정분류율을 통해서 예측력을 검증하기 위해서 교차타당성방법, 최대사후확률방법 등을 사용하였다. 분석결과 중소 벤처기업의 파산예측모형으로 선형판별모형이 로지스틱판별모형보다 적합한 모형이고, 표본자료에 대한 정분류율 추정은 약 69% 이고 정분류율 예측은 약 67% 가 될 것으로 기대된다.

  • PDF

AOS 장르 게임의 승패 예측 모형의 설계와 활용 (Design and Application of a Winning Forecast Model of the AOS Genre Game)

  • 구지민;유견아
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권1호
    • /
    • pp.37-44
    • /
    • 2017
  • AOS(Aeon of Strife)장르의 게임들은 단순히 즐기는 컴퓨터 게임이 아닌 대표적인 e스포츠 종목으로 자리매김하고 있으며 전문성을 필요로 하는 스포츠의 특성상, 게임 플레이 패턴 및 시즌 별 캐릭터 선택 등 게임 운영에 필요한 통계 분석의 중요성이 증가하고 있다. 본 논문에서는 대표적인 AOS 게임 중의 하나인 리그오브레전드의 게임 데이터를 이용해 데이터 마이닝 기법을 이용한 게임의 전략적 분석을 실시한다. 통계적 승률 예측 기법인 로지스틱 회귀분석과 판별 분석 및 인공신경망을 이용하여 게임의 승패 예측 모형을 설계하고 실험한다. 게임 데이터 분석 결과는 확률을 표시한 그래프로 표현되어 게임 플레이를 돕기 위해 개발된 시각적 도구에 이용한다. 승패 예측 모형의 실험 결과, 평균적으로 95%의 높은 분류율을 보이고 시각화 도구를 통해 게임 플레이의 다양한 전략 수립에 이용됨을 보인다.

축구경기의 경기력분석 (Performances analysis of football matches)

  • 민대기;이용수;김용래
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.187-196
    • /
    • 2015
  • 축구경기에서 승패를 결정 하는 것은 골득실이고 경기에 대한 분석은 일반적으로 득점은 공격력으로, 실점은 수비력으로 평가한다. 본 연구에서는 축구경기력에 대한 분석을 함에 있어서 승패와 득점, 실점에 미치는 요인이 무엇인가를 밝혀내고자 하였다. 경기의 승패를 결정하는 요인들을 밝혀내기 위하여 의사결정나무, 로지스틱 회귀모형 그리고 판별함수 등을 이용한다. 그 결과 공격보다는 수비와 관련된 요인이 승부에 더 결정적인 영향을 미치는 것으로 나타났다. 공격력과 수비력에 대한 분석을 실행하기 위하여 득점과 실점을 반응 변수로 사용해 본 결과, 공격력에 있어서는 논스톱패스와 공격속도가 주요한 요인이었고, 수비력에서는 수비 시 공수거리와 좌우 폭이 주요한 결정요인으로 나타났다.

스플라인을 이용한 신용 평점화 (Credit Scoring Using Splines)

  • 구자용;최대우;최민성
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.543-553
    • /
    • 2005
  • 선형 로지스틱 모형은 신용위험 관리를 위한 신용평점 모형 구축에 있어서 널리 쓰이고 있는 방법론이다. 본 논문에서는 신용평점화를 위하여 로지스틱 회귀 방법에 기초한 스플라인 방법론을 다루고자 한다. 선형 스플라인과 자동적인 변수선택 방법을 채택하였다. 모의 실험을 통하여 스플라인 방법의 성능을 규명하였다.

통계 분석을 통한 산사태 토석류 전이규준 모델 (A Statistical Mobilization Criterion for Debris-flow)

  • 윤석;이승래;강신항;박도원
    • 한국지반공학회논문집
    • /
    • 제31권6호
    • /
    • pp.59-69
    • /
    • 2015
  • 최근 들어 집중호우로 인한 산사태 및 토석류 피해가 종종 발생하고 있다. 이에 따라 산사태 재해 예측에 관한 연구 중 산사태 민감도 분석과 토석류 위험도 분석 관련 연구는 활발하게 진행되어 왔지만, 사면 지역에 적용하기 적합한 전이 분석 관련 연구는 부족한 실정이다. 본 연구에서는 판별분석과 로지스틱 회귀 분석과 같은 통계적 방법을 이용하여 실제 토석류가 발생했던 지역에서 추출한 지형학적 인자, 지질학적 인자 등을 토대로 토석류 전이규준을 제시하였다. 10개의 지형학적 및 지질학적 인자가 독립변수로 사용되었으며 실제 466개소(비전이: 228개소, 전이: 238개소)의 토석류 비전이 및 전이 데이터가 수집되었다. 우선, Fisher의 판별 분석이 수행되었으며, 수행 결과 실제경우와 91.6%의 분류 정확도를 보였다. 하지만 전이와 비전이 두 그룹간의 공분산 동질성이 만족되지 않았으며 또한 독립변수들이 정규분포를 보이지도 않았다. 두 번째로 이항 로지스틱 회귀분석이 수행되었으며, 분석 결과 92.3%의 분류 정확도를 나타냈으며 모든 통계적 조건들도 유의하게 나타났다. 따라서 이항 로지스틱 회귀 분석을 이용한 전이 규준은 토석류 재해 발생 여부를 예측하는데 효과적으로 사용될 수 있을 것으로 판단된다.

중소기업 부실예측을 위한 단일변량분석과 다변량분석의 판별력 비교에 관한 연구 (Comparative Study of the Discrimination of Uni-variate Analysis and Multi-variate Analysis for Small-Business Firm's Fail Prediction)

  • 문종건;하규수
    • 한국산학기술학회논문지
    • /
    • 제15권8호
    • /
    • pp.4881-4894
    • /
    • 2014
  • 본 논문은 2009년~2012년까지 코스닥시장에서 상장폐지된 기업 중 제조업을 영위하는 83개사를 부실기업표본으로 선정하고 동종품목 혹은 동종 산업군에 속하는 정상기업 83개사와 함께 쌍대표본으로 표본기업을 구성하였다. 상장폐지직전 5년간 75개의 재무적 비율을 부실기업과 정상기업 두 그룹의 평균차이분석을 통하여 5년 연속 유의미한 변수로 출현한 15개 변수를 선정하여 단일변량분석(이원분류법)과 다변량분석(로지스틱회귀분석 및 판별분석)을 진행하였다. 분석 결과, 로지스틱회귀분석모형의 판별력(분류정확도)이 가장 높게 나타났다. 본 연구는 기업부실이 장기간에 걸쳐 서서히 진행된다는 점을 감안하여 상장폐지직전 5년 전 자료까지 고려하여 기업부실을 예측함으로써 기존 선행연구들이 상장폐지 직전 3년 전 자료로 기업부실을 예측한 것과 달리 보다 조기에 기업부실을 예측하려고 시도한 점과 일반 이해관계자들도 쉽게 접근할 수 있는 이원분류법(단일변량분석)과 통계적으로 복잡한 다변량분석을 비교분석한 것도 기존 선행연구와 차별화된다.

사상체질 분류모형 개발 및 진단시스템의 구현에 관한 연구 (Study on Development of Classification Model and Implementation for Diagnosis System of Sasang Constitution)

  • 범수균;전미란;오암석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 지능정보 및 응용 학술대회
    • /
    • pp.155-159
    • /
    • 2008
  • 본 논문에서는 사상체질분류검사 설문지를 이용하여 사상체질을 진단할 때 진단의 정확도를 향상시키기 위한 사상체질 분류모형을 개발하기 위하여 데이터마이닝의 주요 분류기법인 판별분석(discriminant analysis), 의사결정나무(decision tree analysis), 신경망분석(neural network analysis), 로지스틱 회귀분석(logistic regression analysis), 군집분석(clustering analysis) 등 다양한 분류분석모형을 이용한다. 본 연구에서는 분류의 비교적 정확도가 우수하며, 특히 분석과정을 쉽게 이해하고 설명할 수 있다는 점과 구현이 용이하다는 장점을 가지고 있는 판별분석모형과 의사결정나무분석모형을 기반으로 사상체질 분류모형을 개발하고, 두 분류모형을 적용한 사상체질 진단시스템을 구현하였다.

  • PDF

자기장 측정 홀소자 집게형 맥진기를 이용한 허맥과 실맥 예측 알고리즘 개발 (Development of Prediction Algorithm for Replete Pulse and Vacuous Pulse by using Clip-type Pulsimeter with Hall Device Measuring a Magnetic Field)

  • 이남규;김근호;이상석;유지혜;유준상;선승호;장세진;홍유식
    • 한국자기학회지
    • /
    • 제23권3호
    • /
    • pp.104-109
    • /
    • 2013
  • 소형 영구자석이 부착된 상태에서 요골동맥의 미세한 움직임으로 자기장 변화를 측정하는 홀소자 집게형 맥진기를 개발하였다. 이 맥진기를 통해서 얻은 120명의 임상데이터를 통계적 로지스틱 회귀분석으로 처리하여 허맥과 실맥을 예측하는 알고리즘의 특성을 연구하였다. 요골동맥파의 반사파 시간값과 절흔점 시간값이 허맥과 실맥을 예측할 수 있는 주요인자이였으며, 판별율은 65%이었다. 이로써 한의학적 허맥과 실맥을 예측하고 판별하는 진단지표로 사용할 가능성을 제하였다.

기술금융을 위한 부실 가능성 예측 최적 판별모형에 대한 연구 (A Study on the Optimal Discriminant Model Predicting the likelihood of Insolvency for Technology Financing)

  • 성웅현
    • 기술혁신학회지
    • /
    • 제10권2호
    • /
    • pp.183-205
    • /
    • 2007
  • 본 연구는 기술력평가에 근거해서 중소기업 부실예측 가능성을 사전에 예측할 수 있는 최적 판별 모형을 개발 제안하였다. 판별모형에 포함될 설명변수는 요인분석과 판별모형의 단계별 선택방법에 의하여 선정되었다. 분석결과 선형판별모형이 로지스틱판별모형보다 임계확률 관점에서 적절한 것으로 나타났다. 최적 선형판별모형의 분류 정분류율은 70.4%, 분류 예측력은 67.5%로 나타났다. 최적 선형판별모형의 활용도를 높이기 위해서 확실 범주와 유보범주를 구분할 수 있는 경계값을 설정하였다. 분석결과를 활용하면 기술금융 취급기관은 부실위험 평가와 더불어 기술금융 신청기업의 순위를 부여할 때 유용하게 사용할 수 있을 것으로 기대된다.

  • PDF