• 제목/요약/키워드: 입력변수선택

검색결과 191건 처리시간 0.028초

RFE-SHAP을 활용한 온라인 리뷰를 통한 고객 만족도 예측 (Prediction of Customer Satisfaction Using RFE-SHAP Feature Selection Method)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.325-345
    • /
    • 2023
  • 본 연구는 온라인 리뷰를 이용하여 고객 만족도를 예측하는 새로운 접근 방식을 제안한다. LDA 주제 모델링과 결합된 RFE-SHAP 기능 선택 방법을 활용하여 고객 만족도에 큰 영향을 미치는 주요 기능을 식별하여 예측 분석을 개선했다. 먼저 Random Forest 알고리즘의 경우, 초기 28개 입력변수에서 14개의 변수를 최적 하위 집합으로 추출했다. 제안된 방법에서 Random Forest 모델의 성과는 84%로 확인 되었으며 변수가 많은 모델에서 흔히 발생하는 과적합을 방지하였다. 또한 품질, 착용감, 내구성 등과 같은 리뷰의 특정 요소들이 패션 산업 내에서 소비자 만족도를 증진시키는 중요한 역할을 한다는 사실을 밝혀냈다. 본 연구는 예측 결과를 설명할 때 선택한 각 기능이 고객 만족도에 어떻게 영향을 미치는지에 대한 자세한 설명을 제공하고 고객이 가장 중요하게 생각하는 측면에 대한 세부적인 보기를 제공한다. 본 연구의 공헌도는 다음과 같다. 첫째, 전자상거래 분석 분야 내에서 예측 모델링을 강화하고 특성 중심적인 접근법을 소개함으로써 방법론을 개선하였다. 이는 고객 만족도 예측의 정확도를 높일 뿐만 아니라 예측 모델에서의 변수 선택에 대한 새로운 접근을 제시한다. 둘째, 특히 의류 부문에서 전자상거래 플랫폼에 구체적인 통찰력을 제공한다. 품질, 사이즈, 내구성 등 고객 리뷰의 어떤 부분이 만족도에 가장 큰 영향을 미치는지 강조함으로써, 기업들이 제품과 서비스를 맞춤화 할 수 있는 전략적 방향을 제시한다. 이러한 목표 지향적인 개선은 고객의 쇼핑 경험을 개선하고, 만족도를 향상시키면서 충성도를 이끌어낼 수 있을 것으로 기대한다.

온·오프라인 매개변수 보정기법에 따른 강우-유출해석 적용성 평가 (Evaluation on applicability of on/off-line parameter calibration techniques in rainfall-runoff modeling)

  • 이대업;김연수;유완식;이기하
    • 한국수자원학회논문집
    • /
    • 제50권4호
    • /
    • pp.241-252
    • /
    • 2017
  • 본 연구에서는 오프라인 및 온라인 매개변수 자동보정기법을 이용하여 개념적 집중형 수문모형의 매개변수를 보정한 후, 각 보정기법에 따른 강우-유출 해석 결과를 비교 분석하여 기법별 적용성을 평가하였다. 이를 위해 용담댐 상류 천천 유역을 대상으로 9개의 단기 강우사상을 선정하고, 강우-유출 모의를 위한 수문모형으로 저류함수모형을 선택하였다. 또한 저류함수모형의 매개변수 보정을 위한 자동보정기법으로 오프라인 기법으로는 SCE-UA, 온라인 기법으로는 파티클 필터를 선정하여 해석을 수행하였다. 각 기법에 따른 유출 해석결과의 재현성 평가를 위해 관측수문곡선의 평균유량을 근거로 하여 저수부(평균유량 이하)와 고수부(평균유량 초과)로 구분하여 모의결과를 비교 검토하였다. 그 결과, 매 시간 입력자료를 이용하여 매개변수를 실시간으로 업데이트하는 파티클 필터의 경우, 저수부와 고수부에 구분없이 전반적으로 우수한 재현성을 보여주었다. 반면에 SCE-UA의 경우, 대상 사상에 대한 전체기간의 정보를 활용하여 선택된 목적함수 RMSE와 HMLE를 최소로 하는 최적 매개변수를 추정함에 따라 일정규모 이상의 홍수사상에서는 목적함수에 따라 매개변수의 변동성이 나타났으며, 고수부에서는 RMSE, 저수부에서는 HMLE가 비교적 우수한 유출모의 결과를 나타내는 것으로 분석되었다.

계절내-계절 기후예측의 딥러닝 기반 후보정을 위한 입력자료 전처리 기법 평가 (Investigating Data Preprocessing Algorithms of a Deep Learning Postprocessing Model for the Improvement of Sub-Seasonal to Seasonal Climate Predictions)

  • 정유란;이진영;김미애;손수진
    • 한국농림기상학회지
    • /
    • 제25권2호
    • /
    • pp.80-98
    • /
    • 2023
  • 본 연구에서는 계절내-계절(Subseasonal to seasonal, S2S) 기후예측의 주별 예측 성능을 개선하기 위해서 딥러닝 기반의 후보정(post processing) 기술을 개발하였다. 그 첫 단계로, 일 최고, 최저기온과 일 강수를 목표 변수로, 자료의 특성과 분포에 적합한 자료 변환 및 특성 공학 기법을 규명하고자 하였다. 먼저, 6개 개별 기후모델의 S2S 예측 자료를 딥러닝 모델에 입력하기 위한 훈련자료로 변환하고, 이로부터 다중모델앙상블(Multi-Model Ensemble, MME) 기반 훈련자료를 구축하였다. 참값(label)으로는 ECMWF의 ERA5 재분석 자료를 사용하였다. 자료 변환 알고리즘은 최고 및 최저 차이를 계산하여 입력자료의 범위를 변형시키는 MinMax 및 MaxAbs 변환, 표준편차를 이용하는 Standard 변환 및 분위수를 지정하여 변형하는 Robust와 Quantile 변환으로 구성된 전처리 파이프라인을 구축하였으며, 변환된 훈련자료와 예측 변수와의 상관관계를 계산하여 순위에 따라 훈련자료의 특성을 선택하는 특성 선택 기법을 추가하였다. 본 연구는 U-Net 모델에 TimeDistributed wrapper를 모든 합성곱 층(convolutional layer)에 적용하여 활용하였다. 5개 알고리즘으로부터 변환된 6개 개별 기후모델 및 MME S2S 훈련자료(일 최고 및 최저기온, 강수)에 훈련 모델을 적용한 결과와 훈련 모델을 적용하지 않은 결과를 ERA5와의 공간상관계수(spatial Pattern Correlation Coefficient)를 계산하고 그 개선율인 기술 점수(skill score)를 평가한 결과, 일 강수의 PCC 기술 점수는 Standard 및 Robust 변환으로 처리된 것에서 전체 예측선행(1~4주)에 대해 모두 높았고, 일 최고 및 최저기온에서는 예측 선행시간 3~4주에서만 높게 나타났다. 또한, 일 강수에서 특성 선택에 따른 훈련자료의 차원 감소가 예측 성능 변화에 영향을 미치지 않는 것으로 나타났다. 일 최고 및 최저기온의 경우에는 특성 선택에 의한 훈련자료의 특성 정보 감소가 오히려 예측 성능을 저하시킬 수 있는 것으로 확인되었으며, 원시자료에서 예측성이 높은 1~2주 기온 예측 개선을 위한 적합한 전처리 변환 알고리즘이나 특성 선택을 찾을 수 없었다. 후속 연구에서는 원시 예측 성능이 강수에 비해 높으나 딥러닝 훈련 모델에 의한 후보정 효과가 미미한 예측 선행 1~2주 기온 예측의 저조 원인에 대해 탐색하고, 다양한 딥러닝 훈련 모델로의 적용 및 초매개변수 조정 등 학습 과정의 최적화를 통해 S2S 기후 예측 성능을 개선하고자 한다.

유역의 규모를 고려한 HSPF 모형의 적용성 평가 (An applicability estimation of the HSPF model considering watershed scale)

  • 최현구;김동일;황보현;한건연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.204-204
    • /
    • 2011
  • 최근에 들어 도시화와 이상기후의 영향으로 유역에서의 유출특성과 오염물질 발생특성이 변화하고 있어 이에 따라 체계적인 유역 관리가 요구되고 있다. 우리나라는 하천 및 호소에 대한 수질 관리를 생활하수, 공장폐수 등 점오염원을 중심으로 수질관리정책 및 대책을 추진하여 왔으나, 오염물질의 상당량은 비점오염원에서 유발되고 있다. 또한 오염총량제의 실시 이후 국내에서는 비점오염원 관리의 중요성이 점오염원에 비해 상대적으로 높아짐으로서 유역수질모델링의 중요성을 인식하고 있으며, 비점오염원에 관련된 연구도 활발히 진행되고 있다. 이를 위해 유역의 유출 및 수질 분석을 효율적으로 하기 위해 유역간 물질의 교환 및 전달이 유역 규모에 따라 얼마나 높은 정확성을 나타내는지를 분석하고 이를 검토하여 효과적인 유역수질모델링의 방법이 제시되어야 한다. 본 연구에서는 이러한 통합적 수질관리의 필요성 증대에 따라, 유역 내 수문 순환 및 비점 오염원의 발생 거동을 정량적으로 분석할 수 있는 HSPF(Hydrologic Simulation Program - Fortran) 모형을 통해 오염총량 단위유역을 각각의 소유역으로 순차적으로 모의하여 검 보정을 수행 후 그 결과로 계산된 매개변수들을 단위유역 전체에 대한 분석에 입력하여 수행한 모의 결과와 비교 평가하였다. 또한, 이를 바탕으로 비점오염원에 의한 유역 내 하천 수질 영향도를 파악하였다. 유량 및 수질해석을 위하여 남강유역의 2004년부터 2007년까지 강우와 기상자료, 유량과 오염원 자료를 수집하여 입력 자료를 구축하였다. 또한, 대상유역에 해당되는 환경기초시설의 방류 유량 및 수질을 유입시킴으로써 HSPF모의가 진행되었다. 하천수질에 영향을 줄 수 있는 비점오염원은 강우 및 기상 관련 자료의 입력을 통하여 유역 내 유출 조건의 초기입력을 수행하였으며, 강우 입력에 따른 유출에 영향을 고려하기 위하여 토지이용 및 토양도를 고려하였다. 그리고 유역의 규모를 고려하였을 때 오염총량 단위유역의 유역 규모에 따라 모의를 실시한 결과를 바탕으로 HSPF 모형의 정확성 여부를 판단하여 정확성이 높은 방법을 선택할 수 있도록 하였다. 모의결과 소유역을 순차적으로 모의한 결과(CaseA)가 전체유역을 모의한 결과(CaseB)보다 실측치와 더 높은 상관계수를 나타냄을 알 수 있었다. 본 연구에서의 평가방법을 바탕으로 유역수질모델링이 이루어진다면 추후 비점오염원에 대한 효과적인 관리에 도움이 될 것이며, 모니터링 기법 및 GIS기반 유역관리모델 개발, 4대강 비점오염원 최적관리기법 연구 등에 활용할 수 있을 것으로 사료된다.

  • PDF

저진공 펄스 직류 전원 $BCl_3/SF_6$ 플라즈마를 이용한 GaAs/$Al_{0.2}Ga_{0.8}As$ 화합물 반도체의 선택적 식각 연구

  • 박동균;최경훈;노강현;신주용;송한정;이제원
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2011년도 제41회 하계 정기 학술대회 초록집
    • /
    • pp.261-261
    • /
    • 2011
  • 펄스 직류 전원 $BCl_3/SF_6$ 플라즈마를 이용하여 GaAs/$Al_{0.2}Ga_{0.8}As$의 선택적 식각을 연구하였다. 식각 주요 공정 변수는 $BCl_3/SF_6$ 플라즈마에서 $SF_6$ 가스 유량(0~50%)이었다. $BCl_3/SF_6$의 총 가스 유량은 20 sccm이었다. 다른 공정 조건인 공정 압력(100 mTorr), 펄스 파워(500 V), 펄스 주파수(200 kHz), 리버스 시간 (0.7 ${\mu}s$)은 일정하게 고정시켰으며 기계적 펌프만을 이용하여 공정을 진행하였다. 오실로스코프(Oscilloscope) 데이터에 의하면 가스의 조성 변화에도 척에 걸리는 입력 전압과 전류가 거의 변화가 없었다. $BCl_3/SF_6$ 가스가 10%의 조성에서 GaAs와 $Al_{0.2}Ga_{0.8}As$의 식각 선택비가 약 48 : 1로 우수한 결과를 나타내었다. 그러나 $BCl_3/SF_6$ 가스의 증가는 GaAs의 식각율과 선택도를 감소시켰다. 그리고 $SF_6$ 가스의 조성비가 30% 이상일 경우에는 GaAs와 $Al_{0.2}Ga_{0.8}As$가 식각되지 않았다. 식각 후에 GaAs의 표면 거칠기(RMS surface roughness)는 0.7~1.3 nm로 나타났다. 위의 결과들을 종합적으로 보면 펄스 직류 전원 $BCl_3/SF_6$의 조성비가 10%일 때 가장 좋은 식각 선택비를 얻을 수 있었다.

  • PDF

무선 인지 센서 네트워크를 위한 퍼지 및 러닝 오토메타 기반의 채널 선택 기법 (A Channel Selection Algorithm Based on Fuzzy Logic and Learning Automata for Cognitive Radio Sensor Networks)

  • 퉁 안 투안;구인수
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권1호
    • /
    • pp.23-28
    • /
    • 2011
  • 본 논문은 무선 인지 센서 네트워크에서 2차 사용자를 위한 효율적 채널 선택 알고리즘을 제안한다. 제안된 알고리즘은 러닝 오토메타와 퍼지 로직을 기반하고 있으며, 러닝 오토메타는 무선 전송 채널을 2차 사용자가 학습하여 그 결과를 채널 선택 확률값로 나타내며, 퍼지 로직은 최종 채널 선택을 위하여 다양한 입력 변수를 고려할 수 있도록 한다. 즉, 퍼지 로직은 러닝 오토메타의 결과인 채널 선택 학률값, 기사용자와 2차사용자 사이의 채널 SNR, 송수신 2차 사용자들 사이의 SNR값을 고려하여 다중의 가용 채널로부터 최적으로 전송 채널을 선택할 수 있도록 한다. 시뮬레이션 결과를 통해, 제안된 알고리즘이 기존 알고리즘들 보다 높은 처리율(throughput)을 제공할 수 있음을 보였다.

GNFS를 위한 향상된 다항식 선택 기법 (Enhanced Polynomial Selection Method for GNFS)

  • 김수리;권지훈;조성민;장남수;윤기순;김창한;박영호;홍석희
    • 정보보호학회논문지
    • /
    • 제26권5호
    • /
    • pp.1121-1130
    • /
    • 2016
  • RSA 암호 시스템은 가장 널리 사용되는 공개키 암호 알고리즘 중 하나이며, RSA 암호 시스템의 안전성은 큰 수의 인수분해의 어려움에 기반을 둔다. 따라서 RSA 암호 시스템의 합성수 n을 인수분해하려는 시도는 계속 진행 중에 있다. General Number Field Sieve는 현재까지 알려진 가장 빠른 인수분해 방법이고, RSA-704를 인수분해 하는데 사용된 소프트웨어인 CADO-NFS도 GNFS를 기반으로 설계되어 있다. 그러나 CADO-NFS는 다항식 선택 과정에서 입력된 변수로부터 항상 최적의 다항식을 선택하지 못하는 문제점이 있다. 본 논문에서는 CADO-NFS의 다항식 선택 단계를 분석하고 중국인의 나머지 정리와 유클리드 거리를 사용하여 다항식을 선택하는 방법을 제안한다. 제안된 방법을 이용하면 기존의 방법보다 좋은 다항식이 매번 선택되며, RSA-1024를 인수분해 하는데 적용할 수 있을 것으로 기대한다.

유전자 알고리즘 기반 최적 다항식 뉴럴네트워크 연구 및 비선형 공정으로의 응용 (A Study on GA-based Optimized Polynomial Neural Networks and Its Application to Nonlinear Process)

  • 김완수;이인태;오성권;김현기
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.846-851
    • /
    • 2005
  • 본 논문은 최적 탐색 알고리즘인 유전자 알고리즘을 이용하여 다항식 뉴럴네트워크(Polynomial Neural Networks : PNN)의 최적 설계가 그 목적이다. 기존의 다항식 뉴럴네트워크는 확장된 GMDH(Group Method of Data Handling) 방법에 기반을 두며, 네트워크의 성장과정을 통하여 각 층의 다항식뉴런(혹은 노드)에서 고정된 (설계자에 의해 미리 선택된) 노드 입력들의 수뿐만 아니라 다항식 차수(1차, 2차, 그리고 수정된 2차식)를 이용하였다. 더구나, 그 방법은 학습을 통해 생성된 PNN이 최적 네트워크 구조를 가진다는 것을 보증하지 못한다. 그러나, 제안된 GA-based PNN 모델은 다음의 파라미터들- 즉 입력변수의 수, 입력변수, 및 다항식 차수-을 유전자 알고리즘을 이용하여 선택 동조함으로써 그 구조를 구조적으로 더 최적화된 네트워크가 되도록 하고, 기존의 PNN보다 훨씬 더 유연하고, 선호된 뉴럴 네트워크가 되도록 한다. 하중계수를 가진 합성성능지수가 그 모델의 근사화 및 일반화(예측) 능력 사이의 상호 균형을 얻기 위해 제안된다. GA-based PNN의 성능을 평가하기 위해 그 모델은 가스 터빈 발전소의 NOx 배출 공정 데이터로 실험된다. 비교해석은 제안된 GA-based PNN이 앞서 나타난 다른 지능모델보다 더 우수한 예측능력뿐만 아니라 높은 정확성을 가진 모델임을 보인다.

강우자료의 불확실성을 고려한 강우 유출 모형의 적용 (Application of Rainfall Runoff Model with Rainfall Uncertainty)

  • 이효상;전민우;발린 다니엘라;로드 미하엘
    • 한국수자원학회논문집
    • /
    • 제42권10호
    • /
    • pp.773-783
    • /
    • 2009
  • 강우유출모형의 입력 자료로 사용되는 강우 관측 자료의 불확실성이 유량예측에 미치는 영향을 분석하기 위하여 모형변수 검정의 불확실성 연구에서 사용하는 GLUE (Generalized Likelihood Uncertainty Estimation)방법을 입력 자료 부분으로 확장하여 적용 하였다. 독일의 Weida 유역의 강우 관측 자료를 바탕으로 구조적 및 비구조적인 불확실성 부분을 각각 구조적인 오차 수정 과정과 DUE (Data Uncertainty Engine)을 통하여 강우자료를 구성하였다. 이를 유역의 수문학적 작용을 고려하기 위해 선정한 집중형 강우유출모형, PDM (Probability Distribution Model)에 MC (Monte Carlo)와 GLUE 방법을 활용하여 적용하였다. MC검정변수들의 검정 후 반응 표면(Posterior response surface)을 검토하고 GLUE 의 반응검정 모형변수(Behavioural model parameter set)를 선택, 간략한 GLUE 유량곡선들을 계산하였다. 계산된 GLUE 유량곡선들을 모두 합하여 앙상블 유량을 산정하고, 이 유량의 90 분위를 강우량자료 및 모형변수 검정의 불확실성을 고려한 신뢰구간으로 제시하였다. PDM 모형의 결과는 유량곡선의 전구간에서 안정적인 모의 능력을 보여주고 있으나, 첨두유량 부분이 적게 산정되는 문제점을 보이고 있다. 본 연구에서 상대적으로 적은 수의 강우 시나리오 및 반응검정 모형변수의 적용이라는 한계에도 불구하고, GLUE 방법을 강우관측자료의 불확실성 부분으로 확장하여 강우자료 및 변수 검정의 불확실성을 고려한 모의된 유량예측의 신뢰구간의 적용가능성을 보여주고 있다.

유전자 알고리즘을 사용한 PID제어기의 자동동조 (An Auto-tuing of PID Conrtroller using Genetic Algorithms)

  • 이수흠;정순현
    • 융합신호처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.71-75
    • /
    • 2002
  • 본 논문은 여러 프로세스제어에 사용되는 PID제어기의 최적 자동동조에 관한 새로운 방법을 제안하고자 한다. 이 방법은 먼저, 제어대상의 계단응답으로부터 모델링된 1차 지연계를 Pade 근사화 하고, Ziegler-Nickels의 한계감도 법으로 초기계수를 결정한 후 유전자알고리즘의 부모세대의 2진 스트링에 적합도 값으로 입력시켜 선택 교배 및 돌연변이를 통하여 새로운 자손세대를 형성한다 이 방법은 Ziegler-Nickels로 구한 출력특성보다 더욱 좋은 특성을 가지며 입력변수 K, L, T의 학습범위가 없어져 응용범위가 확장되는 장점을 가지고 있다.

  • PDF