• 제목/요약/키워드: Variable selection

검색결과 882건 처리시간 0.029초

Selection of markers in the framework of multivariate receiver operating characteristic curve analysis in binary classification

  • Sameera, G;Vishnu, Vardhan R
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.79-89
    • /
    • 2019
  • Classification models pertaining to receiver operating characteristic (ROC) curve analysis have been extended from univariate to multivariate setup by linearly combining available multiple markers. One such classification model is the multivariate ROC curve analysis. However, not all markers contribute in a real scenario and may mask the contribution of other markers in classifying the individuals/objects. This paper addresses this issue by developing an algorithm that helps in identifying the important markers that are significant and true contributors. The proposed variable selection framework is supported by real datasets and a simulation study, it is shown to provide insight about the individual marker's significance in providing a classifier rule/linear combination with good extent of classification.

부분최소자승법과 변수선택을 이용한 코팅두께 예측모델 개발 (A Prediction Model for Coating Thickness Based on PLS Model and Variable Selection)

  • 이혜선;이영록;전치혁;홍재화
    • 응용통계연구
    • /
    • 제23권2호
    • /
    • pp.295-304
    • /
    • 2010
  • 산업체 공정과정에서 타겟품질변수의 실시간 예측과 관리는 품질제고, 수익율 향상에 중요한 관건이 된다. 본 연구는 내지문강판의 코팅두께를 비파괴적이고 신속한 방법으로 예측하여 균일한 품질의 강판을 생산하기 위해 UV스펙트럼데이터를 이용한 최적예측모델을 개발하고자 한다. 부분최소자승법에서 변수중요도척도를 이용한 변수선택방법은 노이즈성 영역의 독립변수를 줄임으로써 예측정확도는 높일 수 있으며, 스펙트럼데이터의 경우 원데이터보다 적절한 데이터전처리가 예측정확도를 높이는 정보를 제공하기도 한다. 본 연구에서는 부분최소자승법 예측모텔에서 변수선택방법과 데이터전처리효과가 내지문강판 코팅두께 예측정확도 향상에 기여하는 결과를 제공하고, 스펙트럼 데이터를 이용한 품질변수 예측모델 개발 시 적용할 수 있는 일반적인 변수선택방법과정을 제안한다.

HMR 상품의 선택속성이 1인 가구의 소비자 구매의도에 미치는 영향 - 소비자 온라인 리뷰의 조절효과 중심으로 - (The Effect of Selection Attribute of HMR Product on the Consumer Purchasing Intention of an Single Household - Centered on the Regulation Effect of Consumer Online Reviews -)

  • 김희연
    • 한국조리학회지
    • /
    • 제22권8호
    • /
    • pp.109-121
    • /
    • 2016
  • This study analyzed the effect of five sub-variables' attribute of HMR: features of information, diversity, promptness, price and convenience, on the consumer purchasing intention. In addition, the regulation effect of positive reviews and negative reviews of consumers' online reviews between HMR selection attribute and purchasing intention was also tested. Results are following. First, convenience feature (B=.577, p<.001) and diversity feature (B=.093, p<.01) among the effect of HMR selection attribute had a positive (+) effect on purchasing intention. On the other hand, promptness feature (B=.235, p<.001) and price feature (B=.161, p<.001), and information feature (B=.288, p<.001) were not significant effect on purchasing intention. Second, result of regulation effect of the positive reviews of consumer's online review between the selection attribute of the HMR product and consumers' purchasing intention, in the first-stage model in which the selection attribute of the HMR product is input as an independent variable, there was a significant positive (+) effect on all the features of convenience, diversity, promptness, price, and information. In addition, there was significant positive (+) main effect (B=.472, p<.001) in the second step model in which the consumers' positive reviews, that is a regulation variable. Furthermore, the feature of price (B=.068, p<.05) had a significant positive (+) effect in the third stage in which the selection attribute of the HMR product that is an independent variable and the interaction of the positive review. However, the feature of information (B=-.063, p<.05) showed negative (-) effect, and there was no effect on the features of convenience, diversity, and promptness. Third, as a result of testing the regulation effect of the negative reviews of consumers' online reviews between HMR product selection attribute and consumers' purchasing intention, in the first-stage model in which the selection attribute of the HMR product was a positive (+) effect on all the features of convenience, diversity, promptness, price, and information. In the second-stage model in which consumers' negative reviews (B=-.113, p<.001) had negative (-) effect. In the third-stage in which the selection attribute of the HMR product and the interactions of the negative reviews was a positive (+) effect with the feature of price (B=.113, p<.01). Last, there was no effect at all on the features of convenience, promptness, and information.

퍼지 매핑을 이용한 퍼지 패턴 분류기의 Feature Selection (Feature Selection of Fuzzy Pattern Classifier by using Fuzzy Mapping)

  • 노석범;김용수;안태천
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.646-650
    • /
    • 2014
  • 본 논문에서는 다차원 문제로 인하여 발생하는 패턴 분류 성능의 저하를 방지 하여 퍼지 패턴 분류기의 성능을 개선하기 위하여 다수의 Feature들 중에서 패턴 분류 성능 향상에 기여하는 Feature를 선택하기 위한 새로운 Feature Selection 방법을 제안 한다. 새로운 Feature Selection 방법은 각각의 Feature 들을 퍼지 클러스터링 기법을 이용하여 클러스터링 한 후 각 클러스터가 임의의 class에 속하는 정도를 계산하고 얻어진 값을 이용하여 해당 feature 가 fuzzy pattern classifier에 적용될 경우 패턴 분류 성능 개선 가능성을 평가한다. 평가된 성능 개선 가능성을 기반으로 이미 정해진 개수만큼의 Feature를 선택하는 Feature Selection을 수행한다. 본 논문에서는 제안된 방법의 성능을 평가, 비교하기 위하여 다수의 머신 러닝 데이터 집합에 적용한다.

조건부 상호정보를 이용한 분류분석에서의 변수선택 (Efficient variable selection method using conditional mutual information)

  • 안치경;김동욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1079-1094
    • /
    • 2014
  • 상호정보 (mutual information)를 이용한 변수 선택법은 반응변수와 설명변수간의 선형적인 연관성뿐만 아니라 비선형적인 연관성을 감지하며, 설명변수 사이의 연관성도 고려하는 좋은 변수선택 방법이다. 하지만 고차원 자료에서 상호정보를 추정하기가 쉽지 않아 이에 대한 연구가 필요하다. Cai 등 (2009)은 조건부 상호정보를 이용한 전진선택법과 가지치기법을 이용하여 이러한 문제를 해결하였으며, 마이크로어레이 자료와 같은 고차원 자료에서 조건부 상호정보를 이용한 변수 선택법으로 선택된 변수들로 구성된 SVM의 분류 성능이 SVM-RFE 및 기존의 필터링 방법으로 선택된 변수들로 구성된 SVM의 분류 성능보다 뛰어남을 보였다. 하지만 조건부 상호정보를 추정할 때 사용된 Parzen window 방법은 변수의 수가 많아질수록 변수 선택 시간이 길어지는 단점으로 인해 이에 대한 보완이 필요하다. 본 논문에서는 조건부 상호정보 계산 시 필요한 설명변수의 분포를 다변량 정규분포로 가정함으로써 변수선택을 위한 계산시간을 단축시키며 동시에 변수선택의 성능을 향상시키고자 한다. 반면, 설명변수의 분포를 다변량 정규분포로 가정한다는 것은 강한 제약이 될 수 있으므로 이를 완화시킨 Edgeworth 근사를 이용한 조건부 상호정보 기반의 변수 선택법을 제안한다. 실증분석을 통해 본 논문에서 제안한 방법의 효율성을 살펴보았으며, 기존의 조건부 상호정보 기반 변수 선택법에 비해 계산 속도나 분류 성능 면에서 우수함을 보였다.

베이지안 변수선택을 이용한 한국 수익률곡선 추정 (Estimation of the Korean Yield Curve via Bayesian Variable Selection)

  • 구병수
    • 경제분석
    • /
    • 제26권1호
    • /
    • pp.84-132
    • /
    • 2020
  • 중앙은행은 수익률곡선을 바탕으로 미래 수익률에 대한 시장의 기대를 추론한다. 통화 정책의 유효성 제고를 위하여, 시장이 예상하는 미래 수익률의 움직임을 정확히 파악할 필요가 있기 때문이다. 이에 따라 그동안 수익률곡선과 시장기대를 정확하게 추정하기 위한 다양한 모형들이 활용되었다. 이와 함께 채권시장의 발달로 채권시장과 거시경제간의 상호 연관성이 높아지면서 수익률 곡선에 영향을 미치는 거시변수가 무엇인지 파악하는 것이 매우 중요해졌다. 그러나 수익률 결정요인에 관한 다양한 이론이 있는 만큼 그동안의 선행연구에서는 수익률곡선 추정 모형에 포함되는 거시변수들이 서로 달랐다. 이는 수익률곡선을 추정하는 데 있어 어떤 변수를 포함한 모형이 바람직한가에 관한 문제, 즉 모형 불확실성이 존재한다는 것을 의미한다. 이러한 상황에서 본 연구는 수익률곡선과 미래 수익률에 대한 시장기대를 정교하게 추정하기 위해 동태적 Nelson-Siegel 모형에 베이지안 변수선택 방법을 적용하였다. 베이지안 변수선택은 모형에 포함되는 중요한 변수를 선험적으로 결정하는 데 따르는 문제들을 완화하고 모형 불확실성을 추정에 효율적으로 반영하는 포괄적인 방법이라는 점에서 바람직한 추정방법이 될 수 있다. 베이지안 변수선택 모형과 선행연구의 모형들을 비교한 결과 모형에 어떤 거시변수를 포함하느냐에 따라 도출되는 미래 수익률에 대한 시장기대가 상당히 다르게 나타났다. 이는 모형 불확실성이 추정결과에 큰 영향을 미치며 이를 추정에 반영하는 것이 타당하다는 것을 의미한다. 베이지안 변수선택 모형의 예측력이 선행연구의 다른 모형들보다 우월한 것으로 나타난 점도 이를 뒷받침한다. 따라서 모형 불확실성이 추정에 영향을 미치는 상황에서 수익률곡선과 시장기대 추정의 정확성 제고를 위해 베이지안 변수선택 모형을 활용하는 것이 바람직할 것으로 판단된다.

산업체 전문직 여성의 직무특성과 직장상황에 의한 의복선택 연구 (Cloches Selection in Accordance with Job Characteristic and Working Place Situation of A Professional Women in Industry)

  • 정은숙;이선재
    • 복식
    • /
    • 제50권5호
    • /
    • pp.77-90
    • /
    • 2000
  • The purpose of this study is to disclose the dimension of job characteristic, working place situation. and clothes selection, which are variable on clothes selection, to research the relation of job characteristic, working place situation, and clothes selection and to disclose the feature of consumers by each group in accordance with job characteristic. The follows are summary of this study result : The concept structure of job characteristic is composed by four types. Working place situation related with clothes selection are consisted of five types. Professional women selected clothes in accordance with nine feature. Job characteristic is related with working palace situation and influences on clothes selection. The persons influenced by activity state regarded personality as important when select clothes. The persons influenced by duty state regarded harmony and control as important, instead of, they ignored conformity. People select occupation according to individual feature, so the feature of consumers, working place environment, working place situation are different in accordance with job characteristic, as a result we can find differences in clothes selection suitable for working palace and purchasing.

  • PDF

VMS(Variable Message Sign)를 통한 교통정보 제공이 운전자의 운행경로 전환에 미치는 영향 분석 (The Influence of Traffic Information based on VMS(Variable Message Sign) on the Selection of Drivers' Route)

  • 정헌영;손수란;이정호
    • 대한토목학회논문집
    • /
    • 제31권2D호
    • /
    • pp.193-201
    • /
    • 2011
  • 교통정보 제공은 개인의 통행시간 절약뿐만 아니라, 도로 운영의 효율성을 향상하여 사회적 편익을 증진시키는데 중요한 역할을 한다. 그 중에서 VMS(도로전광판 Variable Message Sign: 이하 VMS)는 운전자가 주행 중에 쉽게 이해할 수 있게 함은 물론 불특정 다수에게 실시간으로 정보를 제공하는 수단으로 이용되고 있다. 그렇지만 VMS로부터 제공되는 정보가 운전자의 경로 선택에 있어서 어느 정도의 영향을 미치는지를 명확히 밝히고 있는 연구는 부족한 상태이다. 본 연구에서는 운전자들의 VMS 교통정보 이용 형태 및 이용 만족도 등에 대해 살펴보고, VMS 정보에서 통행시간이 수치적으로 표현되었을 때, 경로선택에 영향을 미치는지에 대한 경로전환 예측모형을 구축하였다. 경로전환예측 모형은 우회도로의 상태에 따라 조건I, 조건II, 조건III으로 구분하여 확률을 추정하였다. 또한 VMS 교통정보 제공으로 인해 발생하는 운전자의 통행단축시간에 따른 전환율과 그에 따른 민감도를 도출하였다. 본 연구의 결과로, 조건I의 경우 단축시간 5분에서 10.0%의 전환율을 보이지만 단축시간이 20분일 때 81.6%까지 늘어났다. 조건II에서는 단축시간이 증가함에 따라 14.2%에서 92.7%까지, 조건III은 최대 99.1%의 전환율의 결과를 나타냈다. 각 조건별 통행단축시간에 따른 전환확률 민감도 분석에서는 조건I일때 약 11분, 조건II는 약 9분, 조건III은 약 5분의 통행단축시간에서 민감도가 가장 높게 나타났다.

frailtyHL 통계패키지를 이용한 프레일티 모형의 변수선택: 유방암 생존자료 (Variable Selection in Frailty Models using FrailtyHL R Package: Breast Cancer Survival Data)

  • 김보현;하일도;노맹석;나명환;송호천;김자혜
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.965-976
    • /
    • 2015
  • 통계적 모형에서 적절한 변수를 선택하는 것은 회귀분석에서 매우 중요하다. 최근 벌점 함수(예: LASSO 및 SCAD)와 함께 벌점화 가능도를 사용하는 변수 선택 방법들이 선형모형 및 일반화 선형모형과 같은 단순한 통계 모형에서 널리 연구되고 있다. 이러한 방법들의 주요 장점은 중요한 변수를 선택하고 동시에 회귀계수를 추정하는 것이다. 그러므로 이 방법들은 0으로 회귀계수를 추정함으로써 중요하지 않은 변수를 삭제한다. 이 논문에서는 콕스 비례 위험 모형의 한 확장인 준 모수적 프레일티 모형에서 벌점화된 다단계 가능도(h-likelihood; HL)를 기반으로 적절한 변수를 선택하는 방법을 연구한다. 이를 위해 세 가지 벌점 함수 LASSO, SCAD 및 HL을 사용한다. 본 논문에서는 변수선택을 효율적으로 하기 위해 "frailtyHL" R 패키지 (Ha 등, 2012)를 기반으로 하여 새로운 함수를 개발하였다. 개발된 방법의 예증을 위해 전남대 의과대학 병원에서 수집된 유방암 생존자료를 이용하여 세 가지 변수 선택 방법의 결과를 비교하고, 이 변수선택방법들의 상대적 장 단점에 대해 토론한다.

Advances in Data-Driven Bandwidth Selection

  • Park, Byeong U.
    • Journal of the Korean Statistical Society
    • /
    • 제20권1호
    • /
    • pp.1-28
    • /
    • 1991
  • Considerable progress on the problem of data-driven bandwidth selection in kernel density estimation has been made recently. The goal of this paper is to provide an introduction to the methods currently available, with discussion at both a practical and a nontechnical theoretical level. The main setting considered here is global bandwidth kernel estimation, but some recent results on variable bandwidth kernel estimation are also included.

  • PDF