• 제목/요약/키워드: Statistical problem solving

검색결과 218건 처리시간 0.022초

기계 학습 기반 분석을 위한 다변량 정형 데이터 처리 및 시각화 방법: Titanic 데이터셋 적용 사례 연구 (Multi-Variate Tabular Data Processing and Visualization Scheme for Machine Learning based Analysis: A Case Study using Titanic Dataset)

  • 성주형;권기원;박경원;송병철
    • 인터넷정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.121-130
    • /
    • 2024
  • 정보 통신 기술의 기하급수적인 발전에 따라 확보 가능한 데이터의 종류와 크기가 증가하고 있다. 이러한 대량의 데이터를 활용하기 위해, 통계 등 확보한 데이터를 분석하는 것이 중요하지만 다양화되고 복잡도가 증가한 데이터를 일반적인 방법으로 처리하는 것에는 명확한 한계가 있다. 한편, 연산 처리 능력 고도화 및 자동화 시스템에 대한 수요 증가에 따라 다양한 분야에 기계 학습을 적용하여 그동안 해결하지 못하였던 문제들을 풀고자 하는 시도가 증가하고 있다. 기계 학습 모델의 성능을 확보하기 위해서 모델의 입력에 사용되는 데이터를 가공하는 것과 해결하고자 하는 목적 함수에 따라 모델을 설계하는 것이 중요하다. 많은 연구를 통해 데이터의 종류 및 특성에 따라 데이터를 처리하는 방법이 제시되었으며, 그 방법에 따라 기계 학습의 성능에는 큰 차이가 나타난다. 그럼에도 불구하고, 데이터의 종류와 특성이 다양해짐에 따라 데이터 분석을 위하여 어떠한 데이터 처리 방법을 적용해야 하는지에 대한 어려움이 존재한다. 특히, 기계 학습을 이용하여 비선형적 문제를 해결하기 위해서는 다변량 데이터를 처리하는 것이 필수적이다. 본 논문에서는 다양한 형태의 변수를 포함하는 Kaggle의 Titanic 데이터셋을 이용하여 기계 학습 기반으로 데이터 분석을 수행하기 위한 다변량 정형 (tabular) 데이터 처리 방법에 대해 제시한다. 데이터 특성에 따른 통계 분석을 적용한 입력 변수 필터링, 데이터 정규화 등의 처리 방법을 제안하고, 데이터 시각화를 통해 데이터 구조를 분석한다. 마지막으로, 기계 학습 모델을 설계하고, 제안하는 다변량 데이터 처리를 적용하여 모델을 훈련시킨다. 그 이후, 훈련된 모델을 사용하여 탑승객의 생존 여부 예측 성능을 분석한다. 본 논문에서 제시하는 다변량 데이터 처리와 시각화를 적용하여 다양한 환경에서 기계 학습 기반 분석에 확장할 수 있을 것으로 기대한다.

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

휴리스틱 함수를 이용한 feature selection에 관한 연구 (Research about feature selection that use heuristic function)

  • 홍석미;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.281-286
    • /
    • 2003
  • 실생활에서 해결하고자 하는 문제에 대해 수많은 feature들이 수집되어지나 그 feature들을 모두 문제 해결에 활용하는 것은 어렵다. 모든 feature들에 대한 정확한 자료의 수집이 어려우며 관련된 feature들을 모두 학습에 이용할 경우 복잡한 학습 모델이 생성되어지며 좋은 수행 결과도 얻을 수 없다. 또한 수집된 자료들 간에는 상호 관계나 계층적 관계가 존재하는데, 경험적 지식이나 통계적 방법을 이용하여 feature들간의 관계를 분석함으로써 feature의 수를 줄일 수 있다. 휴리스틱 기법은 반복적인 시행 착오와 경험을 통한 학습으로써 미래가 불확실하고 완전한 정보를 갖고 있지 못할 때, 인간의 사고 기능을 통하여 기억이나 경험을 살려, 스스로 해결방안을 모색하면서 점차로 해에 접근해 가는 방법이다. 전문가들은 경험에 의한 의견 수렴 과정을 거쳐 해당 문제 영역에 접근 가능하며, 이러한 특성을 학습에 사용될 feature의 수를 줄이는데 활용할 수 있다. 전문가들은 원시 자료들을 이용하여 새로운 feature들을 생성할 수 있다 새로이 산출된 feature들과 원시 데이터 내의 feature들을 혼합하여 학습 모델 생성에 이용한다. 본 논문에서는 휴리스틱 함수를 이용하여 학습에 사용될 feature의 수를 줄이고, 추출된 feature들을 신경망의 입력값으로 사용하는 기계 학습 모델을 제시한다. 모델의 성능 평가를 위해 프로야구 경기의 승패 예측 문제를 이용하였다. 실험 결과는 신경 회로망과 휴리스틱 모델을 단독으로 사용했을 때 보다 두 기법을 혼합한 모델이 신경 회로망의 복잡성을 감소시킬 뿐 아니라 분류(classification)의 정확성이 향상되었다.아니라 Hep G2 세포에서도 명백히 단백질의 발현을 관찰할 수 있었다. 또한, Hep G2와 COS세포 모두에서 endogenous RXR의 발현이 일어남을 확인하였고 RXR expression plasmid를 transfection시켰을 때 두 세포 모두에서 단백질의 발현이 현저하게 증가되었다. Constitutive Androstane Receptor (CAR)에 의한 CYP2B의 PBRU 활성효과를 다르게 분화된 세포에서 차이가 일어나는지를 비교하기 위하여 CAR에 의해 매개되는 PBRU의 transactivation효과를 Hep G2와 COS세포에서 조사하였다. Hep G2 세포에서는 transfection된 CAR의 발현에 의해 firefly luciferase 보고단백질의 활성이 약 12배 증가하였다. CAR 발현유전자를 15 ng transfection하였을 때 주어진 보고유전자의 양에 대하여 최대반응을 나타내었고 CYP2B1PBRU가 제거된 CYP2C1 promotor/firefly luciferase를 보고유전자로 사용하였을 때는 CAR에 의한 luciferase의 활성이 나타나지 않았다. Hep G2와는 달리, COS세포에서는 transfection된 CAR의 발현이 PBRU에 의한 firefly luciferase보고단백질의 발현에 영향을 주지 못하였다. 이러한 결과들은 분화된 세포의 종류에 따라서 constitutive androstane receptor의 CYP2BPBRU 활성효과가 다르게 나타날 수 있음을 제시할 뿐만 아니라, 간세포에서 Phenobarbital에 의한 PBRU의 활성유도에 영향을 주는 endogenous 매개 인자들 중 CAR와 RXR과는 다

수학적 상황과 비수학적 상황에서의 확산적 사고의 관계 연구 - TTCT의 도형검사와 MCPSAT를 중심으로 - (Relationship between Divergent Thinking in Mathematical and Non-Mathematical Situations -Based on the TTCT; Figural A and the MCPSAT-)

  • 황동주;이강섭;서종진
    • 영재교육연구
    • /
    • 제15권2호
    • /
    • pp.59-76
    • /
    • 2005
  • 본 연구의 목적은 수학적 상황에서의 확산적 사고와 비수학적 상황에서의 확산적 사고의 관계를 조사하기 위하여 중학교 2학년 학생 215명을 대상으로 검사를 실시하여 자료를 분석하였다. 자료 분석은 빈도, 퍼센트, t-검증과 상관 분석을 사용하였다. 본 연구의 결과는 첫 번째, 수학 영재 학생이 일반 학생보다 수학적 상황에서의 확산적 사고(MCPSAT)와 비 수학적 상황에서의 확산적 사고(TTCT)는 통계적으로 유의미하게 높은 점수를 받았다. 두 번째, 여학생이 남학생보다 비 수학적 상황에서의 확산적 사고(TTCT)에서 제목의 추상성을 제외하고 모든 요소에서 통계적으로 유의미하게 높은 점수를 받았다. 세 번째, 남학생이 여학생보다 수학적 상황에서의 확산적 사고에서 유창성과 융통성은 평균이 높게 나타나고 있으나 통계적으로는 유의미하지 않고 여학생이 남학생보다 수학적 상황에서의 확산적 사고에서 독창성의 평균이 높게 나타나고 있으며 통계적으로 유의미하게 나타나고 있다. 네 번째, 수학적 상황과 비 수학적 상황에서의 확산적 사고 점수사이의 상관관계는 통계적으로 유의미하게 나타나고 있으며 중학생 전체에서는 r=.41(p<.05)이고 r=.21에서 r=.56까지 분포하고 있으며 일반 학생은 r=.27(p<.05)이고 r =.07에서 r=.27까지 분포하고 있다. 다섯 번째로 수학 영재학생의 경우는 수학적 상황과 비 수학적 상황에서의 확산적 사고 점수사이의 상관관계는 r=.11이며 통계적으로 유의미하지 않게 나타나고 있다. 이 결과는 수학 영재학생의 경우 수학적 상황과 비 수학적 상황에서의 확산적 사고 점수사이의 상관관계는 거의 0에 가깝다고 할 수 있다. 이것은 수학적 상황에서의 확산적 사고능력은 비 수학적인 상황에서의 확산적 사고 조합된 능력이 아니라 다른 특별한 능력이라고 볼 수 있다. 그러나 본 연구에서 수학 영재 학생들의 사례수가 적어서 수학 영재 학생의 수학적 상황과 비 수학적 상황에서의 확산적 사고 점수 사이의 상관관계가 있다는 주장을 일반화하기에는 충분치 않을 수 있다는 제한점을 가지고 있다.

2015 개정 과학과 교육과정에 기초한 과학과 핵심역량 조사 문항의 개발 및 적용 (Developing and Applying the Questionnaire to Measure Science Core Competencies Based on the 2015 Revised National Science Curriculum)

  • 하민수;박현주;김용진;강남화;오필석;김미점;민재식;이윤형;한효정;김무경;고성우;손미현
    • 한국과학교육학회지
    • /
    • 제38권4호
    • /
    • pp.495-504
    • /
    • 2018
  • 이 연구는 2015 과학과 교육과정에 제시된 과학과 핵심역량에 관한 서술문을 기초로 학생들의 과학과 핵심역량을 측정할 수 있는 문항을 개발하고, 그 타당도와 신뢰도를 확인하기 위하여 진행되었다. 2015 과학과 교육과정에 제시된 과학적 사고력, 과학적 탐구 능력, 과학적 문제해결력, 과학적 의사소통 능력, 과학적 참여와 평생 학습 능력에 대한 설명을 근거로 각 역량별로 5개 문항씩, 총 25개 문항이 개발되었다. 개발된 문항은 전국 17개 시도에 고루 분포한 학생 참여형 과학수업 선도학교의 초등학교, 중학교, 고등학교 학생 11,348명을 대상으로 과학과 핵심역량을 조사하여 문항의 타당도와 신뢰도를 분석하였다. 타당도는 Messick(1995)이 제안한 6가지 타당도 중 내용 타당도, 실제 타당도, 내적 구조 타당도, 일반화 타당도 등 4가지를 확인하였다. 라쉬 모델의 문항 적합도(MNSQ)를 분석한 결과, 25개 문항 중 부적합 문항은 없었으며, 구조방정식을 활용한 확인적 요인 분석 결과 5개 요인 모델은 적합한 모델로 확인되었다. 성별과 학교급별에 따른 차별적 문항 반응을 분석한 결과, 부적합 값은 175개 중 2개에서 나타났다. 성별과 학교급별 다변량 이원분산분석을 실시한 결과, 학교급 간 및 성별 간에서 통계적으로 유의미한 차이가 나타났으며, 교호작용 효과 역시 유의미하였다. 결론적으로 2015 과학과 교육과정에 제시된 과학과 핵심역량의 설명에 기초하여 개발한 과학과 핵심역량 평가문항은 정신측정학적 관점에서 타당하며, 따라서 교육 현장에서 그 활용 가치가 있을 것으로 판단된다.

발명체험 교육기부활동이 예비기술교사의 교수 효능감에 미치는 영향 (The impacts of the experince of donation for education to improve the teaching efficacy of pre-technology teacher with Invent touring activity)

  • 최유현;임윤진;이은상;이동원
    • 대한공업교육학회지
    • /
    • 제38권2호
    • /
    • pp.156-175
    • /
    • 2013
  • 이 연구는 발명체험 교육기부활동이 예비 기술교사의 교수 효능감에 어떤 영향을 주는지를 검증하고자 하였다. 발명체험 교육기부활동은 발명교육의 중요 활동인 창의적 문제해결과정체험 교육프로그램 개발, 교육프로그램 운영 및 교육기부활동 평가를 포함한다. 이 활동에 참여한 학생들은 C대학교 기술교육과의 전공 및 부전공 학생 20명이다. 교육기부활동은 D아동지역센터, K대안학교, D초등학교, D중학교에서 이루어졌다. 이 연구를 위하여 교육기부활동과 교수효능감에 대한 문헌을 고찰하였고, 교수효능감을 측정하기 위한 검사도구를 선정하였다. 선정된 검사도구는 Riggs와 Enochs(1990)가 개발한 STEBI(Science Teaching Efficacy Beliefs Instrument)를 예비기술교사에게 맞게 수정하기 위하여 전문가 3명이 참여하여 타당도를 확보하였다. 이 연구는 단일집단 사전 사후검사 설계(One-Group Pretest-Posttest Design)에 의해 이루어졌으며, 사전검사와 사후검사를 실시하였다. 검사도구의 신뢰도는 Cronbach ${\alpha}$계수 분석을 실시하였으며, 사전검사는 .840, 사후검사는 .746으로 나타났다. 자료의 분석은 유의수준 5%에서 대응표본 t검정을 실시하였으며, 사용된 통계도구는 SPSS 19.0 이다. 연구 결과 발명체험 교육기부활동에 참여한 예비기술교사들의 교수 효능감이 향상되었다. 교육기부활동에 참여한 학생들과의 인터뷰를 통해 질적인 고찰을 실시한 결과 교육활동을 통해 인성이 긍정적으로 변화였고, 무엇보다 기술교과지도를 위한 교수역량개발의 기회가 되었다고 답하였다. 이에 따라 예비기술교사의 교수효능감 향상을 위한 교수 학습전략으로 교육기부활동의 체험을 적극 활용할 필요가 있다고 판단된다.

예비 창업자의 인구학적 특성과 창업성향 발달도 및 창업업종 선정에 관한 연구 (A Study on the Relationships Between Demographic Characteristics of Entrepreneurial Candidates, their Developmental Level of Entrepreneurial Traits and Choice of Business Field)

  • 최중석;성상현
    • 벤처창업연구
    • /
    • 제10권5호
    • /
    • pp.1-13
    • /
    • 2015
  • 본 연구는 예비 창업자의 인구학적 특성에 따른 창업업종 선정 및 창업성향 발달도 간의 관계를 연구한 논문이다. 예비창업자의 성, 연령, 학력에 따른 외식업, 유통업, 서비스업, 인터넷사업의 업종선정 및 성취도, 인지도, 계획성, 성실성, 대인관계, 문제해결의 6가지 창업성향 발달도 간의 관계를 파악하기 위하여 2002년부터 2014년까지 조사에 참가한 예비창업자 1,441명을 대상으로 기술통계 분석 및 상관관계 분석을 실시하였고 구체적인 차이를 확인하기 위하여 로지스틱 회귀분석과 분산분석을 실시하였다. 본 연구에서는 남성 또는 대학졸업 이상에서 외식업 및 유통업, 인터넷사업에 비하여 서비스업을 선호하는 확률이 높은 것으로 나타났으며 창업성향 발달도도 높은 것으로 나타났다. 반면 여성은 서비스업보다는 인터넷사업, 유통업, 외식업을 더 선호하였으며 20대 이하의 젊은 층에서는 다른 업종보다는 인터넷사업을 더 선호하는 것으로 나타났다. 대학재학 이하에서는 서비스업보다는 외식 및 유통업을 선호하는 것으로 나타났다. 이는 정부 조사에서도 나타난 바와 같이 자영업의 실패율이 높은 외식업 및 유통업을 선택하는 계층과 새로운 창업기회 창출 및 실패율이 적은 서비스업을 선택하는 계층이 구분되고 있음을 검증한 것이라고 할 수 있다. 한발 더 나아가 창업성향 발달도도 다르게 나타나고 있는 점을 확인할 수 있었다. 따라서 창업자 스스로는 물론이거니와 실패율이 높은 창업, 특별한 노하우 없이 시작하는 창업을 지양하거나 줄일 수 있는 환경을 마련하고 체계를 구축하는 정책적인 지원이 필요할 것으로 사료된다. 즉, 창업자 적성과 능력을 고려한 기술력과 노하우, 창업성향 등의 개발을 위한 개인적인 노력과 정부차원의 재교육 제공이 필요하며, 창업정책 지원의 초기 단계에서부터 이러한 창업자 적합성에 관한 검사 및 전문 상담을 제공하는 것이 좋을 것이라고 생각한다.

  • PDF

빅데이터 도입의도에 미치는 영향요인에 관한 연구: 전략적 가치인식과 TOE(Technology Organizational Environment) Framework을 중심으로 (An Empirical Study on the Influencing Factors for Big Data Intented Adoption: Focusing on the Strategic Value Recognition and TOE Framework)

  • 가회광;김진수
    • Asia pacific journal of information systems
    • /
    • 제24권4호
    • /
    • pp.443-472
    • /
    • 2014
  • To survive in the global competitive environment, enterprise should be able to solve various problems and find the optimal solution effectively. The big-data is being perceived as a tool for solving enterprise problems effectively and improve competitiveness with its' various problem solving and advanced predictive capabilities. Due to its remarkable performance, the implementation of big data systems has been increased through many enterprises around the world. Currently the big-data is called the 'crude oil' of the 21st century and is expected to provide competitive superiority. The reason why the big data is in the limelight is because while the conventional IT technology has been falling behind much in its possibility level, the big data has gone beyond the technological possibility and has the advantage of being utilized to create new values such as business optimization and new business creation through analysis of big data. Since the big data has been introduced too hastily without considering the strategic value deduction and achievement obtained through the big data, however, there are difficulties in the strategic value deduction and data utilization that can be gained through big data. According to the survey result of 1,800 IT professionals from 18 countries world wide, the percentage of the corporation where the big data is being utilized well was only 28%, and many of them responded that they are having difficulties in strategic value deduction and operation through big data. The strategic value should be deducted and environment phases like corporate internal and external related regulations and systems should be considered in order to introduce big data, but these factors were not well being reflected. The cause of the failure turned out to be that the big data was introduced by way of the IT trend and surrounding environment, but it was introduced hastily in the situation where the introduction condition was not well arranged. The strategic value which can be obtained through big data should be clearly comprehended and systematic environment analysis is very important about applicability in order to introduce successful big data, but since the corporations are considering only partial achievements and technological phases that can be obtained through big data, the successful introduction is not being made. Previous study shows that most of big data researches are focused on big data concept, cases, and practical suggestions without empirical study. The purpose of this study is provide the theoretically and practically useful implementation framework and strategies of big data systems with conducting comprehensive literature review, finding influencing factors for successful big data systems implementation, and analysing empirical models. To do this, the elements which can affect the introduction intention of big data were deducted by reviewing the information system's successful factors, strategic value perception factors, considering factors for the information system introduction environment and big data related literature in order to comprehend the effect factors when the corporations introduce big data and structured questionnaire was developed. After that, the questionnaire and the statistical analysis were performed with the people in charge of the big data inside the corporations as objects. According to the statistical analysis, it was shown that the strategic value perception factor and the inside-industry environmental factors affected positively the introduction intention of big data. The theoretical, practical and political implications deducted from the study result is as follows. The frist theoretical implication is that this study has proposed theoretically effect factors which affect the introduction intention of big data by reviewing the strategic value perception and environmental factors and big data related precedent studies and proposed the variables and measurement items which were analyzed empirically and verified. This study has meaning in that it has measured the influence of each variable on the introduction intention by verifying the relationship between the independent variables and the dependent variables through structural equation model. Second, this study has defined the independent variable(strategic value perception, environment), dependent variable(introduction intention) and regulatory variable(type of business and corporate size) about big data introduction intention and has arranged theoretical base in studying big data related field empirically afterwards by developing measurement items which has obtained credibility and validity. Third, by verifying the strategic value perception factors and the significance about environmental factors proposed in the conventional precedent studies, this study will be able to give aid to the afterwards empirical study about effect factors on big data introduction. The operational implications are as follows. First, this study has arranged the empirical study base about big data field by investigating the cause and effect relationship about the influence of the strategic value perception factor and environmental factor on the introduction intention and proposing the measurement items which has obtained the justice, credibility and validity etc. Second, this study has proposed the study result that the strategic value perception factor affects positively the big data introduction intention and it has meaning in that the importance of the strategic value perception has been presented. Third, the study has proposed that the corporation which introduces big data should consider the big data introduction through precise analysis about industry's internal environment. Fourth, this study has proposed the point that the size and type of business of the corresponding corporation should be considered in introducing the big data by presenting the difference of the effect factors of big data introduction depending on the size and type of business of the corporation. The political implications are as follows. First, variety of utilization of big data is needed. The strategic value that big data has can be accessed in various ways in the product, service field, productivity field, decision making field etc and can be utilized in all the business fields based on that, but the parts that main domestic corporations are considering are limited to some parts of the products and service fields. Accordingly, in introducing big data, reviewing the phase about utilization in detail and design the big data system in a form which can maximize the utilization rate will be necessary. Second, the study is proposing the burden of the cost of the system introduction, difficulty in utilization in the system and lack of credibility in the supply corporations etc in the big data introduction phase by corporations. Since the world IT corporations are predominating the big data market, the big data introduction of domestic corporations can not but to be dependent on the foreign corporations. When considering that fact, that our country does not have global IT corporations even though it is world powerful IT country, the big data can be thought to be the chance to rear world level corporations. Accordingly, the government shall need to rear star corporations through active political support. Third, the corporations' internal and external professional manpower for the big data introduction and operation lacks. Big data is a system where how valuable data can be deducted utilizing data is more important than the system construction itself. For this, talent who are equipped with academic knowledge and experience in various fields like IT, statistics, strategy and management etc and manpower training should be implemented through systematic education for these talents. This study has arranged theoretical base for empirical studies about big data related fields by comprehending the main variables which affect the big data introduction intention and verifying them and is expected to be able to propose useful guidelines for the corporations and policy developers who are considering big data implementationby analyzing empirically that theoretical base.