• 제목/요약/키워드: Exploratory Data Analysis(EDA)

검색결과 19건 처리시간 0.026초

SQC, DOE 및 RE에서 확증적 데이터 분석(CDA)과 탐색적 데이터 분석(EDA)의 고찰 (Review of Confirmatoty Data Analysis and Exploratory Data Analysis in Statistical Quality Control, Design of Experiment and Reliability Engineering)

  • 최성운
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2010년도 춘계학술대회
    • /
    • pp.253-258
    • /
    • 2010
  • The paper reviews the methodologies of confirmatory data analysis(CDA) and exploratory data analysis(EDA) in statistical quality control(SQC), design of experiment(DOE) and reliability engineering(RE). The study discusses the properties of flexibility, openness, resistance and reexpression for EDA.

  • PDF

Exploratory Data Analysis for microarray experiments with replicates

  • Lee, Eun-Kyung;Yi, Sung-Gon;Park, Tae-Sung
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 추계 학술발표회 논문집
    • /
    • pp.37-41
    • /
    • 2005
  • Exploratory data analysis(EDA) is the initial stage of data analysis and provides a useful overview about the whole microarray experiment. If the experiments are replicated, the analyst should check the quality and reliability of microarray data within same experimental condition before the deeper statistical analysis. We shows EDA method focusing on the quality and reproducibility for replicates.

  • PDF

DX 전환 환경에서 EDA에 대한 재고찰 (A study on rethinking EDA in digital transformation era)

  • 고승곤
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.87-102
    • /
    • 2024
  • 디지털 전환(digital transformation)이란 기업이나 조직이 기존의 비즈니스 모델이나 영업 활동을 디지털 기술을 활용하여 변화시키거나 새롭게 혁신하는 과정을 말한다. 이는 시장에서의 경쟁력 강화, 고객 경험 개선 그리고 새로운 사업의 발굴 등을 위하여 다양한 디지털 기술들 - 클라우드 컴퓨팅, IoT, 인공 지능 등 - 의 활용이 요구된다. 또한 시장, 고객 그리고 생산 환경에 대한 지식과 통찰을 도출할 수 있도록 올바른 데이터의 선택, 분석 가능한 상태로의 데이터 전처리(preprocessing) 그리고 목적에 적합한 체계적인 분석들에 대한 올바른 프로세스 정립을 필요로 한다. 이러한 디지털 빅 데이터의 유용성은 적합한 전처리와 함께 정보 및 가설 탐색 그리고 지식과 통찰의 시각화를 위한 탐색적 데이터 분석(exploratory data analysis; EDA)의 올바른 적용이 결정한다. 본 논문에서는 EDA의 철학과 기본 개념에 대하여 재고찰과 함께 효과적인 시각화를 위하여 시각화 핵심 정보, 그래프 문법(grammar of graphics)에 기초한 정보 표현 방법 그리고 최종 시각화 검토 기준인 ACCENT 원칙을 논의한다.

탐색적 자료 분석(EDA) 기법을 활용한 온라인 해외직접구매에 대한 소비자 불만족 및 제도 개선 방안 연구 (A Researh for Consumer Dissatisfaction and Institutional Improvement of The Overseas Direct Purchase using Exploratory Data Analysis)

  • 박성우;강주영
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.41-54
    • /
    • 2020
  • 최근 인터넷 채널의 확장, 금융 기술과 정보통신기술이 발달하면서 해외직접구매가 확대되었다. 해외직접구매는 비교적 저렴한 가격의 제품과 국내에서 구하기 힘든 제품을 제공함으로써 소비자에게 가격, 희소성 면에서 유리한 위치를 선점하고 있지만, 아무래도 국내에서 구매하는 것보다 배송, 제품, A/S·환불 면에서 소비자 불만족이 발생할 확률이 높다. 따라서 본 연구에서는 해외직접구매 활성화에 따른 소비자 불만족을 분석하고 해외직접구매 문제점의 개선 방안을 연구하였다. 연구 방법으로 한국소비자원, 관세청, 한국무역협회에서 여러 통계자료를 수집했고, 탐색적 자료 분석 기법(EDA)을 활용해 분석하였다. 분석 결과 소비자는 해외직접구매 관련 정보에 대해 잘 알지 못한다는 것과 구매 유형에 따라 소비자 불만 유형이나 정도가 달라짐을 확인하였다. 따라서 본 연구는 EDA를 활용하여 해외직접구매의 전체적인 현황과 소비자 불만족을 파악하고 이에 따른 해외직접구매의 개선 방안을 제시함으로써 해외직접구매의 활성화 방향을 제시하는데 시사점이 있다.

탐색적 데이터분석(EDA) 기능에 대한 통계팩키지 프로그램의 비교검토 (Software review of statistical package programs on EDA aspects)

  • 허명회;정진환
    • 응용통계연구
    • /
    • 제3권2호
    • /
    • pp.17-25
    • /
    • 1990
  • 본 소고에서는 탐색적 데이터분석(EDA)의 방법들이 국내에서 비교적 쉽게 구할 수 있는 통계 팩키지 프로그램에 어떻게 수용되어 있는지를 비교검토할 것이다. 여기에서 고려된 통계 팩키지 프로그램은 IBM-PC의 XT/AT 기종에서 사용가능한 Minitab, NCSS, SAS, SPSS/PC+, Statgraphics, SYSTAT의 모두 6종이다.

  • PDF

탐색적 자료 분석(EDA) 기법을 활용한 국내 11개 대표 온라인 쇼핑몰 BEST 100 비교 (Comparison of Online Shopping Mall BEST 100 using Exploratory Data Analysis)

  • 강지천;강주영
    • 한국빅데이터학회지
    • /
    • 제3권1호
    • /
    • pp.1-12
    • /
    • 2018
  • 초기 온라인 쇼핑몰이 등장할 때부터 지금까지 BEST 100은 모든 쇼핑몰 웹사이트의 핵심 기능으로 제공되고 있다. BEST 100은 소비자들이 한눈에 인기 상품들을 확인할 수 있기 때문에 쇼핑몰의 매출 등에 미치는 영향이 높지만 온라인 쇼핑 선행 연구에서 BEST 100과 관련된 연구는 거의 이루어지지 않고 있다. 따라서 본 연구에서는 현 온라인 쇼핑몰 11곳을 대상으로 선정하여 쇼핑몰별 판매 특징을 분석하였다. 연구 방법으로 각 쇼핑몰 웹 사이트의 BEST 100의 구성요소인 판매문구, 가격, 무료배송의 유/무 확인을 크롤링 하여 탐색적 자료 분석 기법(EDA)을 활용하였다. 분석 결과 쇼핑몰 11곳의 종합 평균 가격은 72,891.41원으로 나타났으며 상품 가격이 저렴할수록 무료배송 비율이 낮음을 확인하였다. 가격 이외에 판매문구에서는 텍스트 마이닝을 통해 8개의 카테고리로 구분하였다. 가장 많은 카테고리는 fashion 부분이었으나 카테고리의 설정이 제품 속성이 아닌 마케팅 문구를 분석한 점에 의의가 있다. 본 연구는 EDA를 활용하여 현 온라인 시장 흐름을 파악하고 향후 방향을 제시하는데 시사점이 있다.

경력단절여성 자격증 취득과 취업률과의 연관성분석 연구 (A Study on the Relationship between Career Interrupted Women's Certification Acquisition and Employment Rate)

  • 이정원;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.487-489
    • /
    • 2021
  • 우리나라 여성의 대부분은 결혼부터 재취업에 이르는 생애사건으로 인한 노동시장으로의 재접근이 매우 어려운 상황으로 생애과정에서 경제활동 및 비경제활동 인구를 오가며 지위의 변화를 경험하고 있다. 이에 본 연구에서는 경력단절여성이 취업에 도움이 될 수 있는 요인으로 자격증을 고려하여 연구를 수행하였다. 데이터의 분석 방법으로는 구조적 특성을 알아내기 위한 통계적 기법인 탐색적 분석(Exploratory Data Analysis : EDA) 방법을 사용하였다. 우리나라 경력단절여성을 위한 직업훈련과정 데이터를 활용하여 자격증 취득이 취업에 얼마나 많은 도움이 되는지 연구하였다.

  • PDF

소셜 빅 데이터 분석을 통한 미용분야 대학생 창업지원 정책에 관한 연구 -탐색적 데이터 분석법을 기반으로- (Study on the Policy of Supporting University Students in the Beauty Field through Social Big Data Analysis: Based on exploratory data analytics)

  • 윤미연;박남훈
    • 한국응용과학기술학회지
    • /
    • 제39권6호
    • /
    • pp.853-863
    • /
    • 2022
  • 본 연구에서는 미용분야 창업 활성화를 위해 소셜 빅데이터 분석을 탐색적 데이터 분석(EDA)을 기반으로 하여 2019년부터 2021년 동안 각 년도별로 기간을 구분하여 '미용창업'에 대한 수요 변화와 감정 및 의미 차이의 특징적인 패턴을 도출하고자 하였다. '미용창업' 키워드를 주제로 연관된 검색어를 추출한 결과 창업에 필요한 전문적인 창업교육 보다는 미용관련 기술을 배울 수 있는 기관이나 자격증에 더 많은 관심을 보였으며, 이는 정부 및 지자체에서 여러 가지 창업지원 정책들이 마련되고 있음에도 불구하고 여전히 전문적인 창업교육의 중요성을 인식하지 못하고 있는 것으로 파악할 수 있으며, 이에 대한 대안으로 미용분야 창업을 성공적으로 이루기 위한 전공별 맞춤형 창업교육 프로그램을 개발하는 것이 필요할 것으로 사료된다. 탐색적 데이터 분석을 통해 가설을 설정하고 전통적인 확증적 데이터 분석(CDA)을 결합하여 가설을 검증한다. 미용 창업을 위한 탐색적 데이터 분석 방법이 존재한 적은 없으며, 정식 창업교육의 필요성을 언급하기보다는 미용창업에 대한 관심 변화와 예비창업자의 요구사항을 탐색적 데이터로 분석한다면 맞춤형 창업 프로그램 개발에 도움이 될 것이라고 확신한다.

해상안전 통계 항목 다양화를 위한 EDA 기반 통계 속성 도출 및 활용에 관한 연구 (Study on the EDA based Statistics Attributes Discovery and Utilization for the Maritime Safety Statistics Items Diversification)

  • 강성경;이영재
    • 해양환경안전학회지
    • /
    • 제26권7호
    • /
    • pp.798-809
    • /
    • 2020
  • 과학적 행정을 위한 증거 기반 정책 수립과 평가에 대한 요구로 통계(데이터) 활용 중요성이 날로 강조되고 있다. 통계는 사회전반의 현상을 수치로 제공함으로써 직관적으로 어떤 현상을 설명할 수 있도록 하며, 합리적인 의사결정을 위한 공공자원으로 설명된다. 이러한 특성으로 통계는 정부 정책 결정 및 각종 현상의 연구·분석 등에 기초자료이자 근거자료로 널리 활용되고 있으나 그 중요성에 비해 통계의 역할은 제한적인 수준이다. 이는 현재 개방된 통계가 단순 결과 요약 자료 수준이며 공급자 위주로 생산되어 수요자 관점에서 가치 창출을 위한 수단으로는 부족하다는 의미이며, 본 연구에서는 이러한 문제 보완을 위해 현재 제공되는 통계 항목 외에 정책이나 연구에 다양하게 활용할 수 있는 추가 속성을 탐색했다. 연구에 활용한 기준 통계자료는 해양경찰청에서 발간하는 「해상조난사고 통계 연보」이며, 해양경찰에서 작성하는 선박사고 상황보고서 텍스트 분석을 통해 추가할 수 있는 속성들을 도출했다. 텍스트 분석을 통해 도출된 56개 속성에 대해 데이터를 수집하고 EDA를 수행한 결과, 유의확률(p-value < .05)을 만족하는, 상관계수 0.7 이상의 강한 상관관계가 있는 속성 조합 18개와, 중간 정도의 상관관계(0.4 이상 0.7 미만)를 가지는 속성조합 70개, 총 88개의 조합을 발굴할 수 있었다. 더불어 EDA를 통해 발견된 추가 속성을 정책적으로 활용하기 위해 수난대비기본계획 세부 전략별 키워드 분석을 실시하고, 키워드와 EDA 도출 속성 간 매칭작업을 통해 속성의 활용 가능 여부를 검토했다.

The research of new algorithm to improve prediction accuracy of recommender system in electronic commercey

  • Kim, Sun-Ok
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.185-194
    • /
    • 2010
  • In recommender systems which are used widely at e-commerce, collaborative filtering needs the information of user-ratings and neighbor user-ratings. These are an important value for recommendation in recommender systems. We investigate the in-formation of rating in NBCFA (neighbor Based Collaborative Filtering Algorithm), we suggest new algorithm that improve prediction accuracy of recommender system. After we analyze relations between two variable and Error Value (EV), we suggest new algorithm and apply it to fitted line. This fitted line uses Least Squares Method (LSM) in Exploratory Data Analysis (EDA). To compute the prediction value of new algorithm, the fitted line is applied to experimental data with fitted function. In order to confirm prediction accuracy of new algorithm, we applied new algorithm to increased sparsity data and total data. As a result of study, the prediction accuracy of recommender system in the new algorithm was more improved than current algorithm.