• Title/Summary/Keyword: exploratory data

검색결과 1,746건 처리시간 0.029초

데이터 탐색을 활용한 딥러닝 기반 제천 지역 산사태 취약성 분석 (Assessment of Landslide Susceptibility in Jecheon Using Deep Learning Based on Exploratory Data Analysis)

  • 안상아;이정현;박혁진
    • 지질공학
    • /
    • 제33권4호
    • /
    • pp.673-687
    • /
    • 2023
  • 데이터 탐색은 수집한 데이터를 다양한 각도에서 관찰 및 이해하는 과정으로 데이터 구조 및 특성 분석을 통해 데이터의 분포와 상관관계를 파악하는 과정이다. 일반적으로 산사태는 다양한 인자들에 의해 유발되고 발생 지역에 따라 유발 인자들이 미치는 영향이 상이하기 때문에 산사태 취약성 분석 이전에 데이터 탐색을 통해 유발 인자 사이의 상관관계를 파악하고 특징적인 유발 인자를 선별한다면 효과적인 분석을 수행할 수 있다. 따라서 본 연구는 데이터 탐색이 예측 모델의 성능에 미치는 결과를 확인하기 위해 두 단계에 걸친 데이터 탐색을 수행하여 인자를 선별하고, 선별된 유발 인자들 사이의 조합과 23개의 전체 유발 인자 조합을 활용하여 딥러닝 기반의 산사태 취약성 분석을 진행하였다. 데이터 탐색 과정에서는 Pearson 상관계수 heat map과 random forest의 인자 중요도 histogram을 활용하였으며, 딥러닝 기반 산사태 취약성 분석 결과의 정확도는 분석을 통해 획득한 산사태 취약 지수 값을 이용해 제작한 산사태 취약성 지도를 confusion matrix 기반의 정확도 검증 방법을 통해 분석하였다. 분석 결과, 전체 23개의 인자를 사용한 산사태 취약성 해석 결과는 55.90%의 낮은 정확도를 보였지만 한 단계의 탐색을 거쳐 선별한 13개 인자를 활용한 취약성 해석 결과는 81.25%의 분석 정확도를 보였고, 두 단계 데이터 탐색을 모두 수행하여 선별된 9개의 유발 인자를 활용한 산사태 취약성 분석 결과는 92.80%로 가장 높은 정확도를 보였다. 따라서 데이터 탐색을 통해 특징적인 유발 인자를 선별하고 분석에 활용하는 것이 산사태 취약성 분석에서 더 좋은 분석 성능을 기대할 수 있음을 확인하였다.

Exploratory Methods for Joint Distribution Valued Data and Their Application

  • Igarashi, Kazuto;Minami, Hiroyuki;Mizuta, Masahiro
    • Communications for Statistical Applications and Methods
    • /
    • 제22권3호
    • /
    • pp.265-276
    • /
    • 2015
  • In this paper, we propose hierarchical cluster analysis and multidimensional scaling for joint distribution valued data. Information technology is increasing the necessity of statistical methods for large and complex data. Symbolic Data Analysis (SDA) is an attractive framework for the data. In SDA, target objects are typically represented by aggregated data. Most methods on SDA deal with objects represented as intervals and histograms. However, those methods cannot consider information among variables including correlation. In addition, objects represented as a joint distribution can contain information among variables. Therefore, we focus on methods for joint distribution valued data. We expanded the two well-known exploratory methods using the dissimilarities adopted Hall Type relative projection index among joint distribution valued data. We show a simulation study and an actual example of proposed methods.

초기 데이터 분석 로드맵을 적용한 사례 연구 (The Study on Application of Data Gathering for the site and Statistical analysis process)

  • 최은향;이상복
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2010년도 춘계학술대회
    • /
    • pp.226-234
    • /
    • 2010
  • In this thesis, we present process that remove mistake of data before statistical analysis. If field data which is not simple examination about validity of data, we cannot believe analyzed statistics information. As statistical analysis information is produced based on data to be input in statistical analysis process, the data to be input should be free of error. In this paper, we study the application of statistical analysis road map that can enhance application on site by organizing basic theory and approaching on initial data exploratory phase, essential step before conducting statistical analysis. Therefore, access to statistical analysis can be enhanced and reliability on result of analysis can be secured by conducting correct statistical analysis.

  • PDF

연령별 인구이동 특성에 대한 탐색적 공간 데이터 분석 (ESDA) : 대구시를 사례로 (Exploratory Spatial Data Analysis (ESDA) for Age-Specific Migration Characteristics : A Case Study on Daegu Metropolitan City)

  • 김감영
    • 한국지역지리학회지
    • /
    • 제16권5호
    • /
    • pp.590-609
    • /
    • 2010
  • 본 연구의 목적은 연령별 인구이동의 구조와 공간적 패턴에 대한 이해를 향상시킬 수 있는 다양한 탐색적 공간 데이터 분석(Exploratory Spatial Data Analysis: ESDA) 기법들을 제시하는데 있다. ESDA 기법의 하나로 지역의 연령별 이동성향과 이동구조를 파악하기 위한 도구로 인구이동 피라미드를 고안하였다. 인구이동 피라미드는 연령별 전입, 전출, 순이동 정보를 이용하여 작성되는 그래픽 도구이다. 또한 연령별 인구이동의 공간적 패턴을 파악하기 위하여 다양한 국지적 연관성 측정 지표인 Local Moran's $I_i$, Getis-Ord's ${G_i}^*$와 이를 응용한 AMOEBA 기법을 이용하였다. 사례 분석 결과, 제시한 ESDA 기법들을 이용하여 연령별 인구이동 구조, 연령별 이동의 연관성, 연령별 순이동률의 공간 군집 패턴 등을 확인할 수 있었으며, 연령별 공간 군집 사이의 상응관계를 탐색할 수 있었다. 이러한 정보는 인구이동 현상에 대한 상세한 이해뿐만 아니라 인구이동을 유발하는 지역의 특성을 유추하는데 도움을 준다.

  • PDF

감각추구성향이 의복탐색행동에 미치는 영향에 있어 의복 관여의 역할 (The Role of Clothing Involvement in the Influential Relationship of Sensation Seeking Tendency and Explorary Behavior on Clothing)

  • 정유진;이은영
    • 한국의류학회지
    • /
    • 제23권4호
    • /
    • pp.609-620
    • /
    • 1999
  • The purpose of the study were first to propose and determine the influence of sensation seeking tendency on exploratory behavior related to clothing would be mediated by consumer's clothing involvement and second to examine whether sensation seeking tendency is applicable variable on segmenting market expecially using underlying factors of sensation seeking tendency. A questionaire was developed and data were collected from 342 women ranged in age from 0 to 34 years. They were conveniently selected as a proper sample for applying and examining sensation seeking tendency. Arousal seeking tendency scale(Mehrabian & Russel 1974) was selected for operationalizing sensation seeking tendency and exploratory behavior related to clothing. As a result of regression the indirect effect mediated by clothing involvement of sensation seeking tendency on exploratory behavior was larger than the direct one. The influences of factors of sensation-seeking tendency behavior was larger than the direct one. The influences of factors of sensation-seeking tendency were also investigated. The influence of change-seeking tendency and new enviornment seeking tendency was considerably mediated by clothing involvement but that of risk-seeing tendency was not. Artistic sensation seeking tendency had little effect on clothing involvement and exploratory behavior related to clothing. As a result of regression the indirect effect mediated by clothing involvement of sensation seeking tendency on exploratory behavior was larger than influence of change-seeking tendency and new enviornment seeking tendency was considerably mediated by clothing involvement but that of risk-seeking tendency was not. Artistic sensation seeking tendency had little effect on clothing involvement and exploratory behavior related to clothing.

  • PDF

키워드 기반 탐색적 테스트의 실험적 연구 (Experimental Study of Keyword-Based Exploratory Testing)

  • 황준선;최은만
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제29권2호
    • /
    • pp.13-20
    • /
    • 2020
  • 탐색 테스트는 빠른 개발 주기라는 특징으로 바람직한 테스트 방법으로 소개되었으나 적용을 위하여 문서화 및 테스트 범위의 분석이 요구되어 적극적으로 채택하지 않고 있다. 한편 키워드 기반 테스트는 리소스 절약 및 유지 관리를 용이하게 하는 방법으로 소개되었으나 데이터, 설정, 상호 작용, 시퀀스 및 타이밍과 같은 변수가 많아 테스트를 미리 계획하는 것이 쉽지 않다. 하지만 키워드 기반 테스트에서 키워드를 작성하기 위한 명확한 기준과 방법을 제시하고 탐색 테스트 프로세스를 적용하여 키워드를 기반으로 테스트 사례를 만들 수 있다. 이 논문에서는 키워드 기반으로 탐색적 테스트를 자동화 하는 모델을 제안하고 실험한다. 효과를 검증하기 위해 일반 키워드 기반 테스트(KBT)와 탐색적 키워드 기반 테스트(KBET)와 비교하였고 탐색적 정상 테스트 사례(ETC) 및 탐색적 키워드 기반 테스트(KBET)와 비교하였다.

Preliminary Development of a Scale for the Measurement of Information Avoidance

  • Kap-Seon, KIM
    • 웰빙융합연구
    • /
    • 제6권1호
    • /
    • pp.23-31
    • /
    • 2023
  • Purpose: The purpose of this study is a preliminary study to develop a comprehensive information avoidance scale that includes various search contexts. Research design, data and methodology: This study is a part of exploratory sequential design of mixed method for the development of information avoidance scale. Based on the themes derived from the analysis of the in-depth interview data collected in the qualitative research of the first stage of the study, 45 preliminary items on information search and avoidance were constructed. The factors related to information searching included information recognition, information seeking purpose, and information search expectations. Individual, information, time, and system factors were related to information avoidance. Pearson's correlation analysis was performed for the correlation between factor items, and Cronbach's alpha analysis was performed for the reliability analysis of the items. Exploratory factor analysis was applied to examine the construct validity of 35 items of information avoidance. Results: Among the information avoidance items, one of the less relevant among information purpose items, two information factor items, and one time factor item were excluded. Conclusions: A secondary survey should be conducted to confirm the validity and reliability of the scale composed of adjusted items (35) based on the results of exploratory factor analysis. The strength of this preliminary scale is that it was developed based on vivid qualitative data of ordinary people who had experiences of search and avoidance in various search contexts.

2014년 근로환경조사 데이터 분석 (2014 Korea Working Conditions Survey Data Analysis)

  • 김영선;이재희;백재욱
    • 한국신뢰성학회지:신뢰성응용연구
    • /
    • 제15권3호
    • /
    • pp.181-191
    • /
    • 2015
  • Change in labor time is affecting occupational safety and health. Recently reduction in labor time brought innovational operation method, investment in plant and equipment, and flexible labor time in some companies, thereby affecting working conditions for labourers. However, working conditions for some vulnerable social groups have deteriorated. As a result, they are becoming more exposed to risk factors such as injury and emotional stress. In this study we use 2014 KWCS data in order to find the social and demographic characteristics in Korean working conditions. To this end, we use exploratory data analysis approach to find the relationship between some of the important variables in the KWCS data. We also use Press-State-Response model to find which group of people are vulnerable to Press and State. We find that women, people over age 50 and business owners are more vulnerable to Press and State than men, people below age 50 and wage workers.

Chatterjee의 ξ 계수에 대한 탐색적자료분석 (Exploratory data analysis for Chatterjee's ξ coefficient)

  • 장대흥
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.421-434
    • /
    • 2022
  • Chatterjee (2021)는 새로운 상관계수 ξ를 제안하였다. 두 가지 질문 (1. Anscombe's quartet 데이터셋에 대하여 ξ 계수는 구별이 가능한가?, 2. 다양한 종류의 산점도에서 데이터의 개수에 따라 ξ 계수 값의 변화는 어떠한가?)을 중심으로 ξ 계수에 대한 탐색적자료분석을 시도하였다. 세 가지 측도 (ξ 계수, 피어슨상관계수, 상호정보)를 서로 비교하였다.

신제품 개발과정의 디지털화와 현실반영 정확도 관리에 대한 탐색적 연구 (Exploratory Research on the Fidelity Management and the Digitalization of New Product Development Process)

  • 임채성;김우봉
    • 기술혁신연구
    • /
    • 제16권2호
    • /
    • pp.65-94
    • /
    • 2008
  • There has been rapid diffusion of digital innovation technology(DIT) such as 3 D CAD, CAE, simulation software which enable firms to see the future results of intended product designs through 3 D diagram and simulated results. This technology helps firms to reduce trial and error process by solving later stage problems in earlier stages. The DIT being the technology reflecting the real world, as a tool representing the simplified form of the real world, the degree of reflecting the real world(fidelity) is important in utilizing the DIT. This study is an exploratory research examining the process of reviewing the fidelity of the DITs and developing the complementary process necessary for utilizing the DIT with 'not good enough' fidelity. This study could draw out, from its case study, an exploratory hypothesis about the process of developing the complementary process. In the process, there is an analysis of the corresponding relationship between the actual data and the output data of the DIT, e.g. simulated result. Then the input data or output data are adjusted on the basis of the analysis of the corresponding relationship so that the discrepancy between the actual data and the expected interpretation of the output data, through the adjustment, of the DIT, can be reduced. This process is sometimes accompanied by the process of generating experimental data, which reflect the unique situation of the product development process of a company, to be put to the data base of DIT. The complementary process is the process requiring knowledge sharing and adjustment activities across different divisions. This study draw outs implications for effective management of the fidelity of DIT tools.

  • PDF