적은 수의 표본에 기초한 흙막이 공법선정 방법에 대한 기초연구

A Framework for Developing a Method for Selecting a Retaining Wall System Using a Small Number of Samples

  • 최명석 (연세대학교 건축공학과) ;
  • 이강 (연세대학교 건축공학과)
  • 발행 : 2008.11.07


지난 10여 년간 건설 분야에서 데이터 마이닝(data mining) 기법을 이용하여 실적 데이터의 패턴을 찾고 이를 바탕으로 다양한 예측 모델을 개발하려는 연구들이 다수 진행되어 왔다. 그러나 데이터 마이닝 기법의 경우, 일반적으로 수천 또는 수만 개의 데이터를 사용할 것을 추천하고 있으나, 건설 분야의 선행연구들을 살펴보면 데이터 마이닝에 사용된 데이터의 수가 최대 이백 개 표본 정도에 그치고 있다. 그 결과 데이터 마이닝 기법을 이용하여 선행연구의 방법 및 결과를 재현하려고 하여도 같은 결과를 얻기 힘들고, 아예 패턴추출이 힘들거나 도출된 패턴에 오류가 있는 경우도 있다. 본 연구는 소수의 표본수에 기초하여 보다 신뢰성 있는 공법선정 모델의 개발에 관한 대안적인 방법을 모색하고자 한다. 먼저 건설 분야에서 데이터 마이닝 기법을 활용한 연구의 범위에 대해 살펴보고, 특히 흙막이 공법선정 모델 구축에 관한 선행연구 고찰을 통해 소수의 데이터에 의존함에 따라 발생하는 문제점들을 알아보고, 이를 극복할 수 있는 방안에 대해 논의 하고자 한다.

In the past decade, various data mining techniques have been used in construction engineering as a means to make informed decisions through the aid of useful knowledge discovered from historical data. Researchers in the construction domain are often confronted with a challenge to derive a meaningful conclusion with a limited sample of data. However, when the data size is small, the proposed results are often illogical. Even if the derived results are technically flawless, sometimes it is difficult to reproduce these results by using the same analysis method when a different set of data is used. This paper reviews some problems that stem from limited data size, and discusses several recommendations for dealing with these problems.
