Journal of the Korean Data and Information Science Society
/
제28권4호
/
pp.755-768
/
2017
빅데이터가 4차 산업혁명의 핵심으로 자리하면서 빅데이터 기반 처리 및 분석 능력이 기업의 미래 경쟁력을 좌우할 전망이다. 빅데이터 처리 및 분석을 위한 RHadoop과 RHIPE 모형은 R과 Hadoop의 통합모형으로 지금까지 각각의 모형에 대해서는 연구가 많이 진행되어 왔으나 두 모형간 비교 연구는 거의 이루어 지지 않았다. 본 논문에서는 대용량의 실제 데이터와 모의실험 데이터에서 다중 회귀 (multiple regression)와 로지스틱 회귀 (logistic regression) 추정을 위한 머신러닝 (machine learning) 알고리즘을 MapReduce 프로그램 구현을 통해 RHadoop과 RHIPE 간의 비교 분석하고자 한다. 구축된 분산 클러스터 (distributed cluster) 하에서 두 모형간 성능 실험 결과, RHIPE은 RHadoop에 비해 대체로 빠른 처리속도를 보인 반면에 설치, 사용면에서 어려움을 보였다.
TBM (Tunnel boring machine)은 터널 굴착 과정에서 여러 디스크 커터를 이용하여 암석을 절삭한다. 디스크 커터는 암석과의 지속적인 접촉과 마찰로 인해 마모된다. 디스크 커터의 표면이 마모되면 절삭 능력이 감소하고 굴착 효율이 떨어진다. 암석의 마모성은 디스크 커터 마모에 큰 영향을 미친다. 높은 마모도를 가진 암석은 커터에 더 큰 마모를 일으키며, 이는 디스크 커터의 수명을 단축시킨다. 세르샤 마모지수(Cerchar abrasivity index, CAI)는 암석의 마모성을 평가하는데 널리 사용되는 지표로 CAI는 암석의 마모특성을 나타내며, 디스크 커터의 수명과 성능 예측에 필수적인 요소로 인식되고 있다. 본 연구의 목적은 암석의 강도, 암석학적 특성과 선형회귀, 머신러닝 기법을 이용하여 CAI를 효과적으로 추정하는 새로운 방법을 개발하는 것이다. 문헌 조사를 통해 CAI, 일축압축강도, 압열인장강도, 등가석영함량이 포함된 데이터베이스를 구축하고 파생변수를 추가하였다. 통계적 유의성과 다중공선성을 고려하여 다중선형회귀분석을 위한 입력변수를 선정하였고, 머신러닝 모델의 입력변수는 변수중요도 분석을 통해 선정하였다. 머신러닝 예측모델 중 Gradient Boosting 모델의 예측 성능이 가장 높게 나타나 최적의 CAI 예측 모델로 선정되었다. 마지막으로 본 연구에서 도출한 다중선형회귀분석과 Gradient Boosting 모델의 예측 성능을 선행연구들의 CAI 예측모델과 비교하여 연구 결과의 타당성을 확인하였다.
본 연구의 목적은 산림재적 현장자료와 항공 LiDAR 자료 기반의 산림재적 추정을 위한 회귀모델의 개발이다. 추정 모델은 경상북도 봉화군 지역에서 임의추출법에 의해 선정된 30개의 원형 표본지로부터 산출한 표본지별 산림재적을 반응변수로 하고, 항공 LiDAR 원자료로부터 개별 표본지의 고도분포 백분위수(Height Percentiles, HP) 및 층위 단위 점 개체수 백분율(Height Bin, HB)을 추출하여 예측변수로 사용하여 구성하였다. 단순선형회귀분석, 이차 다항회귀분석 및 단계적 회귀분석 방법을 이용한 다중회귀분석을 실시하여 적합모델들의 후보들을 도출하였으며, 검증을 위하여 각 모델별로 교차 타당성 검증을 실시하여 PRESS 통계치를 구하였다. 모델의 $R^2$ 및 PRESS을 비교하여 적합성을 검토한 결과, $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$의 다중회귀모델의 $R^2$이 0.509로 가장 높고, $HP_{25}$ 단순회귀모델의 PRESS 값이 122.352으로 가장 낮은 것으로 나타났다. 수직구조가 복잡한 우리나라 산림재적을 추정하는 모델로는 다양한 수직적 정보를 포함하고 있는 $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$이 상대적으로 보다 적합하다고 사료된다.
본 연구의 목적은 첫째, ISO26000의 핵심요소를 선행연구를 통하여 카지노 기업에 적합한 ISO26000의 핵심요인을 도출하고, 둘째, ISO26000의 핵심요소별 조직신뢰에 미치는 영향을 최소자승법을 이용한 다중회귀분석을 이용하여 측정하며, 마지막으로, ISO26000의 핵심요소가 조직신뢰의 정도에 따라 어떤 차이가 있는지를 분위수 회귀분석을 이용하여 분석하여, 그 결과를 바탕으로 카지노기업의 CSR 경영 정책 수립과 개발방향을 제시하고자 하는 것이다. 선행연구를 중심으로 ISO26000의 측정항목을 7개(환경, 인권, 지배구조개선, 공정운영관행, 노동관행, 공동체사회경제발전, 소비자이슈)를 도출하였고 설문조사를 통해 실증분석을 위한 자료를 수집하였다. 요인분석결과 ISO26000의 측정항목을 7개 중 지배구조개선과 공정운영관행은 하나의 요인(지배구조 및 공정운영)으로 단순화되어 6개의 요인을 실증분석에 사용하였다. 최소자승법을 이용한 다중회귀분석을 실시한 결과 인권을 제외한 나머지 5개의 변수가 유의한 영향을 미치는 것으로 나타났다. 또한, 분위수 회귀분석의 결과, ISO26000 핵심요소 중 인권과 공동체사회경제발전을 제외한 4가지 핵심요소는 종사원의 조직신뢰 수준에 따라 미치는 영향이 다른 것으로 나타났다. 본 연구의 결과를 바탕으로 향후 카지노기업이 지속경영을 위한 CSR경영활동의 활성화 방안을 수립하여 조직신뢰를 높이기 위해 종사원의 조직신뢰수준에 따라 CSR경영방안을 다르게 모색하고 그에 맞는 정책을 수립해야 할 것이다.
헤도닉 가격 모형은 부동산 가격에 영향을 미치는 여러 요소를 모델링하는데 활용되는 대표적 방법이다. 부동산 가격은 전용면적, 방의 개수, 주차공간과 같은 내재적 속성 뿐 아니라 주변 선호/비선호시설의 존재여부에 따라 영향을 받는다. 주변 입지시설의 경우, 그 영향을 파악하기 위해서는 해당 부동산과의 인접거리를 설명변수로 사용하게 된다. 그러나 다수의 입지시설이 인접해 있는 경우에는 설명 변수 간 다중공선성이 발생하는 문제가 존재한다. 본 연구에서는 분산팽창지수 및 능형회귀분석을 이용해 다중공선성을 파악하고 유의한 설명변수를 선별하는데에 활용하였다. 이들 기법을 서울시 구로구 아파트들에 적용한 결과, 전철 차량 기지, 디지털 단지 및 위도에 해당하는 변수간의 다중공선성을 파악하였으며, 능형회귀분석을 통해 적합한 변수들을 체계적으로 선정할 수 있었다. 본 사례를 통해 상기 기법들이 더 정확하고 적정한 헤도닉 가격 모형을 구축하는데 중요한 보완적 기능을 해준다는 것을 알 수 있다.
본 연구에서는 대구시의 지하철과 버스간의 환승통행을 대상으로 환승통행특성을 분석하고 또한 다중회귀분석을 통해 버스와 지하철간의 환승통행량에 영향을 미치는 요인을 분석하여 이를 통한 대중교통환승센터에서 보다 많은 환승통행량이 처리될 수 있는 방안에 대해 모색하였다. 그 결과 환승시간은 환승통행량과 반비례하는 반면, 연계버스 노선수, 지하철역의 공간적 위치, 버스노선의 연계지수는 비례관계가 있는 것으로 나타났다. 또한 표준화계수로부터 지하철역과 연계되는 버스노선의 특성을 반영한 버스노선의 연계지수가 가장 많은 영향을 미친다는 것을 알 수 있었다.
본 연구는 천식이나 아토피 피부염이 있는 청소년의 삶의 만족도에 영향을 미치는 요인을 알아보기 위하여 실시하였다. 자료는 2016년 한국아동청소년패널조사(Korean Child and Youth Panel Survey; KCYPS) 자료를 이용하였고, 자료분석은 교차분석, t-test, 일원분산분석, 단계적 다중회귀분석을 실시하였다. 단계적 다중회귀분석결과 덜 우울할수록, 자아존중감과 자아탄력성이 높을수록, 연령이 적을수록, 부모의 양육태도가 애정적일수록 알레르기 질환이 있는 청소년의 삶의 만족도가 높아졌다. 지속적인 증상관리가 필요한 알레르기 질환이 있는 청소년의 삶의 만족도를 높이기 위해서는 부모가 애정적 양육태도를 취하고, 자녀에게 적절한 선택권을 부여하고, 긍정적이고 지지적인 관계를 유지하며, 우울감을 관리하기 위한 적절한 교육 프로그램을 제공하는 것이 필요하다.
본 연구는 교통안전공단과 사단법인 녹색교통운동이 공동으로 개발한 교통문화지수와 관련한 2002년과 2003년의 전국 81개 도시 자료를 토대로 통계적 분석을 행하여 이들 대상도시들을 유형화하고, 집단별 영향요인에 근거하여 교통사고 예방대책들을 제시하고자 하였다. 먼저 교통문화지수와 영향요인들에 대한 주성분분석 결과로는 4개의 주성분으로 구분 지울 수 있었으며, 도시 특성별 최적 집단 수는 4개가 적합한 것으로 나타났다. 또한 이들 유형화된 집단별 교통문화지수에의 영향요인을 단계별 다중 회귀분석법을 이용하여 분석한 결과, 4개 집단 모두 높은 설명력을 갖는 회귀모형을 구축할 수 있었다. 이에 따라 각 집단별 교통사고 예방대책들을 구체적으로 제시할 수 있었으며, 아울러 투자된 시설이 얼마나 교통사고 예방에 효과적이었는가를 분석할 필요성이 있음을 향후의 연구 과제로 제시하였다.
가뭄대응 및 이수분야 활용을 위한 장기 기상예측정보 확보를 위해, 경안천 유역을 대상으로 전구기후지수의 원격상관 패턴을 이용하여 통계적 기반의 다중회귀모형을 구성하고 월 강수량의 예측가능성을 평가하였다. 예측인자로서 미국 NOAA에서 제공하는 기후지수 중 총 37개의 지수에 대해 1948~2018년의 월 자료를 이용하였으며, 예측대상인 경안천 월 강수량은 1966~2018년의 유역평균 강수량 자료를 활용하였다. 각 기후지수별 1~24개월 선행자료와 예측대상년도 월 강수량과의 상관분석을 통해 상관성이 높은 기후자료를 선별하여 다중회귀모형의 독립변수로 적용하였다. 예측대상년도를 기준으로 과거 40년의 자료(월 강수량 및 월 기후지수)를 보정자료와 검정자료로 구분(20년씩 무작위로 추출)하고, 보정기간에 대해 도출된 회귀모형 중 검정기간을 대상으로 예측성이 좋은 100개의 회귀모형을 선별하여 예측대상기간에 대한 예측모형으로 활용하였다. 2006~2018년에 대해 전망기간별(1개월, 3개월, 6개월, 12개월)로 각 월별 100개 회귀모형으로 부터의 예측값(예측치의 범위)이 실제 관측치를 포함하는 경우를 월별로 분석한 결과 10월이 가장 높고(83%), 11월(81%), 1월(79%), 8월(77%), 6월(75%), 12월(71%)의 순으로 높게 나타났으며, 상대적으로 7월(29%)과 3월(44%)의 예측성이 낮은 것으로 나타났다. 통계적 모형의 특성상 전망기간에 따른 예측의 정확도는 비례하지 않았다. 예측치의 편차는 크지 않지만 예측성이 낮게 나타나는 기간(3월, 2월)과 예측성은 높지만 예측범위가 크게 나타나는 기간(8월, 6월)에 대해서는 예측모형의 재검토 및 다양한 규모의 유역에 대한 적용을 통해 예측인자 추가 및 보완 등을 수행할 예정이다.
터널 시공 중 나타나는 단층은 방향, 규모 및 강도를 예측하기 어려우면서 지반의 강도를 결정하는 중요한 요소이다. 그러나, 많은 시공 현장에서 단층대의 강도 및 암반분류를 경험적으로 적용하고 있는 실정이다. 본 논문에서는 전국 9개의 지역의 단층에서 총 109개의 시료를 획득하여 직접전단시험과 입도분석을 수행하였다. 또한 6개의 다중회귀모델을 설정하고 97개의 데이터를 이용하여 회귀분석을 실시한 후 전단강도와 단층물질의 무게비의 상관성을 분석하였다. 분석된 6개의 모델을 대상으로 분석에 사용되지 않은 12개의 시험데이터를 이용하여 검증을 실시한 결과 모든 모델에서 결정계수 $R^2{\geq}0.6$을 보이며, Model 5에 비하여 상대적으로 수직응력을 세분화 하여 고려할 수 있는 Model 1과 3이 $R^2{\geq}0.69$으로 높게 나타났다. 향후 단층 물질의 전단강도 산정에 대한 유용한 정보를 제공할 수 있을 것으로 판단된다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.