• Title/Summary/Keyword: 결합 모형

검색결과 1,200건 처리시간 0.023초

다변량 지구과학 데이터와 가우시안 혼합 모델을 이용한 공간 분포 추정 (Estimation of Spatial Distribution Using the Gaussian Mixture Model with Multivariate Geoscience Data)

  • 김호림;유순영;윤성택;김경호;이군택;이정호;허철호;류동우
    • 자원환경지질
    • /
    • 제55권4호
    • /
    • pp.353-366
    • /
    • 2022
  • 지구과학 데이터(지오데이터)의 공간 이질성, 희소성 및 고차원성으로 인해 공간 분포 추정에 어려움이 있다. 따라서 지구과학의 많은 응용 분야에서 지오데이터의 고유 특성을 고려할 수 있는 공간 추정 기법이 필요하다. 본 연구에서는 기계 학습 알고리즘 중 하나인 가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 공간 예측 방법을 제공하고자 하였다. 제안된 기법의 성능을 검증하기 위해, 옛 제련소 부지에서 휴대용 X선 형광분석기(PXRF) 및 유도결합플라즈마-원자방출분광법(ICP-AES)을 이용하여 분석된 토양 농도 자료를 활용하였다. ICP-AES를 이용해 분석된 As와 Pb를 주변수로 하고, 나머지 자료는 보조변수로 활용하였다. 다차원의 보조변수 중 중요 변수를 선별하기 위해 랜덤포레스트 기반의 변수선택법을 적용하였다. ICP-AES 및 PXRF를 통해 구축된 다변량 데이터를 사용한 GMM의 결과를 단변량 및 이변량 데이터를 사용한 정규 크리깅(Ordinary Kriging; OK) 및 정규 공동크리깅(Ordinary Co-Kriging; OCK)의 결과와 비교하였다. GMM의 결과는 OK 및 OCK의 결과보다 낮은 평균 제곱근 편차(RMSE; 비소는 최대 0.11 및 납은 0.33까지 향상)와 높은 상관관계(r; 비소는 최대 0.31 및 납은 0.46까지 향상)를 제공하였다. 이는 GMM을 사용할 경우 토양 오염의 범위 해석의 성능을 향상시킬 수 있음을 지시한다. 본 연구는 다 변량 공간추정 접근법이 복잡하고 이질적인 지질 및 지구 화학자료의 특징을 이해하는 데 효과적으로 적용될 수 있음을 증명하였다.

딥러닝과 머신러닝을 이용한 아파트 실거래가 예측 (Apartment Price Prediction Using Deep Learning and Machine Learning)

  • 김학현;유환규;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.59-76
    • /
    • 2023
  • 코로나 시대 이후 아파트 가격 상승은 비상식적이었다. 이러한 불확실한 부동산 시장에서 가격 예측 연구는 매우 중요하다. 본 논문에서는 다양한 부동산 사이트에서 자료 수집 및 크롤링을 통해 2015년부터 2020년까지 87만개의 방대한 데이터셋을 구축하고 다양한 아파트 정보와 경제지표 등 가능한 많은 변수를 모은 뒤 미래 아파트 매매실거래가격을 예측하는 모델을 만든다. 해당 연구는 먼저 다중 공선성 문제를 변수 제거 및 결합으로 해결하였다. 이후 의미있는 독립변수들을 뽑아내는 전진선택법(Forward Selection), 후진소거법(Backward Elimination), 단계적선택법(Stepwise Selection), L1 Regularization, 주성분분석(PCA) 총 5개의 변수 선택 알고리즘을 사용했다. 또한 심층신경망(DNN), XGBoost, CatBoost, Linear Regression 총 4개의 머신러닝 및 딥러닝 알고리즘을 이용해 하이퍼파라미터 최적화 후 모델을 학습시키고 모형간 예측력을 비교하였다. 추가 실험에서는 DNN의 node와 layer 수를 바꿔가면서 실험을 진행하여 가장 적절한 node와 layer 수를 찾고자 하였다. 결론적으로 가장 성능이 우수한 모델로 2021년의 아파트 매매실거래가격을 예측한 후 실제 2021년 데이터와 비교한 결과 훌륭한 성과를 보였다. 이를 통해 머신러닝과 딥러닝은 다양한 경제 상황 속에서 투자자들이 주택을 구매할 때 올바른 판단을 할 수 있도록 도움을 줄 수 있을 것이라 확신한다.

북한지역 토지자산 추정에 관한 연구: 프레임워크 개발 및 탐색적 적용 (Estimating Land Assets in North Korea: Framework Development & Exploratory Application)

  • 임송
    • 경제분석
    • /
    • 제27권2호
    • /
    • pp.71-123
    • /
    • 2021
  • 본 연구는 북한당국이 발표하는 지역별 토지가격이나 토지의 특성에 관한 자료들이 없는 조건에서 북한지역의 토지가격과 토지자산의 규모를 추정하는 방법론과 모형을 제시하고 이를 이용하여 북한 시가화지역 전체를 대상으로 시장가격 기준의 토지자산 규모를 실험적으로 추정하였다. 우선 관련 사회경제적 변수를 이용가능하면서 최근의 북한과 소득수준의 격차가 상대적으로 크지 않았던 것으로 평가되는 남한의 1970년대 중후반, 그리고 도시화 수준이 유사했던 1980년대 초반 남한의 시, 군, 구별 실거래가격을 기준으로 시가화지역 토지에 대한 지가결정함수를 도출하였다. 다음으로 북한지역에 대한 지리정보분석을 통해 도출되는 지가결정요인의 대리변수들을 대입하여 2015년경 북한 시가화지역 토지의 시, 군, 구역별 상대가격비율을 산출하였다. 더 나아가서 최근 북한지역 일부 도시들을 대상으로 조사된 주택거래가격과 본고에서 추정한 상대가격비율을 결합하여 북한전역을 대상으로 시가화지역의 토지자산 규모를 추정하였다. 추정결과 북한 시가화지역의 토지가격은 시, 군, 구역별 상대가격비율로 볼 때 평양시 동대원구역이 100으로 제일 높고 양강도 풍서군이 1.70으로 가장 낮은 것으로 평가되었다. 한편 시가화지역의 토지자산 규모는 2015년 기준 216억 달러로 추정되었는데, 이는 동년 북한GDP의 1.2~1.3배에 달하는 규모이다. 이 비율은 남한의 1978~1980년과 비슷한데, 해당시기의 남한의 경제성장률이 평균 6%인데 반해 북한은 1%대 수준인 것을 고려하면 상당히 높은 것으로 보인다.

머신러닝을 활용한 기상조건에 따른 공공도서관 도서대출 수요분석 (Analysis of public library book loan demand according to weather conditions using machine learning)

  • 오민기;김건욱;신세영;이진명;장원준
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.41-52
    • /
    • 2022
  • 국내 공공도서관은 1, 2차 도서관 발전 종합계획을 토대로 양적 성장을 이루었으나, 질적으로는 다소 부족한 점이 있어 이를 개선하기 위한 다양한 연구가 수행되었다. 대다수 선행연구에서는 사회·경제적 요인과 통계분석에 한정되어 수행된 한계점이 있다. 이에 본 연구에서는 시공간적 개념을 적용하여 강우와 폭염으로 인한 공공도서관 대출 수요 감소를 정량적으로 산출하고, 기상 변화로 도서 대출 수요 감소가 높은 지역과 그렇지 않은 지역을 군집화하여 공공도서관 내·외부 요인들과 결합한 후 기상변화에 따른 공공도서관 대출 수요 변화를 분석하였다. 분석 결과 공공도서관별 기상으로 인한 감소 차이가 존재하였으며, 공공도서관의 특성과 공간적 위치에 따라 일부 다르게 나타났다. 또한, 기온이 35℃ 이상인 폭염일 경우 도서 대출 수요 감소 폭이 많이 증가하였으며, 랜덤포레스트 모형으로 분석한 결과 유의미한 요인이 도출되었다. 내적 요인으로는 좌석 수, 장서 수, 면적이 도출되었으며, 외적 요인으로는 공공도서관 접근 경사로, 카페, 독서실, 10대 유동인구, 30/40대 여성 유동인구가 중요한 변수로 분석되었다. 이러한 분석 결과는 특정 시즌 기상을 고려한 공공도서관 이용 활성화 정책 수립에 이바지할 것으로 판단되며, 연구의 한계점도 제시하였다.

국내 제조기업의 경쟁력과 수출: 대기업과 중소기업의 비교를 중심으로 (Competitiveness and Export Performance in Korean Manufacturing Enterprises : Focusing on the Comparison of Conglomerates and SMEs)

  • 이동주
    • 무역학회지
    • /
    • 제43권3호
    • /
    • pp.1-26
    • /
    • 2018
  • 본 연구는 2000년부터 2016년까지 국내 제조기업 중 수출기업을 대상으로 기술적 효율성(TE) 및 총요소생산성(TFP)을 추정하고 TFP와 수출 간의 관계를 분석하였다. 특히 TFP는 기술진보(TC), 기술적 효율성 변화(TEC), 규모 효과(SE)로 분해하였으며, 각각에 대해 대기업과 중소기업을 구분하여 분석결과를 비교하였다. 먼저 기술적 효율성(TE)의 경우 2008년 금융위기 이후 대폭 하락하는 등 한국 경제가 외부충격에 매우 취약한 것으로 나타났으며, 현재 국내 경제의 성장을 견인하고 있는 전자, 자동차, 기계 부문 등의 효율성이 낮게 나타나 개선이 필요하다고 할 수 있다. 또한 비철을 제외한 대부분의 제조업 세부 산업에서 대기업의 효율성이 중소기업보다 높은 것으로 나타났다. 총요소생산성(TFP)의 경우 TFP 변화의 대부분은 기술진보(TC)에 의한 것으로 노동 및 자본의 효율적인 결합이나 규모의 효과는 거의 영향이 없는 것으로 나타나 기업 내부의 체질 개선이 시급하다고 할 수 있다. 또한 2008년 금융위기의 충격으로 인한 변동성이 대기업보다 중소기업에서 훨씬 크게 나타나 외부의 경제 충격은 대기업보다 중소기업에 더 큰 악영향을 미치는 것으로 나타났다. 그리고 TFP 분해요소 중 중소기업의 TC만 수출에 긍정적인 영향을 미치는 것으로 나타나 수출 증대를 위해서는 중소기업의 경우 기술개발을 촉진하기 위한 R&D 지원이 필요하며, 대기업의 경우 효율성과 규모 효과를 수출과 연계하기 위한 수출 시장별, 경쟁 기업별, 품목별로 차별화된 전략을 마련할 필요가 있다.

  • PDF

라이브 스트리밍 전자 상거래에서 소비자 신뢰에 영향을 미치는 요인에 관한 연구 (Research on factors influencing consumer trust in livestreaming e-commerce)

  • 려효영;심재연
    • 산업진흥연구
    • /
    • 제8권3호
    • /
    • pp.181-199
    • /
    • 2023
  • 전자상거래는 전통적인 그래픽 및 텍스트 형식에서 짧은 동영상 및 라이브스트리밍 형식으로 업그레이드되고 있다. 라이브 전자상거래는 정보전달 및 상품전시의 내용과 형식을 풍부하게 하고 소비자의 쇼핑경험을 향상시키며 점차 새로운 소비패턴이 되고 있다. 그러나 생방송 전자상거래의 발전에는 허위선전, 위조상품, 각종 부정적인 사건 등으로 라이브스트리밍 전자상거래에 대한 소비자의 신뢰도에 심각한 영향을 미치고 있다. 신뢰는 라이브스트리밍 전자상거래의 핵심 경쟁요소이다. 본 논문에서는 신뢰이론에 대한 선행연구를 기반으로 라이브커머스의 "사람, 상품, 장면" 특성 요소를 결합하여 라이브커머스의 신뢰도 모형을 구축하고 가설을 세웠다. 설문조사를 통한 데이터 수집, 라이브커머스의 특성, 쇼호스트 특성, 브랜드 이미지, 제품 정보, 플랫폼 평판, 라이브 상황 및 신뢰성 경향 등의 요인이 소비자 신뢰도에 높은 긍정적인 영향을 미친다는 것을 증명하였다. 연구결과로 매장특성지표를 구축하고, 바람직한 쇼호스트의 특성을 창출하며, 제품브랜드를 구축하고 선택하고, 제품정보를 유지하며, 특성에 적합한 라이브 플랫폼을 선택하고, 라이브 상황에 적절한 컨텐츠를 창출하는 등을 제언하였다.

복지국가의 '자녀유무별 여성임금격차(Family gap)' 비교연구 : 가족정책과 노동시장구조의 영향을 중심으로 (A Comparative Study of family gap in Welfare States :The Role of family policy and labor market structure)

  • 허수연
    • 사회복지연구
    • /
    • 제41권2호
    • /
    • pp.279-308
    • /
    • 2010
  • 본 연구는 '자녀유무별 여성임금격차(Family gap)' 의 국가별 차이를 가져오는 제도적 요인을 탐색하기 위해 OECD 14개국을 대상으로 가족정책, 노동시장 및 사회구조와 Family gap의 관계를 분석하는 것을 목적으로 한다. 이 때 가족정책을 여성의 노동역할을 지원하는 '고용지원 가족정책' 과 양육역할을 지원하는 '양육지원 가족정책' 으로 분류하여 각각이 가지는 정책적 지향에 따라 Family gap에 미치는 영향을 구분하였으며 노동시장 및 사회구조를 분석하기 위한 변수로 노동시장 성분절 구조, 임금불평등 구조, 여성의 사회적 지위와 경제적 상황을 모형에 포함하였다. 분석을 위하여 먼저 헤크만 2단계추정법(Heckman's two stage estimation)을 통해 국가별 Family gap 크기를 측정한 후 퍼지셋분석(FSQCA)을 통해 어떠한 제도적 조합이 낮은 Family gap을 가져오는지 검증하였다. 분석결과 낮은 Family gap은 '고용지원 가족정책' 의 발달과 '낮은 임금불평등 구조' 의 결합인과관계(conjunctual causation)에 의해 발생하는 것으로 나타났다. 분석결과를 통해 '자녀가 있는 여성' 의 양육으로 인한 불리함을 줄이고 상대적인 임금수준을 높이기 위한 제도적 노력으로 여성의 고용지속 및 양육의 사회화를 지원하고 여성과 남성 모두의 일-가족 양립을 지향하는 가족정책의 확충과 함께 낮은 노동지위에 있는 여성의 임금 및 고용조건의 보호가 우선과제가 된다는 정책적 함의를 제시하였다.

자율주행차 사고심각도의 영향요인 분석에 관한 연구: 사고데이터와 교통인프라 정보를 결합하여 (A Study on Factors Influencing the Severity of Autonomous Vehicle Accidents: Combining Accident Data and Transportation Infrastructure Information)

  • 김창훈;김정화
    • 한국ITS학회 논문지
    • /
    • 제22권5호
    • /
    • pp.200-215
    • /
    • 2023
  • 자율주행 기술이 고도로 발전하고, 관련 시장이 급격하게 성장하고 있어 머지않은 시기 내에 완전 자율주행 시대가 도래할 것으로 예상된다. 한편, 자율주행 기술의 발전과 함께 기술 안전성에 대한 의문이 제기되고 있으며, 관련 사고 소식이 보도되면서 기술에 대한 우려는 증대되고 있다. 자율주행차의 안전성 향상을 위해, 사고 사례를 분석하고 사고 원인을 규명하는 행위가 선행될 필요가 있다. 이에, 본 연구는 자율주행 사고데이터를 통해 자율차 사고의 심각도에 대한 영향요인을 분석하였다. 연구 데이터는 CA DMV에서 수집·배포하고 있는 자율주행차 사고 레포트를 중심으로 사고 지점의 공간 정보, 교통 정보를 사용하였다. 중점 데이터가 사고 레포트임을 고려할 때, 사건 발생 횟수의 기댓값이 반영될 수 있도록 포아송 회귀 분석을 사용하여 모델링을 진행하였다. 모형 분석 결과, 자율주행차 사고 심각도는 조도가 낮을 때, 자전거·버스 전용 차로가 존재할 때, 보행자와 자전거 사고 이력이 많은 지역에서 증가한다는 결과가 도출되었다. 본 연구 결과는 향후, 자율주행차 안전성 개선을 위한 알고리즘 개발 및 관련 교통 인프라 설치를 위한 기초자료로 활용될 수 있을 것이다.

비대칭 마진 SVM 최적화 모델을 이용한 기업부실 예측모형의 범주 불균형 문제 해결 (Optimization of Uneven Margin SVM to Solve Class Imbalance in Bankruptcy Prediction)

  • 조성임;김명종
    • 경영정보학연구
    • /
    • 제24권4호
    • /
    • pp.23-40
    • /
    • 2022
  • Support Vector Machine(SVM)은 기업부실 예측문제 등 다양한 분야에서 성공적으로 활용되어 왔으나 범주 불균형 문제가 존재하는 경우 다수 범주의 경계영역은 확장되는 반면, 소수 범주의 경계영역은 축소되고 분류 경계선이 소수 범주로 편향되어 분류 성과에 부정적인 영향을 미치는 것으로 보고되고 있다. 본 연구는 범주 불균형 문제에 대한 대칭 마진 SVM(EMSVM)의 한계점을 개선하기 위하여 비대칭 마진 SVM(UMSVM)과 임계점 이동 기법을 결합한 최적화 비대칭 마진 SVM인 OPT-UMSVM을 제안한다. OPT-UMSVM은 소수 범주 방향으로 치우진 분류 경계선을 다수 범주로 재이동함으로써 소수 범주의 민감도를 개선하고 최적화된 분류 성과를 산출함으로써 SVM의 일반화 능력을 향상시키는 장점을 가진다. OPT-UMSVM의 성과 개선 효과를 검증하기 위하여 불균형 비율이 상이한 5개의 표본군을 구성하여 10-fold 교차타당성 검증을 수행한 결과는 다음과 같다. 첫째, 범주 불균형이 미미한 표본에서 UMSVM은 EMSVM의 성과 개선 효과가 미약한 반면, 범주 불균형이 심화된 표본에서 UMSVM은 EMSVM의 성과개선에 크게 공헌하고 있다. 둘째, OPT-UMSVM은 EMSVM 및 기존의 UMSVM과 비교하여 범주 균형 및 범주 불균형 표본 모두에서 보다 우수한 성과를 가지고 있으며, 특히 범주 불균형이 심화된 표본에서 유의적인 성과 차이를 보였다.

불균형 정형 데이터를 위한 SMOTE와 변형 CycleGAN 기반 하이브리드 오버샘플링 기법 (A Hybrid Oversampling Technique for Imbalanced Structured Data based on SMOTE and Adapted CycleGAN)

  • 노정담;최병구
    • 경영정보학연구
    • /
    • 제24권4호
    • /
    • pp.97-118
    • /
    • 2022
  • 이미지와 같은 비정형 데이터의 불균형 클래스 문제 해결에 있어 생산적 적대 신경망(generative adversarial network)에 기반한 오버샘플링 기법의 우수성이 알려짐에 따라 다양한 연구들이 이를 정형 데이터의 불균형 문제 해결에도 적용하기 시작하였다. 그러나 이러한 연구들은 데이터의 형태를 비정형 데이터 구조로 변경함으로써 정형 데이터의 특징을 정확하게 반영하지 못한다는 점이 문제로 지적되고 있다. 본 연구에서는 이를 해결하기 위해 순환 생산적 적대 신경망(cycle GAN)을 정형 데이터의 구조에 맞게 재구성하고 이를 SMOTE(synthetic minority oversampling technique) 기법과 결합한 하이브리드 오버샘플링 기법을 제안하였다. 특히 기존 연구와 달리 생산적 적대 신경망을 구성함에 있어 1차원 합성곱 신경망(1D-convolutional neural network)을 사용함으로써 기존 연구의 한계를 극복하고자 하였다. 본 연구에서 제안한 기법의 성능 비교를 위해 불균형 정형 데이터를 기반으로 오버샘플링을 진행하고 그 결과를 SMOTE, ADASYN(adaptive synthetic sampling) 등과 같은 기존 기법과 비교하였다. 비교 결과 차원이 많을수록, 불균형 정도가 심할수록 제안된 모형이 우수한 성능을 보이는 것으로 나타났다. 본 연구는 기존 연구와 달리 정형 데이터의 구조를 유지하면서 소수 클래스의 특징을 반영한 오버샘플링을 통해 분류의 성능을 향상시켰다는 점에서 의의가 있다.