• 제목/요약/키워드: short prediction

검색결과 1,034건 처리시간 0.025초

강수-일유출량 추정 LSTM 모형의 구축을 위한 자료 수집 방안 (Data collection strategy for building rainfall-runoff LSTM model predicting daily runoff)

  • 김동균;강석구
    • 한국수자원학회논문집
    • /
    • 제54권10호
    • /
    • pp.795-805
    • /
    • 2021
  • 본 연구는 소양강댐 유역을 대상으로 LSTM 기반의 일유출량 추정 딥러닝 모형을 개발한 후, 모형구조 및 입력자료의 다양한 조합에 대한 모형의 정확도를 살폈다. 첫 12년(1997.1.1-2008.12.31) 동안의 유역평균 일강수량, 일기온, 일풍속 (이상 입력), 일평균 유량 (출력)으로 이루어진 데이터베이스를 기반으로 모형을 구축하였으며, 이후 12년(2009.1.1-2020.12.31) 동안의 자료를 사용하여 Nash-Sutcliffe Model Efficiency Coefficient (NSE)와 RMSE를 살폈다. 가장 높은 정확도를 보인 조합은 64개의 은닉유닛을 가진 LSTM 모형 구조에 가능한 모든 입력자료(12년치의 일강수량, 일기온, 일풍속)를 활용한 경우로서 검증기간의 NSE와 RMSE는 각각 0.862와 76.8 m3/s를 기록하였다. LSTM의 은닉유닛이500개를 초과하는 경우 과적합으로 인한 모형의 성능 저하가 나타나기 시작했으며, 1000개를 초과하는 경우 과적합 문제가 두드러졌다. 12년치의 일강수만 입력자료로 활용한 경우에도 매우 높은 성능(NSE=0.8~0.84)의 모형이 구축되었으며, 한 해의 자료만을 활용하여 학습한 경우에도 충분히 활용 가능한 정확도(NSE=0.63~0.85)를 가진 모형을 구축할 수 있었다. 특히 유량의 변동성이 큰 한 해의 자료만을 활용하여 모형을 학습한 경우 매우 높은 정확도(NSE=0.85)의 모형이 구축되었다. 학습자료가 중유량과 양극한의 유량을 모두 포함한 경우라면 5년 이상의 입력자료는 모형의 성능을 크게 개선시키지 못했다.

기계학습법을 이용한 동해 남서부해역의 표층 이산화탄소분압(fCO2) 추정 (Estimation of Surface fCO2 in the Southwest East Sea using Machine Learning Techniques)

  • 함도식;박소예나;최상화;강동진;노태근;이동섭
    • 한국해양학회지:바다
    • /
    • 제24권3호
    • /
    • pp.375-388
    • /
    • 2019
  • 지구의 탄소순환을 이해하고 미래 대기 $CO_2$의 농도와 기후 변화를 예측하기 위해서는 해양과 대기 사이 $CO_2$ 교환율(sea-to-air $CO_2$ flux)의 시공간 변화를 정확하게 추정하는 것이 필요하다. 연구선을 이용한 현장 관측이 갖고 있는 시공간 제약으로 인해 동해에는 매우 제한적인 표층 이산화탄소분압($fCO_2$) 자료만 존재한다. 이 연구에서는 위성 및 수치모형에서 얻은 수온, 염분, 엽록소, 혼합층 자료를 세 종류의 기계학습 모형에 입력하여 동해 남서부해역의 고해상도 표층 $fCO_2$ 시계열 자료를 산출하였다. 세 모형 중 현장 관측 자료를 가장 잘 재현하는 Random Forest (RF) 모형의 평균제곱근오차는 $7.1{\mu}atm$이었다. RF 모형을 이용한 $fCO_2$ 예측에 중요한 역할을 하는 변수는 수온, 염분과 시간 정보였으며, 엽록소와 혼합층 깊이는 $fCO_2$ 예측에 미미한 역할을 하였다. RF 모형에서 예측한 표층 $fCO_2$를 이용하여 계산한 동해 남서부해역의 $CO_2$ 교환율은 $-0.76{\pm}1.15mol\;m^{-2}yr^{-1}$로 이전 현장 관측 연구에서 제시한 교환율( $-0.66{\sim}-2.47mol\;m^{-2}yr^{-1}$) 범위 중 작은 값에 해당한다. RF 모형의 표층 $fCO_2$ 시계열 자료는 1주일 내외의 짧은 시간 사이에도 $CO_2$ 교환율이 상당히 변할 수 있음을 보여주었다. 앞으로 보다 정확한 $CO_2$ 교환율 산출을 위해서는 $fCO_2$가 급격하게 변화하는 봄철에 높은 해상도의 현장 관측을 수행할 필요가 있다.

인공신경망을 이용한 N치 예측 (A Prediction of N-value Using Artificial Neural Network)

  • 김광명;박형준;구태훈;김형찬
    • 지질공학
    • /
    • 제30권4호
    • /
    • pp.457-468
    • /
    • 2020
  • 플랜트, 토목 및 건축 사업에서 말뚝(Pile) 설계 시 어려움을 겪는 주된 요인은 지반 특성의 불확실성이다. 특히 표준관입시험(Standard Penetration Test, SPT)을 통해 측정되는 N치를 얻는 것이 가장 중요한 자료이나 광범위한 모든 지역에서 구하는 것은 어려운 현실이다. 짧은 해외사업 입찰기간 내에 시추조사를 할 경우 인허가, 시간, 비용, 장비접근, 민원 등 많은 제약요건이 존재하여 전체적인 시추조사가 어렵다. 미시추 지점에서 지반 특성은 엔지니어의 경험적 판단에 의존하여 파악되고 있고, 이는 말뚝의 설계 및 물량산출 오류로 이어져서, 공기 지연 및 원가 증가의 원인이 되고 있다. 이를 극복하기 위해서, 한정된 최소한의 지반 실측 자료를 활용하여 미시추 지점에서도 N치를 예측 할 수 있는 기술이 요구되며, 본 연구에서는 AI기법 중 하나인 인공신경망을 적용하여 N치를 예측하는 연구를 수행하였다. 인공신경망은 제한된 양의 지반정보와 생물학적인 로직화 과정을 통하여 입력변수에 대한 보다 신뢰성 있는 결과를 제공하여 준다. 본 연구에서는 최소한의 시추자료의 지반정보를 입력항목으로 하여 다층퍼셉트론과 오류역전파 알고리즘에 의하여 학습된 패턴을 가지고 미시추 지점에서 N치를 예측하는데 그 목적을 두고 있다. 이를 위하여 2개 현장(필리핀, 인도네시아)에 AI기법 적용시 실측값과 예측값에 대한 적정성을 검토하였고, 그 결과 예측값에 대한 신뢰도가 높은 것으로 연구 검토되었다.

경제적, 산업구조적, 문화적 요인을 기반으로 한 주요 국가의 한국 품목별 수입액 예측 모형 개발: 한국의, 한국에 대한 문화적 요인을 중심으로 (Development of the forecasting model for import volume by item of major countries based on economic, industrial structural and cultural factors: Focusing on the cultural factors of Korea)

  • 전승표;서봉군;박도형
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.23-48
    • /
    • 2021
  • 한국경제는 지난 수십년간 정부의 수출전략정책에 힘입어 지속적으로 경제 성장을 이룩해왔으며, 수출의 증가는 경제의 효율성 향상, 고용창출, 기술개발 촉진 등 우리나라의 경제 성장을 견인하는 주도적인 역할을 해왔다. 전통적으로 우리나라 수출에 영향을 미치는 주요 요인은 크게 경제적 요인과 산업구조적 요인이라는 두가지 관점에서 찾아볼 수 있다. 첫번째, 경제적 요인은 환율과 글로벌 경기 변동과 관련된 것으로서, 환율이 우리나라 수출에 미치는 영향은 환율 수준 및 환율 변동성에 따른 영향으로 나누어 살펴볼 수 있으며, 글로벌 경기 변동은 세계 수입 수요에 영향을 미쳐 우리나라 수출을 좌우하는 절대적 요인으로 볼 수 있다. 두 번째, 산업구조적 요인은 국제 분업화의 둔화, 중국의 특정 수입품 자국내 대체 증가, 수출 주력 산업의 해외생산 형태 변화 등 산업이나 제품에 따라 발생한 고유한 특징이다. 가장 최근 글로벌 교류와 관련된 연구들을 살펴보면, 경제적 요인 및 산업구조적 요인과 더불어 문화적인 측면이 중요함을 여러 문헌에서 피력하고 있다. 이에 따라 본 연구에서는 각국의 한국 수입액 예측 모형에 문화적 요인을 함께 반영하여 예측 모형을 개발하고자 하였으며, 구체적으로 문화적 요인이 수입액에 미치는 영향을 PUSH-PULL 프레임워크 관점에서 반영해보고자 하였다. PUSH 관점은 한국이 자신의 브랜드를 개발하고 적극 홍보하는 관점으로 K-POP, K-FOOD, K-CULTURE 등으로 대표되는 한국의 브랜드에 대한 각국의 관심 정도로 정의할 수 있다. 또한, PULL 관점은 각 국가의 국민들의 문화적, 심리적 특징으로 해당 국가의 지배체계, 남성성, 위험 회피성, 시간에 대한 단기/장기 지향성 등으로 대표되는 각 국의 문화 코드로서 한류문화를 얼마나 수용할 성향을 띄고 있는지로 정의할 수 있다. 본 연구에서 제시한 최종 예측 모델의 고유한 특징은 Design Principle에 기반하여 설계한 것인데, 1) 신규로 추가한 데이터 소스를 통해 한국에 대한 관심 및 문화적 특성이 반영될 수 있는 모형으로 구축하였고, 2) 경제적 요인 등의 변화와 품목 및 국가 Code를 입력하면 예측값을 바로 불러올 수 있도록 실용적으로 편의성 있게 설계하였으며, 3) 이론적으로도 의미 있는 결과를 도출하기 위해서 입력과 목표 변수간의 관계를 해석 가능한 알고리즘을 중심으로 설계하였다는 점이다. 본 연구는 기술적 측면, 경제적 측면, 정책적 측면에서 의미 있는 시사점을 제시할 수 있으며, 수입액 예측 모형을 활용하여 중소·중견기업의 수출 지원 전략에 의미 있는 기여를 할 수 있을 것으로 기대된다.

초소형 SAR 위성을 활용한 수체면적 추출: 대청댐 유역 대상 (Extraction of Water Body Area using Micro Satellite SAR: A Case Study of the Daecheng Dam of South korea)

  • 박종수;강기묵;황의호
    • 한국지리정보학회지
    • /
    • 제24권4호
    • /
    • pp.41-54
    • /
    • 2021
  • 수자원 관리와 수재해 피해 분석 및 예측 등을 위해 원격탐사를 활용한 수체면적을 추정하는 것은 매우 필수적이다. 위성을 활용한 수체탐지는 주로 광학 및 영상레이더(Synthetic Aperture Radar, SAR) 센서를 탑재한 대형(무게 1,000kg 이상) 위성을 중심으로 수행되어왔다. 그러나 긴 재방문주기(repeat cycle)로 인해 재난/재해 시 적시 활용이 불가능한 한계가 존재한다. 최근 초소형위성(무게 100kg 미만) 개발이 활발히 이루어짐에 따라 기존 대형위성 중심의 시간해상도 한계를 극복할 수 있는 계기가 되었다. 현재 활발히 운용중인 초소형 SAR 위성은 핀란드의 ICEYE와 미국의 Capella 위성으로, 지구관측을 목적으로 군집(constellation) 형태로 운용되고 있다. 군집화 운용으로 인해 짧은 재방문주기(현재 0.8회/1일) 및 고해상도(Spot(0.5m))를 가지며, SAR센서 탑재로 기상 및 주야 무관하게 관측이 가능한 장점이 있다. 본 연구에서는 초소형위성의 운영 현황 및 특징에 대해서 기술하였으며, 초소형 SAR 위성 영상에 최적화된 수체면적 추정기술을 한반도 대청댐 유역에 적용해 보았다. 또한 광학 위성인 Sentinel-2 위성으로부터 생성된 수체를 참조값(reference)으로 하여 초소형위성 2기와 대형위성인 Sentinel-1위성과의 면적, 상관성 분석을 수행하였다. Capella 위성의 경우 가장 적은 면적의 차를 보였으며, 세 영상 모두 높은 상관관계를 나타냄을 확인하였다. 본 연구의 결과를 통해 초소형 SAR 위성의 낮은 NESZ(Noise Equivalent Sigma Zero)에도 불구하고 수체면적 추정이 가능함을 확인하였으며, 기존 대형 SAR 위성을 활용한 수자원/수재해 감시 활용의 한계를 극복할 수 있을 것으로 사료된다.

딥러닝 기법을 이용한 제주도 중제주수역 지하수위 예측 모델개발 (Development of Deep-Learning-Based Models for Predicting Groundwater Levels in the Middle-Jeju Watershed, Jeju Island)

  • 박재성;정지호;정진아;김기홍;신재현;이동엽;정새봄
    • 지질공학
    • /
    • 제32권4호
    • /
    • pp.697-723
    • /
    • 2022
  • 본연구에서는 제주도의 중제주 수역 내에 위치하는 총 12개 지하수 관정에서 미래 30일 기간의 지하수위를 예측할 수 있는 모델을 개발하였다. 예측 모델개발을 위해 시계열 예측에 적합한 딥러닝 기법의 하나인 누적 장단기 메모리(stacked-LSTM) 기법을 이용하였으며, 2001년에서 2022년 동안 관측된 일 단위 강수량, 지하수 이용량 및 지하수위 자료가 예측 모델개발에 활용되었다. 특히, 본 연구에서는 입력자료의 종류 및 과거 자료의 순차 길이에 따라 다양한 모델을 구축하고 성능을 비교함으로써 딥러닝 기반 예측 모델개발에서 고려하여야 할 사항에 대한 검토와 절차를 제시하였다. 예측 모델개발 결과, 강수량, 지하수 이용량 및 과거 지하수위를 모두 입력자료로 활용하는 모델의 예측성능이 가장 뛰어난 것으로 확인되었으며, 입력으로 활용되는 과거 자료의 순차가 길수록 예측의 성능이 향상됨을 확인하였다. 이는 제주도의 깊은 지하수위 심도로 인하여 강수와 지하수 함양 간 지연시간이 길기 때문으로 판단된다. 이뿐만 아니라, 지하수 이용량 자료의 경우, 모든 이용량 자료를 활용하는 것보다 예측하고자 하는 지점의 지하수위에 민감한 영향을 주는 관정을 선별하여 입력자료로 이용하는 것이 예측 모델의 성능 개선에 긍정적 영향을 주는 것을 확인하였다. 본 연구에서 개발된 지하수위 예측 모델은 현재의 강수량 및 지하수 이용량을 기반으로 미래의 지하수위를 예측할 수 있어 미래의 지하수량에 대한 건전성 정보를 제공함에 따라 적정 지하수량 유지를 위한 다양한 관리방안 마련에 도움이 될 것으로 판단된다.

고해상도 광학 위성영상의 항만선박관리 활용 가능성 평가: 부산 신항의 선석 활용을 대상으로 (Evaluation of the Utilization Potential of High-Resolution Optical Satellite Images in Port Ship Management: A Case Study on Berth Utilization in Busan New Port)

  • 김현수 ;장소영 ;김태호
    • 대한원격탐사학회지
    • /
    • 제39권5_4호
    • /
    • pp.1173-1183
    • /
    • 2023
  • 한국의 전체 수출입 물동량은 지난 20여년 동안 연평균 약 5.3%씩 증가하였고, 약 99%가량의 화물이 여전히 해상을 통해 운송되고 있는 것으로 나타났다. 최근 해상 물동량 증가, 코로나 및 전쟁 등의 이유로 해상 물류가 혼잡해지고 예측이 어려워지고 있어 지속적인 항만의 모니터링이 중요하다. 다양한 지상 관측 시스템과 automatic identification system (AIS) 정보를 이용하여 항만을 모니터링하고 항만 내 컨테이너 터미널의 효율적 운영과 물동량 예측을 위한 많은 선행 연구가 진행되었다. 하지만, 소형 무역항이나 개발도상국의 무역항의 경우 대형 항만에 비해 환경 문제와 노후화된 인프라 등의 이유로 항만을 모니터링하기에 어려움이 있다. 최근 인공위성의 활용성이 높아짐에 따라 광범위하고 접근하기 어려운 지역에 대해 위성 영상을 이용하여 지속적인 해상 물동량 데이터 수집 및 해양 감시체계 구축을 위한 선행 연구가 진행되고 있다. 본 연구는 고해상도 위성영상을 이용하여 부산 신항을 대상으로 항만 내 컨테이너 터미널에 존재하는 선석에 정박한 선박을 육안으로 탐지하고 선석 활용률을 정량적으로 평가하고자 한다. 국토위성, 아리랑위성 3호, PlanetScope, Sentinel-2A를 이용해 항만 내 선석에 정박하고 있는 선박을 육안으로 탐지하였고 선석에 정박 가능한 전체 선박의 수를 이용하여 선석 활용률을 산출하였다. 산출 결과 2022년 6월 2일의 경우 0.67, 0.7, 0.59로 변화하는 것을 보였으며, 영상 촬영 시각에 따라 선박의 수가 변화한 것으로 확인되었다. 2022년 6월 3일의 경우 0.7로 동일한 것으로 나타났고 이는 선박의 종류는 변화하였으나 촬영 시각에 선박의 수는 동일한 것으로 확인이 되었다. 선석 활용률은 값이 클수록 해당 선석에서의 작업이 활발하게 이루어지고 있는 것을 의미하고 있으며, 이는 선석이 혼잡하여 정박지에서 대기하고 있는 다른 선박의 대기시간이 길어지고 운임료가 증가할 수 있기 때문에 선석 활용률을 이용하여 기초적인 새로운 선박 운항 계획 수립에 도움이 될 것으로 판단된다. 선석에서의 작업시간은 수시간에서 수일이 소요되는데 영상의 촬영 시간 차이에 따른 선석에서의 선박의 변화율을 산출한 결과 4분 49초의 시간차이에도 선박의 변화가 있는 것을 확인할 수 있었다. 이는 관측 주기가 짧고 고해상도 위성영상을 모두 이용한다면 항만내 지속적인 모니터링이 가능할 것으로 사료된다. 그리고 항만 내 선박의 변화를 최소 시간 단위로 확인할 수 있는 위성 영상을 활용하면 항만 관리가 이루어지지 않는 소형 무역항이나 개발도상국의 무역항 등에서도 유용하게 사용할 수 있을 것으로 기대된다.

지역 특성을 고려한 무더위쉼터의 입지특성 분석 및 평가 모델 개발 (Development of a Model for Analylzing and Evaluating the Suitability of Locations for Cooling Center Considering Local Characteristics)

  • 류지은;부찬종;이경일;조경두
    • 환경영향평가
    • /
    • 제33권4호
    • /
    • pp.143-154
    • /
    • 2024
  • 기후변화로 인한 폭염은 취약계층의 건강 피해를 급격히 증가시키고 있으며, 이를 예방하기 위하여 국가, 광역, 기초지자체는 기후위기 적응대책을 수립하고 있다. 폭염 피해를 줄이기 위한 대표적인 기후위기 적응대책은 무더위쉼터 개소 수 확대이다. 단기간에 효과가 높아 전라북도를 제외한 대부분의 광역지자체에서는 해당 사업을 적응대책으로 포함하고 있다. 하지만 예산 및 비예산 등에 따라 무더위쉼터로서 선정 기준이 달라 무더위쉼터의 이용률 및 효과가 모두 다르다. 따라서 본 연구에서는 지자체에서 적응대책 이행을 위해 무더위쉼터 확장 시 가능성이 높은 지역을 예측 및 평가할 수 있는 로지스틱 회귀분석 모델을 개발하였다. 원도심과 신도시의 공존 등으로 다양한 폭염 취약 환경으로 구성된 인천광역시를 대상으로 사회·경제적·환경적 차이를 고려하여 강화·옹진군과 이외의 지역으로 구분하여 무더위쉼터 가능 지역을 예측하는 로지스틱 모델을 개발하였다. 연구 결과, 강화·옹진군 지역의 통계 모델에서는 지표면 온도가 높을수록, 65세 이상 고령자수가 많을수록 무더위쉼터 가능성이 높은 것으로 나타났으며, 약 80.93%의 예측 정확도를 나타냈다. 강화·옹진군 이외의 지역에 대해서는 지표면온도가 높을수록, 65세 이상 고령자 수가 많을수록, 30년 이상인 노후 주택으로부터의 거리가 가까울수록, 공공시설로부터의 거리가 가까울수록 무더위쉼터 가능성이 높은 것으로 나타났으며, 약 89.08%의 예측 정확도로 나타났다. 개발된 로지스틱 회귀모형은 지역의 특성을 고려하여 무더위쉼터로서 가능성이 높은 지역을 예측 및 평가할 수 있으며, 추후 무더위쉼터 추가 지정 시 우선순위 선정 및 관리에 활용할 수 있을 것으로 기대한다.

과배란유도 시 혈중 AMH와 난소 반응성과의 상관관계; 예측 인자로서의 효용성 (Correlation of Basal AMH & Ovarian Response in IVF Cycles; Predictive Value of AMH)

  • 안영선;김진영;조연진;김민지;김혜옥;박찬우;송인옥;궁미경;강인수
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제35권4호
    • /
    • pp.309-317
    • /
    • 2008
  • 목 적: 체외수정을 위한 과배란유도 시 난소 반응성의 예측 인자로서 항뮬러리안 호르몬 (AMH)의 효용성을 FSH와 비교하여 알아보고, 체외수정 결과와의 관계도 알아보고자 하였다. 연구방법: 2007년 1월부터 2007년 8월까지 단기 요법이나 GnRH antagonist 요법을 이용하여 체외수정을 시행하는 111명을 대상으로, 생리주기 3일째 혈중 AMH 및 FSH를 전향적으로 측정하였다. 과배란유도 후 채취된 난자 개수와 AMH 또는 FSH의 상관관계를 분석하였고, 채취된 난자 수 및 AMH 수치에 따라 과배란유도 결과와 체외수정 결과를 비교하였다. 저반응군 및 과반응군의 예측을 위한 AMH의 임계치를 알아보기 위해 ROC curve 분석을 시행하였다. 결 과: AMH는 채취된 성숙 난자 수와 밀접한 양의 상관관계를 나타냈으며 (r=0.792, p<0.001), FSH (r=-0.477, p<0.001) 보다 더 높은 상관관계를 보였다. 난소 반응성에 따라 저반응군 (성숙난자수 ${\leq}2$), 정상반응군 ($3{\sim}16$), 과반응군 (${\geq}17$)으로 나누어 AMH와 FSH 수치는 유의한 차이를 보였으며, 저반응군 (채취된 성숙 난자 수${\leq}2$) 및 과반응군 (채취된 성숙 난자 수${\geq}17$)을 예측하는데 ROC curve 상 AMH의 임계치는 각각 <0.50 ng/ml (sensitivity 88.9%, specificity 89.5%), 및 ${\geq}2.60\;ng/ml$ ((sensitivity 85.7%, specificity 87.0%)였다. AMH level에 따라 low AMH group (${\leq}0.60\;ng/ml$), normal AMH group ($0.60{\sim}2.60\;ng/ml$), high AMH group으로 구분하여, 각 군간 채취된 성숙 난자 수와 ($2.7{\pm}2.2$, $8.1{\pm}4.8$, $16.5{\pm}5.7$, p<0.001), 투여된 성선자극호르몬제의 용량에 ($3530.5{\pm}1251.0$, $2957.1{\pm}1057.6$, $2219.2{\pm}751.9\;IU$, p<0.001) 유의한 차이를 보였다. 성숙 난자의 비율과 수정율에 유의한 차이는 없었으며 임신율도 23.8%, 34.0%, 37.5%로 각 군간 유의한 차이는 없었다. 결 론: 혈중 기저 AMH는 과배란유도 시 채취되는 성숙 난자 수와 높은 상관관계가 있어 난소 반응성의 예측 인자로서 유용할 것으로 생각된다. AMH 수치에 따라 체외수정 결과에는 차이가 없었으나, 저반응군 및 과반응군의 예측에 유용하여 체외수정 시 주기의 취소나, 환자별 적정 용량의 결정 및 난소과자극 증후군의 위험을 감소시키는데 도움이 될 것으로 사료된다.

사회연결망 분석을 활용한 연관규칙 확장기법 (Extension Method of Association Rules Using Social Network Analysis)

  • 이동원
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.111-126
    • /
    • 2017
  • 연관 상품 추천은 수많은 상품을 다루는 온라인 상거래에서 소비자의 상품 탐색 시간을 줄여주며 판매자의 매출 증대에 크게 기여한다. 이는 주문과 같은 거래의 빈도를 기반으로 생성되므로, 통계적으로 판매 확률이 높은 상품을 효과적으로 선별할 수 있다. 하지만, 판매 가능성이 높은 경우라도 신상품처럼 판매 초기에 거래 건수가 충분하지 않은 상품은 추천에서 누락될 수 있다. 연관 추천에서 누락된 상품은 이로 인해 노출 기회를 잃게 되고, 이는 거래 건수 감소로 이어져, 또 다시 추천 기회를 잃는 악순환을 겪을 수도 한다. 따라서, 충분한 거래 건수가 쌓이기 전까지 초기 매출은 일정 기간 동안 정체되는 현상을 보이는데, 의류 등과 같이 유행에 민감하거나 계절 변화에 영향을 많이 받는 상품은 이로 인해 매출에 큰 타격을 입을 수도 있다. 본 연구는 이와 같이 거래 초기의 낮은 거래 빈도로 인해 잘 드러나지 않는 상품 간의 잠재적인 연관성을 찾아 추천 기회를 확보할 수 있도록 연관 규칙을 확장하기 위한 목적으로 수행되었다. 두 상품 간에 직접적인 연관성이 나타나지 않더라도 다른 상품을 매개로 두 상품 간의 잠재적 연관성을 예측할 수 있을 것이며, 이런 연관성은 주문에서 나타나는 상품 간 상호작용으로 표현될 수 있으므로, 사회연결망 분석을 활용한 분석을 시도하였다. 사회연결망 분석기법을 통해 각 상품의 속성과 두 상품 간 경로의 특성을 추출하고 회귀분석을 실시하여, 두 상품 간 경로의 최단 거리 및 경로의 개수, 각 상품이 얼마나 많은 상품과 연관성을 갖는지, 두 상품의 분류 카테고리가 어느 정도 일치하는지가 두 상품 간의 잠재적 연관성에 미친다는 것을 확인하였다. 모형의 성능을 평가하기 위해, 일정 기간의 주문 데이터로부터 연결망을 구성하고, 이후 10일 간 생성될 상품 간 연관성을 예측하는 실험을 진행하였다. 실험 결과는 모형을 적용하지 않는 경우보다 제안 모형을 활용할 때 훨씬 많은 연관성을 찾을 수 있음을 보여준다.