• 제목/요약/키워드: 데이터 집계

검색결과 215건 처리시간 0.022초

협업 필터링 및 하이브리드 필터링을 이용한 동종 브랜드 판매 매장간(間) 취급 SKU 추천 시스템 (SKU recommender system for retail stores that carry identical brands using collaborative filtering and hybrid filtering)

  • 조용민;남기환
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.77-110
    • /
    • 2017
  • 최근 인터넷 기반의 웹 및 모바일 기기를 통한 소비 패턴의 다양화와 개성화가 급진전됨에 따라 전통적 유통채널인 오프라인 매장의 효율적 운영이 더욱 중요해졌다. 매장의 매출과 수익 모두를 제고하기 위해 매장은 소비자에게 가장 매력적인 상품을 적시에 공급-판매 해야 하는데 많은 상품들 중에서 어떤 SKU를 취급하는 것이 판매 확률을 높이고 재고 비용을 낮출 수 있는지에 대한 연구가 부족한 실정이다. 특히, 여러 지역에 걸쳐 다수의 오프라인 매장을 통해 상품을 판매하는 기업의 경우 고객에게 매력적인 적절한 SKU를 추천 받아 취급할 수 있다면 매장의 매출 및 수익률 제고에 도움이 될 것이다. 본 연구에서는 개인화 추천에 이용되어 왔던 협업 필터링과 하이브리드 필터링 등의 추천 시스템(Recommender System)을 국가별, 지역별로 복수의 판매 매장을 통해 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하였다. 각 매장의 취급 품목별 구매 데이터를 활용하여 각 매장 별 유사성(Similarity)을 계산하고 각 매장의 SKU별 판매 이력에 따라 협업 필터링을 하여 최종적으로 매장에 개별 SKU를 추천하였다. 또한 매장 프로파일 데이터를 활용하여 주변수 분석 (PCA : Principal Component Analysis) 및 군집 분석(Clustering)을 통하여 매장을 4개의 군집으로 분류한 뒤 각 군집 내에서 협업 필터링을 적용한 하이브리드 필터링 방식으로 추천 시스템을 구현하고 실제 판매 데이터를 바탕으로 두 방식의 성능을 측정하였다. 현존하는 대부분의 추천 시스템은 사용자에게 영화, 음악 등의 아이템을 추천하는 방식으로 연구가 진행되어 왔고 실제로 산업계에서의 적용 또한 개인화 추천 시스템이 주류를 이루고 있다. 그 동안 개인화 서비스 영역에서 주로 다루어져 왔던 이러한 추천 시스템을 동종 브랜드를 취급하는 유통 기업의 매장 단위에 적용하여 각 매장의 취급 SKU를 추천하는 방식에 대한 연구는 거의 이루어지지 않고 있는 실정이다. 기존 추천 방법론의 추천 적용 대상이 '개인의 영역이었다면 본 연구에서는 국가별, 지역별로 복수의 판매 매장을 통해 개인의 영역을 넘어 매장의 영역으로 확대하여 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하고 있다. 또한 기존의 추천시스템은 온라인에 한정되었다면 이를 오프라인으로 활용 범위를 넓히고, 기존 개인을 기반으로 분석을 하는 것보다 매장영역으로 확대 적용하기에 적합한 알고리즘을 개발하기 위해 데이터마이닝 기법을 적용하여 추천 방법을 제안한다. 본 연구의 결과가 갖는 의의는 개인화 추천 알고리즘을 동일 브랜드를 취급하는 복수의 판매 매장에 적용하여 의미 있는 결과를 도출하고 실제 기업을 대상으로 시스템으로 구축하여 활용할 수 있는 구체적 방법론을 제시했다는 데에 있다. 개인화 영역을 위주로 이루어졌던 기존의 추천 시스템과 관련한 학계의 연구 영역을 동종 브랜드를 취급하는 기업의 판매 매장으로 확장시킨 첫 시도라는 데에도 의미가 있다. 2014년 03주차 ~ 05주차 전(全) 매장 판매 수량 실적 Top 100개 SKU로 추천의 대상을 한정하여 협업 필터링과 하이브리드 필터링 방식으로 52개 매장 별로 취급 SKU를 추천하고, 추천 받은 SKU에 대한 2014년 06주차 매장별 판매 실적을 집계하여 두 추천 방식의 성과를 비교하였다. 두 추천 방식을 비교한 이유는 본 연구의 추천 방법이 기존 추천 방식 보다 높은 성과를 입증하기 위해 단순히 오프라인에 협업필터링을 적용한 것을 기준 모델로 정의하였다. 이 기준 모델에 오프라인 매장 관점의 특성을 잘 반영한 본 연구 모델인 하이브리드 필터링 방법과 비교 함으로써 성과를 입증한다. 연구에서 제안한 방식은 기존 추천 방식보다 높은 성과를 나타냈으며, 이는 국내 대기업 의류업체의 실제 판매데이터를 활용하여 입증하였다. 본 연구는 개인 수준의 추천시스템을 그룹수준으로 확장하여 효율적으로 접근하는 방법을 이론적인 프레임 워크를 만들었을 뿐 아니라 실제 데이터를 기반으로 분석하여 봄으로써 실제 기업들이 적용해 볼 수 있다는 점에서 연구의 가치가 크다.

GIS DB를 이용한 토지이용 특성 분석 - 부산광역시 건물 높이 시뮬레이션을 중심으로 - (Analysis of Land Use Characteristics Using GIS DB - A Case Study of Busan Metropolitan City in Korea -)

  • 천민경;백태경
    • 한국지리정보학회지
    • /
    • 제26권3호
    • /
    • pp.52-64
    • /
    • 2023
  • 급격한 도시의 발전을 거듭해 갈수록 인구과밀, 공해오염, 도시 위생문제 등이 발생하면서 상충하는 용도 간의 분리 필요성이 대두되고 있다. 이러한 관점에서 도시의 토지이용이 계획적으로 이루어져야 함에는 이견이 없을 것이다. 따라서 토지공간의 제반 활동을 미리 예측하고 계획적으로 세워 토지이용을 합리적으로 구축하여야 한다. 본 연구는 구축된 데이터를 이용하여 부산광역시의 주거지역, 상업지역, 공업지역 용도분포특성 현황을 비교 분석하여 부산광역시 구·군의 용도지역별 건축물 면적 현황, 연면적, 용적률을 파악하였다. 그 결과 용도지역별 면적 중 주거지역의 비율이 51%로 가장 큰 비율을 차지하고 있었으며, 용도지역별 연면적 중 주거지역의 비율이 63%로 가장 큰 비율을 차지하고 있음을 알 수 있었다. 그리고 토지이용구성비만으로 지역특성을 파악할 수 있는 특화계수를 사용하여 분석하였다. 면적의 절댓값을 집계하는 것만으로는 지역 전체의 경향을 파악하기 어렵기 때문에 면적 구성비를 계산하여 비교하였다. 용도지역별 특화계수 중 주거시설을 보면 기장군, 사상구, 사하구, 중구 이외에는 1.0 이상을 나타내고 있다. 상업시설은 기장군, 강서구, 남구, 사상구, 사하구 이외에는 1.0 이상을 공업시설을 보면 강서구(2.5), 기장군(1.22), 사상구(2.06), 사하구(1.64)로 공단분포지역임을 알 수 있다. 이외 업무시설과 문교후생시설은 골고루 분포되어 있음을 알 수 있었다. 용도지역별 각 표고에 따른 건축물 높이 현황과 용도지역별 건축물 높이 시뮬레이션을 통한 토지이용 분석을 실시하였다. 전반적으로 부산시는 80m 이상의 지역이 43% 이상을 차지하고 있어, 용도지역의 분포가 지형적인 조건의 영향으로 표고가 높은 지역에 지정되어 있음을 알 수 있었다.

다중이용시설 내 식생바이오필터 시스템의 PM10, PM2.5 저감효과 및 측정방법에 대한 연구 (Study on PM10, PM2.5 Reduction Effects and Measurement Method of Vegetation Bio-Filters System in Multi-Use Facility)

  • 김태한;최부헌
    • 한국조경학회지
    • /
    • 제48권5호
    • /
    • pp.80-88
    • /
    • 2020
  • 2019년 3월 미세먼지 비상저감조치가 일주일 동안 발령되면서, 미세먼지로 인한 국민의 불안감은 점차 가중되고 있다. 본 연구는 공기정화식물이 적용된 바이오필터의 다중이용시설 내 적용성 평가를 위해 입자상 오염원의 실내 연속방출환경을 조성하여 오염원 저감효과에 대한 측정방법을 제안하고, 시스템의 실내공기질 개선 여부를 확인할 수 있는 기초연구를 진행하였다. 강의실을 대상으로 춘절기에 모니터링 1시간 전 모기향을 오염원으로 배경농도를 조성한 후, 스케줄에 따라 2시간 관수, 1시간 송풍하여 미세먼지의 저감능을 확인하였으며, 바이오필터 2m 전방에 PM10, PM2.5 및 온습도 센서를 설치하고, 3개 송풍구 중 중앙에 풍속 프로브를 설치하여 시계열 모니터링을 수행하였다. 바이오필터에 구비된 총 3개소의 송풍구 평균 면풍속은 0.38±0.16 m/s로 댐퍼 면적이 제외된 송풍구별 면적 0.29m×0.65m을 적용한 총 공조풍량이 776.89±320.16㎥/h로 산출되었다. 시스템 가동으로 평균온도 21.5~22.3℃, 평균상대습도 63.79~73.6%를 유지하여, 선행연구의 다양한 조건별 온습도 범위에 부합하는 것으로 판단된다. 시스템 공조부 구동을 통해 급격하게 상대습도를 상승시키는 효과를 효율적으로 운용할 경우, 계절에 따른 실내 미세먼지 저감과 적정한 상대습도 확보도 가능할 것으로 판단된다. 미세먼지 농도는 바이오필터 시스템 가동 전의 모든 주기에서 상승 현상이 동일하게 집계되었으며, 시스템 가동 후 1주기 송풍구간(B-1, β=-3.83, β=-2.45)에서 미세먼지(PM10)는 최대 28.8% 수준인 560.3㎍/㎥, 초미세 먼지(PM2.5)는 최대 28.0% 수준인 350.0㎍/㎥까지 저감되었다. 이후 미세먼지(PM10, PM2.5)의 농도는 2주기 송풍구간 감소(B-2, β=-5.50, β=-3.30)로 각각 최대 32.6% 수준인 647.0㎍/㎥, 32.4% 수준인 401.3㎍/㎥까지 저감되었고, 3주기 송풍구간감소(B-3, β=5.48, β=-3.51)로 최대 30.8% 수준인 732.7㎍/㎥, 31.0% 수준인 459.3㎍/㎥까지 저감된 것으로 확인되었다. 본 연구는 식생 바이오필터의 다중이용시설 내 설치와 유관한 관련 표준 및 규정을 참조하여, 객관적인 성능평가환경의 구축 방안을 제시할 수 있었다. 이를 통해 일반 강의실 환경 내에 보다 객관화된 모니터링 인프라를 조성하여, 상대적으로 신뢰성 있는 데이터 확보가 가능했던 것으로 판단된다.

중국 『무이구곡도』 3폭(幅)의 비교 분석을 통해 본 18세기 무이산 구곡계(九曲溪)의 경물 인지특성 (An Analysis of the Landscape Cognitive Characteristics of 'Gugok Streams' in the First Half of the 18th Century Based on the Comparison of China's 『Wuyi-Gugok Painting』)

  • 정조하;노재현;강정
    • 한국전통조경학회지
    • /
    • 제37권3호
    • /
    • pp.62-82
    • /
    • 2019
  • 중국 청나라 중기에 제작된 『산수분계지도(山水分界之圖): A』, 『무이산구곡계전도(武夷山九曲溪全圖): B』 그리고 『무이산십팔경도(武夷山十八景圖): C』 등 3폭의 『무이구곡도』를 대상으로, 그림에 명기된 명칭을 조사한 뒤 문헌조사를 병행하여 경처와 경물유형, 이미지 분석을 시도하였다. 이후 각 곡별 경물 유형수와 경물수를 바탕으로 한 경물풍부도와 경관유사도 분석을 통해 18C '무이산 구곡계'의 경관 인지특성을 살펴본 연구결과는 다음과 같다. 첫째, 『무이산지』의 명소 유형에 대한 묘사에 따르면, 3폭 그림 중 경물 명칭은 총 41개 유형으로 집계되었는데, 이 중 암(岩)·봉(峰)·석(石) 등 3개 경물이 차지하는 경관적 비중이 압도적으로 우세하였다. 데이터에 따르면 무이구곡의 경관 중 암·봉·석의 수가 절반 이상으로 이는 단하지모(丹霞地貌) 등으로 이루어진 무이산의 지모경관적 특성이 반영된 결과이다. 둘째, 구곡계 경관은 다양하고 심상이 풍부한 것으로 확인되었다. 그림 상의 주 대상장인 제1곡 대왕봉과 만정봉, 제2곡 옥녀봉, 제3곡 소장봉, 제4곡 대장봉, 제5곡 대은병과 무이정사 그리고 제6곡 선장봉과 천유봉은 경물풍부도(景觀豐富度)가 탁월한 반면, 7~9곡은 상대적으로 낮게 나타났다. 셋째, 곡별 경관이미지 조사 결과, 구곡계의 인문경관 심상 형성에는 무이산과 관련된 신화 및 전설에서 비롯된 특이성으로 인해 경관 인지도가 매우 높았다. 특히 제1곡과 제5곡은 무이군을 바탕으로 한 도교문화와 주자의 성리문화와 관련한 석각문화, 주유문화(舟遊文化) 등과 밀접하게 관련되어 있다. 넷째, 41가지 경물 유형에 따른 경관유사도 분석 결과, A와 C의 유사도가 매우 높았으며 형태묘사 및 원근 표현관계가 매우 흡사함을 볼 때, 한쪽 그림의 영향을 받은 것이 분명한 것으로 판단된다. 전체적으로 3폭의 그림에 묘사된 경물명은 오랜 시간 동안 전승, 누적된 신화 및 전설 그리고 경물의 이름붙이기를 통해 최소한 18C 전반 이전에 이미 정착·형성되어 인지되어 온 문화경관임이 확인된다. 다소의 순위 차이는 있으나 3폭 모두에 출현하는 경물 유형은 '석'이 21개소, '암'이 20개소, '봉'이 17개소로 석, 암, 봉은 무이산 구곡계의 경관성을 견인하고 있다. 다섯째, A와 C에서는 선조대(仙釣臺/태(台))가 제4곡도에 묘사되어 있지만, 한국에서는 제3곡의 경물명칭으로 알려지고 있는 점은 주목할 만하다. 또한 1곡의 승진동(升眞洞), 7곡의 석당사(石堂寺)는 그림 A·B·C 모두에서 묘사되고 있지 않는 점은 특이하며 향후 연구가 필요한 부분이다.

영화 추천 시스템의 초기 사용자 문제를 위한 장르 선호 기반의 클러스터링 기법 (Clustering Method based on Genre Interest for Cold-Start Problem in Movie Recommendation)

  • 유띳로따낙;누르지드;하인애;조근식
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.57-77
    • /
    • 2013
  • 소셜 미디어는 모바일 어플리케이션과 웹에서 가장 많이 사용되는 미디어 중 하나이다. Nielsen사의 보고서에 따르면 소셜 네트워크 서비스와 블로그가 온라인 사용자의 주 활동 공간으로 사용되고 있으며, 미국인 중에서 온라인 활동이 왕성한 5명의 사용자중 4명은 매일 소셜 네트워크 서비스와 블로그를 방문하고 온라인 활동 시간의 23%를 소비한다고 집계하고 있다. 미국의 인터넷 사용자들은 야후, 구글, AOL 미디어 네트워크, 트위터, 링크드인 등과 같은 소셜 네트워크 서비스중 페이스북에서 가장 많은 시간을 소비한다. 최근에는 대부분의 회사들이 자신의 특정 상품에 대하여 "페이스북 페이지(Facebook Page)"를 생성하고 상품에 대한 프로모션을 진행한다. 페이스북에서 제공되는 "좋아요" 옵션은 페이스북 페이지를 통해 자신이 관심을 가지는 상품(아이템)을 표시하고 그 상품을 지지할 수 있도록 한다. 많은 영화를 제작하는 영화 제작사들도 페이스북 페이지와 "좋아요" 옵션을 이용하여 영화 프로모션과 마케팅에 이용한다. 일반적으로 다수의 스트리밍 서비스 제공업들도 영화와 TV 프로그램을 즐기며 볼 수 있는 서비스를 사용자들에게 제공한다. 이 서비스는 일반 컴퓨터와 TV 등의 단말기에서인터넷을 통해 영화와 TV 프로그램을 즉각적으로 제공할 수 있다. 스트리밍 서비스의 선두 주자인 넷플릭스는 미국, 라틴 아메리카, 영국 그리고 북유럽 국가 등에 3천만 명 이상의 스트리밍 사용자가 가입되어 있다. 또한 넥플릭스는 다양한 장르로 구성된 수백만 개의 영화와 TV 프로그램을 보유하고 있다. 하지만 수많은 콘텐츠로 인해 사용자들은 자신이 선호하는 장르에 관련된 영화와 TV 프로그램을 찾기 위해 많은 시간을 소비해야 된다. 많은 연구자들이 이러한 사용자의 불편함을 줄이기 위해 아이템에 대한 사용자가 보지 않은 아이템에 대한 선호도를 예측하고 높은 예측값을 갖는 아이템을 사용자에게 제공하기 위한 추천 시스템을 적용하였다. 협업적 여과 방법은 추천 시스템을 구축하기 위해 가장 많이 사용되는 방법이다. 협업적 여과 시스템은 사용자들이 평가한 아이템을 기반으로 각 사용자 간의 유사도를 측정하고 목적 사용자와 유사한 성향을 가진 사용자 그룹을 결정한다. 군집된 그룹은 이웃 사용자 집단으로 불리며 이를 이용하여 특정 아이템에 대한 선호도를 예측하고, 예측 값이 높은 아이템을 목적 사용자에게 추천해 준다. 협업적 여과 방법이 적용되는 분야는 서적, 음악, 영화, 뉴스 및 비디오 등 다양하지만 논문에서는 영화에 초점을 맞춘다. 이 협업적 여과 방법이 추천 시스템 내에서 유용하게 활용되고 있지만 아직 "희박성 문제"와 "콜드 스타트 문제" 등 해결해야 할 과제가 남아있다. 희박성 문제는 아이템의 수가 증가할수록 아이템에 대한 사용자의 로그 밀도가 감소하는 것이다. 즉, 전체 아이템 수에 비해 사용자가 아이템에 대해 평가한 정보가 충분하지 않기 때문에 사용자의 성향을 파악하기 어렵고, 이로 인해 사용자가 아직 평가하지 않은 아이템에 대해서 선호도를 추측하기 어려운 것을 말한다. 이 희박성 문제가 포함된 경우 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자들에게 제공되는 아이템 추천의 질이 떨어지게 된다. 콜드 스타트 문제는 시스템 내에 새로 들어온 사용자 또는 아이템으로 지금까지 한 번도 평가를 하지 않은 경우에 발생한다. 즉, 사용자가 평가한 아이템에 대한 정보가 전혀 포함되어 있지 않거나 매우 적기 때문에 이러한 경우 또한 적합한 이웃 사용자 집단을 형성하는데 어려움을 겪게 되고 사용자가 평가하지 않은 아이템에 대한 선호도 예측의 정확성이 감소되게 된다. 본 논문에서는 영화 추천 시스템에서 발생될 수 있는 초기 사용자 문제를 해결하기 위하여 사용자가 평가한 영화와 소셜 네트워크 서비스로부터 추출된 사용자 선호 장르를 활용하여 사용자 군집을 형성하고 이를 활용하는 방법을 제안한다. 소셜 네트워크 서비스로부터 사용자가 선호하는 영화 장르를 추출하기 위해 페이스북 페이지의 '좋아요' 옵션을 이용하며, 이 '좋아요' 정보를 분석하여 사용자의 영화 장르 관심사를 추출한다. 페이스북의 영화 페이지는 각 영화를 위한 페이스북 페이지로 구성되고 있으며, 사용자는 자신의 선호도에 따라서 "좋아요" 옵션을 선택할 수 있다. 사용자의 페이스북 정보는 페이스북 그래프 API를 활용하여 추출되고 이로부터 사용자 선호 영화를 알 수 있게 된다. 시스템에서 활용되는 영화 정보는 인터넷 영화 데이터베이스인 IMDb로부터 획득한다. IMDb는 수많은 영화와 TV 프로그램을 보유하고 있으며, 각 영화에 관련된 배우 정보, 장르 및 부가 정보들을 포함한다. 논문에서는 사용자가 "좋아요" 표시를 한 영화 페이지를 이용하여 IMDb로부터 영화 장르 정보를 가져온다. 그리고 추출된 영화 장르 선호도와 본 시스템에서 제안하는 영화 평가 항목을 이용하여 유사한 이웃 사용자 집단을 구성한 후, 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고, 높은 예측 값을 갖는 아이템을 사용자에게 추천한다. 본 논문에서 제안한 사용자의 선호 장르 기반의 사용자 군집 기법을 이용한 시스템을 평가하기 위해서 IMDb 데이터 집합을 이용하여 사용자 영화 평가 시스템을 구축하였고 참가자들의 영화 평가 정보를 획득하였다. 페이스북 영화 페이지 정보는 참가자들의 페이스북 계정과 페이스북 그래프 API를 통해 획득하였다. 사용자 영화 평가 시스템을 통해 획득된 사용자 데이터를 제안하는 방법에 적용하였고 추천 성능, 품질 및 초기 사용자 문제를 벤치마크 알고리즘과 비교하여 평가하였다. 실험 평가의 결과 제안하는 방법을 적용한 추천 시스템을 통해 추천의 품질을 10% 향상시킬 수 있었고, 초기 사용자 문제에 대해서 15% 완화시킬 수 있음을 볼 수 있었다.