• 제목/요약/키워드: Web System

검색결과 7,797건 처리시간 0.046초

자살과 식단의 연관성 (Association Between Suicide and Diet)

  • 임은지;김봉조;이철순;차보석;이소진;최재원;이영지;강누리;이동윤
    • 정신신체의학
    • /
    • 제30권2호
    • /
    • pp.73-79
    • /
    • 2022
  • 연구목적 자살은 전세계적인 사회적 문제로 자살로 인한 사회적 부담은 점차 증가하고 있다. 자살의 예방을 위해 다양한 시도들이 진행되고 있다. 자살의 위험성이 생활 습관, 그 중 식단의 변화에 의해 증가할 수 있다. 그래서 본 연구는 자살에 대한 보조적 치료로써 식단에 대해 고찰하였다. 방법 본 종설에서는 학술 검색을 통하여 자살의 생화학적 메커니즘을 확인하고 자살에 대한 위험요인으로서 식단, 보호요인으로서 식단에 대해 정리해 보았다. 결과 본 연구에서는 자살의 생화학적 기전을 확인하고, 자살에 대한 위험요인 식단, 보호요인 식단에 대해 조사하였다 신경계통에서 산화스트레스 반응, 염증반응과 같은 신경독성효과가 자살의 위험을 높일 수 있음을 확인하였다. 이들 이전 연구 결과를 바탕으로, 자살과 식단 사이의 이전 연구들을 고찰 해본 결과, 자살에 대한 위험 요인으로 술, 담배, 커피, 탄산음료, 패스트 푸드 등의 과도한 사용 및 섭취가 있었다. 자살에 대한 보호요인으로 비타민 C, 카로틴 등의 항산화 물질 그리고 해산물이 다량 포함하고 있는 오메가 3 지방산 같은 항염증 제재등이 있었다. 결론 자살의 유일한 치료법은 그 예방이다. 그러한 맥락에서 자살의 예방적 치료들의 적용에 있어 효과, 접근성, 안전이 중요할 수 있다. 이런 관점에서 비교적 안전하고, 대중들이 쉽게 섭취할 수 있는 항산화물질 및 항염증 제재들은 자살의 위험을 낮출 수 있는 효과적 보조적 치료가 될 수 있을 것이다. 뿐만 아니라, 자살의 위험을 높일 수 있는 식단을 줄이기 위한 대중들에 대한 교육이 필요할 수 있다

미국 프로농구(NBA)의 플레이오프 진출에 영향을 미치는 주요 변수 예측: 3점과 턴오버 속성을 중심으로 (Prediction of Key Variables Affecting NBA Playoffs Advancement: Focusing on 3 Points and Turnover Features)

  • 안세환;김영민
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.263-286
    • /
    • 2022
  • 본 연구는 웹 크롤링을 이용하여 1990년부터 2022년까지 총 32개년에 해당하는 NBA 통계 정보를 획득하고, 탐색적 데이터 분석을 통해 관심 변수를 관찰하고 관련된 파생변수를 생성한다. 입력 데이터에 대한 정제 과정을 거쳐 무의미한 변수들을 제거하고, 남은 변수에 대한 상관관계 분석, t 검정 및 분산분석을 수행하였다. 관심 변수에 대해 플레이오프 진출/미진출 그룹 간 평균의 차이를 검정하였고, 이를 보완하기 위해 순위를 기준으로 하는 3개 집단(상위/중위/하위) 간 평균 차이를 재확인하였다. 입력 데이터 중 올해 시즌 데이터만을 테스트 세트로 활용하였고, 모델 훈련을 위해서는 훈련 세트와 검증 세트를 분할하여 5-fold 교차검증을 수행하였다. 교차검증 결과와 시험 세트를 이용한 최종 분석 결과를 비교하여 성능 지표에서 차이가 없음을 확인함으로써 과적합 문제를 해결하였다. 원시 데이터의 품질 수준이 높고, 통계적 가정을 만족하기 때문에 적은 수준의 데이터 세트임에도 불구하고 대부분 모델에서 좋은 결과를 나타냈다. 본 연구는 단순히 머신러닝을 이용하여 NBA의 경기 결과를 예측하거나 플레이오프 진출 여부만을 분류하는 것에서 그치지 않고, 입력 특성의 중요도를 파악하여 높은 중요도를 갖는 주요 변수에 본 연구의 관심 대상 변수가 포함되는지를 확인하였다. Shap value의 시각화를 통해 특성 중요도의 결과만으로 해석할 수 없었던 한계를 극복하고, 변수의 진입/제거 과정에서 중요도 산출에 일관성이 부족하다는 점을 보완할 수 있었다. 본 연구에서 관심 대상으로 분류했던 3점 및 실책과 관련된 다수의 변수가 미국 프로농구에서의 플레이오프 진출에 영향을 미치는 주요 변수에 포함되는 것으로 나타났다. 본 연구는 기존의 스포츠 데이터 분석 분야에서 다루었던 경기 결과, 플레이오프 및 우승 예측 등의 주제를 포함하고 분석을 위해 여러 머신러닝 모델을 비교 분석했다는 점에서 유사성이 있지만, 사전에 관심 속성을 설정하고, 이를 통계적으로 검증함으로써 머신러닝 분석 결과와 비교하였다는 측면에서 차이가 있다. 또한 XAI 모델 중 하나인 SHAP를 이용하여 설명 가능한 시각화 결과를 제시함으로써 기존 연구와 차별화하였다.

가정용수의 용도별 사용 원단위 분석 (End-use Analysis of Household Water by Metering)

  • 김화수;이두진;김주환;정관수
    • 대한토목학회논문집
    • /
    • 제28권5B호
    • /
    • pp.595-601
    • /
    • 2008
  • 본 연구에서는 전국 140여개 가구를 대상으로 실측 조사한 자료를 바탕으로 가정용수의 용도별 사용량을 도출함으로써 상 하수도시설설계에 활용할 수 있는 원단위를 제시하고, 용도별 사용특성분석, 영향인자 평가 등을 통하여 가정용수의 변동특성을 이해하고 향후 사용경향을 예측할 수 있는 정보를 제공하고자 하였다. 전국 140가구를 대상으로 약 3여년간 실측한 결과, 가정용수의 총사용량은 165.8 lpcd였으며, 각 용도별 사용량은 세면용수 15.4 lpcd(10%), 욕조용수 24.7 lpcd(16%), 싱크대용수 29.7 lpcd(19%), 세탁기용수 30.8 lpcd(20%), 변기용수 38.5 lpcd(25%), 기타용수 13.5 lpcd(9%)순으로 나타났다. 가정용수 중에서 변기용수의 사용량이 가장 많은 것으로 나타났으며, 베란다, 정원용수 등이 포함된 기타용수의 경우 사용빈도가 일정하지 않고 사용량의 편차도 심하여 변동계수와 표준편차가 가장 크게 나타났다. 가정용수의 용도별 사용량을 미국, 영국 가정과 비교한 결과, 기타용수와 실외용수를 제외하고는 미국의 실내용수 사용량과 비율이 우리나라와 매우 유사한 특성을 보였다. 가정에서 물사용에 기초한 생활양식이 미국과 유사하게 변화되고 있음을 간접적으로 보여준 결과이다. 또한 1985년에 서울에서 조사된 용도별 사용량과 금번결과를 비교한 결과, 목욕, 변기, 세탁, 취사용수의 총량은 23 l가 증가하였으며, 특히 세면과 욕조용수를 합산한 목욕용수가 27 l에서 40 l로 크게 늘어났고, 세탁용수도 17 l나 늘어났다. 생활양식이 서구화되면서 가정에서의 목욕, 사워문화가 점차 확산되고 대용량 세탁기의 보급이 늘어난 것 등이 영향을 미쳤을 것으로 추측되었다.

T맵 검색지와 썸트랜드 데이터를 이용한 관광인기도분석: 강원도 춘천을 중심으로 (Analysis of Tourism Popularity Using T-map Search andSome Trend Data: Focusing on Chuncheon-city, Gangwon-province)

  • 김태우;조재희
    • 서비스연구
    • /
    • 제12권1호
    • /
    • pp.25-35
    • /
    • 2022
  • 2020년 1월 국내 최초 환자가 발생한 코로나19(COVID 19)는 다양한 분야에 영향을 끼쳤다. 그중에서도 가장 타격을 받은 곳은 관광 분야라 하겠다. 특히 강원도 지역은 관광 기반의 산업 구조가 지역의 근간을 이루고 있고 관광산업이 소상공인 및 소기업의 주요 소득원이므로 그 피해가 크다. 이와 같은 피해 상황 및 정도를 확인하고자 강원권 지역 중에서 대중적 접근성이 가장 편리하며 서울 및 수도권 등에서 대중교통을 이용하여 당일 관광이 가능하고, 일반적인 이미지가 적은 비용을 사용한 관광이 가능하다고 인식되고 있는 춘천 지역을 대상으로 데이터 분석을 통하여 실증분석을 하였다. 이를 위하여 관광지식정보시스템에서 제공하는 춘천의 방문객 데이터를 기준으로 일반적인 지역 현황을 확인하였고 코로나 이전인 2019년도와 이후인 2020년도의 관심도 확인을 위하여 키워드 수집 전문 기업인 (주)바이브컴퍼니의 웹서비스 썸트랜드에서 수집한 키워드와 차량용 내비게이션 서비스와 통신 서비스 제공을 병행하는 SK텔레콤의 T맵 검색지 데이터를 함께 비교해 봄으로써 춘천에 대한 일반적인 지역 이미지를 분석하였다. 또한 키워드와 T맵 검색지 데이터를 적용한 관광 인기도 지수를 개발하여 2개 연도의 데이터를 비교해 봄으로써 코로나 상황이 춘천 지역 방문객들의 관심도가 실제 방문으로 이어지는 것에 얼마나 영향을 미쳤는지를 데이터 분석적인 접근 방법으로 고찰하였다. 데이터 마트 설계를 거친 후 관광인기도 지수를 적용한 빅데이터 분석 결과를 확인한 바에 의하면, 코로나19 상황은 강원도 춘천 지역 관광 인기도에 미치는 영향이 크지 않다는 것을 확인하였고, 해당 지역이 가지고 있는 지역별 특수성에 기반한 관광지 이미지 등을 확인하였다. 이와 같은 연구 분석 결과가 관광경제정책 입안에 유용한 참고 자료로 활용될 수 있을 것이다.

1998, 1999년도 우리나라에서 시행된 유방보존수술 후 방사선치료 현황 조사 (The 1998, 1999 Patterns of Care Study for Breast Irradiation After Breast-Conserving Surgery in Korea)

  • 서창옥;신현수;조재호;박 원;안승도;신경환;정은지;금기창;하성환;안성자;김우철;이명자;안기정
    • Radiation Oncology Journal
    • /
    • 제22권3호
    • /
    • pp.192-199
    • /
    • 2004
  • 목적: 유방암에 대한 방사선치료의 적정성과 안전성을 보장하고 궁극적으로 치료 효과를 향상시키기 위한 방사선치료 기술 표준화를 위하여 우리나라 전국의 병원을 대상으로 하는 치료 형태 조사연구(Patterns of Care Study)를 계획하였다. 그 첫 단계로 유방보존적 수술 후 시행한 방사선치료 방법에 대하여 조사하고 분석 하였다. 대상 및 방법: 조사하고자 하는 입력 문항을 개발하였고 동시에 인터넷을 통하여 조사자가 직접 입력할 수 있도록 Web 기반 입력 프로그램(www.pcs.re.kr)을 개발하였다. 대상 환자들은 1998년도와 1999년도에 유방보 존술 후 방사선치료를 받은 환자로 전수 조사를 하지 않고 표본 추출하여 조사하였다. 입력 문항은 127개로 병력과 이학적 소견, 수술 소견과 병리 소견, 항암화학요법, 호르몬요법, 방사선치료계획, 방사선치료, 치료 중 부작용, 치료 효과, 합병증, 미용 효과 등 10군으로 나누어져 있다. 15개 병원에서 입력된 261명의 데이터를 분석 하였다. 결과: 연령은 24$\~$85세(중앙값 45세)였다. 병리학적 유형은 관상피암종이 88.9$\%$로 대부분을 차지하였으며 수질성암종이 4.2$\%$, 소엽상피암종이 1.5$\%$였다. 병기는 AJCC (American Joint Committee on Cancer) 5판에 따라 분류하였으며 T1이 59.7$\%$,T2가 29.5$\%$,Tis가 8.8$\%$였으며 전체의 42.5$\%$가 Tlc에 해당하였다. 전체 환자의 91.2$\%$에서 액와림프절 곽청술이 시행되었고 69.7$\%$의 환자들에서는 액와림프절 전이가 없었으며 림프절 전이가 3개 이하인 경우가 15.3$\%$, 4$\~$9개가 4.2$\%$, 10개 이상 전이된 경우가 1.9$\%$였다. 따라서 병기 0기가 8.4$\%$, I기, 44.9$\%$, IIA기, 33.3$\%$, IIB기 8.4$\%$였다. 에스트로겐수용체와 프로게스테론수용체 검사는 각각71.6, 70.9 $\%$에서 이루어졌다. 유방보존적 수술 방법은 단순절제술(excision/lumpectomy)이 37.2$\%$, 광범위절제술이 11.5$\%$ 사분원절제술(quadrantectomy)이 23$\%$, 부분절제술(partial mastectomy)이 27.5$\%$에서 시행되었다. 수술 후 10예 (3.8$\%$)에서 절제연이 양성이었고 10예는 절제연이 종양에서 2 mm 이내였다. 항암화학요법은 I기에서 54.7$\%$, IIA기에서 83.9$\%$, IIB에서 100$\%$ 시행되었다. 방사선치료는 1예를 제외한 모든 환자들이 계획된 방사선량의 90$\%$ 이상을 조사 받음으로써 순응도가 매우 높은 치료임을 알 수 있었다. 방사선치료의 범위는 전체의 88$\%$가 유방만 치료받았고 5$\%$는 유방과 쇄골상부림프절을, 4.2$\%$는 유방, 쇄골상부림프절에 액와림프절후방추가 조사를 하였으며, 유방, 쇄골상부림프절과 함께 내유방림프절을 치료하였던 예는 1예(0.4$\%$) 뿐이었다. 유방 치료에 사용된 방사선의 종류는 Co-60가 8명(3.1$\%$), 4 MV X-ray가 115명(44.1$\%$), 6 MV X-ray가 125명(47.8$\%$)이었으며 11명(4.2$\%$)은 10 MV X-ray를 사용하였다. 조사된 방사선량은 유방 전체에 45$\~$59.4 Gy (중앙값 50.4), 원발 병소에 대한 추가 조사가 8$\~$20 Gy (중앙값 10 Gy)로 총 방사선 조사선량은 50.4$\~$70.4 Gy (중앙값 60.4 Gy)였다. 결론: 조기 유방암에 대한 진단과 병기 결정 과정, 유방보존적 수술 후 시행되는 방사선치료는 큰 편향이 없이 권고안대로 잘 시행되고 있었다. 다만 원발 병소에 대한 추가 치료는 비교적 다양하게 적용되고 있는데 이것이 치료 결과에 어떤 영향을 미치는지 추적조사연구가 필요하며 방사선치료 계획상의 세부 사항에 대한 분석과 평가가 향후 이루어져야 할 것이다.

Smart Store in Smart City: 소비자 감성기반 상권분석 시스템 개발 (Smart Store in Smart City: The Development of Smart Trade Area Analysis System Based on Consumer Sentiments)

  • 유인진;서봉군;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.25-52
    • /
    • 2018
  • 본 연구는 소비자들이 상권에 대하여 수행하는 웹 탐색 활동과 감성평가를 반영하는 데이터인 지역구 연관감성어휘를 기반으로 서울시 내 대형 상업 공간으로 정의할 수 있는 각 지역구 간의 연관 감성 네트워크에 대하여 소셜 네트워크 분석을 수행하였다. 나아가 도출한 소셜 네트워크 지표를 지역구 공공 데이터와 결합하여 보다 다각적 측면을 고려한 지역구 상권의 매출액에 영향을 미치는 요인들을 검증하였고 그 영향력의 변화 또한 확인해 보았다. 정적 데이터로 표현되는 공공 데이터만을 통해 구성된 모형으로도 높은 설명력을 가지는 것을 확인할 수 있었으나, 소셜 네트워크 분석 결과로 도출된 네트워크 지표와 결합된 모형에서는 그 설명력이 더욱 향상된 것이 확인되었다. 공공 데이터에 대한 회귀 분석 결과, 투입된 22개의 요인들 중 '골목 상권 수,' '1인당 거주면적,' '주거환경만족도,' '거래증감률,' '3년 이상 생존율'의 5개의 요인이 지역구 상권 매출액에 유의한 영향을 미치는 것이 확인되었다. 이후 공공 데이터와 네트워크 지표 결합 모형에서 투입된 지표들은 '에고 네트워크의 밀도,' '연결 중심성,' '근접 중심성,' '매개 중심성,' '아이겐벡터 중심성'이며, 이 중 '연결 중심성'과 '아이겐벡터 중심성'이 매출액에 유의한 영향을 미치며 모형 내에서 가장 높은 영향력을 보유한 것이 확인되었다. 본 연구는 각 상권이 소비자가 원하는 감성을 고려한 도시 전략 계획 수립과 이행의 실증적 근거로 활용될 수 있을 것이며, 상권에 진입하거나 재창업하는 자영업자나 잠재 창업자를 바탕으로 지역구 상권이 보유한 감성과 그 관계 구조를 고려한 상권 진입 방향성을 제공할 수 있을 것이다.

비트코인 가격 변화에 관한 실증분석: 소비자, 산업, 그리고 거시변수를 중심으로 (Empirical Analysis on Bitcoin Price Change by Consumer, Industry and Macro-Economy Variables)

  • 이준식;김건우;박도형
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.195-220
    • /
    • 2018
  • 본 연구는 비트코인 가격 변화량에 영향을 미치는 요인에 대한 실증 분석을 수행하였다. 기존 연구들은 암호화폐와 관련해 블록체인 시스템의 보안성, 암호화폐가 불러일으키는 경제적 파급효과 및 법적 시사점, 소비자 수용 및 사용 의도와 사회현상을 중심으로 이루어졌다. 그러나 암호화폐 가격 변화가 급등과 급락을 반복하면서 많은 사회적 문제를 야기했음에도 불구하고 암호화폐의 가격 변화에 영향을 미치는 요인에 대한 실증적 연구는 부족하다. 때문에 본 연구에서 암호화폐 가격 변화에 미치는 영향 요인을 도출하기 위해 암호화폐 중 가장 대표적인 비트코인을 중심으로 분석을 진행하였다. 분석을 위해 소비자, 산업, 거시경제 세 가지 차원에서 가설을 수립, 각 차원의 변수에 대한 시계열 데이터를 수집하였다. 단위근 검정을 통해 시계열 데이터에 대한 가성 회귀를 제거하고 안정성을 검증한 후, 비트코인 가격 변화량에 영향을 미칠 수 있는 요인들에 대한 회귀 분석을 실시하였다. 분석 결과 비트코인 가격 변화량은 비트코인 거래 금지에 대한 검색 트래픽, 미국 달러지수 변화량과는 음의 상관관계를, GPU 벤더의 주가 변화량, 원유 가격 변화량과는 양의 상관관계를 갖는 것을 확인했다. 그 이유로는 비트코인 거래 금지는 비트코인 존폐와 관련해 투자심리에 부정적 영향을 미친 것으로 판단되며, GPU 벤더 주가는 비트코인 생산 단가 증가와 관련해 비트코인 가격에 영향을 미친 것으로 해석된다. 미국 달러지수와는 반대로 움직임으로서 비트코인이 금의 성격을 갖고 있음을 확인하였으며, 원유 가격과의 관계를 통해 원자재와 같은 투자 자산의 역할도 갖고 있음을 확인하였다. 본 연구의 결과를 통해 비트코인이 가진 성격을 규명하였으며, 비트코인 가격 변화 요인에 대한 실증 검증을 통해, 그 동안 부족했던 비트코인 가격 변화 요인을 규명하였고, 해당 요인들을 통해 실무적으로 소비자나 금융기관, 정부 기관에 대해 비트코인에 대한 전략적인 접근방법에 대한 가이드를 제공할 수 있다는 점에서 의의가 있다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

유통과학연구의 연구 동향 분석 : 창간호부터 제8권 제3호까지를 중심으로 (Analysis of Research Trends in Journal of Distribution Science)

  • 김영민;김영이;윤명길
    • 유통과학연구
    • /
    • 제8권4호
    • /
    • pp.5-15
    • /
    • 2010
  • 본 연구에서는 한국유통과학회가 발행하고 있는 유통과학연구에 게재된 논문의 연구 동향을 분석하고 학회지의 질적 향상을 위한 시사점을 제시하고자 하였다. 즉, 유통분야의 학문체계를 분류하여 연구동향을 분석하고, 유통 관련 다른 학회지와 비교한 후 유통과학연구의 질적 향상을 위한 시사점을 도출하고자 하였다. 특히, 한국유통과학회는 1999년 「유통과학연구」 제1권 제1호 창간을 시작으로 2010년 9월 제8권 제3호까지 총 109편의 논문을 게재하였다. 109편의 논문을 대상으로 연구주제, 연구 주체, 연구 참여자의 수, 연구방법론, 국문 및 영문논문 빈도, 내국인 및 외국인 참여빈도, 참고문헌 활용 등에 대하여 분석하였다. 추가적으로 유통을 연구대상으로 하는 한국유통학회의 유통연구 및 한국유통경영학회의 유통경영학회지와 유통과학연구를 비교 분석하여 발전방안을 모색하고자 한다. 결론적으로 유통과학연구의 연구동향 및 유사 학회지의 비교 분석을 바탕으로 다음과 같은 시사점을 제시하고자 한다. 먼저, 유통과학연구가 SSCI를 준비하기 위해서는 해외 투고자를 적극 유치해야한다. 또한, 영문논문의 비중을 대폭 늘려야 할 것이다. 셋째, 학술지의 질 향상을 위한 다양한 연구방법론 수용을 해야할 것이다. 넷째, 유통과학연구의 피인용율울 확대하기 위하여 학술지의 해외 공급을 원활하게 할 수 있도록 구글 등 웹검색 기능을 보강해야 할 것이다. 이상의 시사점을 통한 개선을 한다면 국내 뿐 아니라 해외에서도 인정받는 세계적인 학술지 반열에 올라설 수 있을 것이다.

  • PDF

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.