• 제목/요약/키워드: 빅 데이터 패턴 분석

Search Result 195, Processing Time 0.024 seconds

팬데믹 전후 공공자전거의 마이크로 모빌리티 패턴 비교: 서울시 사례 연구 (Comparison of Micro Mobility Patterns of Public Bicycles Before and After the Pandemic: A Case Study in Seoul)

  • 조재희;백가은;서일정
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.235-244
    • /
    • 2022
  • 코로나19와 같은 팬데믹 현상이 사람들의 이동성에 어떤 변화를 일으켰는지 살펴보기 위해 서울시 공공자전거 대여이력 데이터를 분석하였다. 2019년과 2021년 데이터를 코로나 이전과 이후로 구분해 비교·분석하였다. 공공데이터 포털사이트에서 데이터를 수집하였고, 심층적인 분석을 위해 데이터마트를 만들었다. 주행방향유형 차원과 대여소유형 차원을 추가하였고, 파생변수(대당 회전율과 이용속도)를 생성하여 두 기간의 변화를 비교하였다. 코로나 이전과 이후 평균 이용시간에는 큰 차이가 없지만, 평균 이용거리와 평균 이용속도는 감소하였다. 생활 리듬이 다소 느려진 현상이 따릉이 이동성에서도 나타나고 있다. 평일의 경우 코로나 이전에도 출·퇴근 시간대에 가장 많은 임대가 일어났으나, 코로나 이후에 급증하였다. 감염을 염려하기 시작한 사람들이 마이크로 모빌리티 수단으로 마을버스보다 따릉이를 선호한다고 해석할 수 있다. 본 연구에 제안된 데이터마트 기반 시각화 및 분석 결과는 공공자전거 운영과 정책 개발에 인사이트를 제공할 수 있을 것이다. 향후 연구에서는 트위터, 인스타그램과 같은 SNS 데이터와 공공자전거 데이터를 병합하여 살펴볼 필요가 있다. 자전거를 이용한 사람이 여러 장소에서 보인 행동 패턴 등을 다양하게 살펴본다면, 관련 연구의 가치가 향상될 수 있을 것으로 기대한다.

도시 지역 트윗 데이터의 시간대별 공간분포 특성 - 부산광역시를 사례로 - (A Study on the Spatial Patterns of Tweet Data for Urban Areas by Time - A Case of Busan City -)

  • 구자용
    • 지적과 국토정보
    • /
    • 제46권2호
    • /
    • pp.269-281
    • /
    • 2016
  • 최근 공간 정보 분야에서 소셜 미디어와 같은 공간 빅 데이터의 분석과 처리에 많은 관심이 집중되고 있다. 본 연구에서는 공간 빅 데이터 분석의 한 사례로서 트윗 데이터가 가지고 있는 위치 정보와 시간 정보를 바탕으로 시간대별로 공간분포를 분석하고 그 특성을 파악하였다. 부산시 지역의 트윗 데이터를 수집하고, 시간대별 공간분석을 통하여 그 특성을 파악하여, 그 지역의 토지이용 특성과 비교하였다. 부산시 지역의 트윗 데이터를 시간대에 따라 평일 주간, 평일 야간, 휴일 주간, 휴일 야간으로 구분하고, 각 시간대별로 공간적 분포 특성을 파악하여, 공간적으로 집중된 지역의 토지이용 특성과 비교하였다. 본 연구의 결과 트윗 데이터는 시간대에 따라 공간분포가 다르게 나타나고 있으며, 이는 그 지역의 일상생활 패턴과 토지이용 특성을 어느 정도 반영하고 있었다. 본 연구에서는 공간정보 분야에서 트윗 데이터와 같은 소셜 미디어 자료의 분석을 통한 활용 가능성을 제시하였다. 향후 토지 계획이나 도시 계획 등의 분야에서 다양한 소셜 미디어 자료를 활용할 수 있을 것으로 전망된다.

스마트폰 보행이동 데이터를 활용한 노인의 역세권 이용실태 분석 - "WalkOn" APP의 서울시 빅데이터를 기반으로 - (Analysis of Elderly's Walking Patterns near Metro-stations in Seoul by Using Smartphone Pedestrian Movement Data - An Empirical Study Based on "WalkOn" App Big Data -)

  • 이선재;박소현
    • 대한건축학회논문집:계획계
    • /
    • 제34권3호
    • /
    • pp.129-138
    • /
    • 2018
  • The purpose of this study is to analyze the daily living area of the elderly using the vast amount of travel route data collected through smart phones. In order to analyze the utilization status of the elderly into the visiting area and the living area, the subway station influence area was typed based on the number and ratio of the elderly visiting and the elderly living there. The characteristics of the elderly visiting area and the living area of the subway station area were derived by analyzing the walking route data for the three types of subway station influence areas where the elderly visit and live. First, we derive the range of visiting area and living area of the elderly near the subway station. Second, we derive the characteristic of moving distance which causes the linked walking of the elderly. Third, destination distribution and facility utilization are influenced by the subject of use, movement pattern, and facility awareness.

전자상거래 이용시 연관성 분석을 통한 맞춤형 상품추천 모델 설계 (Design of customized product recommendation model on correlation analysis when using electronic commerce)

  • ;박기용;최상현
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.203-216
    • /
    • 2022
  • 본 연구에서는 COVID-19의 영향과 온라인 시장을 중심으로 구매패턴이 변화하는 현 경영환경의 시대에서 온라인 배송업체의 구매정보와 상품정보를 기반으로 군집분석과 연관성 분석을 실시하였다. 고객군집, 상품군집, 그리고 교차결합을 통해 데이터를 세분화시켜 결합군집을 생성하여 학문적으로 새로운 방안의 군집분석을 시도하였으며, 각각의 군집분석 결과를 토대로 연관성 분석을 하였다. 연관성 분석 결과, 상대적으로 결합군집에서 더 많은 연관 규칙이 도출 되었으며, 중복률은 더 적은 것으로 분석되어 효율성이 매우 높은 것으로 나타났다. 이는 고객의 니즈에 맞게 상품을 추천하기 위해서는 결합군집이 가장 적합한 모델이라고 판단된다. 결합군집 모델은 소비자에겐 시간 절약과 유용한 정보를 제공하면서, 해당 업체에는 판매량을 증가시키는 등의 긍정적인 효과를 가져올 것으로 사료된다. 향후 연구과제로써, 다양한 특성을 갖고 있는 다수의 온라인 배송업체들을 대상으로 비교·분석한다면 좀 더 명확하고 유의미한 연구결과를 도출할 수 있을것으로 기대된다.

교통카드데이터를 활용한 교통약자 대중교통 환승통행패턴 분석: 버스 지하철 간 환승을 중심으로 (Evaluation of Transit Transfer Pattern for the Mobility Handicapped Using Traffic Card Big Data: Focus on Transfer between Bus and Metro)

  • 권민영;김영찬;구지선
    • 한국ITS학회 논문지
    • /
    • 제20권2호
    • /
    • pp.58-71
    • /
    • 2021
  • 전 세계적으로 고령인구가 급증하고 이에 따라 이동에 불편을 겪는 교통약자의 수도 증가하고 있다. 이러한 추세에 따라 국내에서는 이동편의시설 설치 확대 등 교통약자에 대한 양질의 대중교통 서비스 제공을 위해 다양한 정책을 시행 중이다. 기존 대중교통 이동편의시설 설치는 역사의 면적, 층수, 시설 미확보역 등의 양적인 측면을 기준으로 우선적 확대·설치되고 있다. 하지만 양적 기준 보다는 실제 이용자 기준의 설치 필요 지역에 이동편의시설을 확보하는 것이 교통약자의 이동편의 증진에 더 효과적일 것으로 사료된다. 본 연구에서는 이용자 기반의 교통카드 빅데이터 분석을 통해 교통약자의 환승취약지점을 도출하고자 했다. 스마트카드 거래내역 데이터를 가공하여 환승통행데이터를 구축하고 이용자별 환승통행패턴 분석 및 환승통행시간 차이가 큰 경로를 기준으로 환승취약지점을 도출했다. 분석 결과 일반 이용자보다 교통약자의 환승시간이 오래 걸리는 것으로 나타났다. 일반과 교통약자의 환승통행시간 차이와 시설물 개수와의 상관관계는 미약한 것으로 나타났는데 현장 조사 결과 환승통행시간 차이는 시설물의 단순 개수보다는 해당 환승최단경로 내 이동편의시설의 부재로 인해 발생하는 것으로 나타났다. 향후 교통약자를 위한 이동편의시설 확대 시 실질적 이용자 기반 데이터 분석을 통한 환승취약지점을 기준으로 우선적 시설 확보 시 교통약자의 이동편의가 보다 더 향상될 것으로 사료된다.

타임라인데이터를 이용한 트위터 사용자의 거주 지역 유추방법 (Location Inference of Twitter Users using Timeline Data)

  • 강애띠;강영옥
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.69-81
    • /
    • 2015
  • SNS사용자의 거주 지역을 유추하여 그들이 생성한 데이터에 거주위치를 부여하는 것은 위치희박(location sparsity)과 생태학적 오류문제로 인해 연구결과의 신뢰성이 떨어진다는 평가를 받아온 공간빅데이터 연구에 대안이 될 수 있다. 본 연구에서는 Tweet 사용자의 거주 지역을 유추하는 방법으로 사용자 타임라인데이터 속에서 찾아낸 일상생활활동패턴을 이용하는 방법을 고안하였다. 트윗 사용자의 일상생활활동패턴은 이동궤적과 사용자의 언어(text)에서 확인할 수 있었으며 전자를 활용한 모델을 일상이동패턴모델, 후자를 활용한 모델을 일상 활동장 모델이라 명명하고 각각 모델에 입력될 변수를 선정하였다. 자신의 거주 지역에서 가장 높은 빈도의 트윗 발생 여부와 가장 높은 빈도의 거주행정구역 표현 단어를 사용하는지 아닌지를 종속변수로 한 판별분석을 실시하여 모델을 작성하였으며 설명력은 일상 이동패턴모델, 일상 활동장 모델 각각 67.5%, 57.5%였다. 이 모델을 스트레스 관련 트윗을 작성한 사용자의 타임라인데이터로 구성된 테스트데이터에 입력해본 결과 전체 사용자 48,235명 중 5,301명의 거주 지역을 유추하였고 이를 활용하여 위치 부여된 스트레스 관련 트윗 9,606개를 확보하였다. 본 연구의 유추기법을 통해 기존 SNS데이터 분석연구에서 사용하는 데이터 수집 방법보다 44배 많은 위치 부여 트윗을 확보할 수 있었다. 본 연구방법론은 SNS데이터를 이용한 연구에서 위치 부여된 데이터를 확보하는데 활용 가능할 것으로 판단되며, 각종 지역통계와 상관관계파악을 통해 지역적 현상 분석에도 SNS데이터를 이용할 수 있는 가능성을 높일 것으로 판단된다.

소셜 미디어 상 고객피드백을 위한 감성분석 (The Sensitivity Analysis for Customer Feedback on Social Media)

  • 송은지
    • 한국정보통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.780-786
    • /
    • 2015
  • SNS 등과 같은 소셜 미디어는 실시간으로 자발적인 고객의 의견들을 대거 포함하고 있어 최근 기업들은 효율적인 경영을 위해 소셜 미디어상의 빅 데이터를 분석하는 시스템을 이용하여 고객피드백에 관한 정보를 수집하고 분석하고 있다. 그러나 온라인 사이트에서 수집한 데이터는 띄어쓰기와 철자 오류가 많아 기존의 형태소 분석기로는 정확한 분석을 할 수 없다. 또한 온라인 상의 문장은 짧다는 특징이 있어 상호 정보량, 카이제곱 통계량 등과 같은 기존의 의미 선택 방법을 이용하게 되면 문장 내 선택 할 수 있는 의미의 부재로 인해 정확한 감성 분류를 할 수 없다는 문제점이 있다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 초/중성 및 어절 패턴 사전을 이용해서 보정할 수 있는 모듈과 문장 내 품사의 우선순위를 이용한 의미 선택 방법을 제안한다. 이러한 방법으로 형태소 분석기에서 추출된 품사 정보를 기반으로 용언과 체언을 분리해서 분석 해당 품사에 종속적인 속성 DB 구축 한 후 학습에 의해 누적된 속성 DB를 사용하여 보다 정확한 긍/부정 감성을 추출한다.

Digital Signage service through Customer Behavior pattern analysis

  • Shin, Min-Chan;Park, Jun-Hee;Lee, Ji-Hoon;Moon, Nammee
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권9호
    • /
    • pp.53-62
    • /
    • 2020
  • 최근 연구된 상품 추천 서비스들은 고객들의 구매 이력을 통해서만 추천이 이루어졌다. 본 논문에서는 구매 이력을 통해 추천뿐만 아니라 고객이 상품을 고를 때 취하는 행동 패턴을 분석하여 관심도가 높은 광고를 노출하는 행동 패턴 분석 기반 디지털 사이니지 서비스를 제안한다. 이 서비스는 고객행동 패턴을 분석하여 실질적으로 관심을 가지는 상품에 대해 관심도를 추출한다. 추출된 관심도와 고객들의 구매 이력을 Wide & Deep 모델을 통해 학습하고, 이를 바탕으로 MF(Matrix Factorization) 모델을 통해 다른 상품들의 희소 벡터를 예측한다. 예측된 상품 관심도에 대한 순위를 도출하고, 적합한 광고를 노출하기 위해 고객과 상호 작용할 수 있는 인도어 사이니지를 활용한다. 본 논문의 서비스를 통해 온라인뿐만이 아닌 오프라인 환경에서도 고객의 관심 정보를 파악하고 단순히 무작위로 노출하는 광고가 아닌 고객에게 적합한 광고를 제공하여 만족도 높은 구매 환경이 조성될 것이다.

Integrated Safety System based on IoT

  • Shin, Jin Seob
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권10호
    • /
    • pp.159-165
    • /
    • 2019
  • 현재 화재의 58%정도는 전기에 의한 화재이다. 본 연구에서는 전기에 의한 화재의 요인을 분석하여 미연에 화재를 예방이 가능한 시스템에 대하여 연구하였다. 재난재해를 예방하기 위해서는 기본적으로 화재 징후를 알아내기 위한 다양한 전기에 관한 IoT 센서들이 필요하다. 이러한 센서들은 각각 발생하는 많은 상황정보들을 계속적으로 수신하고 메인시스템으로 전송한다. 이렇게 모아진 빅 데이터들은 패턴분석을 통해 재난이 발생할 수 있는 임계치를 벗어나는지 여부를 계속적으로 체크하며 데이터의 비교를 통하여 어느 부분의 문제가 있는지 여부도 체크할 수 있다. 임계치를 벗어나는 상황에는 경보신호를 알려주고 문제 있는 부분에 대한 정보도 전달한다. 이를 통해 과전류, 누설전류 등과 같은 전기적인 문제를 미연에 방지함으로써 화재를 예방할 수 있는 결과를 보여준다.

S-PARAFAC: 아파치 스파크를 이용한 분산 텐서 분해 (S-PARAFAC: Distributed Tensor Decomposition using Apache Spark)

  • 양혜경;용환승
    • 정보과학회 논문지
    • /
    • 제45권3호
    • /
    • pp.280-287
    • /
    • 2018
  • 최근 추천시스템과 데이터 분석 분야에서 고차원 형태의 텐서를 이용하는 연구가 증가하고 있다. 이는 고차원의 데이터인 텐서 분석을 통해 더 많은 잠재 요소와 잠재 패턴을 추출가능하기 때문이다. 그러나 고차원 형태인 텐서는 크기가 방대하고 계산이 복잡하기 때문에 텐서 분해를 통해 분석해야한다. 기존 텐서 도구들인 rTensor, pyTensor와 MATLAB은 단일 시스템에서 작동하기 때문에 방대한 양의 데이터를 처리하기 어렵다. 하둡을 이용한 텐서 분해 도구들도 있지만 처리 시간이 오래 걸린다. 따라서 본 논문에서는 인 메모리 기반의 빅데이터 시스템인 아파치 스파크를 기반으로 하는 텐서 분해 도구인 S-PARAFAC을 제안한다. S-PARAFAC은 텐서 분해 방법 중 PARAFAC 분해에 초점을 맞춰 아파치 스파크에 적합하게 변형하여 텐서 분해를 빠르게 분산 처리가능 하도록 하였다. 본 논문에서는 하둡을 기반의 텐서 분해 도구와 S-PARAFAC의 성능을 비교하여 약 4~25배 정도의 좋은 성능을 보였다.