• 제목/요약/키워드: 시계열 데이터 분석

검색결과 731건 처리시간 0.041초

빅데이터를 활용한 공원 이용행태의 시계열분석 - 올림픽공원을 대상으로 - (Time Series Analysis of Park Use Behavior Utilizing Big Data - Targeting Olympic Park -)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제46권2호
    • /
    • pp.27-36
    • /
    • 2018
  • 본 연구는 공원 이용자의 욕구를 파악하여 이용자에 적합한 공원 환경으로 변화되어야 할 필요성에 주목하고, 이용자의 욕구를 파악하기 위하여 행태분석의 필요성을 제기하였다. 이에 온라인 데이터(블로그)를 연구의 기초자료로 선정하고, 5년 단위로 구분하여 데이터를 수집한 후 텍스트 마이닝을 활용해 시계열적 행태의 특성을 도출하고, 사회연결망 분석을 통해 온라인 데이터의 유의성을 검증하였다. 텍스트 마이닝 분석 결과, 첫째, '길을 걷다'(산책), '사진을 찍다', '자전거(인라인, 킥보드 등)를 타다', '먹다', '공연을 관람하다'는 올림픽공원에서 행해지는 공통적인 행태로 나타났다. 둘째, 수집된 데이터의 초기에는 운동 등 적극적인 신체활동을 행태가 주를 이루었지만, 최근에는 핸드폰, 게임, 음식을 먹고 커피를 마시는 등의 소극적인 비활동적 행태도 공원에서 나타나는 새로운 행태적 특징으로 나타났다. 셋째, 공원 이용자의 행태에 영향을 미치는 요인은 인터넷 발달, 자신의 개성과 스타일을 표현하는 문화 등 사회의 여러 가지 여건의 변화로 나타났다. 넷째, 올림픽공원에서 나타나는 특별한 행태는 공연 관람 등 문화적인 활동과 역사수업 등 교육적인 활동으로 도출되었다. 결론적으로 공원 계획 설계 시 의도하였던 목적보다는 여러 가지 시대적 변화로 사람들의 라이프 스타일이 변화하고, 공원의 행태에까지 영향을 미치는 것으로 나타났다. 이에 올림픽공원의 주요 행태와 영향을 미치는 요인을 고려하여 이용자에게 적합한 환경으로 변화되어야 할 필요성이 있다. 분석방법으로 활용한 텍스트 마이닝은 과거의 데이터도 수집이 가능하다는 장점이 있어 행태 분석 시 장기적인 관점에서 분석이 가능하고, 도출된 키워드로 새로운 행태 및 가치 측정이 가능하여 이후 행태분석 연구의 영역의 확대가 가능한 것으로 판단된다. 또한, 사회연결망 분석을 통해 온라인 데이터의 타당성을 검증하여 연구결과의 신뢰를 높일 수 있었다. 추후 수집하는 데이터의 종류를 다양하게 하여 더 포괄적인 행태분석에 대한 연구가 수행되어야 하며, 대용량 데이터의 정확성, 신뢰성을 검증할 수 있는 다양한 방법에 대한 연구가 필요할 것이다.

미세먼지 예측 성능 개선을 위한 시공간 트랜스포머 모델의 적용 (Application of spatiotemporal transformer model to improve prediction performance of particulate matter concentration)

  • 김영광;김복주;안성만
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.329-352
    • /
    • 2022
  • 미세먼지는 폐나 혈관에 침투해 각종 심장 질환이나 폐암 등의 호흡기 질환을 일으키는 것으로 보고되고 있다. 지하철은 일 평균 천만 명이 이용하는 교통수단으로, 깨끗하고 쾌적한 환경조성이 중요하나 지하터널을 통과하는 지하철의 운행 특성과 터널에 갇힌 미세먼지가 열차 풍으로 인해 지하역사로 이동하는 등의 문제로 지하역사의 미세먼지 오염도는 높은 것으로 나타나고 있다. 환경부와 서울시는 지하역사 공기질 개선대책을 수립하여 다양한 미세먼지 저감 노력을 기울이고 있다. 스마트 공기질 관리 시스템은 공기질 데이터 수집 및 미세먼지 농도를 예측하여 공기질을 관리하는 시스템으로 미세먼지 농도 예측 모델이 중요한 구성 요소이다. 그동안 시계열 데이터 예측에 관한 다양한 연구가 진행되어왔지만, 지하철 역사의 미세먼지 농도 예측과 관련해서는 통계나 순환신경망 기반의 딥러닝 모델 연구에 국한되어 있다. 이에 본 연구에서는 시공간 트랜스포머를 포함한 4개의 트랜스포머 기반 모델을 제안한다. 서울시 지하철 역사의 대합실을 대상으로 한 시간 후의 미세먼지 농도 예측실험을 수행한 결과, 트랜스포머 기반 모델들의 성능이 기존의 ARIMA, LSTM, Seq2Seq 모델들에 비해 우수한 성능을 나타냄을 확인하였다. 트랜스포머 기반 모델 중에서는 시공간 트랜스포머의 성능이 가장 우수하였다. 데이터 기반의 예측을 통하여 운영되는 스마트 공기질 관리 시스템은 미세먼지 예측의 정확도가 향상될수록 더욱더 효과적이고 에너지 효율적으로 운영될 수 있다. 본 연구 결과는 스마트 공기질 관리 시스템의 효율적 운영에 기여할 수 있을 것으로 기대된다.

케이프선 시장 운임의 결정요인 및 운임예측 모형 분석 (An Analysis on Determinants of the Capesize Freight Rate and Forecasting Models)

  • 임상섭;윤희성
    • 한국항해항만학회지
    • /
    • 제42권6호
    • /
    • pp.539-545
    • /
    • 2018
  • 운임시장의 심한 변동성과 시계열 데이터의 불안정성으로 해운시황 예측에 대한 연구가 큰 성과를 내지 못하고 있지만 최근 대표적인 비선형 모델인 기계학습모델을 적용한 연구들이 활발히 진행되고 있다. 대부분의 기존 연구가 계량모델의 설계단계에서 입력변수에 해당하는 요인들을 기존 문헌연구와 연구자의 직관에 의존하여 선정했기 때문에 요인선정에 대한 체계적인 연구가 필요하다. 본 연구에서는 케이프선 운임을 대상으로 단계적 회귀모형과 랜덤포레스트모델을 이용하여 중요 영향요인을 분석하였다. 해운시장에서 비교적 단순한 수급구조를 가져 요인파악이 용이한 케이프선 운임을 대상으로 하였으며 총 16개의 수급요인들을 사전 추출하였다. 요인간의 상호관련성을 파악하여 단계적 회귀는 8개 요인, 랜덤포레스트는 10개 요인을 분석대상으로 선정하였으며 선정된 변수를 입력변수로 하여 예측한 결과를 비교하였다. 랜덤포레스트의 예측성능이 아주 우수하였는데 수요요인이 주로 선정된 단계적 회귀분석과는 달리 공급요인이 비중 있게 선정되었기 때문인 것으로 판단된다. 본 연구는 운임예측 연구에 있어 운임결정요인에 대한 과학적인 근거를 마련하였으며 이를 위해 기계학습 기반의 모델을 활용하였다는데 연구적 의의가 있다. 또한 시장정보의 분석에 있어 실무자들이 어떤 변수에 중점을 두어야 하는지에 대해 합리적 근거를 제시한 측면에서 해운기업의 의사결정에 실질적 도움이 될 것으로 기대된다.

적응성 있는 단기간 속도 예측모형 개발에 관한 연구 (Adaptive Short-Term Vehicle Speed Prediction Models)

  • 조범철
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 Proceedings 제34회 추계 학술발표회
    • /
    • pp.265-274
    • /
    • 1998
  • 본 논문은 도로를 주행하는 차량의 지점속도에 대하여 단기간(short-term)으로 예측하는 네 가지의 모형들에 대한 개발 및 결과의 비교하고 평가했다. 사용된 기법들로는 다중회귀분석, 시계열분석(ARIMA), 인공 신경망, 칼만필터링 등이며, 모형의 구출을 위하여 다수의 독립변수 및 입력변수가 요구되는 다중회귀분석과 인공 신경망에서는 연속방정식에서 고려되는 변수들간의 단순상관계수 및 편상관계수의 계산을 통해서 입력변수가 설정이 되었으며, 시계열분석(ARIMA)과 칼만필터링 등 단일 입력 변수만을 요하는 모형에서는 바로 전 시간대와 현재시간대의간격동안 속도의 변화량을 입력변수로 설정하였다. 속도를 비롯해서 교통 데이터는 현장자료를 사용하였는데, 이는 서울의 한강 옆에 위치한 올림픽대로 중 한강대로에 위치한 검지기 3개를 통해서 천호동 방면으로 이동하는 교통류에 대해서 17시간 (00시~17시)동안 수집했다. 17시간 수집했는데 그중에 검지된 속도는 14km/h에서 98km/h까지 변하는 등, 수집된 자료에는 다양한 교통상태가 포함되어 있는데 이는 각 모형들의 정확한 예측력과 적응성을 평가하기 위함이었다. 각 모형은 예측하고자 하는 시점으로부터 1, 5, 10, 15분 후의 속도를 예측하는 것으로 총 4가지의 예측시간간격으로 각각 실험되었다. 결과는 전반적으로 신뢰성 있게 나왔으나 그중에서도 정확성면에서는 인공신경망과 칼만필터링이 우수했고 적응성면에서는 칼만필터리딩 탁월했다. 또한 1분 후의 속도를 예측하는 결과들은 모형들간에 거의 비슷한 정확도를 보여주었는데 이는 입력변수의 설정이 중요한 것임을 보여주는 것이라 판단된다. 있는 기법이다.적으로 세부적 차종분류로 접근한다.의 영향들을 고려함으로써 가로망 설계 과정에서 가로망의 상반된 역할인 이동성과 접근성의 비교가 가능한 보다 현실적인 가로망 설계 모형을 구축하고자 한다. 지금까지 소개된 가로망 설계모형들은 용량변화에 대한 설계변수의 형태에 따라 이산적 가로망 설계 모형과 연속적 가로망 설계모형으로 나뉘어지게 된다. 본 논문의 경우, 계산속도의 향상 측면에서는 연속적 가로망 설계 모형을 도입할 수 있지만, 이때 요구되는 도로용량이 이산적인 변수(차선 수)로 결정되어야만 신호제어 변수를 결정할 수 있기 때문에, 이산적 가로망 설계 모형이 사용된다. 하지만, 이산적 설계모형의 경우 조합최적화 문제이므로 정확한 최적해를 구하기 위해서는 상당한 시간이 소요되며, 경우에 따라서는 국부 최적해에 빠지게 된다. 이러한 문제를 극복하기 위해, 우선 이상적 모형의 근사화, 혹은 조합최적화문제를 위해 개발된 Simulated Annealing기법의 적용, 연속적 모형의 변수를 이산화하는 방법 등 다양한 모형들을 고려해 본 뒤, 적절한 모형을 적용할 것이다. 가로망 설계 모형에서 신호제어를 고려하기 위해서는 주어진 가로망에 대한 통행 배정과정에서 고려되는 통행시간을 링크통행시간과 교차로 지체시간을 동시에 고려해야 하는데, 이러한 문제의 해결을 위해서 최근 활발히 논의되고 있는 교차로에서의 신호제어에 대응하는 통행배정 모형을 도입하여 고려하고자 한다. 이를 위해서 지금까지 연구되어온 Global Solution Approach와 Iterative Approach를 비교, 검토한 뒤 모형에 보다 알맞은 방법을 선택한다. 차량의

  • PDF

가이드북에 나타난 태산 (泰山) 경관특성에 관한 연구 (A Study on Landscape Characteristics of Mount Tai Appearing in Guidebooks)

  • 위잉;정태열
    • 한국조경학회지
    • /
    • 제51권2호
    • /
    • pp.54-67
    • /
    • 2023
  • 태산(泰山)은 해발 1,532m로 중국에서 제일 높은 산이 아님에도 불구하고 "오악독존(五嶽獨尊)"과 같은 높은 명성을 가지고 있다. 가이드북은 특정 이벤트나 시설 등에 대한 안내와 설명을 담은 책이나 소개서이다. 특히 관광지에 대해 상세하면서 정확한 정보를 다른 상업홍보 보다 시각적이면서도 다량으로 제공한다는 특성이 있다. 이에 태산에 관한 경관을 묘사한 가이드북을 연구 재료로 활용하여 경관유형 및 요소 분석과 경관요소의 커널 밀도(Kernel Density), 평균중심(Mean Center), 표준차 타원(Standard Deviational Ellipse) 분석을 통해 태산경관 특성을 파악하였다. 본 연구 결과를 요약하면, 첫째, 태산의 경관유형 특성은 자연경관이 가장 많이 나타났으며, 이는 시문과 빅 데이터 분석에 나타난 인간활동 위주의 태산경관 특성과 다르다. 둘째, 세부적인 경관유형별로 보면 경관요소의 비중에 따라 많이 나타난 것은 지형, 구조물, 건물, 식물, 의미, 사람, 이미지 순이라고 할 수 있다. 셋째, 시계열별 경관요소로 보면 ''봉선(封禅)"과 ''제사(祭祀)", ''전설"은 1950년대와 1980년대에 많이 나타났으며 1990년대 이후는 ''등반", ''멀리 바라보기"가 많이 나타났다. 넷째, 태산 경관요소의 공간분포는 전시대에 걸쳐 태산 대정 (岱顶)과 대묘 (岱廟)에 많이 분포되어 있다. 이는 향후 태산 풍경명승지의 중요 공간이 될 수 있다. 그리고 전체적으로 경관요소는 태산 풍경명승지 집중분포에서 태산과 태안 도시지역을 포함하는 분산분포의 형태로 나타났다. 이는 향후 태산 풍경명승지의 경관 보정과 가이드북 재제작을 할 때 필요한 시사점을 제시하고자 한다.

대규모기업집단의 차별적 이익조정 행태 (Chaebol and Earnings Management)

  • 임형주
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.385-394
    • /
    • 2012
  • 본 연구에서는 총수 및 그 일가에 의해 절대적인 영향력을 받고 있는 대규모기업집단이 그렇지 않은 기업에 비해 이익조정행위에 차별적으로 관여하는지 고찰한다. 본 연구는 선행연구에서 간과한 기업특성 및 잠재적 이분산에 기인한 내생성 문제를 통제하고자, 1992년부터 2010년까지 19년 동안 268개의 기업이 반복적으로 관찰되는 패널데이터를 이용한 확률효과 GLS 분석을 수행하였고, 추가분석에서는 잠재적 이분산성을 통제하고자 Hausman and Taylor검증을 실시하였다. 본 연구의 결과를 요약하면 다음과 같다. 재벌집단에 속해 있는 기업들의 발생액을 이용한 이익조정행위는 그렇지 않은 기업들의 이익조정행위 수준과 유의한 차이를 보이지 않는 것으로 나타난 반면 실제이익조정행위를 덜 행하는 것으로 나타났다. 이는 미래경영성과 및 장기주가에도 부정적인 영향을 미치고, 기업가치 또한 크게 오인시키는 실제이익조정행위를 대규모집단이 회피한다는 것으로 해석할 수 있다. 본 연구는 재벌기업의 장기간 시계열특성과 횡단면적 특성을 동시에 고려한 패널데이터를 이용하여, 재벌기업과 이익조정의 관련성에 대한 보다 신뢰할 수 있는 결과를 제공했다는 점에서 의미가 크다고 할 수 있다.

한국 청년실업률 예측 모형에서 네이버와 구글 검색 정보의 유용성 분석 (Comparative Usefulness of Naver and Google Search Information in Predictive Models for Youth Unemployment Rate in Korea)

  • 정재운
    • 디지털융복합연구
    • /
    • 제16권8호
    • /
    • pp.169-179
    • /
    • 2018
  • 최근 고급 예측모형 연구에 웹 검색 정보가 활용되고 있다. 세계 웹 검색시장에서 구글이 절대적 우위를 점하고 있지만, 국내 웹 검색시장에서는 네이버가 절대적 우위를 보이고 있다. 이러한 특성을 토대로 본 연구는 예측모형을 활용하여 구글과 네이버의 한국어 검색 정보에 대한 유용성을 비교해 보고자 한다. 이를 위해 ARIMA 모형을 활용하여 세 가지의 한국 청년실업률 예측 시계열 모형을 개발하였다. 모형1은 한국 청년실업률 데이터만 사용하였으며, 모형2와 3은 모형1에 네이버와 구글의 검색어 정보를 각각 추가하였다. 모형 훈련기간에서는 모형1보다 모형2와 3이 더 우수한 예측력을 보였다. 모형2와 3은 서로 다른 검색어 정보와 상관관계를 보였으며, 예측기간 1과 2에서 모형3이 가장 좋은 성능을 보였다. 예측기간 2에서는 모형 3만 유의미한 예측결과를 나타내었다. 이 비교 연구는 네이버와 구글 검색엔진을 이용한 한국어 웹 검색 정보의 유용성을 이해하는 데 도움을 준다.

위성 토양수분 데이터 및 COSMIC-ray 데이터 보정/검증을 위한 성균관대학교 내 FDR 센서 토양수분 측정 연구(SM-FC) 및 데이터 분석 (Construction and estimation of soil moisture site with FDR and COSMIC-ray (SM-FC) sensors for calibration/validation of satellite-based and COSMIC-ray soil moisture products in Sungkyunkwan university, South Korea)

  • 김형록;선우우연;김성균;최민하
    • 한국수자원학회논문집
    • /
    • 제49권2호
    • /
    • pp.133-144
    • /
    • 2016
  • 본 연구에서는 수원 성균관대학교 내 Frequency Domain Reflectometry (FDR) 토양수분 측정 장비 및 COSMIC-ray 중성자 측정 장비를 통한 토양수분 지점 관측 사이트를 확립하였다. 또한 양질의 토양수분 데이터 확보를 위해 연구지역 내 토질실험, 토질별 FDR 토양수분 데이터 및 COSMIC-ray 중성자 개수의 시계열 분석, 관측한 토양수분 데이터와 위성 기반 토양수분 데이터와의 비교분석을 실시하였다. 2014년도부터 6개 지점에서 표층으로부터 5 cm에서 40 cm까지 총 24개의 FDR 센서를 5~10 cm 깊이별로 설치하여 토양수분 데이터를 측정하였다. 해당 지점들의 토질 분석결과, Sand에서 Loamy Sand까지의 다양한 토질이 불균질한 층을 이루어 분포되어 있는 것으로 판단되었다. 측정된 토양수분 데이터는 강우 데이터와 높은 상관성을 보이며, 위성 산출 토양수분 데이터와의 비교에서도 상대적으로 높은 상관관계와 낮은 평균제곱근편차(Root mean square deviation, RMSD)값을 보여주었다. 2014년도 설치 지역 토양수분 데이터의 신뢰도가 확보됨에 따라 2015년도에는 10개의 FDR 토양수분 측정 장비 및 COSMIC-ray 중성자 측정 장비가 추가로 설치되어 성균관대학교의 Soil Moisture site with FDR and COSMIC-ray(SM-FC) 연구지역이 구축되었다. SM-FC에 설치된 COSMIC-ray 중성자 측정 장비의 최초 검증을 위해 2015년 8~11월의 COSMIC-ray 중성자 데이터 및 FDR 토양수분 데이터가 활용되었다. 중성자기반 토양수분 값과 전체 지점 FDR 토양수분 평균값을 비교한 결과 매우 높은 상관관계를 볼 수 있었다 (상관계수 0.95). 이러한 연구를 통해 성균관대학교 SM-FC는 향후 한반도 지역 위성 및 모델 토양수분 데이터를 검증하는 대표 연구지역이 될 것으로 기대된다.

한국프로농구 기업의 임금수준과 임금격차가 구성원의 생산성과 조직성과에 미치는 영향: 한국프로농구를 중심으로 (The Effects of Compensation and Pay Dispersion on Organizational Productivity and Performance: The Case of Korean Professional Basketball Teams)

  • 김필수;정태성;이상현
    • 벤처창업연구
    • /
    • 제18권2호
    • /
    • pp.127-139
    • /
    • 2023
  • 제한된 자원을 보유한 기업이 내재한 조직역량을 효율적으로 운영하여 성과를 극대화하는 것은 중요한 과제이다. 하지만, 국내 벤처기업 및 이러한 속성을 지닌 기업이 조직 내의 구성원들에게 지급하는 임금이 어떠한 과정을 통하여 조직성과에 영향을 주며, 어떤 상황에서 그 효과가 극대화될 수 있는지에 관한 연구는 찾기 힘든 실정이다. 기존 연구의 한계를 보완하기 위하여 본 연구에서는 임금과 조직 구성원의 생산성이 조직 내 임금격차의 수준에 따라 조직성과에 미치는 영향이 달라질 것이라는 가설을 세우고 실증적으로 검증하고자 하였다. 이를 분석하기 위해 벤처기업과 조직의 구조, 자본 및 인적자원의 규모나 운영방식 등 많은 부분에서 유사한 특징을 지닌 한국프로농구(KBL) 리그에 속한 10개 구단의 9개 시즌(2013~2014시즌 - 2021~2022시즌)의 팀 연봉 및 경기기록과 관련한 자료를 체계적으로 수집하여 실증분석을 시행하였다. 본 연구의 분석을 위해 프로세스 매크로 58번의 조절된 매개효과 모형이 적용되었다. 실증분석 결과, 한국프로농구팀의 (1) 팀 연봉은 구성원의 성과와 정(+)의 관계를 지니고, (2) 임금격차와 구성원의 성과는 U자형의 비선형 관계가 존재한다. 또한, (3) 구성원의 생산성은 한국프로농구팀의 연봉과 조직성과의 정(+)의 관계를 매개하며, (4) 임금격차는 팀 연봉이 조직성과에 미치는 간접효과를 조절하는 것으로 나타났다. 본 연구는 비교적 객관적으로 조직성과를 측정할 수 있도록 계량화되어 있고 조직 구성원의 생산성과 조직성과가 표준화되어 있어 시계열 데이터로 구축할 수 있는 프로스포츠 데이터를 활용하였다. 벤처기업과 기업 규모의 측면에서 매우 유사한 프로스포츠팀의 임금이 어떤 방식으로 구성원의 생산성과 조직성과에 영향을 미치며 그 효과가 어떻게 극대화될 수 있는지에 대해 실증적으로 분석하여 기존의 논의를 확장하였다는 측면에서 의의가 있다.

  • PDF

인공신경망 기법을 이용한 청미천 유역 Flux tower 결측치 보정 (A point-scale gap filling of the flux-tower data using the artificial neural network)

  • 전현호;백종진;이슬찬;최민하
    • 한국수자원학회논문집
    • /
    • 제53권11호
    • /
    • pp.929-938
    • /
    • 2020
  • 본 연구에서는 청미천 유역에서의 플럭스타워에서 산출되는 증발산량의 결측값을 보완하기 위해 인공신경망(Artificial Neural Network, ANN)을 사용하였다. 비교 평가를 위해, Mean Diurnal Variation(MDV), Food and Agriculture Organization Penman-Monteith(FAO-PM) 방법들을 이용하여 증발산량을 산정하였고, ANN 방법을 이용한 결과와 비교하였다. 비교 평가 방법으로 시계열 방법 및 통계 분석(결정계수, IOA, RMSE, MAE)이 사용되었다. 각 gap-filling 모델의 검증을 위해 2015년의 30분 단위 데이터를 이용하였으며, 121개의 결측값 중 MDV, FAO-PM, ANN 방법 순으로 각각 70, 53, 54개의 결측값을 보완하여 모든 데이터가 관측되지 않은 36개의 데이터를 제외하면 각각 82.4%, 62.4%, 63.5%의 성능을 보였다. 결정계수(MDV, FAO-PM, ANN 방법 순으로 각각 0.673, 0.784, 0.841)와 IOA(MDV, FAO-PM, ANN 방법 순으로 각각 0.899, 0.890, 0.951)를 분석한 결과, 3가지 방법 모두 양질의 상관성을 보여 활용성이 충분하다고 판단되며, 이 중 ANN 모델이 가장 높은 적합도와 양질의 성능을 나타내었다. 본 연구를 기반으로 기계학습방법을 이용한 플럭스 타워 자료의 gap-filing 연구에 보다 적절하게 활용될 수 있을 것이다.