• 제목/요약/키워드: 공간통계학

검색결과 85건 처리시간 0.025초

외국인 관광객 리뷰데이터를 활용한 토픽모델링 기반의 공간분석: 대구광역시를 사례로 (Spatial analysis based on topic modeling using foreign tourist review data: Case of Daegu)

  • 정지우;김서윤;김현유;윤주혁;장원준;김건욱
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.33-42
    • /
    • 2021
  • 스마트폰 기반의 관광 플랫폼들이 활성화되면서 리뷰 데이터를 활용한 정책 수립 및 서비스 고도화가 다양한 분야에서 이루어지고 있다. 관광 리뷰 데이터를 활용한 선행연구들의 경우 국내 관광객 중심의 연구가 대다수 수행되었으며, 외국인 관광객 연구의 경우 일부 언어로 수집된 데이터와 텍스트 마이닝 기법에 한정하여 연구가 수행되었다. 이에 본 연구에서는 온라인 리뷰 사이트를 통해 '대구 명소' 키워드를 지정하여 외국인들이 작성한 리뷰 데이터 3,515건을 수집하였다. 그리고 LDA 기반의 토픽모델링을 수행하여 관광 토픽을 도출하였으며, 각 토픽별 전역 및 국지적 공간 분석을 수행한 점이 선행연구와 차별성이라 할 수 있다. 분석 결과 전역적 공간 자기상관이 존재하며, 외국인들이 주로 방문하는 관광지들이 국지적으로 결집되어 있음을 확인하였다. 또한 대다수 토픽에서 중구를 중심으로 핫스팟이 도출되었으며, 분석 결과를 바탕으로 지자체 외국인 관광정책 수립 및 토픽모델링 기반의 공간분석 연구의 기초연구로 활용되길 기대하며, 본 연구의 한계점 또한 제시하였다.

소상공인 점포의 분포와 환경요인의 공간적 영향관계에 관한 실증연구 (An Empirical Study on the Spatial Effect of Distribution Patterns between Small Business and Social-environmental factors)

  • 유무상;최돈정
    • 한국지리정보학회지
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2019
  • 본 연구에서는 천안시, 아산시의 $100m{\times}100m$격자 내에 집계된 소상공인 분포가 가지는 공간적 의존성(Spatial Dependency)과 공간적 이질성(Spatial Heterogeneity)을 전역적(Global), 국지적(Local) 공간 자기상관(Spatial Autocorrelation)을 통해 측정 및 가시화하였다. 먼저 탐색적 공간데이터 분석방법(ESDA: Explotory Spatial Data Analysis)인 Moran's I Index를 통해 연구지역에서 소상공인 분포의 정적(Positive)공간자기상관이 발생하는 것을 확인하였으며, 국지적 공간자기상관 지표(LISA : Local Indicators of Spatial Association) 중 하나인 Getis-Ord $GI{\ast}$를 통해 공간자기상관의 국지적 패턴을 가시화하였다. 이를 통해 소상공인 상가점포의 입지요인 분석 시 적용할 변수와의 관계에 대해 공간회귀모형의 적용이 타당함을 증명하였으며, 소상공인의 분포와 모바일 트래픽 기반의 시간대별 유동인구, 토지이용 혼합성 지수 그리고 주거지, 상점, 도로망, 교통결절점과의 공간영향관계를 지리가중 회귀분석(GWR : Geographically Weighted Regression)을 통해 분석하였다. 최종적으로 다중공선성(Multicollinearity)이 발생했던 버스정류장 접근성, 오후시간대 유동인구, 저녁시간대 유동인구를 제외한 6개의 변수를 적용하였고 GWR 모형이 OLS모형보다 주요통계량에서 모형 설명력이 개선됨을 도출하였다. 분석에 최종적으로 적용된 6가지 변수의 회귀계수와 국지적 결정계수(Local $R^2$)에 대해 연구지역 내에서 공간적으로 변화하는 변수별 영향력을 가시화하였다. 본 연구는 실질적으로 측정된 방식의 유동인구 정보를 적용함으로써 상권을 이용하는 도시민의 동적 정보를 반영한 것이 상권분석을 수행한 다른 연구들과 차별적인 성격을 가진다. 마지막으로 이러한 동적정보와 변수들의 공간적 상호작용을 구조화하기 위해 미시적 공간단위에서 공간통계학(Spatial Statistical)적 모형 적용을 통해 상권분석의 새로운 프레임을 제시하였다는 점에서 연구적 의의를 가진다.

토픽모델링을 활용한 SIAM Journal on Applied Mathematics의 연구 동향 분석 (Analysis of Research Trends in SIAM Journal on Applied Mathematics Using Topic Modeling)

  • 김성연
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.607-615
    • /
    • 2020
  • 본 연구는 텍스트 마이닝 기법을 이용하여 산업수학과 관련한 논문들의 연구 현황 및 동향을 파악하는데 목적이 있다. 이를 위해 R로 1970년부터 2019년까지 SIAM Journal on Applied Mathematics 총 4910편 논문의 제목, 초록, 주제어를 수집하였으며, LDA 알고리즘 기반의 토픽모델링 분석을 수행하였다. 수집된 자료에 대한 coherence score 분석 결과, 토픽의 최적 개수는 20개로 결정하였으며, 핵심 연구 주제들은 Gibbs 샘플링 방법을 기반으로 추출하였다. 주요 분석 결과는 다음과 같다. 첫째, 해석학과 대수학을 중심으로 계산수학, 기하학, 수학적 모델링, 위상수학, 이산수학, 확률 및 통계학 등 다양한 수학 분야에서 산업수학 관련 연구가 진행되었다. 둘째, 연대별 연구 주제의 동향을 분석한 결과, 상승하는 연구 주제는 수리생물학, 비선형편미분방정식, 이산수학, 통계학, 위상수학으로, 하강하는 연구 주제는 확률론만 나타났다. 셋째, 2015개정 수학교육과정에서 반영되지 않은 분야 중 고등학교 수학교육과정에서 다루어야 할 내용으로 기수법, 행렬, 공간벡터, 복소수가 도출되었다. 마지막으로 분석 결과를 바탕으로 우리나라의 산업수학 활성화 방안과 본 연구의 제한점 및 후속 연구를 제시하였다.

지화학 자료의 확률론적 불확실성 및 위험성 분석을 위한 지시자 지구통계학의 응용 (Application of Indicator Geostatistics for Probabilistic Uncertainty and Risk Analyses of Geochemical Data)

  • 박노욱
    • 한국지구과학회지
    • /
    • 제31권4호
    • /
    • pp.301-312
    • /
    • 2010
  • 지화학 자료는 환경 관리를 위한 중요한 환경 변수중 하나로 인식되어 왔다. 지화학 자료는 보통 공간적으로 산재되어 수집되기 때문에, 샘플링 되지 않은 지점에서의 속성값 예측과 더불어 부가적인 분석을 위해 예측에 수반되는 불확실성을 추정할 필요가 있다. 이 논문은 지시자 지구통계학이 지화학 자료의 공간적인 분포값의 제시뿐만 아니라 의사결정을 보조할 수 있는 정보를 제공하기 위해 유용하게 사용될 수 있는지를 예시하고자 한다. 카드뮴 자료의 추정사례 연구를 통해 확률론적 불확실성 모델링, 위험성 분석 등 지구통계학적 분석의 틀을 제시하였다. 지시자 크리깅을 통해 조건부 누적 분포 함수를 모델링한 후에, 기대값 추정치와 조건부 분산을 카드뮴의 추정값과 정량적 불확실성 추정을 위해 각각 계산하였다. 그리고 확률 임계치와 속성 임계치의 적용을 통해 오염/비오염 지역을 구분하였다. 또한 조건부 분산과 속성값과 임계치값의 차이를 모두 설명할 수 있는 변동 계수를 통해 추가적인 샘플링 지점을 추출하였다. 이 연구에서 적용한 지시자 지구통계학적 분석 틀은 불확실성을 고려한 의사 결정과 관련하여 지화학 자료를 포함한 환경 변수의 분석에 유용하게 사용될 수 있을 것으로 기대된다.

계층적 군집분석을 이용한 반도체 웨이퍼의 불량 및 불량 패턴 탐지 (Wafer bin map failure pattern recognition using hierarchical clustering)

  • 정주원;정윤서
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.407-419
    • /
    • 2022
  • 반도체는 제조 공정이 복잡하고 길어 결함이 발생될 때 빠른 탐지와 조치가 이뤄져야 결함으로 인한 손실을 최소화할 수 있다. 테스트 공정을 거쳐 구성된 웨이퍼 빈 맵(WBM)의 체계적인 패턴을 탐지하고 분류함으로써 문제의 원인을 유추할 수 있다. 이 작업은 수작업으로 이뤄지기 때문에 대량의 웨이퍼를 단 시간에 처리하는 데 한계가 있다. 본 논문은 웨이퍼 빈 맵의 정상 여부를 구분하기 위해 계층적 군집 분석을 활용한 새로운 결함 패턴 탐지 방법을 제시한다. 제시하는 방법은 여러 장점이 있다. 군집의 수를 알 필요가 없으며 군집분석의 조율 모수가 적고 직관적이다. 동일한 크기의 웨이퍼와 다이(die)에서는 동일한 조율 모수를 가지므로 대량의 웨이퍼도 빠르게 결함을 탐지할 수 있다. 소량의 결함 데이터만 있어도 그리고 데이터의 결함비율을 가정하지 않더라도 기계학습 모형을 훈련할 수 있다. 제조 특성상 결함 데이터는 구하기 어렵고 결함의 비율이 수시로 바뀔 수 있기 때문에 필요하다. 또한 신규 패턴 발생시에도 안정적으로 탐지한다. 대만 반도체 기업에서 공개한 실제 웨이퍼 빈 맵 데이터(WM-811K)로 실험하였다. 계층적 군집 분석을 이용한 결함 패턴탐지는 불량의 재현율이 96.31%로 기존의 공간 필터(spatial filter)보다 우수함을 보여준다. 결함 분류는 혼합 유형에 장점이 있는 계층적 군집 분석을 그대로 사용한다. 직선형과 곡선형의 긁힘(scratch) 결함의 특징에 각각 주성분 분석의 고유값과 2차 다항식의 결정계수를 이용하고 랜덤 포레스트 분류기를 이용한다.

인구이동 연구에 대한 공간통계학적 접근: 장소특수적 거리 패러미터의 추출과 공간적 패턴 분석 (A Spatial Statistical Approach to Migration Studies: Exploring the Spatial Heterogeneity in Place-Specific Distance Parameters)

  • 이상일
    • 한국지역지리학회지
    • /
    • 제7권3호
    • /
    • pp.107-120
    • /
    • 2001
  • 이 연구의 목적은 장소-특수적 거리 패러미터를 측정하는 방법론을 제시하고, 그것이 인구이동 연구에서 가지는 의미에 대해 미국의 48개 주간(州間) 인구 이동자료를 사례로 검토해보는 것이다. 전통적인 인구이동 연구에서 추출하는 거리 패러미터는 인구 이동량에 대해 거리가 가지는 평균적인 효과를 측정하는 것이다. 그러나, 그 평균적인 거리 패러미터는 모든 지역간 인구이동의 대표값일 뿐 인구이동에 있어 거리가 가지는 효과의 공간적 변이에 대해서는 아무런 통찰을 제공해 주지 못한다. 장소-특수적 거리 패러미터란 개개 소지역이 평균적인 거리 패러미터에 대해 가지는 상대적인 값이며, 거리가 인구이동에 대해 가지는 효과의 지역적 특이성을 측정하려고 한다. 이러한 연구는 최근 계량지리학 분야에서 발생하고 있는 변화에 부응하는 것이다. 1980년대 이후, 계량지리학은 공간통계학이라는 보다 폭넓은 개념의 확장과 일반연구환경으로서의 지리정보체계(GIS)치 성장으로 학문적 재구조화 과정 속에 있다. 이러한 재구조화 과정은 특정한 패러다임으로서의 탐구적 공간자료분석(ESDA)과 그것을 통계적으로 가능케 하는 국지 통계(local statistics)의 발달로 특징 지워진다. 통계적으로 가공되어 지역에 부여된 값으로 정의되는 국지 통계는 그것의 시각화를 효과적으로 수행하는 GIS와 결합함으로써, 시각화(visualization)와 과학활동으로서의 탐구(exploration)를 강조하는 탐구적 공간자료분석이라는 계량지리학의 새로운 패러다임을 효과적으로 수행하게 된다. 이러한 맥락에서, 장소-특수적 거리 패러미터는 하나의 국지 통계치로 인식될 수 있으며, 그것이 보여주는 공간적 패턴을 탐구하는 것은, 인구이동연구에서 탐구적 공간자료분석의 전형을 수행하는 것이라 올 수 있다. 장소-특수적 거리 패러미터는 출발지-특수적 거리 패러미터와 도착지-특수적 거리 패러미터로 나뉘어 지는데, 이러한 패러미터를 추출하기 위해서는 특정한 통계기법이 요구된다. 이러한 패러미터를 추출하기 위해 전통적인 혹은 보다 진보된 형태의 중력모델이나 엔트로피-극대화 모델이 활용될 수 있지만, 본 논문은 포아송 회귀분석을 이용함으로써 패러미터의 추출이 가장 효과적으로 이루어짐을 논증하고 있다. 이 방법론은 1985년과 1990년 사이에 발생한 미국 48개 주간 인구이동량에 대한 사례연구에 적용되었다. 그 연구 결과는 장소-특수적 거리 패러미터의 공간성을 명확히 보여준다. 즉, 평균적 거리 패러미터로 부터의 편기로 이해될 수 있는 장소-특수적 거리 패러미터들이 지역별로 상당한 차이를 보여줄 뿐만 아니라(공간적 이질성), 유사한 장소-특수적 거리 패러미터들이 공간적으로 집중되어 있음을 확인할 수 있었다(공간적 의존성). 지역차에 대한 강한 전통을 가지고 있는 지리학내에서 태동한 계량지리학이 지역적 특이성을 무시하는 방향으로 발전해 온 것은 아이러니라 할 수 있다. 그것은 계량적 방법론의 한계라기 보다는 그 방법론을 사용하는 전통적 계량지리학자의 한계라고 보아야 할 것이다. 이러한 의미에서 본 연구는 최근 계량지리학의 경향을 인구이동연구에 적용한 사례임과 동시에 맥락 의존성을 강조하는 보다 폭넓은 과학운동의 계량지리적 반응이다.

  • PDF

수리전도도맵 작성을 위한 자료병합 툴 개발과 적용 (Development of a Data Integration Tool for Hydraulic Conductivity Map and Its Application)

  • 류동우;박의섭;안등현일;김형목
    • 터널과지하공간
    • /
    • 제17권6호
    • /
    • pp.493-502
    • /
    • 2007
  • 암반의 수리적 특성 및 지하수 유동 양상을 파악하는데 요구되는 수리전도도맵 작성시, 투수시험 자료의 자료수 한계를 극복하고 수리전도도맵의 신뢰도 향상을 목적으로 물리탐사 결과 자료와의 병합툴을 개발하고 현장 적용해 보았다. 개발된 병합툴은 지구통계학적 최적화 시뮬레이션 기법 중의 하나인 모의 담금질 기법(Simulated Annealing)을 활용하였으며, 시뮬레이션에 필요한 전처리 과정과 후처리 과정을 포함한 4개의 모듈로 구성되었다. 파쇄대 수리특성의 파악 및 가시화를 위한 현장 적용 결과, 시추공 사이의 비조사 영역에서의 투수특성의 변화를 파악하는데 유용하게 적용될 수 있음을 확인하였다.

한반도 지진발생의 무작위성에 대한 통계적 검정과 집중도 추정 (Statistical Testing of the Randomness and Estimation of the Degree of for the Concentration Earthquake Occurrence in the Korean Peninsula)

  • 김성균;백장선
    • 한국지구과학회지
    • /
    • 제21권2호
    • /
    • pp.159-167
    • /
    • 2000
  • 본 연구에서는 한반도의 지진활동을 공간 통계학 방법을 이용하여 지진발생의 무작위성에 대한 검정과 집중도의 추정을 수행하였다. 무작위성에 대한 통계적 검정은 검정통계량을 이용한 방법과 경험분포를 이용한 두 가지 방법을 사용하였다. 역사지진과 계기지진의 두 대상자료에 대하여 적용한 결과, 두 자료 모두 무작위적이지 않고 군집적인 분포를 가지고 있는 것으로 판명되었다. 한편 비모수 밀도함수 추정방법을 이용한 진앙지 분포의 집중도는 역사지진의 경우 한반도 중부, 충남, 전북, 경북지역에서 높게 나타났다. 또한 계기지진의 경우에는 황해도-충남 해안-경북 내륙을 연결하는 "L"자 형태의 집중도를 보인다.

  • PDF

물리탐사 자료의 지구통계학적 역산에 의한 암반강도 추정 (Geostatistical inversion of geophysical data for estimation of rock quality)

  • 오석훈;서백수
    • 한국지구물리탐사학회:학술대회논문집
    • /
    • 한국지구물리탐사학회 2008년도 공동학술대회
    • /
    • pp.63-67
    • /
    • 2008
  • 시추공에서 떨어진 지점에서의 암반등급 (RMR)을 물리탐사 자료를 통하여 간접적으로 추정하기 위해, 지구통계학적 복합 역산 기법을 적용하였다. 지금까지 지구통계학적 기법은 두 가지 이상의 자료의 특성을 잘 반영하는 변수를 추정하는데 주로 이용되었으나, 본 연구에서는 역산 기법에 의한 접근 방법을 사용하였다. 시추공에서 확보한 암반 등급 값을 이용하여, 미리 지정된 격자점상에 지구통계학적 시뮬레이션을 수행하여 다수의 추정값을 확보한다. 이 값은 임의의 상관성이 있는 물리탐사 자료와 비교하여 가장 오차가 작은 값을 채택하게 되고, 이와 같은 비교는 모든 격자점에 대해 수행된다. 이러한 절차는 암반등급의 공간적 분포를 준수하면서, 물리탐사 자료와의 비교를 통해 두 자료의 상관성을 최대한 확보한 결과를 얻을 수 있다. 또한 동일한 과정을 다수 수행하여, 추정한 결과의 신뢰도를 분석할 수 있는 정보를 제공할 수 있다.

  • PDF

서양의 역사적인 지도제작법의 발달 과정과 수학적 지식의 상호 영향 관계를 통해 본 직교좌표계 (A study on the rectangular coordinate system via comparing the interrelated influence between mathematical knowledge evolution and historical development of Cartography in Europe)

  • 이동원
    • 한국수학사학회지
    • /
    • 제25권4호
    • /
    • pp.37-51
    • /
    • 2012
  • 역사적인 지도제작법에 나타난 좌표계와 수학적 직교좌표계의 발전 과정을 비교하면서 위치를 표시하는 직교좌표계는 수학의 해석기하학과는 상관없이 인간 본연에 내재되어 있었던 공간지각능력의 일환으로 발전되어 왔음을 주장한다. 지도제작법의 발전이 해석기하학의 발명 전후 삼각함수, 로그, 기하학, 미적분학, 통계학 등 수학의 여러 분야와 상호 영향을 미치지만 원점의 표시나 음수 좌표의 사용과 같은 수학적 직교좌표계 자체에 대한 발전은 데카르트의 논문 발표 후 100여년 이상 지난 후에 이루어지는 점, 해석기하학을 발명하는데 공헌한 대부분의 수학자들이 당대의 문제 해결에 집중하면서 직교좌표계에 대한 수학적 설명없이 자연스럽게 사용하였던 점을 바탕으로 이런 결론을 얻는다.