• 제목/요약/키워드: 데이터 집계

검색결과 215건 처리시간 0.031초

사회경제적 지리정보 활용 및 데이터 요구조건에 관한 연구 (A Study on the Application and Requirements of Socioeconomic GIS Data)

  • 남광우;김호용;이성호;이상학;하수욱;최현
    • 한국지리정보학회지
    • /
    • 제8권3호
    • /
    • pp.44-54
    • /
    • 2005
  • 지리참조된 사회경제적 데이터를 체계적으로 구축하고 관리하는 GIS 선진국의 경우는 이를 활용하여 다양한 사회경제적 분야에서 많은 이득을 획득하고 있는 것으로 알려지고 있다. 하지만 우리나라의 경우는 지형 지물 관련 데이터에 비해 사회경제적 지리정보의 구축은 상대적으로 매우 부족한 형편이다. 이는 사회경제적 데이터의 구축단계부터 활용에 이르는 과정상의 특성들에 기인한다고 할 수 있다. 즉 데이터 구축단계에서부터 지형지물위주의 데이터에 비해 상대적으로 잦은 변동성의 해결이 요구되며 또한 개별 개체의 위치표현이 어려움으로 인해 적절한 공간집계단위의 설정을 통한 정보구축이 이루어진다. 데이터의 활용단계에서도 사회경제적 현상의 복잡성으로 인해 다른 사회경제적 데이터와의 잦은 결합이 요구되는 특성 등을 갖고 있다. 이에 본 연구는 대표적인 사회경제적 분야의 GIS 선진사례 분석을 통해 사회경제적 분야에서의 GIS 활용의 유용성 및 사회경제적 정보의 공간적 차원을 살펴보고 그 결과를 토대로 데이터 구축단계 및 활용단계에서 나타나는 사회경제적 지리정보의 데이터 요구조건을 도출하여 이에 대한 해결방안과 함께 제시하였다.

  • PDF

격자 기반의 통계정보 표현을 위한 데이터 변환 방법 (A Data Transformation Method for Visualizing the Statistical Information based on the Grid)

  • 김문수;이지영
    • Spatial Information Research
    • /
    • 제23권5호
    • /
    • pp.31-40
    • /
    • 2015
  • 본 논문에서는 다양한 형태로 존재하는 통계정보를 일정한 모양과 크기를 갖는 격자로 표현하기 위해 필요한 데이터 변환 방법론에 대하여 제시한다. 격자는 기존 통계지도 서비스에서 활용하고 있는 통계공간단위인 행정구역과 집계구와 비교하였을 때 모양과 크기가 일정하여 통계정보를 객관적으로 파악할 수 있게 하며, 지도 축척 변화에 유연하게 적용될 수 있는 특징이 있다. 한편, 기존 통계지도 서비스에서는 면 보간법을 활용하여 통계공간단위로 변환하고 있는데, 이것을 다양한 형태로 존재하는 통계정보에 적용시키기 위해서는 추가적인 프로세스가 필요하다. 이에 따라, 본 논문에서는 다양한 형태로 존재하는 통계정보의 격자 변환을 위해 1)지오코딩을 통한 공간데이터로의 변환, 2)공간 관계 정의를 통한 위치정보 변환, 3)데이터 척도를 고려한 속성정보 변환을 수행하는 방법론을 정리하였다. 제시한 방법론은 서울시 A지역의 인구 밀도 통계정보를 격자로 변환하기 위해 적용하였다. 특히, 동일한 통계정보를 표현하는 참조데이터가 서로 다르더라도 유사한 격자 표현이 가능해야 함을 검증하기 위해 공간 자기상관성을 통해 분석하였다. 그 결과, 집계구와 건물을 통해 표현되는 인구 밀도를 각각 격자로 변환하였을 때, 두 데이터 모두 유사한 격자 분포를 표현함을 파악할 수 있었다. 이러한 결과를 통해 본 연구에서 제안하는 방법론은 일관된 결과를 표현할 수 있음을 확인하였다.

사이트의 접속 정보 유출이 없는 네트워크 트래픽 데이터에 대한 순차 패턴 마이닝 (Privacy Preserving Data Mining of Sequential Patterns for Network Traffic Data)

  • 김승우;박상현;원정임
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.19-22
    • /
    • 2005
  • 본 논문에서는 대용량 네트워크 트래픽 데이터를 대상으로 사이트의 프라이버시를 보호하면서 마이닝 결과의 정확성, 실용성 등을 보장할 수 있는 효율적인 순차 패턴 마이닝 기법을 제안한다. 네트워크가 발달함에 따라 네트워크 트래픽 데이터에 대한 마이닝은 네트워크를 통한 통신의 패턴을 찾아내고, 이를 사용하여 침입 탐지, 인터넷 웜의 탐지 등으로 유용하게 쓰이게 되었다. 그러나 네트워크 트래픽 데이터는 네트워크 사용자 개개인의 인터넷 접속 형태, IP 주소 등의 정보를 포함하는 데이터로 네트워크 사용자의 프라이버시를 해칠 수 있다는 문제점이 존재한다. 따라서 이들 네트워크 트래픽 데이터를 대상으로 하는 마이닝 기법에서는 프라이버시 보호를 위하여 각 사이트에 저장되어 있는 네트워크 트래픽 데이터를 공개하지 않으면서도, 의미있는 패턴을 찾을 수 있어야 한다. 본 논문에서는 프라이버시 보호를 위하여 N-저장소 서버 모델을 제안한다. 제안된 모델에서는 데이터를 분할하여 암호화한 후, 이를 복호화할 수 없는 서버에서 집계하는 방식을 사용하여 실제 데이터가 저장되어 있는 각 사이트의 출처 정보를 감추는 방식을 사용한다. 또한, 효율적인 빈번 패턴 생성을 위하여 빈번 항목에 대한 인덱스 구조를 제안하고, 이를 기반으로 한 순차 패턴 마이닝 기법을 보인다.

  • PDF

선거 개표방송에서 출구조사 자료를 활용한 중간 득표율 추정에 관한 연구 (Estimating the Interim Rate of Votes Earned Based on the Exit Poll Results during the Coverage of Ballot Results by Broadcasters)

  • 이윤동;박진우
    • 한국조사연구학회지:조사연구
    • /
    • 제12권1호
    • /
    • pp.141-152
    • /
    • 2011
  • 지상파 방송 3사에서 선거 개표방송을 할 때 사용하는 현재의 개표 집계방식은 각 개표소에서 집계된 개표결과를 단순 합산하여 발표하는 방식이다. 그런데 이 방식은 투표소별 개표 진도의 차이를 무시하는 방식이어서 불필요한 혼선을 초래할 여지가 있다. 방송사 입장에서는 이미 출구조사를 통해 얻은 지역별 데이터가 있는데도 불구하고 이 정보를 오후 6시 예측결과를 발표할 때에만 사용할 뿐이고, 이후 개표가 진행되는 동안에는 전혀 이용하지 않은 채 개표결과만을 단순 집계하여 발표한다. 본 논문에서는 베이지안(Bayesian) 기법을 도입하여 출구조사 자료와 개표결과를 통합하여 발표하는 방법을 제시하고자 한다. 이 방법을 사용함으로써 투표소별 개표 진도의 차이에서 생기는 혼선을 피할 수 있을 것으로 기대한다.

  • PDF

OLAP에서 다차원 파일 구조를 사용한 큐브 생성 방법 (Effective Cube Computation using Multidimensional File Structure in OLAP)

  • 김학경;김진호;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.199-201
    • /
    • 2003
  • 온라인 분석처리 시스템의 핵심 기술인 큐브를 효과적으로 산출하기 위한 많은 연구들이 이루어 졌다. 이러한 연구는 크게 온라인 분석처리 시스템의 결과 데이터를 저장하는 방식에 의해 MOLAP과 ROLAP으로 구분하여 이루어 졌다. 최근에 온라인 분석처리 시스템에서 큐브 산출에 대한 연구로 다중키 엑세스를 효율적으로 처리하는 다차원 파일 구조를 사용하여 집계 연산의 효율을 높이는 연구가 이루어졌다. 본 논문은 이러한 연구들을 바탕으로 다차원 파일 구조를 사용하여 효과적으로 큐브를 산출하고 결과 값을 미리 저장하는 일반적인 방법을 제안한다.

  • PDF

이동전화망에서 호 도착 시간과 채널 보류 시간의 통계적 분석 (Statistical Analysis of Call Interarrival Time and Channel Holding Time in Cellular Telephony Network)

  • 엄태랑;장주욱;이경근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.478-480
    • /
    • 2003
  • 일반적으로 음성전화망에서 수학적 모델을 사용하여 트래픽 분석을 수행하는 경우 호 도착 시간과 채널 보류 시간은 지수 분포라고 가정한다. 본 논문에서는 이동전화망을 구성하고 있는 교환기에서 추출한 과금 데이터를 이용하여 호 발생으로 인해 집계되는 호량애 관한 호 도착 시간과 채널 보류 시간이 나타내는 분포를 알아본다. 또한 분석된 확률 분포를 통계적 검정 방법을 이용하여 경험분포함수에 대한 기대 분포함수의 적합성을 판별한다.

  • PDF

데이터융합, 앙상블과 클러스터링을 이용한 교통사고 심각도 분류분석 (Data Fusion, Ensemble and Clustering for the Severity Classification of Road Traffic Accident in Korea)

  • 손소영;이성호
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.597-600
    • /
    • 2000
  • 계속적인 증가 추세를 보이고 있는 교통량으로 인해 환경 문제뿐 아니라 교통사고로 인한 사상자 및 물적피해가 상당량으로 집계되고 있다. 본 논문에서는 데이터융합 및 앙상블 클러스터링방법을 이용한 교통사고 심각도 분류분석방법을 제안함으로서 교통사고예방에 기여하고자 한다. 이를 위하여 신경망과 Decision-Tree기법을 이용하여 얻은 물적피해와 신체상해가 발생할 확률을 융합하는 전형적인 데이터 융합기법(템스터-쉐퍼, 베이지안 방법, 로지스틱융합방법)을 사용하였다. 또한, 분류정확도를 향상시키고자 Bootstrap 재추출 방법을 이용해 얻어진 여러 개의 분류예측 결과 중 다수의 분류결과를 선택하는 앙상블 (arcing, bagging)기법을 적용하였다. 더불어, 본 연구에서는 클러스터링 방법을 제시하고, 이 방법이 기존의 융합기법, 앙상블기법과 비교한 결과, 분류예측면에서 정확도가 향상됨을 보였다.

  • PDF

사물인터넷에서 개인 정보 보안 강화를 위한 위협 및 대응방안 (Threats and countermeasures for strengthening personal information security in the Internet of Things)

  • 임지수;박재경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.599-600
    • /
    • 2023
  • 본 논문은 사물인터넷 환경에서 개인 정보 보안을 강화하기 위해 개인 정보 위협과 대응방안을 조사하는 것을 목표로 한다. 개인 정보의 위협으로는 무단 액세스, 데이터 위반, 데이터 집계 및 프로파일링, 추적 및 감시가 있다. 이에 대한 대응방안으로는 암호화, 개인 정보 보호 데이터 처리, 보안 통신 프로토콜 등을 연구되고 있다. 또한, 실증적 연구를 통해 사물인터넷 사용자의 개인 정보 보호 문제와 기존 전략의 효과를 평가하고 권장 사항을 도출한다. 본 논문은 사물인터넷 생태계에서 개인 정보 보안을 강화하기 위한 정보를 제공하며, 개인정보를 활용하는 사용자에게 도움을 줄 것으로 기대한다.

  • PDF

밀도구분도 매핑을 이용한 통계정보 공간 내삽의 유효성 평가 (An Evaluation of Spatial Interpolation of Statistical Information Using Dasymetric Mapping)

  • 이병길
    • 한국측량학회지
    • /
    • 제24권4호
    • /
    • pp.343-350
    • /
    • 2006
  • 인구통계와 같이 임의의 공간 단위로 집계되는 통계자료를 위성영상이나, 여타 다른 GIS 도형정보와 통합하여 활용하기 위해서는 상호간의 공간 단위를 일치시켜야 한다. 밀도구분도 매핑 기법은 집성된 통계자료를 분해하여 세밀한 공간 단위로 나누거나, 행정구역과 같은 객체 단위의 데이터를 연속된 표면 모델로 만드는데 적용 가능한 기법으로 제안되고 있다. 본 연구에서는 밀도구분도 매핑의 유효성을 평가하기 위해 1) 연구대상지역의 사업체 정보를 행정동 단위의 통계로 집계하고, 2) 행정동 통계에 밀도구분도 매핑 기법을 적용하여 사업체의 분포를 구하고, 3) 공간 내삽에 의해 구해진 사업체의 분포와 원 정보로부터 구해진 분포를 비교하여 알고리즘의 성능을 평가하였다.

센서스 자료를 활용한 다차원홍수피해산정법 개선 연구 (A Study on Improvements of Multi-Dimensional Flood Damage Analysis using Census Data)

  • 김길호;김덕환;최천규;김경탁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.576-576
    • /
    • 2016
  • 치수경제성분석, 투자우선순위 및 시설물 규모결정 등의 의사결정과정에서 실무에서는 다차원 홍수피해산정법(MD-FDA)을 현재까지 널리 사용 중이다. 2004년에 개발된 MD-FDA는 대상지역의 자산규모를 행정구역 경계 최소단위인 "읍면동"을 기준으로 계산하여 취합하고, 대상자산이 위치가능한 토지이용정보를 토지피복도로부터 확인하여, 읍면동내 토지이용공간면적을 기준으로 자산정보를 분배(분해)하는 방식으로 이루어진다. 그러나 읍면동 단위의 공간적인 범위는 상당한 면적의 공간적 경계이기 때문에, 이를 평균적인 밀도데이터로 분배 시 공간적인 자산분포에 대해 정밀도를 담보할 수 없다. 이에 본 연구는 행정구역경계인 "읍면동"과 비교할 때 평균적으로 1/30의 면적을 가지는 집계구 단위의 센서스 공간정보자료를 이용하여 방법론을 개선하였고, 이를 MD-FDA 분석체계를 근간으로 센서스자료와 관계된 자료들 간의 연계 및 전체적인 분석과정을 정립하였다. 본 연구에서 제안한 방법을 경기도 동두천시를 대상으로 적용하여 기존 방법에 의한 피해액과 그 차이를 비교하였고, 도로명전자지도의 실제 건물객체 자료(.shp)를 기준으로 오차율을 확인한 결과, 기존 방식에 비해 정밀도가 월등히 향상된 것을 확인할 수 있었다.

  • PDF