• Title/Summary/Keyword: 통계데이터

검색결과 3,194건 처리시간 0.033초

공공도서관 통계지표 항목 설정의 개선방향에 관한 연구 (A Study on the Improvement in Statistical Indicator of Public Library)

  • 조현양;김홍렬
    • 한국도서관정보학회지
    • /
    • 제43권4호
    • /
    • pp.427-450
    • /
    • 2012
  • 통계지표(statistical indicator)는 특정 시간이나 장소, 그리고 기타 특정 사항에 대한 통계 데이터를 표현할 수 있도록 지정된 데이터 요소로 정의하고 있다. 2008년부터 전국도서관통계시스템에서 사용하고 있는 현행 조사지표는 실제 도서관 현장에서 일상적인 업무성과의 기록을 통하여 수집되는 지표와는 다소 차이가 있어 사서들의 통계작성 시 정확한 데이터의 산출을 위한 별도의 노력과 인위적으로 데이터를 재구성하는 업무가 요구되고 있다. 본 연구는 현재의 공공도서관 통계지표와 관련한 각종 법률, 도서관기준, 통계지표를 면밀히 조사 분석하고, 공동도서관의 통계조사 응답률 등을 분석하여 공공도서관의 특성을 반영한 새로운 통계지표의 개발하기 위한 방향을 제시하고자 한다. 이러한 연구결과는 공공도서관의 통계지표는 작성된 통계의 품질을 보증할 수 있는 다양한 요소 즉, 이용자 요구의 충족, 정확한 통계의 생산, 시의성과 정시성의 보장, 일관성, 접근성 등을 유지할 수 있는 통계를 생성할 수 있는 지표로 활용할 수 있을 것이다.

통계 패키지에서의 데이터 접근 방식 비교 (Comparing Data Access Methods in Statistical Packages)

  • 강근석
    • Communications for Statistical Applications and Methods
    • /
    • 제16권3호
    • /
    • pp.437-447
    • /
    • 2009
  • 최근에 산업현장에서의 통계전문가들에게는 여러 가지 통계분석기법을 사용한 자료 분석 외에 다양한 형태의 자료 저장장치에서 추출 또는 생성의 과정을 거쳐 분석 목적에 적합한 자료를 구성해야하는 문제에 많이 부닥치고 있다. 본 논문에서는 현재 일반적으로 사용되고 있는 여러 통계 패키지들에서 제공하고 있는 데이터 접근방식을 살펴보고 각 기능들을 비교 분석하고자 한다. 이들 방식에 대한 정확한 이해는 특히 데이터마이닝 등 대용량의 자료를 분석하고자 할 때 데이터 처리과정에서의 어려움으로 발생하는 비용과 시간을 감소시켜주어 통계전문가들이 통계분석에 더욱 많은 작업을 할애할 수 있도록 해줄 것이다.

빅데이터와 통계학 (Big data and statistics)

  • 김용대;조광현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권5호
    • /
    • pp.959-974
    • /
    • 2013
  • 빅데이터 시대를 맞이하여 통계학과 통계학자의 역할에 대하여 살펴본다. 빅데이터에 대한 정의 및 응용분야를 살펴보고, 빅데이터 자료의 통계학적 특징들 및 이와 관련한 통계학적 의의에 대해서 설명한다. 빅데이터 자료 분석에 유용하게 사용되는 통계적 방법론들에 대해서 살펴보고, 국외와 국내의 빅데이터 관련 프로젝트를 소개한다.

동형암호를 이용한 대용량 데이터의 통계 분석 방법 (Statistical analysis method of large data using homomorphic encryption)

  • 강동우;원동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.225-228
    • /
    • 2021
  • 동형암호를 이용한 통계 분석은 기존의 개인정보보호 문제로 수행할 수 없었던 데이터에 대해서 통계분석이 가능하게 만든다. 본 논문에서는 대용량 데이터에 사용되는 대표적 통계 수치인 평균, 분산, 왜도, 첨도를 병렬처리를 사용하여 구하는 방법을 제안한다. 또한, 연산이 비교적 제한적인 동형암호에서도 통계적 수치를 구하기 위하여 동형암호문끼리의 뺄셈, 나눗셈, 제곱근 연산을 제안한다. 이를 통해, 분산된 대용량 데이터에 대해서도 동형암호를 통해 다양한 통계 연산이 가능할 것으로 기대된다.

온라인 빅 데이터 분석 결과와 상수도 통계 비교를 통한 데이터 가치 추출 (Data value extraction through comparison of online big data analysis results and water supply statistics)

  • 홍성진;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.431-431
    • /
    • 2021
  • 4차 산업혁명의 도래로 사회기반시설물의 계획 및 운영관리에 있어 데이터 분석을 통한 가치추출에 대한 관심은 매우 높은 상황이다. 데이터의 가용성과 접근성, 정부 지원 등을 평가하는 공공데이터 개방지수에서 한국은 1점 만점에 0.93점을 획득하여 경제협력개발기구 회원국 중 1위(2019년 기준)를 할 정도로 매우 높은 수준(평균 0.60점)이다. 그러나 공식적으로 발표 및 배포되는 사회기반시설물 관련 정보와 심도 있는 연구 분석이 필요한 정보는 접근이 여전히 제한적이라 할 수 있다. 특히 대표적인 사회기반시설물인 상수도시스템은 대부분 국가중요시설로 지정되어 있어 다양한 정보를 획득하고 분석하는데 제약이 존재하며, 관련 국가통계인 상수도통계에서는 누수사고 등과 같은 비정상적 상황에 대한 사고지점, 원인 등과 같은 세부정보는 제공하고 있지 않다. 본 연구에서는 웹크롤링 및 빅데이터 분석기술을 활용하여 과거 일정기간 발생한 지자체의 상수도 누수사고 관련 뉴스를 전수조사하고 도출된 사고건수를 국가 공인 정보인 상수도통계자료와 비교·분석하였다. 독립적인 누수사고 기사를 추출하기 위해서 중복기사의 제거, 누수 관련 키워드 정립, 상수도분야 이외의 관련기사 제거 등의 절차가 필요하며, 이와 같은 기법은 R프로그래밍을 통해 구현되었다. 추가적으로 뉴스기사의 자연어 처리기반 정보추출기법을 통해 누수사고 건수 뿐만 아니라 사고발생일, 위치, 원인, 피해정도, 그리고 대상 관로의 크기 등을 획득하여 상수도 통계에서 제시하고 있는 정보보다 많은 가치를 추출하여 연계할 수 있는 방안을 제시하였다. 제시된 방법론을 국내 A광역시에 적용하여 누수사고 건수를 비교한 결과 상수도통계에서 제시하고 있는 누수발생건수와 유사한 규모의 사고건수를 뉴스기사분석을 통해 도출할 수 있었다. 제안된 방법론은 추가적인 정보의 추출이 가능하다는 점에서 향후 활용성이 높을 것으로 기대된다.

  • PDF

우리나라 경제통계 시각화의 현황과 과제 (Visualizing Korean economic statistics)

  • 이긍희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1313-1325
    • /
    • 2017
  • GDP, 소비자물가, 국세수지, 실업률 등 경제통계는 시간에 따라 주기적으로 측정되고 있다. 또한 경제통계는 산업, 상품, 지역 등의 분류에 따라 측정된다. 우리의 관심은 경제통계가 시간에 따라 어떤 패턴으로 움직이고, 현시점에서 경제통계는 어떻게 구성되어 있으며, 다른 나라 또는 지역과는 어떤 차이가 있는지 살펴보는 것이다. 통계청, 한국은행 등 통계작성 기관은 보도자료와 웹 등에서 경제통계를 시각화하여 경제통계에 대한 이용자 측면의 편의성을 높이고 있다. 본 연구에서는 통계청, 한국은행의 경제통계 시각화를 검토 정리한 후 언론 등의 경제통계 시각화 결과를 참고하여 향후 경제통계 시각화의 과제를 정리하였다.

데이터웨어하우징

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 9호통권64호
    • /
    • pp.60-62
    • /
    • 1998
  • 한국오라클은 최근 자사의 데이터 웨어하우스 솔루션을 이용해 보험개발원의 보험통계 시스템을 구축했다. 이를 통해 보험개발원은 다차원적 통계분석, 전략적 의사결정 지원 등 데이터의 전사적 관리가 가능하게 되었다. 보험개발원의 데이터 웨어하우스의 도입배경, 구축과정, 시스템 구성, 구축효과에 대해 살펴봤다.

  • PDF

마이크로데이터 제공과 통계적 노출조절기법 (Release of Microdata and Statistical Disclosure Control Techniques)

  • 김규성
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.1-11
    • /
    • 2009
  • 마이크로데이터를 이용자에게 제공하면 레코드 단위의 데이터가 노출되고 응답자의 정보 노출위험이 불가피하다. 통계적 노출조절기법은 통계데이터 제공시 노출위험을 줄이면서 데이터 유용성을 높이기 위한 통계적 기법이다. 본 논문에서는 노출과 노출위험, 그리고 통계적 노출조절기법을 고찰하였고 데이터 유용성과 연관하여 노출조절기법 선택 전략을 살펴보았으며, '위험-유용성 경계 지도' 방법의 예를 알아보았다. 마지막으로 마이크로데이터를 이용자에게 제공할 때 단계별로 검토할 사항을 알아보았다.

통계계산분야의 현재와 미래

  • 김병천
    • Journal of the Korean Statistical Society
    • /
    • 제20권
    • /
    • pp.105-110
    • /
    • 1991
  • 통계계산, Statistical Computing, 또는 Numerical Computation for Statistics라고 불리우는 통계의 한 분야는 컴퓨터 산업에 의한 제3의 산업혁명이 일고 있는 현대에서 매우 중요한 위치를 차지하고 있음은 두말 할 것도 없다. 특히 통계학이 컴퓨터가 발전하면서 더욱 더 학문적 발전에 박차를 가하고 있다는 것도 의심할 여지가 없다. 통계가 다루는 데이터는 적은 양으로부터 방대한 양을 다루고 있기 때문에 컴퓨터는 필수불가결한 파트너가 되었다. 1980년 초반에 16비트 컴퓨터가 개발되면서, 통계를 처리하는 장소가 전자계산소로부터 사무실로 옮겨 오기 시작했고, 최근에는 70MIPS이상의 속도를 갖고 있는 탁상용 Workstation이 개발되어 통계학자들의 마음을 설레게 하고 있다. 또한 대량의 데이터를 저장할 수 있는 Laser Compact Disk들이 개발되어 통계분야 및 통계계산분야의 발전에 기대가 더 모아지게 되었다. 그러면 컴퓨터가 발전되고 있는데 왜 통계계산분야의 발전이 필요하며, 현재까지 통계계산분야는 어느 단계까지 와 있으며, 미래를 위한 통계계산분야는 어떻게 변화할 것인지를 한국의 실정에 기초를 두고 논해 보고자 한다.

  • PDF

가이드 맵과 인터랙티브 시각화를 이용한 의료 통계분석 시스템 (A System for Medical Statistical Analysis Using Guide Maps and Interactive Visualization)

  • 이돈수;최수미
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.1000-1011
    • /
    • 2005
  • 본 논문에서는 통계에 대한 지식이 부족한 임상 의학자들이 보다 쉽고 정확하게 데이터를 분석할 수 있도록 표본 데이터의 분포에 따라 적절한 분석 방법을 제시해주고, 분석 과정을 아이콘들의 트리로 구성한 가이드맵을 제공하는 의료 통계분석 시스템을 개발하였다. 개 발 시스템은 일반적으로 활용되는 통계 방법, 반복측정자료에 활용되는 통계 방법, 생존분석 등 의료 분야에서 자주 사용되는 분석법들을 포함하고 있다. 또한 3차원 글리프를 이용하여 결과를 인터랙티브하게 보여주고, 불확실성을 시각화함으로써 분석된 결과를 더욱 쉽게 이해할 수 있도록 하였다.

  • PDF