• Title/Summary/Keyword: 통계데이터

Search Result 3,229, Processing Time 0.03 seconds

A Study on the Improvement in Statistical Indicator of Public Library (공공도서관 통계지표 항목 설정의 개선방향에 관한 연구)

  • Cho, Hyun-Yang;Kim, Hong-Ryul
    • Journal of Korean Library and Information Science Society
    • /
    • v.43 no.4
    • /
    • pp.427-450
    • /
    • 2012
  • This study was to propose an improvement direction in statistical indicators of public libraries to collect objective data from such libraries. This improvement direction was made by deriving from countable factors at the library. These were selected from various parts of the library sectors, such as the library-related laws, public library standard of our country, and statistical indicators of IFLA and other major countries. Also The these statistical indicator was compared to the current statistical indicator of public library in Korea. The results will be able to develop new draft of statistical indicator, which can be used in understanding the present situation of public libraries.

Comparing Data Access Methods in Statistical Packages (통계 패키지에서의 데이터 접근 방식 비교)

  • Kang, Gun-Seog
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.3
    • /
    • pp.437-447
    • /
    • 2009
  • Recently, in addition to analyzing data with appropriate statistical methods, statistical analysts in the industrial fields face difficulties that they have to compose proper datasets for analysis objectives via extracting or generating processes from diverse data storage devices. In this paper we survey and compare many state-of-the-art data access technologies adopted by several commonly used statistical packages. More understanding of these technologies will help to reduce the costs occurring when analyzing large size of datasets in especially data mining works, and so to allow more time in applying statistical analysis methods.

Big data and statistics (빅데이터와 통계학)

  • Kim, Yongdai;Cho, Kwang Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.5
    • /
    • pp.959-974
    • /
    • 2013
  • We investigate the roles of statistics and statisticians in the big data era. Definition and application areas of big data are reviewed and statistical characteristics of big data and their meanings are discussed. Various statistical methodologies applicable to big data analysis are illustrated, and two real big data projects are explained.

Statistical analysis method of large data using homomorphic encryption (동형암호를 이용한 대용량 데이터의 통계 분석 방법)

  • Kang, Dongwoo;Won, Dongho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.225-228
    • /
    • 2021
  • 동형암호를 이용한 통계 분석은 기존의 개인정보보호 문제로 수행할 수 없었던 데이터에 대해서 통계분석이 가능하게 만든다. 본 논문에서는 대용량 데이터에 사용되는 대표적 통계 수치인 평균, 분산, 왜도, 첨도를 병렬처리를 사용하여 구하는 방법을 제안한다. 또한, 연산이 비교적 제한적인 동형암호에서도 통계적 수치를 구하기 위하여 동형암호문끼리의 뺄셈, 나눗셈, 제곱근 연산을 제안한다. 이를 통해, 분산된 대용량 데이터에 대해서도 동형암호를 통해 다양한 통계 연산이 가능할 것으로 기대된다.

Data value extraction through comparison of online big data analysis results and water supply statistics (온라인 빅 데이터 분석 결과와 상수도 통계 비교를 통한 데이터 가치 추출)

  • Hong, Sungjin;Yoo, Do Guen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.431-431
    • /
    • 2021
  • 4차 산업혁명의 도래로 사회기반시설물의 계획 및 운영관리에 있어 데이터 분석을 통한 가치추출에 대한 관심은 매우 높은 상황이다. 데이터의 가용성과 접근성, 정부 지원 등을 평가하는 공공데이터 개방지수에서 한국은 1점 만점에 0.93점을 획득하여 경제협력개발기구 회원국 중 1위(2019년 기준)를 할 정도로 매우 높은 수준(평균 0.60점)이다. 그러나 공식적으로 발표 및 배포되는 사회기반시설물 관련 정보와 심도 있는 연구 분석이 필요한 정보는 접근이 여전히 제한적이라 할 수 있다. 특히 대표적인 사회기반시설물인 상수도시스템은 대부분 국가중요시설로 지정되어 있어 다양한 정보를 획득하고 분석하는데 제약이 존재하며, 관련 국가통계인 상수도통계에서는 누수사고 등과 같은 비정상적 상황에 대한 사고지점, 원인 등과 같은 세부정보는 제공하고 있지 않다. 본 연구에서는 웹크롤링 및 빅데이터 분석기술을 활용하여 과거 일정기간 발생한 지자체의 상수도 누수사고 관련 뉴스를 전수조사하고 도출된 사고건수를 국가 공인 정보인 상수도통계자료와 비교·분석하였다. 독립적인 누수사고 기사를 추출하기 위해서 중복기사의 제거, 누수 관련 키워드 정립, 상수도분야 이외의 관련기사 제거 등의 절차가 필요하며, 이와 같은 기법은 R프로그래밍을 통해 구현되었다. 추가적으로 뉴스기사의 자연어 처리기반 정보추출기법을 통해 누수사고 건수 뿐만 아니라 사고발생일, 위치, 원인, 피해정도, 그리고 대상 관로의 크기 등을 획득하여 상수도 통계에서 제시하고 있는 정보보다 많은 가치를 추출하여 연계할 수 있는 방안을 제시하였다. 제시된 방법론을 국내 A광역시에 적용하여 누수사고 건수를 비교한 결과 상수도통계에서 제시하고 있는 누수발생건수와 유사한 규모의 사고건수를 뉴스기사분석을 통해 도출할 수 있었다. 제안된 방법론은 추가적인 정보의 추출이 가능하다는 점에서 향후 활용성이 높을 것으로 기대된다.

  • PDF

Visualizing Korean economic statistics (우리나라 경제통계 시각화의 현황과 과제)

  • Lee, Geung-Hee
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.6
    • /
    • pp.1313-1325
    • /
    • 2017
  • Economic statistics such as GDP, consumer prices, balance of payments, and unemployment rates are regularly measured over time. One of the best way to understand economic statistics is to visualize economic statistics as a picture. This makes it easier to grasp patterns of economic statistics and to communicate with users. The web technologies and the visualization tools make it possible to create dynamic and interactive visualization of economic statistics. Statistics Korea and the Bank of Korea provide various data visualization relating to official statistics such as infographics and dynamic charts. This paper presents an overview of visualization of Statistics Korea and the Bank of Korea. It also discusses a future direction to explore the visualization of Korean economic statistics.

데이터웨어하우징

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.9 s.64
    • /
    • pp.60-62
    • /
    • 1998
  • 한국오라클은 최근 자사의 데이터 웨어하우스 솔루션을 이용해 보험개발원의 보험통계 시스템을 구축했다. 이를 통해 보험개발원은 다차원적 통계분석, 전략적 의사결정 지원 등 데이터의 전사적 관리가 가능하게 되었다. 보험개발원의 데이터 웨어하우스의 도입배경, 구축과정, 시스템 구성, 구축효과에 대해 살펴봤다.

  • PDF

Release of Microdata and Statistical Disclosure Control Techniques (마이크로데이터 제공과 통계적 노출조절기법)

  • Kim, Kyu-Seong
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.1
    • /
    • pp.1-11
    • /
    • 2009
  • When micro data are released to users, record by record data are disclosed and the disclosure risk of respondent's information is inevitable. Statistical disclosure control techniques are statistical tools to reduce the risk of disclosure as well as to increase data utility in case of data release. In this paper, we reviewed the concept of disclosure and disclosure risk as well as statistical disclosure control techniques and then investigated selection strategies of a statistical disclosure control technique related with data utility. The risk-utility frontier map method was illustrated as an example. Finally, we listed some check points at each step when microdata are released.

통계계산분야의 현재와 미래

  • 김병천
    • Journal of the Korean Statistical Society
    • /
    • v.20
    • /
    • pp.105-110
    • /
    • 1991
  • 통계계산, Statistical Computing, 또는 Numerical Computation for Statistics라고 불리우는 통계의 한 분야는 컴퓨터 산업에 의한 제3의 산업혁명이 일고 있는 현대에서 매우 중요한 위치를 차지하고 있음은 두말 할 것도 없다. 특히 통계학이 컴퓨터가 발전하면서 더욱 더 학문적 발전에 박차를 가하고 있다는 것도 의심할 여지가 없다. 통계가 다루는 데이터는 적은 양으로부터 방대한 양을 다루고 있기 때문에 컴퓨터는 필수불가결한 파트너가 되었다. 1980년 초반에 16비트 컴퓨터가 개발되면서, 통계를 처리하는 장소가 전자계산소로부터 사무실로 옮겨 오기 시작했고, 최근에는 70MIPS이상의 속도를 갖고 있는 탁상용 Workstation이 개발되어 통계학자들의 마음을 설레게 하고 있다. 또한 대량의 데이터를 저장할 수 있는 Laser Compact Disk들이 개발되어 통계분야 및 통계계산분야의 발전에 기대가 더 모아지게 되었다. 그러면 컴퓨터가 발전되고 있는데 왜 통계계산분야의 발전이 필요하며, 현재까지 통계계산분야는 어느 단계까지 와 있으며, 미래를 위한 통계계산분야는 어떻게 변화할 것인지를 한국의 실정에 기초를 두고 논해 보고자 한다.

  • PDF

A System for Medical Statistical Analysis Using Guide Maps and Interactive Visualization (가이드 맵과 인터랙티브 시각화를 이용한 의료 통계분석 시스템)

  • Lee Don-Soo;Choi Soo-Mi
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.7
    • /
    • pp.1000-1011
    • /
    • 2005
  • This paper presents a system for medical statistical analysis that helps medical professionals analyze clinical data more easily and accurately. It is able to recommend proper methods according to the distribution of sample data, and provides guide maps composed of icons for the understanding of the process of analysis. Besides general statistical analysis, it includes commonly-used statistical methods for medical fields, such as survival analysis and methods for repetitive measurements. The results of analysis are interactively displayed by 3D glyph-based visualization with uncertainty.

  • PDF