• 제목/요약/키워드: 통계데이터

검색결과 3,194건 처리시간 0.041초

국가 통계표준 메타데이터 설계에 관한 연구 (Construction of the Guidelines for National Statistical Metadata)

  • 남영준
    • 정보관리연구
    • /
    • 제36권1호
    • /
    • pp.33-56
    • /
    • 2005
  • 본 연구에서는 인터넷 상에서 국가 통계 데이터의 자유로운 활용과 공개를 위해 필요한 메타데이터 표준안을 제안하였다. 설계는 우리나라 통계조사보고서와 통계청 내부 확장 메타데이터 기준을 기반으로 국제기준에서 요구하는 최소한의 메타데이터 세트가 포함되도록 하였다. 그 결과, SDMX와 SDDS의 중복요소에서 29개의 항목을 채택하고, 더블린 코어에서 14개의 항목을 채택하여 최종적으로 43개로 이루어진 국가 통계표준 메타데이터를 완성하였다.

XML에 기반한 국가 통계 메타데이터 표준화 연구 (A study on statistical metadata of a Nation in XML base for standardization)

  • 하유정;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.203-208
    • /
    • 2004
  • 통계 데이터의 메타데이터에 대한 연구는 90년대 중반부터 각 나라에서 다양하게 이루어져 왔지만 아직 그 기준의 모호하다. 하지만 방대한 양의 데이터 관리와 자료의 활성화를 위한 방안으로 표준화를 위한 노력은 계속되고 있다. 여기서는 통계데이터를 위한 각 국가의 연구들을 조사하고 우리나라 통계청의 자료를 분석하여 통계 메타데이터 요소를 추출하였다. 본 연구는 이 요소들을 중심으로 XML 기반에서 DTD로 하나의 문서형태를 정의하여 우리나라 통계 데이터의 표준화를 위한 방안을 제시하고자 한다.

  • PDF

표준품질지수

  • 한근식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.41-48
    • /
    • 2004
  • 2002년 10월 유럽통계협회는 품질지수개발을 위해 협회소속국가들이 연합하여 특별연구팀을 발족시켰다. 이 팀의 주목적은 유럽통계협회에서 생산되는 자료의 품질을 측정하기 위해 대표성이 있으며, 계산하기 쉽고, 이해하기 쉬운 지수를 개발하는 것이었다. 유럽 통계협회는 연구팀에서 개발한 지수를 이용하여 내부품질보고서를 작성하도록 결정하였다. 개발된 풀질지수들은 유럽 통계협회 소속 국가에 의해 생산된 통계에 적용하기 적합해야하며 유럽전체를 위해 Eurostat 이 보유하고 있는 통계에도 적합해야한다. 그러므로 지수들은 각 국이 합의한 용어, 공식, 변수, 도메인, 분석의 정도를 고려하여 개발되도록 하였다. 이러한 지수는 정기적으로 생산되도록 규정하고 있으며 이 규정이 지켜지기 위해서는 동일한 변수, 공식 통이 적용되어야함은 물론이고 시계열의 유지를 위해 관련된 메타데이터가 제공되어야한다. 서로 다른 조사결과로부터 관련된 통계량의 측정과 개념들간의 차이를 확인하기 위해서 메타데이터는 반드시 필요하며 품질보고서가 있는 경우 많은 도움이 릴 것이다. 본 연구에서는 동계생산자의 관점에서 본 각각의 품질 요소에 따라서 생산된 다양한 통계의 풀질을 평가하기 위해서 개발된 일련의 표준화된 품질지수를 제시할 것이다. 각 지수들의 정의와 가장 대표적인 지수산출을 제안하고 지수산출을 위해 필요한 메타데이터를 선명한 것이다.

  • PDF

국가도서관통계시스템 활용 현황 분석 (An Analysis of National Library Statistics System Utilization)

  • 김선아
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2018년도 제25회 학술대회 논문집
    • /
    • pp.47-50
    • /
    • 2018
  • 2008년 도서관분야 국가승인통계 생성과 더불어 국가도서관통계시스템이 구축되었다. 본 연구는 국가도서관통계시스템 구축 이후 10년을 맞이하여 도서관통계데이터를 제공하는 국가도서관통계시스템이 도서관 정책 및 연구의 기초자료로 활용된 사례를 분석하였다. 데이터 수집은 한국한술지인용색인(KCI) 및 온-나라정책연구(PRISM)를 활용하여 2008년~2018년도에 발행된 학회지와 정책연구를 대상으로 하였다. 해당 데이터는 국가도서관통계시스템을 참고한 논문 95건, 정책연구보고서 39건이다.

  • PDF

웹 로그(WEB LOG) 데이터 분석 방법에 관한 연구 (Web Log Data Analysis)

  • 김석기;안정용;한경수
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.261-271
    • /
    • 2001
  • 정보 공유와 비즈니스 수행 등의 매체로서 World Wide Web의 이용이 보편화됨에 따라 다양하고 방대한 데이터를 웹을 통하여 얻을 수 있게 되었으며, 이러한 데이터로부터 유용한 정보를 추출하기 위한 데이터 분석과 활용은 많은 분야에서 중요한 사안으로 인식되고 있다. 본 연구에서는 웹 로그(web log)데이터로부터 정보를 추출하기 위한 과정 및 방안에 대해 살펴보고자 한다. 로그 데이터의 특징과 통계 데이터와의 차이점, 데이터 수집 및 사전 처리 과정, 추출할 수 있는 정보 및 분석 방법 등을 제시하고 로그 데이터 분석 예제를 제시한다.

  • PDF

빅데이터 통계그래픽스의 유형 및 특정 - 인지적 방해요소를 중심으로 - (The types and characteristics of statistical big-data graphics with emphasis on the cognitive discouragements)

  • 심미희;류시천
    • 스마트미디어저널
    • /
    • 제3권3호
    • /
    • pp.26-35
    • /
    • 2014
  • 통계그래픽스는 정량적인 데이터를 이용하여 정보 분석, 추출, 시각화의 과정을 거쳐 정확한 정보전달과 효과적인 이해를 위해 사용자 인지측면에 초점을 둔 디자인 분야이다. 이러한 통제그래픽스에 빅데이터의 구성요소들 내포하게 될 경우 빅데이터 통제그래픽스라고 할 수 있다. 통계그래픽스에서 시각적 요소는 인지부분에 대한 오류를 줄이고 성공적으로 정보를 전달하기 위해 사용되어야 하지만, 빅데이터 통계그래픽스에서는 방대한 데이터로 인해 시각적 요소가 오히려 인지적 방해를 일으키고 있다. 본 연구는 빅데이터 통계 그래픽스에서 나타날 수 있는 인지적 방해요소를 도출하여 제시하는 것을 목적으로 한다. 빅데이터의 통계그래픽스의 유형을 구조적 형태를 바탕으로 '네트워크 유형', '세그먼트 유형', '혼합유형' 세 가지로 분류하였고, 그에 따른 특징들을 탐색하였다. 특히, 빅데이터 통계그래픽스에서 시각적 주요요소를 기반으로 시각화의 고도화 시 나타날 수 있는 인지적 방해요소를 '다차원 범례', '다양한 색채', '정보의 중첩', '서체의 가독성' 네 가지로 도출하여 제시하였다.

출판사 생성 이용통계 데이터의 품질 평가에 대한 연구 (Evaluation on Quality of Publisher-Generated Usage Statistics)

  • 정영임
    • 정보관리연구
    • /
    • 제43권3호
    • /
    • pp.161-180
    • /
    • 2012
  • 본 논문에서는 최근 연구가 활성화되고 있는 전자저널 이용통계의 개념과 필요성에 대해 알아보고 COUNTER 그룹에 의해 진행 중인 이용 지수 프로젝트(Journal Usage Factor Project)의 동향을 파악하였다. 또 생성 주체별 이용통계 데이터가 가지는 장점 및 한계점을 살펴보았고, 31개 출판사의 실제 이용통계 데이터를 분석하여 다양한 오류와 문제 유형을 발견함으로써 출판사 생성 이용통계 데이터의 품질이 완전히 신뢰할만한 수준이 아님을 지적하였다.

웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구 (Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites)

  • 오정선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.161-179
    • /
    • 2007
  • 디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다. 일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, http://www.bls.gov/) 및 the Energy Information Administration (EIA, http://eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어, 이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

지리정보를 갖는 통계 데이터의 Visualization

  • 이정진
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.27-29
    • /
    • 2003
  • 정보화시대의 발전과 더불어 우리 일상생활에 친숙하게 다가온 기술 중의 하나가 지리정보시스템(Geographical Information System: GIS)이다. GIS는 공간(지표, 지하, 해양 등)상에 분포하고 있는 정보에 대해 여러 종류의 세밀한 지도를 이용하여 효율적으로 사용자에게 제공하여 관리하는 종합정보기술이다. 통계 데이터 중에는 지리정보를 가지고 있는 경우가 상당히 많다. 하지만 지리정보를 갖는 통계 데이터의 탐색적 자료분석(Exploratory Data Analysis)을 위한 Visualization 기법에 대해서는 별로 연구된 바가 없다. 본 논문에서는 GIS를 위한 벡터맵(vector map)의 간단한 제작방법과 GIS의 개발방법, 그리고 탐색적 자료분석을 위한 Visualization기법을 소개한다.

  • PDF

인적 모델 개발에 필요한 통계 데이터 고찰 (Review On the Statistical Data to Implement Human Model)

  • 조수산;장은진;임정빈
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 추계학술대회
    • /
    • pp.193-195
    • /
    • 2015
  • 해양사고 원인의 70 % 이상을 차지하는 인적오류 예방은 해양안전에 가장 중요한 이슈이다. 인적오류는 확률기반의 인적 모델을 구축하여 평가함으로써 예상되는 위기의 수준을 과학적으로 예측할 수 있다. 확률기반 인적 모델을 구축하기 위해서는 사건의 원인과 결과 사이에 연계성을 갖고 있는 통계 데이터가 필요하다. 본 연구에서는 이러한 연계 데이터 확보를 위한 것으로, 해양안전심판원의 통계 데이터 사이의 연계성 확보 방안을 주로 검토하였다. 그리고 이러한 통계 데이터를 인적 모델에 적용하는 방법과 전략도 검토하였다. 인적 모델은 회사, 선박, 해기사 관련 요소들이 총체적으로 반영될 필요가 있음을 알았고, 이러한 세 가지 요소로 구성된 통합 모델을 설계하기 위한 방안도 검토하였다. 특히, 각 요소들에 포함될 데이터 사이의 연계성 확보를 위해서 해양사고 연계 체인(Chain)을 도입하였다. 확보한 데이터는 사고의 가장 근본원인인 Hazard부터 사고의 영향을 나타내는 Impact까지의 6 단계 분석 방법을 적용하여 통계 데이터에 결합되어 있는 원인과 결과 사이의 연계성을 확보할 수 있는 방안을 수립하였다. 본 연구는 중장기적으로 추진할 과제이기 때문에 향후 본 연구 내용을 토대로 인적 모델을 개발하여 해양사고 예방에 적극 기여하고자 한다.

  • PDF