• Title/Summary/Keyword: 통계데이터

Search Result 3,251, Processing Time 0.037 seconds

The Privacy Safety of Public Data: A Case Study on Medical Statistics HIRA-NPS 2011 (공개 데이터의 프라이버시 안전성: 진료정보 통계자료 HIRA-NPS 2011 사례 분석)

  • Kim, Soohyung;Chung, Yon Dohn;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.786-789
    • /
    • 2013
  • 개인정보가 포함된 데이터가 많은 기관에서 다양한 목적을 위해 배포되고 있다. 이러한 공개 데이터는 프라이버시 문제를 야기할 수 있기 때문에, 배포에 앞서 항상 데이터에 대한 프라이버시 보호가 고려되어야 한다. 그러나 현재 배포되는 많은 데이터는 충분하지 못한 프라이버시 보호 과정을 거쳐 배포되고 있다. 이 논문에서는 개인정보를 포함하는 데이터의 프라이버시 안전성을 분석한다. 이를 위해 우리는 건강보험심사평가원에서 배포한 2011년 진료정보 통계자료(HIRA-NPS)를 실험에 사용한다. 분석을 위해 기존에 널리 쓰이는 프라이버시 보호 모델 k-익명성(k-anonymity)과 l-다양성(l-diversity)을 차용하여 안전성 판단의 척도를 정의한다. 또한 실제 데이터에 이 척도를 적용하여 프라이버시 안전성을 측정하고, 그 결과가 갖는 의미를 분석한다.

GIS를 이용한 교통망상 시간거리 지도화 방법 및 접근성의 구조 분석

  • Kim, So-Yeon;Lee, Geum-Suk
    • Proceedings of the Conference
    • /
    • 2005.12a
    • /
    • pp.40-47
    • /
    • 2005
  • 카토그램(Cartogram)은 통계데이터를 이용하여 지리공간에 나타나는 현상을 효과적으로 표현하는 방법 중 하나이다. 카토그램이란 넓은 의미에서 모든 통계지도를 포함하지만, 좁은 의미에서 지도의 변형을 통해 통계데이터의 특징을 표현하는 시각화 방법을 의미한다. 이 연구에서는 후자의 의미에서 카토그램이란 용어를 사용하였으며, 우리나라를 대상으로 절대적 공간을 시간거리 접근성에 의한 공간 카토그램으로 재구성하여 지도화하고, 변화된 공간패턴을 분석하고자 하였다. 카토그램은 특정한 목적을 위해 기본도의 형상이나 지역간의 연속성을 강조시켜서 만든 변형된 지도의 일종으로 전통적인 지도와는 매우 다른 이미지를 주게 되지만, 표현하고자 하는 현상의 공간적 구조를 매우 효과적으로 나타낼 수 있다.

  • PDF

A Research for Efficient Use of Statistics in National Education Information System (교육행정정보시스템(NEIS) 통계자료의 효율적 활용을 위한 방안 연구)

  • Son, Ji-Seong;Na, Hong-Seok;Kim, Chang-Heon;Baik, Doo-Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.439-442
    • /
    • 2010
  • 교육행정정보시스템에서 제공하는 통계자료는 광범위한 데이터를 기반으로 학교행정 지원 및 교육 정책 수립의 기초가 되는 자료로 중요한 역할을 하지만, 고도화된 설계 과정 없이 행정정보처리 수준에서 제공되는 경우가 많아 일선업무에 적극적으로 활용되지 못하고 있다. 본 연구에서는 교육행정정보시스템 내에서 제공되는 각종 통계자료에 대한 현황 분석과 함께 활용 방안에 대한 요구분석을 진행하였으며, 이를 기반으로 통계자료의 효과적인 활용을 위한 제도적, 정책적 측면의 개선 방안을 도출하였다. 연구의 결과가 교육행정정보시스템에서 처리되는 데이터에 대한 전반적인 만족도 및 개선방안 수립에 도움이 될 것으로 기대한다.

  • PDF

Development of Compensation Statistic System Based on Dashboard for Smart Work (스마트 워크를 위한 대시보드 기반의 보상 통계시스템 개발)

  • Seo, Myoung-Bae;Kim, Nam-Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.789-791
    • /
    • 2013
  • 보상업무를 수행하는 기관에서 정기 또는 비정기적으로 발생하는 각종 보고나 통계에 활용되는 자료들을 쉽게 작성하고 이러한 자료를 단순 보고자료에서 의사결정 자료로 확장시켜 스마트 워크에 활용하기 위해 시각적인 효과를 극대화시킨 대시보드 기반의 보상통계시스템 구축사례를 제시하였다. 이를 위해 국토해양부, 감사원, 국회 등에 제출하는 다양한 보고자료들을 분석하여 통계항목을 구성하였고 대용량 데이터를 신속하게 조회하기 위해 모델마트를 활용하였으며 플래시 기반의 비쥬얼 박스 등을 활용하여 시각적이며 직관적인 통계화면을 구성하였다. 또한, 기능구성시 관리자와 보상담당자가 활용하는 화면을 별도로 구성하여 맞춤형 서비스를 제공하였고 플래시 기반의 지도를 활용하여 화면상의 데이터가 상호 연동이 가능하도록 구성하였다.

A Factor Analysis and Regression-Based Prediction Model of Security Deposit Scam Amount for Preventing Rental Scam (부동산 전세사기 예방을 위한 요인 분석 및 회귀 분석 기반 전세보증사고 금액 예측 모델)

  • Seo Jung Ha;Se Hyeon Oh;Soh Jung Ban;Ji Youn Lee;Hyon Hee Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.554-555
    • /
    • 2024
  • 전세 사기로 인한 피해가 해마다 증가하고 있다. 본 연구에서는 부동산 가격과 대출 데이터를 통해 전세 사기의 원인을 분석하고, 이에 대한 대처방안을 제시하였다. 데이터 분석 결과, 주택 가격의 상승과 부동산 정책의 변화가 전세사기에 주요한 영향을 미친다는 것과, 전세사기 사건 수와 부동산 가격 상승 사이에 높은 상관관계가 나타남을 확인했다. 또한, 회귀분석을 사용하여 연도에 따른 전세보증사고 금액 예측 모델을 구축하였다. 이를 토대로 부동산 시장 안정화와 함께 개인 및 정부 차원의 협력이 강화된다면 전세사기 피해를 줄일 수 있을 것이라 기대된다.

Efficient Sensor Middleware Architecture on Multi Level Spatial DBMS with Snapshot (스냅샷을 사용하는 다중 레벨 공간 DBMS를 가지는 효율적인 센서 미들웨어 구조 설계)

  • Oh Eun-Seog;Kim Ho-Seog;Bae Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.19-22
    • /
    • 2006
  • 최근 들어, 모든 장소에 컴퓨터가 있고 그것을 누구나 자유롭게 사용할 수 있는 인간 중심 유비쿼터스 환경에 대한 연구가 활발하게 진행되고 있다. 그러나 이러한 컴퓨팅 환경에서의 센서 미들웨어들은 연속적인 스트림 데이터 처리에 대한 막대한 비용을 줄이기 위해서 분석이 끝난 스트림 데이터를 삭제한다. 따라서 사용자의 서비스에 삭제된 스트림 데이터가 요구될 경우, 또는 과거 데이터들에 대한 확률 통계 정보가 요구될 경우, 이에 대한 서비스를 사용자에게 제공할 수 없다. 본 논문에서는 이러한 미들웨어에서의 스트림 데이터 재사용 문제를 해결하기 위해서 스냅샷을 가지는 다중 레벨 공간 DBMS를 기반으로 하는 효율적인 센서 데이터 미들웨어 구조를 설계하였다. 본 시스템은 사용자에게 재사용될 가치가 높은 스트림 데이터들을 다중 레벨 공간 DBMS 의 디스크 데이터베이스에서 관리한다. 또한 빈번한 서비스를 가지는 스트림 데이터의 경우 해당 스트림 데이터를 메모리 데이터베이스에 관리함으로서 사용자에게 신속한 서비스를 제공한다. 본 시스템은 기존의 미들웨어에서 지원할 수 없었던 동일한 스트림 데이터에 대한 빈번한 요청, 또는 확률이나 통계 자료와 같은 데이터 서비스 요청 문제들을 해결하였다. 그리고 메인 메모리 데이터베이스에 스냅샷 형태로 저장되는 스트림 데이터의 높은 데이터 재사용성을 유지함으로서, 사용자에게 지속적으로 정확하고 신속한 데이터 서비스를 제공한다.

  • PDF

Data Collection and Management on the World Wide Web : Evaluating system for Lecture (웹을 이요한 데이터 수집 및 관리에 관한 연구 : 강의평가 시스템 구현)

  • 안정용;최승현;한경수
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.2
    • /
    • pp.287-296
    • /
    • 2000
  • Data collection, management, and analysis to furnish information are very important in these modern days. In this paper, we discuss the methods of data collection and management on the World Wide \Veb and introduce an evaluating system for lecture.

  • PDF

데이터 마이닝에서 배깅과 부스팅 알고리즘 비교 분석

  • Lee, Yeong-Seop;O, Hyeon-Jeong
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.97-102
    • /
    • 2003
  • 데이터 마이닝의 여러 기법중 모형의 변동성을 줄이고 정확도가 높은 분류자를 형성하기 위하여 다양한 앙상블 기법이 연구되고 있다. 그 중에서 배깅과 부스팅 방법이 가장 널리 알려져 있다. 여러 가지 데이터에 이 두 방법을 적용하여 오분류율을 구하여 비교한 후 각 데이터 특성을 입력변수로 하고 배깅과 부스팅 중 더 낮은 오분류율을 갖는 알고리즘을 목표변수로 하여 의사결정나무를 형성하였다. 이를 통해서 배깅과 부스팅 알고리즘이 어떠한 데이터 특성의 패턴이 존재하는지 분석한 결과 부스팅 알고리즘은 관측치, 입력변수, 목표변수 수가 큰 것이 적합하고 반면에 배깅 알고리즘은 관측치, 입력변수, 목표변수 수의크기가 작은 것이 적합함을 알 수 있었다.

  • PDF

Building a computing infrastructure in the era of data science (데이터과학 시대에 적합한 컴퓨팅 인프라 구축)

  • Sookhee Choi;Kyungsoo Han;Zhe Wang
    • The Korean Journal of Applied Statistics
    • /
    • v.37 no.1
    • /
    • pp.49-59
    • /
    • 2024
  • The popularity of data science, influenced by the trends from the United States around 2010, has significantly impacted the education of various statistics departments at domestic universities. However, it is challenging to find research papers in domestic academic journals that address the efficient teaching of data science topics in relation to computing environment. This article will discuss and propose the establishment of a suitable computing infrastructure for the education and research in statistics and data science departments in domestic universities.

Music Recommendation System Using Audio Metadata and User Playlists (음원 메타데이터와 사용자 플레이리스트를 활용한 음악 추천 시스템)

  • Kyoung Min Nam;Yu Rim Park;Ji Young Jung;Do Hyeon Kim;Hyon Hee Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.731-732
    • /
    • 2024
  • 본 논문은 음원 메타데이터 임베딩 방법론을 기반으로 새로운 음원 추천 방법을 제안한다. 사용자 행동 데이터를 활용한 개인 맞춤형 음악 추천 모델은 신규 사용자의 데이터가 부족할 경우, 적절한 추천이 어려운 콜드스타트 현상을 초래할 수 있다. 본 연구에서는 플레이리스트의 음원 메타데이터를 Song sentence 로 구성하고, 고차원 벡터 공간에 임베딩하여 유사도를 계산한 추천 알고리즘을 구축한다. 사용자 행동 데이터가 아닌 음원의 자체적인 정보에 근거하기 때문에 콜드 스타트 현상을 보완하여 사용자에게 편리한 음악 감상 경험을 제공할 수 있을 것으로 기대된다.