• 제목/요약/키워드: 데이터 활용도

검색결과 18,376건 처리시간 0.044초

초등학생을 위한 데이터 분석대회를 활용한 데이터 분석 프로그램 개발 (Development of a Data Analysis Program Using a Data Analysis Competition for Primary School Students)

  • 고학능;정재리;이영준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.471-472
    • /
    • 2024
  • 본 논문에서는 초등학생을 위한 데이터 분석 대회를 활용한 데이터 분석 프로그램을 개발하였다. 데이터 분석 프로그램은 ADDIE 모형에 개발하였다. 분석 단계에서 G초등학교 학생들의 데이터 분석 도구인 스프레드 시트를 학습한 경험이 적고 배우고자 하는 동기가 없었다. 하지만 교육과정에서 공학도구로 활용하도록 제시되어 있다. 이를 바탕으로 디자인 학생들이 스프레드 시트를 학습할 수 있는 프로그램과 이를 실습할 수 있는 데이터 분석 대회를 디자인 하였다. 개발 단계에서는 LMS를 활용하여 학생들에게 학습을 위한 데이터를 제공하고 학습하며, 데이터 분석 대회에서는 학습한 데이터와 문제만 제공하여 대회에 참여하면서 실습할 수 있는 기회를 제공하였다. 평가 도구로는 데이터 리터러시 평가 도구를 선정하였다.

  • PDF

디지털 도서관의 의미적 상호운용성(Semantic Interoperability) 향상을 위한 메타데이터 요소와 활용에 관한 연구 (The Utilization of Metadata Elements and Content Designation for Improving Semantic Interoperability in Context of Digital Libraries)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제42권1호
    • /
    • pp.193-211
    • /
    • 2008
  • 이 연구는 디지털 도서관에 실제로 사용된 메타데이터의 요소와 활용을 분석하여 의미적 상호운용성 향상 요인을 고찰하는 데 목적이 있다. 이를 위해 그린스톤 기반의 78종의 디지털 도서관에서 실제로 사용한 메타데이터 요소를 동질 정보 커뮤니티로 세분하여 분석하였다. 동질 정보 커뮤니티내 디지털 도서관에서 사용된 메타데이터 요소를 크로스워킹하고. 각 요소들의 활용 및 활용 수준을 분석하였다 그 결과 동일 정보 커뮤니티 내에서 중복되는 핵심 메타데이터 요소는 25% 미만으로 나타났다. 이들 핵심 메타데이터 요소는 요소 명칭과 활용에 있어서 불일치하는 문제점이 고찰되었으며, 메타데이터 요소 활용의 수준에 있어서도 무결점과 완결성 면에서 상이한 측면이 밝혀졌다.

보건의료 분야의 빅데이터 활용 동향

  • 이지혜;제미경;조명지;손현석
    • 정보와 통신
    • /
    • 제32권1호
    • /
    • pp.63-75
    • /
    • 2014
  • 정보통신기술의 발전과 생산되는 데이터의 양적 증가에 따라 빅데이터에 대한 관심이 증대되고 있다. 빅데이터(Big Data)란 기존 데이터베이스의 데이터 저장 관리 분석 능력을 초과하는 다양한 형식을 가진 대량의 데이터를 의미한다. 여러 분야에서 빅데이터가 생성, 분석, 활용되고 있는데, 특히 보건의료 및 바이오 분야에서의 빅데이터 분석은 사회경제적으로 큰 영향력을 발휘할 수 있기 때문에 크게 주목 받고 있다. 본 연구에서는 보건의료 분야에서 생성되는 데이터의 특징과 빅데이터 분석 프로세스에 대해서 조사하였고, 국내 외 빅데이터 정책 및 활용사례를 분석하였다. 그리고 현재의 빅데이터 활용 장벽을 극복할 수 있는 몇 가지 전략을 제시하였다. 대량의 데이터에서 유용한 정보를 생성해내는 빅데이터 분석 기술은 보건의료 및 바이오 분야에서 국가경쟁력을 향상시키는 중요한 기반이 될 것이다.

범용적 활용을 위한 ENC Data Loader의 개발 (Development of ENC Data Loader for General Purpose)

  • 심우성;강준선;서상현;박종민
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.414-419
    • /
    • 1998
  • 1996년에 3판이 발행된 S-57 표준은 디지틀 수로데이터의 국제적인 교환 표준형식이며 ENC는 S-57을 기본형식으로 하고 특정 상품을 위한 생산품 규약에 의해 만들어진 것이다. ECDIS에 사용되기 위해 만들어진 디지틀 해도 데이터 상품이지만 앞으로 예상되는 ENC 데이터의 일반적 목적을 갖고 있는 사용자들이 모두 S-57과 ENC 생산품 규약을 이해하고 데이터를 읽기 위해 시간과 노력을 투자하는 것은 무척 소비적인 일이 될 것이다. 즉 사용자의 요구는 데이터의 형식이 아니라 데이터의 사용에 집중된다. 그러므로 사용자가 데이터의 내부형식을 알지 못하더라도 사용하고자 하는 의도에 맞게 데이터의 내용을 보여주고 필요한 형식으로 재가공하여 사용할 수 있도록 데이터를 제공하는 프로그램이 필요하며 이는 ENC의 보급 및 활용도를 높이는데 매우 중요하다고 할 수 있다. 본 논문에서는 Data Loader 개발의 기초 단계로 ENC 데이터를 텍스트 형태로 전환하여 ENC에 담긴 내용을 파악할 수 있도록 하는 ENC Data Loader의 기능과 프로그램 개발과정에 대하여 기술하고 텍스트가 아닌 그림으로 보여주며 일반적인 데이터 교환형식으로 변환하는 둥의 새로운 모듈 개발과정을 설명한다. 이를 위해 ENC 데이터의 형식과 내용을 분석하고 GIS 측면에서의 데이터 해석을 시도한다. 또한 이러한 프로그램을 이용한 향후 ENC 데이터의 활용방안에 대하여 기술한다.

  • PDF

데이터 웨어하우스 메타데이터 구축사례 (Implementing A Data Warehouse Metadata: A Case)

  • 조남철;손명호;김태훈;이희석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.383-392
    • /
    • 1999
  • 오늘날의 의사결정을 지원하는 시스탬에 있어서 데이터 웨어하우스가 널리 활용되고 있다. 이러한 데이터웨어 하우스를 개발하는데 있어서 메타 데이터가 필수적인 요소로 활용되고 있다. 한편. 메타 데이터 연합 (Meta Data Coalition)에서 제정한 Metadata Interchange Specification (MDIS)는 이러한 메타 데이터의 표준으로 널리 활용되고 있다. 본 연구는 이러한 표준을 기반으로 한 메타 데이터 스키마를 제시하고 있다. 실제적인 개발에서 이러한 표준은 핵심웨어하우스 계층, 적용 계층, 사용자 탐험 계층 및 비즈니스 계층으로 구성되어 있다. 이러한 메타 데이터 스키마를 적용한 실제 시스템의 프로토타입을 본 연구에서 구현해 보았다.

  • PDF

'보건의료 데이터 활용 가이드라인'의 현행법상 문제점 (Probleme nach geltendem Recht „Richtlinien für die Verwendung von Gesundheitsdaten")

  • 이석배
    • 의료법학
    • /
    • 제22권4호
    • /
    • pp.3-35
    • /
    • 2021
  • 민간과 공공이 생산해내는 정보의 홍수 속에서, 이 방대한 분량의 정보는 빅데이터로 대표되는 제4차 산업혁명시대의 핵심자원으로 간주되고 있다. 전 세계적으로 이 빅데이터에 대한 관심이 높아지고 데이터의 확보와 축적, 축적된 데이터의 안전하면서도 유용하게 활용하는 방안에 대한 논의가 활발하다. 특히 보건의료 데이터는 빅데이터 기술이 활용될 가장 가치 있는 자원으로 평가되고 있다. 이러한 보건의료 데이터를 유용하게 활용하기 위해서는 분산된 보건의료 데이터를 통합하여 조사나 연구에 활용 가능한 형태로 이용자에게 제공되어야 한다. 주요 국가들이 데이터 경제의 주도권을 확보하기 위해 경쟁하는 상황에서 우리나라도 2020년 8월 「개인정보보호법」 등 소위 '데이터 3법'이 개인정보의 활용방향으로 개정되었다. '데이터 3법'의 개정은 개인정보 정의의 판단기준을 명확하게 하고, 가명정보의 개념을 도입하여 개인정보의 안전한 활용을 뒷받침하기 위한 제도적 기반이라 할 수 있다. 최근에는 그 후속 조치로 개인정보보호위원회가 '가명정보 처리 가이드라인'을 발표하였고, 보건복지부는 이와 별도로 '보건의료 데이터 활용 가이드라인'을 발표하였다. 하지만 여전히 풀어야 할 숙제는 남아있다. 우리나라는 「국민건강보호법」에 따라 전 국민의 건강보험 가입이 의무화되어 있고, 모든 국민의 보건의료정보는 국민건강보험공단, 국민건강보험심사평가원 등 공공기관이 보유, 관리하고 있다. 이러한 데이터는 보건의료와 관한 빅데이터를 구성하게 되는데, 특히 모든 국민이 단일 건강보험에 모두 가입되어 있다는 점에서 보건의료 영역에서 빅데이터로서 그 가치와 잠재력은 어느 나라에서도 찾기 어려운 것도 사실이다. 반면 안정성의 측면에서는 그만큼 위험을 가지고 있다고 볼 수 있다. 보건의료데이터는 사람의 생명이나 신체와 직결되고 그와 관련된 수많은 민감정보를 포함하고 있어, 다른 분야보다 세심하고 보수적인 관점에서 개인정보를 보다 안전하게 보호하는 것을 전제로 그 안에서 활용이 될 수 있도록 제도가 마련되어야 할 것이다. 이 글에서는 개인정보보호위원회와 보건복지부가 제시한 '보건의료데이터 활용 가이드라인'의 주요내용을 분석하기 위하여 우선 개정된 「개인정보보호법」의 주요내용을 검토하고, 그에 따라 '보건의료 데이터 활용 가이드라인'의 주요내용을 분석하여 타 법률과 충돌문제 등 그 문제점과 개선방안을 검토하였다. '보건의료 데이터 활용 가이드라인'은 그 성격상 현행 「개인정보보호법」의 해석을 보충하고, 보건의료 분야에 특화된 데이터 활용의 관점에서 「개인정보보호법」이 내다보지 못했던 상황에 관해 법의 해석·적용과 실무상의 지침을 제시하려 하였으나, 가이드라인의 제목에서 나타나듯이 '활용'에 초점을 두어 개인정보보호와 균형을 이루는 데에는 실패한 것으로 보인다. '보건의료 데이터 활용 가이드라인'은 「개인정보보호법」의 내재적인 문제점과 「의료법」, 「생명윤리법」과 충돌문제나 실효성 문제, 법률에 규정할 네용을 법률에 근거 없이 가이드라인에 담고 있는 등 아직까지 미흡한 부분이 많고, 여러 가지 문제점을 가지고 있다는 점을 확인하였다. 많은 민감 정보를 담고 있는 보건의료 데이터는 언제든지 새로운 개인정보 침해 위험이 발생할 수 있으므로, 사후관리 강화와 다양한 수준에서 데이터 활용의 영향을 평가하면서 활용에만 중점을 두는 것이 아니라 정보주체의 권리와 조화를 이룰 수 있도록 법령의 보완과 더불어 '가이드라인'도 보완해 나가야 할 것이다.

기본지리정보 중첩활용 수요분석 (Demand Analysis of Framework Data overlap)

  • 신동빈;박시영
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.189-194
    • /
    • 2008
  • 국가지리정보체계의구축및활용등에관한 법률(이하 NGIS법)에 따라 국가GIS의 효과적인 구축 관리 및 활용을 위하여 기본지리정보가 구축되고 있다. 기본지리정보는 국가공간정보기반으로서 기본이 되는 데이터이며, 법적 근거에 따라 중첩활용이 가능해야 한다. 따라서 본 논문에서는 기본지리정보 중첩활용성 제고를 위하여 지리정보 중첩활용에 대한 수요를 조사 및 분석하였다. 설문 응답자는 민간기업이 38.2%로 가장 많았으며, 교육기관, 정부투자기관, 연구기관, 중앙행정기관, 지방자치단체의 순으로 조사되었다. 기본지리정보 활용목적은 기술관련 업무용으로 가장 많이 사용하였으며, 연구관련 업무용, 부가가치생산용의 순으로 나타났다. 기본지리정보 활용 우선순위는 교통분야가 가장 높았으며, 지적분야, 공간영상분야, 지형분야의 순으로 나타났다. 기본지리정보 상호간 중첩활용수요는 교통분야가 가장 높고, 지적분야, 공간영상분야, 지형분야의 순으로 나타났다. 기본지리정보 상호간 중첩활용 수요에 있어서도 '교통-시설물' 중첩활용수요가 가장 높았으며, '행정구역-교통', '행정구역-지적', '행정구역-시설물' 등의 순으로 나타났다. 기본지리정보 중첩활용을 위한 요구사항을 1순위부터 5순위까지 조사한 후 가중치를 부여하여 합산한 결과 데이터품질이 가장 높았으며, 데이터포맷, 데이터모델, 데이터구축지침, 데이터생산사양의 순으로 나타났다. 이러한 수요조사 결과를 기반으로 향후 기본지리정보 중첩활용성을 제고하기 위한 시범구축 등을 수행하여 사용자의 수요를 만족시킬 수 있는 상호호환성이 확보된 기본지리정보의 공급이 요구된다.

  • PDF

위성 데이터 및 기계 학습 기법을 활용한 한반도 임진강 미계측 지역 유출량 예측: MODIS, ASCAT, SDS 데이터를 활용하여 (River Flow Forecasting using Satellite-based Products and Machine Learning Technique over the Ungauged River Flow in Korean Peninsula, Imjin River: Using MODIS, ASCAT, and SDS dataset)

  • 최민하;김형록;;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.159-159
    • /
    • 2016
  • 북한 지역에서 시작되어 한반도의 금문댐까지 연결되는 임진강은 북한지역의 유출량 미계측으로 인해 유출량 산출에 많은 어려움이 있어왔다. 본 연구에서는 위성 데이터를 활용하여 미계측 유역의 유출량을 추정 할 수 있는 기법을 제시하였다. Satellite-derived Flow Signal (SDF)는 위성 기반 특정 지역의 유출 정보를 제공하며, JAXA의 GCOM-W1 위성에 탑재된 Advanced Microwave Scanning Radiometer 2(AMSR2) 센서에서 산출된다. 본 연구에서는 SDS 뿐 아니라 유출에 크게 관련이 있는 지표 토양수분 데이터와 식생인자를 임진강 유출 값을 예측하기 위한 입력 값으로 활용하였다. 토양수분 데이터는 Metop-A 위성에 탑재된 Advanced Scatterometer(ASCAT) 센서에서 산출되는 데이터를 활용하였으며, 식생데이터는 Aqua 위성에 탑재된 Moderate Resolution Imaging Spectroradiometer(MODIS) 센서에서 측정되는 Normalized Difference Vegetation Index(NDVI) 데이터를 활용하였다. 추가적으로 SDS, 토양수분, NDVI 데이터는 다양한 lag time으로 약 150여개의 입력데이터로 세분화되었다. 150개의 방대한 입력인자는 Partial Mutual Information(PMI) 방법을 통해 소수 중요 인자들로 간추려져 기계 학습 입력인자로 활용되었다. 기계학습에 있어서는 Support Vector Machine(SVM), Artificial Neural Network (ANN) 기법을 활용하였다. SVM, ANN을 통해 모델화된 유출데이터는 금문댐 유출데이터와 비교/분석되었다. SVM 기법 기반의 유출량은 실제 유출량과 0.73의 상관계수를 보여주었고, ANN 기법 기반의 유출량은 0.66의 상관계수를 결과를 나타내었다. 하지만 SVM 기반 유출데이터는 과소 산정 되는 경향을 보였으며, ANN 기법 기반의 유출량은 과대산정되는 결과가 산출되는 한계점이 있음을 파악할 수 있었다.

  • PDF

데이터 품질관리가 데이터 활용도 및 고객 지향성에 미치는 영향 (The Influence of Data Quality Management on Data Utilization and Customer Orientation)

  • 안희정;김현수
    • 서비스연구
    • /
    • 제5권2호
    • /
    • pp.119-132
    • /
    • 2015
  • 낮은 품질의 데이터가 기업의 효율적인 운영과 신속한 의사결정을 저해한다는 이슈가 제기되고 있다. 이에, 본 연구는 경영층의 지원과 경쟁력이 심화되고 있는 경영환경이 데이터 활용 품질관리 활동의 영향요인이 될 수 있는지, 해당 활동이 업무처리 또는 의사결정을 위한 데이터 활용을 촉진시킴으로써 고객 지향성에 긍정적인 영향을 미치는지 살펴보았다. 연구결과 데이터 활용 품질관리는 데이터를 업무처리에 직접적 또는 의사결정에 활용하는데 긍정적인 영향요인이 될 수 있으며, 데이터 활용이 고객지향성에 간접적인 효과를 줄 수 있음을 확인하였다. 본 연구는 직접적인 매출 향상의 성과를 기대할 수 있을 것 같지 않다는 인식으로 데이터 품질관리의 중요성을 간과하는 기업의 경영자들에게 데이터 품질관리활동의 가치 및 경영층의 지원에 대한 실무적 함의를 제시하였다.

순환신경망을 활용한 야구승부예측 (A Prediction of Baseball Game Results Using Recurrent Neural Netowrks)

  • 정경석;김진학;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 딥러닝(Deep-learning)을 활용한 기상 예측, 심리 예측, 교통상황 예측 등 다양한 분야에 걸쳐 여러 모델의 인공신경망이 활용되고 있다. 본 논문에서는 여러 분야 중 스포츠라는 분야에 접근했으며, 딥러닝 모델을 통해 승부를 예측하는 실험을 진행하였다. 야구의 승부는 선수의 능력치, 기상의 변화, 험/어웨이 여부, 교체 여부 등 가늠할 수 없이 수많은 데이터들에 의존하고 있다. 그러나 본 논문에서는 이러한 수많은 데이터 중 경기 외적인 데이터를 제외한 데이터를 활용하여 그 다음 경기의 승부를 예측할 수 있을 지를 연구한다. 날짜 별 경기들이 훈련데이터가 되고 목표는 이전 경기들의 영향으로 예측된 다음 경기의 승/패를 예측한다. 즉 순차적인 데이터의 활용에 적합한 모델, Recurrent Neural-Network을 이용하였다. 이를 위하여 KBreport에서 데이터를 수집하였고, 수집된 데이터를 훈련 데이터 세트로 만들어 Recurrent Neural Network를 통해 훈련시켜 다음 경기의 승패를 예측하였다.