• 제목/요약/키워드: 데이터과학과

검색결과 5,237건 처리시간 0.043초

인체 데이터를 포함한 과학 데이터 리파지터리의 구축 및 활용에 관한 연구 (A Study on Building the Scientific Data Repository Involving Human Data and Its Application)

  • 이상호;이상환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.170.1-170.1
    • /
    • 2012
  • 본 발표에서는 KISTI에서 현재 구축하고 있는 인체 데이터의 현황과 인체 데이터를 포함한 과학 데이터 리파지터리의 구축과 활용에 대한 전반적인 내용을 소개한다. 인체 데이터는 인체 절단면 영상을 중심으로 한 Visible Korean 데이터와 CT, MR 영상과 인체 뼈대 물성을 중심으로 한 Digital Korean 데이터로 나누어지며 이들 데이터의 제작 과정과 활용 내용을 주로 소개한다. 과학 데이터 리파지터리 구축 내용은 현재 국가의 연구개발 예산으로 수행되고 있는 연구과제에서 생성된 다양한 과학 데이터들을 국가적 차원에서 수집, 관리, 유통시키기 위해 기관별 또는 분야별로 과학데이터센터를 육성하고 이를 거점으로 하여 국내의 과학데이터가 수집, 관리, 유통, 활용될 수 있도록 국가적 과학데이터 관리체계를 구축한다. 또한 이렇게 수집된 과학데이터의 활용을 위해 연구자들이 데이터 기반의 연구 과제를 수행할 수 있도록 데이터 기반의 첨단 연구 환경을 구축하고 연구에 필요한 S/W, H/W 및 기타 필요한 IT 기반의 요소기술들을 개발, 지원한다. 또한 KISTI가 제작 주체가 되어 생산한 상기의 인체 데이터뿐만 아니라 의료 관련 분야의 연구 현장에서 생산되고 있는 다양한 인체 데이터를 수집, 관리, 공유할 수 있도록 인체 데이터 리파지터리를 구축하기 위해 Visible Korean, Digital Korean 데이터를 포함한 다양한 의료 데이터의 리파지토리를 설계하고 이러한 의료 데이터 기반 연구의 활성화 및 데이터 리파지터리의 활성화를 위한 정부 및 분야별 커뮤니티 차원의 다양한 대책들을 소개한다.

  • PDF

과학 응용 데이터베이스 관리를 위한 시간지원 데이터 모델 (A Temporal Data Model for Managing Scientific Database)

  • 김진호;옥수호
    • 정보기술과데이타베이스저널
    • /
    • 제4권1호
    • /
    • pp.51-64
    • /
    • 1997
  • 최근 컴퓨터 응용이 우주 항공, 천체 기상, 환경 관리, 공장 자동화(FA) 등의 분야로 확산되면서 물리, 화학, 생물, 기계 등의 과학 응용에서 생성되는 자료를 처리하는 기법에 대한 요구가 늘어나고 있다. 이들 과학 응용에서는 물리적 실험 장치나 측정 기계, 또는 시뮬레이션으로부터 데이터를 시간별로 측정(또는 수집)하므로 이들 과학 데이터는 시간에 종속된 데이터이다. 많은 과학 응용의 시간 지원 데이터는 과학 분야의 특성에 따라 매우 정밀한 시간 단위로 수집하기도 하고 실험 시작부터 경과된 상대적인 시간에 따라 데이터를 수집한다. 달력상의 시간을 사용하는 기존의 시간지원 데이터베이스는 과학 응용의 이러한 특징을 지원하지 못한다. 따라서 이 논문에서는 과학 실험 응용에서 요구하는 시간에 대한 특징과 요구 사항을 분석하고, 이들 과학 응용의 요구 사항을 만족하도록 확장한 새로운 시간 지원 데이터 모델을 제안한다. 이 모델에서는 실험이 경과된 상대적인 시간에 대한 데이터의 이력을 확장형 집합 개념을 사용하여 표현한다. 기존의 관계 데이터 모델과 유사하게, 이 모델은 집합 개념에 바탕을 두고 있으므로 데이터 모델과 그 연산의 의미를 쉽게 이해하고 사용할 수 있다는 장점이 있다.

  • PDF

동시출현단어분석을 통한 데이터과학 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Data Science Using Co-Word Analysis)

  • 김현정
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.101-126
    • /
    • 2017
  • 최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터 과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.

데이터과학 시대에 적합한 컴퓨팅 인프라 구축 (Building a computing infrastructure in the era of data science)

  • 최숙희;한경수;왕철
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.49-59
    • /
    • 2024
  • 2010년을 전후로 미국에서 시작된 데이터과학의 인기는 국내 대학의 여러 통계학과 교육에 큰 영향을 주고 있다. 그러나 국내 학술지에서는 데이터과학을 효율적으로 교육하기 위한 컴퓨팅 환경 구축과 활용을 다루는 연구 결과는 많지 않다. 본 논문은 국내의 통계학과 및 데이터과학 관련 학과의 교육과 연구에 적합한 컴퓨팅 인프라 구축과 활용에 관한 문제를 논의하고 해결책을 제시한다.

엔트리를 활용한 초등 데이터 과학 교육 사례 연구 (A Study on Elementary Education Examples for Data Science using Entry)

  • 허경
    • 정보교육학회논문지
    • /
    • 제24권5호
    • /
    • pp.473-481
    • /
    • 2020
  • 데이터과학은 스몰데이터 분석에서 출발하여, 빅데이터 분석을 위한 머신러닝, 딥러닝까지 포함하고 있다. 데이터과학은 인공지능 기술의 핵심 영역이고, 학교 교육과정에 체계적으로 반영해야 할 내용이다. 데이터과학 교육을 위해, 엔트리에서도 초등교육용 데이터 분석 도구를 제공하고 있다. 빅데이터 분석에서는 데이터 표본을 추출하여, 통계학적인 추측과 판단을 통해 분석결과를 해석한다. 본 논문에서는 통계학적인 지식을 필요로 하는 빅데이터 분석 영역을 초등영역에서 제외하기로 하고, 초등영역에 초점을 맞춘 데이터과학 교육 사례를 제안하였다. 이를 위해서, 일반적인 데이터과학 교육 단계를 먼저 설명하고, 초등 데이터과학 교육 단계를 새롭게 제안하였다. 그리고 엔트리에서 제공하는 공공 스몰 데이터를 사용한 데이터 변수 값 비교 사례와 데이터 변수 간 상관관계 분석 사례를 초등 데이터과학 교육 단계에 따라 제안하였다. 본 논문에서 제안된 엔트리 데이터분석 사례들을 활용하면, 여러 교과에서 발생하는 데이터를 사용한 초등 데이터과학 융합 교육이 가능하다. 또한, 엔트리를 사용하여 텍스트, 음성 및 영상인식 AI 도구와 결합한 데이터과학 교육 자료도 개발 가능하다.

계산과학 데이터의 인공지능 분석을 위한 확장성 있는 특징 데이터 추출 자동화 시스템 (A scalable and automated feature data extraction system for AI analysis of computational science data)

  • 안선일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.102-105
    • /
    • 2020
  • AI 분석 과정에서 특징 데이터 추출은 분석 성능에 큰 영향을 미칠 뿐만 아니라 가장 많은 시간을 소요하는 과정 중의 하나이다. 계산과학 데이터는 HPC를 활용하여 생산되므로 데이터가 크고 복잡할 뿐 아니라 데이터의 수도 방대한 경우가 많다. 이 때문에 계산과학 데이터로부터 특징 데이터 추출하는 과정은 복잡성이 크고, 소요 시간도 매우 크다. 본 논문은 먼저 계산과학 데이터로부터 특징 데이터 추출하는 과정에 대한 요구사항과 이슈들을 분석한다. 그리고 확장성을 고려한 계산과학 데이터의 인공지능 분석을 위한 특징 데이터 추출 자동화 시스템을 제안한다.

과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈 (Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues)

  • 임헌국;신광천
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.904-913
    • /
    • 2020
  • 데이터 볼륨과 복잡도가 빠르게 증가함에 따라 과학 빅데이터를 다루는 데이터 집적 과학은 네트워크를 통해 보다 효과적인 데이터 저장 및 분배를 위한 새로운 기술을 발견하는 것을 필요로 한다. 최근 네임드 데이터 네트워킹 커뮤니티와 데이터 집적 과학 커뮤니티는 함께 과학 실험 빅데이터의 분배 및 관리에 있어서 혁신적인 변화를 꾀하였다. 본 논문 에서는 기후과학 및 고에너지물리 데이터 등과 같은 과학 빅데이터를 위한 현존하는 엔디엔 테스트베드들에 대한 분석이 처음으로 이루어진다. 과학 빅데이터를 위한 엔디엔 테스트베드들을 현황, 엔디엔 기반 응용, 특징 측면에서 묘사하고 토의한다. 마지막으로 과학 빅데이터를 위한 엔디엔 테스트베드 네트워크를 확립함에 있어서, 함정에 빠질 수 있는 다양한 이슈들을 엔디엔 테스트베드들에 대한 묘사 그리고 특징들로 부터 도출하여, 분석 제시한다.

과학 데이터의 출판과 인용에 관한 연구 (A Study on Publishing and Citing the Scientific Data)

  • 이상호;이유선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.303-304
    • /
    • 2011
  • 과학적 논문의 기초가 되는 과학 데이터들은 국가 차원에서 체계적으로 관리가 되지 않아 원활하게 유통 및 재활용이 되지 않고 있으며 논문 원문과 데이터들이 서로 연계, 통합되지 않아서 과학 데이터의 유통이 더욱 어려워지고 있다. 이 연구에서는 유통 측면에서 과학 논문과 데이터를 비교하고 연계, 통합을 위한 영구식별자의 도입 및 제도적 측면에서 데이터 기탁 및 데이터 리파지토리의 활성화 방안에 대해 논의한다.

  • PDF

국내 과학기술분야 연구기관의 과학데이터 관리 현황 (Research Data Management of Science and Technology Research Institutes in Korea)

  • 최명석;이승복;이상환
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.117-126
    • /
    • 2017
  • 최근 연구 환경과 연구 패러다임이 데이터 중심(Data-Driven)으로 변화되고 있다. 특히, 공공 연구성과의 개방과 공유에 기반한 오픈 사이언스(Open Science)가 과학 연구의 글로벌 어젠다로 새롭게 부각되고 있다. 해외에서는 공적 지원에 의해 수행된 연구에서 생산되는 과학데이터의 공유 활용을 위한 정책이 적극적으로 시행되고 있어, 국내에서도 '오픈 연구데이터'를 위한 정책과 인프라 구축이 시급한 상황이다. 본 연구에서는 국내 과학기술 분야 연구기관의 과학데이터 생산, 관리, 활용 현황을 조사했다. 국가과학기술연구회 소속 22개 정부출연 연구기관과 국내 20개 대학의 연구자를 대상으로 과학데이터 생산, 관리, 활용현황, 과학데이터 공유 활용 참여 의지, 과학데이터 공유 활용 요구사항 등 5개 관점의 심층인터뷰를 실시했다. 이를 기반으로 과학데이터 공유 활용을 위한 시사점과 개선방향을 도출했다.

국가 과학데이터센터 구축을 위한 성과분석 모델 수립에 관한 연구 (A Study on Establishment of Performance Analysis Model for National Science Data Center Construction)

  • 박성욱;한선화;이필우;이윤석;김선태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.433-434
    • /
    • 2011
  • 학술 정보유통의 패러다임이 데이터중심 과학으로 연구방법이 변화됨에 따라 사실데이터, 실험데이터 등으로 구성된 과학데이터의 중요성은 커지고 있다. 이에 분야별로 구축된 과학데이터의 개별적 활용 체제보다는 국가 차원에서의 과학데이터센터 구축을 통해 효율적인 과학데이터의 보존, 활용이 필요한 시점에 와 있다. 본 논문에서는 국가 과학데이터센터 구축이 가져오는 경제적 파급효과에 대한 성과분석 모델을 수립하여 차후에 보다 체계적인 성과분석의 효율성 제고와 발전방향의 모색에 활용하고자 한다.

  • PDF