• 제목/요약/키워드: 데이터 과학

검색결과 5,215건 처리시간 0.041초

인체 데이터를 포함한 과학 데이터 리파지터리의 구축 및 활용에 관한 연구 (A Study on Building the Scientific Data Repository Involving Human Data and Its Application)

  • 이상호;이상환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.170.1-170.1
    • /
    • 2012
  • 본 발표에서는 KISTI에서 현재 구축하고 있는 인체 데이터의 현황과 인체 데이터를 포함한 과학 데이터 리파지터리의 구축과 활용에 대한 전반적인 내용을 소개한다. 인체 데이터는 인체 절단면 영상을 중심으로 한 Visible Korean 데이터와 CT, MR 영상과 인체 뼈대 물성을 중심으로 한 Digital Korean 데이터로 나누어지며 이들 데이터의 제작 과정과 활용 내용을 주로 소개한다. 과학 데이터 리파지터리 구축 내용은 현재 국가의 연구개발 예산으로 수행되고 있는 연구과제에서 생성된 다양한 과학 데이터들을 국가적 차원에서 수집, 관리, 유통시키기 위해 기관별 또는 분야별로 과학데이터센터를 육성하고 이를 거점으로 하여 국내의 과학데이터가 수집, 관리, 유통, 활용될 수 있도록 국가적 과학데이터 관리체계를 구축한다. 또한 이렇게 수집된 과학데이터의 활용을 위해 연구자들이 데이터 기반의 연구 과제를 수행할 수 있도록 데이터 기반의 첨단 연구 환경을 구축하고 연구에 필요한 S/W, H/W 및 기타 필요한 IT 기반의 요소기술들을 개발, 지원한다. 또한 KISTI가 제작 주체가 되어 생산한 상기의 인체 데이터뿐만 아니라 의료 관련 분야의 연구 현장에서 생산되고 있는 다양한 인체 데이터를 수집, 관리, 공유할 수 있도록 인체 데이터 리파지터리를 구축하기 위해 Visible Korean, Digital Korean 데이터를 포함한 다양한 의료 데이터의 리파지토리를 설계하고 이러한 의료 데이터 기반 연구의 활성화 및 데이터 리파지터리의 활성화를 위한 정부 및 분야별 커뮤니티 차원의 다양한 대책들을 소개한다.

  • PDF

과학 응용 데이터베이스 관리를 위한 시간지원 데이터 모델 (A Temporal Data Model for Managing Scientific Database)

  • 김진호;옥수호
    • 정보기술과데이타베이스저널
    • /
    • 제4권1호
    • /
    • pp.51-64
    • /
    • 1997
  • 최근 컴퓨터 응용이 우주 항공, 천체 기상, 환경 관리, 공장 자동화(FA) 등의 분야로 확산되면서 물리, 화학, 생물, 기계 등의 과학 응용에서 생성되는 자료를 처리하는 기법에 대한 요구가 늘어나고 있다. 이들 과학 응용에서는 물리적 실험 장치나 측정 기계, 또는 시뮬레이션으로부터 데이터를 시간별로 측정(또는 수집)하므로 이들 과학 데이터는 시간에 종속된 데이터이다. 많은 과학 응용의 시간 지원 데이터는 과학 분야의 특성에 따라 매우 정밀한 시간 단위로 수집하기도 하고 실험 시작부터 경과된 상대적인 시간에 따라 데이터를 수집한다. 달력상의 시간을 사용하는 기존의 시간지원 데이터베이스는 과학 응용의 이러한 특징을 지원하지 못한다. 따라서 이 논문에서는 과학 실험 응용에서 요구하는 시간에 대한 특징과 요구 사항을 분석하고, 이들 과학 응용의 요구 사항을 만족하도록 확장한 새로운 시간 지원 데이터 모델을 제안한다. 이 모델에서는 실험이 경과된 상대적인 시간에 대한 데이터의 이력을 확장형 집합 개념을 사용하여 표현한다. 기존의 관계 데이터 모델과 유사하게, 이 모델은 집합 개념에 바탕을 두고 있으므로 데이터 모델과 그 연산의 의미를 쉽게 이해하고 사용할 수 있다는 장점이 있다.

  • PDF

계산과학 데이터의 인공지능 분석을 위한 확장성 있는 특징 데이터 추출 자동화 시스템 (A scalable and automated feature data extraction system for AI analysis of computational science data)

  • 안선일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.102-105
    • /
    • 2020
  • AI 분석 과정에서 특징 데이터 추출은 분석 성능에 큰 영향을 미칠 뿐만 아니라 가장 많은 시간을 소요하는 과정 중의 하나이다. 계산과학 데이터는 HPC를 활용하여 생산되므로 데이터가 크고 복잡할 뿐 아니라 데이터의 수도 방대한 경우가 많다. 이 때문에 계산과학 데이터로부터 특징 데이터 추출하는 과정은 복잡성이 크고, 소요 시간도 매우 크다. 본 논문은 먼저 계산과학 데이터로부터 특징 데이터 추출하는 과정에 대한 요구사항과 이슈들을 분석한다. 그리고 확장성을 고려한 계산과학 데이터의 인공지능 분석을 위한 특징 데이터 추출 자동화 시스템을 제안한다.

과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈 (Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues)

  • 임헌국;신광천
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.904-913
    • /
    • 2020
  • 데이터 볼륨과 복잡도가 빠르게 증가함에 따라 과학 빅데이터를 다루는 데이터 집적 과학은 네트워크를 통해 보다 효과적인 데이터 저장 및 분배를 위한 새로운 기술을 발견하는 것을 필요로 한다. 최근 네임드 데이터 네트워킹 커뮤니티와 데이터 집적 과학 커뮤니티는 함께 과학 실험 빅데이터의 분배 및 관리에 있어서 혁신적인 변화를 꾀하였다. 본 논문 에서는 기후과학 및 고에너지물리 데이터 등과 같은 과학 빅데이터를 위한 현존하는 엔디엔 테스트베드들에 대한 분석이 처음으로 이루어진다. 과학 빅데이터를 위한 엔디엔 테스트베드들을 현황, 엔디엔 기반 응용, 특징 측면에서 묘사하고 토의한다. 마지막으로 과학 빅데이터를 위한 엔디엔 테스트베드 네트워크를 확립함에 있어서, 함정에 빠질 수 있는 다양한 이슈들을 엔디엔 테스트베드들에 대한 묘사 그리고 특징들로 부터 도출하여, 분석 제시한다.

과학 데이터의 출판과 인용에 관한 연구 (A Study on Publishing and Citing the Scientific Data)

  • 이상호;이유선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.303-304
    • /
    • 2011
  • 과학적 논문의 기초가 되는 과학 데이터들은 국가 차원에서 체계적으로 관리가 되지 않아 원활하게 유통 및 재활용이 되지 않고 있으며 논문 원문과 데이터들이 서로 연계, 통합되지 않아서 과학 데이터의 유통이 더욱 어려워지고 있다. 이 연구에서는 유통 측면에서 과학 논문과 데이터를 비교하고 연계, 통합을 위한 영구식별자의 도입 및 제도적 측면에서 데이터 기탁 및 데이터 리파지토리의 활성화 방안에 대해 논의한다.

  • PDF

국내 과학기술분야 연구기관의 과학데이터 관리 현황 (Research Data Management of Science and Technology Research Institutes in Korea)

  • 최명석;이승복;이상환
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.117-126
    • /
    • 2017
  • 최근 연구 환경과 연구 패러다임이 데이터 중심(Data-Driven)으로 변화되고 있다. 특히, 공공 연구성과의 개방과 공유에 기반한 오픈 사이언스(Open Science)가 과학 연구의 글로벌 어젠다로 새롭게 부각되고 있다. 해외에서는 공적 지원에 의해 수행된 연구에서 생산되는 과학데이터의 공유 활용을 위한 정책이 적극적으로 시행되고 있어, 국내에서도 '오픈 연구데이터'를 위한 정책과 인프라 구축이 시급한 상황이다. 본 연구에서는 국내 과학기술 분야 연구기관의 과학데이터 생산, 관리, 활용 현황을 조사했다. 국가과학기술연구회 소속 22개 정부출연 연구기관과 국내 20개 대학의 연구자를 대상으로 과학데이터 생산, 관리, 활용현황, 과학데이터 공유 활용 참여 의지, 과학데이터 공유 활용 요구사항 등 5개 관점의 심층인터뷰를 실시했다. 이를 기반으로 과학데이터 공유 활용을 위한 시사점과 개선방향을 도출했다.

국가 과학데이터센터 구축을 위한 성과분석 모델 수립에 관한 연구 (A Study on Establishment of Performance Analysis Model for National Science Data Center Construction)

  • 박성욱;한선화;이필우;이윤석;김선태
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.433-434
    • /
    • 2011
  • 학술 정보유통의 패러다임이 데이터중심 과학으로 연구방법이 변화됨에 따라 사실데이터, 실험데이터 등으로 구성된 과학데이터의 중요성은 커지고 있다. 이에 분야별로 구축된 과학데이터의 개별적 활용 체제보다는 국가 차원에서의 과학데이터센터 구축을 통해 효율적인 과학데이터의 보존, 활용이 필요한 시점에 와 있다. 본 논문에서는 국가 과학데이터센터 구축이 가져오는 경제적 파급효과에 대한 성과분석 모델을 수립하여 차후에 보다 체계적인 성과분석의 효율성 제고와 발전방향의 모색에 활용하고자 한다.

  • PDF

데이터 과학의 방법론을 적용한 데이터 기반 디자인 방법론에 대한 연구 - 미세먼지 정보 서비스 앱의 디자인 리서치 사례를 중심으로 (Data-Driven Design Methodology based on Data Science Paradigm Focused on Design Research Case Study of Fine Dust Information App Service)

  • 이현진
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.103-114
    • /
    • 2021
  • 본 연구는 데이터 과학의 분석적 연구 방법을 디자인 연구에 활용할 수 있는 방법을 모색, 실증해봄으로써 빅데이터 기반의 디자인 분야에서 데이터 자원을 효과적으로 활용하고, 빅데이터 기술과 디자인이 상생 발전할 수 있는 디자인 연구 방향을 제시하였다. 본 연구의 방법은 먼저 고전적인 디자인 리서치의 방법들과 데이터를 활용한 디자인 리서치의 연구 방법론, 데이터 과학의 연구 방법론을 고찰하고 디자인과 데이터 과학의 선행연구들을 종합하여 데이터 과학의 연구 방법론과 디자인 프로세스를 통합하는 데이터 기반 디자인의 연구 방법론을 개발 제안하였다. 제안된 연구 모델은 데이터 기반 서비스 앱의 디자인 리서치 사례 연구를 수행하여 제안한 방법론의 적용 가능성을 살펴보았으며, 제시한 연구 방법의 적용을 위하여 데이터 큐레이션 방법에 대한 연구와 디자이너의 데이터 문해력 확보가 향후 연구과제로 도출되었다.

Data Locality를 활용한 VR환경에서의 대용량 데이터 가시화 시스템의 성능 개선 (Performance Enhancement of A Massive Scientific Data Visualization System on Virtual Reality Environment by Using Data Locality)

  • 이세훈;김민아;이중연;허영주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.284-287
    • /
    • 2012
  • GLOVE(GLObal Virtual reality visualization Environment for scientific simulation)는 컴퓨팅 자원의 성능 향상으로 데이터 양이 급속히 증가한 응용 과학과 전산 시뮬레이션 분야의 대용량 과학 데이터를 효율적으로 가시화하여 분석하기 위한 도구이다. GLOVE의 데이터 관리자인 GDM(GLOVE Data Manager)은 대용량 데이터의 분산 병렬 가시화를 위해 분산 공유 메모리를 제공하는 GA(Global Array)를 이용해 테라 바이트 단위의 데이터를 실시간으로 처리한다. 그러나 대용량 과학 데이터를 가시화 하는 과정에서 기존의 Data Locality를 고려하지 않은 데이터 접근 방식으로 인한 성능 저하를 확인했다. 본 논문은 기존 GLOVE에서 발견한 성능 저하 현상을 밝히고, 이에 대한 해결 방법을 제시한다.

국내 학술지 출현 학과정보 데이터셋 구축 및 자동분류 (Dataset construction and Automatic classification of Department information appearing in Domestic journals)

  • 김병규;류범종;심형섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.343-344
    • /
    • 2023
  • 과학기술 문헌을 활용한 계량정보분석에서 학과정보의 활용은 매유 유용하다. 본 논문에서는 한국과학기술인용색인데이터베이스에 등재된 국내 학술지 논문에 출현하는 대학기관 소속 저자의 학과정보를 추출하고 데이터 정제 및 학과유형 분류 처리를 통해 학과정보 데이터셋을 구축하였다. 학과정보 데이터셋을 학습데이터와 검증데이터로 이용하여 딥러닝 기반의 자동분류 모델을 구현하였으며, 모델 성능 평가 결과는 한글 학과정보 기준 98.6%와 영문 학과정보 기준 97.6%의 정확률로 측정되었다. 향후 과학기술 분야별 지적관계 분석 및 논문 주제분류 등에 학과정보 자동분류 처리기의 활용이 기대된다.

  • PDF