• Title/Summary/Keyword: 데이터 사이언스

Search Result 303, Processing Time 0.036 seconds

사이언스 빅 데이터(Science Big Data) 처리 기술 동향

  • Kim, Hui-Jae;Ju, Gyeong-No;Yun, Chan-Hyeon
    • Information and Communications Magazine
    • /
    • v.29 no.11
    • /
    • pp.11-23
    • /
    • 2012
  • 본 고에서는 과학 분야에서의 대용량 데이터 처리를 위한 기술인 사이언스 빅데이터의 처리 기술 동향에 대하여 기술한다. 서론에서 사이언스 빅데이터의 정의 및 필요성을 다루고, 본론에서는 데이터 중심 과학 패러다임의 등장과 그로 인한 사이언스 빅데이터 요구사항, 사이언스 빅데이터 소스 수집 및 정제, 저장 및 관리, 처리, 분석 등으로 이루어지는 사이언스 빅데이터 처리 기법에 대하여 기술한다. 또한 현재 다양한 기관에서 연구하고 있는 사이언스 빅데이터 플랫폼, 맵리듀스 등을 이용한 워크플로우 제어 기반의 사이언스 빅데이터 처리 기법을 예시로 소개한다.

Data Science Degree and Curriculum in Korea and its Implications for the Information Field (국내 데이터사이언스 학위 및 교과 운영 현황과 문헌정보학과로의 함의)

  • Park, Hyoungjoo;Lee, Heejin
    • Journal of Korean Library and Information Science Society
    • /
    • v.53 no.3
    • /
    • pp.431-454
    • /
    • 2022
  • This study examined data science degree programs and courses offered by universities, and those offered by the Library and Information Science (LIS) degree programs, to understand its implications for the LIS programs in Korea. This research assessed the status of data science degrees from 439 schools using the list released by the Korea Educational Development Institute in 2022. To be specific, this study analyzed universities, colleges, majors, sub-majors, interdisciplinary majors, convergence majors, micro-degrees, nanodegrees, tracks, modules, and industry-university cooperative programs within the data science field. This research examined 1,148 courses offered by data science degree programs and 1,325 courses offered by LIS degree programs. Data science degrees in Korea offer courses such as introductory, technical, practical, applied, and in-depth subjects related to data science. Although the LIS programs in Korea do not always offer data science, the courses included topics such as the introduction to data science, database, data visualization, data curation, metadata, big data, and information technology, when courses were offered. The researchers hope the findings of this study will be useful as a starting point for the development and revisions of LIS curriculum on data science in Korea.

An Examination of the Course Syllabi related to Data Science at the ALA-accredited Library and Information Science Programs (데이터사이언스 관련 교과목의 강의 계획서 분석: ALA의 인가를 받은 문헌정보학 프로그램을 중심으로)

  • Park, Hyoungjoo
    • Journal of the Korean Society for information Management
    • /
    • v.39 no.1
    • /
    • pp.119-143
    • /
    • 2022
  • This preliminary study examined the status of data science-related course syllabi in the American Library Association (ALA) accredited Library and Information Science (LIS) programs. The purpose of this study was to explore LIS course syllabi related to data science, such as course title, course description, learning outcomes, and weekly topics. LIS programs offer various topics in data science such as the introduction to data science, data mining, database, data analysis, data visualization, data curation and management, machine learning, metadata, and computer programming. This study contributes to helping instructors develop or revise course materials to improve course competencies related to data science in the ALA-accredited LIS programs.

Data science and data literacy (데이터 사이언스와 데이터 리터러시)

  • Lee, Jae Yun
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2015.08a
    • /
    • pp.11-15
    • /
    • 2015
  • 데이터 사이언스가 경영, 학술, 교육 등의 전 영역에 확산되면서 변화를 이끌어내고 있다. 문헌정보학과 도서관의 입장에서 데이터 사이언스라는 대세를 수용하는 전략에 대해서 데이터 리터러시를 중심으로 살펴보았다. 연구 데이터 리터러시, 통계 데이터 리터러시, 실무 데이터 리터러시의 세 가지로 나누어 살펴본 결과, 데이터 리터러시는 데이터와 관련된 기술과 역량을 강조하는 용어로서 문헌정보학과 도서관 현장에서 데이터 사이언스를 주도적인 입장에서 수용하는 브랜드로 육성시킬 필요가 있다고 판단된다.

  • PDF

Codeless Data Science Learning Software (Codeless 데이터 사이언스 학습 소프트웨어)

  • Choi, Hyo Hyun;Song, Da Hye
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.507-508
    • /
    • 2021
  • 4차산업 혁명시대가 도래하고, 클라우드 컴퓨팅의 발전과 동시에 데이터 처리 효율과 속도가 높아지면서, 지속적으로 다양한 분야의 데이터가 누적되고, 이를 활용한 기술들이 발전하고 있는 가운데 데이터 사이언스의 역량을 필요로 하는 직군 또한 넓어지고 있다. 본 논문에서는 데이터 사이언스에 막 뛰어든 입문자들이 고난이도의 코딩 없이 데이터 분석 및 전처리, 머신러닝에 익숙해질 수 있도록 디자인적 접근성을 고려한 코드리스 프로그램을 개발하였다.

  • PDF

Analyzing and Visualizing the Intellectual Structure of Data Science (데이터사이언스 연구의 지적 구조 분석 및 시각화)

  • Park, Hyoungjoo
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.7
    • /
    • pp.18-29
    • /
    • 2022
  • The purpose of this exploratory study is to examine the intellectual structure of data science. For this purpose, this research examined a total of 17,997 bibliographies on data science indexed in Web of Science(WoS) of Clarivate Analytics from 2012 to 2021. This research applied methods such as descriptive analysis, citation analysis, co-author network analysis, co-occurrence network analysis, bibliographic coupling analysis, and co-citation analysis. This research contributes to finding the research directions of future data science topics.

A Study on the Curriculums of Data Science (데이터 사이언스 교과과정에 대한 연구)

  • Yi, Myongho
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.27 no.1
    • /
    • pp.263-290
    • /
    • 2016
  • The purpose of this study is to compare seven data science programs in Korea and ten data science programs in the US. Results show that 14 data science programs are housed in graduate schools. 10% of data science courses in Korea and 26% in the US fall under the Math and Statistics Knowledge area, one of the three areas defined by Conway. The syllabus analysis does not show much differences in terms of class contents and grading. The results of this study can be used to design data science programs that are more effective and well-grounded.

The development of an AI-Based Platform for Identifying and Matching Promising Influencers (AI 기반 유망 인플루언서 발굴 및 매칭 플랫폼 개발)

  • Yura Cho;Eunsoo Kim;Juyeon Kim;Yejin Kim;ChaeWon Han
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.926-927
    • /
    • 2023
  • 본 논문은 인플루언서 매칭 서비스를 위한 데이터 수집 및 분석 방법, 매칭 및 성과 모니터링 알고리즘, 웹 서비스 구현에 대해 말하고 있다. 매칭 알고리즘은 사용자가 원하는 인플루언서를 맞춤형으로 제공하며, 성과 모니터링을 이용해 유의미한 자료를 시각화하여 제공한다.

Distance-Based Emergency Canine Blood Transfusion Matching Algorithm and Application (거리 기반 반려견 긴급 수혈 매칭 알고리즘 및 어플리케이션 개발)

  • Yura Cho;Eunsoo Kim;Juyeon Kim;YeJin Kim;ChaeWon Han
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.892-893
    • /
    • 2023
  • 본 어플리케이션은 반려견의 건강 데이터와 한국헌혈견협회에서 제공하는 수혈 기준을 기반으로 수혈 가능 여부를 분류한 뒤, 거리를 기반으로 긴급 수혈을 매칭하는 알고리즘을 구현한다. 또한 긴급 수혈의 긴급성을 고려하여, 실시간 게시판 운영 및 협회 지정 병원의 혈액 잔여량을 시각화한다.

Big Query execution for FHIR objects on Google Cloud (구글 클라우드 FHIR 객체의 Big Query 수행)

  • Soyeon Kim;Minchae Kim;Jooeun Jin;Nayeon Kim;Junghoon Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.269-270
    • /
    • 2023
  • 본 논문에서는 구글 클라우드에 1차적으로 저장된 Healthcare API 서비스의 FHIR 객체들을 Big Query 서비스로 전환하고 질의를 작성하여 결과를 확인하는 과정을 설명한다. 이 과정에서 IAM을 위한 Big Query 테이블로의 입력 권한 부여 과정과 중첩된 필드들을 포함하고 있는 FHIR 객체의 명세과정이 핵심적인 단계가 되고 있으며 위 서비스들의 연계에 의해 대용량의 의료정보들이 구글 클라우드 상에 저장되고 사전분석되어 추가적인 정밀 분석을 위한 기저 자료를 제공할 수 있다.