• 제목/요약/키워드: 데이터 사이언스

검색결과 303건 처리시간 0.028초

사이언스 빅 데이터(Science Big Data) 처리 기술 동향

  • 김희재;주경노;윤찬현
    • 정보와 통신
    • /
    • 제29권11호
    • /
    • pp.11-23
    • /
    • 2012
  • 본 고에서는 과학 분야에서의 대용량 데이터 처리를 위한 기술인 사이언스 빅데이터의 처리 기술 동향에 대하여 기술한다. 서론에서 사이언스 빅데이터의 정의 및 필요성을 다루고, 본론에서는 데이터 중심 과학 패러다임의 등장과 그로 인한 사이언스 빅데이터 요구사항, 사이언스 빅데이터 소스 수집 및 정제, 저장 및 관리, 처리, 분석 등으로 이루어지는 사이언스 빅데이터 처리 기법에 대하여 기술한다. 또한 현재 다양한 기관에서 연구하고 있는 사이언스 빅데이터 플랫폼, 맵리듀스 등을 이용한 워크플로우 제어 기반의 사이언스 빅데이터 처리 기법을 예시로 소개한다.

국내 데이터사이언스 학위 및 교과 운영 현황과 문헌정보학과로의 함의 (Data Science Degree and Curriculum in Korea and its Implications for the Information Field)

  • 박형주;이희진
    • 한국도서관정보학회지
    • /
    • 제53권3호
    • /
    • pp.431-454
    • /
    • 2022
  • 본 연구의 목적은 국내 대학에서 수여하는 데이터사이언스 학위 및 교과 운영 현황과 국내외 정보대학의 데이터사이언스 교과 운영 현황을 이해함으로써, 국내 문헌정보학과의 데이터사이언스 교과 운영에 대한 함의를 살펴보는 것이다. 데이터 수집의 대상은 2022년 한국교육개발원에서 공개한 국내 439개 학교의 데이터사이언스 학위였다. 분석의 대상은 데이터사이언스 학위를 운영하는 국내의 대학교, 단과대학, 학부, 학과, 세부 전공, 연계전공, 융합전공, 마이크로 학위, 나노 학위, 트랙, 모듈, 산학협동 과정 등이었다. 교과 분석을 위해서 국내 데이터사이언스 학위 과정에 개설된 1,148개의 교과 명을 분석했다. 국내 문헌정보학과 학사 과정의 1,325개의 교과 명을 분석해서 국내 문헌정보학과의 데이터사이언스 교과 운영 현황을 확인했다. 국내의 데이터사이언스 학위는 개론, 기술, 실습, 응용, 심화 교과 등 데이터사이언스 교과를 골고루 개설하고 있었다. 국내 문헌정보학과는 데이터사이언스와 관련된 교과 개설에 적극적이지 않았으나, 개설한 경우에는 데이터사이언스 개론, 데이터베이스, 데이터시각화, 데이터큐레이션, 메타데이터, 빅데이터, 정보 기술 교과가 개설되어 있었다. 본 연구의 결과는 문헌정보학의 관점에서 데이터사이언스 학위 과정, 세부 전공, 연계전공, 융합전공, 마이크로 학위, 나노 학위, 연계 트랙, 모듈, 산학협동과정 등의 교과의 개발 및 개정에 필요한 논의의 기초 자료로 활용되기를 기대한다.

데이터사이언스 관련 교과목의 강의 계획서 분석: ALA의 인가를 받은 문헌정보학 프로그램을 중심으로 (An Examination of the Course Syllabi related to Data Science at the ALA-accredited Library and Information Science Programs)

  • 박형주
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.119-143
    • /
    • 2022
  • 본 연구는 미국도서관협회(American Library Association, ALA)의 인가를 받은 문헌정보학 프로그램에서 제공하는 데이터사이언스와 관련된 수업의 내용을 조사했다. 연구의 목적은 강의 계획서의 내용 분석을 통해 해당 수업에서 다뤄지는 교과목 명, 교과 설명, 학습 목표, 주차 별 주제를 살펴보는 것이다. 문헌정보학 프로그램에서의 데이터사이언스와 관련된 필수 과목 및 선택 과목은, 데이터사이언스 개론, 데이터 마이닝, 데이터베이스, 데이터 분석, 데이터 시각화, 데이터 큐레이션 및 관리, 머신 러닝, 메타데이터, 컴퓨터 프로그래밍 등 데이터사이언스 전 분야에 걸쳐 다양하게 교과목이 개설되어 있었다. 본 연구의 결과는 문헌정보학 프로그램에서 데이터사이언스 교과 과정을 개설 및 개정할 때 논의의 시작점이 될 수 있는 기초 자료가 되어 운영 역량을 강화하는데 활용되기를 기대한다.

데이터 사이언스와 데이터 리터러시 (Data science and data literacy)

  • 이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2015년도 제22회 학술대회 논문집
    • /
    • pp.11-15
    • /
    • 2015
  • 데이터 사이언스가 경영, 학술, 교육 등의 전 영역에 확산되면서 변화를 이끌어내고 있다. 문헌정보학과 도서관의 입장에서 데이터 사이언스라는 대세를 수용하는 전략에 대해서 데이터 리터러시를 중심으로 살펴보았다. 연구 데이터 리터러시, 통계 데이터 리터러시, 실무 데이터 리터러시의 세 가지로 나누어 살펴본 결과, 데이터 리터러시는 데이터와 관련된 기술과 역량을 강조하는 용어로서 문헌정보학과 도서관 현장에서 데이터 사이언스를 주도적인 입장에서 수용하는 브랜드로 육성시킬 필요가 있다고 판단된다.

  • PDF

Codeless 데이터 사이언스 학습 소프트웨어 (Codeless Data Science Learning Software)

  • 최효현;송다혜
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.507-508
    • /
    • 2021
  • 4차산업 혁명시대가 도래하고, 클라우드 컴퓨팅의 발전과 동시에 데이터 처리 효율과 속도가 높아지면서, 지속적으로 다양한 분야의 데이터가 누적되고, 이를 활용한 기술들이 발전하고 있는 가운데 데이터 사이언스의 역량을 필요로 하는 직군 또한 넓어지고 있다. 본 논문에서는 데이터 사이언스에 막 뛰어든 입문자들이 고난이도의 코딩 없이 데이터 분석 및 전처리, 머신러닝에 익숙해질 수 있도록 디자인적 접근성을 고려한 코드리스 프로그램을 개발하였다.

  • PDF

데이터사이언스 연구의 지적 구조 분석 및 시각화 (Analyzing and Visualizing the Intellectual Structure of Data Science)

  • 박형주
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.18-29
    • /
    • 2022
  • 본 탐색적 연구의 목적은 데이터사이언스 관련 논문의 연구 동향을 분석하는 것이다. 본 연구는 Clarivate Analytics사의 Web of Science(WoS)에 색인된 데이터사이언스 관련 논문을 분석의 대상으로 했다. 2012년부터 2021년까지 WoS에 색인된 데이터사이언스 관련 논문 총 17,997편을 분석했다. 데이터사이언스 연구의 지적 구조를 집중 분석하기 위해 기술 분석, 인용 분석, 공동 저자 네트워크 분석, 동시 출현 네트워크 분석, 서지 결합 분석, 동시 인용 분석을 수행했다. 본 연구의 결과는 향후 데이터사이언스 관련 연구의 방향성 모색에 유용하게 사용될 수 있다.

데이터 사이언스 교과과정에 대한 연구 (A Study on the Curriculums of Data Science)

  • 이명호
    • 한국비블리아학회지
    • /
    • 제27권1호
    • /
    • pp.263-290
    • /
    • 2016
  • 본 연구는 국내외 데이터 사이언티스트(Data Scientist) 양성을 위한 데이터 사이언스(Data Science) 프로그램의 교과과정을 분석하였다. 이를 위해 국내 7개 대학교와 미국의 10개 대학교를 분석하였다. 14개의 데이터 사이언스 과정이 대학원 중심으로 운영되고 있는 것으로 나타났다. Conway의 데이터 사이언스 3대 영역 중 수학 및 통계 지식 영역에 국내는 10% 그리고 미국은 26%가 치중되어 있는 것으로 분석되었다. 강의계획서 분석에서 수업내용 및 평가 방법은 국내외가 유사한 것으로 나타났다. 본 연구 결과는 국내 데이터 사이언스 교과과정 개발에 기초 자료로 활용될 수 있을 것이다.

AI 기반 유망 인플루언서 발굴 및 매칭 플랫폼 개발 (The development of an AI-Based Platform for Identifying and Matching Promising Influencers)

  • 조유라;김은수;김주연;김예진;한채원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.926-927
    • /
    • 2023
  • 본 논문은 인플루언서 매칭 서비스를 위한 데이터 수집 및 분석 방법, 매칭 및 성과 모니터링 알고리즘, 웹 서비스 구현에 대해 말하고 있다. 매칭 알고리즘은 사용자가 원하는 인플루언서를 맞춤형으로 제공하며, 성과 모니터링을 이용해 유의미한 자료를 시각화하여 제공한다.

거리 기반 반려견 긴급 수혈 매칭 알고리즘 및 어플리케이션 개발 (Distance-Based Emergency Canine Blood Transfusion Matching Algorithm and Application)

  • 조유라;김은수;김주연;김예진;한채원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.892-893
    • /
    • 2023
  • 본 어플리케이션은 반려견의 건강 데이터와 한국헌혈견협회에서 제공하는 수혈 기준을 기반으로 수혈 가능 여부를 분류한 뒤, 거리를 기반으로 긴급 수혈을 매칭하는 알고리즘을 구현한다. 또한 긴급 수혈의 긴급성을 고려하여, 실시간 게시판 운영 및 협회 지정 병원의 혈액 잔여량을 시각화한다.

구글 클라우드 FHIR 객체의 Big Query 수행 (Big Query execution for FHIR objects on Google Cloud)

  • 김소연;김민채;진주은;김나연;이정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.269-270
    • /
    • 2023
  • 본 논문에서는 구글 클라우드에 1차적으로 저장된 Healthcare API 서비스의 FHIR 객체들을 Big Query 서비스로 전환하고 질의를 작성하여 결과를 확인하는 과정을 설명한다. 이 과정에서 IAM을 위한 Big Query 테이블로의 입력 권한 부여 과정과 중첩된 필드들을 포함하고 있는 FHIR 객체의 명세과정이 핵심적인 단계가 되고 있으며 위 서비스들의 연계에 의해 대용량의 의료정보들이 구글 클라우드 상에 저장되고 사전분석되어 추가적인 정밀 분석을 위한 기저 자료를 제공할 수 있다.