• Title/Summary/Keyword: 데이터과학자

Search Result 604, Processing Time 0.023 seconds

A Study on Entrance Evaluation System for Data Scientist Postgraduate Program (대학원 데이터 과학자 과정 입학 평가 체계 분석)

  • Kim, MiJeong;Kim, JaMee;Lee, WonGyu
    • The Journal of Korean Association of Computer Education
    • /
    • v.23 no.3
    • /
    • pp.49-58
    • /
    • 2020
  • Organizing entrance evaluation system for selecting students who can become expert in data science field according to need of the age and social demand is important. This study was conducted for the purpose of analyzing data science field graduate school entrance evaluation system and deriving implications after taking into account the importance of talents possessing convergence competency. For this aim, a total of 22 graduate schools in 7 countries have been selected targeting data scientist postgraduate program around the world. The selected graduate schools have been analyzed based on qualifications, necessary skills prior to entrance, entrance conditions, and selection methods. As a result of the analysis, 'graduate school which I can apply for regardless of possessing undergraduate degree or undergraduate major (63.6 percent)' in qualifications category, 'graduate school which mentioned skills required in completing master's degree prior to entrance (63.6 percent)' in skills required prior to entrance category, 'graduate school which does not mention separate entrance condition (81.8 percent)' in entrance conditions category, and 'graduate school selecting students merely based on document screening (68.2 percent)' in selection methods category took the highest portion. Based on the above, this study summarized the results of the data scientist process and suggested implications for objectifying admission evaluation.

Secure Multi-Party Computation Based on Homomorphic Encryption for Privacy Preserving in IoT Networks (IoT 네트워크에서 프라이버시 보호를 위한 동형암호화에 기반의 안전한 다자간 계산)

  • CHEN, Hao-Tian;Kim, Tae Woo;Park, Ji Su;Park, Jong Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.189-192
    • /
    • 2021
  • 5G와 사물인터넷(IoT) 시대에 데이터의 크로스컴퓨팅은 연구, 의료, 금융, 민생 분야 등에 더 많은 지원을 할 수 있고 프라이버시 안전성이 중요해지고 있다. SMPC (Secure Multi-party Computation)은 서로 믿지 않는 참여자 간의 프라이버시 보호 시너지 컴퓨팅 문제를 해결하고, 데이터 수요자에게 원본 데이터를 누설하지 않는 범위 하에서의 다자간 컴퓨팅 능력을 제공한다. IoT 장치는 전력 소모와 지연에 제한을 받기 때문에 대부분의 장치가 여전히 경량화 보안 메커니즘에 속하고 IoT에서 트래픽의 데이터 통합관리가 어렵기 때문에 통신 중 신원인식과 데이터를 주고받는 단계에서 프라이버시 유출의 문제가 발생할 수 있고 심지어 DDOS공격, RelayAttack공격 등 사이버의 목적이 될 수도 있다. 본 논문에서 IoT 네트워크 데이터 통신 특징을 분석하고 동형 암호에 기반의 SMPC 연산 아키텍처를 제안한다. 제안하는 이키텍처에서 동형 암호를 사용함으로써 장치 데이터의 안전을 보장하는 동시에 전체 네트워크 안전성도 확보한다. SMPC 및 동형암호 기술의 지속적 발전에 따라 제안하는 아키텍처가 계속 개선할 잠재력이 있다.

Improvement of Learner's learning Style Diagnosis System using Visualization Method (시각화 방법을 이용한 학습자의 학습 성향 진단 시스템의 개선)

  • Yoon, Tae-Bok;Choi, Mi-Ae;Lee, Jee-Hyong;Kim, Yong-Se
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.3
    • /
    • pp.226-230
    • /
    • 2009
  • Intelligent Tutoring System (ITS) is a procedure of analyzing collected data for teaming, making a strategy and performing adequate service for learners. To perform suitable service for learners, modeling is the first step to collect data from the process of their learning. The model, however, cannot be authentic if collected data can contain learners' inconsistent behaviors or unpredictable learning inclination. This study focused on how to sort normal and abnormal data by analyzing collected data from learners through visualization. A model has been set up to assort unusual data from collected learner's data by using DOLLS-HI which makes possible to diagnose learner's learning propensity based on housing interior learning contents in the experiment. The created model has been confirmed its improved reliability comparing to previous one.

해외안테나 - 분산 데이터와 주목받는 콜래버레이션

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.2 s.57
    • /
    • pp.16-25
    • /
    • 1998
  • 시간과 공간의 벽을 넘은 각각의 잠재적 콜래버레이터의 의미는 가상의 리서치 팀이 분산된 데이터 기록과 높은 해상도, 하이모드의 콜래버레이션 환경을 통해 재빨리 조립될 수 있다는 것이다. 최근 실험 과학자나 엔지니어들은 언제나 국제 여행을 즐길 수 있고, 동료를 만날 수 있으며, 넓게 분산된 사이트에 있는 데이터를 분석할 수 있다. 또, 천문학자들은 마우나 키, 키트 픽, 허블 스페이스 텔레스코프 과학 기관, 국제 라디오 천문학 관측소 등에서 시간을 보내며, 각 사이트별 기구의 특수 기능을 탐험하고 다른 콜래버레이터들에 의해 획득된 다양한 데이터를 수집할 수 있다.

  • PDF

Building Sentiment-Annotated Datasets for Training a FbSA model based on the SSP methodology (반자동 언어데이터 증강 방식에 기반한 FbSA 모델 학습을 위한 감성주석 데이터셋 FeSAD 구축)

  • Yoon, Jeong-Woo;Hwang, Chang-Hoe;Choi, Su-Won;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.66-71
    • /
    • 2021
  • 본 연구는 한국어 자질 기반 감성분석(Feature-based Sentiment Analysis: FbSA)을 위한 대규모의 학습데이터 구축에 있어 반자동 언어데이터 증강 기법(SSP: Semi-automatic Symbolic Propagation)에 입각한 자질-감성 주석 데이터셋 FeSAD(Feature-Sentiment-Annotated Dataset)의 개발 과정과 성능 평가를 소개하는 것을 목표로 한다. FeSAD는 언어자원을 활용한 SSP 1단계 주석 이후, 작업자의 주석이 2단계에서 이루어지는 2-STEP 주석 과정을 통해 구축된다. SSP 주석을 위한 언어자원에는 부분 문법 그래프(Local Grammar Graph: LGG) 스키마와 한국어 기계가독형 전자사전 DECO(Dictionnaire Electronique du COréen)가 활용되며, 본 연구에서는 7개의 도메인(코스메틱, IT제품, 패션/의류, 푸드/배달음식, 가구/인테리어, 핀테크앱, KPOP)에 대해, 오피니언 트리플이 주석된 FeSAD 데이터셋을 구축하는 프로세싱을 소개하였다. 코스메틱(COS)과 푸드/배달음식(FOO) 두 도메인에 대해, 언어자원을 활용한 1단계 SSP 주석 성능을 평가한 결과, 각각 F1-score 0.93과 0.90의 성능을 보였으며, 이를 통해 FbSA용 학습데이터 주석을 위한 작업자의 작업이 기존 작업의 10% 이하의 비중으로 감소함으로써, 학습데이터 구축을 위한 프로세싱의 소요시간과 품질이 획기적으로 개선될 수 있음을 확인하였다.

  • PDF

Design of Standard Metadata Schema for Computing Resource Management (컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마 설계)

  • Lee, Mikyoung;Cho, Minhee;Song, Sa-Kwang;Yim, Hyung-Jun
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.433-435
    • /
    • 2022
  • In this paper, we introduce a computing resource standard metadata schema design plan for registering, retrieving, and managing computing resources used for research data analysis and utilization in the Korea Research Data Commons(KRDC). KRDC is a joint utilization system of research data and computing resources to maximize the sharing and utilization of research data. Computing resources refer to all resources in the computing environment, such as analysis infrastructure and analysis software, necessary to analyze and utilize research data used in the entire research process. The standard metadata schema for KRDC computing resource management is designed by considering common attributes for computing resource management and other attributes according to each computing resource feature. The standard metadata schema for computing resource management consists of a computing resource metadata schema and a computing resource provider metadata schema. In addition, the metadata schema of computing resources and providers was designed as a service schema and a system schema group according to their characteristics. The standard metadata schema designed in this paper is used for computing resource registration, retrieval, management, and workflow services for computing resource providers and computing resource users through the KRDC web service, and is designed in a scalable form for various computing resource links.

  • PDF

A Design of Data Flow based Automatic Code Generator for Embedded System (데이터 흐름을 반영하는 임베디드 시스템의 코드 자동 생성기 설계)

  • Lee, Byeong-Yong;Ryu, Ho-Dong;Kwon, JIn-Wook;Seok, Mi-Heui;Lee, Woo Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.56-59
    • /
    • 2010
  • 오늘날 임베디드 환경에서의 하드웨어의 발전에 더불어, 소프트웨어의 복잡도가 점점 증가하고, 유지보수에 대한 비용이 증가함에 따라 UML모델을 이용한 자동코드 생성에 대한 관심이 더욱 커지고 있다. UML을 이용한 코드 생성의 효과적으로 이루어지기 위해서는 설계된 모델의 무결성이 요구되고 이를 위해서는 모델의 논리적 검증이 선행되어야 한다. 아울러 설계자로 하여금 정의하는 모델이 명확하게 이해되고 구현될 있어야 한다. 하지만 코드 생성의 행위적 관점의 기본이 되는 상태머신 다이어그램에서 잘 드러나는 흐름과는 다르게 데이터의 사용은 다이어그램 내부에 숨겨져 있어 설계자로 하여금 모델에 대한 이해를 어렵게 하고 잠재적인 에러의 내포 가능성이 제기되어 왔다. 본 논문은 이러한 문제의 해결을 위해 코드 내포 상태머신 다이어그램의 데이터 시각화기법을 이용하고, 이러한 시각화 기법을 이용하여 데이터 사용관점에서의 모델의 이해를 도움과 동시에 이를 통하여 더욱 정확한 모델링을 수행하고 더불어 이를 통해 최종적으로는 더욱 효율적인 형태의 코드를 생성하는 코드 자동 생성기의 설계를 제안 한다.

Comparative Analysis on the Structure of the Record and the Methods of Content Designation of the MARC (MARC 레코드의 구조(構造)와 내용표지법(內容標識法)에 관한 비교(比較) 및 분석(分析))

  • Oh, Dong-Keun
    • Journal of Information Management
    • /
    • v.22 no.2
    • /
    • pp.29-46
    • /
    • 1991
  • This study intends to compare the structure of the record and the methods of content designation of the MARC formats based on UNIMARC, USMARC, KOMARC, CHINESE MARC and JAPAN MARC. The structure of the formats takes the similar form to base on ISO 2709. The methods of content designation of the fixed fields is analyzed into 6 categories. And of the content designators, JAPAN MARC does not use indicator.

  • PDF

The Current State and Tasks of Citizen Science in Korea (한국 시민과학의 현황과 과제)

  • Park, Jin Hee
    • Journal of Science and Technology Studies
    • /
    • v.18 no.2
    • /
    • pp.7-41
    • /
    • 2018
  • The projects of citizen science which is originated from citizen data collecting action driven by governmental institutes and science associations have been implemented with different form of collaboration with scientists. The themes of citizen science has extended from the ecology to astronomy, distributed computing, and particle physics. Citizen science could contribute to the advancement of science through cost-effective science research based on citizen volunteer data collecting. In addition, citizen science enhance the public understanding of science by increasing knowledge of citizen participants. The community-led citizen science projects could raise public awareness of environmental problems and promote the participation in environmental problem-solving. Citizen science projects based on local tacit knowledge can be of benefit to the local environmental policy decision making and implementation of policy. These social values of citizen science make many countries develop promoting policies of citizen science. The korean government also has introduced some citizen science projects. However there are some obstacles, such as low participation of citizen and scientists in projects which the government has to overcome in order to promote citizen science. It is important that scientists could recognize values of citizen science through the successful government driven citizen science projects and the evaluation tool of scientific career could be modified in order to promote scientist's participation. The project management should be well planned to intensify citizen participation. The government should prepare open data policy which could support a data reliability of the community-led monitoring projects. It is also desirable that a citizen science network could be made with the purpose of sharing best practices of citizen science.

Comparison of Three Preservice Elementary School Teachers' Simulation Teaching in Terms of Data-text Transforming Discourses (Data-Text 변형 담화의 측면에서 본 세 초등 예비교사의 모의수업 시연 사례의 비교)

  • Maeng, Seungho
    • Journal of Korean Elementary Science Education
    • /
    • v.41 no.1
    • /
    • pp.93-105
    • /
    • 2022
  • This study investigated the aspects of how three preservice elementary school teachers conducted the data-text transforming discourses in their science simulation teaching and how their epistemological conversations worked for learners' construction of scientific knowledge. Three preservice teachers, who had presented simulation teaching on the seasonal change of constellations, participated in the study. The results revealed that one preservice teacher, who had implemented the transforming discourses of data-to-evidence and model-to-explanation, appeared to facilitate learners' knowledge construction. The other two preservice teachers had difficulty helping learners construct science knowledge due to their lack of transforming discourses. What we should consider for improving preservice elementary school teachers' teaching competencies was discussed based on a detailed comparison of three cases of preservice teachers' data-text transforming.