• Title/Summary/Keyword: 데이터과학과

Search Result 5,237, Processing Time 0.033 seconds

A Design of Metadata Conversion Tool for Research Paper (학술논문 메타데이터 변환 도구의 설계)

  • Lee, Min-Ho;Lee, Won-Goo;Yoon, Hwa-Mook;Sung, Won-Kyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1222-1225
    • /
    • 2011
  • 대량의 데이터를 분석하여 보다 차원 높은 정보서비스를 제공하기 위해서는 다양한 데이터의 통합관리가 필수적이다. 특히 과학기술 분야에서는 논문 메타데이터를 분석하여 연구동향 파악, 선도 연구자 파악 등을 하기 위한 연구가 진행 중이다. 논문 메타 데이터의 통합 관리를 위해서는 메타데이터 스키마의 매핑과 데이터 변환이 필요한데, 본 논문에서는 논문 메타데이터 변환에서의 문제를 분석하여 보고, 해결하기 위한 방법을 제시하였다. 또한 다양한 구문을 지원하면서 스키마에 유연하여 시스템 수정이 필요없는 도구를 설계하였다.

Legislation Cases, Management Policies and Countermeasures on Scientific Data -Focusing Australia, the United States and China- (과학데이터에 관한 입법례와 관리정책 그리고 대응방안 -호주, 미국, 중국을 중심으로-)

  • Yoon, Chong-Min;Kim, Kyubin
    • Journal of Korea Technology Innovation Society
    • /
    • v.16 no.1
    • /
    • pp.63-100
    • /
    • 2013
  • Research data means data in the form of facts, observations, images, computer program results, recordings, measurements or experiences on which an argument, theory, test or hypothesis, or another research output is based. Data may be numerical, descriptive, visual or tactile. Scientific research is changing because of the paradigm shift. It is all being affected by the data deluge, and a data-intensive science paradigm is emerging. Hence, paradigm shift in scientific research led to increase of value and importance of scientific data. Essential to the creative research and development for scientific data can be reused efficiently is the sharing and utilization of establishing management system. Establishing of management system for sharing and utilization of scientific data should be done at the national level, but compared with Europe, Australia, the United States, China, the management system of Korea doesn't have not linkage or efficiency or internal stability. Australia, the United States, China continues to expand a Mid- and Long-Term policy making, legislation, its investment in infrastructure, so as to promote the utilization of data, such as collection, management and maintenance of scientific data through the relevant agencies at the national level. This study consider legislation cases and management policies of the above countries to the end to that establish management system for the efficient and fair sharing and utilization of scientific data and the legal system, and that provide scientific data legislation and policies related to the future of our country.

  • PDF

Curriculum of Basic Data Science Practices for Non-majors (비전공자 대상 기초 데이터과학 실습 커리큘럼)

  • Hur, Kyeong
    • Journal of Practical Engineering Education
    • /
    • v.12 no.2
    • /
    • pp.265-273
    • /
    • 2020
  • In this paper, to design a basic data science practice curriculum as a liberal arts subject for non-majors, we proposed an educational method using an Excel(spreadsheet) data analysis tool. Tools for data collection, data processing, and data analysis include Excel, R, Python, and Structured Query Language (SQL). When it comes to practicing data science, R, Python and SQL need to understand programming languages and data structures together. On the other hand, the Excel tool is a data analysis tool familiar to the general public, and it does not have the burden of learning a programming language. And if you practice basic data science practice with Excel, you have the advantage of being able to concentrate on acquiring data science content. In this paper, a basic data science practice curriculum for one semester and weekly Excel practice contents were proposed. And, to demonstrate the substance of the educational content, examples of Linear Regression Analysis were presented using Excel data analysis tools.

A Study on Developing Metadata Elements and Database of the Science Information for Youth (청소년 과학정보 메타데이터 요소 및 데이터베이스 구축 연구)

  • Kwak, Seung-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.38 no.1
    • /
    • pp.263-279
    • /
    • 2004
  • This study intends to design a metadata service system of the science information for youth on the web based on the efficiency of the metadata system. Metadata scheme of the science information for youth on the web has been developed and designed metadata collection on the basis of the previously designed classification system. Metadata scheme of the science information for youth, which is consisted of six essential elements and four additional elements, has been brought out, compared to not only Dublin Core Metadata Element Set, but also the main studies related to domestic and foreign metadata projects. Based on the results of it, metadata database of the science information has been designed and it is expected to be applicable to metadata service system of the science information for youth on the web.

Analysis and Implications of Australian National Data Service(ANDS) (오스트레일리아의 과학데이터 서비스체제(ANDS) 분석과 시사점)

  • Park, Dong-Jin
    • Journal of Digital Convergence
    • /
    • v.9 no.3
    • /
    • pp.1-10
    • /
    • 2011
  • Our country does not currently have a concrete policy for the management and preservation of the scientific dataset on the national level. The scientists and the research groups that are implementing a research project are not capable of searching or sharing the information about the dataset. In this situation where there is a major increase in the number of researches that use digitalized dataset, being able to share and reuse the scientific data amongst researchers is recognized to be very important. Therefore our country needs a new formulated policy that manages scientific data on the national level. This paper helps to find the implications of the strategic planning in our country by analyzing previous advanced case studies done by foreign countries. We selected Australia as our subject because its intensive government-driven research environment, research infrastructure and information service are very similar to Korea. To be specific, we analyzed ANDS (Australian National Data Service) and drew out the implications that could be applied to our country also. And finally we propose the basic principles that needs to be mirrored when formulating a policy on our country's scientific data.

Collecting valid facial image dataset using face recognition (얼굴 인식기를 통한 커스텀 데이터의 효율적 수집)

  • Choi, Hee-jo;Kim, Sang-Joon;Lee, Yu-jin;Park, Kyung-moo;Kim, Chung-hwa;Park, Goo-man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.255-256
    • /
    • 2020
  • 인물에 대한 얼굴 이미지 데이터를 수집할 때 유효하지 않은 데이터를 수작업으로 걸러내는 것은 많은 시간과 인력의 투자를 필요로 한다. 얼굴 데이터 셋을 생성할 때 FaceNet을 거쳐 불필요한 정보들을 미리 걸러내고, 사람이 직접 얼굴 데이터의 유효성을 체크하는 수고를 덜어 얼굴 데이터 셋 생성에 있어서의 번거로움을 줄이고자한다. 본 논문에서는 FaceNet을 통해서 얼굴 이미지 데이터에 대한 데이터 수집 시, 더욱 좋은 성능으로 정제된 데이터 셋을 생성하고자 하였다.

  • PDF

Reproducibility Approach for Enhancing Accessibility of Deep Learning Models Using the Korea Research Data Commons (국가연구데이터커먼즈를 활용한 딥러닝 학습 모델 접근성 향상을 위한 재현 방안)

  • Sang-baek Lee;Dasol Kim;Sa-kwang Song;Minhee Cho;Mikyung Lee;Hyung-Jun Yim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.311-313
    • /
    • 2023
  • 딥러닝에 대한 관심이 증가함에 따라 다양한 분야의 연구자 사이에 딥러닝 모델의 적용 및 재현이 중요한 작업으로 자리잡았다. 하지만 모델을 재현하고 활용하는데 있어 다양한 환경과 자원의 한계가 발생하여 문제가 되고 있다. 이러한 문제를 해결하기 위해 본 논문에서는 국가연구데이터커먼즈체계인 KRDC 프레임워크를 활용하여 딥러닝 학습 모델의 재현 방안을 제안하였다. 이를 통해 딥러닝 연구에 익숙하지 않은 사용자도 학습 모델의 적용 및 활용을 용이하게 할 수 있음을 확인하였다. KRDC 프레임워크는 사용자가 원하는 데이터와 태스크를 정의하고, 워크플로우로 구성, 학습 모델의 재현 및 활용을 지원한다.

KorSciQA: A Dataset for Machine Comprehension of Korean Scientific Paper (KorSciQA: 한국어 논문의 기계독해 데이터셋)

  • Hahm, Younggyun;Jeong, Youngbin;Jeong, Heeseok;Hwang, Hyekyong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.207-212
    • /
    • 2019
  • 본 논문에서는 한국어로 쓰여진 과학기술 논문에 대한 기계독해 과제(일명 KorSciQA)를 제안하고자 하며, 그와 수반하는 데이터 구축 및 평가를 보고한다. 다양한 제약조건이 부가된 크라우드소싱 디자인을 통하여, 498개의 논문 초록에 대해 일관성 있는 품질의 2,490개의 질의응답으로 구성된 기계독해 데이터셋을 구축하였다. 이 데이터셋은 어느 논문에서나 나타나는 논박 요소들인 논의하는 문제, 푸는 방법, 관련 데이터, 모델 등과 밀접한 질문으로 구성되고, 각 논박 요소의 의미, 목적, 이유 파악 및 다양한 추론을 하여 답을 할 수 있는 것이다. 구축된 KorSciQA 데이터셋은 실험을 통하여 기존의 기계독해 모델의 독해력으로는 풀기 어려운 도전과제로 평가되었다.

  • PDF

Construction of NTIS Data Standard Management System (NTIS 데이터표준 관리시스템 구축)

  • Yang, Jin-Hyuk;Kim, Jin-Man;Lee, Byeong-Hee;Kim, Jae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.120-121
    • /
    • 2010
  • 저품질의 데이터는 데이터양이 증가함에 따라 조직의 시스템 관리비용을 증가시키는 문제점을 야기 시킨다. 이에 KISTI에서는 고품질의 데이터 확보를 위해 데이터 품질관리 활동을 수행하고 있다. 본 논문에서는 국가과학기술지식정보서비스(NTIS)에서 다루고 있는 국가R&D정보에 대한 데이터표준 관리시스템에 대하여 알아본다. 구축된 시스템 활용을 통하여 일관성 있는 데이터 표준관리가 가능할 것으로 기대한다.

An Inference System for Deep Learning Model Based on Real-time Big Data (실시간 빅데이터 기반 딥러닝 모델 추론 시스템)

  • Park, Kyongseok;Yu, Chan Hee;Kim, Yuseon;Um, Jung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.736-737
    • /
    • 2021
  • 최근의 빅데이터 처리 환경은 실시간 빅데이터를 기반으로 하고 있다. 실시간 빅데이터 처리를 위해서는 기존의 배치처리 방식의 빅데이터 기술에서 발생하는 기술적 요구를 포함하여 추가적으로 요구되는 다양한 문제들을 고려해야 한다. 기계학습 모형을 활용한 의사결정 지원 시스템의 경우 모형 개발을 위한 배치처리 기술과 함께 모형의 배포와 최적화 등도 고려되어야 하며 발전 설비나 제조, 공정, 배송 등의 분야에서 발생하는 대규모 실시간 데이터를 이용하여 추론을 수행해야 한다. 본 연구에서는 센서 데이터를 활용한 예측 모형 개발과 실시간 데이터 처리 그리고 추론을 위한 모델 배포와 최적화 과정을 지원하는 시스템 환경을 제공하여 실제 현장에서 발생하고 있는 데이터를 활용하여 실증을 수행하였다.