• Title/Summary/Keyword: 데이터과학자

Search Result 591, Processing Time 0.029 seconds

A Construction of Management System and Its Portal Site for NTIS Data Quality Management (NTIS 데이터 품질관리 체계와 포털 사이트 구축)

  • Lee, Byeong-Hee;Jung, Ock-Nam;Choi, Heeseok;Lim, ChulSu;Kim, Jaesoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.984-987
    • /
    • 2009
  • 데이터가 기업 및 기관 활동의 중요한 자산으로 인식이 높아지고 있지만 저 품질 데이터로 인한 막대한 손실과 비용의 증가는 큰 문제가 되고 있다. 본 논문에서는 교육과학기술부와 KISTI에서 2007년부터 범부처 차원에서 수행중인 국가R&D 정보자원의 데이터 품질관리를 위해 각 부처와 협의하고 수행해 온 국가R&D 데이터 품질관리 체계 수립과 포털 사이트 구축에 관하여 알아본다. 범부처 국가R&D정보 자원의 데이터 품질관리체계 수립과 범부처 적용 지침 및 가이드라인 제시를 위해 NTIS사업단 및 15개 부처(16개 대표전문기관)의 실무팀장 및 DB 관리자 중심으로 총 33명의 설문을 실시하여 품질관리체계 현황을 조사 분석하였다. 또한 부처(기관)별로 국가R&D표준정보 데이터품질 지표 마련과 주기별 데이터 품질 및 개선도 자체점검을 지원하기 위해, 데이터 점검기준과 절차를 마련하고 이를 기반으로 부처(기관)와 협력하여 데이터품질 점검을 기반을 마련하였다. 이렇게 마련된 품질관리체계와 프로세스를 지원하기 위한 자동화 솔루션을 운영하고자 본 논문에서는 NTIS 데이터 품질관리 체계 및 프로세스, 기능이 통합된 웹 포털 구축에 대해서도 알아본다.

An Introduction and Trend Analysis in Questions of Engineer Big Data Analyst (빅데이터분석 기사 국가기술자격 개요 및 출제 경향 분석)

  • Jang, Hee-Seon;Song, Ji Young
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.393-394
    • /
    • 2022
  • 본 논문에서는 과학기술정보통신부와 통계청에서 주관하고 한국산업인력공단에서 시행(한국데이터산업진흥원 위탁)하는 「빅데이터분석기사」에 대한 필기 및 실기 시험의 내용을 설명하고 지금까지 2회에 걸쳐 시행된 시험에 대한 문제점과 이에 대한 해결방안을 제시하였다. 2021년 처음 시행된 국가기술자격으로써 기존 자격증과의 차별성, 난이도 조정, 수험생들의 각종 민원 발생 등의 문제를 해결하기 위한 체계적인 시스템 마련이 요구되며, 향후 데이터 과학자들에 대한 수요 급증에 대비하기 위해 빅데이터분석 실무 능력을 평가하기 위한 바람직한 제도와 정책이 병행되어야 한다.

  • PDF

TCP Throughput Guarantee using Packet Buffering (패킷 버퍼링을 이용한 TCP 처리율 보장 방법)

  • Choi, Sun-Woong;Kim, Chung-Kwon
    • Journal of KIISE:Information Networking
    • /
    • v.28 no.2
    • /
    • pp.242-250
    • /
    • 2001
  • This paper deals with the TCP bandwidth guarantee problem in a differentiated serviccs(Diffserv) network. The Diffserv assured s<:rvice differentiates packet drop probabilities to guarantee the promised bandwidth even under network congestion. However a token buffer marker fails to show adequate performance because TCI' generates packets according to the unique Tel' congestion control mechanism. We propose a marker that uses a data buffer as well as a token buffer. The marker with a data buffer works well with the assured service mechanism because it smooths Tel' traffic. We showed that the marker with a data buffer achieves the target throughput better than a marker with a token buffer only. We also showed that the optimal buffer size is proportional to reserved throughput and HTT.

  • PDF

Development of a Recommendation System for Crowdfunding Using NLP in Short Text (단문 텍스트의 자연어 처리 기법을 통한 크라우드 펀딩 추천 시스템 개발)

  • Lee, Yeong-Ah;Lee, Sun-Myung;Lee, Ju-Yon;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.466-469
    • /
    • 2021
  • 최근 자연어 처리에 대한 관심이 증가함에 따라 자연어 처리 기술을 활용한 다양한 추천 시스템이 등장하고 있다. 본 논문에서는 자연어 처리를 이용한 서비스를 개발한다. 본 논문에서 개발한 서비스는 KoNLPy 와 Word2Vec 을 이용하여 크라우드 펀딩 프로젝트 창작자 및 후원자에게 키워드 및 키워드와 유사한 단어가 제목에 포함되는 프로젝트를 추천해준다. 단문 텍스트로서 프로젝트 제목을 사용하여 데이터를 자연어 처리 한 후, 딥러닝 모델에 적용시켜 추출한 데이터를 기반으로 창작자와 후원자에게 추천해주는 방식이다. 따라서 본 서비스는 프로젝트 제목 정보를 통한 추천 시스템의 개발로, 나아가 영화, 도서와 같은 콘텐츠 추천 분야에도 적용할 수 있을 것으로 기대한다.

Plan for data science class in high school credit system based curriculum (고교학점제에서의 데이터과학 수업 방안)

  • Kim, Semin;Hong, Ki-Cheon;You, Kangsoo;Seo, SungWon;Woo, SungHee;Lee, Choong Ho
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2022.10a
    • /
    • pp.404-406
    • /
    • 2022
  • In this study, a data science class plan was designed for the high school credit system in general high schools. Since it is difficult to secure class hours in elementary and middle schools or general high schools, learners cannot freely take new subjects such as data science. Therefore, a lesson plan was designed based on the ADDIE model for 15 students who applied for data science at general high schools in A city. Through this study, it was possible to design the data science class according to the learning method.

  • PDF

A Study on Development of Basic Data Science Education Contents for Artificial Intelligence Capability (인공지능 기반의 기초 데이터 과학 교육에 관한 연구)

  • Jo, Junghee
    • 한국정보교육학회:학술대회논문집
    • /
    • 2021.08a
    • /
    • pp.393-400
    • /
    • 2021
  • Data science is a scientific discipline that defines problems while finding meaningful information from collected data to solve problems. Along with artificial intelligence technology, the field of data utilization is gradually expanding, and awareness of the importance of data science education is also increasing. Despite the rapid growth of the domestic data industry market, it has recently been predicted that the shortfall of data experts will reach 31.4% within the next 5 years according to an analysis of the current status of the data industry by the Korea Data Agency. In the field of elementary education, various studies have been conducted to introduce data science in order to improve students' computational thinking and creativity. This paper proposed the contents of data science lectures developed for the purpose of educating elementary school teachers, who are mostly non-majors in the computer field. The developed contents were applied to a group of elementary school teachers attending graduate school for artificial intelligence convergence education. Points for improvement were derived by identifying the contents that were difficult for learners to understand and analyzing the causes of difficulty.

  • PDF

Progressive Data Integration based on Hierarchical Metadata Registry (계층적 메타데이터 레지스트리 기반의 점진적 데이터 통합)

  • 신동길;정동원;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.740-742
    • /
    • 2003
  • 오랜 기간동안 메타데이터를 기반으로 한 데이터통합에 대한 많은 연구들이 진행되어 왔다. 그러나 기존 방법론들은 전역 뷰 또는 전역 스키마와 같은 초기 가이드라인을 구축하는데 많은 비용이 요구 된다는 단점이 있다. 이는 기존 연구들이 해당 도메인 특성들을 간과했기 때문이다. 예를 들어 과학 데이터의 경우 일반사용자들은 생물의 이름이나 모양 등과 같은 단순정보에 관심을 갖는 반면 과학자나 전문가들은 보다 상세하고 전문적인 데이터에 관심을 갖는다. 추가적으로 모든 데이터에 대한 초기 표준 가이드라인을 구축하는 것은 현실적으로 많은 어려움이 따른다. 본 논문에서는 이러한 도메인 특성을 고려하여 점진적인 통합방법론(LOG : Localization-based Global metadata registry)을 제안한다.

  • PDF

The Relationship between Trust, Satisfaction and Perceived Performance of Golf Device Data -Focused on the Golf Swing Analyzer- (골프 디바이스 데이터의 신뢰, 만족 및 인지된 경기력의 관계 -스윙 분석기 중심으로-)

  • Han, Jee-Hoon
    • Journal of the Korean Applied Science and Technology
    • /
    • v.38 no.1
    • /
    • pp.196-207
    • /
    • 2021
  • The purpose of this study is to investigate the relationship between trust, satisfaction and cognitive performance of golf participants in golf device, focusing on the swing analyzer. A total of 328 questionnaires were collected. Collected data were analyzed by SPSSWIN and AMOS program and frequency analysis, confirmatory factor analysis, validity test, correlation analysis and structural equation model analysis were performed. The result of the study were as follows. First, the trust of golf participants in golf device data has a positive effect on satisfaction. Second, the trust of golf participants in golf device data does not affect Perceived performance. Third, the satisfaction of golf participants in golf device data does not affect Perceived performance. In conclusion, golf participants' trust and satisfaction of the golf swing analyzer are irrelevant to the perceived performance. In conclusion, it was found that golf participants trusted the data presented through the golf device and obtained satisfactory results. However, in that it did not affect the perceived performance, golf participants can think that golf devices should be used to play golf rather than thinking that golf devices enhance their performance.

초등학교 과학수업에서 MBL의 활용

  • Choe Seong-Bong;Kim Sang-Dal;Lee Yong-Seop;Lee Sang-Gyun
    • 한국지구과학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.169-174
    • /
    • 2006
  • 현대 교육은 단순한 암기 위주가 아닌 첨단 컴퓨터를 이용한 실험 실습 위주의 직접 보고 듣고 느끼는 방향으로 진보하고 있다. 실험 실습에 의한 과학교육은 사용자의 탐구능력 향상과 과학적 태도 향상에 중요한 역할을 하게 될 것이며 기존의 암기위주나 단순한 수치에 의한 개념 학습을 탈피하여 Data collection 기술과 분석의 활용을 통해 사용자가 과학을 좀 더 이해하고 사용할 수 있도록 하는 능력을 증진하게 한다. 이를 위한 과학교육의 한 방법으로 MBL(Microcomputer Based Laboratory)은 실험자가 실험실이나 야외에서 각종 기구를 사용해 데이터를 습득할 수 있도록 도와주는 컴퓨터 기반 과학 실험 시스템으로서 미국, 영국 등 과학 교육 분야에서 추구하고 있는 세계적인 추세라고 할 수 있다. 이러한 MBL 시스템의 구성은 센서를 통해 얻어지는 자료를 컴퓨터에 전달하는 매개체인 인터페이스, 과학 실험에서 발생하는 데이터를 직접 전기적 신호로 변환하여 인터페이스에 전달하는 센서, 인터페이스에서 전달되는 전기적 신호를 컴퓨터 화면에 나타내어 주는 컴퓨터용 전용 프로그램으로 구성된다. 이러한 MBL을 과학교육에 활용한다면 학생들이 스스로 과학적으로 탐구하고 문제를 해결할 수 있는 능력을 배양하는 데 많은 도움이 될 것이다.

  • PDF