• Title/Summary/Keyword: 데이터과학자

검색결과 599건 처리시간 0.03초

NTIS 데이터 품질관리 체계와 포털 사이트 구축 (A Construction of Management System and Its Portal Site for NTIS Data Quality Management)

  • 이병희;정옥남;최희석;임철수;김재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.984-987
    • /
    • 2009
  • 데이터가 기업 및 기관 활동의 중요한 자산으로 인식이 높아지고 있지만 저 품질 데이터로 인한 막대한 손실과 비용의 증가는 큰 문제가 되고 있다. 본 논문에서는 교육과학기술부와 KISTI에서 2007년부터 범부처 차원에서 수행중인 국가R&D 정보자원의 데이터 품질관리를 위해 각 부처와 협의하고 수행해 온 국가R&D 데이터 품질관리 체계 수립과 포털 사이트 구축에 관하여 알아본다. 범부처 국가R&D정보 자원의 데이터 품질관리체계 수립과 범부처 적용 지침 및 가이드라인 제시를 위해 NTIS사업단 및 15개 부처(16개 대표전문기관)의 실무팀장 및 DB 관리자 중심으로 총 33명의 설문을 실시하여 품질관리체계 현황을 조사 분석하였다. 또한 부처(기관)별로 국가R&D표준정보 데이터품질 지표 마련과 주기별 데이터 품질 및 개선도 자체점검을 지원하기 위해, 데이터 점검기준과 절차를 마련하고 이를 기반으로 부처(기관)와 협력하여 데이터품질 점검을 기반을 마련하였다. 이렇게 마련된 품질관리체계와 프로세스를 지원하기 위한 자동화 솔루션을 운영하고자 본 논문에서는 NTIS 데이터 품질관리 체계 및 프로세스, 기능이 통합된 웹 포털 구축에 대해서도 알아본다.

빅데이터분석 기사 국가기술자격 개요 및 출제 경향 분석 (An Introduction and Trend Analysis in Questions of Engineer Big Data Analyst)

  • 장희선;송지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.393-394
    • /
    • 2022
  • 본 논문에서는 과학기술정보통신부와 통계청에서 주관하고 한국산업인력공단에서 시행(한국데이터산업진흥원 위탁)하는 「빅데이터분석기사」에 대한 필기 및 실기 시험의 내용을 설명하고 지금까지 2회에 걸쳐 시행된 시험에 대한 문제점과 이에 대한 해결방안을 제시하였다. 2021년 처음 시행된 국가기술자격으로써 기존 자격증과의 차별성, 난이도 조정, 수험생들의 각종 민원 발생 등의 문제를 해결하기 위한 체계적인 시스템 마련이 요구되며, 향후 데이터 과학자들에 대한 수요 급증에 대비하기 위해 빅데이터분석 실무 능력을 평가하기 위한 바람직한 제도와 정책이 병행되어야 한다.

  • PDF

단문 텍스트의 자연어 처리 기법을 통한 크라우드 펀딩 추천 시스템 개발 (Development of a Recommendation System for Crowdfunding Using NLP in Short Text)

  • 이영아;이선명;이주연;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.466-469
    • /
    • 2021
  • 최근 자연어 처리에 대한 관심이 증가함에 따라 자연어 처리 기술을 활용한 다양한 추천 시스템이 등장하고 있다. 본 논문에서는 자연어 처리를 이용한 서비스를 개발한다. 본 논문에서 개발한 서비스는 KoNLPy 와 Word2Vec 을 이용하여 크라우드 펀딩 프로젝트 창작자 및 후원자에게 키워드 및 키워드와 유사한 단어가 제목에 포함되는 프로젝트를 추천해준다. 단문 텍스트로서 프로젝트 제목을 사용하여 데이터를 자연어 처리 한 후, 딥러닝 모델에 적용시켜 추출한 데이터를 기반으로 창작자와 후원자에게 추천해주는 방식이다. 따라서 본 서비스는 프로젝트 제목 정보를 통한 추천 시스템의 개발로, 나아가 영화, 도서와 같은 콘텐츠 추천 분야에도 적용할 수 있을 것으로 기대한다.

패킷 버퍼링을 이용한 TCP 처리율 보장 방법 (TCP Throughput Guarantee using Packet Buffering)

  • 최선웅;김종권
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권2호
    • /
    • pp.242-250
    • /
    • 2001
  • 본논문에서는 차별화 서비스망에서 TCP 플로우의 처리율을 보장하는 문제를 연구하였다. 확신 서비스는 망의 혼잡 시에도 약속한 대역폭을 보장하기 위하여 패킷패기율을 차별화하는 방법을 사용한다. 그러나 토큰 버퍼 표시자는 TCP의 혼잡제어과 잘 동작하지 않아 적절한 성능을 보이지 못한다. 본 논문에서는 토큰 버퍼와 함께 데이터 버퍼를 사용하는 표시자를 제안하였다. 데이터 버퍼를 사용하는 표시자는 TCP 트래픽을 평활화하는 효과가 있어 확신 서비스 메커니즘과잘 동작한다. 컴퓨터 시뮬레이션 결과 데이터 버퍼를 사용하는 표시자가 토큰 버퍼만을 사용하는 표시자에 비해 목표 대역폭에 보다 근접한 성능을 보이는 것을 확인하였다. 또한 최적 데이터 버퍼 크기는 예약 대역폭과 RTT에 비례하는 것을 관찰하였다.

  • PDF

고교학점제에서의 데이터과학 수업 방안 (Plan for data science class in high school credit system based curriculum)

  • 김세민;홍기천;유강수;서성원;우성희;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.404-406
    • /
    • 2022
  • 본 연구에서는 일반계 고등학교의 고교학점제를 위하여 데이터과학 수업 방안을 설계하였다. 초·중학교나 일반계 고등학교에서는 시수 확보가 쉽지 않아서, 데이터과학과 같은 새로운 과목을 학습자가 마음껏 수강할 수 없지만, 고교학점제를 통하여 원하는 과목을 신청하여 학습을 진행할 수 있다. 이에 A시의 일반계 고등학교에서 데이터과학을 신청한 15명의 학생을 위하여 ADDIE 모형에 기반하여 수업 방안을 설계하였다. 본 연구를 통하여 학습 방안에 따른 데이터과학 수업 과정을 설계할 수 있었다.

  • PDF

인공지능 기반의 기초 데이터 과학 교육에 관한 연구 (A Study on Development of Basic Data Science Education Contents for Artificial Intelligence Capability)

  • 조정희
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.393-400
    • /
    • 2021
  • 데이터 과학은 문제를 정의하고 수집된 데이터로부터 의미 있는 정보를 찾아내어 문제를 해결하는 과학적인 학문이다. 인공지능 기술의 도입으로 인해 데이터의 활용 분야는 점차 확장되고 있으며, 데이터 과학 교육의 중요성에 대한 인식도 증가하고 있다. 그러나, 한국 데이터 산업진흥원에서 2020년 데이터 산업 현황을 조사하여 발표한 결과에 의하면 국내 데이터 산업의 시장규모가 급성장하고 있음에 불구하고, 향후 5년 이내에 데이터 전문가의 부족률은 31.4%에 이를 것으로 예측하였다. 이러한 사회적 분위기 속에서, 초등 교육 현장에서는 학생들의 컴퓨팅 사고력과 창의력 향상을 위하여 데이터 과학 교육을 도입하고자 다양한 연구가 진행되고 있다. 본 논문에서는 컴퓨터 분야의 비전공자가 대다수인 현직 초등교사들의 교육을 목적으로 개발하여 현장에서 활용하고 있는 데이터 과학 강의의 콘텐츠를 제안하였다. 해당 콘텐츠는 인공지능융합대학원에 재학 중인 현직 초등교사 집단을 대상으로 적용한 후, 학습자들이 이해하기에 어려움이 있었던 내용을 세부적으로 파악하고 원인을 분석하여 개선점을 도출하였다.

  • PDF

계층적 메타데이터 레지스트리 기반의 점진적 데이터 통합 (Progressive Data Integration based on Hierarchical Metadata Registry)

  • 신동길;정동원;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.740-742
    • /
    • 2003
  • 오랜 기간동안 메타데이터를 기반으로 한 데이터통합에 대한 많은 연구들이 진행되어 왔다. 그러나 기존 방법론들은 전역 뷰 또는 전역 스키마와 같은 초기 가이드라인을 구축하는데 많은 비용이 요구 된다는 단점이 있다. 이는 기존 연구들이 해당 도메인 특성들을 간과했기 때문이다. 예를 들어 과학 데이터의 경우 일반사용자들은 생물의 이름이나 모양 등과 같은 단순정보에 관심을 갖는 반면 과학자나 전문가들은 보다 상세하고 전문적인 데이터에 관심을 갖는다. 추가적으로 모든 데이터에 대한 초기 표준 가이드라인을 구축하는 것은 현실적으로 많은 어려움이 따른다. 본 논문에서는 이러한 도메인 특성을 고려하여 점진적인 통합방법론(LOG : Localization-based Global metadata registry)을 제안한다.

  • PDF

골프 디바이스 데이터의 신뢰, 만족 및 인지된 경기력의 관계 -스윙 분석기 중심으로- (The Relationship between Trust, Satisfaction and Perceived Performance of Golf Device Data -Focused on the Golf Swing Analyzer-)

  • 한지훈
    • 한국응용과학기술학회지
    • /
    • 제38권1호
    • /
    • pp.196-207
    • /
    • 2021
  • 본 연구는 골프참여자들의 골프 디바이스 데이터의 신뢰, 만족 및 인지된 경기력에 대한 관계를 규명하는데 목적이 있다. 연구대상은 일반 골프참여자들을 대상으로 서울, 경기도, 강원도, 경상도, 충청도, 전라도, 제주도 등 7개 시, 도 지역에 온라인 설문을 통해 수집하였으며, 온라인 설문은 총 328부를 수집하여 사용되었다. 수집된 자료는 SPSSWIN 프로그램과 AMOS 를 이용하여 자료를 분석하였으며, 빈도분석, 확인적 요인분석, 신뢰도 분석, 상관관계분석, 구조방정식모형분석 및 경로분석을 실시하였다. 변인 간 관계를 검증한 결과는 다음과 같다. 첫째, 골프참여자들의 골프 디바이스 데이터의 신뢰는 만족에 정(+)에 유의한 영향을 미쳤다. 둘째, 골프참여자들의 골프 디바이스 데이터의 신뢰는 인지된 경기력에 영향을 미치지 않았다. 셋째, 골프참여자들의 골프 디바이스 데이터 만족은 인지된 경기력에 영향을 미치지 않았다. 결론적으로 골프참여자들이 골프 디바이스를 통해 제시된 데이터를 신뢰하고 만족한 결과를 얻고 있다는 것을 알 수 있었다. 하지만 인지된 경기력에는 영향을 미치지 못했다는 점에서 골프참여자들은 골프 디바이스를 경기력을 높여준다는 생각보다는 골프를 하기 위해서 당연히 사용해야 되는 것으로 생각할 수 있다.

초등학교 과학수업에서 MBL의 활용

  • 최성봉;김상달;이용섭;이상균
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2006년도 춘계학술발표회 논문집
    • /
    • pp.169-174
    • /
    • 2006
  • 현대 교육은 단순한 암기 위주가 아닌 첨단 컴퓨터를 이용한 실험 실습 위주의 직접 보고 듣고 느끼는 방향으로 진보하고 있다. 실험 실습에 의한 과학교육은 사용자의 탐구능력 향상과 과학적 태도 향상에 중요한 역할을 하게 될 것이며 기존의 암기위주나 단순한 수치에 의한 개념 학습을 탈피하여 Data collection 기술과 분석의 활용을 통해 사용자가 과학을 좀 더 이해하고 사용할 수 있도록 하는 능력을 증진하게 한다. 이를 위한 과학교육의 한 방법으로 MBL(Microcomputer Based Laboratory)은 실험자가 실험실이나 야외에서 각종 기구를 사용해 데이터를 습득할 수 있도록 도와주는 컴퓨터 기반 과학 실험 시스템으로서 미국, 영국 등 과학 교육 분야에서 추구하고 있는 세계적인 추세라고 할 수 있다. 이러한 MBL 시스템의 구성은 센서를 통해 얻어지는 자료를 컴퓨터에 전달하는 매개체인 인터페이스, 과학 실험에서 발생하는 데이터를 직접 전기적 신호로 변환하여 인터페이스에 전달하는 센서, 인터페이스에서 전달되는 전기적 신호를 컴퓨터 화면에 나타내어 주는 컴퓨터용 전용 프로그램으로 구성된다. 이러한 MBL을 과학교육에 활용한다면 학생들이 스스로 과학적으로 탐구하고 문제를 해결할 수 있는 능력을 배양하는 데 많은 도움이 될 것이다.

  • PDF