• 제목/요약/키워드: 데이터과학자

검색결과 604건 처리시간 0.03초

대학원 데이터 과학자 과정 입학 평가 체계 분석 (A Study on Entrance Evaluation System for Data Scientist Postgraduate Program)

  • 김미정;김자미;이원규
    • 컴퓨터교육학회논문지
    • /
    • 제23권3호
    • /
    • pp.49-58
    • /
    • 2020
  • 시대적 필요와 사회적 요구에 따라 데이터 과학 분야의 전문가로 성장할 수 있는 학생을 선발하기 위한 입학 평가 체계의 구성은 중요하다. 본 연구는 융·복합 역량을 갖춘 인재 선발의 중요성을 고려하여 데이터 과학 분야 대학원 입학 평가 체계를 분석하고, 시사점을 도출하기 위한 목적에서 진행되었다. 목적 달성을 위해 전 세계 대학원 데이터 과학자 과정을 대상으로 총 7개국 22개 대학원을 선정하였다. 선정된 대학원들을 지원 자격, 입학 전 필요 기술, 입학 조건, 선발 방법별로 분석하였다. 분석 결과, 지원 자격은 '최소 학사학위 소지자 또는 학사과정 전공과 관계없이 입학 지원 가능한 학교(63.6%)', 입학 전 필요 기술은 '교육과정 이수에 필요한 입학 전 기술을 명시한 학교(63.6%)', 입학 조건은 '별도 입학 조건이 따로 명시되어 있지 않은 학교(81.8%)', 선발 방법은 '서류 심사로만 학생을 선발하는 학교(68.2%)'가 가장 많았다. 이상을 토대로 본 연구는 데이터 과학자 과정의 결과를 정리하고, 입학 평가를 객관화하기 위한 시사점을 제시하였다.

IoT 네트워크에서 프라이버시 보호를 위한 동형암호화에 기반의 안전한 다자간 계산 (Secure Multi-Party Computation Based on Homomorphic Encryption for Privacy Preserving in IoT Networks)

  • 진호천;김태우;박지수;박종혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.189-192
    • /
    • 2021
  • 5G와 사물인터넷(IoT) 시대에 데이터의 크로스컴퓨팅은 연구, 의료, 금융, 민생 분야 등에 더 많은 지원을 할 수 있고 프라이버시 안전성이 중요해지고 있다. SMPC (Secure Multi-party Computation)은 서로 믿지 않는 참여자 간의 프라이버시 보호 시너지 컴퓨팅 문제를 해결하고, 데이터 수요자에게 원본 데이터를 누설하지 않는 범위 하에서의 다자간 컴퓨팅 능력을 제공한다. IoT 장치는 전력 소모와 지연에 제한을 받기 때문에 대부분의 장치가 여전히 경량화 보안 메커니즘에 속하고 IoT에서 트래픽의 데이터 통합관리가 어렵기 때문에 통신 중 신원인식과 데이터를 주고받는 단계에서 프라이버시 유출의 문제가 발생할 수 있고 심지어 DDOS공격, RelayAttack공격 등 사이버의 목적이 될 수도 있다. 본 논문에서 IoT 네트워크 데이터 통신 특징을 분석하고 동형 암호에 기반의 SMPC 연산 아키텍처를 제안한다. 제안하는 이키텍처에서 동형 암호를 사용함으로써 장치 데이터의 안전을 보장하는 동시에 전체 네트워크 안전성도 확보한다. SMPC 및 동형암호 기술의 지속적 발전에 따라 제안하는 아키텍처가 계속 개선할 잠재력이 있다.

시각화 방법을 이용한 학습자의 학습 성향 진단 시스템의 개선 (Improvement of Learner's learning Style Diagnosis System using Visualization Method)

  • 윤태복;최미애;이지형;김용세
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.226-230
    • /
    • 2009
  • 지능형 학습 시스템은 학습자의 학습 과정에서 수집된 데이터를 분석하여 학습자에게 맞는 전략을 세우고 적합한 서비스를 제공하는 시스템이다. 학습자에게 적합한 서비스를 위해서는 학습자 모델링 작업이 우선시 되며, 이 모델 생성을 위해서 학습자의 학습 과정에서 발생한 데이터를 수집하고 분석하게 된다. 하지만, 수집된 데이터가 학습자의 일관되지 못한 행위나 비예측 학습 성향을 포함하고 있다면, 생성된 모델을 신뢰하기 어렵다. 본 논문에서는 학습자에게서 수집된 데이터를 시각화 분석 방법을 이용하여 비정상 데이터를 선별한다. 실험에서는 홈 인테리어 컨텐츠 기반에 학습자의 학습 행위에 대한 학습 성향을 진단하기 위한 DOLLS-HI를 이용하여, 수집된 학습자의 데이터에서 비정상 데이터를 분류하고 학습 성향 진단을 위한 모델을 생성하였다. 생성된 모델은 비정상 데이터 분류전과 비교하여 신뢰가 향상된 것을 확인하였다.

해외안테나 - 분산 데이터와 주목받는 콜래버레이션

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 2호통권57호
    • /
    • pp.16-25
    • /
    • 1998
  • 시간과 공간의 벽을 넘은 각각의 잠재적 콜래버레이터의 의미는 가상의 리서치 팀이 분산된 데이터 기록과 높은 해상도, 하이모드의 콜래버레이션 환경을 통해 재빨리 조립될 수 있다는 것이다. 최근 실험 과학자나 엔지니어들은 언제나 국제 여행을 즐길 수 있고, 동료를 만날 수 있으며, 넓게 분산된 사이트에 있는 데이터를 분석할 수 있다. 또, 천문학자들은 마우나 키, 키트 픽, 허블 스페이스 텔레스코프 과학 기관, 국제 라디오 천문학 관측소 등에서 시간을 보내며, 각 사이트별 기구의 특수 기능을 탐험하고 다른 콜래버레이터들에 의해 획득된 다양한 데이터를 수집할 수 있다.

  • PDF

반자동 언어데이터 증강 방식에 기반한 FbSA 모델 학습을 위한 감성주석 데이터셋 FeSAD 구축 (Building Sentiment-Annotated Datasets for Training a FbSA model based on the SSP methodology)

  • 윤정우;황창회;최수원;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.66-71
    • /
    • 2021
  • 본 연구는 한국어 자질 기반 감성분석(Feature-based Sentiment Analysis: FbSA)을 위한 대규모의 학습데이터 구축에 있어 반자동 언어데이터 증강 기법(SSP: Semi-automatic Symbolic Propagation)에 입각한 자질-감성 주석 데이터셋 FeSAD(Feature-Sentiment-Annotated Dataset)의 개발 과정과 성능 평가를 소개하는 것을 목표로 한다. FeSAD는 언어자원을 활용한 SSP 1단계 주석 이후, 작업자의 주석이 2단계에서 이루어지는 2-STEP 주석 과정을 통해 구축된다. SSP 주석을 위한 언어자원에는 부분 문법 그래프(Local Grammar Graph: LGG) 스키마와 한국어 기계가독형 전자사전 DECO(Dictionnaire Electronique du COréen)가 활용되며, 본 연구에서는 7개의 도메인(코스메틱, IT제품, 패션/의류, 푸드/배달음식, 가구/인테리어, 핀테크앱, KPOP)에 대해, 오피니언 트리플이 주석된 FeSAD 데이터셋을 구축하는 프로세싱을 소개하였다. 코스메틱(COS)과 푸드/배달음식(FOO) 두 도메인에 대해, 언어자원을 활용한 1단계 SSP 주석 성능을 평가한 결과, 각각 F1-score 0.93과 0.90의 성능을 보였으며, 이를 통해 FbSA용 학습데이터 주석을 위한 작업자의 작업이 기존 작업의 10% 이하의 비중으로 감소함으로써, 학습데이터 구축을 위한 프로세싱의 소요시간과 품질이 획기적으로 개선될 수 있음을 확인하였다.

  • PDF

컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마 설계 (Design of Standard Metadata Schema for Computing Resource Management)

  • 이미경;조민희;송사광;임형준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.433-435
    • /
    • 2022
  • 본 논문에서는 국가연구데이터커먼즈에서 연구데이터 분석·활용에 사용되는 컴퓨팅 리소스를 등록, 검색, 관리하기 위한 컴퓨팅 리소스 표준 메타데이터 스키마 설계 방안에 대해 소개한다. 국가연구데이터커먼즈는 연구데이터 공유·활용 극대화를 위한 연구데이터와 컴퓨팅 리소스 연합 활용 체계이다. 컴퓨팅 리소스는 연구 전 과정에서 사용하는 연구데이터를 분석·활용하는데 필요한 분석 인프라, 분석 소프트웨어 등 컴퓨팅 환경의 모든 리소스들을 말한다. KRDC 컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마는 컴퓨팅 리소스 관리를 위한 공통 필수 속성과 각 컴퓨팅 리소스 특징에 따른 속성을 고려하여 설계하였다. 컴퓨팅 리소스 관리를 위한 표준 메타데이터 스키마는 컴퓨팅 리소스 메타데이터 스키마와 컴퓨팅 리소스 제공자 메타데이터 스키마로 구성된다. 또한, 컴퓨팅 리소스와 제공자의 메타데이터 스키마는 성격에 따라 서비스 스키마와 시스템 스키마 그룹으로 구분하여 설계하였다. 표준 메타데이터 스키마는 KRDC 프레임워크를 통해 컴퓨팅 리소스 제공자와 컴퓨팅 리소스 사용자를 위한 컴퓨팅 리소스 등록, 카탈로그 검색, 컴퓨팅 리소스 관리, 워크플로우 서비스에 사용되며, 다양한 컴퓨팅 리소스 연계를 위해 확장 가능한 형태로 설계되었다.

  • PDF

데이터 흐름을 반영하는 임베디드 시스템의 코드 자동 생성기 설계 (A Design of Data Flow based Automatic Code Generator for Embedded System)

  • 이병용;류호동;권진욱;석미희;이우진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.56-59
    • /
    • 2010
  • 오늘날 임베디드 환경에서의 하드웨어의 발전에 더불어, 소프트웨어의 복잡도가 점점 증가하고, 유지보수에 대한 비용이 증가함에 따라 UML모델을 이용한 자동코드 생성에 대한 관심이 더욱 커지고 있다. UML을 이용한 코드 생성의 효과적으로 이루어지기 위해서는 설계된 모델의 무결성이 요구되고 이를 위해서는 모델의 논리적 검증이 선행되어야 한다. 아울러 설계자로 하여금 정의하는 모델이 명확하게 이해되고 구현될 있어야 한다. 하지만 코드 생성의 행위적 관점의 기본이 되는 상태머신 다이어그램에서 잘 드러나는 흐름과는 다르게 데이터의 사용은 다이어그램 내부에 숨겨져 있어 설계자로 하여금 모델에 대한 이해를 어렵게 하고 잠재적인 에러의 내포 가능성이 제기되어 왔다. 본 논문은 이러한 문제의 해결을 위해 코드 내포 상태머신 다이어그램의 데이터 시각화기법을 이용하고, 이러한 시각화 기법을 이용하여 데이터 사용관점에서의 모델의 이해를 도움과 동시에 이를 통하여 더욱 정확한 모델링을 수행하고 더불어 이를 통해 최종적으로는 더욱 효율적인 형태의 코드를 생성하는 코드 자동 생성기의 설계를 제안 한다.

MARC 레코드의 구조(構造)와 내용표지법(內容標識法)에 관한 비교(比較) 및 분석(分析) (Comparative Analysis on the Structure of the Record and the Methods of Content Designation of the MARC)

  • 오동근
    • 정보관리연구
    • /
    • 제22권2호
    • /
    • pp.29-46
    • /
    • 1991
  • MARC포맷의 기본요소 가운데 레코드의 구조와 내용표지법을 UNIMARC와 USMARC, KORMARC, CHINESE MARC, JAPAN MARC 포맷을 대상으로 비교분석하였다. 레코드의 구조는 기본적으로 모든 포맷이 ISO 2709에 준거하고 있으므로 유사한 구조를 가지고 있다. 고정장데이터요소의 표지방법은 문자기호대입법과 유무판별법, 대표지시자 선행방법, 코드표지방법, 수치대입법, 결합지시자표지법이 사용되고 있다. 가변장필드의 데이터요소를 명시적으로 식별하고 추가의 정보를 제공하기 위해 사용되는 내용표지기호로는 표시자와 지시자, 서브필드식별자가 있으며, JAPAN MARC에서는 지시자가 사용되지 않는다.

  • PDF

한국 시민과학의 현황과 과제 (The Current State and Tasks of Citizen Science in Korea)

  • 박진희
    • 과학기술학연구
    • /
    • 제18권2호
    • /
    • pp.7-41
    • /
    • 2018
  • 정부 기관 혹은 과학협회에서 비전문가 시민으로 하여금 대량의 데이터를 수집하도록 하는 활동에서 유래하고 있는 시민과학은 현재 프로젝트마다 과학자와의 협력 내용에서 차이를 보이고 있다. 생물종 개체수 조사 등 생태, 환경과학 영역에 집중되고 있던 시민과학 연구 내용은 천문학, 분산 컴퓨팅, 강입자물리 영역까지 확장되어갔다. 시민과학은 시민 자원 봉사자들에 의한 데이터 수집으로 비용 효과적으로 과학 연구를 수행할 수 있게 해주어 과학 연구 진전에 기여할 수 있었다. 또한 시민과학은 프로젝트에 참여한 시민들의 과학지식을 증진시키며 대중의 과학 이해를 향상시켜주는 것으로 나타났다. 이밖에 공동체 주도 시민과학 프로젝트는 지역 환경 이슈에 대한 공중의 인식을 향상시키고 환경 문제 해결에의 시민 참여를 장려하는 역할을 했다. 지역 시민들의 경험지에 근거하는 시민과학 프로젝트는 지역 환경 정책 결정 및 실행에 직접적인 도움을 주고 있는 것으로 나타났다. 이와 같은 시민과학의 교육, 사회 정책적 가치로 인해 각국 정부들에서는 시민과학 활성화를 위한 다양한 정책들을 수립하고 있다. 국내에서도 시민과학의 사회적 역할에 주목하여 정부 주도의 시민과학 프로젝트들이 기획, 실행되고 있다. 시민의 자발적인 참여에 의해 다양한 프로젝트들이 실행되고 있는 국외와 달리 국내에서 진행되는 시민과학 활동은 아직 주제 영역이 제한적이며 활동의 주체로서 과학자나 시민 참여가 아직은 낮은 수준에 머물고 있는 것으로 나타났다. 공공주도의 시민과학 프로젝트를 통해 시민 참여가 늘어나고 또한 과학자들도 시민과학의 가능성을 인지할 수 있도록 하는 것은 중요해 보인다. 과학자에 대한 평가제도를 개선하여 시민과학 참여를 증진하는 방안도 모색되어야 할 것이다. 공공 주도 시민과학 프로젝트 운영을 시민 참여 강화에 맞추어 세밀하게 기획할 필요가 있다. 시민단체 주도의 자연조사 활동이 시민과학으로서 실질적으로 과학 연구, 나아가 환경 정책에 기여할 수 있도록 오픈 데이터 정책이 마련되어야 할 것이다. 시민과학 프로젝트 경험을 공유, 확산할 수 있는 시민과학 네트워크 구축에도 노력할 필요가 있다.

Data-Text 변형 담화의 측면에서 본 세 초등 예비교사의 모의수업 시연 사례의 비교 (Comparison of Three Preservice Elementary School Teachers' Simulation Teaching in Terms of Data-text Transforming Discourses)

  • 맹승호
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제41권1호
    • /
    • pp.93-105
    • /
    • 2022
  • 이 연구는 세 초등 예비교사의 과학 모의수업 시연에서 data-text의 변형 담화가 구현되는 양상을 탐색하여 교사의 인식론적 대화가 학습자의 과학지식 구성에 어떻게 작용할 수 있는지 조사하였다. 계절에 따른 별자리의 변화를 주제로 모의수업을 시연한 초등 예비교사 3명이 연구에 참여하였고, 그들의 모의수업 시연의 수업 담화 중 교수법적 발화에서 data-text의 변형 담화에 해당하는 발화를 선택하여 수업의 흐름에서 학습자의 과학지식 구성에 어떤 역할을 하는지 분석하였다. 연구 결과, 데이터에서 증거로 변형하는 담화와 증거에서 여러 모델에서 설명을 도출하는 변형 담화를 구현했던 예비교사의 수업은 학습자의 과학지식 구성에 기여할 수 있었다. 그러나 데이터를 인식하는 변형 담화 또는 증거를 찾는 변형 담화에 멈추거나 변형 담화가 발견되지 않은 예비교사의 교수법적 발화는 학습 목표로서 과학 지식을 전달할 수 있었지만, 학습자의 과학지식 구성을 효과적으로 유도하지 못했다. 세 예비교사의 모의수업 시연에서 구현된 교수법적 발화를 data-text의 변형 담화 측면에서 발전적인 부분과 제한적인 부분을 비교함으로써 과학적 의사소통 능력의 관점에서 예비교사의 과학 수업 역량을 증진시키기 위해 고려해야 할 지점을 논의하였다.