• 제목/요약/키워드: 과학기술 데이터

검색결과 2,551건 처리시간 0.036초

딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발 (Development of integrated data augmentation automation tools for deep learning)

  • 장찬호;이서영;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

계산 공간 기반 계층 트리를 이용한 구조화된 격자 상에서의 빠른 스트림라인 가시화 (Fast Streamline Visualization on Structured Grids using Computational Space Based Hierarchical Tree)

  • 이중연;구기범;허영주;금복희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.207-210
    • /
    • 2008
  • (비)구조화된 격자 상에 정의된 벡터 데이터는 다양한 과학 및 공학 분야에서 매우 중요하게 다루어진다. 이러한 데이터는 데카르트 격자 상의 데이터에 비해 많은 처리시간을 필요로 하는데, 이러한 문제는 계층 트리를 이용해서 빠르게 처리하는 것이 가능하다. 본 논문에서는 구조화된 격자 데이터에 대해 계산 공간을 기반으로한 계층 트리를 생성하고 이 트리를 이용해서 빠르게 데이터 샘플링을 처리하고자 했다. 이러한 방법을 이용해서 스트림라인 생성 시간을 평균 1800배 빨라지게 하는 것이 가능했다.

MOO(Mathematical Operation Organizer): 한국어 서술형 수학 문제 자동 풀이를 위한 데이터 증강 기법 연구 (MOO: A Study on Data Augmentation Method for Korean Math Word Problem Solving)

  • 안지수;기경서;김지원;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.568-571
    • /
    • 2022
  • 본 논문에서는 서술형 수학 문제의 자동 풀이 기술 개발을 위한 데이터 증강 기법인 MOO 를 제안한다. 서술형 수학 문제는 일상에서의 상황을 수학적으로 기술한 자연어 문제로, 인공지능 모델로 이 문제를 풀이하는 기술은 활용 가능성이 높아 국내외에서 다양하게 연구되고 있으나 데이터의 부족으로 인해 성능 향상에서의 한계가 늘 존재해 왔다. 본 논문은 이를 해결하기 위해 시중의 수학 문제들을 수집하여 템플릿을 구축하고, 템플릿에 적합한 풀이계획을 생성할 수 있는 중간 언어인 MOOLang 을 통해 생성된 문제에 대응하는 Python 코드 형태의 풀이와 정답을 생성할 수 있는 데이터 증강 방법을 고안하였다. 이 기법을 통해 생성된 데이터로 기존의 최고 성능 모델인 KoEPT를 통해 학습을 시도해본 결과, 생성된 데이터셋을 통해 모델이 원활하게 데이터셋의 분포를 학습할 수 있다는 것을 확인하였다.

정지영상 메타데이터 정합 도구 개발 (Development of XMP Metadata merge tool)

  • 김성준;이재국;홍태영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.540-541
    • /
    • 2021
  • 최근 드론산업이 발전하면서 다양한 드론 활용방법에 대한 연구와 특허 출원이 진행되고 있다. 드론에서 촬영된 사진은 실종자 수색, 농작물 생육 분석 등 다양한 목적을 위해서 활용되고 있으며, 다양한 분야에서 연구개발이 이루어지고 있다. 사진에 저장되는 정보는 실제 촬영 이미지와 다양한 메타데이터를 포함하고 있으나, 카메라 제조사별로 포함되는 메타데이터의 구성이 상이한 상태이다. 본고에서는 드론에서 촬영된 사진내의 메타데이터를 사전에 정의된 표준 명세를 만족할 수 있도록 메타데이터를 정합하는 응용프로그램을 제시하였다. 본 프로그램을 활용하여 현재 수행중인 DNA+드론기술 개발과제의 참여기업들이 촬영한 드론 사진내의 메타데이터의 표준화를 함으로써, 이를 활용하여 다양한 응용 기술 개발을 담당하는 참여기업들이 표준화된 데이터를 활용하여 보다 용이하게 개발이 가능할 것으로 예상된다.

GIVI: 몰입형 가상현실 환경에서 가시화된 데이터를 제어하는 통합 인터페이스 (GIVI: The Integrated Interface for Controlling Rotor Dynamics Data Visualized On Immersive Virtual Reality Environments)

  • 허영주;이중연;김민아
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.799-802
    • /
    • 2010
  • HPC에서 시뮬레이션을 수행한 결과로 생성된 데이터는 크기가 방대하고 구조가 복잡해지는 양상을 보이고 있다. 데이터 크기로만 보더라도 기가바이트를 넘어 테라바이트에 이를 정도로 대형화되는 경향을 보이고 있으며, 이렇게 복잡도가 놓은 대형 데이터는 이미 컴퓨터 한 대에서 처리하고 분석할 수 있는 범주는 넘어서고 있다. 본 논문에서는 이런 복잡한 과학 시뮬레이션 데이터 중, 특히 로터 동역학 분야의 데이터를 가시화하고 제어하는데 필요한 통합 가상현실 인터페이스를 소개하기로 한다. 현재 개발중인 GLOVE 프레임워크는 대용량 데이터를 연구자가 필요로 하는 형태로 다양하게 가공해서 가시화해서 분석할 수 있게 하는 프레임워크이며, GIVI는 그 중 사용자와의 인터페이스 부분을 담당하는 프레임워크다. GIVI는 가상현실 환경에서 시뮬레이션 데이터를 실시간으로 상호작용을 통해 분석하는데 필요한 기반환경을 제공하며, 향후에는 실시간 시뮬레이션을 위한 인터페이스로도 확장될 것이다.

농업 빅데이터 관리 및 인공지능 연구 플랫폼 개발 (Agriculture Bigdata Management and AI Research Platform Development)

  • 김기현;석우진;문정훈;김광수;심준용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.507-509
    • /
    • 2022
  • 농업은 우리의 삶에서 빼놓을 수 없는 중요한 분야이며, 농업은 토지를 이용하여 다양한 작물들을 길러 음식을 만드는 기본이라고 말할 수 있다. 이렇게 중요한 농업 분야를 ICT 분야에서 가장 이슈가 되는 기술인 인공지능 기술과 결합하여 스마트팜과 같은 농업의 디지털화를 구축할 수 있다. 이와 같은 스마트팜 구축을 위해서는 기본적으로 다양한 작물의 빅데이터를 제공하고, 이 데이터를 바탕으로 인공지능을 수행하여 다양한 결과를 제공할 수 있다. 하지만 인공지능 연구를 수행하기 위한 시스템 및 플랫폼의 부재라는 문제점이 존재한다. 이러한 문제점을 해결하기 위해 농업 빅데이터 관리 및 인공지능 연구 플랫폼 개발을 위한 과제를 통해 농업 빅데이터를 관리하고 인공지능을 연구자들이 손쉽게 수행할 수 있는 플랫폼을 개발하여 농업 분야의 작물 생산성 향상에 기여하고자 한다.

다분야 데이터 기반 융합 연구 지원을 위한 메타데이터 설계 (Metadata Design for Supporting Data-driven Convergence Research in Various Fields)

  • 한성근;최훈;이재광;이정철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.94-96
    • /
    • 2022
  • 4세대 연구 패러다임의 도래와 함께 데이터가 연구의 중심이 되었고, 인공지능(AI)에 대한 연구가 활발히 진행되면서 데이터의 중요성이 심화되고 있다. 인공지능 기술을 다양한 분야에 적용하려는 노력이 증가하고 있으며, 다양한 분야의 데이터를 다루기 위한 융합 연구의 필요성이 높아지고 있다. 본 논문에서는 융합 연구 플랫폼에서 데이터를 분석 및 활용하는데 필요한 메타데이터를 정의하고 다양한 분야에서 데이터 기반 융합 연구를 지원한다.

디지털 융합 R&D 서비스 플랫폼을 위한 계산과학 SW 서비스 프레임워크 설계 (Design of Computational Science SW Service Framework for Digital Convergence R&D Service Platform)

  • 전인호;한성근;이정철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.693-695
    • /
    • 2022
  • 디지털 기술이 각 분야의 기술과 융합하는 디지털 전환(Digital Transformation)은 4차 산업혁명을 가속화 하고 있다. 국가적으로 클라우드·인공지능·데이터 관련 정책 수립과 디지털 댐 사업, 데이터 플랫폼 사업 등을 통해 산업분야의 디지털 전환을 추진 중이나, 소재·바이오 등 극히 일부 과학기술 분야 외에 클라우드, 데이터, 인공지능, 시뮬레이션 등을 종합적으로 지원하는 국가적 지원이 전무한 실정이다. 본 논문은 국가 R&D의 디지털 전환 가속화를 위한 디지털융합R&D 플랫폼 제공을 위해 계산과학 SW를 서비스하기 위한 프레임워크를 설계하였다.

관측분야 과학데이터 관련 메타데이터 상호운용성 확보를 위한 OpenURL 메타태그 연구 (A Study on the OpenURL META-TAG of Observation Research Data for Metadata Interoperability)

  • 김선태;이태영
    • 정보관리연구
    • /
    • 제42권3호
    • /
    • pp.147-165
    • /
    • 2011
  • 여러 소스에 출현하는 관측분야의 과학데이터가 OpenURL 서비스 아키텍처에서 원활하게 유통되도록 하기 위해, OpenURL 소스와 서비스 구성요소간 상호운용성 확보를 할 수 있도록 Key/Encoded-Value(KEV) 형식으로 OpenURL 핵심 메타태그를 제안하였다. 현재의 OpenURL은 문헌위주의 학술정보 유통에 그 초점이 맞추어져 있으며, 과학데이터 유통을 위한 메타태그는 제공하지 못하고 있다. 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로 하고, 더블린 코어의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 OECD에서 만든 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 비교, 분석하여 관측분야의 과학데이터를 위한 OpenURL 핵심 메타태그를 도출하였다.