• 제목/요약/키워드: 데이터 융합

Search Result 4,483, Processing Time 0.031 seconds

A study on the policy of de-identifying unstructured data for the medical data industry (의료 데이터 산업을 위한 비정형 데이터 비식별화 정책에 관한 연구)

  • Sun-Jin Lee;Tae-Rim Park;So-Hui Kim;Young-Eun Oh;Il-Gu Lee
    • Convergence Security Journal
    • /
    • v.22 no.4
    • /
    • pp.85-97
    • /
    • 2022
  • With the development of big data technology, data is rapidly entering a hyperconnected intelligent society that accelerates innovative growth in all industries. The convergence industry, which holds and utilizes various high-quality data, is becoming a new growth engine, and big data is fused to various traditional industries. In particular, in the medical field, structured data such as electronic medical record data and unstructured medical data such as CT and MRI are used together to increase the accuracy of disease prediction and diagnosis. Currently, the importance and size of unstructured data are increasing day by day in the medical industry, but conventional data security technologies and policies are structured data-oriented, and considerations for the security and utilization of unstructured data are insufficient. In order for medical treatment using big data to be activated in the future, data diversity and security must be internalized and organically linked at the stage of data construction, distribution, and utilization. In this paper, the current status of domestic and foreign data security systems and technologies is analyzed. After that, it is proposed to add unstructured data-centered de-identification technology to the guidelines for unstructured data and technology application cases in the industry so that unstructured data can be actively used in the medical field, and to establish standards for judging personal information for unstructured data. Furthermore, an object feature-based identification ID that can be used for unstructured data without infringing on personal information is proposed.

Deep Learning for Automatic Change Detection: Real-Time Image Analysis for Cherry Blossom State Classification (자동 변화 감지를 위한 딥러닝: 벚꽃 상태 분류를 위한 실시간 이미지 분석)

  • Seung-Bo Park;Min-Jun Kim;Guen-Mi Kim;Jeong-Tae Kim;Da-Ye Kim;Dong-Gyun Ham
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.493-494
    • /
    • 2023
  • 본 논문은 벚꽃나무 영상 데이터를 활용하여 벚꽃의 상태(개화, 만개, 낙화)를 실시간으로 분류하는 연구를 소개한다. 이 연구의 목적은, 실시간으로 취득되는 벚꽃나무의 영상 데이터를 사전에 학습된 CNN 기반 이미지 분류 모델을 통해 벚꽃의 상태에 따라 분류하는 것이다. 약 1,000장의 벚꽃나무 이미지를 활용하여 CNN 모델을 학습시키고, 모델이 새로운 이미지에 대해 얼마나 정확하게 벚꽃의 상태를 분류하는지를 평가하였다. 학습데이터는 훈련 데이터와 검증 데이터로 나누었으며, 개화, 만개, 낙화 등의 상태별로 폴더를 구분하여 관리하였다. 또한, ImageNet 데이터셋에서 사전 학습된 ResNet50 가중치를 사용하는 전이학습 방법을 적용하여 학습 과정을 더 효율적으로 수행하고, 모델의 성능을 향상시켰다.

  • PDF

Implementation of medical image labeling web application for machine learning (기계학습을 위한 의료영상 라벨링 웹 애플리케이션 구현)

  • Lee, Chung-sub;Lim, Dong-Wook;Kim, Ji-Eon;Noh, Si-Hyeong;Yu, Yeong-Ju;Kim, Tae-Hoon;Jeong, Chang-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.602-605
    • /
    • 2021
  • 최근 인공지능 연구가 활발히 진행되고 있는 가운데 국내외에서 오픈 데이터셋을 제공하고 있어 기술개발이 가속화되고 있다. 데이터셋은 지도학습을 위한 학습데이터로 라벨링 데이터를 포함하고 있어 다양한 라벨링 기능이 적용된 도구 개발이 필요하다. 본 논문에서는 의료영상의 라벨링 데이터를 정교하고 빠르게 생성하기 위한 라벨링 웹 애플리케이션에 대해서 기술한다. 이를 구현하기 위해서 Back Projection, Grabcut 기법을 이용한 반자동 방식과 기계학습 모델을 통해서 예측한 자동 방식의 라벨링 기능을 구현하였다. 이와 관련하여 라벨링 기능별 수행 결과를 근감소증 진단을 위한 영상 라벨링 수행결과와 정량분석 결과를 보였다.

Dataset Search System Using Metadata-Based Ranking Algorithm (메타데이터 기반 순위 알고리즘을 활용한 데이터셋 검색 시스템)

  • Choi, Wooyoung;Chun, Jonghoon
    • Journal of Broadcast Engineering
    • /
    • v.27 no.4
    • /
    • pp.581-592
    • /
    • 2022
  • Recently, as the requirements for using big data have increased, interest in dataset search technology needed for data analysis is also growing. Although it is necessary to proactively utilize metadata, unlike conventional text search, research on such dataset search systems has not been actively carried out. In this paper, we propose a new dataset-tailored search system that indexes metadata of datasets and performs dataset search based on metadata indices. The ranking given to the dataset search results from a newly devised algorithm that reflects the unique characteristics of the dataset. The system provides the capability to search for additional datasets which correlate with the dataset searched by the user-submitted query so that multiple datasets needed for analysis can be found at once.

A Design of Small Size Sensor Data Acquisition and Transmission System (소형 센서 데이터 수집 및 전송 시스템 설계)

  • Lim, Joong-Soo
    • Journal of Convergence for Information Technology
    • /
    • v.9 no.1
    • /
    • pp.136-141
    • /
    • 2019
  • In this paper, we describe the design of a small size data acquisition system with STM32 processor based on Cortex-M4. The system is used for the sensor devices to collect raw data on production lines at factory and send them to the server computer in real time. Also the system is designed to easily acquisite various kinds of data collected from various sensors with the digital signal input unit, the analog signal input unit, the digital signal output unit and the analog signal output unit This small data acquisition system will contribute to the improvement of the quality of precision products in the industrial field by collecting various data in real time and transmitting data at high speed.

Data Literacy Education in Design Curriculum of Higher Education Focused on Development of Design-Data Convergence Curriculum (디자인 교과과정에서의 데이터 문해력 교육에 관한 연구 -디자인-데이터 융합 교과 개발 사례를 중심으로)

  • Lee, Hyun Jhin
    • The Journal of the Korea Contents Association
    • /
    • v.22 no.5
    • /
    • pp.685-696
    • /
    • 2022
  • This study explores convergence curriculum for design and data science, and applies data science knowledge on undergraduate design classes for designer's data literacy. First, related studies about data literacy education for non-data science major's, and data driven design project cases are explored, then design competency and data competency based on NCS are studied. Then this study developed 3 step design-data convergence curriculum model for designers' data literacy. The curriculum model is applied on case study classes, which are Big data and UX design(2) classes. The learning results and student's feedback of the case study classes are collected and analyzed to prove the design-data convergence curriculum, and the results provide findings and implications of the design-data convergence class case study.

정형화 수준에 따른 의료 데이터 분류 및 분석

  • Lee, Mi-Yeon;Park, Ye-Seul;Kim, Myeong-Hui;Lee, Jeong-Won
    • Information and Communications Magazine
    • /
    • v.31 no.12
    • /
    • pp.57-63
    • /
    • 2014
  • 최근 빅 데이터가 중요한 이슈로 부상하면서, 의료 분야에서의 빅 데이터 관리 및 활용에 대한 요구도 급증하고 있다. 하지만 의료 분야의 데이터는 데이터 자체의 특성과 의료 분야의 특수성으로 인해 다른 분야의 일반적인 빅 데이터와는 차별점이 많다. 따라서 의료 분야에서는 데이터 분석에 앞서 다양한 종류와 형태의 의료 데이터를 의미적으로 융합할 수 있는 방법이 전제되어야 한다. 본 고에서는 우선 의료 관련 데이터에 대한 기술(description) 표준 동향을 소개한다. 더불어 다각도의 기준에 따라 의료 데이터를 분류해봄으로써 그 다양성을 확인하고, 의료 데이터 융합의 필요성을 강조함으로써 의료 데이터 관리기술의 나아갈 방향을 제시하고자 한다.

Efficient Data Preprocessing Scheme for Audio Deep Learning in Solar-Powered IoT Edge Computing Environment (태양 에너지 수집형 IoT 엣지 컴퓨팅 환경에서 효율적인 오디오 딥러닝을 위한 데이터 전처리 기법)

  • Yeon-Tae Yoo;Chang-Han Lee;Seok-Mun Heo;Na-Kyung You;Ki-Hoon Kim;Chan-Seo Lee;Dong-Kun Noh
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.81-83
    • /
    • 2023
  • 태양 에너지 수집형 IoT 기기는 주기적으로 재충전되는 태양 에너지의 특성상, 에너지 소모를 최소화하기보다는 수집된 에너지를 최대한 유용하게 사용하는 것이 중요하다. 한편, 데이터 기밀성과 프라이버시, 응답속도, 비용 등의 이유로 클라우드가 아닌 데이터 소스 근처에서 머신러닝을 수행하는 엣지 AI에 대한 연구도 활발한데, 그 중 하나는 여러 IoT 장치들이 수집한 오디오 데이터를 활용하여, 다양한 AI 응용들을 IoT 엣지 컴퓨팅 환경에서 제공하는 것이다. 그러나, 이와 관련된 많은 연구에서, IoT 기기들은 에너지의 제약으로 인하여, 엣지 서버(IoT 서버)로의 센싱 데이터 전송만을 수행하고, 데이터 전처리를 포함한 모든 AI 과정은 엣지 서버에서 수행한다. 이 경우, 엣지 서버의 과부하 문제 뿐 아니라, 학습 및 추론에 불필요한 데이터까지도 서버에 그대로 전송되므로 네트워크 과부하 문제도 야기한다. 또한, 이를 해결하고자, 데이터 전처리 과정을 각 IoT 기기에 모두 맡긴다면, 기기의 에너지 부족으로 정전시간이 증가하는 또 다른 문제가 발생한다. 본 논문에서는 각 IoT 기기의 에너지 상태에 따라 데이터 전처리 여부를 결정함으로써, 기기들의 정전시간 증가 문제를 완화시키면서 서버 집중형 엣지 AI 환경의 문제들(엣지 서버 및 네트워크 과부하)을 완화시키고자 한다. 제안기법에서 IoT 장치는 기기가 기본적으로 동작하는 데 필요한 에너지 외의 여분의 에너지 양을 예측하고, 이 여분의 에너지가 있는 경우에만 이를 사용하여 기기에서 전처리 과정, 즉 수집 대상 소리 판별과 잡음 제거 과정을 거친 후 서버에 전송함으로써, IoT기기의 정전시간에 영향을 주지 않으면서, 에너지 적응적으로 데이터 전처리 위치(IoT기기 또는 엣지 서버)를 결정하여 수행한다.

Multi-sensor Data Fusion Using Weighting Method based on Event Frequency (다중센서 데이터 융합에서 이벤트 발생 빈도기반 가중치 부여)

  • Suh, Dong-Hyok;Ryu, Chang-Keun
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.6 no.4
    • /
    • pp.581-587
    • /
    • 2011
  • A wireless sensor network needs to consist of multi-sensors in order to infer a high level of information on circumstances. Data fusion, in turn, is required to utilize the data collected from multi-sensors for the inference of information on circumstances. The current paper, based on Dempster-Shafter's evidence theory, proposes data fusion in a wireless sensor network with different weights assigned to different sensors. The frequency of events per sensor is the crucial element in calculating different weights of the data of circumstances that each sensor collects. Data fusion utilizing these different weights turns out to show remarkable difference in reliability, which makes it much easier to infer information on circumstances.

A Smart Monitoring Management System Architecture Design for Modular Data Center Infra (모듈러 데이터센터 인프라를 위한 스마트 모니터링 관리 시스템 구조 설계)

  • Lee, Woo Seung;Kim, Hyun Woo;Lee, Young Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.26-29
    • /
    • 2013
  • 클라우드 컴퓨팅 및 빅데이터 환경에서 최근 데이터의 유동량은 폭발적으로 증가하였다. 그에 따라 대규모 IT자원 및 서비스 제공을 위한 핵심 인프라 역할을 맡고 있는 데이터센터의 수요가 급증하고 있는 추세이다. 하지만, 데이터센터의 빠른 확장 속도에 비하여 데이터센터를 통합적, 효율적으로 관리하고 모니터링 할 수 있는 시스템의 부재로 데이터센터의 빠른 유지보수, 효율적 자원관리와 고신뢰 시스템 구축이 어려운 실정이다. 또한 국내 여건상 외국의 사례와 같이 넓은 부지를 사용하여 데이터센터를 구축할 수가 없기 때문에 모듈 형태의 데이터센터 구축 연구가 절실한 상황이다. 본 논문에서는 이러한 폭발적 데이터 환경과 국내 여건을 고려한 효율적인 인프라 지원을 위한 모듈러 데이터 센터의 스마트 모니터링 관리 시스템 구조를 설계한다.