• Title/Summary/Keyword: AI학습데이터

Search Result 617, Processing Time 0.031 seconds

JPEG AI의 부호화 프레임워크들의 분석 및 활용 사례에 대한 소개

  • 한승진;김영섭
    • Broadcasting and Media Magazine
    • /
    • v.28 no.1
    • /
    • pp.13-28
    • /
    • 2023
  • 이미지 압축은 이미지 및 영상처리에서 주요한 역할을 하며, 자율주행, 클라우드, 영상 송출 등의 분야에서 빅데이터를 처리해야 하는 수요가 늘어남에 따라 지속적인 연구가 진행 중이다. 그 중심에는 딥러닝(deep learning)의 발전이 자리잡고 있으며, 심층 신경망(deep neural network)을 효과적으로 학습하는 알고리즘들을 적용한 논문들은 기존 압축 포맷인 JPEG, JPEG 2000, MPEG 등의 압축 성능을 뛰어넘는 결과를 보여 주고 있다. 이에 따라 JPEG AI는 딥러닝 기반 학습 이미지 압축의 표준을 제정하는 일을 진행 중이다. 본 기고에서는 JPEG AI가 표준화하고자 하는 기술과 JPEG AI에 제안한 압축 프레임워크들을 분석하고, 활용 사례들을 소개하여 JPEG AI 기반 학습 이미지 압축 모델의 동향에 대해 알아보고자 한다.

  • PDF

Prompt-based Data Augmentation for Generating Personalized Conversation Using Past Counseling Dialogues (과거 상담대화를 활용한 개인화 대화생성을 위한 프롬프트 기반 데이터 증강)

  • Chae-Gyun Lim;Hye-Woo Lee;Kyeong-Jin Oh;Joo-Won Sung;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.209-213
    • /
    • 2023
  • 최근 자연어 이해 분야에서 대규모 언어모델 기반으로 프롬프트를 활용하여 모델과 상호작용하는 방법이 널리 연구되고 있으며, 특히 상담 분야에서 언어모델을 활용한다면 내담자와의 자연스러운 대화를 주도할 수 있는 대화생성 모델로 확장이 가능하다. 내담자의 상황에 따라 개인화된 상담대화를 진행하는 모델을 학습시키려면 동일한 내담자에 대한 과거 및 차기 상담대화가 필요하지만, 기존의 데이터셋은 대체로 단일 대화세션으로 구축되어 있다. 본 논문에서는 언어모델을 활용하여 단일 대화세션으로 구축된 기존 상담대화 데이터셋을 확장하여 연속된 대화세션 구성의 학습데이터를 확보할 수 있는 프롬프트 기반 데이터 증강 기법을 제안한다. 제안 기법은 기존 대화내용을 반영한 요약질문 생성단계와 대화맥락을 유지한 차기 상담대화 생성 단계로 구성되며, 프롬프트 엔지니어링을 통해 상담 분야의 데이터셋을 확장하고 사용자 평가를 통해 제안 기법의 데이터 증강이 품질에 미치는 영향을 확인한다.

  • PDF

Designing a Multimodal MyData Distribution System for Voluntary Acquisition of AI Training Data (인공지능 학습데이터 자발적 확보를 위한 멀티모달 마이데이터 유통시스템 설계)

  • Dong-Hyun Lim;Dea-Woo Park
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.19 no.5
    • /
    • pp.895-902
    • /
    • 2024
  • AI requires learning, and learning requires data. Some data is copyright-free, such as mountains, oceans, and terrain, while others are restricted by various laws, such as privacy and copyright laws. This thesis investigates how data subjects can voluntarily consent and participate in the collection, utilization, and distribution of their data, overcoming legal restrictions. We design a system that creates specific spaces in public places, engages businesses to define the data needed for learning, and rewards citizens for voluntarily participating in the collection of Multimodal MyData in specific spaces. In addition, a system that enables authentication, distribution, and sale/resale of generated data in connection with the government's MyData platform will be implemented. If this is led by the government, it will be possible to collect data for learning in a new way without legal sanctions for each learning domain, which will further revitalize the development and utilization of AI technology.

Optimization of Sensor Data Window Size for Deep Learning Regression Model (딥러닝 회귀 모델 개발을 위한 센서 데이터 윈도우 사이즈 최적화 기법)

  • Choi, Min-Seo;Yoo, Dong-Yeon;Lee, Jung-Won
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.610-613
    • /
    • 2022
  • 센서 데이터의 중요성이 커지면서 센서 데이터 처리 연구의 수요가 증가하고 있다. 센서 데이터 기반의 딥러닝 모델 개발 시, 센서 데이터 단일 값에 의한 출력이 아닌 시계열적인 특성을 반영하여 연속적인 데이터 간의 연관성을 파악할 수 있는 슬라이딩 윈도우 기법을 통해 효율적으로 데이터를 분석하고 처리할 수 있다. 하지만, 기존의 방법들은 학습 성능(학습 시간 및 모델 성능)에 미치는 영향을 평가하는 기준 없이 입력 데이터의 윈도우 사이즈를 임의로 설정하여 데이터를 처리해 왔다. 따라서, 본 논문은 학습 시간과 모델 성능을 기준으로 센서 데이터의 윈도우 사이즈 최적화 기법을 제안한다. 제안한 방법은 전류를 이용하여 스위치와 다이오드 온도를 추정하는 가상 센서(virtual sensor) 실험 테스트베드에 적용하여, 학습 시간 중심으로는 5%의 윈도우 사이즈를, 모델 성능 중심으로는 R2 SCORE 의 값을 0.9295 로 갖는 8%의 윈도우 사이즈가 최적으로 도출되었다.

Implementation of Image Learning Model for Recycling (분리수거를 위한 리사이클링 봇 이미지데이터 학습모델 구현)

  • Noh, Yujeong;Shin, Boksuk
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.527-529
    • /
    • 2021
  • This paper focuses on the implementation of machine learning model for Recycling bot, which is a platform service of recycling education. The recycling bot applied with a AI model using collected image set. The experiment confirms that classified by the model result are accurate.

  • PDF

A Study of Semantic Role Labeling using Domain Adaptation Technique for Question (도메인 적응 기술 기반 질문 문장에 대한 의미역 인식 연구)

  • Lim, Soojong;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.246-249
    • /
    • 2015
  • 기계학습 방법에 기반한 자연어 분석은 학습 데이터가 필요하다. 학습 데이터가 구축된 소스 도메인이 아닌 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 10% 정도 성능 하락이 발생한다. 본 논문은 기존 도메인 적응 기술을 이용하여 도메인이 다르고, 문장의 형태도 다를 경우에 도메인 적응 알고리즘을 적용하여, 질의응답 시스템에서 필요한 질문 문장 의미역 인식을 위해, 소규모의 질문 문장에 대한 학습 데이터 구축만으로도 한국어 질문 문장에 대해 성능을 향상시키기 위한 방법을 제안한다. 한국어 의미역 인식 기술에 prior 모델을 제안한다. 제안하는 방법은 실험결과 소스 도메인 데이터만 사용한 실험보다 9.42, 소스와 타겟 도메인 데이터를 단순 합하여 학습한 경우보다 2.64의 성능향상을 보였다.

  • PDF

Preliminary Test of Google Vertex Artificial Intelligence in Root Dental X-ray Imaging Diagnosis (구글 버텍스 AI을 이용한 치과 X선 영상진단 유용성 평가)

  • Hyun-Ja Jeong
    • Journal of the Korean Society of Radiology
    • /
    • v.18 no.3
    • /
    • pp.267-273
    • /
    • 2024
  • Using a cloud-based vertex AI platform that can develop an artificial intelligence learning model without coding, this study easily developed an artificial intelligence learning model by the non-professional general public and confirmed its clinical applicability. Nine dental diseases and 2,999 root disease X-ray images released on the Kaggle site were used for the learning data, and learning, verification, and test data images were randomly classified. Image classification and multi-label learning were performed through hyper-parameter tuning work using a learning pipeline in vertex AI's basic learning model workflow. As a result of performing AutoML(Automated Machine Learning), AUC(Area Under Curve) was found to be 0.967, precision was 95.6%, and reproduction rate was 95.2%. It was confirmed that the learned artificial intelligence model was sufficient for clinical diagnosis.

Implementation of a data collection system for big data analysis and learning based on infant body temperature data (영유아 체온 데이터 기반 빅데이터 분석 및 학습을 위한 데이터 수집 시스템 구현)

  • Lee, Hyoun-Sup;Heo, Gyeongyong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.577-578
    • /
    • 2021
  • Recently, artificial intelligence systems are being used in various fields. The accuracy of the decision algorithm of artificial intelligence is greatly affected by the amount of learning and the accuracy of the learning data. In the case of the amount of learning, a large amount of data is required because it has a decisive effect on the performance of AI. In this paper, we propose a data collection system for constructing a system that analyzes future conditions and changes in infants' conditions based on the body temperature data of infants and toddlers. The proposed system is a system that collects and transmits data, and it is believed that it can minimize the resource consumption of the server system in existing big data analysis and training data construction.

  • PDF

The Core Concepts of Mathematics for AI and An Analysis of Mathematical Contents in the Textbook (수학과 인공지능(AI) 핵심 개념과 <인공지능 수학> 내용 체계 분석)

  • Kim, Changil;Jeon, Youngju
    • Journal of the Korean School Mathematics Society
    • /
    • v.24 no.4
    • /
    • pp.391-405
    • /
    • 2021
  • In this study, 'data collection', 'data expression', 'data analysis, and 'optimization and decision-making' were selected as the core AI concepts to be dealt with in the mathematics for AI education. Based on this, the degree of reflection of AI core concepts was investigated and analyzed compared to the mathematical core concepts and content of each area of the elective course. In addition, the appropriateness of the content of was examined with a focus on core concepts and related learning contents. The results provided some suggestions for answering the following four critical questions. First, How to set the learning path for ? Second, is it necessary to discuss the redefinition of the nature of ? Third, is it appropriate to select core concepts and terms for ? Last, is it appropriate to present the relevant learning contents of the content system of ?

AI Performance Based On Learning-Data Labeling Accuracy (인공지능 학습데이터 라벨링 정확도에 따른 인공지능 성능)

  • Ji-Hoon Lee;Jieun Shin
    • Journal of Industrial Convergence
    • /
    • v.22 no.1
    • /
    • pp.177-183
    • /
    • 2024
  • The study investigates the impact of data quality on the performance of artificial intelligence (AI). To this end, the impact of labeling error levels on the performance of artificial intelligence was compared and analyzed through simulation, taking into account the similarity of data features and the imbalance of class composition. As a result, data with high similarity between characteristic variables were found to be more sensitive to labeling accuracy than data with low similarity between characteristic variables. It was observed that artificial intelligence accuracy tended to decrease rapidly as class imbalance increased. This will serve as the fundamental data for evaluating the quality criteria and conducting related research on artificial intelligence learning data.