• 제목/요약/키워드: 데이터 생성

검색결과 7,054건 처리시간 0.039초

효율적인 진화알고리즘을 이용한 적응형 퍼지 분류 규칙 생성 (Generating Adaptive Fuzzy Classification Rules using An Efficient Evolutionary Algorithm)

  • 류정우;김성은;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.769-771
    • /
    • 2005
  • 데이터 특성이 연속적이고 애매할 때 퍼지규칙으로 분류 규칙을 표현하는 것은 매우 유용하고 효과적이다. 그러나 일반적으로 정확하지 않은 데이터 특성에 대해서 소속함수를 결정한다는 것은 어려운 일이다. 본 논문에서는 진화알고리즘을 이용하여 효과적인 퍼지 분류 규칙을 자동으로 생성하는 방법을 제안한다. 제안한 방법에서 규칙의 정확성과 이해성을 고려하여 최적화된 소속함수를 생성하기 위해 진화알고리즘을 사용한다. 먼저 지도 군집화로 진화를 위한 초기 소속함수를 생성한다. 진화알고리즘은 전역적 최적 해를 찾는데 효과적이다. 그러나 시간에 대한 효율성이 낮다. 특히 모델 최적화 문제에서는 개체 평가 단계에서 많은 시간이 소요된다. 따라서 본 논문에서는 전체 데이터를 여러 개의 부분 데이터들로 나누고 개체들은 전체 데이터 대신 매번 부분 데이터를 임의적으로 선택하여 개체를 평가함으로써 수행 시간을 단축시킬 수 있는 진화 방법을 제안한다. 제안한 퍼지 분류 규칙 생성 방법의 타당성을 검증하기 위한 실험 데이터로 UCI에서 제공하는 데이터들을 사용하였으며, 실험 결과는 기존 방법에 비해 평균적으로 더 효과적임을 확인하였다.

  • PDF

교육데이터 정제를 위한 다양한 밀도분포를 고려한 개선된 DBSCAN 알고리즘 (An Enhanced DBSCAN Algorithm to Consider Various Density Distributions for Educational Data)

  • 김정훈;나스리디노프 아지즈
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 동계학술대회
    • /
    • pp.41-44
    • /
    • 2018
  • 교육데이터마이닝은 다양한 교육 환경에서 생성되는 막대한 양의 데이터를 활용하여 학습자들의 학습 유형, 학습 진도를 분석, 예측하고 교육 성취를 효과적으로 향상시키는 것을 목적으로 한다. 효과적인 교육데이터마이닝 결과를 얻기 위해서는 교육데이터에 대한 정제 과정이 필요하며 DBSCAN 클러스터링을 통해 교육데이터에 포함된 노이즈 데이터를 제거하고 생성된 각 클러스터에서 동일한 비율로 데이터를 추출함으로써 편향되지 않은 표본 데이터를 생성할 수 있다. 하지만 DBSCAN은 두 개의 전역 매개변수에 의해 다양한 밀도분포를 가지는 클러스터를 생성할 수 없다는 문제점이 있으며 이는 교육 데이터를 정제함에 있어 치명적인 문제점이 될 수 있다. 본 논문에서는 DBSCAN의 문제점을 개선하고 클러스터링 정확도를 향상시키기 위해 고정된 매개변수를 사용하지 않고 각 밀도분포에 대해 최적의 입력 매개변수를 결정함으로써 다양한 밀도분포를 가지는 클러스터들을 효과적으로 생성하는 C-DBSCAN을 제안한다.

  • PDF

라이다 데이터와 항공영상을 이용한 DSM 생성 (DSM Generation using LIDAR and Image Data)

  • 홍주석;최경아;이임평;민성홍
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2009년도 춘계학술대회 논문집
    • /
    • pp.66-71
    • /
    • 2009
  • 최근 가상도시, 위치기반시스템 등 여러 분야에서 도심지역의 고해상도 DSM의 수요가 증가하고 있다. 고해상도 DSM을 획득하는데 항공 라이다 측량은 가장 효율적이고 경제적인 방법으로 인정받고 있다. 그러나 레이저 펄스는 도시건물의 모서리와 코너보다는 주로 표면에서 반사되기 때문에 일반적으로 라이다 DSM은 명확한 수직 breakline을 포함하기 힘들다. 이에 본 연구에서는 라이다 데이터와 항공영상의 결합을 통해서 고품질의 도시지역 DSM을 생성하는 새로운 방법을 제안하고자 한다. 제안된 방법은 (1) 서로 다른 두 센서에서 획득된 라이다 데이터와 영상의 기하 정합, (2) 라이다 데이터를 이용한 영상정합, (3) 영상정합을 통해 획득된 지상점과 라이다 데이터를 이용한 DSM 생성순으로 이루어진다. 영상 정합을 위한 지상점의 초기값으로 대상지의 평균고도를 높이로 사용하는 것이 아니라 라이다 데이터로부터 얻어진 높이를 사용한다면 영상 정합이 아주 정밀하게 이루어 질 수 있다. 이와 함께 정합된 영상으로부터 얻어진 지상점은 라이다 데이터 보다 더 높은 밀도를 갖게 된다. 따라서 DSM 생성을 위한 격자에 라이다 데이터와 영상정합의 결과로 얻어진 지상점 모두를 내삽에 이용하여 DSM을 생성하고자 한다.

  • PDF

초정밀 가시화를 위한 디지털 트윈 데이터 생성 및 저작 플랫폼 (Digital Twin Data Generation and Authoring Platform for Ultra-precision Visualization)

  • 전지혜;길영익;백희원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.18-20
    • /
    • 2021
  • 디지털 트윈 기술은 산업 분야와 관련된 방대한 데이터를 다루기 때문에 데이터에서 유의미한 인사이트를 도출하는 것은 매우 중요한 이슈이다. 그러기 위해서는 관리자가 데이터를 직관적이고 빠르게 해석하고 이해할 수 있어야 하며 그와 관련된 표출 기술에 관한 연구가 필요하다. 이에 본 논문은 현장에 대한 정확한 이해를 위해 전 산업 현장에서 공통으로 활용할 수 있도록 데이터를 초정밀로 표출하고 자동으로 디지털 트윈 가상 공간의 데이터 생성 및 저작이 가능한 서비스 플랫폼에 대해 논한다. 첫 번째, 데이터 초정밀 가시화를 위해 실사 영상 기반의 3D 가상 공간 및 현장 오브젝트를 자동으로 생성하여 표출하고, 저작 가능한 기술에 대해 논한다. 두 번째, 생성한 데이터를 서비스 하기 위한 경량화 표출 기술에 대해 논한다. 두 가지 기술 요소의 융합으로 디지털 트윈 가상 공간을 빠르게 생성하여 시간과 비용을 절감할 수 있고, 서비스 가능한 형태로 변환하여 광역 표출 확장성에 대한 효과를 검증하였다.

  • PDF

데이터 균형을 위한 Chat-GPT와 Diffusion Model 기반 폐기물 생성모델 설계 (Design of a Waste Generation Model based on the Chat-GPT and Diffusion Model for data balance)

  • 김시웅;고준혁;박정현;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.667-669
    • /
    • 2023
  • 데이터의 균형은 객체 인식 분야에서 영향을 미치는 요인 중 하나이다. 본 논문에서는 폐기물 데이터 균형을 위해 Chat-GPT와 Diffusion model 기반 데이터 생성 모델을 제안한다. Chat-GPT를 사용하여 폐기물의 속성에 해당하는 단어를 생성하도록 질문하고, 생성된 단어는 인코더를 통해 벡터화시킨다. 이 중 폐기물과 관련 없는 단어를 삭제 후, 남은 단어들을 결합하는 전처리 과정을 거친다. 결합한 벡터는 디코더를 통해 텍스트 데이터로 변환 후, Stable Diffusion model에 입력되어 텍스트와 상응하는 폐기물 데이터를 생성한다. 이 데이터는 AI Hub의 공공 데이터를 활용하며, 객체 인식 모델인 YOLOv5로 학습해 F1-score와 mAP로 평가한다.

테스트 데이터 자동 생성을 위한 적합도 평가 방법의 효율성 향상 기법 (An Improved Technique of Fitness Evaluation for Automated Test Data Generation)

  • 이선열;최현재;정연지;배정호;김태호;채흥석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.882-891
    • /
    • 2010
  • 테스트 데이터를 자동으로 생성하기 위한 동적 테스트 데이터 생성에 관한 많은 연구가 이루어졌다. 동적 테스트 데이터 생성 방법은 가공 테스트 대상 프로그램(SUT; Software Under Test)을 실행시켜 기존의 테스트 데이터의 적합도를 평가하고, 평가된 적합도 값과 최적의 알고리즘을 이용하여 새로운 테스트 데이터를 생성하는 방법이다. 최근에 전역 최적화 알고리즘을 이용한 동적 테스트 데이터 생성에 관한 많은 연구가 이루어져 왔고, 이 알고리즘을 통해서 테스트 대상 프로그램 (SUT)의 커버리지를 높일 수 있는 데이터를 생성할 수 있다는 것이 실험적으로 밝혀졌다. 그러나 최적화 알고리즘은 오랜 연산 시간이 필요하기 때문에, 이를 이용한 방법은 테스트 데이터를 생성하기 위해 많은 시간이 걸린다는 단점이 있다. 본 논문에서는 최적화 알고리즘을 이용한 동적 테스트 데이터 생성의 시간을 줄이기 위하여, 최적화 알고리즘의 절차 중 적합도 평가 시간을 줄이는 방법을 제안한다. 이를 위하여 SUT의 테스트 목표 경로로 부터 생성된 적합도 평가 프로그램(FEP)을 정의하고, 가공 SUT 실행하는 대신 소개된 FEP를 이용한 적합도 평가 방법을 제안하고 'ConGA'라는 도구를 구현한다. 그리고 C언어로 작성된 프로그램을 'ConGA'를 이용하여, 테스트 데이터 생성 효율성을 확인하였다. 이 실험을 통하여 제안된 방법이 기존의 방법보다 테스트 데이터 생성에 걸린 시간을 평균적으로 약 20% 줄인 것을 확인할 수 있었다.

Diffusion Model을 활용한 신용 예측 데이터 불균형 해결 기법 (Mitigating Data Imbalance in Credit Prediction using the Diffusion Model)

  • 오상민;이주홍
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.9-15
    • /
    • 2024
  • 본 논문에서는 신용 예측에서 발생하는 불균형 문제를 해결하기 위해 Diffusion Multi-step Classifier(DMC)를 제안한다. DMC는 Diffusion Model을 통해 신용 예측 데이터의 연속적인 수치형 데이터들을 생성하고 생성된 데이터들을 Multi-step Classifier로 구분하는 것으로 범주형 데이터를 생성한다. DMC를 통해 기존의 데이터를 생성하는 다른 알고리즘보다 실제 데이터와 유사한 분포를 가지는 데이터를 생성할 수 있었다. 이렇게 생성된 데이터를 사용하여 실험을 진행하였을 때 연체를 예측할 확률이 20%이상 상승하였으며, 전체적으로 예측 정확성은 약 4%정도 상승하였다. 이러한 연구 결과는 실제 금융기관에 적용 시 연체율 감소와 수익 증가에 큰 기여를 할 수 있을것으로 예상된다.

모션 매핑 기반의 캐릭터 애니메이션 개발 도구 (A Character Animation Tool Based on Motion Mapping)

  • 이민근;이명원
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제5권2호
    • /
    • pp.43-52
    • /
    • 1999
  • 본 논문에서는 캐릭터의 운동 표현에 필요한 데이터 구조를 시각적으로 기술할 수 있는 사용자 인터페이스에서 모션 매핑 기술을 이용하여 3차원 캐릭터의 애니메이션을 쉽게 생성할 수 있는 도구 개발에 대해 기술한다. 본 논문에서의 모션 매핑이란 한 번 생성된 애니메이션을 그대로 다른 캐릭터에 적용하여 같은 모션을 생성시키는 것으로 정의한다. 본 애니메이션 도구는 3차원 캐릭터의 기하 데이터를 이용하여 애니메이션의 생성과 변형을 대화적 방법으로 쉽게 생성시킬 수 있다. 이것은 본 연구팀에서 앞서 개발한 캐릭터 개발도구에서 생성된 3차원 캐릭터 데이터를 위의 인터페이스에서 모션 생성의 구조를 대화적으로 변형시키면서 애니메이션을 생성하도록 구성한 것이다. 기존의 다른 애니메이션 도구와 구별되는 기능으로는 캐릭터의 모델링 데이터와 모션 데이터를 분리하여 모델링 데이터가 없는 상황에서도 독립적으로 애니메이션만을 실행시킬 수 있으며 한 번 생성된 애니메이션을 모션 매핑으로 다른 캐릭터에 그대로 적용시킬 수 있다는 것이다.

  • PDF

해무 제거 학습을 위한 가상 해무 데이터셋 생성 및 유효성 검증 연구

  • 전영수;김현철;이상훈;오세웅;옥수열
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 춘계학술대회
    • /
    • pp.103-105
    • /
    • 2022
  • 인공지능을 기반으로 한 안개를 제거하는 기술은 많은 연구가 있다. 하지만 대부분의 연구가 육상을 타겟으로 하고 있기 때문에 해상에 발생하는 해무를 제거하기 위한 데이터 셋은 현저히 부족하다. 이를 해결하기 위해 가상의 해무를 생성하여 데이터 셋을 생성하고 유효성 검증을 하는 방법에 대하여 연구하였다.

  • PDF

Image captioning 데이터와 Visual QA 데이터를 활용한 질문 자동 생성 (Automatic question generation based on image captioning data & visual QA data)

  • 이경호;최용석;이공주
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.176-180
    • /
    • 2016
  • 대화형 시스템이 사람의 경청 기술을 모방할 수 있다면 대화 상대방과 더 효과적으로 상호작용 할 수 있을 것이다. 본 논문에서는 시스템이 경청 기술을 모방할 수 있도록 사용자의 발화를 기반으로 질문을 생성하는 것에 대해 연구하였다. 그리고 이러한 연구를 위해 필요한 데이터를 Image captioning과 Visual QA 데이터를 기반으로 생성하고 활용하는 방안에 대해 제안한다. 또한 이러한 데이터를 Attention 메커니즘을 적용한 Sequence to sequence 모델에 적용하여 질문을 생성하고, 생성된 질문의 질문 유형을 분석하였다. 마지막으로 사람이 작성한 질문과 모델의 질문 생성 결과 비교를 BLEU 점수를 이용하여 수행하였다.

  • PDF