• 제목/요약/키워드: 데이터 선별

검색결과 570건 처리시간 0.026초

비전 인공지능 기반의 Recyclable-PET 선별에서 최적의 감독학습 기법 (A Method for Optimized Supervised Learning in Recyclable-PET Sorting based on Vision AI)

  • 김지영;지민구;정중은
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.640-642
    • /
    • 2021
  • 비전 기반의 재활용-PET 선별공정에서, PET 외 물체와의 식별 성능은 물론 PET 용기 내 포함된 이물질 및 라벨, 뚜껑의 존재 여부, 색상에 대한 검출 성능은 재활용 소재 품질에 중요한 영향을 미친다. 본 연구에서는 비전 인공지능 기반의 재활용-PET 자동 선별 시스템을 제안하고, 인공지능 모델의 제작에서 감독학습의 학습 효과를 최적화하기 위한 데이터 레이블링 기법을 제안한다. 재활용대상 PET 와 이물질 파트가 포함된 용기의 컨베이어벨트 선별공정 혼입을 재현한 실험을 통해서, 재활용 소재화 물량과 순도를 최대화하기 위한 인공지능 모델 생성 방법에 대해 고찰한다.

XML구조를 이용한 공공 빅데이터의 선별 저장 및 시각화 방법 (A Method for Selective Storing and Visualization of Public Big Data Using XML Structure)

  • 백봉현;하일규
    • 한국정보통신학회논문지
    • /
    • 제21권12호
    • /
    • pp.2305-2311
    • /
    • 2017
  • 최근들어 공공 정보화와 함께 정부기관, 지자체 및 다양한 정부산하기관에서 보유하고 있는 데이터를 공개하고 있는 추세이다. 즉, 공공기관이 업무수행의 결과물로 생성 및 수집한 다양한 전자화된 형태의 데이터를 공공데이터 포털사이트에서 개방하고 있다. 하지만 이를 사용하는 사용자는 데이터 형식의 이해와 데이터 처리 지식의 부족, 데이터에 대한 접근과 관리의 어려움, 수집 및 저장한 데이터의 이해를 위한 시각화 기술의 부족 등으로 빅데이터의 활용에 제한을 받고 있다. 따라서 본 연구에서는 다양한 공공 사이트에서 제공하는 빅데이터를 데이터셋의 URL 및 API를 사용하여 데이터 포맷에 관계없이 데이터를 수집하며, 수집된 데이터를 XML 구조를 이용하여 재가공하여 데이터베이스화하며, 데이터 융합을 통한 시각화가 가능하도록 하는 공공 빅데이터 수집, 선별 저장 및 시각화 플랫폼을 제안한다.

블록체인을 활용한 양질의 기계학습용 데이터 수집 방안 연구 (High-quality data collection for machine learning using block chain)

  • 김영랑;우정훈;이재환;신지선
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.13-19
    • /
    • 2019
  • 기계학습의 정확도는 학습용 데이터의 양과 데이터의 품질에 많은 영향을 받는다. 기존의 웹을 기반으로 학습용 데이터를 수집하는 것은 실제 학습과 무관한 데이터가 수집 될 수 있는 위험성이 있으며 데이터의 투명성을 보장할 수가 없다. 본 논문에서는 블록체인구조에서 블록들이 직접 병렬적으로 데이터를 수집하게 하고 각 블록들이 수집한 데이터를 타 블록의 데이터와 비교하여 양질의 데이터만을 선별하는 방안을 제안한다. 제안하는 시스템은 각 블록들은 데이터를 서로 블록체인을 통해 공유하며 All-reduce 구조의 Parallel-SGD를 활용하여 다른 블록들의 데이터와 비교를 통해 양질의 데이터만을 선별하여 학습용 데이터셋을 구성할 수가 있다. 또한 본 논문에서는 제안한 구조의 성능을 확인하기 위해 실험을 통해 기존의 벤치마크용 데이터셋의 이미지를 활용하여 변조된 이미지 사이에서 원본 이미지만을 양질의 데이터로 판별함을 확인하였다.

클래스 구분력이 없는 특징 소거법 (Removing non-informative features weakening of class separability)

  • 이재성;김대원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.59-62
    • /
    • 2007
  • 본 논문에서는 불균형 및 Under-sampling된 바이오 데이터에 대하여 클래스 구분력이 없는 특징의 소거를 통해 이후 이어질 FLDA 둥 다양한 방법론올 적용할 수 있는 방법을 제안하고자 한다. 제안하는 알고리즘은 평균과 분산을 통해 클래스의 형태를 결정하는 기존 방법론의 문제점을 회피할 수 있는 방법을 제공하며, 클래스 구분력에 중점을 두어 특정을 선별하였을 경우 선별된 특정들의 상관 계수가 높은 문제를 극복할 수 있도록 한다. 이에 따라 알고리즘이 선택한 특정집합은 서로의 특징에 대해 상관계수가 낮으며, 클래스의 구분력이 높은 특정을 갖게 된다.

  • PDF

인간 지식을 이용한 경험적 의사결정트리의 설계 (Design of Heuristic Decision Tree (HDT) Using Human Knowledge)

  • 윤태복;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.525-531
    • /
    • 2009
  • 데이터 마이닝(Data Mining)은 수집된 데이터로 부터 감춰진 패턴을 찾는 작업이다. 여기에서 수집된 데이터는 예측 및 추천을 위한 기반 정보로 중요한 역할을 하며, 분석 결과의 성능을 향상시키기 위해 잘못된(Missing value) 데이터를 선별하는 과정을 필요로 한다. 수집한 데이터에서 의도하지 못한 데이터를 선별하기 위한 기존의 방법은 주로 통계적이거나 단순 거리(Distance)에 기반을 둔 방법을 이용하였다. 하지만 환경 및 데이터의 특성을 고려하지 못하여, 의미 있는 데이터도 함께 분석에서 제외 될 수 있는 문제점을 가지고 있다. 본 논문은 인간의 경험적 지식을 수집된 데이터와 비교하여 가중치로 변환하고, 의사결정트리(Decision Tree)의 생성에 이용한다. 생성된 트리는 인간의 지식이 반영되어 기존의 분석 방법보다 신뢰성이 높다고 할 수 있으며, 실험을 통하여 제안하는 방법의 유효성을 확인하였다.

GPS 기선처리에 대한 한계범위 검증 (Verification of Limit Range for GPS Baseline Processing)

  • 홍정수;박운용;이용희;오창수
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2004년도 춘계학술발표회논문집
    • /
    • pp.97-102
    • /
    • 2004
  • 현재 4차원 정밀측정이 가능한 GPS는 데이터 처리와 사용기기 면에서 많은 발전을 이루고 있으며, 정밀한 데이터 결과를 제공하고 있다. 처리 방식에 따른 기선거리별 한계치에 대한 재검증을 실시하고자 하였으며, 측지용 GPS 수신기를 이용한 기선측정에 있어, L$_1$주파수 수신 GPS 시스템의 유효측정거리에 대하여 논하였다. 또한 일반적인 기선처리방식 이외의 다양한 처리기법들을 적용하여 각 단ㆍ중ㆍ장기선에 대해 가장 알맞은 처리방식을 도출하려고 하였으며 결과를 도출하는 과정에서 GPS 상대거리 관측데이터에 대해 양호한 데이터를 선별할 수 있는 기준 안을 마련하고자 하였다.

  • PDF

머신러닝에 의한 도시광산 재활용 기술 개발 (Development of Urban Mine Recycling Technology by Machine Learning)

  • Terada, Nozomi;Ohya, Hitoshi;Tayaoka, Eriko;Komori, Yuji;Tayaoka, Atsunori
    • 자원리싸이클링
    • /
    • 제30권4호
    • /
    • pp.3-10
    • /
    • 2021
  • 도시광산의 대표적인 사례인 폐 전자부품 재활용 분야는 유용한 선별기술의 개발이 필요하다. 본 연구에서는 전자부품들을 4개의 그룹으로 선별하기 위해 딥러닝에 의한 이미지 식별을 기반으로 한 선별기를 개발하였다. 전자부품들은 폐 인쇄회로기판으로부터 회수되었으며, 처리 후 차이점에 따라 분리되어야 한다. 선별기는 GPU, 카메라, 컨베이어벨트, 공기 압축기로 이루어진 워크스테이션으로 구성되어있다. 컨베이어벨트(벨트 속도: 6cm/s) 위에 있는 작은 크기(3.5cm 이하)의 전자부품들을 데이터로 가져와 학습했다. 이미지 식별의 정확도는 종류에 따라 96%, 그리고 그룹에 따라 99%였다. 벨트속도와 압축공기의 블로다운 시간과 같은 작동조건에 변화를 주었을 때, 이미지 식별의 정확도 그리고 블로다운에 의한 회수율을 측정하여 선별의 최적 조건을 결정했다. 최적조건에서 이미지 분류의 정확도는 그룹별로 98.7%였다. 선별 효율은 70% 이상이었다.

Sparse and low-rank feature selection for multi-label learning

  • Lim, Hyunki
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권7호
    • /
    • pp.1-7
    • /
    • 2021
  • 본 논문에서는 다중 레이블 분류를 위한 특징 선별 기법을 제안한다. 기존 많은 특징 선별 기법들은 상호정보척도 등을 이용하여 특징과 레이블 사이의 연관성을 계산하여 특징을 선별하였다. 하지만 상호정보척도는 결합 확률을 요구하기 때문에 실제 전제 특징 집합에서 결합 확률을 계산하는 것은 어렵다. 따라서 소수의 특징만 계산이 가능하여 지역적 최적화만 가능하다는 단점을 가진다. 이런 지역적 최적화 문제를 피해, 주어진 특징 전체 공간에서 저랭크 공간을 구성하고, 희소성을 가진 특징들을 선별할 수 있는 특징 선별 기법을 제안한다. 이를 위해 뉴클리어 노름을 이용해 회귀 기반의 목적함수를 설계하였고, 이 목적 함수의 최적화 문제를 풀기 위한 경사하강법 방식의 알고리즘을 제안하였다. 4가지의 데이터와 3가지 다중 레이블 분류 성능을 기준으로 다중 레이블 분류 실험 결과를 통해 제안하는 방법론이 기존 특징 선별 기법보다 좋은 성능을 나타내는 것을 보였다. 또한 제안하는 목적함수의 파라미터 값 변화에도 성능 변화가 둔감한 것을 실험적인 결과로 확인하였다.

치매 선별을 위한 도형모사검사 개발 및 타당화 (Development and Validation of Figure-Copy Test for Dementia Screening)

  • 김초복;허주연;홍지윤;이경면;박중규;신창환
    • 한국노년학
    • /
    • 제40권2호
    • /
    • pp.325-340
    • /
    • 2020
  • 치매 증상의 진행 지연 및 관리비용의 절감을 위해서는 치매를 조기에 발견하여 관리하는 것이 중요하다. 이에 본 연구에서는 치매와 관련된 인지신경학적 손상을 측정할 수 있는 간단한 그림검사인 도형모사검사를 개발하여, 치매 선별 가능성을 확인하고자 하였다. 또한, 도형모사검사의 이미지 데이터에 대한 기계학습을 통해 검사 채점의 자동화 가능성을 확인하고자 하였다. 이를 위해 270명의 일반 및 손상집단 참가자들에 대하여 도형모사검사, MMSE-DS, 그리고 시계그리기 검사를 수행하였다. 분석 결과, 도형모사검사의 점수는 높은 내적 일치도를 보였을 뿐만 아니라, 다른 두 검사 점수와 유의한 상관을 보여 검사의 타당성을 확인하였다. 세 검사의 치매 선별 정확도를 비교하기 위해 판별분석을 시행한 결과, 다른 두 검사와 비교했을 때 도형모사검사가 일반 및 손상 집단을 각각 90.8% 및 77.1%의 정확도로 예측하여, 집단에 대한 예측 수준이 상대적으로 더 높은 것으로 나타났다. 또한, 신경과 진단을 통한 임상 결과를 통해, MMSE-DS를 통해 선별하지 못했던 치매 사례들을 도형모사검사를 이용하여 선별할 수 있음을 확인하였다. 마지막으로, 도형모사검사의 이미지 데이터를 이용한 기계학습을 수행한 결과, 73.70%의 정확률로 집단을 예측하는 것을 확인하였다. 본 연구는 기존에 사용되어 온 치매 선별 검사의 한계를 보완하여, 시행과 채점이 간편한 새로운 그림검사를 개발하였다는 점에서 의의를 지닌다.

한우 6번 염색체의 Bootstrap기법을 이용한 우수 DNA 탐색

  • 이제영;여정수;김재우;이용원;김문정
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 춘계학술대회
    • /
    • pp.41-47
    • /
    • 2003
  • 한우 6번 염색체 유전자 지도에서 한우의 질을 높이기 위한 QTL(quantitative trait loci)분석을 실시하여 선별된 Loci 값을 Permutation Test를 이용하여 계산하였다. 한편, 경제적으로 주요한 한우의 특성부위(질적부위와 육량등)에 따른, 우수 경제형질 DNA marker를 K-평균 군집법을 실시 파악하였다. 이들 QTL과 K-평균법에 의해 한우의 염색체 6번, ILST035의 주요 경제 형질별 DNA marker들을 선별하여, Bootstrap BCa방법을 이용하여 각 DNA marker들의 신뢰구간을 구했다.

  • PDF