• 제목/요약/키워드: 데이터셋 유형

검색결과 71건 처리시간 0.022초

액티브 러닝을 활용한 영상기반 건설현장 물체 자동 인식 프레임워크 (Automated Vision-based Construction Object Detection Using Active Learning)

  • 김진우;지석호;서준오
    • 대한토목학회논문집
    • /
    • 제39권5호
    • /
    • pp.631-636
    • /
    • 2019
  • 최근 많은 연구자들이 대규모 현장에 투입된 건설자원의 유형과 위치를 자동 파악하는 영상분석기술을 활발히 개발하고 있다. 하지만 기존의 방법들은 인식하고자 하는 건설 물체(작업자, 중장비, 자재 등)를 학습용 이미지 데이터에 표시하는 Labeling 작업을 요구하고 이에 불필요한 시간과 노력이 낭비된다는 한계가 있다. 이러한 한계를 보완하기 위해서 본 연구는 액티브 러닝을 활용한 영상기반 건설현장 물체 자동 인식 프레임 워크를 제안함을 목표로 한다. 개발 프레임워크 검증을 목적으로 건설분야 Benchmark 데이터셋을 이용하여 실제 실험을 진행하였다. 그 결과, 액티브 러닝을 통해 학습한 모델은 다양한 특성을 지닌 건설물체를 성공적으로 인식할 수 있었고, 기존의 학습 DB 구축 방식과 비교할 때 더 적은 데이터 수와 반복학습 횟수로도 높은 성능을 가지는 영상분석모델을 개발할 수 있었다. 결과적으로 기존에 요구되던 학습 DB 구축을 위한 Labeling 작업을 줄일 뿐만 아니라 총 시간과 비용을 최소화할 수 있다.

사물인터넷 기기 고장 진단을 위한 그래프 신경망 모델 기반 분류 방법 (Classification Method based on Graph Neural Network Model for Diagnosing IoT Device Fault)

  • 김진영;선준호;윤성훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.9-14
    • /
    • 2022
  • 각종 기기들이 연결되는 사물인터넷(internet of things) 시스템에서 중요한 부품의 고장은 경제적, 인명의 손실을 야기할 수 있다. 시스템 내에서 발생하는 고장으로 인한 손실을 줄이기 위해 고장 검진 기술이 IoT에서 중요한 기술로써 여겨지고 있다. 본 논문에서는 그래프 신경망 기반 방법을 사용하여 시스템 내의 설비에서 취득된 진동 데이터의 특징을 추출하여 고장 여부를 판단하고 유형을 분류하는 방법을 제안한다. 딥러닝 모델의 학습을 위해, CWRU(case western reserve university)에서 취득된 고장 데이터 셋을 입력 데이터로 사용한다. 제안하는 모델의 분류 정확도 성능을 확인하기 위해 기존 제안된 합성곱 신경망(convolutional neural networks) 기반 분류 모델과 제안된 모델을 비교한다. 시뮬레이션 결과, 제안된 모델은 불균등하게 나누어진 데이터에서 기존 모델보다 분류 정확도를 약 5% 향상 시킬 수 있는 것을 확인하였다. 이후 연구로, 제안하는 모델을 경량화해서 분류 속도를 개선할 예정이다.

대학기록관 사진 아카이브를 위한 정보구조 모형 제안 (The Development of the Model of Information Structure for Photo Archives in University Archives)

  • 이혜원;한승희
    • 한국기록관리학회지
    • /
    • 제23권1호
    • /
    • pp.101-126
    • /
    • 2023
  • 대학의 사진기록은 대학의 정체성을 확립하고 역사적 증거를 제공하는 매우 가치 있는 기록의 유형 중 하나이나, 텍스트와 달리 의미전달의 취약성을 갖고 있으므로 사진기록의 정보가 포괄적으로 기술되지 않으면 이용자의 검색과 활용이 어렵다. 본 연구에서는 대학기록관 사진 아카이브를 위해 사진기록의 분류체계를 구조화하고, 분류 내의 카테고리 특성을 반영한 메타데이터 셋 개발을 시도하였다. 이를 위해 국내와 미국 대학기록관의 사진기록 분류체계와 메타데이터 요소를 분석하고, 정보구조 모형을 제안하였다. 본 연구에서 제안한 정보구조 모형을 통해 대학기록관 사진기록의 데이터 품질을 향상시킬 수 있으며, 이용자에게는 사진기록에 대한 풍부한 디스커버리를 지원할 수 있다.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

무게중심을 활용한 모션 생성 기술 (Motion generation using Center of Mass)

  • 박근태;손채준;이윤상
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권2호
    • /
    • pp.11-19
    • /
    • 2020
  • 캐릭터의 자세가 변할 때 마다 캐릭터의 무게 중심(COM) 위치도 변하게 된다. 이 때 무게 중심의 위치 변화는 걷기, 뛰기, 쭈그려 앉기 등 다양한 동작 각각에 대응되는 독자적인 패턴을 가지므로 이를 이용하면 원래 동작의 정보를 알아낼 수 있다. 본 논문에서는 캐릭터의 무게 중심의 위치 변화를 토대로 동작을 예측하는 모션 생성 기법을 제안한다. 이 방법을 이용하면 무게 중심 정보를 통해 원래 동작의 유형에 대한 별도의 라벨 없이도 다양한 동작을 생성할 수 있다. 그러므로 네트워크의 학습 및 실행을 위한 데이터셋을 만들 때 사람의 손을 거칠 필요 없이 전처리를 비롯한 모든 과정을 자동으로 진행할 수 있다. 본 논문에서 제안하는 신경망 모델은 캐릭터의 모션 이력(history) 정보와 무게 중심 정보들을 입력 받아 현재 프레임에서의 포즈 정보를 출력하며, 연속적인 시계열 모션 데이터를 다루기 위해 1차원 Convolution을 수행하는 간단한 형태의 Convolutional Neural Network(CNN)를 사용하여 학습되었다.

제조업에서의 성공적인 기술투자 전략에 대한 연구: 퍼지셋 질적비교분석 (Successful Technology Investment Strategy in Manufacturing Industry: Fuzzy-set Qualitative Comparative Analysis (fsQCA) Approach)

  • 구윤모;함주연;이재남
    • 경영정보학연구
    • /
    • 제19권4호
    • /
    • pp.1-25
    • /
    • 2017
  • 재무적 성과 측면의 높은 불확실성에도 불구하고, 기업들은 기술에 대한 투자를 지속적으로 확대하고 있다. 이는 기업들이 단기적 운영효율성의 증대는 물론 지속적 경쟁우위를 창출하고 유지하는 데 있어 기술투자를 중요하게 인식하고 있기 때문이다. 주목할 점은 개별 기업의 기술투자 전략과 그에 따른 세부적인 양상 혹은 패턴이 동일 산업 내에서도 상이한 모습을 보이고 있으며, 이러한 차이점이 궁극적인 기업성과의 차이로 이어지고 있다는 것이다. 본 연구는 이러한 기술투자를 전통적인 R&D 투자와 IT 투자로 구분하고, 두 가지 유형의 기술투자가 조합되어 만들어 내는 일종의 기술투자 패턴이 기업규모 및 공급사슬 상에서의 위치에 따라 기업성과에 어떤 영향을 미치고 있는 지에 대해 살펴보았다. 이를 위해 국내 562개 제조기업을 대상으로 수집된 데이터를 퍼지셋 질적비교분석(fsQCA: fuzzy-set Qualitative Comparative Analysis)을 통해 살펴보았다. 분석 결과, 상대적으로 기업규모가 큰 기업의 경우 세부적인 기술투자 패턴이 기업성과에 미치는 영향의 정도가 낮은 것으로 나타난 반면, 규모가 작은 기업의 경우 그 영향의 정도가 큰 것으로 나타났으며, 공급사슬 상에서의 위치에 따른 영향 역시 큰 것으로 나타났다. 이는, 기업규모가 작은 기업일수록 높은 기업성과를 얻기 위해서는 주어진 경영환경에 따라 보다 적합한 형태의 기술투자 전략이 요구된다는 것을 의미한다.

데이터 증강 기반 효율적인 무선 신호 분류 연구 (An Efficient Wireless Signal Classification Based on Data Augmentation)

  • 임상순
    • Journal of Platform Technology
    • /
    • 제10권4호
    • /
    • pp.47-55
    • /
    • 2022
  • 사물인터넷 환경에서는 다양한 무선 통신 기술을 사용하는 기기들이 점점 증가하고 있다. 특히, 다양한 무선 신호 변조 유형을 정확하게 식별하기 위해 효율적인 특성 추출 기법을 설계하고 무선 신호의 종류를 분류하는 것이 필수적이다. 하지만, 실제 환경에서 레이블이 지정된 무선 신호 데이터를 수집하는 것은 쉬운 문제가 아니다. 최근 무선 신호 분류를 위해 딥러닝 기반의 다양한 학습 기법들이 제안되어졌다. 딥러닝의 경우 훈련 데이터셋이 적을 경우 과대적합에 빠질 가능성이 높으며, 이는 딥러닝 모델을 활용한 무선 신호 분류 기법의 성능 저하를 유발한다. 본 연구에서는 다양한 무선 신호들이 존재할 때 분류 성능을 높이기 위해 생성적 적대 신경망 기반 데이터 증대 기법을 제안한다. 분류해야 하는 무선 신호의 종류가 다양할 때 특정 무선 신호를 나타내는 데이터의 양이 적거나 균형이 맞지 않는 경우 제안한 기법을 활용하여 필요한 무선 신호와 관련된 데이터의 양을 증가시킨다. 제안한 데이터 증강 알고리즘의 유효성을 검증하기 위해 무선 신호의 데이터양을 증가시키고 균형을 맞춘 결과를 바탕으로 CNN 및 LSTM 기반 무선 신호 분류기를 구현하여 실험해본 결과 데이터 균형을 맞추지 않았을 때보다 분류 정확도가 높아지는 것을 확인하였다.

교과서 메타데이터 요소 설계에 관한 연구 (A Study on the Design of Metadata Elements in Textbooks)

  • 오의경
    • 문화기술의 융합
    • /
    • 제9권4호
    • /
    • pp.401-408
    • /
    • 2023
  • 이 연구의 목적은 교과서 데이터베이스 구축을 위한 기초 작업으로서 교과서 메타데이터를 설계하는 것이다. 이를 위하여 독본류를 교과서의 범주로 정의하였고, 선행연구를 통하여 메타데이터 개발 방법론을 수립하였다. 국립중앙도서관 등 교과서를 수집, 축적, 서비스하는 기관의 목록 기술요소를 조사하여 서지적으로 필수적인 요소들이 누락되지 않도록 하였으며, Dublin Core, MODS, KEM의 요소들을 매핑하여 교과서를 기술하는데 적합한 요소들을 도출하였다. 마지막으로 발행유형, 장르, 교육과정기 요소를 추가하여 최종적으로 3개의 범주-서지, 맥락, 교과서 특성에서 14개의 요소로 구성된 교과서 메타데이터 요소 셋을 제시하였다. 14개의 요소는 표제사항, 저자사항, 발행사항, 형태사항, 식별기호, 언어, 소장처, 주제명, 해제, 장르, 목차, 이용대상자, 교육과정기, 교과정보이다. 우리는 이 연구에서국가지식자원으로 교과서 자원을 축적할 수 있는 조직화 방안을 논의하여 이 분야에 기여하였으며, 향후 연구에서 우리는 실제 교과서를 대상으로 메타데이터 요소를 적용하여 사용성을 평가하고 평가결과에 따라 수정 보완할 것을 제안하였다.

Faster R-CNN과 이미지 오그멘테이션 기법을 이용한 화염감지에 관한 연구 (A Study on Flame Detection using Faster R-CNN and Image Augmentation Techniques)

  • 김재중;류진규;곽동걸;변선준
    • 전기전자학회논문지
    • /
    • 제22권4호
    • /
    • pp.1079-1087
    • /
    • 2018
  • 최근 딥러닝(deep learning) 인공지능 기반의 컴퓨터 비전 분야는 각종 영상분석 분야에서 화제로 떠오르고 있다. 본 연구에서는 딥러닝 기반의 여러 이미지 인식 알고리즘 중 이미지 내에서 객체를 검출하는 데 사용되는 Faster R-CNN 알고리즘을 이용하여 화재 이미지에서 불꽃을 검출하고자 한다. 학습 과정에서 소량의 데이터셋을 통한 화재검출 정확도 향상을 위해 이미지 오그멘테이션(image augmentation) 기법을 이용하고, 이미지 오그멘테이션을 6가지 유형별로 나누어 학습하여 정확도, 정밀도, 검출률을 비교하였다. 그 결과, 이미지 오그멘테이션의 종류가 늘어날수록 검출률이 상승하지만, 다른 객체 검출 모델들의 일반적인 정확도와 검출률의 관계와 마찬가지로 오검출율 또한 10%에서 최대 30%까지 증가하게 됨을 확인하였다.

사용자 맞춤형 서버리스 안드로이드 악성코드 분석을 위한 전이학습 기반 적응형 탐지 기법 (Customized Serverless Android Malware Analysis Using Transfer Learning-Based Adaptive Detection Techniques)

  • 심현석;정수환
    • 정보보호학회논문지
    • /
    • 제31권3호
    • /
    • pp.433-441
    • /
    • 2021
  • 안드로이드 어플리케이션은 생산성과 게임 등의 다양한 카테고리에 걸쳐 출시되며, 사용자는 개인의 사용 패턴에 따라 다양한 어플리케이션 및 악성코드에 노출된다. 반면 대부분의 분석 엔진은 기존에 존재하는 데이터셋을 활용하며, 주기적인 업데이트가 이루어진다고 해도 사용자의 선호도를 반영하지 않는다. 따라서 알려진 악성코드에 대한 탐지율은 높은 반면, 애드웨어와 같은 유형의 악성코드는 탐지가 어렵다. 또한 기존의 엔진은 서버를 거쳐야 하므로, 추가적인 비용이 발생하며, 사용자는 가용성과 실시간성을 보장받지 못하는 문제가 발생한다. 이러한 문제를 해결하기 위해 논문에서는 서버와 단 한번만의 통신이 요구되는 on-device 악성코드 분석과 전이학습을 통한 모델 재훈련을 수행하는 분석 시스템을 제안한다. 또한 해당 시스템은 디바이스 내부에서 디컴파일을 포함한 전체 프로세스가 이루어지므로, 서버 시스템에서의 부하를 분산할 수 있다. 이러한 분석 시스템을 구현하여 테스트한 결과, 전이 학습이전 기준 최대 90.3%의 정확도를 얻었으며, Adware 카테고리에 대하여 전이학습을 수행한 뒤 최대 95.1% 의 정확도로, 기존 대비 4.8% 높은 정확도를 얻을 수 있었다.