• 제목/요약/키워드: AI dataset

검색결과 243건 처리시간 0.031초

Concept Drift에 의한 ML 모델 성능 변화의 정량적 추정 방법 (Quantitative Estimation Method for ML Model Performance Change, Due to Concept Drift)

  • 안순홍;이훈석;김승훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권6호
    • /
    • pp.259-266
    • /
    • 2023
  • 기계학습을 통해 학습된 모델은 업무 활용 시 그 성능을 실측하기 매우 어렵다. 때문에 운영 부서에서는 모델의 성능을 효과적으로 관리하지 못한다. 이로 인해 모델의 상태를 판단하기 위한 Concept drift 탐지 방법이 다양하게 연구되고 있다. 운영 부서에서는 운영 중인 모델의 성능을 정량적으로 관리하려고 한다. 그러나 Concept drift는 모델 상태를 데이터 관계적으로 판단 할 뿐, 모델의 정량적 성능 수치를 추정하지는 못한다. 본 연구에서는 Concept drift의 통계량을 통해 정량적으로 precision 값을 추정하는 성능 예측 모델(PPM, Performance prediction model)을 제안한다. 제안 모델의 Algorithm 1에서는, 학습데이터에서 복원 추출한 샘플링 데이터에 인위적인 drift를 유도하고 이때의 precision을 측정하여 drift와 precision의 데이터 셋을 만들어 학습한다. Algorithm 2에서는 테스트 데이터를 통해 실제 precision과 예측 precision의 차이를 측정하여 성능 예측 모델의 오차를 보정 한다. 현실 비즈니스에서 사용될 수 있는 대출 심사 모델과 신용카드 오사용 탐지 모델에 PPM을 적용하여 성능 예측의 유효성을 확인했다.

넙치 질병 증상 분류를 위한 객체 탐지 딥러닝 모델 성능 평가 (Performance Evaluation of Object Detection Deep Learning Model for Paralichthys olivaceus Disease Symptoms Classification)

  • 조경원;백란;정종호;김찬진;최한석;정석원;손현승
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.71-84
    • /
    • 2023
  • 넙치 양식은 우리나라 양식 산업의 절반 이상 차지할 정도로 큰 비중을 차지한다. 그러나 연중 총사육량의 25~30% 정도가 질병으로 인한 집단 폐사가 발생하여 양식장의 경제성에 매우 나쁜 영향을 준다. 넙치 양식장의 경제성 성장을 위해서는 넙치 질병 증상 진단을 자동화하여 빠르고 정확하게 질병 진단을 하는 방법이 필요하다. 본 연구에서는 독창적인 학습 데이터 수집 방법과 학습 정제 알고리즘 및 학습 데이터 분리 기법을 사용하여 학습 데이터를 구축하고 4가지 객체 탐지 딥러닝 모델(YOLOv8, Swin, Vitdet, MvitV2)의 넙치 질병증상 감지 성능을 비교한다. 실험 결과 YOLOv8 모델이 평균 인식률(mAP)과 예상 도착 시간(ETA) 관점에서 우수하다는 결론을 얻었다. 본 연구에서 제안하는 AI 모델의 성능이 검증되면 넙치 양식장에서는 실시간으로 넙치 질병을 진단할 수 있고, 진단 결과에 따른 신속한 예방 조치로 양식장의 생산성은 크게 향상될 것이라 기대된다.

챗지피티 4.0을 활용한 사용자 경험 계층 기반 사용자 경험 평가에 관한 기초적 연구 (A Basic Study on User Experience Evaluation Based on User Experience Hierarchy Using ChatGPT 4.0)

  • 한수민;박재완
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.493-498
    • /
    • 2024
  • 최근 생성형 인공지능 기술이 급속도로 발전함에 따라, 이를 실무에 활용하는 방법에 대한 관심이 높아지고 있다. 또한 사용자 요구에 부합하는 결과물을 생성하기 위한 프롬프트 엔지니어링의 중요성이 새롭게 조명되고 있다. 이러한 생성형 인공지능의 새로운 활용 가능성을 탐구하는 것은 중요한 가치를 지닐 수 있다. 본 연구는 대표적인 생성형 인공지능인 챗지피티 4.0을 활용하여 온라인 고객 리뷰 데이터 분석을 통한 효과적인 사용자 경험 평가 방법을 제안하는 것을 목적으로 한다. 사용자 경험 평가 방법은 사용자 경험 계층의 6단계 요소인 '기능성', '신뢰성', '사용성', '편의성', '감성', '의미성'을 기반으로 수행되었다. 본 연구를 위해 프롬프트 엔지니어링의 이해도를 높이고 사용자경험 계층의 명확한 개념을 파악하는 문헌연구를 수행하고, 이를 기반으로 프롬프트를 작성 및 수집된 온라인 고객 리뷰 데이터 분석을 통한 사용자 경험 평가 방법을 위한 실험이 수행되었다. 본 연구에서 우리는 사용자 경험 요소에 대한 정확한 정의 및 분류 과정에 대한 설명 입력 시, 챗지피티는 사용자 경험 평가에 대한 우수한 성능을 나타냈으나, 시간적 제약으로 다량의 데이터 분석에 한계를 나타냈음을 밝힌다. 우리는 사용자 경험 평가에 챗지피티 4.0을 활용하는 방법을 소개하고 제안함으로써 UX 분야의 발전에 공헌할 수 있는 것으로 기대한다.

YOLO 네트워크를 활용한 전이학습 기반 객체 탐지 알고리즘 (Transfer Learning-based Object Detection Algorithm Using YOLO Network)

  • 이동구;선영규;김수현;심이삭;이계산;송명남;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.219-223
    • /
    • 2020
  • 딥 러닝 기반 객체 탐지 및 영상처리 분야에서 모델의 인식률과 정확도를 보장하기 위해 다량의 데이터 확보는 필수적이다. 본 논문에서는 학습데이터가 적은 경우에도 인공지능 모델의 높은 성능을 도출하기 위해 전이학습 기반 객체탐지 알고리즘을 제안한다. 본 논문에서는 객체탐지를 위해 사전 학습된 Resnet-50 네트워크와 YOLO(You Only Look Once) 네트워크를 결합한 전이학습 네트워크를 구성하였다. 구성된 전이학습 네트워크는 Leeds Sports Pose 데이터셋의 일부를 활용하여 이미지에서 가장 넓은 영역을 차지하고 있는 사람을 탐지하는 네트워크로 학습을 진행하였다. 실험결과는 탐지율 84%, 탐지 정확도 97%를 기록하였다.

BERT를 이용한 한국어 특허상담 기계독해 (Korean Machine Reading Comprehension for Patent Consultation Using BERT)

  • 민재옥;박진우;조유정;이봉건
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.145-152
    • /
    • 2020
  • 기계독해는(Machine reading comprehension) 사용자 질의와 관련된 문서를 기계가 이해한 후 정답을 추론하는 인공지능 자연어처리 태스크를 말하며, 이러한 기계독해는 챗봇과 같은 자동상담 서비스에 활용될 수 있다. 최근 자연어처리 분야에서 가장 높은 성능을 보이고 있는 BERT 언어모델은 대용량의 데이터를 pre-training 한 후에 각 자연어처리 태스크에 대해 fine-tuning하여 학습된 모델로 추론함으로써 문제를 해결하는 방식이다. 본 논문에서는 BERT기반 특허상담 기계독해 태스크를 위해 특허상담 데이터 셋을 구축하고 그 구축 방법을 소개하며, patent 코퍼스를 pre-training한 Patent-BERT 모델과 특허상담 모델학습에 적합한 언어처리 알고리즘을 추가함으로써 특허상담 기계독해 태스크의 성능을 향상시킬 수 있는 방안을 제안한다. 본 논문에서 제안한 방법을 사용하여 특허상담 질의에 대한 정답 결정에서 성능이 향상됨을 보였다.

다양한 합성곱 신경망 방식을 이용한 모바일 기기를 위한 시작 단어 검출의 성능 비교 (Performance comparison of wake-up-word detection on mobile devices using various convolutional neural networks)

  • 김상홍;이보원
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.454-460
    • /
    • 2020
  • 음성인식 기능을 제공하는 인공지능 비서들은 정확도가 뛰어난 클라우드 기반의 음성인식을 통해 동작한다. 클라우드 기반의 음성인식에서 시작 단어 인식은 대기 중인 기기를 활성화하는 데 중요한 역할을 한다. 본 논문에서는 공개 데이터셋인 구글의 Speech Commands 데이터셋을 사용하여 스펙트로그램 및 멜-주파수 캡스트럼 계수 특징을 입력으로 하여 모바일 기기에 대응한 저 연산 시작 단어 검출을 위한 합성곱 신경망의 성능을 비교한다. 본 논문에서 사용한 합성곱 신경망은 다층 퍼셉트론, 일반적인 합성곱 신경망, VGG16, VGG19, ResNet50, ResNet101, ResNet152, MobileNet이며, MobileNet의 성능을 유지하면서 모델 크기를 1/25로 줄인 네트워크도 제안한다.

OP Code 특징 기반의 텍스트와 이미지 데이터셋 연구를 통한 인공지능 백신 개발 (Development of Vaccine with Artificial Intelligence: By Analyzing OP Code Features Based on Text and Image Dataset)

  • 최효경;이세은;이주현;홍래영;최원혁;김형종
    • 정보보호학회논문지
    • /
    • 제29권5호
    • /
    • pp.1019-1026
    • /
    • 2019
  • 지속적으로 새롭게 등장하는 악성 파일(malware)탐지의 어려움으로 인해 머신러닝 기반 인공지능 백신 개발의 중요성이 크게 대두되고 있다. 하지만 현존하는 인공지능 백신은 파일의 일부 영역만을 검사하기 때문에 탐지율이 떨어진다는 단점이 존재한다. 이에 본 논문에서는 독자적인 로직을 기반으로 개발한 인공지능 백신에 근거하여, 파일 내 전체 데이터를 검사하는 방법을 제안한다. 그 중 정상 파일과 비교했을 때 악성 파일에만 존재하는 unique한 함수에서 추출한 OP Code 특징을 학습 데이터셋으로 한 진단법 강화 방안을 제시한다. 해당 강화법의 성능을 Random Forest 알고리즘을 기반으로 한 CSV 데이터셋 학습과 Inception V3 모델을 기반으로 한 이미지 데이터셋 학습으로 나누어 테스트해본 결과, 약 80%의 탐지율을 도출하는 것을 확인할 수 있었다.

새로운 Boosted 3-D PCA 기반 Head Pose Estimation 방법 (A New Head Pose Estimation Method based on Boosted 3-D PCA)

  • 이경민;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.105-109
    • /
    • 2021
  • 본 논문에서는 Boosted 3-D PCA 방법을 데이터 세트로 평가하고 성능을 평가한다. 그런 다음 네트워크의 특징과 성능을 분석하겠습니다. 본 논문에서는 Boosted 3-D PCA 학습방법을 사용하여 300W-LP 데이터 학습을 수행했으며 AFLW2000 데이터 세트를 사용하여 평가를 평가했다. 결과는 이 성능 결과는 기존 랜드마크 대 포즈 방법보다 자유롭게 얼굴 이미지의 데이터 세트를 사용하여 학습할 수 있으므로 실제 상황에서 포즈를 정확하게 예측할 수 있다. 키포인트 세트의 최적화는 독립적이지 않기 때문에, 우리는 계산 시간을 줄일 방법을 확인했다. 이 방법은 Boosted 3-D PCA 성능을 향상시키거나 다양한 애플리케이션 도메인에 적용하는 데 매우 중요한 자원이 될 것으로 예상한다

재난안전관리 과학기술 네트워크: 전문가 수요조사를 중심으로 (Science and Technology Networks for Disaster and Safety Management: Based on Expert Survey Data)

  • 허정은;양창훈
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.123-134
    • /
    • 2018
  • 최근 국가적 재난사고의 발생으로 인해 재난안전문제의 근원적 해결을 위한 과학기술의 활용과 역할에 대한 연구 관심이 증대되고 있다. 이에 재난 유형이나 재난안전 관리 단계별로 국민의 안전기본권 확보, 효과적 대응을 위한 기술개발 분야 발굴, 관련 R&D 투자의 효율적 방향 모색 등의 필요성도 크게 대두되고 있다. 본 연구에서는 네트워크 분석을 기반으로 과학기술을 통해 우선적으로 해결이 필요한 재난 유형 및 재난안전 관리 단계는 무엇인지 그리고 재난안전문제 해결을 위해서는 어떤 기술개발이 필요한지를 분석하였다. 전문가 수요조사에 대한 네트워크 분석 결과, 사회재난인 화재와 자연재난인 지진에 대한 우리사회의 불안감이 가장 큰 것으로 나타났으며, 대부분의 재난 유형에 공통적으로 요구되거나 재난 상황에 따라 응용 가능성이 높은 기술개발 분야는 인공지능과 빅데이터 분석인 것으로 조사되었다. 본 연구는 재난안전과 기술 분야 간 연결망 구조를 구축한 후 그 연계 속성이 갖는 구조적 특성을 탐색하고, 나아가 재난안전 과학기술의 역할 강화를 위한 함의를 제시하였다.

딥러닝 스타일 전이 기반의 무대 탐방 콘텐츠 생성 기법 (Generation of Stage Tour Contents with Deep Learning Style Transfer)

  • 김동민;김현식;봉대현;최종윤;정진우
    • 한국정보통신학회논문지
    • /
    • 제24권11호
    • /
    • pp.1403-1410
    • /
    • 2020
  • 최근, 비대면 경험 및 서비스에 관한 관심이 증가하면서 스마트폰이나 태블릿과 같은 모바일 기기를 이용하여 손쉽게 이용할 수 있는 웹 동영상 콘텐츠에 대한 수요가 급격히 증가하고 있다. 이와 같은 요구사항에 대응하기 위하여, 본 논문에서는 애니메이션이나 영화에 등장하는 명소를 방문하는 무대 탐방 경험을 제공할 수 있는 영상 콘텐츠를 보다 효율적으로 제작하기 위한 기법을 제안한다. 이를 위하여, Google Maps와 Google Street View API를 이용하여 무대탐방 지역에 해당하는 이미지를 수집하여 이미지 데이터셋을 구축하였다. 그 후, 딥러닝 기반의 style transfer 기술을 접목시켜 애니메이션의 독특한 화풍을 실사 이미지에 적용한 후 동영상화하기 위한 방법을 제시하였다. 마지막으로, 다양한 실험을 통해 제안하는 기법을 이용하여 보다 재미있고 흥미로운 형태의 무대탐방 영상 콘텐츠를 생성할 수 있음을 보였다.