• 제목/요약/키워드: Benchmark dataset

검색결과 103건 처리시간 0.032초

단변량 시계열 모형들의 단순 결합의 예측 성능 (Performance for simple combinations of univariate forecasting models)

  • 이선홍;성병찬
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.385-393
    • /
    • 2022
  • 본 논문에서는 시계열 예측 분야에서 잘 알려져 있는 단변량 시계열 모형들을 이용하여, 그들의 단순 조합이 어떤 예측력을 보여주는지 연구한다. 고려된 단변량 시계열 모형으로는, 지수평활 및 ARIMA(autoregressive integrated moving average) 모형들과 그들의 확장된 형태인 모형들 그리고 예측의 벤치마크 모형으로 자주 사용되는 비계절 및 계절 랜덤워크 모형이다. 단순 조합의 방법은 중앙값과 평균을 이용하였으며, 검증을 위하여 사용된 데이터셋은 3,003개의 시계열 자료로 구성된 M3-competition 자료이다. 예측 성능을 sMAPE(symmetric mean absolute percentage error)와 MASE(mean absolute scaled error)로 평가한 결과, 단변량 시계열 모형들의 단순 조합이 아주 우수한 예측력을 가지고 있음을 확인하였다.

얼굴 정보를 이용한 대형 카메라 네트워크에서의 사람 추적 시스템 (Human Tracking System in Large Camera Networks using Face Information)

  • 이영건
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1816-1825
    • /
    • 2022
  • 본 논문에서는 다양한 해상도의 카메라를 사용하는 감시 카메라 네트워크에서 각 사람을 추적하는 새로운 접근 방식을 제안한다. 다수의 비겹침 카메라 상에서 사람 추적 시 기존에 사용되던 사람 특징 정보는 다양한 카메라 시야 조건에 쉽게 영향을 받는다. 이러한 한계를 극복하기 위해 제안하는 시스템은 외모 정보와 함께 얼굴 정보를 활용한다. 일반적으로 감시 카메라로 촬영하는 사람 영상은 해상도가 낮은 경우가 많기 때문에 추적을 용이하게 하기 위해 저해상도 얼굴에서도 유용한 특징을 추출할 수 있어야 한다. 제안하는 추적 방식에서 사람 얼굴 특징을 추출하기 위해 탐지된 얼굴을 정면화한 후 텍스쳐 기반의 특징을 추출한다. 또한 감시 카메라에 포착된 얼굴의 크기가 매우 작은 경우 얼굴을 확대하는 초해상도 기법도 함께 활용한다. 공개된 데이터셋인 Dana36을 이용하여 수행한 실험결과를 통해 제안된 알고리즘의 우수한 성능을 보여준다.

Online resources for information on shoulder arthroplasty: an assessment of quality and readability

  • Mohamad Y. Fares;Jaspal Singh;Amar S. Vadhera;Jonathan Koa;Peter Boufadel;Joseph A. Abboud
    • Clinics in Shoulder and Elbow
    • /
    • 제26권3호
    • /
    • pp.238-244
    • /
    • 2023
  • Background: Many patients use online resources to educate themselves on surgical procedures and make well-informed healthcare decisions. The aim of our study was to evaluate the quality and readability of online resources exploring shoulder arthroplasty. Methods: An internet search pertaining to shoulder arthroplasty (partial, anatomic, and reverse) was conducted using the three most popular online search engines. The top 25 results generated from each term in each search engine were included. Webpages were excluded if they were duplicates, advertised by search engines, subpages of other pages, required payments or subscription, or were irrelevant to our scope. Webpages were classified into different source categories. Quality of information was assessed by HONcode certification, Journal of the American Medical Association (JAMA) criteria, and DISCERN benchmark criteria. Webpage readability was assessed using the Flesch reading ease score (FRES). Results: Our final dataset included 125 web pages. Academic sources were the most common with 45 web pages (36.0%) followed by physician/private practice with 39 web pages (31.2%). The mean JAMA and DISCERN scores for all web pages were 1.96±1.31 and 51.4±10.7, respectively. The total mean FRES score was 44.0±11.0. Only nine web pages (7.2%) were HONcode certified. Websites specified for healthcare professionals had the highest JAMA and DISCERN scores with means of 2.92±0.90 and 57.96±8.91, respectively (P<0.001). HONcode-certified webpages had higher quality and readability scores than other web pages. Conclusions: Web-based patient resources for shoulder arthroplasty information did not show high-quality scores and easy readability. When presenting medical information, sources should maintain a balance between readability and quality and should seek HONcode certification as it helps establish the reliability and accessibility of the presented information. Level of evidence: IV.

OECD TG데이터를 이용한 그래프 기반 딥러닝 모델 분자 특성 예측 (Toxicity prediction of chemicals using OECD test guideline data with graph-based deep learning models)

  • 황대환;임창원
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.355-380
    • /
    • 2024
  • 본 연구에서는 OECD test guideline 데이터를 이용하여 graph기반 딥러닝 모델들의 성능을 비교하고자 한다. OECD TG는 화학물질들이 인체와 환경에 미칠 잠재적 영향에 대해 시험하는 방법이며, 많은 실험이 동물실험을 통해 독성을 확인한다. 동물실험은 많은 시간과 비용이 들며, 윤리적 이슈가 있어 대안을 찾거나 최소화하는 방법들이 연구되고 있다. 딥러닝은 화학물질을 활용하는 다양한 분야에서 사용되고 있으며, 독성예측 분야에도 사용되고 있으며, 특히 graph 기반 모델에 대한 연구가 활발하다. 우리의 목표는 OECD TG 데이터에 대한 graph기반 딥러닝 모델들의 성능을 비교하여 가장 성능이 좋은 모델을 찾는 것이다. 우리는 OECD에서 운영하는 웹사이트 eChemportal.org에서 OECD TG를 따른 결과를 수집하였으며, 전처리 과정을 통해 학습이 불가능하거나 부적절한 화학물질은 제거하였다. 수집된 OECD TG데이터와 화학물질 특성 예측 성능의 벤치마크 데이터셋인 MoleculeNet 데이터를 활용하여 5개의 graph기반 모델들의 독성 예측 성능을 비교하였다.

강변저류지 횡월류부의 흐름 형태 변화를 고려한 HEC-RAS의 하도 내 부정류 모의 정확도 분석 (Accuracy Analysis of HEC-RAS for Unsteady Flow Simulation considering the Flow Pattern Variations over the Side-weir of Side-Weir Detention Basin)

  • 김상혁;윤병만;김동수;김서준
    • 한국수자원학회논문집
    • /
    • 제49권1호
    • /
    • pp.29-39
    • /
    • 2016
  • 강변저류지를 홍수방어대책에 포함시키기 위해서는 정확한 홍수조절효과 산정이 필요하며, 이를 위해 현재 실무에서는 1차원 부정류 수치모형인 HEC-RAS를 사용하고 있다. 그러나 강변저류지의 저류용량이 부족한 경우에 발생하는 잠긴 횡월류 흐름에 대해서는 HEC-RAS 부정류 수치모의의 정확도 분석이 수행되지 않았다. 따라서 본 연구에서는 직선수로에 강변저류지를 설치한 경우에 대하여 횡월류부의 다양한 흐름 형태를 재현할 수 있는 부정류 수리실험을 수행하였다. 또한 부정류 수리실험 결과를 이용하여 HEC-RAS 모형의 부정류 수치모의 결과의 정확도를 분석하여 하도 내 수위 오차 및 강변저류지의 홍수조절효과 산정 오차를 제시하였다. 분석 결과 횡월류부에서 잠긴 횡월류 흐름이 발생하는 경우에 대한 HEC-RAS의 수위 계산 결과는 최대 -5% 오차를 보였으며, 홍수조절효과 오차는 최대 2.4%로 나타나 HEC-RAS의 부정류 모의 결과가 비교적 정확한 것을 확인하였다.

대용량 추론을 위한 분산환경에서의 가정기반진리관리시스템 (Distributed Assumption-Based Truth Maintenance System for Scalable Reasoning)

  • 바트셀렘;박영택
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1115-1123
    • /
    • 2016
  • 가정기반진리관리 시스템(ATMS)은 추론 시스템의 추론 과정을 저장하고 비단조추론을 지원할 수 있는 도구이다. 또한 의존기반 backtracking을 지원하므로 매우 넓은 공간 탐색 문제를 해결 할 수 있는 강력한 도구이다. 모든 추론 과정을 기록하고, 특정한 컨텍스트에서 지능형시스템의 Belief를 매우 빠르게 확인하고 비단조 추론 문제에 대한 해결책을 효율적으로 제공할 수 있게 한다. 그러나 최근 데이터의 양이 방대해지면서 기존의 단일 머신을 사용하는 경우 문제 해결 프로그램의 대용량의 추론과정을 저장하는 것이 불가능하게 되었다. 대용량 데이터에 대한 문제 해결 과정을 기록하는 것은 많은 연산과 메모리 오버헤드를 야기한다. 이러한 단점을 극복하기 위해 본 논문에서는 Apache Spark 환경에서 functional 및 객체지향 방식 기반의 점진적 컨텍스트 추론을 유지할 수 있는 방법을 제안한다. 이는 가정(Assumption)과 유도과정을 분산 환경에 저장하며, 실체화된 대용량 데이터셋의 변화를 효율적으로 수정가능하게 한다. 또한 ATMS의 Label, Environment를 분산 처리하여 대규모의 추론 과정을 효과적으로 관리할 수 있는 방안을 제시하고 있다. 제안하는 시스템의 성능을 측정하기 위해 5개의 노드로 구성된 클러스터에서 LUBM 데이터셋에 대한 OWL/RDFS 추론을 수행하고, 데이터의 추가, 설명, 제거에 대한 실험을 수행하였다. LUBM2000에 대하여 추론을 수행한 결과 80GB데이터가 추론되었고, ATMS에 적용하여 추가, 설명, 제거에 대하여 수초 내에 처리하는 성능을 보였다.

인공지능기법을 이용한 온라인 P2P 대출거래의 채무불이행 예측에 관한 실증연구 (Artificial Intelligence Techniques for Predicting Online Peer-to-Peer(P2P) Loan Default)

  • 배재권;이승연;서희진
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.207-224
    • /
    • 2018
  • 온라인 P2P 대출(Online Peer-to-Peer Lending)이란 대출자(차입자)들이 인터넷 및 모바일 P2P 플랫폼을 통해 대출을 신청하면 P2P 플랫폼 기업이 이를 심사하고, 공개하여 불특정 다수가 자금을 빌려주고 이자를 받는 대출중개 서비스를 말한다. 국내외적으로 P2P 대출시장의 성장과 수익률에 대한 관심이 커진 상황에서 현재는 P2P 대출에 대한 안정성 측면에서 문제가 제기되고 있다. P2P 대출시장은 높은 수익률을 제공하지만 P2P 업체의 연체율과 부실률(채무불이행률)도 함께 높아지고 있는 실정이다. P2P 금융시장의 신뢰도를 높이기 위해서는 P2P 대출의 연체율과 채무불이행률을 줄이는 것이 무엇보다 중요하다. 본 연구는 세계적인 P2P 기업인 렌딩클럽(Lending Club)의 P2P 대출거래데이터베이스를 이용하여 인공지능기반의 P2P 채무불이행 예측모형을 구축하고자 한다. 구체적으로 벤치마크(benchmark) 모형으로 통계기법인 판별분석과 로지스틱 회귀분석을 이용하고, 인공지능기법으로는 신경망, CART, 그리고 C5.0을 이용하여 P2P 대출거래의 채무불이행 예측모형을 구축하고자 한다. 연구결과, P2P 대출거래의 채무불이행 예측을 위해 우선 고려해야 할 변수는 대출이자율이며, 중요도 3순위에 가장 많이 언급된 대출금액과 총부채상환비율도 고려해야 할 요인으로 추출되었다. 전통적인 통계기법보다는 인공지능기법의 예측성과가 더 좋은 것으로 나타났으며, 신경망의 경우 모든 데이터 셋에서 오분류율이 가장 낮은 예측모형으로 나타났다.

국소부위 패턴 표현을 위한 샘플링 기반 초해상도 U-Net (Sampling-based Super Resolution U-net for Pattern Expression of Local Areas)

  • 이교석;갈원모;임명재
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.185-191
    • /
    • 2022
  • 본 연구에서는 U-Net, 잔차 신경망, 서브 픽셀 컨볼루션을 기반으로 새로운 초해상도 신경망을 제안한다. U-Net의 최대 풀링으로 인해 세부적인 정보의 손실이 일어나는 것을 막기 위해 서브 픽셀 컨볼루션을 활용한 다운 샘플링 그리고 연결을 제안한다. 이는 필터 안의 최대 값만으로 새로운 피처맵을 만드는 최대 풀링과 다르게 필터 안의 모든 픽셀을 사용한다. 2×2 크기의 필터가 지나가면서 왼쪽 위, 오른쪽 위, 왼쪽 아래, 오른쪽 아래의 픽셀들로만 이루어진 피처맵을 만든다. 이를 통해 크기가 절반이 되고, 피처맵이 개수가 4배가 된다. 그리고 연산량을 줄이기 위해 두 가지 방법을 제안했다. 첫 번째는 U-Net의 업 컨볼루션 대신 연산량이 없고, 성능이 더 좋은 서브 픽셀 컨볼루션을 사용한다. 두 번째는 U-Net의 연결 층 대신 두 피처 맵을 더하는 층을 사용한다. 밴치 마크 데이터 세트로 실험한 결과 스케일 2의 set5 데이터를 제외하고 모든 스케일 및 벤치마크 데이터 세트에서 더 나은 PSNR 값을 보여주고, 국소부위의 패턴을 명확하게 표현할 수 있었다.

멀티-뷰 영상들을 활용하는 3차원 의미적 분할을 위한 효과적인 멀티-모달 특징 융합 (Effective Multi-Modal Feature Fusion for 3D Semantic Segmentation with Multi-View Images)

  • 배혜림;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.505-518
    • /
    • 2023
  • 3차원 포인트 클라우드 의미적 분할은 각 포인트별로 해당 포인트가 속한 물체나 영역의 분류 레이블을 예측함으로써, 포인트 클라우드를 서로 다른 물체들이나 영역들로 나누는 컴퓨터 비전 작업이다. 기존의 3차원 의미적 분할 모델들은 RGB 영상들에서 추출하는 2차원 시각적 특징과 포인트 클라우드에서 추출하는 3차원 기하학적 특징의 특성을 충분히 고려한 특징 융합을 수행하지 못한다는 한계가 있다. 따라서, 본 논문에서는 2차원-3차원 멀티-모달 특징을 이용하는 새로운 3차원 의미적 분할 모델 MMCA-Net을 제안한다. 제안 모델은 중기 융합 전략과 멀티-모달 교차 주의집중 기반의 융합 연산을 적용함으로써, 이질적인 2차원 시각적 특징과 3차원 기하학적 특징을 효과적으로 융합한다. 또한 3차원 기하학적 인코더로 PTv2를 채용함으로써, 포인트들이 비-정규적으로 분포한 입력 포인트 클라우드로부터 맥락정보가 풍부한 3차원 기하학적 특징을 추출해낸다. 본 논문에서는 제안 모델의 성능을 분석하기 위해 벤치마크 데이터 집합인 ScanNetv2을 이용한 다양한 정량 및 정성 실험들을 진행하였다. 성능 척도 mIoU 측면에서 제안 모델은 3차원 기하학적 특징만을 이용하는 PTv2 모델에 비해 9.2%의 성능 향상을, 2차원-3차원 멀티-모달 특징을 사용하는 MVPNet 모델에 비해 12.12%의 성능 향상을 보였다. 이를 통해 본 논문에서 제안한 모델의 효과와 유용성을 입증하였다.

효율적인 개방형 어휘 3차원 개체 분할을 위한 클래스-독립적인 3차원 마스크 제안과 2차원-3차원 시각적 특징 앙상블 (Class-Agnostic 3D Mask Proposal and 2D-3D Visual Feature Ensemble for Efficient Open-Vocabulary 3D Instance Segmentation)

  • 송성호;박경민;김인철
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.335-347
    • /
    • 2024
  • 개방형 어휘 3차원 포인트 클라우드 개체 분할은 3차원 장면 포인트 클라우드를 훈련단계에서 등장하였던 기본 클래스의 개체들뿐만 아니라 새로운 신규 클래스의 개체들로도 분할해야 하는 어려운 시각적 작업이다. 본 논문에서는 중요한 모델 설계 이슈별 기존 모델들의 한계점들을 극복하기 위해, 새로운 개방형 어휘 3차원 개체 분할 모델인 Open3DME를 제안한다. 첫째, 제안 모델은 클래스-독립적인 3차원 마스크의 품질을 향상시키기 위해, 새로운 트랜스포머 기반 3차원 포인트 클라우드 개체 분할 모델인 T3DIS[6]를 마스크 제안 모듈로 채용한다. 둘째, 제안 모델은 각 포인트 세그먼트별로 텍스트와 의미적으로 정렬된 시각적 특징을 얻기 위해, 사전 학습된 OpenScene 인코더와 CLIP 인코더를 적용하여 포인트 클라우드와 멀티-뷰 RGB 영상들로부터 각각 3차원 및 2차원 특징들을 추출한다. 마지막으로, 제안 모델은 개방형 어휘 레이블 할당 과정동안 각 포인트 클라우드 세그먼트별로 추출한 2차원 시각적 특징과 3차원 시각적 특징을 상호 보완적으로 함께 이용하기 위해, 특징 앙상블 기법을 적용한다. 본 논문에서는 ScanNet-V2 벤치마크 데이터 집합을 이용한 다양한 정량적, 정성적 실험들을 통해, 제안 모델의 성능 우수성을 입증한다.