• 제목/요약/키워드: 2D Dataset

검색결과 208건 처리시간 0.023초

3차원 객체 탐지를 위한 어텐션 기반 특징 융합 네트워크 (Attention based Feature-Fusion Network for 3D Object Detection)

  • 유상현;강대열;황승준;박성준;백중환
    • 한국항행학회논문지
    • /
    • 제27권2호
    • /
    • pp.190-196
    • /
    • 2023
  • 최근 들어, 라이다 기술의 발전에 따라 정확한 거리 측정이 가능해지면서 라이다 기반의 3차원 객체 탐지 네트워크에 대한 관심이 증가하고 있다. 기존의 네트워크는 복셀화 및 다운샘플링 과정에서 공간적인 정보 손실이 발생해 부정확한 위치 추정 결과를 발생시킨다. 본 연구에서는 고수준 특징과 높은 위치 정확도를 동시에 획득하기 위해 어텐션 기반 융합 방식과 카메라-라이다 융합 시스템을 제안한다. 먼저, 그리드 기반의 3차원 객체 탐지 네트워크인 Voxel-RCNN 구조에 어텐션 방식을 도입함으로써, 다중 스케일의 희소 3차원 합성곱 특징을 효과적으로 융합하여 3차원 객체 탐지의 성능을 높인다. 다음으로, 거짓 양성을 제거하기 위해 3차원 객체 탐지 네트워크의 탐지 결과와 이미지상의 2차원 객체 탐지 결과를 결합하는 카메라-라이다 융합 시스템을 제안한다. 제안 알고리즘의 성능평가를 위해 자율주행 분야의 KITTI 데이터 세트를 이용하여 기존 알고리즘과의 비교 실험을 수행한다. 결과적으로, 차량 클래스에 대해 BEV 상의 2차원 객체 탐지와 3차원 객체 탐지 부분에서 성능 향상을 보였으며 특히 Voxel-RCNN보다 차량 Moderate 클래스에 대하여 정확도가 약 0.47% 향상되었다.

SuperDepthTransfer: Depth Extraction from Image Using Instance-Based Learning with Superpixels

  • Zhu, Yuesheng;Jiang, Yifeng;Huang, Zhuandi;Luo, Guibo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권10호
    • /
    • pp.4968-4986
    • /
    • 2017
  • In this paper, we primarily address the difficulty of automatic generation of a plausible depth map from a single image in an unstructured environment. The aim is to extrapolate a depth map with a more correct, rich, and distinct depth order, which is both quantitatively accurate as well as visually pleasing. Our technique, which is fundamentally based on a preexisting DepthTransfer algorithm, transfers depth information at the level of superpixels. This occurs within a framework that replaces a pixel basis with one of instance-based learning. A vital superpixels feature enhancing matching precision is posterior incorporation of predictive semantic labels into the depth extraction procedure. Finally, a modified Cross Bilateral Filter is leveraged to augment the final depth field. For training and evaluation, experiments were conducted using the Make3D Range Image Dataset and vividly demonstrate that this depth estimation method outperforms state-of-the-art methods for the correlation coefficient metric, mean log10 error and root mean squared error, and achieves comparable performance for the average relative error metric in both efficacy and computational efficiency. This approach can be utilized to automatically convert 2D images into stereo for 3D visualization, producing anaglyph images that are visually superior in realism and simultaneously more immersive.

3D 인체 스캔 데이터를 이용한 11~15세 성장기 여성의 유방형태에 따른 유형 분류 (Classification of Breast Shape of Women Aged 11~15 Using 3D Body Scan Data)

  • 한정정;송화경;이규선
    • 한국의류산업학회지
    • /
    • 제19권6호
    • /
    • pp.786-794
    • /
    • 2017
  • The purpose of this study is to analyze and classify breast shape of women aged 11~15 using 3D body scan data. In this study, 250 women's body scans were selected from the 6th Size Korea dataset, and 30 items from each of the scan were measured using RapidForm XOR 3 program. The principal component analysis and cluster analysis were conducted using statistical program SPSS 17.0. The five principal components were identified; breast drooping and breast capacity, size from chest to under bust area, breast protrusion, breast height, and under breast angle & outer distance of breast. As the results of cluster analysis, woman's breast types were classified into four types. The breast type 1 was protrusion type (25.1%) which is considered as the breast maturity stage. The breast type 2 had the most drooped breast covering a large area (20.2%). The breast type 3 had the least prominent breast with a highest nipple point, which was considered as the early breast development stage (38.9%). The breast type 4 had the obesity of the chest and breast circumferences with the slightly prominent and the least drooped breast (15.8%). This study can provide fundamental information to develop sizing system and brassiere pattern for junior girls.

Classification of Infant Crying Audio based on 3D Feature-Vector through Audio Data Augmentation

  • JeongHyeon Park;JunHyeok Go;SiUng Kim;Nammee Moon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.47-54
    • /
    • 2023
  • 영아는 비언어적 의사 소통 방식인 울음이라는 수단을 사용한다[1]. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다[2,3]. 이에 본 논문에서는 다양한 음성 데이터 증강을 통한 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. 연구에서는 총 5개의 클래스 복통, 하품, 불편함, 배고픔, 피곤함(belly pain, burping, discomfort, hungry, tired)로 분류된 데이터 세트를 사용한다. 데이터들은 5가지 기법(Pitch, Tempo, Shift, Mixup-noise, CutMix)을 사용하여 증강한다. 증강 기법 중에서 Tempo, Shift, CutMix 기법을 적용하였을 때 성능의 향상을 보여주었다. 최종적으로 우수한 데이터 증강 기법들을 동시 적용한 결과 단일 특징 벡터와 오리지널 데이터를 사용한 모델보다 17.75%의 성능 향상을 도출하였다.

ASM기반 (2D)2 하이브리드 전처리 알고리즘을 이용한 얼굴인식 시스템 설계 (Design of ASM-based Face Recognition System Using (2D)2 Hybird Preprocessing Algorithm)

  • 김현기;진용탁;오성권
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.173-178
    • /
    • 2014
  • 본 연구에서는 ASM기반 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용한 얼굴인식 분류기와 그것의 설계방법론을 소개한다. 얼굴인식을 위한 이미지는 외부 환경에 쉽게 영향을 받기 때문에, 전처리 단계로 이러한 문제를 해결하기 위해서 ASM을 사용하였다. 특히 사람 얼굴의 특징 추출을 목적으로 널리 이용되고 있다. ASM을 이용해 얼굴영역을 추출 한 뒤 PCA와 LDA를 이용한 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용하여 차원을 축소한다. 전처리 알고리즘을 통한 얼굴데이터는 제안된 다항식 기반 방사형 기저함수 신경회로망의 입력으로 사용된다. 기존의 신경회로망과는 달리 제안된 지능형 패턴 분류기는 강인한 네트워크 특성을 가지며, 예측능력이 우수할 뿐만 아니라 다차원 입출력에 대한 문제도 해결했다. 분류기의 중요한 필수 설계 파라미터(행의 고유벡터의 수, 열의 고유벡터의 수, 클러스터의 수, 퍼지화 계수)는 ABC알고리즘에 의해 최적화 되어진다. 얼굴인식에 많이 사용되는 Yale과 AT&T를 사용하여 인식률을 평가하였다.

Model-based Clustering of DOA Data Using von Mises Mixture Model for Sound Source Localization

  • Dinh, Quang Nguyen;Lee, Chang-Hoon
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.59-66
    • /
    • 2013
  • In this paper, we propose a probabilistic framework for model-based clustering of direction of arrival (DOA) data to obtain stable sound source localization (SSL) estimates. Model-based clustering has been shown capable of handling highly overlapped and noisy datasets, such as those involved in DOA detection. Although the Gaussian mixture model is commonly used for model-based clustering, we propose use of the von Mises mixture model as more befitting circular DOA data than a Gaussian distribution. The EM framework for the von Mises mixture model in a unit hyper sphere is degenerated for the 2D case and used as such in the proposed method. We also use a histogram of the dataset to initialize the number of clusters and the initial values of parameters, thereby saving calculation time and improving the efficiency. Experiments using simulated and real-world datasets demonstrate the performance of the proposed method.

Relationships between Carcass Characteristics of Commercial Pork Breeds

  • Hwang, I.H.;Park, B.Y.;Kim, J.H.;Cho, S.H.;Kim, D.H.;Lee, J.M.;Lee, C.S.
    • 한국축산식품학회:학술대회논문집
    • /
    • 한국축산식품학회 2006년도 정기총회 및 제37차 춘계 국제학술발표대회
    • /
    • pp.196-199
    • /
    • 2006
  • The current study was conducted to identify relationship between myosin heavy chain I to objective color dimensions. Myosin heavy chain I isoform showed coefficients of determinant($r^2$) of 0.54 and 0.40 for Hunter a* and b* values. For he current dataset, Hunter a* value at day 1 had higher relationships with that at both day 7 and 14, emphasizing the importance of initial meat color which is largely affected by animal management prior to slaughter.

  • PDF

생성적 적대 신경망을 이용한 행성의 장거리 2차원 깊이 광역 위치 추정 방법 (Planetary Long-Range Deep 2D Global Localization Using Generative Adversarial Network)

  • 아하메드 엠.나기브;투안 아인 뉴엔;나임 울 이슬람;김재웅;이석한
    • 로봇학회논문지
    • /
    • 제13권1호
    • /
    • pp.26-30
    • /
    • 2018
  • Planetary global localization is necessary for long-range rover missions in which communication with command center operator is throttled due to the long distance. There has been number of researches that address this problem by exploiting and matching rover surroundings with global digital elevation maps (DEM). Using conventional methods for matching, however, is challenging due to artifacts in both DEM rendered images, and/or rover 2D images caused by DEM low resolution, rover image illumination variations and small terrain features. In this work, we use train CNN discriminator to match rover 2D image with DEM rendered images using conditional Generative Adversarial Network architecture (cGAN). We then use this discriminator to search an uncertainty bound given by visual odometry (VO) error bound to estimate rover optimal location and orientation. We demonstrate our network capability to learn to translate rover image into DEM simulated image and match them using Devon Island dataset. The experimental results show that our proposed approach achieves ~74% mean average precision.

시뮬레이션 기반 3차원 엮임 재료의 물성치 분석 및 인공 신경망 해석 (Simulation-Based Material Property Analysis of 3D Woven Materials Using Artificial Neural Network)

  • 김병모;하승현
    • 한국전산구조공학회논문집
    • /
    • 제36권4호
    • /
    • pp.259-264
    • /
    • 2023
  • 본 논문에서는 3차원 엮임 재료의 재료 물성치들을 효율적으로 분석하고 추후 최적설계 연구에 활용하기 위해서 파라메트릭 배치 해석 워크플로우를 제시하였다. 3차원 엮임 재료를 구성하는 와이어들 사이의 간격을 설계 매개변수로 하는 파라메트릭 모델에 대해서 임의의 변수 조합을 가지는 2,500개의 수치 모델을 생성하였으며, 상용 프로그램인 매트랩과 앤시스의 여러 모듈을 사용하여 체적탄성계수, 열전도도, 유체투과율과 같은 다양한 재료 물성치들을 배치 해석을 통해서 자동으로 얻어질 수 있도록 구성하였다. 이와 같이 얻어진 대용량의 재료 물성치 데이터베이스를 활용해서 회귀 분석을 수행하였으며, 그 결과 설계 변수들과 재료 물성치 사이의 경향성과 수치 해석 결과의 정확도를 검증하였다. 또한 확보된 데이터베이스를 통해서 3차원 엮임 재료의 물성치를 예측할 수 있는 인공 신경망을 구성하고 학습시켰으며, 그 결과 임의의 설계 매개변수 값들을 가지는 엮임 재료 모델에 대해서 구조 및 유체해석 과정 없이도 높은 정확도로 재료 물성치들을 추정할 수 있음을 확인하였다.

비선형 보간법을 이용한 수중 이미지 소나의 3 차원 해저지형 실시간 생성기법 (Real-time Data Enhancement of 3D Underwater Terrain Map Using Nonlinear Interpolation on Image Sonar)

  • 이인규;김재선;노세환;신기철;이재준;유선철
    • 센서학회지
    • /
    • 제32권2호
    • /
    • pp.110-117
    • /
    • 2023
  • Reconstructing underwater geometry in real time with forward-looking sonar is critical for applications such as localization, mapping, and path planning. Geometrical data must be repeatedly calculated and overwritten in real time because the reliability of the acoustic data is affected by various factors. Moreover, scattering of signal data during the coordinate conversion process may lead to geometrical errors, which lowers the accuracy of the information obtained by the sensor system. In this study, we propose a three-step data processing method with low computational cost for real-time operation. First, the number of data points to be interpolated is determined with respect to the distance between each point and the size of the data grid in a Cartesian coordinate system. Then, the data are processed with a nonlinear interpolation so that they exhibit linear properties in the coordinate system. Finally, the data are transformed based on variations in the position and orientation of the sonar over time. The results of an evaluation of our proposed approach in a simulation show that the nonlinear interpolation operation constructed a continuous underwater geometry dataset with low geometrical error.