• 제목/요약/키워드: COCO

검색결과 98건 처리시간 0.025초

계층 간 특징 복원-예측 네트워크를 통한 피라미드 특징 압축 (Pyramid Feature Compression with Inter-Level Feature Restoration-Prediction Network)

  • 김민섭;심동규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.283-294
    • /
    • 2022
  • 딥 러닝 네트워크에서 사용되는 특징 맵은 일반적으로 영상보다 데이터가 크며 특징 맵을 전송하기 위해서는 영상의 압축률보다 더 높은 압축률이 요구된다. 본 논문은 딥러닝 기반의 영상처리에서 객체의 크기에 대한 강인성을 가지는 FPN 구조의 네트워크에서 사용되는 피라미드 특징 맵을 높은 압축률로 전송하기 위해 제안한 복원-예측 네트워크를 통해 전송된 일부 계층의 피라미드 특징 맵으로 전송하지 않은 계층의 피라미드 특징 맵을 예측하며, 압축으로 인한 손상을 복원하는 구조를 제안한다. 제안한 방법의 COCO 데이터셋 2017 Train images에 대한 객체 탐지의 성능은 rate-precision 그래프에서 VTM12.0을 통해 특징 맵을 압축한 결과 대비 BD-rate 31.25%의 성능향상을 보였고, PCA와 DeepCABAC을 통한 압축을 수행한 방법 대비 BD-rate 57.79%의 성능향상을 보였다.

딥러닝 기반 임의적 스케일 초해상도 모듈을 이용한 Mask-RCNN 성능 향상 (Improvement of Mask-RCNN Performance Using Deep-Learning-Based Arbitrary-Scale Super-Resolution Module)

  • 안영필;박현준
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.381-388
    • /
    • 2022
  • 인스턴스 분할에서 Mask-RCNN은 베이스 모델로 자주 사용된다. Mask-RCNN의 성능을 높이는 것은 파생된 모델에 영향을 미치기에 의미가 있다. Mask-RCNN에는 입력 이미지 크기를 배치 크기로 통일시키는 변환 모듈(transform module)이 있다. 이 논문에서는 Mask-RCNN의 성능 향상을 위해 변환 모듈의 크기 조정 부분에 딥러닝 기반 ASSR(Arbitrary-Scale Super-Resolution)을 적용하고, 스케일 정보를 모델의 IM(Integration Module)을 이용하여 주입한다. 제안하는 방법을 COCO 데이터세트에 적용하였을 때 인스턴스 분할 성능이 Mask-RCNN 성능보다 2.5 AP 높았다. 그리고 제안하는 IM 위치 최적화를 위한 실험에서는 FPN(Feature Pyramid Network)과 백본(backbone)이 결합하기 전의 'Top' 위치에 배치했을 때 가장 좋은 성능을 보였다. 따라서 제안하는 방법은 Mask-RCNN을 베이스 모델로 사용하는 모델들의 성능을 향상시킬 수 있다.

Dual Attention Based Image Pyramid Network for Object Detection

  • Dong, Xiang;Li, Feng;Bai, Huihui;Zhao, Yao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권12호
    • /
    • pp.4439-4455
    • /
    • 2021
  • Compared with two-stage object detection algorithms, one-stage algorithms provide a better trade-off between real-time performance and accuracy. However, these methods treat the intermediate features equally, which lacks the flexibility to emphasize meaningful information for classification and location. Besides, they ignore the interaction of contextual information from different scales, which is important for medium and small objects detection. To tackle these problems, we propose an image pyramid network based on dual attention mechanism (DAIPNet), which builds an image pyramid to enrich the spatial information while emphasizing multi-scale informative features based on dual attention mechanisms for one-stage object detection. Our framework utilizes a pre-trained backbone as standard detection network, where the designed image pyramid network (IPN) is used as auxiliary network to provide complementary information. Here, the dual attention mechanism is composed of the adaptive feature fusion module (AFFM) and the progressive attention fusion module (PAFM). AFFM is designed to automatically pay attention to the feature maps with different importance from the backbone and auxiliary network, while PAFM is utilized to adaptively learn the channel attentive information in the context transfer process. Furthermore, in the IPN, we build an image pyramid to extract scale-wise features from downsampled images of different scales, where the features are further fused at different states to enrich scale-wise information and learn more comprehensive feature representations. Experimental results are shown on MS COCO dataset. Our proposed detector with a 300 × 300 input achieves superior performance of 32.6% mAP on the MS COCO test-dev compared with state-of-the-art methods.

Multiple Binarization Quadtree Framework for Optimizing Deep Learning-Based Smoke Synthesis Method

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.47-53
    • /
    • 2021
  • 본 논문에서는 초해상도(Super-Resolution, SR)을 계산하는데 필요한 물리 기반 시뮬레이션 데이터를 효율적으로 분류하고 분할하여 빠르게 SR연산을 가능하게 하는 쿼드트리 기반 최적화 기법을 제안한다. 제안하는 방법은 입력 데이터로 사용하는 연기 시뮬레이션 데이터를 다운스케일링(Downscaling)하여 쿼드트리 연산 소요 시간을 대폭 감소시킨다. 이 과정에서 연기의 밀도를 이진화함으로써, 다운스케일링 과정에서 밀도가 수치 손실되는 문제를 완화하며 쿼드트리를 구축한다. 학습에 사용된 데이터는 COCO 2017 데이터 셋이며, 인공신경망은 VGG19 기반 네트워크를 사용한다. 컨볼루션 계층을 거칠 때 데이터의 손실을 막기 위해 잔차(Residual) 보완 방식과 유사하게 이전 계층의 출력 값을 더해주며 학습을 진행한다. 실험결과가 연기의 경우 제안된 방법은 이전 접근법에 비해 약 15~18배 정도의 속도향상을 얻었다.

MediaPipe를 활용한 춤동작 피드백 시각화 시스템 (Visualization System for Dance Movement Feedback using MediaPipe)

  • 김현서;정재영;최봉준;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.217-224
    • /
    • 2024
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 춤을 처음 접하는 댄스 초보자들은 동영상을 보며 혼자서 춤을 출 때, 객관적인 피드백을 받기 어려워 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤 영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 연구에서는 웹캠이나 카메라로 촬영한 사용자 영상과 안무 영상 간의 춤동작 유사도를 코사인 유사도와 COCO OKS를 활용해 계산하여 사용자에게 색상 지표(Color Map)를 기반으로 한 피드백을 주는 방식을 제안한다. 본 시스템을 통해 사용자의 춤동작에 대한 객관적인 피드백을 시각적으로 받을 수 있으며 초보자들도 정확한 춤동작을 습득할 수 있을 것으로 기대한다.

A Visual and Contextual Comparative Study of the Work of Picasso and Chanel Towards an Understanding of the Overlaps Between Modern Art and Fashion

  • Forster, Samantha Vettese
    • International Journal of Costume and Fashion
    • /
    • 제12권2호
    • /
    • pp.15-32
    • /
    • 2012
  • From the beginning of the twentieth century, 'Modernism' impacted and transformed art and clothing. Pablo Picasso and Gabrielle 'Coco' Chanel were two of the most central characters in Modernism working simultaneously in their disciplines. Picasso's innovations, particularly in abstract art and Chanel's fashion designs, that dramatically departed from the previous corseted and highly decorative styles, were so significant that they have left an influence on contemporary art and fashion. This study will compare their visual works and documented evidence of their motivations, within the context of their cultural backgrounds, to reveal meaning in the occurrences of overlaps. This approach has examined the historical, cultural background of the artist and designer's environment from different perspectives, adding to previous research in this area. Through this research, outcomes of the analysis have shown similarities and divergences in the wider genres of art and fashion and the practice of the artist and fashion designer. The reference list to this text, used in the survey, gives a comprehensive overview of pertinent publications disseminating Picasso and Chanel's visual works, oral perspectives and cultural impact.

Paul Poiret와 Gabrielle Chanel의 작품세계 비교 연구 - Haute Couture에 미친 영향을 중심으로 - (A Comparative Study on Art of Paul Poiret and Gabrielle Chanel - focusing on Their Influence on Haute Couture -)

  • 이윤정
    • 복식문화연구
    • /
    • 제11권4호
    • /
    • pp.525-540
    • /
    • 2003
  • This survey paper aims to compare two significant figures in the history of Haute Couture e.g, Paul Poiret and Coco Chanel, who played a leading role between 1910 and 1930. It is found here that they have common features with respect to giving freedom to body through costume, enlarging Garconne Mode, creating more value of Costume Jewelry, exploiting advertisement strategy using models, proving exotic styles, and last but not the least contributing to Haute Couture. The research shows, however, that Poiret differs from Chanel in that he made most of various natural colors whereas Chanel used black or beige colors that had been rarely used woman wear previously. They also differed in using fabric, permitting copy by others, ingredients and bottling of perfume, meaning of silhouette. This kind of comparative research is expected to provide more understanding of fashion history and to contribute to more rigorous analysis of key success factors of designers in his or her age of fashion.

  • PDF

호주산 갈탄의 미생물에 의한 가용화 연구: 전처리 방법이 가용화에 미치는 영향 (Biosolubilization of Australian lignite: effect of pretreatment method on biosolubilization)

  • 신현재;양지원
    • KSBB Journal
    • /
    • 제7권1호
    • /
    • pp.73-78
    • /
    • 1992
  • 곰팡이의 일종인Poria cocos, Trichodermareesei, Candide tropicalis, Aspergillus niger를 이용하여 호주산 갈탄의 액화를 연구하였다. 갈탄을 전처리하는 방법을 달리하여 전처리가 갈탄의 액화에 미치는 영향에 관하여 알아보았으며, 질산과 과산화수소가 호주산 갈탄을 액화하는데 우수한 전처리제라는 사실을 확인하였다. 사용한 여러 균주 가운데 Poria cocos가 가장 뛰어난 액화능을 나타내었으며, 석탄 액화 물질의 구조를 Infrared, Nuclear magnetic resonance, Ultraviolet 분광법을 사용하여 예측하였다.

  • PDF

U-Net 구조를 이용한 이미지에서의 보행자 분할 (Pedestrian Segmentation Using U-Net)

  • 김승택;이효종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.519-521
    • /
    • 2019
  • 자율주행 자동차에서의 보행자 인식 및 사람의 행동 인식과 같은 분야 등에 대한 연구들이 활발하게 진행되고 그에 기반을 둔 기술들이 많이 개발되고 있다. 그리고 대부분의 연구에서는 사람에 대한 경계 박스를 검출한다. 영상에서 사람의 유무 혹은 위치를 판단하는 문제에서는 경계 박스만을 검출하는 것이 효율적일 수 있으나 경계 박스는 행동 인식과 같은 분야에 사용하기에는 많은 정보의 손실이 발생할 수 있다. 본 논문에서는 U-NET 구조의 딥러닝 모델을 사용해 경계 박스로 인한 정보 손실을 줄일 수 있는 보행자 분할 방법을 제안한다. 모델의 학습을 위해 2017 COCO 데이터셋의 사람 카테고리를 사용하였으며 Penn-Fudan 보행자 데이터셋을 이용하여 제안 방법을 테스트하였으며 기존의 방법들과 비교하여 의미 있는 결과를 얻었다.

딥러닝 기반의 회전에 강인한 텍스트 검출 기법 (Rotation-robust text localization technique using deep learning)

  • 최인규;김제우;송혁;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.80-81
    • /
    • 2019
  • 본 논문에서는 자연스러운 장면 영상에서 임의의 방향성을 가진 텍스트를 검출하기 위한 기법을 제안한다. 텍스트 검출을 위한 기본적인 프레임 워크는 Faster R-CNN[1]을 기반으로 한다. 먼저 RPN(Region Proposal Network)을 통해 다른 방향성을 가진 텍스트를 포함하는 bounding box를 생성한다. 이어서 RPN에서 생성한 각각의 bounding box에 대해 세 가지의 서로 다른 크기로 pooling된 특징지도를 추출하고 병합한다. 병합한 특징지도에서 텍스트와 텍스트가 아닌 대상에 대한 score, 정렬된 bounding box 좌표, 기울어진 bounding box 좌표를 모두 예측한다. 마지막으로 NMS(Non-Maximum Suppression)을 이용하여 검출 결과를 획득한다. COCO Text 2017 dataset[2]을 이용하여 학습 및 테스트를 진행하였으며 주관적으로 평가한 결과 기울어진 텍스트에 적합하게 회전된 영역을 얻을 수 있음을 확인하였다.

  • PDF