• 제목/요약/키워드: Computer vision technology

검색결과 669건 처리시간 0.032초

딥러닝을 통한 하이엔드 패션 브랜드 감성 학습 (Deep Learning for Classification of High-End Fashion Brand Sensibility)

  • 장세윤;김하연;이유리;설진석;김성재;이상구
    • 한국의류학회지
    • /
    • 제46권1호
    • /
    • pp.165-181
    • /
    • 2022
  • The fashion industry is creating innovative business models using artificial intelligence. To efficiently utilize artificial intelligence (AI), fashion data must be classified. Until now, such data have been classified focusing only on the objective properties of fashion products. Their subjective attributes, such as fashion brand sensibilities, are holistic and heuristic intuitions created by a combination of design elements. This study aims to improve the performance of collaborative filtering in the fashion industry by extracting fashion brand sensibility using computer vision technology. The image data set of fashion brand sensibility consists of high-end fashion brand photos that share sensibilities and communicate well in fashion. About 26,000 fashion photos of 11 high-end fashion brand sensibility labels have been collected from the 16FW to 21SS runway and 50 years of US Vogue magazines beginning from 1971. We use EfficientNet-B1 to establish the main architecture and fine-tune the network with ImageNet-ILSVRC. After training fashion brand sensibilities through deep learning, the proposed model achieved an F-1 score of 74% on accuracy tests. Furthermore, as a result of comparing AI machine and human experts, the proposed model is expected to be expanded to mass fashion brands.

영상인식과 사진측량 기술을 이용한 교통표지 자동측정 방법 (Automatic Measurement Method of Traffic Signs Using Image Recognition and Photogrammetry Technology)

  • 장상규;김진수
    • 대한공간정보학회지
    • /
    • 제21권3호
    • /
    • pp.19-25
    • /
    • 2013
  • 최근 도시의 도로시설물 관리에 대한 중요성이 증대됨에 따라 보다 정확한 시설물의 데이터베이스 정보가 요구되고 있다. 본 연구에서는 효율적인 도로시설물 DB 구축에 필요한 교통표지를 자동으로 검출하는 방법을 제안하였다. 검출 방법은 영상에서 특정 교통표지를 인식하여 자동으로 검출한 후 시설물의 중심위치를 찾는 순서로 진행하였다. 최종적으로 검출된 교통표지의 위치 정확도를 평가하기 위해서, 실제 측량한 좌표값과 연구를 통해 교통표지의 좌표값을 비교하였다. 교통표지 인식과 검출 과정에서는 OPEN CV를 이용한 코딩을 통해 컴퓨터 비젼 기술을 이용하였으며, 검출된 교통표지의 정확한 위치 계산은 사진측량 기술을 이용하였다. 다양한 종류의 도로표지판 중에서 원형 교통표지판(주차금지)과 삼각형 교통표지판(횡단보도)을 선택하여 진행하였다. 제안한 연구를 통해 산출된 좌표값과 실제 측량된 좌표값의 차이는 원형 교통표지판이 약 50cm, 삼각형 교통표지판이 약 60cm의 오차값으로 나타났다. 이러한 결과는 만족할 만한 결과는 아니지만 교통표지의 위치를 찾기에는 무리가 없을 것으로 판단된다.

이미지 기반 기계 학습과 BIM을 활용한 자동화된 시공 진도 관리 - 합성곱 신경망 모델(CNN)과 실내측위기술, 4D BIM을 기반으로 - (Automated Construction Progress Management Using Computer Vision-based CNN Model and BIM)

  • 노주희;박문서;이현수
    • 한국건설관리학회논문집
    • /
    • 제21권5호
    • /
    • pp.11-19
    • /
    • 2020
  • 시공 현장 일단위의 진도 관리는 프로젝트 전체의 일정 관리와 성공적인 건설 프로젝트 완료에 상당한 영향을 미친다. 그러나 현재의 현장 진도 관리는 작업 담당자에 의하여 수기로 작성되기 때문에 객관적 입장의 유지가 어렵고, 일과 후 추가업무로 작성되어 내용의 누락 등 오류가 발생하는 경우가 있다. 인적 오류로 인한 잘못된 기록 작성의 문제를 해결하기 위하여 기존 연구들은 객체 인식 기반 현황의 시각화 또는 자동 BIM 데이터 수정 기술을 개발하였다. 그러나 특정 장비의 사용 또는 고정된 위치에서 장비사용을 전제로 하는 방법적 한계로 인하여 건물 시공 현장 전체를 파악하는 데에는 제약이 있다. 이러한 한계를 극복하기 위하여 본 연구는 작업자가 휴대하는 스마트기기를 활용하여 촬영한 사진의 객체 인식 기술과 WIFI 기반의 실내 사용자의 측위 기술을 활용하여 추출된 정보를 BIM 데이터의 속성으로 반영하고 즉각적인 현황 파악과 향후 지속적 데이터 활용이 가능한 방법을 제안한다. 실제 시공 현장 관리에 적용 가능한 방법과 기술의 성능을 확인하였고, 기존 개발된 기술 대비 실용도가 높아 건설 현장 관리의 신속화와 정보 작성과 처리의 정밀화에 이바지할 것으로 기대된다.

A computer vision-based approach for behavior recognition of gestating sows fed different fiber levels during high ambient temperature

  • Kasani, Payam Hosseinzadeh;Oh, Seung Min;Choi, Yo Han;Ha, Sang Hun;Jun, Hyungmin;Park, Kyu hyun;Ko, Han Seo;Kim, Jo Eun;Choi, Jung Woo;Cho, Eun Seok;Kim, Jin Soo
    • Journal of Animal Science and Technology
    • /
    • 제63권2호
    • /
    • pp.367-379
    • /
    • 2021
  • The objectives of this study were to evaluate convolutional neural network models and computer vision techniques for the classification of swine posture with high accuracy and to use the derived result in the investigation of the effect of dietary fiber level on the behavioral characteristics of the pregnant sow under low and high ambient temperatures during the last stage of gestation. A total of 27 crossbred sows (Yorkshire × Landrace; average body weight, 192.2 ± 4.8 kg) were assigned to three treatments in a randomized complete block design during the last stage of gestation (days 90 to 114). The sows in group 1 were fed a 3% fiber diet under neutral ambient temperature; the sows in group 2 were fed a diet with 3% fiber under high ambient temperature (HT); the sows in group 3 were fed a 6% fiber diet under HT. Eight popular deep learning-based feature extraction frameworks (DenseNet121, DenseNet201, InceptionResNetV2, InceptionV3, MobileNet, VGG16, VGG19, and Xception) used for automatic swine posture classification were selected and compared using the swine posture image dataset that was constructed under real swine farm conditions. The neural network models showed excellent performance on previously unseen data (ability to generalize). The DenseNet121 feature extractor achieved the best performance with 99.83% accuracy, and both DenseNet201 and MobileNet showed an accuracy of 99.77% for the classification of the image dataset. The behavior of sows classified by the DenseNet121 feature extractor showed that the HT in our study reduced (p < 0.05) the standing behavior of sows and also has a tendency to increase (p = 0.082) lying behavior. High dietary fiber treatment tended to increase (p = 0.064) lying and decrease (p < 0.05) the standing behavior of sows, but there was no change in sitting under HT conditions.

딥러닝 기반 비디오 캡셔닝의 연구동향 분석 (Analysis of Research Trends in Deep Learning-Based Video Captioning)

  • 려치;이은주;김영수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.35-49
    • /
    • 2024
  • 컴퓨터 비전과 자연어 처리의 융합의 중요한 결과로서 비디오 캡셔닝은 인공지능 분야의 핵심 연구 방향이다. 이 기술은 비디오 콘텐츠의 자동이해와 언어 표현을 가능하게 함으로써, 컴퓨터가 비디오의 시각적 정보를 텍스트 형태로 변환한다. 본 논문에서는 딥러닝 기반 비디오 캡셔닝의 연구 동향을 초기 분석하여 CNN-RNN 기반 모델, RNN-RNN 기반 모델, Multimodal 기반 모델, 그리고 Transformer 기반 모델이라는 네 가지 주요 범주로 나누어 각각의 비디오 캡셔닝 모델의 개념과 특징 그리고 장단점을 논하였다. 그리고 이 논문은 비디오 캡셔닝 분야에서 일반적으로 자주 사용되는 데이터 집합과 성능 평가방안을 나열하였다. 데이터 세트는 다양한 도메인과 시나리오를 포괄하여 비디오 캡션 모델의 훈련 및 검증을 위한 광범위한 리소스를 제공한다. 모델 성능 평가방안에서는 주요한 평가 지표를 언급하며, 모델의 성능을 다양한 각도에서 평가할 수 있도록 연구자들에게 실질적인 참조를 제공한다. 마지막으로 비디오 캡셔닝에 대한 향후 연구과제로서 실제 응용 프로그램에서의 복잡성을 증가시키는 시간 일관성 유지 및 동적 장면의 정확한 서술과 같이 지속해서 개선해야 할 주요 도전과제와 시간 관계 모델링 및 다중 모달 데이터 통합과 같이 새롭게 연구되어야 하는 과제를 제시하였다.

사용자와의 거리에 따라 다른 형태의 정보를 제공하는 디지털 거울 연구 - 사용자 니즈 분석을 중심으로 - (A Study on a Digital Mirror System Offering Different Information by Distance)

  • 박지은;이문헌;함원식;소연정;최혜주;정지홍;한민수
    • 한국HCI학회논문지
    • /
    • 제1권2호
    • /
    • pp.43-50
    • /
    • 2006
  • 거울은 인간이 자신의 모습을 들여다보기 위해 오랜 세월 동안 이용했던 친숙한 도구이다. 디지털 기술의 발달로 우리는 빛과 정보를 함께 반사해 주는 거울에 대한 여러 가지 접근들을 보아 왔다. 전통적인 거울은 빛의 즉각적인 반사에 의해 일어나는 자동적인 시각적 피드백 덕분에 특별한 조작이 필요하지 않으나, 빛과 정보가 함께 반사되는 디지털 거울에서는 다른 형태의, 좀 더 적극적인 사용자 인터랙션을 기대할 수 있다. 본 논문에서는 사용자와 거울간의 거리에 따른 행태 조사결과를 바탕으로 인터랙션 유형을 분류 정리하였다. 이를 바탕으로 사용자와 거울간의 거리에 따라 다른 서비스를 제공하는 디지털 거울에 적합한 사용자 인터페이스를 제안하였고, 초기 모델로 적외선 격자를 이용한 조작, 비전 기반의 정면 이미지 획득 및 얼굴 확인, 그리고 적외선 위치 확인을 통해 사용자와 인터랙션 하는 거울을 설계하였다. 아울러 결과물의 초기모델에 대한 분석을 통해 더 개선된 형태의 '거울을 응용한 시스템'의 설계 가능성 및 사용자 중심적 프로세스를 적용한 개발 사례를 제시한다.

  • PDF

시각 장애인을 위한 영상 기반 심층 합성곱 신경망을 이용한 화재 감지기 (Fire Detection using Deep Convolutional Neural Networks for Assisting People with Visual Impairments in an Emergency Situation)

  • 보라시 콩;원인수;권장우
    • 재활복지
    • /
    • 제21권3호
    • /
    • pp.129-146
    • /
    • 2017
  • 본 연구는 실내에서 화재 발생시 시각 장애인들을 지원하기 위한 영상 기반의 화재감지기를 제안한다. 건물 내에 화재가 발생하는 비상 상황 발생시 시각 장애인은 일반인보다 상황을 인지하는 것이 늦기 때문에 위험한 상황에 노출되기 쉽다. 기존의 연기 감지기와 같은 현재의 화재 감지 방법은 화재 발생시 발생하는 화학 센서 기반 기술을 사용함으로써 감지가 상대적으로 늦으며 화재가 확산된 후에 감지가 되는 등 낮은 신뢰성이 문제가 될 수 있다. 이를 보완하기 위해 영상 기반의 화재 감지 기술이 개발되었지만 낮은 정확도가 문제가 되어 실용화되지 못하였다. 최근 인공 지능을 위한 심층 학습 분야의 큰 발전으로 영상 내의 물체 인식률이 높아짐에 따라 관련 연구가 활발히 진행되고 있다. 따라서 본 연구에서는 보안 카메라 영상을 사용하여 화재를 감지할 수 있는 심층 학습 기반의 화재 감지기를 제안한다. 심층 학습 기반의 접근법은 영상에서 자동으로 특징을 학습할 수 있으므로 일반적으로 복잡한 상황에 대해서도 일반화가 가능하다. 본 논문에서는 화재감지 정확도와 속도 측면의 균형을 고려하여 두 개의 심층 합성곱 신경망 모델을 제안하였다. 실험을 통해 두 모델 모두 99%의 평균 정밀도로 화재를 감지할 수 있으며 첫 번째 모델은 초당 30장의 처리 속도와 76%의 정확도를 나타냈다. 두번째 모델은 초당 50장의 처리 속도와 61%의 정확도를 나타낸다. 또한 두 개의 모델의 메모리 사용량을 서로 비교하였으며 다양한 실제 화재 시나리오에서 테스트하여 신뢰할 수 있는 모델임을 증명하였다. 본 논문에 제안한 영상 기반 화재 감지기가 상용화된다면 상대적으로 실내 화재에 취약한 시각 장애인들의 안전에 도움이 될 것이다.

이미지 인식 기술의 산업 적용 동향 연구 (A Study on the Industrial Application of Image Recognition Technology)

  • 송재민;이새봄;박아름
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.86-96
    • /
    • 2020
  • 본 연구는 이미지 인식기술 서비스의 산업 적용 사례를 기반으로 인공지능이 이미지 인식기술에 어떠한 역할을 하고 있는지 살펴보았다. 이미지 인식 기술을 사용하여 위성사진을 인공지능으로 분석해 특정 국가의 원유 저장탱크의 산출 내역을 밝혀내거나, 사용자가 촬영하거나 다운로드한 이미지와 유사한 이미지나 제품을 검색해주기도 하며, 과일의 산출량을 정렬한다거나 식물의 질병을 탐지해 낼 수도 있다. 딥러닝과 신경망 알고리즘을 기반으로 사람의 나이, 성별, 기분까지도 인식할 수 있어 이미지 인식 기술이 다양한 산업에서 적용되고 있음을 확인하였다. 본 연구에서는 국내 및 해외의 이미지 인식 기술의 활용 사례를 살펴보는 것 뿐 아니라, 어떠한 형태로 산업에 적용되고 있는지 확인을 할 수 있다. 또한, 본 연구를 통하여 여러 산업에서 이미지 인식기술을 구현하고 적용하여 발전시킨 여러 성공 사례들을 중심으로 향후 연구의 방향성을 제시했으며, 향후 국내 이미지 인식 기술이 나아가야 할 방향을 고찰해 볼 수 있다.

Distance Measurement Using a Single Camera with a Rotating Mirror

  • Kim Hyongsuk;Lin Chun-Shin;Song Jaehong;Chae Heesung
    • International Journal of Control, Automation, and Systems
    • /
    • 제3권4호
    • /
    • pp.542-551
    • /
    • 2005
  • A new distance measurement method with the use of a single camera and a rotating mirror is presented. A camera in front of a rotating mirror acquires a sequence of reflected images, from which distance information is extracted. The distance measurement is based on the idea that the corresponding pixel of an object point at a longer distance moves at a higher speed in a sequence of images in this type of system setting. Distance measurement based on such pixel movement is investigated. Like many other image-based techniques, this presented technique requires matching corresponding points in two images. To alleviate such difficulty, two kinds of techniques of image tracking through the sequence of images and the utilization of multiple sets of image frames are described. Precision improvement is possible and is one attractive merit. The presented approach with a rotating mirror is especially suitable for such multiple measurements. The imprecision caused by the physical limit could be improved through making several measurements and taking an average. In this paper, mathematics necessary for implementing the technique is derived and presented. Also, the error sensitivities of related parameters are analyzed. Experimental results using the real camera-mirror setup are reported.

Extracting the axis of potential axial symmetry employing variance minimization

  • Kim, Hyoung-Seop;Ishikawa, Seiji
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1996년도 Proceedings of the Korea Automatic Control Conference, 11th (KACC); Pohang, Korea; 24-26 Oct. 1996
    • /
    • pp.434-437
    • /
    • 1996
  • Symmetry is one of the important structural properties of shapes both in perceptual psychology and in computer vision. Recently, a number of automatic symmetry finding algorithms have been reported. Among them, the algorithm based on the use of principal axes of objects is the most general and practical. It is, however, of no use when shapes concerned have some asymmetry. Asymmetric shapes which make us associate with certain kinds of symmetry are practically important and they are called shapes with potential symmetry in this paper. The algorithm we have already proposed can cope with those shapes having potential axial symmetry. The algorithm employs a reflected image of the original and a certain evaluation function. In the former paper, areal minimization was employed for the evaluation function and it yielded satisfactory experimental results. However, it could not cope with those shapes which have larger asymmetry. In this paper, we propose the employment of variance as an alternative evaluation index with respect to the difference image between the reflected and the original shape. The technique is examined its performance by real video images as well as synthetic data. Experimental results are shown and discussion is given.

  • PDF