• 제목/요약/키워드: vision artificial intelligence

검색결과 172건 처리시간 0.024초

드론영상과 인공지능 기반 교통량 추정을 위한 데이터 구축 가이드라인 도출 연구 (Guidelines for Data Construction when Estimating Traffic Volume based on Artificial Intelligence using Drone Images)

  • 한동권;김두표;김성보
    • 한국측량학회지
    • /
    • 제40권3호
    • /
    • pp.147-157
    • /
    • 2022
  • 최근 CCTV (Closed Circuit TeleVision)나 드론영상을 활용하여 인공지능 기반 예측 모델을 통해 차량을 분류하는 객체인식이나 교통량 분석을 하는 많은 연구들이 수행되고 있다. 정확한 교통량 추정을 위한 객체인식 딥러닝 모델을 개발하기 위해서는 체계적인 데이터 구축이 요구되는데 이와 관련된 표준화된 가이드라인은 미흡한 실정이다. 본 연구에서는 드론영상을 활용한 인공지능 기반 교통량 추정 학습데이터 구축 가이드라인 도출을 위하여 선행연구를 분석하고 사업보고서나 기존 인공지능 학습용 데이터 구축 및 품질관리 가이드라인을 참고하였다. 데이터 구축 가이드라인은 크게 데이터 획득, 가공, 검증으로 분류되며, 항목 별 유의사항 및 평가지표 가이드라인을 제시하였다. 본 연구의 결과물인 데이터 구축 가이드라인은 드론 영상 인공지능 기반 도로교통량 추정 분석을 하는데 강건하고 일반화된 인공지능 모델 개발에 도움을 제공하고자 한다.

이미지 기반 인공지능을 활용한 현장 적용성 연구 (Application of artificial intelligence-based technologies to the construction sites)

  • 나승욱;허석재;노영숙
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 봄 학술논문 발표대회
    • /
    • pp.225-226
    • /
    • 2022
  • The construction industry, which has a labour-intensive and conservative nature, is exclusive to adopt new technologies. However, the construction industry is viably introducing the 4th Industrial Revolution technologies represented by artificial intelligence, Internet of Things, robotics and unmanned transportation to promote change into a smart industry. An image-based artificial intelligence technology is a field of computer vision technology that refers to machines mimicking human visual recognition of objects from pictures or videos. The purpose of this article is to explore image-based artificial intelligence technologies which would be able to apply to the construction sites. In this study, we show two examples which is one for a construction waste classification model and another for cast in-situ anchor bolts defection detection model. Image-based intelligence technologies would be used for various measurement, classification, and detection works that occur in the construction projects.

  • PDF

Digital Modelling of Visual Perception in Architectural Environment

  • Seo, Dong-Yeon;Lee, Kyung-Hoi
    • KIEAE Journal
    • /
    • 제3권2호
    • /
    • pp.59-66
    • /
    • 2003
  • To be the design method supporting aesthetic ability of human, CAAD system should essentially recognize architectural form in the same way of human. In this study, visual perception process of human was analyzed to search proper computational method performing similar step of perception of it. Through the analysis of visual perception, vision was separated to low-level vision and high-level vision. Edge detection and neural network were selected to model after low-level vision and high-level vision. The 24 images of building, tree and landscape were processed by edge detection and trained by neural network. And 24 new images were used to test trained network. The test shows that trained network gives right perception result toward each images with low error rate. This study is on the meaning of artificial intelligence in design process rather than on the design automation strategy through artificial intelligence.

Crowd Activity Recognition using Optical Flow Orientation Distribution

  • Kim, Jinpyung;Jang, Gyujin;Kim, Gyujin;Kim, Moon-Hyun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권8호
    • /
    • pp.2948-2963
    • /
    • 2015
  • In the field of computer vision, visual surveillance systems have recently become an important research topic. Growth in this area is being driven by both the increase in the availability of inexpensive computing devices and image sensors as well as the general inefficiency of manual surveillance and monitoring. In particular, the ultimate goal for many visual surveillance systems is to provide automatic activity recognition for events at a given site. A higher level of understanding of these activities requires certain lower-level computer vision tasks to be performed. So in this paper, we propose an intelligent activity recognition model that uses a structure learning method and a classification method. The structure learning method is provided as a K2-learning algorithm that generates Bayesian networks of causal relationships between sensors for a given activity. The statistical characteristics of the sensor values and the topological characteristics of the generated graphs are learned for each activity, and then a neural network is designed to classify the current activity according to the features extracted from the multiple sensor values that have been collected. Finally, the proposed method is implemented and tested by using PETS2013 benchmark data.

인공지능 로봇에 적용할 수 있는 공간지각에 대한 종설 (A review of space perception applicable to artificial intelligence robots)

  • 이영림
    • 디지털융복합연구
    • /
    • 제17권10호
    • /
    • pp.233-242
    • /
    • 2019
  • 수많은 공간지각 연구 결과, Euclidean 3-D 구조는 양안 입체시, 움직임, 입체시와 움직임의 결합, 또는 여러 광학 정보의 결합으로도 복구될 수 없다는 사실이 밝혀졌다. 그러나 인간은 이러한 부정확한 공간지각에도 불구하고 특정 과제를 수행하는 데는 어려움이 전혀 없다. 우리는 인공지능과 컴퓨터 비전에 인간의 기술과 능력을 적용해 왔지만 이러한 기계들은 여전히 인간의 능력보다 훨씬 뒤떨어져 있다. 따라서 우리는 인간이 공간의 깊이를 어떻게 지각하는지, 과제를 수행하기 위해 어떠한 정보들을 사용하여 3차원 공간을 정확하게 지각하는지 이해해야 한다. 이 논문의 목적은 미래에 더욱 발전된 인공지능 로봇에 인간의 능력을 적용하기 위해 공간지각 문헌을 검토하는 것이다.

트랜스포머 기반 판별 특징 학습 비전을 통한 얼굴 조작 감지 (Facial Manipulation Detection with Transformer-based Discriminative Features Learning Vision)

  • ;김민수;최필주;이석환;;권기룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.540-542
    • /
    • 2023
  • Due to the serious issues posed by facial manipulation technologies, many researchers are becoming increasingly interested in the identification of face forgeries. The majority of existing face forgery detection methods leverage powerful data adaptation ability of neural network to derive distinguishing traits. These deep learning-based detection methods frequently treat the detection of fake faces as a binary classification problem and employ softmax loss to track CNN network training. However, acquired traits observed by softmax loss are insufficient for discriminating. To get over these limitations, in this study, we introduce a novel discriminative feature learning based on Vision Transformer architecture. Additionally, a separation-center loss is created to simply compress intra-class variation of original faces while enhancing inter-class differences in the embedding space.

특허데이터 기반 한국의 인공지능 경쟁력 분석 : 특허지표 및 토픽모델링을 중심으로 (Analysis of Korea's Artificial Intelligence Competitiveness Based on Patent Data: Focusing on Patent Index and Topic Modeling)

  • 이현상;차오신;신선영;김규리;오세환
    • 정보화정책
    • /
    • 제29권4호
    • /
    • pp.43-66
    • /
    • 2022
  • 인공지능 기술의 발전과 더불어 세계 각국의 인공지능 기술 특허를 둘러싼 경쟁도 치열해지고 있다. 2000년~2021년간 미국 특허청의 인공지능 기술 특허출원은 꾸준히 증가하고 있는 가운데 2010년대 들어 보다 가파른 성장세를 기록하고 있다. 특허지표를 통해 한국의 인공지능 기술경쟁력을 분석한 결과, 청각지능, 시각지능 등의 세부 분야에서 특허활동성, 영향력, 시장성 등이 우위에 있는 것으로 평가된다. 그러나, 주요국과 비교하여 한국의 인공지능 기술 특허는 양적 활동성, 시장성 확보 측면에서는 상대적으로 우수하나 기술 파급력은 다소 열위에 있는 것으로 나타난다. 최근 인공지능 기술 토픽으로 노이즈 캔슬링, 음성인식 등은 감소한 반면 모델학습 최적화, 스마트센서, 자율주행 등이 활성화되면서 성장이 기대되고 있다. 한국의 경우 사기탐지/보안, 의료 비전러닝 등의 분야에서 특허출원 성과가 다소 부족하여 분발이 요구된다.

Prompt Tuning for Facial Action Unit Detection in the Wild

  • ;;김애라;김수형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.732-734
    • /
    • 2023
  • Facial Action Units Detection (FAUs) problem focuses on identifying various detail units expressing on the human face, as defined by the Facial Action Coding System, which constitutes a fine-grained classification problem. This is a challenging task in computer vision. In this study, we propose a Prompt Tuning approach to address this problem, involving a 2-step training process. Our method demonstrates its effectiveness on the Affective in the Wild dataset, surpassing other existing methods in terms of both accuracy and efficiency.

DiLO: Direct light detection and ranging odometry based on spherical range images for autonomous driving

  • Han, Seung-Jun;Kang, Jungyu;Min, Kyoung-Wook;Choi, Jungdan
    • ETRI Journal
    • /
    • 제43권4호
    • /
    • pp.603-616
    • /
    • 2021
  • Over the last few years, autonomous vehicles have progressed very rapidly. The odometry technique that estimates displacement from consecutive sensor inputs is an essential technique for autonomous driving. In this article, we propose a fast, robust, and accurate odometry technique. The proposed technique is light detection and ranging (LiDAR)-based direct odometry, which uses a spherical range image (SRI) that projects a three-dimensional point cloud onto a two-dimensional spherical image plane. Direct odometry is developed in a vision-based method, and a fast execution speed can be expected. However, applying LiDAR data is difficult because of the sparsity. To solve this problem, we propose an SRI generation method and mathematical analysis, two key point sampling methods using SRI to increase precision and robustness, and a fast optimization method. The proposed technique was tested with the KITTI dataset and real environments. Evaluation results yielded a translation error of 0.69%, a rotation error of 0.0031°/m in the KITTI training dataset, and an execution time of 17 ms. The results demonstrated high precision comparable with state-of-the-art and remarkably higher speed than conventional techniques.

인공지능에 활용되는 공학수학 합성곱(convolution) 교수·학습자료 연구 (A Study on Teaching of Convolution in Engineering Mathematics and Artificial Intelligence)

  • 이상구;남윤;이재화;김응기
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권2호
    • /
    • pp.277-297
    • /
    • 2023
  • 합성곱(convolution)은 인공지능(artificial intelligence)에서 컴퓨터 비전(computer vision), 심층학습(deep learning) 등의 분야를 이해하고 응용하려면 알아야 하는 중요한 수학적 연산이다. 그러나 현재의 공학수학 교과과정의 합성곱 내용은 독립적인 주제가 아니라 단편적으로 다루어지고 있어서 그 의미를 충분히 전달하지 못하고 있다. 이에 본 논문에서는 공학수학에서 인공지능 교육과 연계할 수 있도록 개발한 합성곱 교수·학습 자료를 제시한다. 먼저 기존 공학과 인공지능 기술의 통합적 관점에서 합성곱에 대한 배경지식과 응용 사례를 정리하고, 코딩을 이용한 교육이 가능하도록 파이썬(Python)/SageMath 코드를 개발하여 제공한다. 또한 합성곱 지식이 인공지능에서 어떻게 활용되는지 보여주는 구체적인 예시로, 이미지 분류에 사용되는 합성곱신경망(Convolutional Neural Network, CNN)을 개발된 코드와 함께 제공한다. 본 교수·학습자료는 합성곱 개념을 쉽고 효과적으로 교육할 수 있도록 공학수학의 보충 자료로 활용가능하며, 학습자는 코딩을 통해 합성곱을 배우고 본인의 전공과 관련된 인공지능 기술을 학습하는 데 이를 이용할 수 있다.