• 제목/요약/키워드: Spatial detection system

검색결과 441건 처리시간 0.023초

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

구간통행속도 추정을 위한 고속도로 검지기자료 처리기법 개발 (Quality of Departure Time Based On-line Link Travel Time Estimates)

  • 박동주;김재진;노정현;김상범
    • 한국도로학회논문집
    • /
    • 제10권1호
    • /
    • pp.145-154
    • /
    • 2008
  • 본 연구의 목적은 출발시각기준 실시간 링크통행시간 추정정보의 질을 평가하는 것이다. 이에 본 연구는 통행시간 정보의 질을 정확성(추정오차)과 신속성(시간처짐) 측면에서 평가하였다. 그리고 통행시간 정보의 질과 링크길이 및 혼잡수준과의 관계를 규명하였다. 분석결과, 출발시각기준 실시간 링크통행시간 추정정보의 정확성과 신속성은 서로 상충관계임을 알 수 있었다. 또한 정확성을 나타내는 '추정오차' 는 계통오차(systematic error)와 혼잡수준을 반영하는 평균자승오차(MSEE)로 구성되는 것으로 분석되었다 시간처짐은 '최소시간처짐', '혼잡에 의한 시간처짐', '갱신간격에 의한 시간처짐'으로 구분하여 평가하였다. 이를 실제 AVI자료에 적용한 결과, 링크길이와 혼잡수준에 관계없이 추정오차가 5%일 때, 시간처짐은 약 10분 정도 발생하는 것으로 나타났다.

  • PDF

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

정확도를 향상시킨 BGA 솔더볼 외관검사 기법 개발 (Development of an Accuracy-improved Vision Inspection System for BGA Solder Ball)

  • 허경무
    • 전자공학회논문지SC
    • /
    • 제47권6호
    • /
    • pp.80-85
    • /
    • 2010
  • 현재 BGA 409 chip의 외관검사는 대부분 현미경을 이용한 육안검사로 이루어지고 있다. 그러나 인간의 시력에 의존하여 검사하는 현재의 외관검사 방법은 검사자의 육체적, 정신적 부분에 의하여 검사 결과가 변화하기 때문에 안정적인 결과를 기대하기 어렵다. 따라서 육안검사 시 발생하는 문제점을 개선하기 위해 BGA 솔더볼 외관검사의 비전 시스템이 개발 되었고, 이는 기존의 검사 방법에 비해 BGA 409 chip의 솔더볼의 외관검사의 신뢰성과 효율성을 증가시켰다. 하지만 BGA 솔더볼의 크기가 미세하고 그 특징의 구분이 힘들어 검사의 정확도가 떨어지고 오리엔테이션 오류가 발생하였다. 이에 본 논문에서는 BGA 솔더볼 외관검사의 정확도를 향상시키기 위해 에지 검출 알고리즘의 보완과 특징들만을 비교하는 패턴매칭 기법을 제안하였으며, 또한 특징 공간 설정의 기준이 되는 기준 영역의 개선을 통해 오리엔테이션 오류의 개선을 제안하였다. 즉, 본 논문에서는 기존의 비전 시스템의 정확도와 오리엔테이션 오류를 개선하는 방법을 제안함으로써 BGA 솔더볼 외관검사의 정확도를 향상시켜 결과적으로 BGA 솔더볼 외관검사의 에러율을 줄이고 검사 속도의 향상 등 기존의 외관검사 방법에 비해 향상된 검사 결과를 획득하였다.

영상압축에 강인한 변질검증 워터마킹에 관한 연구 (A Study on Semi-fragile Watermarking for Robust Authentication on Image Compression)

  • 안성철;이경학;박화범;고형화
    • 한국통신학회논문지
    • /
    • 제31권12C호
    • /
    • pp.1165-1172
    • /
    • 2006
  • 소프트웨어의 발전으로 인해 디지털 컨텐츠에 대한 복사, 변경이 손쉽게 일반인들에 의해서도 가능하게 되어 컨텐츠의 제작자는 소유권 수장이나 내용의 변질에 대한 인증과 검증을 필요로 하게 되었다. 변질검증(Fragile) 워터마킹 기법은 워터마크가 삽입된 영상의 변질 및 훼손 여부를 판별할 수 있지만, 고의적이지 않은 표준화된 영상압축 등에서도 워터마크가 사라지는 문제점이 있다. 본 논문에서 JPEG 압축과 같은 영상처리에서는 강인하지만 변질에는 약한 Semi-Fragile 워터마킹 방법을 제안하였다. 제안한 방법은 블록간의 상관관계를 이용하여 워터마크를 생성하고, DCT(Discrete Cosine Transform)수행 후에 계수 값들의 양자화를 이용하여 HVS(Human Visual System)에 둔감한 부분의 계수 값에 삽입하는 방법을 제안하였다. 실험결과 공간영역 상에서 미세한 변화에도 변질여부의 검출 정도가 뛰어났으며, 변질된 부분을 블록별로 검출할 수 있어 공간상의 어떤 위치의 픽셀들이 변화하였는지를 시각적으로 확인할 수 있었다.

근거리 수치사진측량시스템을 위한 저가격 자료획득방법의 개발 (Development of Low-Cost Data Acquisition Method for Close-range Digital Photogrammetric System)

  • 박홍기
    • 대한공간정보학회지
    • /
    • 제7권2호
    • /
    • pp.143-153
    • /
    • 1999
  • 지형공간정보체계는 사용이 용이하여 널리 대중화되어가고 있다. 최근 수치사진측량은 GIS데이터베이스를 구축하거나 갱신하기 위한 경제적인 방법으로 인정받아 가고 있다. 지형공간정보의 획득을 위한 근거리사진측량은 좌표해석을 위해 이용되고 있는 번들조정이 요구된다 번들조정은 외부표정요소를 결정하기 위해서 초기 근사 값과 기준점들을 필요로 한다. 본 연구에서는 번들조정을 수행하기 전에 초기근사값을 추정하기 위한 종래의 방법들을 비교분석하고, 이들 외부표정요소의 결정을 위한 새로운 알고리즘을 개발하여 비용을 절감할 수 있는 방안을 제시하고자 하였다. 우선 효과적이고 경제적이며 보다 정확한 사진측량 관측값처리 기법을 제공하고자, 기존의 DLT 알고리즘에 관측값에서의 모든 종류의 과대오차들을 자동적으로 검출하고 제거하기 위한 robust 방법과 해를 위해 필요한 기준점의 수를 줄이기 위해 GPS를 도입하였다. 또한 본 논문에서는 단사진으로 처리하는 새로운 후방교회법(space resection)유도하였다. 제안한 방법의 주된 장점은 외부표정요소의 초기근사값을 요구하지 않고 계산과정에서 반복계산을 요구하지 않는다는 점이다.

  • PDF

도시지역 LiDAR DSM으로부터 DEM추출기법 연구 (DEM Extraction from LiDAR DSM of Urban Area)

  • 최연웅;조기성
    • 대한공간정보학회지
    • /
    • 제13권1호
    • /
    • pp.19-25
    • /
    • 2005
  • 최근에는 LiDAR시스템의 등장으로 기존의 항공사진측량에 비하여 효율적이고, 경제적으로 도시지역의 수치표고자료를 효과적으로 구축할 수 있게 되었으나, 도시지역에서는 다양한 형태의 객체들이 모두 포함된 DSM(Digital Surface Model) 형식의 자료를 취득하게 된다. 따라서, 홍수범람예측에 있어서의 인공지물의 영향 해석 등을 위하여 건물이 제거된 지형에 관한 상세한 정보를 제공하기 위해서는 DSM으로부터 DEM(Digital Elevation Model)을 추출하기 위한 전처리 과정이 필요하다. 된 연구는 LiDAR 시스템으로부터 취득된 도시지역에 대한 DSM으로부터 건물 등이 제거된 DEM을 추출하기 위한 연구로서 영상처리기법의 경계검출 알고리즘을 적용하여 건물 등의 건물들에 대한 경계를 추출하였으며, 선행연구에서 건물로 추출된 지역에 대하여 보간법을 적용함으로써 발생하는 원시 DSM 자료의 변형에 따른 대안으로써, 추출된 경계에 대여 평균값 필터 링, 중간값 필터링, 최소값 필터링을 각각 적용함으로써 원시 DSM자료의 변형을 최소화하여 건물 등의 지물들을 제거하였으며, LiDAR DSM으로부터 DEM을 제작하는 과정을 간략화, 자동화하였다.

  • PDF

Discriminant analysis of grain flours for rice paper using fluorescence hyperspectral imaging system and chemometric methods

  • Seo, Youngwook;Lee, Ahyeong;Kim, Bal-Geum;Lim, Jongguk
    • 농업과학연구
    • /
    • 제47권3호
    • /
    • pp.633-644
    • /
    • 2020
  • Rice paper is an element of Vietnamese cuisine that can be used to wrap vegetables and meat. Rice and starch are the main ingredients of rice paper and their mixing ratio is important for quality control. In a commercial factory, assessment of food safety and quantitative supply is a challenging issue. A rapid and non-destructive monitoring system is therefore necessary in commercial production systems to ensure the food safety of rice and starch flour for the rice paper wrap. In this study, fluorescence hyperspectral imaging technology was applied to classify grain flours. Using the 3D hyper cube of fluorescence hyperspectral imaging (fHSI, 420 - 730 nm), spectral and spatial data and chemometric methods were applied to detect and classify flours. Eight flours (rice: 4, starch: 4) were prepared and hyperspectral images were acquired in a 5 (L) × 5 (W) × 1.5 (H) cm container. Linear discriminant analysis (LDA), partial least square discriminant analysis (PLSDA), support vector machine (SVM), classification and regression tree (CART), and random forest (RF) with a few preprocessing methods (multivariate scatter correction [MSC], 1st and 2nd derivative and moving average) were applied to classify grain flours and the accuracy was compared using a confusion matrix (accuracy and kappa coefficient). LDA with moving average showed the highest accuracy at A = 0.9362 (K = 0.9270). 1D convolutional neural network (CNN) demonstrated a classification result of A = 0.94 and showed improved classification results between mimyeon flour (MF)1 and MF2 of 0.72 and 0.87, respectively. In this study, the potential of non-destructive detection and classification of grain flours using fHSI technology and machine learning methods was demonstrated.

지리정보체계를 이용한 안산시의 오픈스페이스 분석 (An Analysis of Urban Open Space with Geographic Information Systems - A Case Study of Ansan City, Korea -)

  • 서동조;박종화
    • 대한원격탐사학회지
    • /
    • 제6권2호
    • /
    • pp.89-113
    • /
    • 1990
  • The purpose of this study is to develop means to apply GIS and remote sensing technology to the analysis of Korean urban open spaces. To achieve this objective, a framework of analysis of urban open spaces was developed, and then the framework was applied for the evaluation of the potential and suitability of open spaces of Ansan City, which is a new town developed to accomodate industries relocation from Seoul, Korea, mainly due to their pollution problems. The software used in this study are IDRISI, a grid-based GIS, and KMIPS, a remote sensing analysis system. Both packages are based on IBM PC/AT computers with Microsoft DOS. Landsat MSS and TM data were used for the land use classification, land use change detection, and analysis of transformed vegetation indices. The size of the geographic data base is 110 rows and 150 columns with the spatial resolution of 100m$\times$100m. The framework of analysis includes both quanititative and qualitative analysis of open spaces. The quantitative analysis includes size and distribution of open spaces, urban develpment of open spaces, and the degree of vegree of vegetation removal of the study area. The qualitative analysis includes evaluative criteria for primary productivity of land, park use potential, major visual resources, and urban environmental control. The findings of this study can be summarized as follows. First, the size of builtup areas increased 18.73km$^2$, while the size of forest land decreased 10.86km$^2$ during last ten years. Agricultural lands maintained its size, but shifted toward outside of the city into forest. Second, the potential of open spaces for park use is limited mainly due to their lack of accessibility and connectivity among open spaces, in spite of ample acreage and good site conditions. Third, major landscape elements and historic sites should be connected to the open space system of the city by new accesses and buffers.

항공사진을 이용한 산사태 탐지 및 인공신경망을 이용한 산사태 취약성 분석 (Landslide Detection and Landslide Susceptibility Mapping using Aerial Photos and Artificial Neural Networks)

  • 오현주
    • 대한원격탐사학회지
    • /
    • 제26권1호
    • /
    • pp.47-57
    • /
    • 2010
  • 본 연구의 목적은 2006년 태풍 에위니아, 빌리스, 개미와 집중호우로 인해 많은 산사태가 발생한 진부면 지역을 대상으로 항공사진을 이용한 산사태 탐지 및 인공신경망과 GIS를 이용한 산사태 취약성을 분석하는데 있다. 산사태 위치는 산사태 발생 전후의 항공사진을 판독 후 현장에서 확인하였다. 취약성 분석을 위해 지형, 지질, 토양, 임상, 선구조, 토지이용도 등의 자료는 공간 데이터베이스로 구축하였다. 산사태와 관련 요인들간의 상대적 가중치는 인공신경망의 역전파 알고리즘을 이용하여 결정하였다. 그 결과 경사방향과 경사는 다른 요인들 보다 1.2~1.5배 높게 나타났다. 이 가중치를 이용하여 취약성도를 작성 후 분석에 사용하지 않은 산사태 위치와 비교하여 검증하였다. 그 결과 예측 정확도는 81.44%로 나타났다.