• 제목/요약/키워드: image analysis algorithm

검색결과 1,480건 처리시간 0.023초

행렬기반의 정합 알고리듬에 의한 음악 기호의 인식 (A Matrix-Based Graph Matching Algorithm with Application to a Musical Symbol Recognition)

  • 허경용;장경식;장문익;김재희
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.2061-2074
    • /
    • 1998
  • 패턴 인식의 분야에서 그래프는 복잡한 대상체의 표현 및 인식의 도구로서 많이 사용되지만, 그래프간의 유사성 비교에는 많은 시간이 소요될 뿐아니라 실제 입력되는 영상은 왜곡으로 인해 저장되어 있는 이상적인 영상과 동일함을 기대할 수 없으므로 유사한 정도를 판별하는 기준이 마련되어야만 한다. 이 논문에서는 행렬을 그래프의 표현 수단으로 사용하였다. 행렬은 표현이 간단하며, 정의되어 있는 연산을 통해 순서 배열 및 매칭 과정을 간단히 수행하루 수 있다. 이 때 그래프를 구성하는 노드(node)들을 기하학적 위치에 따라 순서 배열함으로써 그래프를 구성하는 노드들 사이의 대응 관계를 효율적으로 찾을 수 있도록 하였으며, 또한 왜곡으로 인하여 기호를 표현하는 그래프의 노드가 제대로 추출되지 못한 경우는 기호의 구조를 고려하여 보정해 줄 수 있는 분할 과정을 도입하여 해결하였다. 제안한 방법은 악보의 비음표 기호 인식을 통해 실험하였으며, 실험 결과 95% 정도의 인식률을 얻을 수 있었다.

  • PDF

실시간 2차원 Separable 메디안 필터 (Real-time 2-D Separable Median Filter)

  • Jae Gil Jeong
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권3호
    • /
    • pp.321-330
    • /
    • 2002
  • 2차원 메디안필터는 정지영상 및 동영상 신호처리 분야에 많이 활용되고 있다. 최근의 급속한 VLSI기술의 발전은 적절한 비용으로 실시간 2차원 메디안 필터의 구현을 가능하게 하여 주고 있다. 효율적인 VLSI구현을 위해서는 적은 양의 메모리 사용, 규칙적인 계산, 지역 데이터 전달 등의 특성을 갖는 알고리즘과 VLSI 구조가 필수적이다. 본 논문에서는 위와 같은 특성을 갖는 새로운 실시간 2차원 메디안필터의 VLSI구조를 제안하였다. 이를 위하여 메디안필터링 알고리즘을 분석하여 메디안 필터링 알고리즘에 내재되어 있는 병렬처리 특성, 특히 파이프라인 가능성을 최대한 활용할 수 있도록 하였다. 또한 Separable 2차원 메디안 필터링 알고리즘을 사용하여 하드웨어 복잡성을 크게 감소시켰다. Separable 2차원 메디안필터는 기존의 메디안필터와 거의 유사한 성능을 보여주었으며 bit-slice pipeline median searching 알고리즘은 기존의 메디안 필터에서 문제가 되었던 window의 크기에 따라 하드웨어 복잡성이 크게 증가하는 문제를 해결하여 window 크기에 관계없이 2차원 실시간 메디안 필터의 VLSI 구현을 가능하게 하여 주었다. C 언어를 이용한 행위레벨 시뮬레이션을 통하여 성능을 확인하고 분석하였다.

  • PDF

다중 구간 샘플링에 기반한 배경제거 알고리즘 (Background Subtraction Algorithm Based on Multiple Interval Pixel Sampling)

  • 이동은;최영규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.27-34
    • /
    • 2013
  • 배경제거는 동영상의 내용을 자동으로 분석하기 위한 매우 중요한 기술의 하나로 움직이는 객체를 검출하고 추적하기 위한 핵심 기술이다. 본 논문에서는 배경 모델과 함께 배경 영상을 제공하는 새로운 샘플링 기반의 배경제거 알고리즘을 제안한다. 제안된 방법에서는 움직임이 빠른 객체와 느린 객체를 동시에 처리하기 위해 다중 구간 샘플링 기법을 이용하여 배경 모델을 생성한다. 이러한 다중 구간 배경 모델들로부터 최선의 배경 모델을 만들기 위해 "신뢰도"를 사용한 것이 본 논문의 특징이다. 배경 제거 분야에서 다양한 모델을 병합하여 하나의 모델을 만들기 위해 신뢰도를 정의하여 사용한 경우는 현재까지 보고되지 않았다. 실험을 통해 제안된 방법이 다양한 속도의 객체가 존재하고 시간에 따른 그림자의 이동과 같은 환경 변화가 있는 응용에서도 안정적인 결과를 나타내는 것을 알 수 있었다.

열화상 이미지 분석을 통한 배전 설비 공정능력지수 감지 시스템 개발 (Identifying Process Capability Index for Electricity Distribution System through Thermal Image Analysis)

  • 이형근;홍용민;강성우
    • 품질경영학회지
    • /
    • 제49권3호
    • /
    • pp.327-340
    • /
    • 2021
  • Purpose: The purpose of this study is to propose a system predicting whether an electricity distribution system is abnormal by analyzing the temperature of the deteriorated system. Traditional electricity distribution system abnormality diagnosis was mainly limited to post-inspection. This research presents a remote monitoring system for detecting thermal images of the deteriorated electricity distribution system efficiently hereby providing safe and efficient abnormal diagnosis to electricians. Methods: In this study, an object detection algorithm (YOLOv5) is performed using 16,866 thermal images of electricity distribution systems provided by KEPCO(Korea Electric Power Corporation). Abnormality/Normality of the extracted system images from the algorithm are classified via the limit temperature. Each classification model, Random Forest, Support Vector Machine, XGBOOST is performed to explore 463,053 temperature datasets. The process capability index is employed to indicate the quality of the electricity distribution system. Results: This research performs case study with transformers representing the electricity distribution systems. The case study shows the following states: accuracy 100%, precision 100%, recall 100%, F1-score 100%. Also the case study shows the process capability index of the transformers with the following states: steady state 99.47%, caution state 0.16%, and risk state 0.37%. Conclusion: The sum of caution and risk state is 0.53%, which is higher than the actual failure rate. Also most transformer abnormalities can be detected through this monitoring system.

Vanishing Line based Lane Detection for Augmented Reality-aided Driver Induction

  • Yun, Jeong-Rok;Lee, Dong-Kil;Chun, Sung-Kuk;Hong, Sung-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.73-83
    • /
    • 2019
  • In this paper, we propose the augmented reality(AR) based driving navigation based on robust lane detection method to dynamic environment changes. The proposed technique uses the detected lane position as a marker which is a key element for enhancing driving information. We propose Symmetrical Local Threshold(SLT) algorithm which is able to robustly detect lane to dynamic illumination environment change such as shadows. In addition, by using Morphology operation and Connected Component Analysis(CCA) algorithm, it is possible to minimize noises in the image, and Region Of Interest(ROI) is defined through region division using a straight line passing through several vanishing points We also propose the augmented reality aided visualization method for Interchange(IC) and driving navigation using reference point detection based on the detected lane coordinates inside and outside the ROI. Validation experiments were carried out to assess the accuracy and robustness of the proposed system in vairous environment changes. The average accuracy of the proposed system in daytime, nighttime, rainy day, and cloudy day is 79.3% on 4600 images. The results of the proposed system for AR based IC and driving navigation were also presented. We are hopeful that the proposed research will open a new discussion on AR based driving navigation platforms, and thus, that such efforts will enrich the autonomous vehicle services in the near future.

다중 회귀 모델을 이용한 전주시 보행 환경 점수 예측에 관한 연구 (A Study on the Walkability Scores in Jeonju City Using Multiple Regression Models)

  • 이기춘;남광우;이창우
    • 한국산업정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.1-10
    • /
    • 2022
  • 컴퓨터 비전을 활용하여 인간의 시각을 해석하려는 시도가 다양한 분야에서 발전되어 왔다. 본 논문에서는 도로영상으로부터 영상의 의미론적 분할 결과를 통해 보행 환경을 평가하는 방법을 제안한다. 먼저 도로영상을 수집하기 위해 카카오 지도 API를 활용하였으며 전주시지역의 약 5만 점에서 4방향 영상을 수집한다. 수집된 영상의 20%는 크라우드 소싱기반 쌍체 비교를 통해 데이터 셋을 구축하고, 쌍체 비교 데이터를 이용하여 다양한 회귀 모델을 훈련한다. 영상 데이터의 보행성 점수를 도출하기 위해 순위 알고리즘인 Trueskill 알고리즘을 활용하여 랭킹 점수를 계산하고, 구축된 데이터를 활용하여 다양한 회귀모델을 사용한 보행성 평가 및 분석 작업을 수행한다. 본 연구를 통해 사람의 시각이 아닌 픽셀 분포 분류 정보 간의 상관관계를 통해 컴퓨터 시스템만으로 전주시의 보행 환경을 평가하고 점수를 도출해 낼 수 있다는 것을 보여준다.

Abnormal behaviour in rock bream (Oplegnathus fasciatus) detected using deep learning-based image analysis

  • Jang, Jun-Chul;Kim, Yeo-Reum;Bak, SuHo;Jang, Seon-Woong;Kim, Jong-Myoung
    • Fisheries and Aquatic Sciences
    • /
    • 제25권3호
    • /
    • pp.151-157
    • /
    • 2022
  • Various approaches have been applied to transform aquaculture from a manual, labour-intensive industry to one dependent on automation technologies in the era of the fourth industrial revolution. Technologies associated with the monitoring of physical condition have successfully been applied in most aquafarm facilities; however, real-time biological monitoring systems that can observe fish condition and behaviour are still required. In this study, we used a video recorder placed on top of a fish tank to observe the swimming patterns of rock bream (Oplegnathus fasciatus), first one fish alone and then a group of five fish. Rock bream in the video samples were successfully identified using the you-only-look-once v3 algorithm, which is based on the Darknet-53 convolutional neural network. In addition to recordings of swimming behaviour under normal conditions, the swimming patterns of fish under abnormal conditions were recorded on adding an anaesthetic or lowering the salinity. The abnormal conditions led to changes in the velocity of movement (3.8 ± 0.6 cm/s) involving an initial rapid increase in speed (up to 16.5 ± 3.0 cm/s, upon 2-phenoxyethanol treatment) before the fish stopped moving, as well as changing from swimming upright to dying lying on their sides. Machine learning was applied to datasets consisting of normal or abnormal behaviour patterns, to evaluate the fish behaviour. The proposed algorithm showed a high accuracy (98.1%) in discriminating normal and abnormal rock bream behaviour. We conclude that artificial intelligence-based detection of abnormal behaviour can be applied to develop an automatic bio-management system for use in the aquaculture industry.

확장 참조표를 활용한 허프변환의 성능 분석 (Performance Analysis of Hough Transform Using Extended Lookup Table)

  • 오정수
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1868-1873
    • /
    • 2021
  • 본 논문은 대표적인 직선 검출 알고리즘인 허프변환이 갖고 있는 계산적인 부담을 줄이기 위해 확장된 참조표를 활용한 허프변환을 제안하고, 성능을 분석하고 있다. 기존 허프변환도 계산 부담을 줄이기 위해 관심 에지 화소를 지나는 모든 직선들의 매개 변수 𝜌 계산에 참조표를 적용한다. 그러나 제안된 허프변환은 더 많은 계산 감소를 유도하기 위해 관심 에지 화소뿐만 아니라 그 주변 에지 화소들을 지나는 직선들에도 적용할 수 있는 확장 참조표를 채택하고 있다. 본 논문은 제안된 알고리즘의 유효성을 수학적으로 증명하고 또한 모의실험을 통해 확인하고 있다. 모의 실험 결과는 제안된 허프변환이 기존 허프변환과 비교해 곱셈 계산량을 영상과 적용된 확장 참조표에 따라 49.6%에서 최대 16.1%까지 감소시키는 것을 보여주고 있다.

회랑 감시를 위한 딥러닝 알고리즘 학습 및 성능분석 (Deep Learning Algorithm Training and Performance Analysis for Corridor Monitoring)

  • 정우진;홍석민;최원혁
    • 한국항행학회논문지
    • /
    • 제27권6호
    • /
    • pp.776-781
    • /
    • 2023
  • K-UAM은 2035년까지의 성숙기 이후 상용화될 예정이다. UAM 회랑은 기존의 헬리콥터 회랑을 수직 분리하여 사용될 예정이기에 회량 사용량이 증가할 것으로 예상된다. 따라서 회랑을 모니터링하는 시스템도 필요하다. 최근 객체 검출 알고리즘이 크게 발전하였다. 객체 검출 알고리즘은 1단계 탐지와, 2단계 탐지 모델로 나뉜다. 실시간 객체 검출에 있어서 2단계 모델은 너무 느리기에 적합하지 않다. 기존 1단계 모델은 정확도에 문제가 있었지만, 버전 업그레이드를 통해 성능이 향상되었다. 1단계 모델 중 YOLO-V5는 모자이크 기법을 통한 소형 객체 검출 성능을 향상시킨 모델이다. 따라서 YOLO-V5는 넓은 회랑의 실시간 모니터링에 가장 적합하다고 판단된다. 본 논문에서는 YOLO-V5 알고리즘을 학습시켜 궁극적으로 회랑 모니터링 시스템에 대한 적합도를 분석한다.

얼굴인식의 향상을 위한 스테레오 영상기반의 3차원 정보를 이용한 인식 (Recognition method using stereo images-based 3D information for improvement of face recognition)

  • 박장한;백준기
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.30-38
    • /
    • 2006
  • 본 논문에서는 스테레오 얼굴영상으로부터 3차원 정보인 거리와 깊이 정보를 이용해 거리에 따라 얼굴인식률이 떨어지는 것을 개선하였다. 단안 영상은 객체의 거리, 크기, 이동, 회전, 깊이 등의 불확실한 정보로 인해 인식률이 떨어지는 문제점이 있다. 또한 얼굴의 회전, 조명, 표정변화 등의 영상정보가 취득되지 않으면 인식률이 매우 저하되는 단점이 있다. 그래서 본 연구는 이와 같은 문제점을 해결하고자 한다. 제안된 방법은 눈 검출 알고리듬, 얼굴의 회전 방향분석, PCA(Principal Component Analysis)로 구성된다. 또한 제한된 영역에서 얼굴을 고속으로 검출하기 위해 RGB컬러공간에서 YCbCr공간으로 변환한다. 얼굴후보 영역에서 다층 상대적인 밝기 맵을 생성하여 얼굴의 기하학적인 구조로부터 얼굴인지를 판별한다. 스테레오 얼굴영상으로부터 거리 및 눈과 입의 깊이 정보를 취득하고, 거리에 따라 확대, 축소, 이동, 회전 등의 정규화를 통해 $92{\times}112$ 크기의 얼굴을 검출한다. 검출된 왼쪽 얼굴영상과 추정된 방향의 차를 PCA로 학습한다. 제안된 방법은 정면에서 최대 95.8%(100cm), 포즈변화에 따라 98.3%의 인식률을 얻을 수 있었다. 따라서 실험을 통하여 제안된 방법은 거리에 따라 확대, 축소와 회전 등의 정확한 정규화로 높은 인식률을 얻을 수 있음을 보였다.