• 제목/요약/키워드: Object recognition system

검색결과 714건 처리시간 0.027초

적응적 형상학 Meyer 웨이브렛-CNN을 이용한 영상 에지 검출 연구 (A study on image edge detection using adaptive morphology Meyer wavelet-CNN)

  • 백영현;문성룡
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.704-709
    • /
    • 2003
  • 디지털 영상은 전송 중에 잡음과 시스템의 다른 요소에 의해 입력 요소가 왜곡된다. 이는 영상객체의 분할시 경계면의 모호함이 발생시키고, 특히 입력 영상 경계 부분은 패턴인식의 분할 및 검출 요소를 결정하기 때문에 매우 중요하다. 따라서 그 경계 부분을 정확하게 분할ㆍ검출하는 최적의 에지 검출 방법을 제안하였다. 본 논문에서는 입력 영상의 임계값에 따른 적응적 형상학을 이용하여 영상의 경계면을 부각시킨 후, 이 영상을 Meyer 웨이브렛-CNN 알고리즘에 적용한 후 최적의 에지를 검출하였다. 제안된 알고리즘이 기존의 영상 에지 검출 알고리즘인 Sobel 에지 검출과 기존의 다른 에지 검출보다 우수함을 확인하였다. 특히 에지와 에지의 부분이 가까운 곳과 완만한 곡선을 가지고 있는 부분에서 더 우수한 결과 에지를 얻을 수 있음을 시뮬레이션에 의해 확인하였다.

생체 신호와 비전 정보의 융합을 통한 스마트 휴먼-컴퓨터 인터페이스 (Smart HCI Based on the Informations Fusion of Biosignal and Vision)

  • 강희수;신현출
    • 전자공학회논문지SC
    • /
    • 제47권4호
    • /
    • pp.47-54
    • /
    • 2010
  • 본 논문에서는 3차원 공간에서의 직관적이며 자연스러운 손동작을 통해 기존의 컴퓨터 인터페이스를 대체할 수 있는 새로운 인터페이스를 제안한다. 제안하는 인터페이스는 커서의 이동 제어와 명령 제어의 기능을 3차원 공간에서 마우스란 매개체 없이 손의 움직임만으로 수행할 수 있다. 명령 제어를 위한 손가락 동작은 손목에서 얻은 근전도 신호를 통해 추론하며, 손가락 동작의 종류는 4가지(좌클릭, 우클릭, 홀드, 릴리즈)로 마우스의 모든 기능을 표현할 수 있다. 또한 컴퓨터 화면상 커서의 상하좌우 움직임 제어는 손의 이동을 통하여 이루어지며 이는 영상 정보처리를 통하여 구현하였다. 손가락 동작 추론을 위해 지표로는 근전도 신호의 엔트로피가 사용되었으며, 가우시안 모델링과 최우추정법을 이용하였다. 커서의 움직임 제어를 위한 영상처리에는 색상인식을 통하여 손가락 끝에 부착한 마커 영역의 위치 좌표를 얻고, 그 좌표의 중심점을 구하여 커서의 이동 제어를 구현하였다. 손가락 움직임 추론을 통한 명령 제어의 성공률은 95% 이상이며 커서 이동제어는 실시간 지연 없이 자연스러운 수행이 가능하였다. 전체 시스템을 직접 구현하여 성능 및 유용성에 대하여 확인하였다.

다수의 보행자 추적과정에서 특징정보를 이용한 보행자 검출 알고리즘 설계 (Design of Pedestrian Detection Algorithm Using Feature Data in Multiple Pedestrian Tracking Process)

  • 한명호;류창주;이상덕;한승조
    • 한국정보통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.641-647
    • /
    • 2018
  • 최근 여러 목적으로 영상 정보를 제공하는 CCTV는 지능형으로 변화하고 있으며, 컴퓨터 비전을 이용한 자동화 응용 범위가 증가하고 있다. 보행자 및 차량 등의 정확한 인식을 위해 신뢰성이 높은 검출방법을 수행하여야 하며 이를 위해 다양한 방법들이 연구되고 있다. 본 논문에서는 다수의 보행자가 움직이는 상황에서 보행자의 세 가지 특징 정보를 획득하여 다수의 보행자들을 검출하는 방법을 제안한다. 제안하는 방법은 보행자 검출 및 추적에 실패하거나 혼동되는 상황을 최소화 하면서 각각의 보행자를 구별한다. 보행자들끼리 근접하거나 겹치는 경우 미리 저장된 프레임 특징 정보를 이용하여 보행자를 구별 및 검출한다.

환경 변화에 강인한 구조 기반 손 영역 탐지 (Robust Hand-Region Detecting Based On The Structure)

  • 임경진;전미연;홍록기;서성원;신미혜;김의정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.389-392
    • /
    • 2010
  • 본 논문에서는 웹캠으로 입력받은 컬러 영상에서 손의 구조정보를 활용하여 위치를 탐지하고 손동작을 인식하는 방법을 제시한다. 본 시스템에서는 피부색을 기반으로 영상을 이진화하고, 라벨링한다. 각각의 라벨링된 영역 내에서 Voronoi Diagram을 활용한 최대 내접원(Maximum Inscribed Circle)을 탐색하여 손의 중심점을 찾고 최대 내접원과 연결된 타원 성분을 분석하여 손 영역을 추출한다. 그리고 여기에서 찾아진 최대 내접원과 타원 성분을 손동작 인식의 특징점으로 사용한다. 제안하는 알고리즘은 다양한 환경에서 손을 인식할 때 문제가 되는 배경에서의 유사한 색상을 가진 물체를 효과적으로 제거할 수 있는 장점이 있다.

  • PDF

모바일 환경을 위한 맞춤형 서비스 유비쿼터스 영상전송 시스템의 설계 (Design and Implementation of High-Resolution Image Transmission Interface for Mobile Device)

  • 이상욱;안용범;김응수
    • 한국정보통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.791-799
    • /
    • 2008
  • 영상전송에 있어서 주변 환경에 대한 영상인식은 대단히 중요하다. 최근 정보인프라의 대중화에 따라 모바일 환경에까지 유, 무선을 통한 대상의 상태를 영상으로 확인하려는 사용자 중심적 욕구가 증가하였다. 하지만 기존의 모바일용 솔루션은 저대역폭을 가지는 모바일 단말기 기반의 네트워크 특성상 소프트웨어 코덱만을 지원함으로써 소프트웨어적인 처리의 한계로 인한 고화질의 영상은 기대 할 수 없었다. 이러한 단점을 해결하기 위해서 본 논문에서는 모바일 환경에서 적용할 수 있는 고화질 지원과 실시간적 요소를 고려하여 높은 압축률을 가지는 국제비디오 압축 표준인 MPEG-4 기반 하드웨어 코덱 설계에 관하여 기술하였다. 이를 위한 시스템의 최적화된 설계를 위하여 임베디드용 전용 CPU를 채용하였으며 구현된 시스템은 모바일 환경에서도 고기능을 서비스하고 전송속도 및 해상도 등에 있어서 우수한 성능을 나타내었다.

공간패턴을 이용한 자동 비닐하우스 추출방법 (Automated Vinyl Green House Identification Method Using Spatial Pattern in High Spatial Resolution Imagery)

  • 이종열;김병선
    • 대한원격탐사학회지
    • /
    • 제24권2호
    • /
    • pp.117-124
    • /
    • 2008
  • 지형지물은 각각의 특징적 요인을 내포하고 있다. 이 특징적 요인들은, 공간해상도에 따라 정도의 차이가 있겠지만, 수집된 위성영상에도 반영된다. 이러한 요인들 중에서는 영상분류에 활용될 경우 영상 분류의 정확도를 높혀주고, 때로는 이것이 거의 물체인식의 수준까지 기여할 수 있는 것들이 있다. 이 연구에서는 텍스춰 및 지형지물의 배열에 있어서 특징적 현상을 보이는 비닐하우스를 대상으로 spatial auto-corelation 개념을 기반으로 자동적으로 이를 인지하는 방법을 개발하였다. 사용된 알고리즘은 디지타이징과 같은 사람의 직접적인 개입이 없이 자동화된 방법으로 비닐하우스의 특정한 패턴이 반복적으로 나타나는 것을 감지할 수 있도록 개발되었다. 패틴의 인식에 더하여 비닐하우스의 기하학적 모양을 고려하는 방법도 도입하였다. 그럼으로써 비닐하우스의 추출에 단순히 화소 단위의 분석이 아닌 보다 객체지향적인 방법으로 비닐하우스를 추출하도록 하였다. 개발된 방법을 제주지역의 IKONOS에 적용시켜 본 결과 연구대상지역내의 비닐하우스가 매우 정확하게 적출되었다.

DSP(Digital signal proccesor)를 이용한 산업현장에서의 안전모 미착용 인식 기술 (Recognizing that a person doesn't put on a safety cap using DSP.)

  • 이용욱;송강석;정무일;임철후;문성모
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.530-533
    • /
    • 2009
  • 본 연구는 DSP(Digital signal processor)상에서 영상 처리 기술을 이용한 안전모 미착용 인식 기술을 개발한다. 이는 산업 현장에 배치된 영상 입력 장치를 통해 입력된 영상을 영상 처리하고, 안전모를 미착용한 사람이 발견될 경우 감독관에게 해당 인식 결과를 전송하여 조치를 취함으로써 만약의 사고 발생시 안전모를 착용하지 아니하여 발생할 수 있는 추가적인 인명피해를 미연에 방지한다. 안전모 미착용을 인식하기 위해서는 입력된 영상에서의 오브젝트 추출, 노이즈 제거, 사람/사물 판단, 머리 영역 추출, HSV 색공간을 이용한 안전모 착용 유/무 판단 등의 과정을 거친다. 영상입력 및 영상처리는 DSP를 이용해 처리하고 알고리즘의 속도 개선을 위하여 C언어 기반의 코드를 DSP가 제공하는 고유 함수(Intrinsics)들을 이용하여 최적화 한다.

  • PDF

LGP-FL과 해마 구조를 이용한 H-CNN 기반 보행자 검출에 대한 연구 (A Study on H-CNN Based Pedestrian Detection Using LGP-FL and Hippocampal Structure)

  • 박수빈;강대성
    • 한국정보기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.75-83
    • /
    • 2018
  • 최근 자율 주행 자동차에 대한 연구가 활발하다. 자율 주행 자동차는 보행자 검출 및 인식 기술이 중요하다. 최근에 주로 사용되는 CNN(Convolutional Neural Network)을 이용한 보행자 검출은 대체로 좋은 성능을 보이나 영상의 환경에 따른 성능 저하가 있다. 본 논문에서는 LGP-FL(Local Gradient Pattern-Feature Layer)을 추가한 CNN Network를 기반으로 해마 신경망의 장기 기억 구조를 적용한 보행자 검출 시스템을 제안한다. 먼저 입력 이미지를 $227{\times}227$의 크기로 변경한다. 그 후 총 5개 층의 Convolution layer를 거쳐 특징을 추출한다. 그 과정에서 추가되는 LGP-FL에서는 LGP 특징 패턴을 추출하여 출현 빈도수가 높은 패턴을 장기 기억 장치에 저장한다. 이후 검출 과정에서 밝기 및 색상 변화에 강인한 LGP 특징 패턴 정보를 이용해 검출함으로써 보다 정확하게 보행자를 검출할 수 있다. 기존의 방법들과 제안하는 기법의 비교를 통해 약 1~4%의 검출률 증가를 확인하였다.

초음파 스캐닝을 활용한 지능형 건설기계 충돌방지 기술 (Intelligent Collision Prevention Technique for Construction Equipment using Ultrasound Scanning)

  • 이재훈;황영서;양강혁
    • 한국건설관리학회논문집
    • /
    • 제22권5호
    • /
    • pp.48-54
    • /
    • 2021
  • 고용노동부의 2020년 산업재해 사고 사망 통계 발표에 따르면 최근 5년간 발생한 업무상 사고 사망 재해의 절반 이상이 건설업에서 발생하고 있다. 그중 건설기계와 관련된 충돌 및 협착 사고가 사망 재해의 큰 부분을 차지하고 있다는 것을 알 수 있다. 정부는 건설 현장에서 발생하는 사고를 예방하기 위해 "건설안전특별법" 발의, 사고 예방을 위한 새로운 기술의 도입 장려 등 큰 노력을 기울이고 있지만, 여전히 건설 현장에서 수많은 안전사고가 발생하고 있다. 이에 본 연구는 초음파 스캐닝 기술을 통해 반경 내 대상의 종류와 위치를 인식하여 건설기계와 작업자 간의 충돌사고를 예방할 수 있는 기술을 개발했다. 본 연구는 파일럿 실험을 수행하였으며, 결과 분석을 통해 대상 인식과 위치 추정 모두에서 높은 정확도로 기술의 실현 가능성을 증명하였다. 개발한 기술은 건설 현장에서 발생하는 충돌사고를 예방하고, 자동화된 건설기계 충돌사고 예방 기술 개발에 이바지할 수 있을 것으로 기대된다.

Question Similarity Measurement of Chinese Crop Diseases and Insect Pests Based on Mixed Information Extraction

  • Zhou, Han;Guo, Xuchao;Liu, Chengqi;Tang, Zhan;Lu, Shuhan;Li, Lin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.3991-4010
    • /
    • 2021
  • The Question Similarity Measurement of Chinese Crop Diseases and Insect Pests (QSM-CCD&IP) aims to judge the user's tendency to ask questions regarding input problems. The measurement is the basis of the Agricultural Knowledge Question and Answering (Q & A) system, information retrieval, and other tasks. However, the corpus and measurement methods available in this field have some deficiencies. In addition, error propagation may occur when the word boundary features and local context information are ignored when the general method embeds sentences. Hence, these factors make the task challenging. To solve the above problems and tackle the Question Similarity Measurement task in this work, a corpus on Chinese crop diseases and insect pests(CCDIP), which contains 13 categories, was established. Then, taking the CCDIP as the research object, this study proposes a Chinese agricultural text similarity matching model, namely, the AgrCQS. This model is based on mixed information extraction. Specifically, the hybrid embedding layer can enrich character information and improve the recognition ability of the model on the word boundary. The multi-scale local information can be extracted by multi-core convolutional neural network based on multi-weight (MM-CNN). The self-attention mechanism can enhance the fusion ability of the model on global information. In this research, the performance of the AgrCQS on the CCDIP is verified, and three benchmark datasets, namely, AFQMC, LCQMC, and BQ, are used. The accuracy rates are 93.92%, 74.42%, 86.35%, and 83.05%, respectively, which are higher than that of baseline systems without using any external knowledge. Additionally, the proposed method module can be extracted separately and applied to other models, thus providing reference for related research.