• 제목/요약/키워드: Image Recognition Technologies

검색결과 159건 처리시간 0.024초

디지털 도서관(圖書館)과 정보관리 (Digital Library and Information Management)

  • 김순자
    • 정보관리연구
    • /
    • 제26권1호
    • /
    • pp.16-51
    • /
    • 1995
  • 정보관리 분야에서는 컴퓨터와 정보 네트워크의 발달, 그리고 초고속 정보통신망 구축과 같은 환경변화로 인하여 새로운 시대를 맞이하고 있다. 이러한 변화의 시대에 정보의 중요성과 새로운 정보기술의 발달, 정보이용자들의 주변환경 변화를 인식하게 됨에 따라 디지털 도서관(digital library)을 구상하게 되었다. 본고에서는 새롭게 등장한 디지털 도서관의 개념과 기능을 알아보고, CD-ROM, OCR 기법과 이미지 스캐닝, hypertext, hypermedia, multimedia와 같은 정보기술에 대해서 살펴보았다. 또한 이러한 기술을 응용한 시스템 사례를 살펴봄으로써 정보관리 분야에서 새로운 전자정보 서비스를 위한 전략과 정보의 디지털 화를 위한 응용가능성을 살펴보고자 한다.

  • PDF

Real time instruction classification system

  • Sang-Hoon Lee;Dong-Jin Kwon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제16권3호
    • /
    • pp.212-220
    • /
    • 2024
  • A recently the advancement of society, AI technology has made significant strides, especially in the fields of computer vision and voice recognition. This study introduces a system that leverages these technologies to recognize users through a camera and relay commands within a vehicle based on voice commands. The system uses the YOLO (You Only Look Once) machine learning algorithm, widely used for object and entity recognition, to identify specific users. For voice command recognition, a machine learning model based on spectrogram voice analysis is employed to identify specific commands. This design aims to enhance security and convenience by preventing unauthorized access to vehicles and IoT devices by anyone other than registered users. We converts camera input data into YOLO system inputs to determine if it is a person, Additionally, it collects voice data through a microphone embedded in the device or computer, converting it into time-domain spectrogram data to be used as input for the voice recognition machine learning system. The input camera image data and voice data undergo inference tasks through pre-trained models, enabling the recognition of simple commands within a limited space based on the inference results. This study demonstrates the feasibility of constructing a device management system within a confined space that enhances security and user convenience through a simple real-time system model. Finally our work aims to provide practical solutions in various application fields, such as smart homes and autonomous vehicles.

밀리미터파의 손동작 인식 알고리즘에 관한 연구 (Study on Hand Gestures Recognition Algorithm of Millimeter Wave)

  • 남명우;홍순관
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.685-691
    • /
    • 2020
  • 본 논문에서는 77GHz를 사용하는 밀리미터파 레이더 센서의 반향 신호를 이용하여 손동작의 움직임을 추적한 후 얻어진 데이터로 0부터 9까지의 숫자들을 인식하는 알고리즘을 개발하였다. 손동작을 감지하여 레이더 센서로부터 얻어진 반향 신호들은 산란 단면적의 차이 등에 의해 불규칙한 점들의 군집형태를 보인다. 이들로부터 유효한 중심점을 얻기 위해 3차원 좌푯값들을 이용해 K-Means 알고리즘을 적용하였다. 그리고 얻어진 중심점들을 연결하여 숫자 형태의 이미지를 생성하였다. 얻어진 이미지와 스무딩 기법을 적용해 사람의 손글씨 형태와 유사하게 만든 이미지를 MNIST(Modified National Institute of Standards and Technology database)로 훈련된 CNN(Convolutional Neural Network) 모델에 입력하여 인식률을 비교하였다. 실험은 두 가지 방법으로 진행되었다. 먼저 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서는 각각 평균 77.0%와 81.0%의 인식률을 얻었다. 그리고 학습데이터를 확장(augmentation)한 CNN 모델의 실험에서는 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서 각각 평균 97.5%와 평균 99.0%의 인식률을 얻었다. 본 연구는 레이더 센서를 이용한 다양한 비접촉 인식기술에 응용이 가능할 것으로 판단된다.

Exploring Image Processing and Image Restoration Techniques

  • Omarov, Batyrkhan Sultanovich;Altayeva, Aigerim Bakatkaliyevna;Cho, Young Im
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제15권3호
    • /
    • pp.172-179
    • /
    • 2015
  • Because of the development of computers and high-technology applications, all devices that we use have become more intelligent. In recent years, security and surveillance systems have become more complicated as well. Before new technologies included video surveillance systems, security cameras were used only for recording events as they occurred, and a human had to analyze the recorded data. Nowadays, computers are used for video analytics, and video surveillance systems have become more autonomous and automated. The types of security cameras have also changed, and the market offers different kinds of cameras with integrated software. Even though there is a variety of hardware, their capabilities leave a lot to be desired. Therefore, this drawback is trying to compensate by dint of computer program solutions. Image processing is a very important part of video surveillance and security systems. Capturing an image exactly as it appears in the real world is difficult if not impossible. There is always noise to deal with. This is caused by the graininess of the emulsion, low resolution of the camera sensors, motion blur caused by movements and drag, focus problems, depth-of-field issues, or the imperfect nature of the camera lens. This paper reviews image processing, pattern recognition, and image digitization techniques, which will be useful in security services, to analyze bio-images, for image restoration, and for object classification.

학습기반 효율적인 얼굴 검출 시스템 설계 (Design of an efficient learning-based face detection system)

  • 김현식;김완태;박병준
    • 디지털산업정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.213-220
    • /
    • 2023
  • Face recognition is a very important process in video monitoring and is a type of biometric technology. It is mainly used for identification and security purposes, such as ID cards, licenses, and passports. The recognition process has many variables and is complex, so development has been slow. In this paper, we proposed a face recognition method using CNN, which has been re-examined due to the recent development of computers and algorithms, and compared with the feature comparison method, which is an existing face recognition algorithm, to verify performance. The proposed face search method is divided into a face region extraction step and a learning step. For learning, face images were standardized to 50×50 pixels, and learning was conducted while minimizing unnecessary nodes. In this paper, convolution and polling-based techniques, which are one of the deep learning technologies, were used for learning, and 1,000 face images were randomly selected from among 7,000 images of Caltech, and as a result of inspection, the final recognition rate was 98%.

유연한 모델 기반의 얼굴 영역 검출 방법 (A Flexible Model-Based Face Region Detection Method)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.251-256
    • /
    • 2021
  • 일반적인 카메라와 다르게 초당 매우 많은 개수의 프레임을 캡처할 수 있는 기능을 가진 고속의 카메라는 그동안 제한적이었던 일부의 영상 처리 기술들의 고도화를 가능하게 할 수 있다. 본 논문에서는 입력되는 초고속의 컬러 영상으로부터 잡음을 제거한 다음, 잡음이 제거된 영상으로부터 사람의 얼굴 영역을 검출하는 방법을 제시한다. 본 논문에서는 우선 입력되는 초고속의 영상 안에 포함된 잡음 화소들을 양방향의 필터를 적용하여 효과적으로 제거한다. 그런 다음, 레티나 얼굴 모델을 사용하여 잡음이 제거된 영상으로부터 사람의 개인 정보를 대표적으로 나타내는 얼굴 영역을 강인하게 검출한다. 실험 결과에서는 본 논문에서 제시한 알고리즘이 입력되는 컬러 영상으로부터 잡음을 제거한 다음, 생성된 모델을 사용하여 사람의 얼굴 영역을 강인하게 검출한다는 것을 보여준다. 본 논문에서 제시된 모델 기반의 얼굴 영역검출 방법은 실내외 건물의 모니터링, 출입문 개폐 관리, 그리고 모바일 생체 인증과 같은 영상처리 및 패턴 인식과 관련된 실제적인 많은 응용 분야의 기초 기술로 사용될 것으로 예상된다.

이미지 인식 기반의 컵 오염 여부 측정 시스템의 설계 및 구현 (Design and Implementation of Dangerous of Image Recognition based Cup Contamination Measurement System)

  • 이태준;채희석;이상원;김재민;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.213-215
    • /
    • 2022
  • 최근 이미지를 처리하는 딥러닝 기술이 화재 감지나 자율주행, 불량품 검출 등에서 다양하게 활용되고 있다. 특히, 제품이 오염되었는지 아닌지를 파악하기 위해 기존 센서 데이터에서 넘어온 오염물질을 통해 파악할 수 있지만, 제품의 균열이나 오염물질 자체를 이미지로 인식하는 기술도 다양한 분야에서 활발히 연구되고 있다. 본 논문에서는 오염되지 않은 정상적인 컵과 오염된 컵을 이미지를 통해 분류하는 시스템을 설계하고 이를 구현하였다. 이미지는 오픈 이미지와 촬영한 이미지를 사용하였고, 3D 객체 인식을 위한 Google Objectron을 활용해 컵 이미지의 상단 부분을 추출하여 이미지를 분석하였다. 본 연구를 통해 위생 분야에서 필요한 제품의 오염도를 이미지 기반으로 추출할 수 있는 연구에 다각도로 활용할 것으로 사료된다.

  • PDF

광기술을 이용한 연구보고서 관리시스템 구축 (A Study on Construction of Technical Reports Management System Using Optical Technology)

  • 이상헌;김익철
    • 정보관리학회지
    • /
    • 제9권1호
    • /
    • pp.131-164
    • /
    • 1992
  • 본 연구에서는 광기술을 이용한 보고서 서지정보와 원문정보를 관리할 수 있는 보고서관리시스템을 개발하였다. 시스템을 현재 상업적으로 보급되고 있는 문서용 광화일링시스템과의 비교평가를 통하여 보고서관리에 적합하고, 도서관 업무에 효율화에 직접적으로 기여할 수 있는 구조로 설계되었으며, 디지탈 이미지 처리기술, MARC 표준, 영문 OCR등의 기술이 사용되었다. (키워드 : 디지탈 이미지, 광기술, 전문데이타베이스, 표준화, 기술보고서, MARC, 광학문자인식)

  • PDF

비접촉식 동작인식 기반 사용자 인터페이스 기술 전망 (Prospect of Non-Touch User Interface Technique)

  • 김수균;성경
    • 한국항행학회논문지
    • /
    • 제18권3호
    • /
    • pp.242-247
    • /
    • 2014
  • 접촉식 동작인식기반 사용자 인터페이스 기술(touch user interface)의 발전은 새로운 사용자 경험(UX)인 아이폰의 등장과 성공에 있다고 할 수 있다. 특히 애플 아이폰이 출시된 이후, 기존에 많이 쓰였던 전통적인 사용자 경험인 키보드와 마우스라는 큰 틀에서 벗어나게 된다. 현재는 4세대 기술인 비접촉식 동작인식 기반 사용자 인터페이스 기술이 접촉식 인터페이스 기술을 대체하는 방향으로 발전하고 있으며, 3세대에서 4세대로 이동한다고 할 수 있다. 본 논문에서는 비접촉식 인터액션 기술에 대한 선도기업을 중심으로 소개할 예정이며, 현재 선보이고 있는 최신 기술과 향후 선보일 기술에 대해 분석하고 비교해 본다.

번호판 인식을 통한 자동 주차관리 시스템의 개선된 UI 설계 (Design of Improved UI of Automatic Parking Management System using License Plate Recognition)

  • 김봉기
    • 한국산학기술학회논문지
    • /
    • 제15권2호
    • /
    • pp.1083-1088
    • /
    • 2014
  • 최근 영상 기술과 ICT 기술의 발전으로 인해 다양한 형태의 영상처리 서비스가 가능하게 되고, 이러한 기술을 활용하는 응용 서비스가 다양화 되고 있다. 자동차 번호판 인식은 주차관리 등 차량의 정보를 인지하는 곳에 사용되는데 기존의 시스템들은 주차권 발급이나 불필요한 장비 부착 등 경제적인 단점을 갖고 있다. 이러한 문제점을 개선하기 위하여 본 논문에서는 OpenCV를 근간으로 한 emguCV를 이용하여 차량의 고유번호인 자동차 번호판 인식을 통한 자동 주차관리 시스템을 설계 및 구현하였다. 그리고 사용자 프로그램 개발에 가장 최신 기술인 WPF를 이용하여 각 주차 차량의 상세정보와 주차 시간 및 남은 주차 공간 정보 등 전체 주차관리 사항을 화면이동 없이 관리할 수 있도록 개선된 UI를 설계하였다. 본 논문에서 사용된 emguCV는 Intel 기반의 환경에서 최적화된 성능을 나타내었다. 따라서 본 논문에서는 0.5초 이내의 번호판 인식 처리 시간과 90% 이상의 인식률이라는 결과를 얻었다. 또한 관리자가 전체 시스템을 간편하고 직관적으로 관리할 수 있게 UI가 개선되었음을 보였다.