• 제목/요약/키워드: object-image recognition

검색결과 798건 처리시간 0.028초

앙상블 학습 알고리즘과 인공지능 표정 인식 기술을 활용한 사용자 감정 맞춤 힐링 서비스 (Using Ensemble Learning Algorithm and AI Facial Expression Recognition, Healing Service Tailored to User's Emotion)

  • 양성연;홍다혜;문재현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.818-820
    • /
    • 2022
  • The keyword 'healing' is essential to the competitive society and culture of Koreans. In addition, as the time at home increases due to COVID-19, the demand for indoor healing services has increased. Therefore, this thesis analyzes the user's facial expression so that people can receive various 'customized' healing services indoors, and based on this, provides lighting, ASMR, video recommendation service, and facial expression recording service.The user's expression was analyzed by applying the ensemble algorithm to the expression prediction results of various CNN models after extracting only the face through object detection from the image taken by the user.

SURF 알고리즘 기반 특징점 추출기의 FPGA 설계 (FPGA Design of a SURF-based Feature Extractor)

  • 류재경;이수현;정용진
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.368-377
    • /
    • 2011
  • 본 논문에서는 특징점 정합을 통한 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 사용될 수 있는 알고리즘 중 대표적인 SURF 알고리즘 기반 특징점 추출기의 하드웨어 구조 설계 및 FPGA 검증 결과에 대해 기술한다. SURF 알고리즘은 크기와 회전변화에 강한 특징점과 서술자를 생성함으로써 객체인식, 파노라마 이미지 생성, 3차원 영상 복원 등에 활용될 수 있다. 하지만 ARMl1(667Mhz) 프로세서와 128Mbytes의 DDR 메모리를 사용하는 임베디드 환경에서 실험결과 VGA($640{\times}480$) 해상도 C영상의 특정점 추출 처리 시약 7,200msec의 시간이 걸려 실시간 동작이 불가능한 것으로 파악되었다. 본 논문에서는 SURF 알고리즘의 핵심 요소인 적분 이미지 메모리 접근 패턴을 분석하여 메모리 접근 횟수와 메모리 사용량을 줄이는 방법을 이용해 실시간 동작이 가능하도록 하드웨어로 설계하였다. 설계된 하드웨어를 Xilinx(社)의 Vertex-5 FPGA 를 이용하여 검증한 결과 l00Mhz 클록에서 VGA 영상의 특징점 추출시 약 60frame/sec로 동작하여 실시간 응용으로 충분함을 알 수 있다.

종양세포식별을 위한 공간주파수영역에서의 화상해석 (Image Analysis for Discrimination of Neoplastic Cellis in Spatial Frequency Domain)

  • 나철훈;김창원;김현재
    • 한국통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.385-396
    • /
    • 1993
  • 본(本) 논문(論文)은 병리학등(病理學等) 기초의학(基礎醫學)에서 요청되는 세포진(細胞診)을 위한 개선된 디지털 화상해석방법(畵像解析方法)을 제안(提案)하였다. 대상화상(對象晝像)은 갑상선세포(甲狀腺細胞)의 현미경화상(顯微鏡畵像)이고 목적은 정상세포(正常細胞)와 악성(惡性)인 유두상(乳頭狀) 종양(腫瘍)과 여포성종양(濾胞性腫瘍)간의 염색질(染色質) 패턴이 상이(相異)함을 화상해석(畵像解析)에 의해 자동식별(自動識別)하는 것이다. 먼저, 화상처리상(畵像處理上) 특징영역(特徵領域)인 세포핵(細胞核)만을 추출(抽出)하기 위해 윤곽추적법(輪廓追跡法)에 의한 영역분할(領域分割) 알고리즘을 제안하였다. 그리고 공간영역(空間領域)의 화상정보(畵像情報)를 이산적(離散적) 2차원 푸리에 변환한 후 1차원 푸리에변환에 의해 특징(特徵)파라미터를 추출(抽出)하였다. 여기서 세포(細胞) 유형별(類型別) 특징표본군(特徵標本群)을 구축하여 임의의 검증세포(檢證細胞)와 식별실험(識別實驗)을 행하였다. 기존의 방법보다 개선된 식별율(識別率)(70-90%)을 얻음으로써 본 방식은 세포진(細胞診)에 있어서 정량성(定量性)과 객관성(客觀性)을 더욱 구체화(具體化)시킬 수 있음을 증명하였다. 또한 본 방식을 그대로 종양세포식별(腫瘍細胞識別)에 즉시 사용가능함을 제시하였다.

  • PDF

인공지능 기반 구글넷 딥러닝과 IoT를 이용한 의류 분류 (Classification of Clothing Using Googlenet Deep Learning and IoT based on Artificial Intelligence)

  • 노순국
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.41-45
    • /
    • 2020
  • 최근 4차 산업혁명 관련 IT기술 중에서 머신러닝과 딥러닝으로 대표되는 인공지능과 사물인터넷은 다양한 연구를 통해 여러 분야에서 우리 실생활에 적용되고 있다. 본 논문에서는 사물인터넷과 객체인식 기술을 활용한 인공지능을 적용하여 의류를 분류하고자 한다. 이를 위해 이미지 데이터셋은 웹캠과 라즈베리파이를 이용하여 의류를 촬영하고, 촬영된 이미지 데이터를 전이학습된 컨벌루션 뉴럴 네트워크 인공지능망인 구글넷에 적용하였다. 의류 이미지 데이터셋은 온전한 이미지 900개와 손상이 있는 이미지 900 그리고 총 1800개를 가지고 상하의 2개의 카테고리로 분류하였다. 분류 측정 결과는 온전한 의류 이미지에서는 약 97.78%의 정확도를 보였다. 결론적으로 이러한 측정결과와 향후 더 많은 이미지 데이터의 보완을 통해 사물인터넷 기반 플랫폼상에서 인공지능망을 활용한 여타 사물들의 객체 인식에 대한 적용 가능성을 확인하였다.

지역 가중치 적용 퍼지 클러스터링을 이용한 효과적인 이미지 분할 (Effective Image Segmentation using a Locally Weighted Fuzzy C-Means Clustering)

  • 나이마 알람저;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권12호
    • /
    • pp.83-93
    • /
    • 2012
  • 본 논문에서는 기존의 퍼지 클러스터링 기반 이미지 분할의 성능과 계산 효율을 개선하기 위해 퍼지 클러스터링의 목적 함수를 수정하는 이미지 분할 프레임워크를 제안한다. 제안하는 이미지 분할 프레임워크는 주변 픽셀들에 가중치를 부여함으로써 현재 센터 픽셀 연산을 위해 주변 픽셀들의 중요성을 고려하는 지역 가중치 적용 퍼지 클러스터링 기법을 포함한다. 이러한 가중치들은 각 멤버쉽들의 중요성을 표시하기 위해 현재 픽셀과 대응되는 각 주변 픽셀들 사이의 거리차에 의해 결정되어 지며, 이러한 프로세서는 향상된 클러스터링 성능을 보장한다. 제안하는 방법의 성능을 평가하기 위해 분할 계수, 분할 엔트로피, Xie-Bdni 함수, Fukuyzma-Sugeno 함수와 같은 네 가지 클러스터 유효성 함수를 이용하여 분석하였다. 모의실험 결과, 제안한 방법은 기존의 다른 퍼지 클러스터링 기법들보다 클러스터 유효성 함수들뿐만 아니라 분할과 조밀도 측면에서 우수한 성능을 보였다.

모바일 환경을 위한 맞춤형 서비스 유비쿼터스 영상전송 시스템의 설계 (Design and Implementation of High-Resolution Image Transmission Interface for Mobile Device)

  • 이상욱;안용범;김응수
    • 한국정보통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.791-799
    • /
    • 2008
  • 영상전송에 있어서 주변 환경에 대한 영상인식은 대단히 중요하다. 최근 정보인프라의 대중화에 따라 모바일 환경에까지 유, 무선을 통한 대상의 상태를 영상으로 확인하려는 사용자 중심적 욕구가 증가하였다. 하지만 기존의 모바일용 솔루션은 저대역폭을 가지는 모바일 단말기 기반의 네트워크 특성상 소프트웨어 코덱만을 지원함으로써 소프트웨어적인 처리의 한계로 인한 고화질의 영상은 기대 할 수 없었다. 이러한 단점을 해결하기 위해서 본 논문에서는 모바일 환경에서 적용할 수 있는 고화질 지원과 실시간적 요소를 고려하여 높은 압축률을 가지는 국제비디오 압축 표준인 MPEG-4 기반 하드웨어 코덱 설계에 관하여 기술하였다. 이를 위한 시스템의 최적화된 설계를 위하여 임베디드용 전용 CPU를 채용하였으며 구현된 시스템은 모바일 환경에서도 고기능을 서비스하고 전송속도 및 해상도 등에 있어서 우수한 성능을 나타내었다.

DSP(Digital signal proccesor)를 이용한 산업현장에서의 안전모 미착용 인식 기술 (Recognizing that a person doesn't put on a safety cap using DSP.)

  • 이용욱;송강석;정무일;임철후;문성모
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.530-533
    • /
    • 2009
  • 본 연구는 DSP(Digital signal processor)상에서 영상 처리 기술을 이용한 안전모 미착용 인식 기술을 개발한다. 이는 산업 현장에 배치된 영상 입력 장치를 통해 입력된 영상을 영상 처리하고, 안전모를 미착용한 사람이 발견될 경우 감독관에게 해당 인식 결과를 전송하여 조치를 취함으로써 만약의 사고 발생시 안전모를 착용하지 아니하여 발생할 수 있는 추가적인 인명피해를 미연에 방지한다. 안전모 미착용을 인식하기 위해서는 입력된 영상에서의 오브젝트 추출, 노이즈 제거, 사람/사물 판단, 머리 영역 추출, HSV 색공간을 이용한 안전모 착용 유/무 판단 등의 과정을 거친다. 영상입력 및 영상처리는 DSP를 이용해 처리하고 알고리즘의 속도 개선을 위하여 C언어 기반의 코드를 DSP가 제공하는 고유 함수(Intrinsics)들을 이용하여 최적화 한다.

  • PDF

얼굴 인식과 RFID를 이용한 실시간 인증 시스템 (The Authentication System in Real-Time using Face Recognition and RFID)

  • 지정규
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.263-272
    • /
    • 2008
  • 본 논문은 RFID 보안 시스템에서 2단계 인증 과정을 통하여 RFID시스템의 안정성을 높이는 방법을 제안한다. 제안하는 시스템은 RFID 태그 인증 후 추가적으로 사용자를 인증하기 위하여 카메라를 통하여 입력된 사용자의 이미지 정보에서 특징을 추출 한다. 출입구에서 인증을 위해 먼저 RFID태그를 사용하여 인증하고, 다음으로 카메라를 통하여 획득한 사용자 이미지로부터 특징 정보를 추출하여 시스템에 등록된 사용자 정보와 유사도 비교를 통하여 최종 인증하는 시스템을 제안한다. RFID 시스템에서 사용하는 태그는 2.450Hz 대역의 다양한 주파수를 발진하는 능동형 태그를 사용한다. 또한 사용자 이미지의 특징 정보는 윤곽선 정보와 색상 특징 정보를 이용하여 시스템에 등록된 정보와 일치 하는지 유사도를 비교하여 인증할 수 있도록 하였다.

  • PDF

AWGN 환경에서 쿼드트리 분할을 사용한 변형된 가우시안 필터 알고리즘 (Modified Gaussian Filter Algorithm using Quadtree Segmentation in AWGN Environment)

  • 천봉원;김남호
    • 한국정보통신학회논문지
    • /
    • 제25권9호
    • /
    • pp.1176-1182
    • /
    • 2021
  • 최근 인공지능과 IoT 기술의 발달에 따라 다양한 분야에서 자동화와 무인화가 진행되고 있으며, AI 객체인식의 기반이 되는 영상처리에 대한 중요성이 높아지고 있다. 특히 세밀한 데이터 처리가 필요한 시스템에서는 전처리 단계로 잡음 제거를 사용하고 있으나, 기존 알고리즘은 영상의 잡음 수준을 고려하지 않아 필터링 과정에서 블러링 현상이 나타나는 단점을 가지고 있다. 따라서 본 논문에서는 영상의 잡음 수준을 판단하여 가중치를 결정하는 변형된 가우시안 필터를 제안한다. 제안한 알고리즘은 쿼드트리 분할을 사용하여 영상의 AWGN에 대한 잡음추정치를 구하여 가우시안 가중치와 화소가중치를 정하며, 로컬마스크와 컨벌루션하여 최종출력을 구한다. 제안한 알고리즘을 평가하기 위해 기존 방법과 비교하여 시뮬레이션하였으며, 기존 방법에 비해 우수한 성능을 확인하였다.

유아 상상력을 위한 연상 인터렉티브 놀이 콘텐츠 (Associative Interactive play Contents for Infant Imagination)

  • 장은정;임찬
    • 문화기술의 융합
    • /
    • 제5권1호
    • /
    • pp.371-376
    • /
    • 2019
  • 창조적 사고는 언어로 표현되기 전부터 나타나며, 논리학이나 언어학법칙이 작동하기 전에 감정과 직관, 이미지와 몸의 느낌을 통해 그 존재를 드러낸다. 본 연구에서는 레고 놀이를 이미지 표현 방식으로, 이미지 프로세싱 기법을 중심으로 컴퓨터 비전을 응용한 실험적인 유아 참여형 인터렉티브 콘텐츠를 제시하고자 한다. 특히 유아의 경우 손의 소 근육 발달과 상상력을 실재로 구현하는 것은 매우 중요한 창조의 과정이다. 사물인식으로 대표되는 이미지 프로세싱 기술의 지각변동 속에서 'OpenCV 라이브러리'의 분석 알고리즘과 그것을 'Node'로써 구현한 'VVVV'로 이미지 프로세싱을 진행하고, 웹캠을 이용하여 물체를 촬영하고, 인식하고, 해당 분석에 맞는 결과를 도출해 내어 사용자가 참여함으로 완성되는 인터렉티브 콘텐츠를 제작하는 것을 목표로 한다. 연구를 통해서 아이들이 만든 레고가 어떤 작품인지 알 수 있고, 아이들은 스스로 무언가를 만들며 창의성을 기를 수 있다. 나아가, 더 많은 데이터를 기반으로 다양하고 개성적인 사람의 사고를 유추할 수 있을 것이라 기대한다.