• 제목/요약/키워드: Extraction of Object

검색결과 843건 처리시간 0.028초

좌표계산을 통해 동영상의 안면 특징점 분석을 중심으로 한 웹 기반 발표 태도 교정 프로그램 개발 (Development of a Web-based Presentation Attitude Correction Program Centered on Analyzing Facial Features of Videos through Coordinate Calculation)

  • 권기현;안수호;박찬정
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.10-21
    • /
    • 2022
  • 학생들의 취업을 위한 면접 발표와 회사에서의 프로젝트 결과 발표 등과 같은 형식적인 발표 태도가 개선되려면 동료나 교수자의 관찰에 의한 방법 이외에 자동화된 방법은 드물다. 기존 연구에 따르면, 발표자의 안정적인 발화와 시선 처리가 발표에서의 전달력에 영향을 미친다고 한다. 또한, 본인 발표에 대한 적절한 피드백이 발표자의 발표 역량을 늘이는 효과가 있다는 연구도 있다. 본 연구에서는 이와 같은 교정의 긍정적 측면을 고려하여 대학생들의 잘못된 발표 습관과 태도를 동영상의 안면 분석을 통해 지능적으로 교정해 주는 프로그램을 개발하고 성능을 분석하였다. 개발하는 프로그램은 웹 기반으로 군말 사용 여부를 확인하고 안면 인식과 발표 내용 텍스트화를 통해 개발되었다. 이를 위해 군말 분류 인공지능 모델을 개발하였고, 동영상 객체 추출 후, 좌표에 기반으로 얼굴 특징점을 인식하였다. 이후 4,000개 안면 데이터를 이용해 Teachable Machine에서 안면 인식한 경우와 본 연구의 알고리즘 성능을 비교·분석하였다. 프로그램을 이용해 발표 태도를 자기스스로 교정하여 발표자들에게 도움을 준다.

선형모델을 이용한 방향성 조명하의 얼굴영상 정규화 (Normalization of Face Images Subject to Directional Illumination using Linear Model)

  • 고재필;김은주;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 얼굴인식은 외관기반(appearance-based) 매칭기법으로 풀어야 할 문제 중의 하나이다. 그러나, 얼굴영상의 외관은 조명 변화에 매우 민감하다. 얼굴인식 성능을 향상시키기 위해서는 다양한 조명 아래에서 다양한 학습 데이타를 수집해야 하나, 실제로는 데이타 수집이 용이하지 않다. 따라서, 성능향상을 위해서 다양한 데이타를 학습시키는 것 보다 다양한 조건의 데이타를 정규화 하는 기법에 주목하는 것이 바람직하다. 본 논문에서는 방향성 조명 아래에서 취득한 얼굴영상을 정규화 할 수 있는 간단한 방법을 제안한다. 조명 문제는 얼굴인식 시스템에서 오류를 일으키는 가장 중요한 요인중 하나이다. 제안하는 방법을 ICR(illumination Compensation based on Multiple Linear Regression)이라 명명하였다. 본 방법에서는 다중회귀분석 모델을 사용하여 얼굴영상의 화소 밝기 갈 분포에 가장 잘 맞는 평면을 찾은 후 이 평면을 이용하여 얼굴영상을 정규화 한다. 제안하는 방법의 장점은 간단하고 실용적이며, 얼굴영상의 밝기 값 분포에 대한 평면 근사가 선형모델에 의해 수학적으로 정의된다는 점이다. 얼굴인식에서 제안하는 방법의 성능 향상을 보여주기 위해 공개 및 자체 구축 데이타 베이스에 대한 실험 결과를 제시한다. 실험 결과 두드러진 얼굴인식 성능 향상을 보여주었다.

통합 산림관리를 위한 협력요인 추출 및 협력프로그램 개발 - 동해안 및 지리산권역 산불관리센터의 사례를 중심으로 - (Extraction of Cooperation Factors and Development of Cooperation Program for Unified Cooperative Forest Management - A Case Study of the East Coast & Mt. Jiri Sphere Forest Fire Administration Center -)

  • 김의경;김성주;김현근;김대현
    • 한국산림과학회지
    • /
    • 제96권6호
    • /
    • pp.684-692
    • /
    • 2007
  • 이 연구의 목적은 통합적 산불관리에 있어서 협력을 형성 촉진시키는 요인을 구명하고, 이를 통해 효율적 산림관리를 위한 협력프로세스 및 협력 매뉴얼을 제시하는데 있다. 이를 위해 행정구역 단위를 초월하여 협력함으로써 큰 성과를 거둔 "동해안 산불관리센터"와 "지리산권역 산불관리센터"를 모델로 하여 각 단계별 협력요인을 추출하였다. 즉, 협력의 단계를 발의 계획 집행 이익의 공유 4단계로 나누고 통합 산림관리체계를 위한 각 단계별 협력요인을 추출하기 위해 심층면접 및 설문조사를 실시하였으며, AHP분석을 사용하여 중요도 순에 따른 핵심 4요인을 단계별로 추출하였다. 최종적으로 각 단계별 핵심 4요인을 바탕으로 산림협력 사업에 적용할 수 있는 협력 프로세스 및 매뉴얼을 개발하였다. 이는 지자체간의 협력을 통한 제반 산림관리를 성공적으로 추진하는데 있어 하나의 가이드라인이 될 수 있을 것이다.

추천시스템을 위한 복합지식저장소 설계 (Design of Compound Knowledge Repository for Recommendation System)

  • 한정수;김귀정
    • 디지털융복합연구
    • /
    • 제10권11호
    • /
    • pp.427-432
    • /
    • 2012
  • 본 연구는 복합저장소 구축 방법과 복합지식 프로세스 개발을 위한 기술적 방법을 제안하였다. 본 연구에서 제안한 복합지식 저장소에 저장되는 데이터 대상은 복합지식 메타데이터와 디지털 자원 모두를 포함하며, 사용목적에 따라 사용자 역할, 기능적 요소, 서비스 범주로 나눌 수 있다. 이 세 가지 요소는 저장소의 추상적 모델을 설명하는 기본적인 구성요소이다. 본 연구에서는 복합지식의 메타데이터를 2가지 요소로 구분하여 정의하였다. Component는 지식을 사용하고 생성하는 주체나 활동단위, 리소스 자체 등에 대한 속성을 나타내고, Context는 지식객체가 포함되어 있는 맥락을 나타낸다. 복합지식 프로세스 Agent는 복합지식의 분류와 등록, 검색, 패턴 정보 관리 등의 역할을 수행하고 복합지식 저장소와 사용자 사이의 데이터 흐름과 처리를 담당한다. 복합지식 프로세스 Agent는 데이터의 검색과 추출, 분산 환경에서 데이터 교환을 위한 데이터의 수집과 출력, 저장된 데이터의 추가, 변경 등이 발생한 것을 알려주는 경고, 데이터의 저장과 등록, 메타데이터 조회 후 원하는 물리적 자료를 요청하는 요청과 전달 등의 기능으로 구성하였다. 본 연구에서 개발하고자하는 추천시스템을 위한 복합지식저장소 구축은 산업 현장에서 적시에 다양한 콘텐츠를 사용자에게 제시함으로서 일과 학습이 동시에 일어날 수 있도록 하여 시의적절한 지식을 실시간 가시화함으로써 학습 생산성을 증대하는데 도움을 줄 수 있다.

다중 공간정보 데이터의 점진적 조합에 의한 의미적 분류 딥러닝 모델 학습 성능 분석 (Training Performance Analysis of Semantic Segmentation Deep Learning Model by Progressive Combining Multi-modal Spatial Information Datasets)

  • 이대건;신영하;이동천
    • 한국측량학회지
    • /
    • 제40권2호
    • /
    • pp.91-108
    • /
    • 2022
  • 대부분의 경우 광학 RGB 영상을 딥러닝(DL: Deep learning)의 학습 데이터로 사용하여 객체탐지, 인식, 식별, 분류, 의미적 분할 및 객체 분할 등을 수행하지만, 실세계의 3차원 객체들을 2차원 영상으로 완전하게 파악하는 것은 한계가 있다. 그러므로 대표적인 3차원 지형 공간정보인 수치표면모델(DSM: Digital Surface Model)과 더불어 DSM에 내재된 특성정보를 이용하여 3차원 지형지물을 분석하는 것이 효과적이다. 건물과 같이 기하학적으로 정형화된 형태의 인공구조물은 3차원 공간데이터로부터 얻을 수 있는 기하학적 요소와 특성을 이용하여 객체의 분류와 형상 묘사가 가능하다. 이 연구는 고차원 시각정보(high-level visual information) 시스템에서 중요한 역할을 하는 내재된 고유의 특성정보(intrinsic information)를 기반으로 하며, 이를 위하여 객체의 기하학적 요소인 경사와 주향을 DSM으로부터 도출하고, 다방향에서 생성한 음영기복영상(SRI: Shaded Relief Image)과 함께 DL 모델의 학습 수행에 사용하였다. 실험은 ISPRS (International Society for Photogrammetry and Remote Sensing)에서 제공하는 데이터 셋 중에서 DSM과 레이블 데이터를 객체의 의미적 분류를 위해 개발된 합성곱 기반의 SegNet 학습에 사용하였다. 지형지물을 분류하고 분류 결과를 이용하여 건물을 추출하였다. 특히 DL 모델의 학습 성능 향상을 위해 학습 데이터의 여러 조합에 따른 시너지 효과를 분석하는 것에 핵심이다. 제안한 방법은 건물 분류와 추출에 효과적임을 보여주고 있다.

대용량 고해상 위성영상처리 시스템 개발 (Development of an Image Processing System for the Large Size High Resolution Satellite Images)

  • 김경옥;양영규;안충현
    • 대한원격탐사학회지
    • /
    • 제14권4호
    • /
    • pp.376-391
    • /
    • 1998
  • 위성의 발달에 따라 고해상영상이 등장하게 되었고 지표상태 분석에 매우 유용하게 되었다. GeoWatch는 지능형 영상처리 시스템으로서, 고해상도 영상을 이용하여 디지타이징, 지리보정, 강조, 여러 가지 연산, 식생지수 분석, 등을 하여 지표면 분석 등을 할 수 있는 시스템이다. 도한 지능형 분석 방법등 여러 가지 기법을 이용하여 변화지역분석, 토지 분류, 도시정보추출 등을 수행한다. 이 시스템의 강점은 full scene 영상같은 대용량 영상을 다룰 경우 역동적인 알고리즘 저장 방식을 채택하였고, 자동메뉴 생성, 사용자 편의를 위한 비쥬얼 프로그래밍 환경 등을 제공한다. 이 시스템은 또한 위성영상 위에 벡터를 중첩하여 분석하거나 수정 작업을 할 수 있고, 3차원 비행 시뮬레이션도 가능하다. 이 시스템은 영상 처리 모듈 외에도 영상 변환 및 수정 유틸리티 기능을 많이 제공한다. 본 논문에서는 또한 지능형 영상 분석 방법 뿐만 아니라, 대용량처리나, 비쥬얼 프로그램을 위한 디자인 개념을 제공한다.

딥러닝 모델을 이용한 항공정사영상의 비닐하우스 탐지 (Detection of Plastic Greenhouses by Using Deep Learning Model for Aerial Orthoimages)

  • 윤병현;성선경;최재완
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.183-192
    • /
    • 2023
  • 위성영상 및 항공사진과 같은 원격탐사 자료들은 영상판독과 영상처리 기법을 통하여 영상 내의 객체를 탐지하고 추출하는 데에 사용될 수 있다. 특히, 원격탐사 자료의 해상도가 향상되고, 딥러닝(deep learning) 모델 등과 같은 기술의 발전으로 인하여 관심객체를 자동으로 추출하여 지도갱신 및 지형 모니터링 등에 활용될 수 있는 가능성이 증대되고 있다. 이를 위해, 본 연구에서는 의미론적 분할에 사용되는 대표적인 딥러닝 모델인 fully convolutional densely connected convolutional network (FC-DenseNet)을 기반으로 하여 항공정사영상 내 존재하는 비닐하우스를 추출하고, 이에 대한 결과를 정량적으로 평가하였다. 농림축산식품부의 팜맵(farm map)을 이용하여 담양, 밀양지역의 비닐하우스에 대한 레이블링을 수행하여 훈련자료를 생성하고, 훈련자료를 이용하여 FC-DenseNet의 훈련을 수행하였다. 원격탐사자료에 딥러닝 모델을 효과적으로 이용하기 위하여, 각 밴드별 특성이 유지되도록 instance norm을 이용하여 정규화과정을 수행하였으며, attention module을 추가하여 각 밴드별 가중치를 효과적으로 산정하였다. 실험결과, 딥러닝 모델을 이용하여 영상 내 존재하는 비닐하우스 지역을 효과적으로 추출할 수 있음을 확인하였으며 팜맵, 토지피복지도 등의 갱신에 활용될 수 있을 것으로 판단하였다.

영상 기반 3차원 점군과 FUSION S/W 기반의 임분고 분석 모듈 개발 (Development of Mean Stand Height Module Using Image-Based Point Cloud and FUSION S/W)

  • 김경민
    • 한국지리정보학회지
    • /
    • 제19권4호
    • /
    • pp.169-185
    • /
    • 2016
  • 최근 임상도의 신규 속성으로 임분의 평균 수고인 임분고를 추가하기 시작하였으나 전국 940만개의 포인트를 스테레오 항공사진에서 수동 측정해야 하는 어려움이 예상된다. 아울러, 항공사진에서 수고 측정 시 임연부나 묘지 주변의 수고를 측정하기 쉬워 임분 대표성이 떨어지는 한계를 가지고 있다. 본 연구에서는 고해상도 스테레오 항공사진에서 추출한 영상 기반 3차원 점군과 FUSION S/W를 활용한 임분고 추정 방법을 제안하고 임분고를 자동 분석할 수 있는 모듈을 개발하였다. 스테레오 항공사진에서 수치표면모델 3차원 점군을 추출한 후 지면점 필터링을 거쳐 수치지면모델을 추출하고 이 두 모델을 차분하여 정규수치표면모델을 제작하였다. 정규수치표면모델에서 표본점별 개체목 수관을 육안판독한 후 수관별 최고점을 추출하여 정규수치표면모델 수고를 산출하였다. 표본점에서의 실측 수고와 정규수치표면모델 수고의 RMSE를 분석한 결과 전체 표본점 평균 수고의 RMSE는 0.96m로 나타났다. 대상지 전체의 개체목 수고를 추출하기 위해 FUSION S/W를 이용하여 항공사진의 정규수치표면모델에서 개체목 수고를 자동 추출하고 이를 임상도의 임분 폴리곤 단위로 평균하여 최종 임분고를 산출하였다. 마지막으로 임분고를 보다 손쉽게 분석할 수 있는 환경을 구현하기 위해 임분고 분석 프로세스를 ArcGIS add-in 모듈 형태로 자동화하였다.

딥러닝 SW 기술을 이용한 임베디드형 융합 CCTV 카메라 (Convergence CCTV camera embedded with Deep Learning SW technology)

  • 손경식;김종원;임재현
    • 한국융합학회논문지
    • /
    • 제10권1호
    • /
    • pp.103-113
    • /
    • 2019
  • 차량 번호판 인식 카메라는 차량 번호판 내 문자와 숫자의 인식을 위하여 대상 차량의 이미지 취득을 목적으로 하는 전용 카메라를 말하며 대부분 단독 사용보다는 서버와 영상 분석 모듈과 결합된 시스템의 일부로 적용된다. 그러나 차량 번호판 인식을 위한 시스템 구축을 위해서는 취득 영상 관리 및 분석 지원을 위한 서버와 문자, 숫자의 추출 및 인식을 위한 영상 분석 모듈을 함께 구성하여야 하므로 구축을 위한 설비가 필요하고 초기 비용이 많이 든다는 문제점이 있다. 이에 본 연구에서는 카메라의 기능을 차량 번호판 인식에만 한정하지 않고 방범 기능을 함께 수행할 수 있도록 확장하고 카메라 단독으로도 두가지 기능 수행이 가능한 Edge Base의 임베디드형 융합 카메라를 개발한다. 임베디드형 융합 카메라는 선명한 영상 취득 및 빠른 데이터 전송을 위해 고해상도 4K IP 카메라를 탑재하고 오픈소스 신경망 알고리즘 기반의 다중 객체 인식을 위한 딥러닝 SW인 YOLO를 적용하여 차량 번호판 영역을 추출한 후 차량 번호판 내의 문자와 숫자를 검출하고 검출 정확도와 인식 정확도를 검증하여 CCTV 방범 기능과 차량 번호 인식 기능이 가능한지를 확인 하였다.

얼굴인식의 향상을 위한 스테레오 영상기반의 3차원 정보를 이용한 인식 (Recognition method using stereo images-based 3D information for improvement of face recognition)

  • 박장한;백준기
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.30-38
    • /
    • 2006
  • 본 논문에서는 스테레오 얼굴영상으로부터 3차원 정보인 거리와 깊이 정보를 이용해 거리에 따라 얼굴인식률이 떨어지는 것을 개선하였다. 단안 영상은 객체의 거리, 크기, 이동, 회전, 깊이 등의 불확실한 정보로 인해 인식률이 떨어지는 문제점이 있다. 또한 얼굴의 회전, 조명, 표정변화 등의 영상정보가 취득되지 않으면 인식률이 매우 저하되는 단점이 있다. 그래서 본 연구는 이와 같은 문제점을 해결하고자 한다. 제안된 방법은 눈 검출 알고리듬, 얼굴의 회전 방향분석, PCA(Principal Component Analysis)로 구성된다. 또한 제한된 영역에서 얼굴을 고속으로 검출하기 위해 RGB컬러공간에서 YCbCr공간으로 변환한다. 얼굴후보 영역에서 다층 상대적인 밝기 맵을 생성하여 얼굴의 기하학적인 구조로부터 얼굴인지를 판별한다. 스테레오 얼굴영상으로부터 거리 및 눈과 입의 깊이 정보를 취득하고, 거리에 따라 확대, 축소, 이동, 회전 등의 정규화를 통해 $92{\times}112$ 크기의 얼굴을 검출한다. 검출된 왼쪽 얼굴영상과 추정된 방향의 차를 PCA로 학습한다. 제안된 방법은 정면에서 최대 95.8%(100cm), 포즈변화에 따라 98.3%의 인식률을 얻을 수 있었다. 따라서 실험을 통하여 제안된 방법은 거리에 따라 확대, 축소와 회전 등의 정확한 정규화로 높은 인식률을 얻을 수 있음을 보였다.