• 제목/요약/키워드: 객체사전

검색결과 194건 처리시간 0.027초

객체 추출 및 객체별 그룹핑을 이용한 영상검색 결과의 단계적 서비스 방안 (A Scheme for Progressive Service of Retrieved Images based on Object Extraction and Grouping)

  • 박창민;김성영;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.180-185
    • /
    • 2002
  • 본 논문에서는 키워드를 입력해 검색된 영상들을 유사한 특징을 갖는 소수의 그룹으로 그룹핑하고 각 그룹을 대표하는 대표영상을 추출하여 우선적으로 사용자에게 보여주고 필요에 따라 나머지 영상들을 단계적으로 서비스할 수 있는 방안을 제시한다. 영상 그룹핑을 위한 각 영상의 특징은 영상에 포함된 중심 객체를 사용하여 추출한다. 이를 위해 검색 키워드는 객체와 연관성이 있는 단어로 제한하여 영상을 검색하며 검색된 영상으로부터 중심 객체를 추출할 수 있는 객체 추출 방법을 활용하였다. 각 영상으로부터 추출된 중심 객체에 대한 특징 벡터는 칼라 분포를 이용한다. 영상 그룹핑은 칼라분포로 표현되는 특징공간에서의 밀집도를 조사하여 높은 밀도로 모여있는 영역별로 추출하여 동일한 그룹으로 분류하였다. 대표 영상은 분류된 그룹에서 가장 밀집도가 높은 영상으로 선택된다. 한편, 얼굴이 포함된 영상은 사전에 따로 분류하고 얼굴 크기 및 얼굴 수에 따라 영상을 그룹핑하여 각 그룹에 대한 대표 영상을 선정한다. 본 연구에서 제안한 방법은 사용자에게 모든 검색 결과를 일괄적으로 보여주는 것에 비해 보다 빠른 시간 내에 사용자가 원하는 영상을 편리하면서도 효과적으로 확인할 수 있는 방법을 제공해 줄 수 있을 것으로 기대한다.

  • PDF

객체들 간의 상호 가치 균형을 위한 플랫폼 설계 (Design a Platform for Balancing Mutual Values between Objects)

  • 김봉한
    • 디지털융복합연구
    • /
    • 제15권9호
    • /
    • pp.241-248
    • /
    • 2017
  • 게임 프로젝트를 진행하는 과정에는 그래픽 해상도의 변경, 배경음악 및 음향의 수정, 소스 코드의 오류 등 다양한 문제점이 발생한다. 특히 각 객체가 가지고 있는 속성에 대한 가치 균형을 테스트하는 과정에서도 많은 문제가 발생한다. 이것은 곧 개발 비용의 증가와 개발 시간의 지연이라는 문제점을 발생시킨다. 따라서 각 객체의 상호 가치 균형을 사전에 테스트할 수 있는 도구나 시뮬레이터가 있다면 이러한 문제점을 해결할 수 있다. 그러나 현재 이러한 객체 간 상호 가치균형을 분석하고 평가할 수 있는 시뮬레이터, 도구, 플랫폼 등이 미비한 실정이다. 본 논문에서는 이러한 시뮬레이션 게임개발 과정에서 객체간의 상호 가치 균형을 좀 더 빠르고 능동적으로 상호 가치 균형을 분석하고 평가할 수 있는 플랫폼을 설계하고자 한다. 설계된 모의전투기반의 상호 가치 균형 플랫폼은 사전에 각 객체의 공격력과 방어력에 따른 능력치를 테스트하고 평가함으로서 개발 비용의 감소와 개발 시간의 단축을 기할 수 있을 것으로 판단된다.

교통사고의 사전 예측 방법 연구 (A Study on Early Prediction Method of Traffic Accidents)

  • 김인첩;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.441-442
    • /
    • 2022
  • 교통사고 예측은 차량의 블랙박스 동영상을 통해 사고 발생을 최대한 빨리 예측하는 것을 목표로 한다. 이는 안전한 자율주행 시스템을 보장하는 데 중요한 역할을 한다. 다양한 교통 상황과 카메라의 제한된 시야로 인해 프레임에서 사고 가능성을 조기에 관찰하는 것은 어려운 도전이다. 예측의 핵심 기술은 객체의 시공간 관계를 학습하는 것이다. 본 논문에서는 블랙박스 동영상에서 사고 예측을 위한 계산 모델을 제안한다. 이것을 사용하여 사고 예방을 강화한다. 이 모델은 사고 위험에 대한 운전자의 시각적 인식에서 영감을 받았다. 객체 탐지기는 동영상 프레임에서 다양한 객체를 탐지한다. 탐지한 객체는 노드 생성기와 특징 추출기 동시에 통과한다. 노드 생성기에서 생성한 노드는 GCN 실행기를 사용한다. GCN 실행기는 각 프레임에 대한 객체의 3D 위치 관계를 계산한 후 공간 특징을 취득한다. 동시에 공간 특징과 특징 추출기에서 얻은 객체의 특징은 GRU 실행기로 보내진다. GRU 실행기 안에 시공간 특징을 암기하고 분석하여 교통사고 확률을 예측한다.

객체 추적을 통한 이상 행동 감시 시스템 연구 (A Study on Monitoring System for an Abnormal Behaviors by Object's Tracking)

  • 박화진
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권4호
    • /
    • pp.589-596
    • /
    • 2013
  • 사회의 범죄율 증가와 더불어 지능형 보안 시스템강화에 대한 관심이 높아지고 있다. 이에 본 연구에서는 CCTV에 획득되는 영상으로부터 객체의 이상 행동을 감지하는 시스템을 제안한다. 배경영상과의 차연산 및 모폴로지를 통해 객체를 검출하고 객체의 특징 정보를 이용해 각각의 객체를 인식하여 추적하여 이를 통해 이상행동을 탐지한다. 객체가 영상 내에서 일정시간 이상을 배회했을 때 이를 이상행동으로 판단하여 사전에 관제센터에 알려 미연에 방지할 수 있도록 한다. 특히 본 연구는 이상 행동 중 객체의 배회행위를 감지하는 것을 목표로 하며 영상 내에서 사라진 객체가 다시 영상 내로 들어 왔을 때의 이전 객체와의 동일여부를 판단할 수 있도록 하였다.

UV-map 기반의 신경망 학습을 이용한 조립 설명서에서의 부품의 자세 추정 (UV Mapping Based Pose Estimation of Furniture Parts in Assembly Manuals)

  • 강이삭;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.667-670
    • /
    • 2020
  • 최근에는 증강현실, 로봇공학 등의 분야에서 객체의 위치 검출 이외에도, 객체의 자세에 대한 추정이 요구되고 있다. 객체의 자세 정보가 포함된 데이터셋은 위치 정보만 포함된 데이터셋에 비하여 상대적으로 매우 적기 때문에 인공 신경망 구조를 활용하기 어려운 측면이 있으나, 최근에 들어서는 기계학습 기반의 자세 추정 알고리즘들이 여럿 등장하고 있다. 본 논문에서는 이 가운데 Dense 6d Pose Object detector (DPOD) [11]의 구조를 기반으로 하여 가구의 조립 설명서에 그려진 가구 부품들의 자세를 추정하고자 한다. DPOD [11]는 입력으로 RGB 영상을 받으며, 해당 영상에서 자세를 추정하고자 하는 객체의 영역에 해당하는 픽셀들을 추정하고, 객체의 영역에 해당되는 각 픽셀에서 해당 객체의 3D 모델의 UV map 값을 추정한다. 이렇게 픽셀 개수만큼의 2D - 3D 대응이 생성된 이후에는, RANSAC과 PnP 알고리즘을 통해 RGB 영상에서의 객체와 객체의 3D 모델 간의 변환 관계 행렬이 구해지게 된다. 본 논문에서는 사전에 정해진 24개의 자세 후보들을 기반으로 가구 부품의 3D 모델을 2D에 투영한 RGB 영상들로 인공 신경망을 학습하였으며, 평가 시에는 실제 조립 설명서에서의 가구 부품의 자세를 추정하였다. 실험 결과 IKEA의 Stefan 의자 조립 설명서에 대하여 100%의 ADD score를 얻었으며, 추정 자세가 자세 후보군 중 정답 자세에 가장 근접한 경우를 정답으로 평가했을 때 100%의 정답률을 얻었다. 제안하는 신경망을 사용하였을 때, 가구 조립 설명서에서 가구 부품의 위치를 찾는 객체 검출기(object detection network)와, 각 개체의 종류를 구분하는 객체 리트리벌 네트워크(retrieval network)를 함께 사용하여 최종적으로 가구 부품의 자세를 추정할 수 있다.

  • PDF

원격 분산 환경에서의 소프트웨어 개발을 위한 통합 정보 객체 관리 (An Integrated Information Object Management for Distributed Software Development)

  • 한관희
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.427-434
    • /
    • 2002
  • 원격 분산 환경에서의 효과적인 소프트웨어 개발 관리를 위해서는 각종 정보 객체들을 체계적으로 분류하고 정보 객체들 간의 연관 관계를 구조적으로 정립하여 통합 관리하는 기능이 가장 기본이 된다고 할 수 있다. 본 논문에서는 통합 정보 객체 관리를 위해 첫째, 분산 소프트웨어 개발에 필요한 각종 정보 객체들의 구조 및 관계를 통합관리하는 틀로서 BOC(Bill Of Class)를 제안하며 BOC를 이용한 정보 객체 관리 시스템의 구조와 기능을 제시한다. 둘째, BOC 구조내의 부품을 구성하고 있는 데이터들을 표준화하여, 파트 사전을 구성하여 프로그램 작성시 표준 파트(데이터)만을 사용하게 함으로써 개발 생산성과 유지 보수 생산성을 향상시키는 방안을 제시한다. 셋째, 제시한 정보 객체 관리 구조를 활용하여 분산 환경에서의 효과적인 소프트웨어 개발을 지원하는 통합 정보 객체 관리 시스템을 설계 및 구현하고 이의 유용성을 보인다.

의사결정 트리를 이용한 한글 자막 추출 (Korean Caption Extraction with Decision Tree)

  • 정제희;이승훈;김재광;이지형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.527-532
    • /
    • 2008
  • 자막은 영상과 관련이 있는 정보를 포함한다. 이러한 영상의 정보를 이용하기 위해서 자막을 추출하는 연구가 진행되고 있다. 기존의 자막 추출 연구는 언어 독립적인 특징으로 자막을 이루는 획의 에지는 일정한 간격을 유지하거나 수평라인으로 존재하는 글자의 분포를 이용한 방법을 제안하였다. 이러한 방법들은 획의 간격이 일정한 자막이나 하나의 글자가 하나의 획으로 이루어진 글자에서만 정상적인 동작을 보장하였다. 본 논문에서는 한글 자막 특징을 고려한 자막 추출 방법을 제안한다. 먼저, 한글 자막의 특징인 가로 획의 다수 분포를 고려한 적응형 에지 이진화를 수행하여 에지 영상을 생성하고 에지 연결 객체를 생성한다. 그 후에 생성한 연결 객체를 특징을 추출하여 사전에 생성한 의사결정 트리로 연결 객체를 자막과 비자막 연결객체로 분류한다. 의사결정 트리를 생성하기 위해서 사용한 연결 객체는 뉴스, 다큐멘터리 프로그램에서 획득하였으며, 성능 평가를 위해서 뉴스, 다큐멘터리, 스포츠 프로그램과 같은 대중 방송에서 획득한 영상에서 자막을 추출하였다. 평가 방법은 찾아진 연결 객체 중에 자막 연결 객체의 비율과 전체 자막 중에서 찾아진 자막 연결 객체의 비율로 분석하였다. 실험 결과에서는 제안한 방법이 한글 자막의 추출에 적용 가능함을 보여준다.

  • PDF

특이 칼라에 기반한 칼라 영상에서의 중심 객체 추출 (Extraction of a Central Object in a Color Image Based on Significant Colors)

  • SungYoung Kim;Eunkyung Lim;MinHwan Kim
    • 한국멀티미디어학회논문지
    • /
    • 제7권5호
    • /
    • pp.648-657
    • /
    • 2004
  • 본 논문에서는 특이 칼라 분포에 대한 정보를 활용함으로써 어떠한 사전 지식없이 칼라 영상으로부터 중심 객체를 추출하는 방법에 대해 제안한다. 중심 객체는 영상 중심 부근에 위치하면서 특이 칼라 분포를 갖는 영역들의 집합으로 정의한다. 특이 칼라는 영상 경계 주변에 비해 영상의 중심 위치에서 보다 높은 밀도로 존재하는 칼라로 정의한다. 중심 객체 추출을 위해 우선 특이 칼라 정보를 사용하여 영상 분할된 영역 중에서 객체의 특징을 대표하는 영역들의 집합을 핵심객체영역을 선택한다. 핵심객체영역에 인접하며 이와 높은 칼라 유사도를 갖고 또한 배경이 아닌 영역들을 반복적으로 핵심객체영역에 병합하여 핵심객체영역을 확장함으로써 생성된 최종 병합 결과를 중심 객체로 추출한다. 따라서 중심 객체는 상이한 칼라 특징을 갖는 영역으로 구성될 수 있으며 상호 연결되어 있을 경우에는 두개 이상의 객체가 중심 객체에 포함될 수 있다. 제안된 방법의 타당성 및 중요 칼라의 유용성은 다양한 실험 영상을 통해 확인하였다. 본 논문에서 제안된 방법으로 추출된 중심 객체는 영상 검색 응용 분야에 유용하게 사용될 수 있을 것으로 기대한다.

  • PDF

이미지 개체 표현을 위한 논리적 프레임워크 (A Logical Framework for Image Object Representation)

  • 최준호;김성석;최창;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.197-200
    • /
    • 2005
  • 의미 기반 영상 검색은 Color, Texture, Region 정보, Spatial Color Distribution 등의 저차원 특징 정보와 이미지 데이터에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드나 시소러스와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 따라서 본 논문에서는 WordNet 어휘 사전을 확장한 개념적 어휘 체계를 갖는 대형 Ontology를 기반으로 하여 이미지 데이터 내의 객체 인식과 추출된 객체간의 관계를 정의하여 이를 논리적으로 표현할 수 있는 방법을 제시하고자 한다.

  • PDF

VL-KE-T5: 한국어와 영어로 구성된 영상-언어 병렬 데이터를 이용한 대조학습 기반 사전학습모델 구축 (VL-KE-T5: A contrastive learning-based pre-trained model using image-language parallel data composed of Korean and English)

  • 김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.337-342
    • /
    • 2022
  • 본 논문은 한국어-영어 기반 영상-언어 모델인 VL-KE-T5를 소개한다. VL-KE-T5는 영상-텍스트 쌍으로 구성된 한국어와 영어 데이터 약 2천 3백만개를 이용하여 영상-언어 모델의 임베딩 벡터들을 정렬시킨 사전학습모델이며, 미세조정을 통하여 여러 영상-언어 작업에 활용할 할 수 있다. VL-KE-T5는 텍스트 기반 영상 검색 작업에서 높은 성능을 보였으나, 세세한 속성을 가진 여러 객체들의 나열이나 객체 간 관계를 포함한 텍스트 기반 영상 검색에서는 비교적 낮은 성능을 보였다.

  • PDF