• 제목/요약/키워드: 영역 기반 이미지 검색

검색결과 82건 처리시간 0.021초

시맨틱 웹을 위한 사진 관리 모델 (A Photo Management Model for Semantic Web)

  • 한정환;구용완
    • 한국산업정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.15-20
    • /
    • 2005
  • 웹의 출현이후 웹은 우리 일상의 정보검색 및 오프라인에서 이루어졌던 많은 영역들을 잠식해 가며 우리의 일상으로 다가왔다. 텍스트 기반의 검색에서 시작된 웹은 미디어의 발달에 따라 이미지${\cdot}$음악${\cdot}$영화 등의 멀티미디어 컨텐츠가 웹상에 범람하면서 기존의 텍스트 위주의 패턴매칭 검색방법이 아닌 해당 미디어에 최적화된 검색방법을 요구하게 되었다. 본 논문에서는 멀티미디어 자원에 대한 정보(메타데이터)를 RDF로 변환한 후 실제 멀티미디어 자원과 RDF로 변환된 해당 메타데이터를 각각의 서버에 분리${\cdot}$관리하여 그 자원들이 효율적으로 시맨틱 웹상에서 공유될 수 있도록 하는 모델을 제시하고 구현하였다. 제안된 모델은 모든 멀티미디어 자원에 적용될 수 있지만 설명과 구현의 편의를 위하여 디지털 사진을 예로 적용하였다.

  • PDF

거리 학습과 재서열화를 이용한 방송 콘텐츠에 대한 블로그 포스팅 태깅 (Distance Learning and Re-Ranking based Broadcasting Contents Tagging with Blog Postings)

  • 손정우;김선중;김화숙;조기성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.882-885
    • /
    • 2014
  • 이미지 혹은 영상에 대한 자동 태깅은 해당 콘텐츠에 대한 추가적인 정보를 자동으로 시스템에 제공하는 기술로써 영상 인식, 콘텐츠 매시업, 정보 검색 등 다양한 기술/서비스 분야에서 여러 목적으로 활용되고 있다. 특히, 방송 콘텐츠는 많은 양의 정보를 제한된 영역 및 시간에 축약하여 담고 있기 때문에 영상 처리 기술을 통한 객체 인식이나, 콘텐츠 매시업, 추천 서비스 등의 성능 향상을 위해 자동 혹은 수동 태깅을 통한 정보 제공이 요구된다. 본 논문에서는 블로그를 이용한 프레임 단위의 방송 콘텐츠 태깅 기술을 제안한다. 제안하는 기술은 기존의 콘텐츠 단위의 정보 제공이나, 수동 태깅 된 정보를 제공하는 기술들과 달리, 영상의 각 프레임에 대한 자동 태깅을 목표로 한다. 제안하는 방법은 거리 학습을 통해 영상의 각 프레임이 가지는 특성을 고려한 모델을 구축한 후, 이를 토대로 영상의 프레임들과 블로그의 이미지를 매칭한다. 매칭된 결과를 기반으로 특정 블로그는 영상 내 특정 프레임 구간에 태깅 된다. 제안한 방법은 이미지 매칭 성능을 측정하여 평가하였다. 블로그 이미지에 대해 Top 1 매칭 프레임을 살펴본 결과, 70%의 정확률을 보였다. 소프트 매칭(Top n)의 경우, 최대 90%의 성능을 얻을 수 있음을 실험을 통해 알 수 있었다.

MF sampler: 동영상 기반 패션 검색 모델의 성능 향상을 위한 샘플링 방법 (MF sampler: Sampling method for improving the performance of a video based fashion retrieval model)

  • 백상훈;박종혁
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.329-346
    • /
    • 2022
  • 최근 소셜 미디어의 숏폼(Short form) 동영상(인스타그램, 틱톡, 유튜브) 시장이 점차 증가하면서 인공지능 영역에서는 이를 활용한 연구가 활발히 진행되고 있다. 대표적인 연구분야로 동영상 내의 패션 상품을 탐지하고 상품 이미지를 검색하는 Video to shop 을 들 수 있다. 이와 같은 동영상 기반 인공지능 모델에서는 Convolution 연산을 사용하여 상품의 특징을 추출한다. 하지만 연산 자원의 제한으로 인해, 동영상의 모든 프레임을 사용하여 특징을 추출하는 것은 현실적으로 불가능하다. 이로 인해, 기존 연구에서는 전체 프레임 중 일부만 샘플링해서 사용하거나, 주제의 특성을 활용한 샘플링 방법을 개발하여 이를 통해 위 문제점을 개선하고, 모델의 성능도 향상시켰다. 기존의 Video to shop 연구에서는 프레임을 샘플링 할 때, 무작위로 일부분의 프레임을 샘플링하거나 균등한 간격으로 샘플링 한다. 하지만 이러한 샘플링 방법은 상품이 존재하지 않는 노이즈 프레임을 샘플링 하면서 패션 상품 검색 모델의 성능을 저하시킨다. 이에 본 연구는 노이즈 프레임을 제거하고 검색 모델의 성능을 향상시키는 샘플링 방법 MF(Missing Fashion items on frame) sampler를 제안한다. MF sampler는 키 프레임 메커니즘(Mechanism)을 발전시켜 자원 한계의 문제점을 개선했다. 또한, 노이즈 탐지 모델을 활용한 노이즈 프레임 제거를 통해 검색 모델의 성능을 향상시켰다. 이와 같은 결과는 실험을 통해 확인되었고, Video to shop 패션 상품 검색에 있어 성능 향상과 효과적인 학습이 가능하다는 것을 확인할 수 있었다.

가상 시점 영상 합성을 위한 방향성 고려 홀 채움 방법 (Consider the directional hole filling method for virtual view point synthesis)

  • 문지훈;호요성
    • 스마트미디어저널
    • /
    • 제3권4호
    • /
    • pp.28-34
    • /
    • 2014
  • 최근 깊이 영상 기반 합성 방법을 이용한 가상시점 합성 방법이 3차원 영상의 적용 분야에서 많이 사용되고 있다. 가상 시점 영상은 기존에 알고 있는 영상과 이와 관련된 깊이 영상 정보를 이용하여 카메라로 촬영 하지 않은 가상시점 영상을 생성하게 된다. 하지만 깊이 영상 기반 합성 방법을 이용해 가상시점 영상을 생성할 경우, 깊이 영상을 기반으로 합성하기 때문에 이미지 워핑 과정에서 폐색 영역이 발생하게 된다. 이러한 폐색 영역을 제거하기 위해 지금까지 다양한 홀 채움 방법들이 제안되어 왔다. 동일 색상영역 검색, 수평방향 보간 방법, 수평방향 보외 방법 그리고 다양한 인페인팅 방법들이 홀 채움 방법들로 제안되었다. 하지만 이러한 방법들을 사용하여 텍스쳐 영역의 홀을 제거할 경우 다른 종류의 간섭 현상이 발생하는 문제가 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 다양한 방향성을 고려한 홀 채움 방법을 새롭게 제안하여 확장된 홀 영역을 효율적으로 채우는 방법을 설명한다. 제안된 방법들은 복잡한 텍스쳐들이 있는 배경부분에서 발생하는 홀 영역을 채울 때 성능 효율성을 나타낸다. 방향성을 고려한 홀 채움 방법은 픽셀 단위로 홀 채움 영역 값을 측정하는 과정에서 홀 영역의 주변 텍스쳐 픽셀 값들을 사용하게 된다. 제안한 방법을 이용해 가상시점 영상 합성 결과 발생하는 홀 영역을 기존의 홀 채움 방법보다 보다 더 효율적으로 채울 수 있는 것을 확인할 수 있었다.

모바일 이미지 기반의 문자인식 시스템 (The Character Recognition System of Mobile Camera Based Image)

  • 박영현;이형진;백중환
    • 한국산학기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.1677-1684
    • /
    • 2010
  • 최근 모마일 폰의 발달과 스마트 폰의 보급으로 인해서 많은 콘텐츠들이 개발되어지고 있다. 특히, 모바일 휴대장치에 소형 카메라가 탑재되면서부터 카메라로부터 입력되어지는 영상 기반 콘텐츠 개발은 사람들의 흥미뿐만 아니라 활용 면에서도 중요한 부분을 차지하고 있다. 그중 문자인식 시스템은 시각 장애인 보행 보조 시스템, 로봇 자동 주행 시스템, 비디오 자동 검색 및 색인 시스템, 텍스트 자동 번역 시스템 등과 같은 활용영역에서 매우 광범위하게 쓰일 수 있다. 따라서 본 논문에서는 스마트 폰 카메라로 입력되는 자연 영상에 포함되어 있는 텍스트를 추출 및 인식하고 음성으로 출력해주는 시스템을 제안하였다. 텍스트 영역을 추출하기 위해 Adaboost 알고리즘을 이용하고 추출된 개별 텍스트 후보영역의 문자 인식에는 오류 역전파 신경망을 이용하였다.

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석 (Patent data analysis using clique analysis in a keyword network)

  • 김현;김동건;조진남
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1273-1284
    • /
    • 2016
  • 본 연구에서는 기계 학습 분야의 특허를 수집하여 키워드 네트워크를 구축하고 클릭 분석을 실시하였다. 먼저 텍스트 마이닝 기법을 적용하여 핵심 키워드들을 선정한 다음, 이 키워드를 기반으로 키워드 네트워크를 구축하였다. 다음으로 네트워크 구조 분석, 중요 키워드 분석 및 클릭 분석을 시행하여 2005년도와 2015년도에 출원된 기계 학습 특허의 동향을 파악하였을 뿐만 아니라 양해년도의 분석 결과를 통해 특허 경향을 파악하였다. 분석 결과 기계 학습 특허의 키워드 네트워크는 밀도와 군집 계수가 낮은 것으로 드러났으며 기계 학습 기법 자체에 대한 특허보다는 다양한 응용 영역에서 기계학습을 적용한 특허들이 다수이기 때문으로 판단된다. 클릭 분석 결과 2005년도 클릭 분석에 의해 발견된 주제는 뉴스메이커 검증, 상품 소비 예측, 바이러스 공격 예방, 바이오마커, 그리고 워크플로우 관리였으며, 2015년도 기계 학습 특허 주제는 디지털 이미지 편집, 직불카드, 수신자 인라이닝 시스템, 유방 촬영 시스템, 재고 관리 시스템, 이미지 편집 시스템, 비행기 티켓 가격 예측, 그리고 문제 예측 시스템으로 나타났다. 2005년도에 비하여 2015년도의 근접 중앙성은 낮아지고 매개 중심성은 높아진 것으로 보아 최근의 특허 경향은 보다 다양한 분야에서 출원되고 있으며 이들 간의 연결이 활발해지고 있음을 알 수 있다. 클릭 분석은 클릭을 형성하는 키워드 집합을 해석하여 주제를 파악하는데 활용될 수 있을 뿐만 아니라 추출된 공유 멤버쉽 키워드 집합은 특허 검색 시스템과 같이 키워드 검색 기반의 시스템에서 검색 키워드로 활용될 수 있을 것으로 기대된다.

동질성 문턱 값 기반 영상분할에서 과분할 영역 축소 방법 (A Reduction Method of Over-Segmented Regions at Image Segmentation based on Homogeneity Threshold)

  • 한기태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권1호
    • /
    • pp.55-68
    • /
    • 2012
  • 본 논문에서는 영상의 동질성 문턱 값(Homogeneity Threshold:$H_T$)을 이용한 영상분할방법에서 영상의 과분할 발생을 해결하기 위한 개선된 영상분할 방법을 제안한다. $H_T$을 기반으로 한 영역성장(Region Growth) 알고리듬은 선택된 윈도우의 중심화소만을 사용하기 때문에 과 분할이 발생하였으나, 제안한 방법에서는 선택된 윈도우에 대한 동질성 여부를 조사하여 동질성을 만족할 경우 선택된 윈도우 화소전체를 영역병합에 사용하고 선택 윈도우가 동질성 윈도우를 만족하지 않을 때에는 윈도우의 중심화소를 사용함으로써 영역의 과 분할을 현저하게 줄일 수 있었다. 제안한 방법의 타당성을 보이기 위하여 기존방법과 동일한 영상을 동일한 조건으로 실험하였으며, 그 결과 제안한 방법은 기존 방법에 비해 영역의 개수를 40% 이상 줄이면서도 시각적으로 영상의 품질에 차이가 없음을 볼 수 있었다. 특히 분할된 영역의 크기순으로 결합한 영상을 가지고 비교 했을 때, 기존방법에서는 분할된 영역의 큰 영역으로부터 1,000개 이상의 영역을 결합하여도 어떠한 영상인지 구분하기가 힘들었으나, 제안한 방법에서는 10개 내외의 영역만 결합하여도 어떠한 이미지인지 식별할 수 있음을 확인할 수 있었다. 따라서 제안한 방법은 특정 영상으로부터의 객체 추출이나 정보검색 혹은 해부학이나 생물학 분야의 연구 및 영상 시각화와 애니메이션 등 다양한 분야에서 활용될 수 있을 것으로 기대한다.

임의의 부분 노이즈제거를 지원하는 윤곽선 매칭의 색인 구축 방법 (An Index-Building Method for Boundary Matching that Supports Arbitrary Partial Denoising)

  • 김범수
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1343-1350
    • /
    • 2019
  • 윤곽선 이미지를 시계열로 변환하는 작업은 빠르고 상호작용 방식이 매우 중요한 대용량 이미지 데이터베이스에서도 윤곽선 매칭 수행을 가능 할 수 있게 만든다. 최근 연구에서는 윤곽선 이미지를 시계열 데이터로 변환하여 부분 노이즈제거를 고려하면서 빠르게 매칭을 수행하려는 시도가 있었다. 본 논문에서는 성능 향상을 위해 임의의 노이즈제거를 위해 임의의 모든 노이즈제거 매개 변수를 고려한 색인 구축 방법을 제안한다. 이는 가능한 모든 노이즈제거 매개 변수에 따른 부분 노이즈제거를 고려해야하기 때문에 어려운 문제이다. 본 논문에서는 다차원 색인인 R*-tree를 사용하여 모든 가능한 노이즈제거 매개 변수에 의한 최소 경계 영역(MBR)을 구성하여 효율적인 단일 생성 알고리즘을 제안한다. 다양한 실험 결과, 제안한 색인 기반 매칭 방법은 검색 성능을 최대 46.6 ~ 4023.6 배나 향상시킨다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.

멀티미디어 기술 기반 방송제작 체계

  • 김경수
    • 정보과학회지
    • /
    • 제20권5호
    • /
    • pp.10-16
    • /
    • 2002
  • 디지털 기술의 급속한 발전에 의한 디지털 방송의 도입은 방송환경에 커다란 변혁을 초래하고 있다. 기술의 발전은 방송, 통신, 컴퓨터를 융합시킨 새로운 미디어 서비스를 등장시키고 있으며, 이러한 미디어의 융합은 지금까지 독자적인 영역에서 발전하여 오던 각각의 미디어들이 가지고 있는 한계성 또는 단점을 상호보완적으로 개선함으로써 서비스 능력을 대폭적으로 향상시키는 방향으로 전개되고 있다. 이와같은 디지털 시대의 대변혁은 멀티미디어 서비스를 그 중심축으로 하고 있으며, 이른바 방송통신 융합시대의 경쟁력 있는 서비스를 도입하기 위한 미디어간, 국가간의 경계영역을 초월한 글로벌 경쟁체제가 급속히 진전되어 가고 있다. 이와 같은 미디어의 융합 현상에 따라 제작 환경도 새로운 디지털 방송 서비스를 효율적으로 지원하도록 전환되어야 한다. 디지털 방송의 특징인 고품질 및 다채널 시대를 맞아 방송 콘텐츠의 재활용도를 높이는 것은 매우 중요하며, 데이터 방송, 인터넷 방송 등 다양한 기능의 서비스를 도입하기 위해선 제작 체계의 개선이 뒷받침되어야 한다. 따라서 본 논문에서는 새로운 제작 환경에 대해서 살펴보고자 한다. 특히, 컴퓨터 기반의 제작 환경 구축에 핵심 요소인 넌리니어 편집시스템과 방송 콘텐츠를 효율적으로 관리하고 재활용할 수 있는 디지털 아카이브에 대해 소개하고자 한다. 테이프 대신 하드디스크를 기록 매체로 하는 넌리니어(non-linear) 시스템의 등장에 따라 방송 프로그램 제작에 대한 새로운 개념의 정립이 필요하게 되었으며, 이를 근간으로 하는 새로운 프로그램 제작환경, 즉 네트워크에 의해 컴퓨터와 데이터베이스를 연결하여 제작으로부터 송출가지 통합관리가 가능한 새로운 방송 프로그램 제작환경, 이른바 멀티미디어 제작환경을 구축하는 것이 디지털 방송 시대의 방송 사업자에게 가장 중요한 과제중의 하나가 되었다. 멀티미디어 제작환경을 구축함으로써 영상, 음성 및 다양한 부가 데이터를 포함하는 멀티미디어 프로그램을 편리하게 제작할 수 있으며, 데이터베이스로부터 필요한 영상 이미지를 자유롭게 합성, 조작하는 등, 매우 다양하고 편리한 제작기법을 활용할 수 있다. 또한 멀티미디어를 응용한 제작 분야로서 컴퓨터 그래픽스 기술은 방송의 사전제작에 커다란 기여를 하고 있으며, 이미 선거방송을 비롯한 여러가지 프로그램은 가상스튜디오와 가상캐릭터 기술을 활용하여 제작하고 있다. 방송사업자는 이러한 멀티미디어 제작시스템을 근간으로 영상검색, 영상 합성, 스크립트 편집, 가상현실 응용 등 고도의 제작 기법을 활용함으로써 사용자 친화성, 다이나믹한 표현, 실시간, 대화성을 특징으로 하는 다양한 멀티미디어 서비스를 시청자에게 제공할 수 있을 것이다.