• 제목/요약/키워드: image indexing

검색결과 204건 처리시간 0.022초

동영상과 수치지도의 결합에 관한 연구 (Integrating Video Image into Digital Map)

  • 김용일;편무욱
    • 대한공간정보학회지
    • /
    • 제4권2호
    • /
    • pp.161-172
    • /
    • 1996
  • 본 연구는 동영상과 수치지도를 결합하는 기법 및 공정의 개발을 그 목적으로 한다. 이를 위해 본 연구에서는 동영상을 GIS에 도입하는 과정에서 필요한 동영상의 위치색인(georeferencing)기법을 개발하고 실험용 데이터베이스를 구축하여 평가를 수행하였다. 본 연구에서 개발된 동영상의 georeferencing 기법은 DGPS를 이용한 위치측정, 이상점의 제거, 지도융합기법, time-tag을 이용한 동영상의 위치색인 등으로 구성되며, 정확한 위치가 알려져 있는 가로등을 기준점으로 위치정확도 평가를 행한 결과, 92.8%의 기준점이 전후 2프레임안에 포함되는 결과를 얻었다. 본 논문의 궁극적 의미는 기존의 2차원 수치지도의 한계를 넘어선 새로운 개념의 수치지도에 대한 가능성을 제시하였다는 것에 있다.

  • PDF

Content Description on a Mobile Image Sharing Service: Hashtags on Instagram

  • Dorsch, Isabelle
    • Journal of Information Science Theory and Practice
    • /
    • 제6권2호
    • /
    • pp.46-61
    • /
    • 2018
  • The mobile social networking application Instagram is a well-known platform for sharing photos and videos. Since it is folksonomy-oriented, it provides the possibility for image indexing and knowledge representation through the assignment of hashtags to posted content. The purpose of this study is to analyze how Instagram users tag their pictures regarding different kinds of picture and hashtag categories. For such a content analysis, a distinction is made between Food, Pets, Selfies, Friends, Activity, Art, Fashion, Quotes (captioned photos), Landscape, and Architecture image categories as well as Content-relatedness (ofness, aboutness, and iconology), Emotiveness, Isness, Performativeness, Fakeness, "Insta"-Tags, and Sentences as hashtag categories. Altogether, 14,649 hashtags of 1,000 Instagram images were intellectually analyzed (100 pictures for each image category). Research questions are stated as follows: RQ1: Are there any differences in relative frequencies of hashtags in the picture categories? On average the number of hashtags per picture is 15. Lowest average values received the categories Selfie (average 10.9 tags per picture) and Friends (average 11.7 tags per picture); for highest, the categories Pet (average 18.6 tags), Fashion (average 17.6 tags), and Landscape (average 16.8 tags). RQ2: Given a picture category, what is the distribution of hashtag categories; and given a hashtag category, what is the distribution of picture categories? 60.20% of all hashtags were classified into the category Content-relatedness. Categories Emotiveness (about 4.38%) and Sentences (0.99%) were less often frequent. RQ3: Is there any association between image categories and hashtag categories? A statistically significant association between hashtag categories and image categories on Instagram exists, as a chi-square test of independence shows. This study enables a first broad overview on the tagging behavior of Instagram users and is not limited to a specific hashtag or picture motive, like previous studies.

낮은 피사계 심도 영상에서 관심 물체의 효율적인 추출 방법 (An Efficient Object Extraction Scheme for Low Depth-of-Field Images)

  • 박정우;이재호;김창익
    • 한국멀티미디어학회논문지
    • /
    • 제9권9호
    • /
    • pp.1139-1149
    • /
    • 2006
  • 본 논문은 낮은 피사계 심도 영상(low depth-of-field image)에 대해 사용자의 도움 없이 포커스 된 관심 영역을 고속으로 추출하는 효율적인 방법을 제안한다. 우리는 입력 영상에 존재하는 고주파 성분을 HOS(higher order statistics) 계산을 함으로써 영상의 포커스 된 영역을 찾아내는 중요한 지표로 활용한다. 본 논문에서 제안하는 방법은 크게 4가지 단계로 구분할 수 있다. 첫 번째 단계에서는 기존 연구[1] 방법과 동일하게 모든 화소에 관해 HOS 지도를 계산하고 블록화한다. 두 번째 단계에서는 블록화 된 HOS를 이용하여 포커스 된 물체가 존재하는 후보 관심 영역을 대략적으로 구한다. 이후 관심 영역 내부에 존재하는 구멍(hole)을 제거하기 위해 구멍(hole) 추적 및 제거 연산을 수행한다. 마지막으로 최종 관심 후보 영역에서 배경 부분의 화소만 제거하여 포커스 된 관심 물체만을 섬세하게 추출한다. 제안하는 방법은 기존 방법[1]에 비해 정지 영상에서 고속으로 관심 영역을 추출하므로 추후 알고리즘의 변형 없이 낮은 피사계 심도의 동영상에 확장 적용하여 관심 영역을 실시간으로 추출할 수 있다. 본 논문에서 제안하는 방법은 가상 현실(VR)이나 실감 방송, 비디오 인덱싱 시스템과 같은 여러 응용 분야에 효과적으로 적용될 수 있고, 이러한 유용성은 실험 결과를 통해 보였다.

  • PDF

영화 비디오 자막 추출 및 추출된 자막 이미지 향상 방법 (Methods for Video Caption Extraction and Extracted Caption Image Enhancement)

  • 김소명;곽상신;최영우;정규식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.235-247
    • /
    • 2002
  • 디지털 비디오 영상을 효과적으로 색인하고 검색하기 위해서 비디오의 내용을 함축적으로 표현하고 있는 비디오 자막을 추출하여 인식하는 연구가 필요하다. 본 논문에서는 압축되지 않은 비디오 영화 영상에 인위적으로 삽입한 한글 및 영어 자막을 대상으로 자막 영역을 추출하고, 추출된 자막 이미지를 향상시키는 방법을 제안한다. 제안한 방법의 특징은 동일한 내용의 자막을 갖는 프레임들의 위치를 자동으로 찾아서 동일 자막 프레임들을 다중 결합하여 배경에 포함되어 있는 잡영의 일부 또는 전부를 우선 제거한다. 또한, 이 결과 이미지에 해상도 중대, 히스토그램 평활화, 획 기반 이진화, 스무딩의 이미지 향상 방법을 단계적으로 적용하여 인식 가능한 수준의 이미지로 향상시킨다. 제안한 방법을 비디오 영상에 적용하여 동일한 내용의 자막 그룹 단위로 자막 이미지를 추출하는 것이 가능해졌으며, 잡영이 제거되고 복잡한 자소의 획이 보존된 자막 이미지를 추출할 수 있었다. 동일한 내용의 자막 프레임의 시작 및 글위치를 파악하는 것은 비디오 영상의 색인과 검색에 유용하게 활용될 수 있다. 한글 및 영어 비디오 영화 자막에 제안한 방법을 적용하여 향상된 문자 인식 결과를 얻었다.

국내 지자체 사진 기록물의 효율적 관리를 위한 메타데이터 설계 및 기계학습 기반 자동 인덱싱 방법 연구 (Metadata Design and Machine Learning-Based Automatic Indexing for Efficient Data Management of Image Archives of Local Governments in South Korea)

  • 김인아;강영선;이규철
    • 한국기록관리학회지
    • /
    • 제20권2호
    • /
    • pp.67-83
    • /
    • 2020
  • 국내의 많은 지방자치단체에서는 지역에서 발생하는 사건들에 대한 시청각 기록물을 사람들이 쉽게 열람할 수 있도록 온라인 서비스를 제공하고 있다. 그러나 지자체들의 현재 사진 기록물 관리 방식은 표준적인 메타데이터가 부재하고 사진의 정보를 활용하지 않기 때문에 지자체 간 호환성과 검색 편의성이 낮은 문제점을 가진다. 이와 같은 문제점을 개선하기 위해, 본 논문에서는 국내 지자체 사진 기록물의 효율적 관리를 위한 메타데이터 설계와 기계학습 기반 자동 인덱싱 기술을 제안한다. 먼저, 본 논문에서는 국내 지자체 사진 기록물에 특화된 메타데이터를 설계하여 지자체 간 사진 기록물의 호환성을 높이고, 사진의 기본 정보와 특성을 나타낼 수 있는 요소들을 메타데이터 항목에 포함함으로써 사진 기록물의 효율적인 관리를 가능하게 한다. 또한, 기계학습 기술을 기반으로 사진의 사건과 카테고리를 반영하는 정보인 사진 속 텍스트와 객체를 자동 인덱싱하여, 사진 기록물 검색 시 사용자 검색의 편의성을 높인다. 마지막으로, 본 논문에서는 제안한 방법을 사용하여 국내 지자체 사진 기록물에서 텍스트와 객체를 자동으로 추출하고, 추출한 내용과 기본 정보를 본 논문에서 설계한 사진 기록물 메타데이터 항목에 저장하는 프로그램을 개발하였다.

영상분할과 특징점 추출을 이용한 영역기반 영상검색 시스템 (A Region-based Image Retrieval System using Salient Point Extraction and Image Segmentation)

  • 이희경;호요성
    • 방송공학회논문지
    • /
    • 제7권3호
    • /
    • pp.262-270
    • /
    • 2002
  • 대부분의 영상색인 기법에서는 영상의 전역 특징값을 이용한다. 그러나 이러한 방법은 영상의 지역적인 변화들을 담아내지 못하기 때문에 만족할 만한 격과를 제공하지 못한다. 본 논문에서는 이러한 문제점을 해결하기 위한 방법으로 영상의 특징점(salient point)과 영상분할을 이용하여 중요영역(important region)을 추출하는 새로운 영역기반 영상검색 시스템을 제안한다. 본 논문에서 제안하는 특징점 추출 기법은 기존의 방법과 비교하여 빠르고 정확한 추출 결과를 보여준다. 선택된 영역에서 추출된 칼라와 질감 정보를 이용하여 검색한 결과는 칼라나 질감 정보의 전력 특징값을 이용한 검색 방법의 결과보다 크게 향상됨을 알 수 있었다.

Memory-Efficient NBNN Image Classification

  • Lee, YoonSeok;Yoon, Sung-Eui
    • Journal of Computing Science and Engineering
    • /
    • 제11권1호
    • /
    • pp.1-8
    • /
    • 2017
  • Naive Bayes nearest neighbor (NBNN) is a simple image classifier based on identifying nearest neighbors. NBNN uses original image descriptors (e.g., SIFTs) without vector quantization for preserving the discriminative power of descriptors and has a powerful generalization characteristic. However, it has a distinct disadvantage. Its memory requirement can be prohibitively high while processing a large amount of data. To deal with this problem, we apply a spherical hashing binary code embedding technique, to compactly encode data without significantly losing classification accuracy. We also propose using an inverted index to identify nearest neighbors among binarized image descriptors. To demonstrate the benefits of our method, we apply our method to two existing NBNN techniques with an image dataset. By using 64 bit length, we are able to reduce memory 16 times with higher runtime performance and no significant loss of classification accuracy. This result is achieved by our compact encoding scheme for image descriptors without losing much information from original image descriptors.

Content Based Image Retrieval Using Combined Features of Shape, Color and Relevance Feedback

  • Mussarat, Yasmin;Muhammad, Sharif;Sajjad, Mohsin;Isma, Irum
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권12호
    • /
    • pp.3149-3165
    • /
    • 2013
  • Content based image retrieval is increasingly gaining popularity among image repository systems as images are a big source of digital communication and information sharing. Identification of image content is done through feature extraction which is the key operation for a successful content based image retrieval system. In this paper content based image retrieval system has been developed by adopting a strategy of combining multiple features of shape, color and relevance feedback. Shape is served as a primary operation to identify images whereas color and relevance feedback have been used as supporting features to make the system more efficient and accurate. Shape features are estimated through second derivative, least square polynomial and shapes coding methods. Color is estimated through max-min mean of neighborhood intensities. A new technique has been introduced for relevance feedback without bothering the user.

모양 기반 이미지 분류를 위한 최적의 우세점 추출 (Extraction of Optimal Interest Points for Shape-based Image Classification)

  • 조성택;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권4호
    • /
    • pp.362-371
    • /
    • 2003
  • 이 논문에서는 이미지 데이타베이스에서 모양 특징 기반 이미지 분류와 인덱싱을 위해 객체의 윤곽선 특성을 고려해 임계값을 동적으로 결정하여 최적 우세점을 추출하는 알고리즘을 제안한다. 동적 임계값결정은 원본 모양의 윤곽선 길이 비와 근사화된 다각형의 둘레 길이 비를 알고리즘 수행시 점진적으로 검사하는 방법을 사용한다. 이 알고리즘은 윤곽선 특징을 반영하여 동적인 임계값 검사를 함으로써 의사점 수를 최대한 줄이며 최소 우세점만으로 모양 특징 정보를 추출할 수 있는 장점을 보인다. 제안한 방법은 객체의 윤곽선을 이루는 n개의 점에서 m개의 최적 우세점을 찾는데 평균 O(nlogn)이 걸린다. 최적화 평가는 7가지 서로 다른 특성을 가지는 70개의 합성 모양과 1,100개의 어류 모양에 대해 알고리즘을 적용하고 피 결과에 대해 평가 함수를 구성하여 수행하였다. 최적화율은 실험 모양들에 대해 평균0.92를 보였으며 기존 알고리즘에 대해 약 14% 최적화 성능 개선을 보였다. 제안한 알고리즘을 통해 추출한 모양 특징 정보는 정규화를 통해 이미지 분류와 인덱싱, 유사도 검색에 활용할 수 있다.

Feature-Based Image Retrieval using SOM-Based R*-Tree

  • Shin, Min-Hwa;Kwon, Chang-Hee;Bae, Sang-Hyun
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.223-230
    • /
    • 2003
  • Feature-based similarity retrieval has become an important research issue in multimedia database systems. The features of multimedia data are useful for discriminating between multimedia objects (e 'g', documents, images, video, music score, etc.). For example, images are represented by their color histograms, texture vectors, and shape descriptors, and are usually high-dimensional data. The performance of conventional multidimensional data structures(e'g', R- Tree family, K-D-B tree, grid file, TV-tree) tends to deteriorate as the number of dimensions of feature vectors increases. The R*-tree is the most successful variant of the R-tree. In this paper, we propose a SOM-based R*-tree as a new indexing method for high-dimensional feature vectors.The SOM-based R*-tree combines SOM and R*-tree to achieve search performance more scalable to high dimensionalities. Self-Organizing Maps (SOMs) provide mapping from high-dimensional feature vectors onto a two dimensional space. The mapping preserves the topology of the feature vectors. The map is called a topological of the feature map, and preserves the mutual relationship (similarity) in the feature spaces of input data, clustering mutually similar feature vectors in neighboring nodes. Each node of the topological feature map holds a codebook vector. A best-matching-image-list. (BMIL) holds similar images that are closest to each codebook vector. In a topological feature map, there are empty nodes in which no image is classified. When we build an R*-tree, we use codebook vectors of topological feature map which eliminates the empty nodes that cause unnecessary disk access and degrade retrieval performance. We experimentally compare the retrieval time cost of a SOM-based R*-tree with that of an SOM and an R*-tree using color feature vectors extracted from 40, 000 images. The result show that the SOM-based R*-tree outperforms both the SOM and R*-tree due to the reduction of the number of nodes required to build R*-tree and retrieval time cost.

  • PDF