• 제목/요약/키워드: image clustering

검색결과 599건 처리시간 0.027초

관광객 공유한 사진 및 머신 러닝을 활용한 도시 색채 특성 분석 연구 - 중국 대리시를 대상으로 - (Research on Characterizing Urban Color Analysis based on Tourists-Shared Photos and Machine Learning - Focused on Dali City, China -)

  • 인샤오옌;정태열
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.39-50
    • /
    • 2024
  • 색채는 중요한 시각적 요소로서 도시 이미지와 사람들의 인식 형성에 중요한 영향을 미친다. 도시환경에서 색채를 정량적으로 분석하는 작업은 복잡한 과정을 필요로 하여 과거에는 실행하기가 어려웠다. 그러나 최근 머신 러닝 기술의 급속한 발전으로 관광객이 공유한 사진을 이용하여 도시 색채를 분석하는 것이 가능해졌다. 본 연구는 중국의 인기 관광지인 대리시를 사례로 선정하여 관광객이 공유한 대리시의 사진을 수집하였으며, 머신 러닝 기술을 결합하여 대규모 도시 색채를 측정하는 방법을 탐색하였다. 구체적으로는 먼저 DeepLabv3+ 모델을 사용하여 ADE20k 데이터 셋을 기반으로 관광객이 공유한 사진의 의미 분할을 수행하여 사진에서 인공 요소를 분리했다. 다음으로 K-means 클러스터링 알고리즘을 사용하여 대리시의 인공 요소의 주요 색상을 추출하고, 이러한 색상 간의 상관관계를 분석하기 위해 인접 매트릭스를 구축했다. 연구 결과에 따르면 대리시의 인공 요소의 주요 색상은 주황-회색이 가장 높은 비율을 차지한다. 또한, 회색 계열의 색상이 다른 색상과 자주 조합되어 사용되는 경향이 있다. 분석에 따르면 대리시의 인공 요소의 색채 특성은 지역의 민족 문화와 불교 문화의 영향을 받는 것으로 나타났다. 본 연구는 색채 분석을 위한 새로운 접근 방법을 제공하며, 연구 결과는 대리시가 관광객의 기대에 부합하는 도시 색채 이미지를 형성하는 데 도움이 될 뿐만 아니라 향후 대리시의 색채 계획을 위한 참고 자료를 제공하고자 한다.

영상분할을 위한 혼합 가우시안 함수 임계 값 결정 (Decision of Gaussian Function Threshold for Image Segmentation)

  • 정용규;최규석;허고은
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.163-168
    • /
    • 2009
  • 영상분할의 대부분의 방법들은 각 화소에서 관측되는 특징벡터로 표현하며 이들에 대하여 적절한 확률모델을 가정하게 된다. 이들 확률 모델을 결정하는 파라미터들을 통계적 방법으로 추정하여 이용하거나 각 특징 벡터간의 유사 도를 기반으로 하는 군집 알고리즘을 사용하여 분할을 수행하는 방법들을 이용한다. 이의 대표적인 방법인 EM알고리즘은 불완전한 데이터에서 미지의 파라미터에 대한 최대 우도를 계산하는 경우나 사후 확률 분포의 최대 값을 구하는 문제 등의 응용 분야가 매우 다양하지만 몇 가지의 구조적 문제점을 가지고 있다. 먼저 추정량의 성능이 시작점에 크게 의존한다는 것이며 따라서 우도 함수가 국부적 최대 값에 수렴한다는 것이다. 이러한 문제점을 해결하기 위하여 영상의 모든 레벨 값을 중심으로 형성된 가우시안 함수와 원 영상의 히스토그램을 혼합하여 영상의 새로운 히스토그램을 통해 임계 값을 설정하는 최적화된 영상분할 기법을 제시한다. 제안된 알고리즘은 MFC를 통해 구현하였으며 영상을 임계 값의 개수에 따라 다양하게 나누어 보았을 때 에지부분이 선명하게 나타나며 세밀하고 정확한 영상으로 분할됨을 확인할 수 있다.

  • PDF

선군집분할방법에 의한 특징 추출 (Feature Extraction by Line-clustering Segmentation Method)

  • 황재호
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.401-408
    • /
    • 2006
  • 영상신호의 수직축 및 수평축 화소 성분 분석을 통해서, 영상 내부에 존재하는 각 영역의 군집적 특성을 통계 및 영역적으로 처리 분류함으로써 필요한 특징을 추출할 수 있는 새로운 형태의 영역분할처리 알고리즘을 제시한다. 종래의 점처리나 면처리 방식에 비해 이 방식은 수평축과 수직축 상에서의 연속적인 선처리 방식이라고 할 수 있다. 영상을 구성하는 영역간 경계가 암시적으로 구분되어 있으나, 명시적으로는 불투명하고, 영상 특성의 분기점 또한 불명확하고 중복되어 있음으로 인하여 문턱치처리나 분기점처리로 그 영역간 특정을 분할, 추출하기가 곤란한 경우에 이 방식은 우수한 효과가 있다. 수평축 및 수직축 선처리를 통해 각 영역들의 특성들을 군집으로 처리한 다음 처리한 축과 수직 방향으로 축차적 적응진행처리한다. 그 결과 영상 내 각 영역은 화소값의 중복에도 불구하고 하나의 군집으로 자리매김하면서 군집 고유의 화소 값을 갖는다. 그리고 처리후 영상은 각 군집에 부여한 새로운 화소값으로 변환함으로 필요한 특정이 추출된다. 이 방식은 특히 영역 분할을 통해 시각적 효과를 극대화시킬 필요가 있는 경동맥 초음파 의료영상에서 우수한 결과를 보였다.

3-태그 기반의 웹 이미지 검색 기법 (3-tag-based Web Image Retrieval Technique)

  • 이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1165-1173
    • /
    • 2012
  • 웹2.0 환경에서의 대중적인 기술 중 하나는 태깅이며, 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있다. 그러나 태깅에 사용된 태그가 정보 검색에 재사용되어 검색의 효율성을 극대화 시킬 것이라는 기대와는 달리 실제로는 부정확한 태그로 인해 낮은 검색 결과를 제공 하고 있다. 이에 선행 연구에서는 웹상에 산재되어있는 다양한 리소스 및 그에 따른 태그 정보들을 수집하여 태그들 간의 연관성에 따라 맵핑하고, 이를 클러스터링 하기 위한 연구를 진행하였다. 본 논문에서는 클러스터링된 태그들을 검색에 활용하는 3-태그 기반 검색 알고리즘을 제안하였다. 제안 알고리즘의 성능평가를 위하여, 태그 기반 대표 사이트인 Flicker 사이트의 이미지 검색 결과와 정확성 및 재현율을 비교 평가하였다.

드론 기반의 전력선 추적 제어 시스템 (Drone-based Power-line Tracking System)

  • 정종민;김재승;윤태성;박진배
    • 전기학회논문지
    • /
    • 제67권6호
    • /
    • pp.773-781
    • /
    • 2018
  • In recent years, a study of power-line inspection using an unmanned aerial vehicle (UAV) has been actively conducted. However, relevant studies have been conducting power-line inspection with an UAV operated by manual control, and they have developed just power-line detection algorithm on aerial images. To overcome limitations of existing research, we propose a drone-based power-line tracking system in this paper. The main contributions of this paper are to operate developed system under configured environment and to develop a power-line detection algorithm in real-time. Developed system is composed of the power-line detection and the image-based tracking control. To detect a power-line in real-time, a region of interest (ROI) image is extracted. Furthermore, clustering algorithm is used in order to discriminate the power-line from background. Finally, the power-line is detected by using the Hough transform, and a center position and a tilt angle are estimated by using the Kalman filter to control a drone smoothly. We design a position controller and an attitude controller for image-based tracking control, and both controllers are designed based on the proportional-derivative (PD) control method. The interaction between the position controller and the attitude controller makes the drone track the power-line. Several experiments were carried out in environments where conditions are similar to actual environments, which demonstrates the superiority of the developed system.

A Comparative Analysis of Research Trends in the Information and Communication Technology Field of South and North Korea Using Data Mining

  • Jiwan Kim;Hyunkyoo Choi;Jeonghoon Mo
    • Journal of Information Science Theory and Practice
    • /
    • 제11권1호
    • /
    • pp.14-30
    • /
    • 2023
  • The purpose of this study is to compare research trends in the information and communication technology (ICT) field between North and South Korea and analyze the differences by using data mining. Frequency analysis, clustering, and network analysis were performed using keywords from seven South Korean and two North Korean ICT academic journals published for five years (2015-2019). In the case of South Korea (S. Korea), the frequency of research on image processing and wireless communication was high at 16.7% and 16.3%, respectively. North Korea (N. Korea) had a high frequency of research, in the order of 18.2% for image processing, 16.9% for computer/Internet applications/security, and 16.4% for industrial technology. N. Korea's natural language processing (NLP) sector was 11.9%, far higher than S. Korea's 0.7 percent. Student education is a unique subject that is not clustered in S. Korea. In order to promote exchanges between the two Koreas in the ICT field, the following specific policies are proposed. Joint research will be easily possible in the image processing sector, with the highest research rate in both Koreas. Technical cooperation of medical images is required. If S. Korea's high-quality image source is provided free of charge to N. Korea, research materials can be enriched. In the field of NLP, it calls for proposing exchanges such as holding a Korean language information conference, developing a Korean computer operating system. The field of student education encourages support for remote education contents and management know-how, as well as joint research on student remote evaluation.

제초로봇 개발을 위한 2차원 콩 작물 위치 자동검출 (Estimation of two-dimensional position of soybean crop for developing weeding robot)

  • 조수현;이충열;정희종;강승우;이대현
    • 드라이브 ㆍ 컨트롤
    • /
    • 제20권2호
    • /
    • pp.15-23
    • /
    • 2023
  • In this study, two-dimensional location of crops for auto weeding was detected using deep learning. To construct a dataset for soybean detection, an image-capturing system was developed using a mono camera and single-board computer and the system was mounted on a weeding robot to collect soybean images. A dataset was constructed by extracting RoI (region of interest) from the raw image and each sample was labeled with soybean and the background for classification learning. The deep learning model consisted of four convolutional layers and was trained with a weakly supervised learning method that can provide object localization only using image-level labeling. Localization of the soybean area can be visualized via CAM and the two-dimensional position of the soybean was estimated by clustering the pixels associated with the soybean area and transforming the pixel coordinates to world coordinates. The actual position, which is determined manually as pixel coordinates in the image was evaluated and performances were 6.6(X-axis), 5.1(Y-axis) and 1.2(X-axis), 2.2(Y-axis) for MSE and RMSE about world coordinates, respectively. From the results, we confirmed that the center position of the soybean area derived through deep learning was sufficient for use in automatic weeding systems.

Visual Model of Pattern Design Based on Deep Convolutional Neural Network

  • Jingjing Ye;Jun Wang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권2호
    • /
    • pp.311-326
    • /
    • 2024
  • The rapid development of neural network technology promotes the neural network model driven by big data to overcome the texture effect of complex objects. Due to the limitations in complex scenes, it is necessary to establish custom template matching and apply it to the research of many fields of computational vision technology. The dependence on high-quality small label sample database data is not very strong, and the machine learning system of deep feature connection to complete the task of texture effect inference and speculation is relatively poor. The style transfer algorithm based on neural network collects and preserves the data of patterns, extracts and modernizes their features. Through the algorithm model, it is easier to present the texture color of patterns and display them digitally. In this paper, according to the texture effect reasoning of custom template matching, the 3D visualization of the target is transformed into a 3D model. The high similarity between the scene to be inferred and the user-defined template is calculated by the user-defined template of the multi-dimensional external feature label. The convolutional neural network is adopted to optimize the external area of the object to improve the sampling quality and computational performance of the sample pyramid structure. The results indicate that the proposed algorithm can accurately capture the significant target, achieve more ablation noise, and improve the visualization results. The proposed deep convolutional neural network optimization algorithm has good rapidity, data accuracy and robustness. The proposed algorithm can adapt to the calculation of more task scenes, display the redundant vision-related information of image conversion, enhance the powerful computing power, and further improve the computational efficiency and accuracy of convolutional networks, which has a high research significance for the study of image information conversion.

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

Sentinel-1 SAR 영상을 이용한 주성분분석 및 K-means Clustering 기반 산불 탐지 (Detection of Forest Fire Damage from Sentinel-1 SAR Data through the Synergistic Use of Principal Component Analysis and K-means Clustering)

  • 이재세;김우혁;임정호;권춘근;김성용
    • 대한원격탐사학회지
    • /
    • 제37권5_3호
    • /
    • pp.1373-1387
    • /
    • 2021
  • 산불은 지표 에너지 균형, 사회 및 환경에 중대한 위협을 미치며, 사회경제적 손실을 일으킨다. 한편, 현재까지 널리 사용되고 있는 다중분광 위성 영상 기반 산불 피해 탐지 알고리즘은 구름으로 인한 반사도 오염으로 인해 시의적절한 산불 정보를 얻기 어려운 문제가 있다. 따라서 본 연구에서는 구름에 영향을 받지 않는 유럽우주국의 Sentinel-1 SAR (Synthetic Aperture Radar) 자료로부터 2019년 4월 초에 발생한 남한 강원도의 강릉·동해, 고성·속초 및 인접한 북한의 두 산불 발생 지역을 대상으로 주성분분석(Principal Component Analysis; PCA)을 포함하는 일련의 전 처리 및 K-means clustering을 이용하여 산불 피해 면적을 탐지하였다. 추정된 산불 면적은 국립산림과학원에서 남한의 두 산불에 대해 제공한 산불 피해 면적 및 강도 참조자료 및 산불 피해 탐지에 널리 사용되는 dNBR (differenced Normalized Burn Ratio)을 사용하여 검증하였다. 국립산림과학원의 참조자료 기반 검증에서 강릉·동해와 고성·속초 산불에 대해 평균 약 86%의 정확도를 보였다. dNBR을 사용한 검증에서는 남한 및 북한의 지역 모두에 대해 평균 약 84%의 정확도를 보였다. 이때, 산불 강도가 강할수록 산불 면적 탐지 성능이 높고 반대로 산불 강도가 약할수록 산불 면적 탐지 성능이 낮은 것을 확인할 수 있었다. 본 연구를 통해 검증된 SAR 영상을 이용한 PCA 및 K-means clustering 기반 탐지 알고리즘이 추후 구름의 영향이 크고 작은 산불이 빈번하게 발생하는 한반도에 대하여 신속한 산불 피해 면적 탐지에 활용될 수 있을 것으로 기대된다.