• 제목/요약/키워드: Image data-sets

검색결과 370건 처리시간 0.03초

시청자의 불편감을 유발하는 스테레오 3D 영상 콘텐츠 요소 분석 (Analysis of Stereo 3D Content Factors Causing Viewer's Discomfort)

  • 김우열;서영호;김동욱
    • 한국통신학회논문지
    • /
    • 제37C권10호
    • /
    • pp.870-887
    • /
    • 2012
  • 본 논문에서는 3D 스테레오 콘텐츠를 시청할 때 시청자의 불편감을 유발하는 요인들을 정성적으로 분석한다. 이를 위해 실제 3D 스테레오 콘텐츠를 시청하면서 불편감을 느끼는 곳을 표시하는 주관적 평가 실험을 수행하여 불편감을 느끼는 위치와 불편감 정도에 대한 데이터를 얻고, 그 콘텐츠에서 다양한 요인들에 대한 정량적인 데이터를 추출하여, 두 세트의 데이터를 대상으로 실제 불편감을 느끼게 하는 요인들을 분석한다. 분석대상은 시차의 크기와 시차변화의 크기를 비롯하여, 콘텐츠의 내용, 정황이나 상황, 화면의 움직임, 카메라의 위치와 움직임, 색상, 화면밝기 등이다. 기존 연구는 시청자의 불편감을 유발하는 개개 요인들에 대해 다루어 왔는데, 본 논문에서는 단일 요인보다는 그 요인들의 복합적인 작용에 더욱 초점을 맞춘다. 즉, 지금까지 주로 다루어왔던 큰 시차뿐만 아니라 불편감을 유발하는 크고 작은 요인들과 그 복합요인이 어느 정도의 불편감을 느끼는지를 분석한다.

지능로봇 제어를 위한 비전기반 실시간 수신호 인식 시스템 (Real-time Hand Gesture Recognition System based on Vision for Intelligent Robot Control)

  • 양태규;서용호
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2180-2188
    • /
    • 2009
  • 본 논문은 지능로봇의 동작을 제어하기 위해 비전기반의 실시간 수신호를 PCA 및 BP 알고리즘을 이용한 인식시스템을 제안하였다. 수신호 인식은 PCA 알고리즘을 이용한 전처리 단계와 BP 알고리즘을 이용한 인식의 두 단계로 구성한다. PCA 알고리즘은 데이터 분석을 위해 다차원 데이터 집합을 보다 낮은 차원으로 감소시키기 위해 사용되는 기술로 주어진 수신호의 특징인 투영 벡터를 계산하기 위하여 적용되었고, BP 알고리즘은 병렬 구조를 가지고 있으므로 병렬 분산처리가 가능하고, 처리 속도가 빠르므로 PCA로부터 훈련된 고유 수신호를 학습시켜 수신호를 실시간으로 인식한다. 실험에서는 10종류의 수신호를 PCA 알고리즘만을 사용한 경우와 제안한 PCA 및 BP 알고리즘을 사용한 경우와 인식률을 비교하여 제안한 알고리즘이 우수하다는 것을 보였다.

Improved Quality Keyframe Selection Method for HD Video

  • Yang, Hyeon Seok;Lee, Jong Min;Jeong, Woojin;Kim, Seung-Hee;Kim, Sun-Joong;Moon, Young Shik
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권6호
    • /
    • pp.3074-3091
    • /
    • 2019
  • With the widespread use of the Internet, services for providing large-capacity multimedia data such as video-on-demand (VOD) services and video uploading sites have greatly increased. VOD service providers want to be able to provide users with high-quality keyframes of high quality videos within a few minutes after the broadcast ends. However, existing keyframe extraction tends to select keyframes whose quality as a keyframe is insufficiently considered, and it takes a long computation time because it does not consider an HD class image. In this paper, we propose a keyframe selection method that flexibly applies multiple keyframe quality metrics and improves the computation time. The main procedure is as follows. After shot boundary detection is performed, the first frames are extracted as initial keyframes. The user sets evaluation metrics and priorities by considering the genre and attributes of the video. According to the evaluation metrics and the priority, the low-quality keyframe is selected as a replacement target. The replacement target keyframe is replaced with a high-quality frame in the shot. The proposed method was subjectively evaluated by 23 votes. Approximately 45% of the replaced keyframes were improved and about 18% of the replaced keyframes were adversely affected. Also, it took about 10 minutes to complete the summary of one hour video, which resulted in a reduction of more than 44.5% of the execution time.

스마트 팜의 자동 제어를 위한 AMCS(Agricultural Machine Control System) 설계 (A Design of AMCS(Agricultural Machine Control System) for the Automatic Control of Smart Farms)

  • 정이나;이병관;안희학
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.201-210
    • /
    • 2019
  • 본 논문에서는 농장의 위성 사진 혹은 드론 사진을 이용하여 농장을 구분하고 농장 드론과 트랙터의 자율주행 및 행동을 제어하는 'AMCS(Agricultural Machine Control System)'를 제안한다. AMCS는 드론과 트랙터의 센서 데이터 및 비디오 영상 데이터로부터 농장 경계를 구분하고, 메인 서버에서 원격 제어 명령어를 읽어 들인 후 드론 및 트랙터 스프링클러와의 연동을 통해, 관리지역 내의 원격 제어 명령을 전달하는 'LSM(Local Server Module)'과 드론과 트랙터가 농장 밖에서 농장으로 이동하는 경로와 농장 안에서 저비용, 고효율로 일을 처리할 수 있는 경로를 설정하는 'PSM(Path Setting Module)'으로 구성된다. 본 논문에서 제안하는 AMCS의 성능분석 결과 AMCS의 PSM은 외부 출발점에서 농장까지 도달하는 경로를 설정할 때 다익스트라 알고리즘보다 약 100% 향상된 성능을 보였으며, 농장 내부 작업 경로를 설정할 때 기존 경로보다 약 13% 높은 작업 효율을 보였고 36% 낮은 작업 거리를 설정했다. 따라서 PSM은 기존 방식보다 더 효율적으로 트랙터와 드론을 제어할 수 있다.

게이트심장혈액풀검사에서 딥러닝 기반 좌심실 영역 분할방법의 유용성 평가 (Evaluating Usefulness of Deep Learning Based Left Ventricle Segmentation in Cardiac Gated Blood Pool Scan)

  • 오주영;정의환;이주영;박훈희
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제45권2호
    • /
    • pp.151-158
    • /
    • 2022
  • The Cardiac Gated Blood Pool (GBP) scintigram, a nuclear medicine imaging, calculates the left ventricular Ejection Fraction (EF) by segmenting the left ventricle from the heart. However, in order to accurately segment the substructure of the heart, specialized knowledge of cardiac anatomy is required, and depending on the expert's processing, there may be a problem in which the left ventricular EF is calculated differently. In this study, using the DeepLabV3 architecture, GBP images were trained on 93 training data with a ResNet-50 backbone. Afterwards, the trained model was applied to 23 separate test sets of GBP to evaluate the reproducibility of the region of interest and left ventricular EF. Pixel accuracy, dice coefficient, and IoU for the region of interest were 99.32±0.20, 94.65±1.45, 89.89±2.62(%) at the diastolic phase, and 99.26±0.34, 90.16±4.19, and 82.33±6.69(%) at the systolic phase, respectively. Left ventricular EF was calculated to be an average of 60.37±7.32% in the ROI set by humans and 58.68±7.22% in the ROI set by the deep learning segmentation model. (p<0.05) The automated segmentation method using deep learning presented in this study similarly predicts the average human-set ROI and left ventricular EF when a random GBP image is an input. If the automatic segmentation method is developed and applied to the functional examination method that needs to set ROI in the field of cardiac scintigram in nuclear medicine in the future, it is expected to greatly contribute to improving the efficiency and accuracy of processing and analysis by nuclear medicine specialists.

Deep Learning-Based Lumen and Vessel Segmentation of Intravascular Ultrasound Images in Coronary Artery Disease

  • Gyu-Jun Jeong;Gaeun Lee;June-Goo Lee;Soo-Jin Kang
    • Korean Circulation Journal
    • /
    • 제54권1호
    • /
    • pp.30-39
    • /
    • 2024
  • Background and Objectives: Intravascular ultrasound (IVUS) evaluation of coronary artery morphology is based on the lumen and vessel segmentation. This study aimed to develop an automatic segmentation algorithm and validate the performances for measuring quantitative IVUS parameters. Methods: A total of 1,063 patients were randomly assigned, with a ratio of 4:1 to the training and test sets. The independent data set of 111 IVUS pullbacks was obtained to assess the vessel-level performance. The lumen and external elastic membrane (EEM) boundaries were labeled manually in every IVUS frame with a 0.2-mm interval. The Efficient-UNet was utilized for the automatic segmentation of IVUS images. Results: At the frame-level, Efficient-UNet showed a high dice similarity coefficient (DSC, 0.93±0.05) and Jaccard index (JI, 0.87±0.08) for lumen segmentation, and demonstrated a high DSC (0.97±0.03) and JI (0.94±0.04) for EEM segmentation. At the vessel-level, there were close correlations between model-derived vs. experts-measured IVUS parameters; minimal lumen image area (r=0.92), EEM area (r=0.88), lumen volume (r=0.99) and plaque volume (r=0.95). The agreement between model-derived vs. expert-measured minimal lumen area was similarly excellent compared to the experts' agreement. The model-based lumen and EEM segmentation for a 20-mm lesion segment required 13.2 seconds, whereas manual segmentation with a 0.2-mm interval by an expert took 187.5 minutes on average. Conclusions: The deep learning models can accurately and quickly delineate vascular geometry. The artificial intelligence-based methodology may support clinicians' decision-making by real-time application in the catheterization laboratory.

Research on damage detection and assessment of civil engineering structures based on DeepLabV3+ deep learning model

  • Chengyan Song
    • Structural Engineering and Mechanics
    • /
    • 제91권5호
    • /
    • pp.443-457
    • /
    • 2024
  • At present, the traditional concrete surface inspection methods based on artificial vision have the problems of high cost and insecurity, while the computer vision methods rely on artificial selection features in the case of sensitive environmental changes and difficult promotion. In order to solve these problems, this paper introduces deep learning technology in the field of computer vision to achieve automatic feature extraction of structural damage, with excellent detection speed and strong generalization ability. The main contents of this study are as follows: (1) A method based on DeepLabV3+ convolutional neural network model is proposed for surface detection of post-earthquake structural damage, including surface damage such as concrete cracks, spaling and exposed steel bars. The key semantic information is extracted by different backbone networks, and the data sets containing various surface damage are trained, tested and evaluated. The intersection ratios of 54.4%, 44.2%, and 89.9% in the test set demonstrate the network's capability to accurately identify different types of structural surface damages in pixel-level segmentation, highlighting its effectiveness in varied testing scenarios. (2) A semantic segmentation model based on DeepLabV3+ convolutional neural network is proposed for the detection and evaluation of post-earthquake structural components. Using a dataset that includes building structural components and their damage degrees for training, testing, and evaluation, semantic segmentation detection accuracies were recorded at 98.5% and 56.9%. To provide a comprehensive assessment that considers both false positives and false negatives, the Mean Intersection over Union (Mean IoU) was employed as the primary evaluation metric. This choice ensures that the network's performance in detecting and evaluating pixel-level damage in post-earthquake structural components is evaluated uniformly across all experiments. By incorporating deep learning technology, this study not only offers an innovative solution for accurately identifying post-earthquake damage in civil engineering structures but also contributes significantly to empirical research in automated detection and evaluation within the field of structural health monitoring.

지열지대 VSP 자료를 이용한 파쇄대 영상화 연구 (Imaging Fractures by using VSP Data on Geothermal Site)

  • 이상민;변중무;송호철;박권규;이태종
    • 지구물리와물리탐사
    • /
    • 제14권3호
    • /
    • pp.227-233
    • /
    • 2011
  • 지열은 외부 연료 공급요건에 영향을 받지 않고 연중 가동할 수 있는 장점을 가지기 때문에 최근 해외에서 주목받고 있는 대체 에너지원이다. 그리고 국내의 온천 및 지열이상대는 화강암 지역의 심부 파쇄대를 통한 지열수의 순환에 의한 것이 대부분으로 알려져 있다. 따라서 국내에서의 지열탐사는 지하유체의 주요 통로인 심부 파쇄대의 분포상황을 정확하게 파악하는 것이 매우 중요하다. 본 연구에서는 석모도에서 취득한 수직 탄성파탐사(Vertical Seismic Profiling, VSP) 자료의 전처리와 심부 파쇄대의 영상화를 수행하기 위하여 급경사 파쇄대 지역과 퇴적층 구조를 모사한 속도모델로부터 합성탄성파 자료를 생성하고, 이 자료에 일반적인 VSP 자료처리기법과 급경사 파쇄대를 고려한 VSP 자료처리기법을 각각 적용한 결과를 비교 분석하였다. 그 결과 파쇄대에 의한 반사 이벤트의 손실을 없애기 위해서는 단순히 모든 하향파를 제거하는 일반적인 전처리 과정이 아닌 파쇄대를 고려한 전처리 과정이 필요하다는 것을 확인하였다. 또한 파쇄대를 고려한 전처리 과정이 수행된 석모도 거꿀 수직 탄성파탐사(Reversed VSP, RVSP) 현장자료에 3차원 겹쌓기전 위상막 참 반사보정을 적용하여 석모도 탐사현장의 지하구조를 영상화하였다. 참 반사보정 결과 파쇄대로 추정되는 구조가 확인되었으며, 이는 시추공 자료에서 추정되는 균열대의 심도와 일치하였다.

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

합성곱 신경망(CNN)을 활용한 항공 시스템의 이상 탐지 모델 연구 (Anomaly Detections Model of Aviation System by CNN)

  • 임현재;김태림;송종규;김범수
    • 항공우주시스템공학회지
    • /
    • 제17권4호
    • /
    • pp.67-74
    • /
    • 2023
  • 최근 미래의 운송시스템으로 도심교통항공(Urban Aircraft Mobility)이 주목받고 있으며 소형 드론도 다양한 산업에서 역할을 하고 있다. 다양한 종류의 항공 시스템 고장은 추락으로 막대한 재산 및 인명 피해로 이어질 수 있다. 항공 시스템이 많이 활용되는 무기체계에서도 고장은 임무 실패의 결과를 유발한다. 본 논문에서는 항공 시스템의 이상(Anomaly)을 탐지하여 개발 및 생산 간 시스템의 신뢰도를 높이고 운용 중 사고를 예방할 수 있도록 딥러닝 기술을 활용한 이상 탐지 모델을 연구했다. 모델 훈련 및 평가 데이터로 극저온 환경에서 시스템의 전류 데이터를 활용하였으며 이미지 인식에 많이 활용되는 딥러닝 기법 합성곱 신경망(CNN; Convolutional Neural Network)을 활용하여 딥러닝 네트워크를 구현했다. 시험 대상 시스템은 극저온 환경에서 다양한 형태의 고장이 유발되었고 전륫값의 특이점이 나타났다. 시스템 정상 및 고장 데이터를 활용하여 모델을 훈련 시키고 평가한 결과 98% 이상의 재현율(Recall)로 이상 탐지하는 것을 확인했다.