• Title/Summary/Keyword: image feature extraction

검색결과 1,017건 처리시간 0.028초

폴립 검출 컨볼루션 신경망 설계를 위한 캡슐내시경 영상의 멀티 스케일 분석 기반 특징 추출 기법 (A Feature Extraction Method Based on Multi-Scale Image Analysis for Designing Convolutional Neural Network as to Polyp Detection)

  • 임창남;박예슬;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.669-672
    • /
    • 2018
  • 캡술내시경은 식도부터 항문까지 소화기관 전체를 한번에 촬영할 수 있는 의료기기로, 한번의 검사에 평균 8~12 시간 정도의 길이와 5만장 이상의 프레임으로 구성된 영상을 생성한다. 그러나 생성된 영상에 대한 분석은 수작업으로 진행되고 있어, 캡술내시경 영상 분석 자동화에 대한 기술적인 수요가 높아지고 있는 추세이다. 이를 위해, 캡슐내시경 영상 분석에 대한 많은 연구가 진행되고 있는데, 본 연구에서는 그 중에서도 폴립 영상에 대한 검출 자동화 연구에 주목하였다. 폴립이란 위장관 내에서 발견될 수 있는 융기성 병변으로, 많은 연구에서 기계학습 혹은 딥러닝 방식을 적용하여 이를 검출하기 위한 연구를 수행하였다. 그러나 캡슐내시경 영상의 특성상, 병번이 있는 영상이 굉장히 적기 때문에 일반적인 딥러닝 방식의 적용으로 좋은 성능을 내기 어렵다. 따라서 본 논문에서는 폴립 검출 컨볼루션 신경망 설계를 위한 멀티 스케일에 대한 원형 검출기법을 결합하여 폴립이 의심되는 영역을 추출해주는 특징 추출 기법으로, 수집한 데이터 150장에 대한 실험한 결과 약 82%의 성능을 보였다.

키넥트 센서를 이용한 실용적인 3차원 안면 진단기 연구 (Study on the Practical 3D Facial Diagnosis using Kinect Sensors)

  • 장준수;도준형;김장웅;남지호
    • 동의생리병리학회지
    • /
    • 제29권3호
    • /
    • pp.218-222
    • /
    • 2015
  • Facial diagnosis based on quantitative facial features has been studied in many Korean medicine fields, especially in Sasang constitutional medicine. By the rapid growing of 3D measuring technology, generic and cheap 3D sensors, such as Microsoft Kinect, is popular in many research fields. In this study, the possibility of using Kinect in facial diagnosis is examined. We introduce the development of facial feature extraction system and verify its accuracy and repeatability of measurement. Furthermore, we compare Sasang constitution diagnosis results between DSLR-based system and the developed Kinect-based system. A Sasang constitution diagnosis algorithm applied in the experiment was previously developed by a huge database containing 2D facial images acquired by DSLR cameras. Interrater reliability analysis result shows almost perfect agreement (Kappa = 0.818) between the two systems. This means that Kinect can be utilized to the diagnosis algorithm, even though it was originally derived from 2D facial image data. We conclude that Kinect can be successfully applicable to practical facial diagnosis.

급성심근경색증 관련 의료 영상의 관상동맥 구조 기반 질병 연관 특징 추출 (Disease-associated Feature Extraction based on Coronary Anatomy of Medical Image related to Acute Myocardial Infarction)

  • 박예슬;이미연;김명희;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.806-809
    • /
    • 2015
  • 급성심근경색증은 우리나라의 3 대 응급질환으로 골든타임 내의 빠른 진단과 처치가 필요하다. 보통 급성심근경색은 질환의 특성상 관상동맥의 상태를 파악하는 것이 중요하기 때문에, 진단을 위한 지표로서 의료 영상이 활용되고 있으며 빠른 진단을 위해서는 효과적인 영상 정보 제공이 요구되는 상황이다. 하지만 기존 시스템은 영상의 형식적인 메타데이터에 의해 식별되어 중요 의료정보를 결여된 평면적인 정보 제공이 이루어지고 있다. 그러나 영상에 내재된 의미적 특징을 기반으로 한 정보 제공이 가능해진다면, 효과적인 영상 정보의 확인이 가능해진다. 따라서 본 논문에서는 급성심근경색의 신속하고 효과적인 진단을 위해, 관련 영상으로부터 의학적으로 가치있는 의료정보들의 의미적 정보를 추출함으로써 개별적인 영상에 분산되어 있던 의료 정보들을 통합하며, 직관적이고 효과적으로 의료 영상정보에 대한 파악을 가능케 한다.

색상분할 및 객체 특징정보의 계층적 적용에 의한 신호등 및 속도 표지판 인식 (Traffic Light and Speed Sign Recognition by using Hierarchical Application of Color Segmentation and Object Feature Information)

  • 이강호;방민영;이규원
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.207-214
    • /
    • 2010
  • 본 논문에서는 실제 도로환경의 신호등 및 속도표지판 영역 검출 및 인식 방법을 제안하였다. 밝기정보 및 HIS 컬러모델에기반한 색상정보를 이용하여 신호등을 인식하였다. 또한 HSI 컬러정보로부터 적색강도를 추정함으로써 속도 표지판을 검출하였다. 표지판의 경사여부를 판단하여 시계방향, 반시계방향으로 각각 표지판을 회전시켜 기울기를 보정한 후 인식을 행함으로써 인식률을 제고하였다. 도로환경의 동영상을 대상으로 인식을 행한 결과 신호등과 속도표지판이 혼합된 영상에서도 매우 강건한 인식 결과를 보인다.

Person-Independent Facial Expression Recognition with Histograms of Prominent Edge Directions

  • Makhmudkhujaev, Farkhod;Iqbal, Md Tauhid Bin;Arefin, Md Rifat;Ryu, Byungyong;Chae, Oksam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.6000-6017
    • /
    • 2018
  • This paper presents a new descriptor, named Histograms of Prominent Edge Directions (HPED), for the recognition of facial expressions in a person-independent environment. In this paper, we raise the issue of sampling error in generating the code-histogram from spatial regions of the face image, as observed in the existing descriptors. HPED describes facial appearance changes based on the statistical distribution of the top two prominent edge directions (i.e., primary and secondary direction) captured over small spatial regions of the face. Compared to existing descriptors, HPED uses a smaller number of code-bins to describe the spatial regions, which helps avoid sampling error despite having fewer samples while preserving the valuable spatial information. In contrast to the existing Histogram of Oriented Gradients (HOG) that uses the histogram of the primary edge direction (i.e., gradient orientation) only, we additionally consider the histogram of the secondary edge direction, which provides more meaningful shape information related to the local texture. Experiments on popular facial expression datasets demonstrate the superior performance of the proposed HPED against existing descriptors in a person-independent environment.

컬러 및 질감 특징 추출을 이용한 향상된 이미지 검색 기법 (Improved Image Retrieval Method using Color and Texture Feature Extraction)

  • 박성현;신인경;안효창;이용환;조한진;이준환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1563-1566
    • /
    • 2013
  • 최근 네트워크와 멀티미디어 관련 기술의 발달로 이미지 및 동영상과 같은 대용량 멀티미디어 데이터가 증가하고 있다. 이에 따라 대용량의 데이터에서 영상 정보의 효율적인 검색 방법이 요구 되고 있다. 하지만 기존의 전통적인 색인기술은 관리자가 영상을 직접 보면서 적절한 텍스트 내용을 입력하는 방법으로 시간이 많이 소요되며, 관리자의 성향에 따라 색인어의 입력이 다를 수 있어 검색시 오류를 발생시킬 수 있다. 따라서 본 논문에서는 영상으로부터 컬러 특징과 질감 특징을 추출하여 보다 효율적으로 내용 기반 영상 검색을 수행하는 방법을 제안한다. 실험을 통하여 다른 기존의 영상 검색 방법보다 검색 효율성에서 안정적이며 보다 나은 결과를 얻음을 확인한다.

PathGAN: Local path planning with attentive generative adversarial networks

  • Dooseop Choi;Seung-Jun Han;Kyoung-Wook Min;Jeongdan Choi
    • ETRI Journal
    • /
    • 제44권6호
    • /
    • pp.1004-1019
    • /
    • 2022
  • For autonomous driving without high-definition maps, we present a model capable of generating multiple plausible paths from egocentric images for autonomous vehicles. Our generative model comprises two neural networks: feature extraction network (FEN) and path generation network (PGN). The FEN extracts meaningful features from an egocentric image, whereas the PGN generates multiple paths from the features, given a driving intention and speed. To ensure that the paths generated are plausible and consistent with the intention, we introduce an attentive discriminator and train it with the PGN under a generative adversarial network framework. Furthermore, we devise an interaction model between the positions in the paths and the intentions hidden in the positions and design a novel PGN architecture that reflects the interaction model for improving the accuracy and diversity of the generated paths. Finally, we introduce ETRIDriving, a dataset for autonomous driving, in which the recorded sensor data are labeled with discrete high-level driving actions, and demonstrate the state-of-the-art performance of the proposed model on ETRIDriving in terms of accuracy and diversity.

학습기반 효율적인 얼굴 검출 시스템 설계 (Design of an efficient learning-based face detection system)

  • 김현식;김완태;박병준
    • 디지털산업정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.213-220
    • /
    • 2023
  • Face recognition is a very important process in video monitoring and is a type of biometric technology. It is mainly used for identification and security purposes, such as ID cards, licenses, and passports. The recognition process has many variables and is complex, so development has been slow. In this paper, we proposed a face recognition method using CNN, which has been re-examined due to the recent development of computers and algorithms, and compared with the feature comparison method, which is an existing face recognition algorithm, to verify performance. The proposed face search method is divided into a face region extraction step and a learning step. For learning, face images were standardized to 50×50 pixels, and learning was conducted while minimizing unnecessary nodes. In this paper, convolution and polling-based techniques, which are one of the deep learning technologies, were used for learning, and 1,000 face images were randomly selected from among 7,000 images of Caltech, and as a result of inspection, the final recognition rate was 98%.

인공지능 기반 건전성 예측 및 관리에 관한 국내 연구 동향 분석 (Analysis of Domestic Research Trends on Artificial Intelligence-Based Prognostics and Health Management)

  • 정예은;김용수
    • 품질경영학회지
    • /
    • 제51권2호
    • /
    • pp.223-245
    • /
    • 2023
  • Purpose: This study aim to identify the trends in AI-based PHM technology that can enhance reliability and minimize costs. Furthermore, this research provides valuable guidelines for future studies in various industries Methods: In this study, I collected and selected AI-based PHM studies, established classification criteria, and analyzed research trends based on classified fields and techniques. Results: Analysis of 125 domestic studies revealed a greater emphasis on machinery in both diagnosis and prognosis, with more papers dedicated to diagnosis. various algorithms were employed, including CNN for image diagnosis and frequency analysis for signal data. LSTM was commonly used in prognosis for predicting failures and remaining life. Different industries, data types, and objectives required diverse AI techniques, with GAN used for data augmentation and GA for feature extraction. Conclusion: As studies on AI-based PHM continue to grow, selecting appropriate algorithms for data types and analysis purposes is essential. Thus, analyzing research trends in AI-based PHM is crucial for its rapid development.

Counterfactual image generation by disentangling data attributes with deep generative models

  • Jieon Lim;Weonyoung Joo
    • Communications for Statistical Applications and Methods
    • /
    • 제30권6호
    • /
    • pp.589-603
    • /
    • 2023
  • Deep generative models target to infer the underlying true data distribution, and it leads to a huge success in generating fake-but-realistic data. Regarding such a perspective, the data attributes can be a crucial factor in the data generation process since non-existent counterfactual samples can be generated by altering certain factors. For example, we can generate new portrait images by flipping the gender attribute or altering the hair color attributes. This paper proposes counterfactual disentangled variational autoencoder generative adversarial networks (CDVAE-GAN), specialized for data attribute level counterfactual data generation. The structure of the proposed CDVAE-GAN consists of variational autoencoders and generative adversarial networks. Specifically, we adopt a Gaussian variational autoencoder to extract low-dimensional disentangled data features and auxiliary Bernoulli latent variables to model the data attributes separately. Also, we utilize a generative adversarial network to generate data with high fidelity. By enjoying the benefits of the variational autoencoder with the additional Bernoulli latent variables and the generative adversarial network, the proposed CDVAE-GAN can control the data attributes, and it enables producing counterfactual data. Our experimental result on the CelebA dataset qualitatively shows that the generated samples from CDVAE-GAN are realistic. Also, the quantitative results support that the proposed model can produce data that can deceive other machine learning classifiers with the altered data attributes.