• 제목/요약/키워드: feature extraction, and classification

검색결과 662건 처리시간 0.02초

Medical Image Analysis Using Artificial Intelligence

  • Yoon, Hyun Jin;Jeong, Young Jin;Kang, Hyun;Jeong, Ji Eun;Kang, Do-Young
    • 한국의학물리학회지:의학물리
    • /
    • 제30권2호
    • /
    • pp.49-58
    • /
    • 2019
  • Purpose: Automated analytical systems have begun to emerge as a database system that enables the scanning of medical images to be performed on computers and the construction of big data. Deep-learning artificial intelligence (AI) architectures have been developed and applied to medical images, making high-precision diagnosis possible. Materials and Methods: For diagnosis, the medical images need to be labeled and standardized. After pre-processing the data and entering them into the deep-learning architecture, the final diagnosis results can be obtained quickly and accurately. To solve the problem of overfitting because of an insufficient amount of labeled data, data augmentation is performed through rotation, using left and right flips to artificially increase the amount of data. Because various deep-learning architectures have been developed and publicized over the past few years, the results of the diagnosis can be obtained by entering a medical image. Results: Classification and regression are performed by a supervised machine-learning method and clustering and generation are performed by an unsupervised machine-learning method. When the convolutional neural network (CNN) method is applied to the deep-learning layer, feature extraction can be used to classify diseases very efficiently and thus to diagnose various diseases. Conclusions: AI, using a deep-learning architecture, has expertise in medical image analysis of the nerves, retina, lungs, digital pathology, breast, heart, abdomen, and musculo-skeletal system.

2D-MELPP: A two dimensional matrix exponential based extension of locality preserving projections for dimensional reduction

  • Xiong, Zixun;Wan, Minghua;Xue, Rui;Yang, Guowei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.2991-3007
    • /
    • 2022
  • Two dimensional locality preserving projections (2D-LPP) is an improved algorithm of 2D image to solve the small sample size (SSS) problems which locality preserving projections (LPP) meets. It's able to find the low dimension manifold mapping that not only preserves local information but also detects manifold embedded in original data spaces. However, 2D-LPP is simple and elegant. So, inspired by the comparison experiments between two dimensional linear discriminant analysis (2D-LDA) and linear discriminant analysis (LDA) which indicated that matrix based methods don't always perform better even when training samples are limited, we surmise 2D-LPP may meet the same limitation as 2D-LDA and propose a novel matrix exponential method to enhance the performance of 2D-LPP. 2D-MELPP is equivalent to employing distance diffusion mapping to transform original images into a new space, and margins between labels are broadened, which is beneficial for solving classification problems. Nonetheless, the computational time complexity of 2D-MELPP is extremely high. In this paper, we replace some of matrix multiplications with multiple multiplications to save the memory cost and provide an efficient way for solving 2D-MELPP. We test it on public databases: random 3D data set, ORL, AR face database and Polyu Palmprint database and compare it with other 2D methods like 2D-LDA, 2D-LPP and 1D methods like LPP and exponential locality preserving projections (ELPP), finding it outperforms than others in recognition accuracy. We also compare different dimensions of projection vector and record the cost time on the ORL, AR face database and Polyu Palmprint database. The experiment results above proves that our advanced algorithm has a better performance on 3 independent public databases.

Multi-classification Sensitive Image Detection Method Based on Lightweight Convolutional Neural Network

  • Yueheng Mao;Bin Song;Zhiyong Zhang;Wenhou Yang;Yu Lan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권5호
    • /
    • pp.1433-1449
    • /
    • 2023
  • In recent years, the rapid development of social networks has led to a rapid increase in the amount of information available on the Internet, which contains a large amount of sensitive information related to pornography, politics, and terrorism. In the aspect of sensitive image detection, the existing machine learning algorithms are confronted with problems such as large model size, long training time, and slow detection speed when auditing and supervising. In order to detect sensitive images more accurately and quickly, this paper proposes a multiclassification sensitive image detection method based on lightweight Convolutional Neural Network. On the basis of the EfficientNet model, this method combines the Ghost Module idea of the GhostNet model and adds the SE channel attention mechanism in the Ghost Module for feature extraction training. The experimental results on the sensitive image data set constructed in this paper show that the accuracy of the proposed method in sensitive information detection is 94.46% higher than that of the similar methods. Then, the model is pruned through an ablation experiment, and the activation function is replaced by Hard-Swish, which reduces the parameters of the original model by 54.67%. Under the condition of ensuring accuracy, the detection time of a single image is reduced from 8.88ms to 6.37ms. The results of the experiment demonstrate that the method put forward has successfully enhanced the precision of identifying multi-class sensitive images, significantly decreased the number of parameters in the model, and achieved higher accuracy than comparable algorithms while using a more lightweight model design.

EIV와 MLP를 이용한 뇌파 기반 운전자의 졸음 감지 시스템 (Electroencephalogram-Based Driver Drowsiness Detection System Using Errors-In-Variables(EIV) and Multilayer Perceptron(MLP))

  • 한형섭;송경영
    • 한국통신학회논문지
    • /
    • 제39C권10호
    • /
    • pp.887-895
    • /
    • 2014
  • 졸음운전은 전체 교통사고 원인 중 큰 비중을 차지하며 그 위험성이 음주운전보다도 크다고 알려져 있다. 따라서 운전자의 졸음을 판단하고 경고하는 시스템 개발에 대한 관심이 높아지고 있으며, 뇌파를 분석하는 것이 운전자의 피로와 졸음을 감지하는데 효과적이라는 연구결과들이 발표되었다. 본 논문은 짧은 시간에 높은 해상도를 가지는 auto-regressive 모델 기법 중 잡음에 강인한 errors-in-variables(EIV) 방법을 이용하여 특징벡터를 추출하고, 다층신경망(multilayer perceptron; MLP)에 적용하여 운전자의 상태를 각성, 천이, 졸음의 세 가지 상태로 분류하는 졸음 감지 시스템을 제안한다. 생체신호의 측정 환경에 따른 성능을 평가하기 위해 높은 진단률을 갖도록 하는 EIV차수를 결정하고, 잡음에 대한 강인성을 확인하기 위해 신호대 잡음비(signal-to-noise ratio; SNR)에 따른 성능을 선형 예측 부호화(linear predictive coding; LPC) 방법과 비교하였다. 이 결과로부터 제안한 EIV와 MLP를 결합한 졸음 감지 시스템은 기존의 LPC와 MLP를 이용한 시스템에 대해 우수한 성능을 얻을 수 있음을 확인하였다.

한글 외곽선 폰트의 자소 분할 (Hangul Component Decomposition in Outline Fonts)

  • 구상옥;정순기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-21
    • /
    • 2011
  • 본 논문은 한글 외곽선 폰트를 입력으로 글자의 초성, 중성, 종성 요소(컴포넌트)를 통계적-구조적 정보를 이용하여 분할하는 방법을 제안한다. 한 폰트 내에서 한글 컴포넌트는 통계적으로 일정한 위치에 나타나며, 각 컴포넌트를 이루는 획 간의 관계는 그 컴포넌트의 구조적 특징을 나타낸다. 우리는 먼저 각 컴포넌트의 위치를 저장하는 컴포넌트 히스토그램을 생성하여 컴포넌트 위치에 관한 통계 정보를 저장하였다. 그리고 글자의 구조적 정보를 반영하기 위해 픽셀의 방향성 확률을 기반으로 픽셀클러스터를 만들고, 클러스터의 위치, 방향 및 크기, 클러스터간 인접성 정보를 이용하여 후보 획을 추출하였다. 마지막으로 릴렉세이션 레이블링을 통해 후보 획 집합과 미리 정의된 글자 모델 간의 가장 적합한 구조적 매치를 구하였다. 본 논문에서 제안한 컴포넌트 분할방법은 한글 폰트의 조형적 특징에 관한 연구 및 이를 활용한 폰트분류 빛 폰트검색에 활용될 수 있다.

컬러와 패턴을 이용한 텍스타일 영상에서의 감정인식 시스템 (Emotion Recognition Using Color and Pattern in Textile Images)

  • 신윤희;김영래;김은이
    • 전자공학회논문지CI
    • /
    • 제45권6호
    • /
    • pp.154-161
    • /
    • 2008
  • 본 논문에서는 컬러와 패턴 정보를 이용하여 텍스타일 영상에 포함된 감성을 자동으로 인식할 수 있는 방법을 제안한다. 이때, 감성을 표현하기 위해 고바야시의 10가지 감성 그룹 - {romantic, clear, natural, casual, elegant chic, dynamic, classic, dandy, modern}- 을 이용한다. 제안된 시스템은 특징 추출과 분류로 구성된다. 특징 추출 단계에서는 주관적인 감성을 물리적인 영상 특징으로 표현하기 위해 텍스타일을 구성하는 대표 컬러와 패턴을 추출 한다. 이 때 대표 컬러를 추출하기 위해서 양자화 기법을 이용하고, 패턴정보를 표현하기 위해서는 웨이블릿 변환 후의 통계적인 정보를 이용한다 추출된 컬러와 패턴 특징은 신경망을 이용한 분류기의 입력으로 사용되고, 분류기를 통해 입력 텍스타일이 임의의 감성을 가지는지 여부가 결정된다. 제안된 감성인식 방법의 효율성을 증명하기 위해서 인위적인 도메인, 패션 도메인, 인테리어 도메인에서 얻어진 389장의 텍스타일 영상에서 실험하였다. 다양한 도메인의 영상에 대해 사용된 결과 제안된 방법은 100%의 정확도와 99%의 재현율을 보였다. 이러한 실험 결과는 제안된 감성인식 방법이 다양한 텍스타일 관련 산업분야에 일반화되어 사용될 수 있음을 보여주었다.

LDA를 이용한 얼굴인식에서의 Small Sample Size문제 해결을 위한 Resampling 방법 (A Resampling Method for Small Sample Size Problems in Face Recognition using LDA)

  • 오재현;곽노준
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.78-88
    • /
    • 2009
  • 본 논문에서는 LDA를 이용한 얼굴 인식에서 발생하는 small sample size 문제를 해결하기 위한 효율적인 방법인 resampling 방법을 제안한다. 기존에는 regularization method를 사용하여 small sample size 문제를 해결하였는데, 이 방법을 사용하면 클래스내 분산행렬의 특이성을 없앨 수 있지만, 클래스내 분산행렬과 상수를 곱하는 과정에서 상수 값을 임의로 정해 주어야 하고, 이 상수 값에 따라 인식률이 개선되지 않을 수 있다는 문제점이 발생한다. 제안된 resampling 방법을 이용하여 학습 데이터의 수를 늘리면, regularization method보다 개선된 인식률을 얻을 수 있고, 또한 경험적으로 상수 값을 지정해 주는 과정을 거치지 않아도 되는 장점이 있다.

필터 및 특징 선택 기반의 적응형 얼굴 인식 방법 (An Adaptive Method For Face Recognition Based Filters and Selection of Features)

  • 조병모;김기한;이필규
    • 한국콘텐츠학회논문지
    • /
    • 제9권6호
    • /
    • pp.1-8
    • /
    • 2009
  • 2D 영상 이미지를 인식하는데 있어서, 테스트 이미지를 입력 받는 카메라의 설치 공간 및 설정 상황에 따라 밝기, 명암, 빛의 방향 등과 같은 인식의 성능에 영향을 끼칠 수 있는 요소들이 매우 많이 존재한다. 본 논문은 카메라가 위치한 환경 상의 최소의 샘플 이미지를 가지고, 그 환경에서 입력되는 영상의 인식 성공률을 높일 수 있는 적응형 얼굴 인식 방법을 제안하고 있다. 제안한 적응형 얼굴 인식은 두 개의 부분으로 구성되어 있는데, 하나는 환경 적응을 하기 위한 부분이고, 다른 하나는 얼굴 인식을 수행하는 부분이다. 전자인 환경 적응 모듈에서는 안정 상태 유전 알고리즘을 사용하여 인식기가 최적의 성능을 낼 수 있는 필터 조합과 필터 파라메터와 특징 벡터 집합 차원을 결정하고, 후자인 얼굴 인식 모듈에서는 그 결과를 사용하여 얼굴 인식 결과를 확인한다. 얼굴 인식 과정에서 이미지 사이의 유사도를 측정하기 위해서 가보 웨이블릿을 사용하였고, 인식의 결과를 도출하는 과정에서는 k-Nearest Neighbor을 사용하였다. 적응형 얼굴 인식 방법을 테스트 하기위해, 사인 함수의 가중치를 사용한 명암 노이즈, 임펄스 노이즈, 복합 노이즈에 관하여 각각 실험을 하였고, 진화 후에는 일반적으로 발생할 수 있는 노이즈에 대한 급격한 인식률 저하를 방지할 수 있음을 확인하였다.

폐암 생존율 향상을 위한 아다부스트 학습 기반의 컴퓨터보조 진단방법에 관한 연구 (Study of Computer Aided Diagnosis for the Improvement of Survival Rate of Lung Cancer based on Adaboost Learning)

  • 원철호
    • 재활복지공학회논문지
    • /
    • 제10권1호
    • /
    • pp.87-92
    • /
    • 2016
  • 본 논문에는 관심 영역의 폐실질 영역을 양성과 악성 결절의 분류를 위한 특징인자에 포함으로써 분류성능을 개선하였다. CT를 통해 확인되는 매우 작은 폐결절(4~10mm)은 고형 종양 내에 CT 데이터 복셀 수가 제한되어 기존 컴퓨터보조 진단도구를 통해 처리하기가 어렵다. 이러한 아주 작은 폐 결절의 경우 분석을 위해 주변의 실질을 포함하여 특징인자를 추출하는 것이 CT 복셀 세트를 증가시킬 수 있으며, CT 스캐너와 매개 변수에 대한 컴퓨터 보조진단도구의 유연성을 확보함으로써 진단 성능을 개선할 수 있다. 나이브 베이스와 SVM 약분류기를 이용하는 아다부스트 학습을 통해 304개의 특징인자로부터 유효한 특징인자를 결정하였으며, 제안한 방법을 COPDGene 데이터에 적용한 결과 100%의 정확도, 민감도 및 특이도의 결과를 획득하여 컴퓨터 보조진단에 유용하게 사용될 수 있음을 보였다.

선박 탑승자를 위한 다중 센서 기반의 스마트폰을 이용한 활동 인식 시스템 (Activity Recognition of Workers and Passengers onboard Ships Using Multimodal Sensors in a Smartphone)

  • 라지브 쿠마 피야레;이성로
    • 한국통신학회논문지
    • /
    • 제39C권9호
    • /
    • pp.811-819
    • /
    • 2014
  • 상황 인식은 유비쿼터스컴퓨팅 환경에 대한 진화를 변화시켰고 무선 센서네트워크 기술은 많은 응용기기에 대한 새로운 방법을 제시하였다. 특히, 행동 인식은 사람의 응용서비스를 제공하는데 있어 특정 사용자의 상황을 인식하는 핵심 요소로 의학, 취미, 군사 분야에서 폭넓은 응용분야를 갖고 있고 사용반경의 확대에서도 효율과 정확도를 높이는 방법에 크게 기여한다. 스마트폰 센서로부터 나오는 데이터로부터 프레임이 512인셈플 데이터를 얻어, 프레임간50%의 오버랩을 갖도록 하고 Machine Learning Algorithm 인 WEKA Experimenter (University of Waikato, Version 3.6.10)을 써서 데이더로부터 시간영역 특징값을 추출함으로써 행동 인식에 대한 99.33%의 정확도를 얻을 수 있었다. 또한, WEKA Experimenter의 사용기법인 C4.5 Decision Tree과 다른 방법인 BN, NB, SMO or Logistic Regression간의 비교실험을 하였다.