• 제목/요약/키워드: Extraction Feature Vector

검색결과 354건 처리시간 0.028초

정규화된 형상 모델을 이용한 뼈 나이 측정 방법 (A Bone Age Assessment Method Based on Normalized Shape Model)

  • 유주환;이종민;김회율
    • 한국멀티미디어학회논문지
    • /
    • 제12권3호
    • /
    • pp.383-396
    • /
    • 2009
  • 뼈 나이 측정은 소아의 내분비계 관련 질병 진단을 위해 소아과에서 널리 사용되는 방법이다. 그러나 전문 인력이 부족하여 자동화된 측정 방법에 대한 꾸준한 요구가 있었다. 따라서 본 논문에서는 패턴 인식기법을 이용한 자동화된 뼈 나이 측정 알고리즘을 제안한다. 제안하는 알고리즘은 X-ray 영상에서 손가락뼈의 각 부분을 자동으로 분류하는 과정과 분류된 뼈 영상으로부터 정규화된 형상 모델을 추출하는 과정, 그리고 정규화된 형상 모델로부터 뼈 나이를 측정하는 과정으로 구성된다. 제안하는 알고리즘은 능동 형상 모델(Active Shape Model: ASM)을 이용하여 나이 측정에 사용되는 특정값 추출의 정확도를 향상시켰으며, 뼈 나이 분류를 위해 사용된 Support Vector Machine(SVM)의 입력으로 정규화된 형상 모델로부터 얻어진 각 뼈의 크기와 비율을 특징값으로 사용하였다. 성능 평가를 위해서 한양대학교 부속병원에서 제공한 영상에 대해 전문가가 평가한 나이와 제안한 알고리즘을 이용하여 측정된 나이를 통계적으로 비교 분석하였다. 실험을 통하여 본 논문에서 제안한 특징값과 알고리즘으로 뼈 나이를 진단한 결과, 전문가에 의한 결과와 평균 0.679살의 오차 이내의 뛰어난 뼈 나이 측정 성능을 보였다.

  • PDF

MLP의 함수근사화 능력을 이용한 이동통신 3차원 전파 손실 모델링 (3D Wave Propagation Loss Modeling in Mobile Communication using MLP's Function Approximation Capability)

  • 양서민;이혁준
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1143-1155
    • /
    • 1999
  • 셀룰러 방식의 이동통신 시스템에서 전파의 유효신호 도달범위를 예측하기 위해서는 전파전파 모델을 이용한 예측기법이 주로 사용된다. 그러나, 전파과정에서 주변 지형지물에 의해 발생하는 전파손실은 매우 복잡한 비선형적인 특성을 가지며 수식으로는 정확한 표현이 불가능하다. 본 논문에서는 신경회로망의 함수 근사화 능력을 이용하여 전파손실 예측모델을 생성하는 방법을 제안한다. 즉, 전파손실을 송수신 안테나간의 거리, 송신안테나의 특성, 장애물 투과영향, 회절특성, 도로, 수면에 의한 영향 등과 같은 전파환경 변수들의 함수로 가정하고, 신경회로망 학습을 통하여 함수를 근사화한다. 전파환경 변수들이 신경회로망 입력으로 사용되기 위해서는 3차원 지형도와 벡터지도를 이용하여 전파의 반사, 회절, 산란 등의 물리적인 특성이 고려된 특징 추출을 통해 정량적인 수치들을 계산한다. 이와 같이 얻어진 훈련데이타를 이용한 신경회로망 학습을 통해 전파손실 모델을 완성한다. 이 모델을 이용하여 서울 도심 지역의 실제 서비스 환경에 대한 타 모델과의 비교실험결과를 통해 제안하는 모델의 우수성을 보인다.Abstract In cellular mobile communication systems, wave propagation models are used in most cases to predict cell coverage. The amount of propagation loss induced by the obstacles in the propagation path, however, is a highly non-linear function, which cannot be easily represented mathematically. In this paper, we introduce the method of producing propagation loss prediction models by function approximation using neural networks. In this method, we assume the propagation loss is a function of the relevant parameters such as the distance from the base station antenna, the specification of the transmitter antenna, obstacle profile, diffraction effect, road, and water effect. The values of these parameters are produced from the field measurement data, 3D digital terrain maps, and vector maps as its inputs by a feature extraction process, which takes into account the physical characteristics of electromagnetic waves such as reflection, diffraction and scattering. The values produced are used as the input to the neural network, which are then trained to become the propagation loss prediction model. In the experimental study, we obtain a considerable amount of improvement over COST-231 model in the prediction accuracy using this model.

발화구간 검출을 위해 학습된 CNN 기반 입 모양 인식 방법 (Lip Reading Method Using CNN for Utterance Period Detection)

  • 김용기;임종관;김미혜
    • 디지털융복합연구
    • /
    • 제14권8호
    • /
    • pp.233-243
    • /
    • 2016
  • 소음환경에서의 음성인식 문제점으로 인해 1990년대 중반부터 음성정보와 영양정보를 결합한 AVSR(Audio Visual Speech Recognition) 시스템이 제안되었고, Lip Reading은 AVSR 시스템에서 시각적 특징으로 사용되었다. 본 연구는 효율적인 AVSR 시스템을 구축하기 위해 입 모양만을 이용한 발화 단어 인식률을 극대화하는데 목적이 있다. 본 연구에서는 입 모양 인식을 위해 실험단어를 발화한 입력 영상으로부터 영상의 전처리 과정을 수행하고 입술 영역을 검출한다. 이후 DNN(Deep Neural Network)의 일종인 CNN(Convolution Neural Network)을 이용하여 발화구간을 검출하고, 동일한 네트워크를 사용하여 입 모양 특징 벡터를 추출하여 HMM(Hidden Markov Mode)으로 인식 실험을 진행하였다. 그 결과 발화구간 검출 결과는 91%의 인식률을 보임으로써 Threshold를 이용한 방법에 비해 높은 성능을 나타냈다. 또한 입모양 인식 실험에서 화자종속 실험은 88.5%, 화자 독립 실험은 80.2%로 이전 연구들에 비해 높은 결과를 보였다.

클러스터링과 방사기저함수 네트워크를 이용한 실시간 유도전동기 고장진단 (Real-time Fault Diagnosis of Induction Motor Using Clustering and Radial Basis Function)

  • 박장환;이대종;전명근
    • 조명전기설비학회논문지
    • /
    • 제20권6호
    • /
    • pp.55-62
    • /
    • 2006
  • 본 논문에서는 3상 유도전동기의 고장진단을 수행하기 위해 패턴인식에 기반을 둔 진단 알고리즘을 제안한다. 실험 장치는 유도전동기 구동의 기계적 모듈과 고장신호를 구하기 위한 데이터 획득 모듈로 구성하였다. 진단 절차를 위한 첫 번째 단계로서 전처리 과정은 획득한 전류를 단순화하고 정규화 하는 것을 수행한다. 데이터의 단순화 과정은 3상전류를 Concrodia 벡터의 크기로 변환하는 것을 적용한다. 다음으로 특징 추출 단계를 커널 주성분 분석과 선형판별분석으로 수행하며, 마지막으로, 분류기는 방사기저함수 네트워크를 사용한다. 다양한 부하에 대하여 몇몇의 전기적 고장과 기계적 고장 하에서 획득한 데이터를 이용하여 제안된 방법의 타당성을 검증한다.

2D-MELPP: A two dimensional matrix exponential based extension of locality preserving projections for dimensional reduction

  • Xiong, Zixun;Wan, Minghua;Xue, Rui;Yang, Guowei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.2991-3007
    • /
    • 2022
  • Two dimensional locality preserving projections (2D-LPP) is an improved algorithm of 2D image to solve the small sample size (SSS) problems which locality preserving projections (LPP) meets. It's able to find the low dimension manifold mapping that not only preserves local information but also detects manifold embedded in original data spaces. However, 2D-LPP is simple and elegant. So, inspired by the comparison experiments between two dimensional linear discriminant analysis (2D-LDA) and linear discriminant analysis (LDA) which indicated that matrix based methods don't always perform better even when training samples are limited, we surmise 2D-LPP may meet the same limitation as 2D-LDA and propose a novel matrix exponential method to enhance the performance of 2D-LPP. 2D-MELPP is equivalent to employing distance diffusion mapping to transform original images into a new space, and margins between labels are broadened, which is beneficial for solving classification problems. Nonetheless, the computational time complexity of 2D-MELPP is extremely high. In this paper, we replace some of matrix multiplications with multiple multiplications to save the memory cost and provide an efficient way for solving 2D-MELPP. We test it on public databases: random 3D data set, ORL, AR face database and Polyu Palmprint database and compare it with other 2D methods like 2D-LDA, 2D-LPP and 1D methods like LPP and exponential locality preserving projections (ELPP), finding it outperforms than others in recognition accuracy. We also compare different dimensions of projection vector and record the cost time on the ORL, AR face database and Polyu Palmprint database. The experiment results above proves that our advanced algorithm has a better performance on 3 independent public databases.

Feature Extraction and Evaluation for Classification Models of Injurious Falls Based on Surface Electromyography

  • Lim, Kitaek;Choi, Woochol Joseph
    • 한국전문물리치료학회지
    • /
    • 제28권2호
    • /
    • pp.123-131
    • /
    • 2021
  • Background: Only 2% of falls in older adults result in serious injuries (i.e., hip fracture). Therefore, it is important to differentiate injurious versus non-injurious falls, which is critical to develop effective interventions for injury prevention. Objects: The purpose of this study was to a. extract the best features of surface electromyography (sEMG) for classification of injurious falls, and b. find a best model provided by data mining techniques using the extracted features. Methods: Twenty young adults self-initiated falls and landed sideways. Falling trials were consisted of three initial fall directions (forward, sideways, or backward) and three knee positions at the time of hip impact (the impacting-side knee contacted the other knee ("knee together") or the mat ("knee on mat"), or neither the other knee nor the mat was contacted by the impacting-side knee ("free knee"). Falls involved "backward initial fall direction" or "free knee" were defined as "injurious falls" as suggested from previous studies. Nine features were extracted from sEMG signals of four hip muscles during a fall, including integral of absolute value (IAV), Wilson amplitude (WAMP), zero crossing (ZC), number of turns (NT), mean of amplitude (MA), root mean square (RMS), average amplitude change (AAC), difference absolute standard deviation value (DASDV). The decision tree and support vector machine (SVM) were used to classify the injurious falls. Results: For the initial fall direction, accuracy of the best model (SVM with a DASDV) was 48%. For the knee position, accuracy of the best model (SVM with an AAC) was 49%. Furthermore, there was no model that has sensitivity and specificity of 80% or greater. Conclusion: Our results suggest that the classification model built upon the sEMG features of the four hip muscles are not effective to classify injurious falls. Future studies should consider other data mining techniques with different muscles.

강인한 움직임 영역 검출과 화재의 효과적인 텍스처 특징을 이용한 화재 감지 방법 (Fire Detection Approach using Robust Moving-Region Detection and Effective Texture Features of Fire)

  • 트룩 뉘엔;강명수;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.21-28
    • /
    • 2013
  • 본 논문은 그레이레벨히스토그램을 이용한 움직임 영역검출, 퍼지 클러스터링을 이용한 칼라 분할, 그레이 레벨 동시발생 행렬을 이용한 특징 추출 및 서포터 벡터 머신을 이용한 화재 분류 등과 같은 다중 이종 알고리즘을 포함하고 있는 효과적인 화재 감지 방법을 제안한다. 제안한 방법은 움직임 영역을 검출하기 위해그레이레벨히스토그램에 기초한 최적의 임계값을 결정하고 난 후, CIE LAB 칼라 공간에서 퍼지 클러스터링을 적용하여 칼라 분할을 수행한다. 이러한 두 단계는 화재의 후보 영역을 기술하는데 도움이 된다. 다음으로 그레이 레벨 동시발생 행렬을 이용하여 화재의 특징을 추출하고, 이러한 특징들은 화재인지 아닌지를 분류하기 위해 서포터 벡터 머신의 입력으로 사용된다. 제안한 방법을 평가하기위해 기존의 두 알고리즘과 화재 검출율 및 오류 화재 검출율에서 비교하였다. 모의실험결과, 제안한 방법은 97.94%의 화재 검출율 및 4.63%의 오류 화재 검출율을 보임으로써 기존의 화재 감지 알고리즘보다 우수성을 보였다.

전화망에서의 음성인식을 위한 전처리 연구 (Front-End Processing for Speech Recognition in the Telephone Network)

  • 전원석;신원호;양태영;김원구;윤대희
    • 한국음향학회지
    • /
    • 제16권4호
    • /
    • pp.57-63
    • /
    • 1997
  • 본 논문에서는 다양한 전화선 채널에서 수집된 한국통신(KT)의 데이터베이스를 이용하여 인식 시스템의 성능을 향상시키기 위한 효율적인 특징벡터 및 전처리방법을 연구하였다. 먼저 잡음 및 주변 환경 변화에 강인한 갓으로 알려져 있는 특징벡터들을 이용한 인식 성능을 비교하고, 가중 켑스트랄 거리측정 방법을 이용하여 인식시스템의 성능 향상을 검증하였다. 실험 결과, KT의 인식 시스템에서 이용하는 LPC 켑스트럼의 경우에 비하여 PLP(Perceptual Linear Prediction)과 MFCC)Mel Frequency Cepstral Coefficient)등에 대하여 인식률이 향상되었다. 켑스트럼간의 거리측정에 있어서는 RPS(Root Power Sums)와 BPL(Band Pass Lifter)과 같은 가중 켑스트랄 거리측정 함수들이 인식성능 향상에 도움을 주었다. 스펙트럼 차감법(Spectral Subtraction)의 적용은 왜곡에 의한 효과가 커서 인식률이 저하되었지만, RASTA(RelAtive SpecTrAl) 처리방법, CMS(Cepstral Mean Subtraction), SBR(Signal Bias Removal)의 적용시에는 인식 성능 향상을 보였다. 특히, CMS 방법은 간편하면서도 높은 인식 성능 향상을 보였다. 마지막으로, CMS의 실시간 구현을 위한 방법들의 인식 성능을 비교하고, 인식 성능 저하를 막기 위한 개선책을 제시하였다.

  • PDF

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

인공 신경망 기반의 지문 영상 복원 알고리즘 (An Algorithm of Fingerprint Image Restoration Based on an Artificial Neural Network)

  • 장석우;이사무엘;김계영
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.530-536
    • /
    • 2020
  • 일반적인 지문 인식기에서 이용되는 미뉴셔 특징은 표현 공격에는 강건하지만 오 정합률이 상대적으로 높다는 약점이 있다. 따라서 미뉴셔 특징은 스켈리톤 영상과 함께 이용되는 경향이 있다. 보통 지문의 미뉴셔 특징에 대한 보안 취약성 연구는 많이 진행되어 있으나 스켈리톤에 대한 취약성 연구는 미약한 형편이므로 본 연구에서는 스켈리톤에 대한 표현 공격의 취약성을 분석하고자 한다. 이를 위해, 본 연구에서는 지문의 스켈리톤으로부터 학습 알고리즘을 사용해 원래의 지문을 복구하는 방법을 제시한다. 본 논문에서 제시된 방법은 기존의 Pix2Pix 모델에 잠재 벡터를 추가한 새로운 학습 모델인 Pix2Pix을 제안하여, 보다 자연스러운 지문을 생성한다. 본 논문의 실험 결과에서는 제시된 학습 알고리즘을 이용해 원래의 지문을 복원한 다음, 복원된 지문을 지문 인식기에 입력시켜 높은 인식률을 달성하였다. 그러므로 본 연구는 스켈리톤을 함께 이용하는 지문 인식기는 표현 공격에 취약함을 검증하였다. 본 논문에서 제시된 접근방법은 지문 인식 및 복원, 비디오 보안, 생체 인식 등과 연관된 많은 실제적인 응용 분야에서 유용하게 사용될 것으로 기대된다.