• 제목/요약/키워드: Statistical feature

검색결과 666건 처리시간 0.028초

Sequence-based 5-mers highly correlated to epigenetic modifications in genes interactions

  • Salimi, Dariush;Moeini, Ali;Masoudi?Nejad, Ali
    • Genes and Genomics
    • /
    • 제40권12호
    • /
    • pp.1363-1371
    • /
    • 2018
  • One of the main concerns in biology is extracting sophisticated features from DNA sequence for gene interaction determination, receiving a great deal of researchers' attention. The epigenetic modifications along with their patterns have been intensely recognized as dominant features affecting on gene expression. However, studying sequenced-based features highly correlated to this key element has remained limited. The main objective in this research was to propose a new feature highly correlated to epigenetic modifications capable of classification of genes. In this paper, classification of 34 genes in PPAR signaling pathway associated with muscle fat tissue in human was performed. Using different statistical outlier detection methods, we proposed that 5-mers highly correlated to epigenetic modifications can correctly categorize the genes involved in the same biological pathway or process. Thirty-four genes in PPAR signaling pathway were classified via applying a proposed feature, 5-mers strongly associated to 17 different epigenetic modifications. For this, diverse statistical outlier detection methods were applied to specify the group of thoroughly correlated genes. The results indicated that these 5-mers can appropriately identify correlated genes. In addition, our results corresponded to GeneMania interaction information, leading to support the suggested method. The appealing findings imply that not only epigenetic modifications but also their highly correlated 5-mers can be applied for reconstructing gene regulatory networks as supplementary data as well as other applications like physical interaction, genes prioritization, indicating some sort of data fusion in this analysis.

유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용 (Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating)

  • 안현철
    • 경영정보학연구
    • /
    • 제16권3호
    • /
    • pp.161-177
    • /
    • 2014
  • 기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.

심층신경망 기반의 음성인식을 위한 절충된 특징 정규화 방식 (Compromised feature normalization method for deep neural network based speech recognition)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.65-71
    • /
    • 2020
  • 특징 정규화는 음성 특징 파라미터들의 통계적인 특성의 정규화를 통해 훈련 및 테스트 조건 사이의 환경 불일치의 영향을 감소시키는 방법으로서 기존의 Gaussian mixture model-hidden Markov model(GMM-HMM) 기반의 음성인식 시스템에서 우수한 성능개선을 입증한 바 있다. 하지만 심층신경망(deep neural network, DNN) 기반의 음성인식 시스템에서는 환경 불일치의 영향을 최소화 하는 것이 반드시 최고의 성능 개선으로 연결되지는 않는다. 본 논문에서는 이러한 현상의 원인을 과도한 특징 정규화로 인한 정보손실 때문이라 보고, 음향모델을 훈련 하는데 유용한 정보는 보존하면서 환경 불일치의 영향은 적절히 감소시켜 음성인식 성능을 최대화 하는 특징 정규화 방식이 있는 지 검토해보고자 한다. 이를 위해 평균 정규화(mean normalization, MN)와 평균 및 분산 정규화(mean and variance normalization, MVN)의 절충 방식인 평균 및 지수적 분산 정규화(mean and exponentiated variance normalization, MEVN)를 도입하여, 잡음 및 잔향 환경에서 분산에 대한 정규화의 정도에 따른 DNN 기반의 음성인식 시스템의 성능을 비교한다. 실험 결과, 성능 개선의 폭이 크지는 않으나 분산 정규화의 정도에 따라 MEVN이 MN과 MVN보다 성능이 우수함을 보여준다.

동적 RCS의 주기성과 통계적 특성을 이용한 기두부와 단 분리 시 조각들의 구분 (Classification of the Front Body of a Missile and Debris in Boosting Part Separation Phase Using Periodic and Statistical Properties of Dynamic RCS)

  • 최영재;최인식;신진우;정명수
    • 한국전자파학회논문지
    • /
    • 제29권7호
    • /
    • pp.540-549
    • /
    • 2018
  • 초고속 고기동 미사일의 요격에 있어서 기두부와 단 분리 시 조각들을 식별하는 것은 중요한 문제이다. 기두부는 비행 안정성을 위하여 세차운동을 하며, 단 분리 시 조각들은 텀블링 운동을 한다. 기두부와 단 분리 시 조각들의 주기적인 미세거동에 의하여 이들의 동적 RCS에서는 주기성과 통계적 특성이 나타난다. 본 논문에서는 기두부와 단 분리 시 조각들의 동적 RCS에서 나타나는 주기성과 통계적 특성을 이용하여 기두부와 단 분리 시의 조각들을 분류하는 방법을 제안하였다. 동적 RCS가 가지고 있는 주기성과 통계적 특성으로부터 세 종류의 특성벡터를 추출하고, SVM(support vector machine)을 사용하여 분류하였다.

농어촌도로 개발 우선순위 결정을 위한 GIS와 통계분석기법의 활용 (Determination of Priority in Installing Road in Farming and Fishing Communities by Using GIS & Statistical Analysis Techniques)

  • 김동문;이상윤;박병수
    • 한국측량학회지
    • /
    • 제24권4호
    • /
    • pp.351-358
    • /
    • 2006
  • 농어촌도로는 농어촌지역의 생활환경개선과 주민의 소득증대를 위한 도로의 정비계획은 물론 농수산물의 원활한 유통을 위한 군도이상의 도로와의 연결을 위한 중요한 지역 기반이다. 이에 대한 기본계획은 농어촌 도로를 기간으로 관할구역안의 도로에 대한 장기개발방향의 지침이 된다. 그러나 기존의 농어촌도로 기본계획은 노선이 위치한 지역상황의 다양한 지표에 대한 종합적이며 합리적인 분석과 평가가 되지 못한 상황에서 진행되어졌다. 그래서 이 연구에서는 농어촌도로의 개발 우선순위 결정을 위해 도로의 노선별 자료를 GIS DB로 구축하였으며, 자료의 종합적 평가를 위해 AHP와 통계분석기법을 활용하여 인자의 가중치를 결정하였으며, 이 과정에서 노선의 개발 우선순위 계산식을 도출 및 적용하여 연구지역 내의 개발 우선순위를 선정하여 제시하였다.

통계적 영상 품질 측정 (Statistical Image Quality Measure)

  • 배경율
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.79-90
    • /
    • 2007
  • 영상의 품질을 측정하는 것은 영상처리에서 매우 중요한 문제이다. 지금까지 영상 품질을 측정하기 위한 다양한 방법들이 제시되었고, 이들은 수학적인 관점에서 영상의 품질을 적절히 표현해주고 있다. 그러나, 수학적인 측정과 인간의 시각에 의해서 측정되는 품질은 서로 다를 수 있고 영상이 전달되는 최종 대상체는 인간의 시각이기 때문에 이를 고려한 영상품질 측정 방법이 필요하다. 본 논문에서는 사람의 시각적 특성을 고려하여 영상 품질을 측정할 수 있는 통계적 방법을 제시하였다. 사람의 시각은 영상의 전체적인 품질을 판단하면서도 국부적인 위치에서의 품질을 판단하며, 전체적인 영상의 품질보다는 국부적인 위치에서의 품질이 시각적인 영상품질 판단에 미치는 영향이 크다. 본 논문에서는 영상을 세그먼트화하고 각 세그먼트화된 영상에서 얻어진 영상 품질 값에 스코어링을 하는 통계적 기법을 사용하여 시각에 의한 판단과 유사한 결과를 얻었다.

  • PDF

Multiple-Shot Person Re-identification by Features Learned from Third-party Image Sets

  • Zhao, Yanna;Wang, Lei;Zhao, Xu;Liu, Yuncai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권2호
    • /
    • pp.775-792
    • /
    • 2015
  • Person re-identification is an important and challenging task in computer vision with numerous real world applications. Despite significant progress has been made in the past few years, person re-identification remains an unsolved problem. This paper presents a novel appearance-based approach to person re-identification. The approach exploits region covariance matrix and color histograms to capture the statistical properties and chromatic information of each object. Robustness against low resolution, viewpoint changes and pose variations is achieved by a novel signature, that is, the combination of Log Covariance Matrix feature and HSV histogram (LCMH). In order to further improve re-identification performance, third-party image sets are utilized as a common reference to sufficiently represent any image set with the same type. Distinctive and reliable features for a given image set are extracted through decision boundary between the specific set and a third-party image set supervised by max-margin criteria. This method enables the usage of an existing dataset to represent new image data without time-consuming data collection and annotation. Comparisons with state-of-the-art methods carried out on benchmark datasets demonstrate promising performance of our method.

고설 모음 환경에서 한국어 자음의 지각적 구조 (Perceptual Structure of Korean Consonants in High Vowel Contexts)

  • 배문정
    • 말소리와 음성과학
    • /
    • 제1권2호
    • /
    • pp.95-103
    • /
    • 2009
  • We investigated the perceptual structure of Korean consonants by analyzing the confusion among consonants in various vowel contexts. The 36 CV syllable types combined by 18 consonants and 2 vowels (/i/ and /u/) were presented with masking noises or in degraded intensity. The confusion data were analyzed by the INDSCAL (Individual Difference Scaling), ADCLUS (Additive Clustering) and the probability of the transmitted information. The results were compared with those of a previous study with /a/ vowel context (Bae and Kim, 2002). The overall results showed that the laryngeal features-aspiration, lax and tense-are the most salient features in the perception of Korean consonant regardless of vowel contexts, but the perceptual saliency of place features varies across vowel conditions. In high vowel (front and back vowel) contexts, sibilant consonants were perceptually salient compared to in low vowel contexts. In back vowel contexts, grave (labial and velar) consonants were perceptually salient. These findings imply that place features and vowel features strongly interact in speech perception as well as in speech production. All statistical measures from our confusion data ensured that the perceptual structure of Korean consonants correspond to the hierarchical structure suggested in the feature geometry (Clements, 1991). We discuss the link between speech perception and production as the basis of phonology.

  • PDF

Calibration 모형을 이용한 판별분석 (Discriminant analysis based on a calibration model)

  • 이석훈;박래현;복혜영
    • 응용통계연구
    • /
    • 제10권2호
    • /
    • pp.261-274
    • /
    • 1997
  • 기존에 제안되어온 판별분석 기법이 대상으로 하는 대부분의 자료는 각 개체가 어느 한 특정한 집단에 전적으로 소속되어 있는 것으로 국한되어 왔다. 그러나 오늘날 (0-1)의 이치논리가 퍼지(Fuzzy) 개념과 다치논리로 확장되는 현상은 어느 한 개체를 꼭 한개의 집단에만 국한시키는 관점 역시 변화를 요구하고 있다고 본다. 이에 본 논문에서는 한 개체가 어떤 소속확률을 갖고 여러개의 집단에 소속되어 있는 상황을 고려하여 이러한 개체들로 구성된 학습표본으로부터 판별분석 규칙을 개발하는 것을 목표로 하였다. 방법론으로는 개체들의 특성벡터와 소속상태의 관계를 역추정(calibration) 모형으로 표현하고 판별대상개체의 특성벡터가 주어졌을 때 소속상태를 추정하도록 하며 이때 추정은 베이지안 방법, Metropolis 알고리즘 등을 사용하였다. 또한 제안된 판별규칙의 평가를 위한 기준을 제안하고 두개의 자료를 기존의 다른 규칙들과 함께 분석하여 결과를 비교하였다.

  • PDF

은닉 마코프 모델을 이용한 정신질환자의 뇌파 판별 (The Classification of the Schizophrenia EEG Signal using Hidden Markov Model)

  • 이경일;김필운;조진호;김명남
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권3호
    • /
    • pp.217-225
    • /
    • 2004
  • 본 논문에서는 은닉 마코프 모델을 이용하여 정상인과 정신분열증 환자의 뇌파에 대한 새로운 자동 판별 방법을 제안하였다. 특징 파라미터로는 통계적 정상구간에 대한 분산과 알파파, 베타파, 세타파의 전력비를 이용하였다. 실험 결과, 정상인의 경우에는 90.9%, 정신분열증 환자의 경우에는 90.5%의 높은 판별 정확성을 보였으며 이는 제안한 시스템이 복잡한 신호처리과정을 이용하는 시스템보다 효과적임을 알 수 있다. 따라서, 은닉 마코프 모델이 뇌파와 같은 복잡한 생체신호의 분석과 판별에 사용될 수 있으며 제안한 방법이 임상적인 전단에 상당한 도움이 될 것으로 기대된다.