• 제목/요약/키워드: Linear Discriminant analysis

검색결과 344건 처리시간 0.021초

얼굴의 등고선 영역을 이용한 퍼지적분 기반의 3차원 얼굴 인식 (3D Face Recognition in the Multiple-Contour Line Area Using Fuzzy Integral)

  • 이영학
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.423-433
    • /
    • 2008
  • 얼굴 표면에 대한 곡률의 특성은 사람의 특징을 나타내는 중요 요소 중의 하나이며, 깊이 간에 따른 얼굴의 형상 또한 사람마다 다른 모양을 가지고 있으므로 중요한 특징의 하나로 간주 될 수 있다. 본 논문은 3차원 얼굴 영상으로부터 추출된 표면 곡률을 얼굴의 등고선 값에 따라 추출된 영역에 대하여 퍼지적분을 이용한 얼굴 인식 알고리즘을 제안한다. 먼저 객체와 배경을 분리하여 얼굴을 추출한 후 얼굴에서 가장 두드러진 형태인 코끝을 찾고, 회전에 대한 정규화를 실시한다. 얼굴의 등고선 영역은 코끝을 기준으로 깊이 값에 따라 영역이 추출되며 사람마다 서로 다른 형상 특징을 가지게 된다. 등고선에 따라 획득된 3차원 얼굴 영상으로부터 얼굴의 표면 특성 정보인 주 곡률, 평균 곡률 그리고 가우시안 곡률 값을 추출한다. 각각의 등고선 영역에 대해 차원의 감소를 위하여 고유 얼굴 추출과 특징 공간상에서 클래스간의 분리를 최대화시키기 위해 선형판별분석 알고리즘을 이용하여 유사도를 비교하였다. 그리고 클래스간의 분별 정보를 등고선 영역들에 대해 퍼지적분 방법을 사용하여 인식률을 향상 시켰다. 제안된 방법으로 수행한 결과, 코끝으로부터 깊이 값 40 (DT 40)인 등고선 영역이 가장 높은 인식률을 나타내었으며, 퍼지적분을 사용한 방법이 다른 알고리즘보다 놀은 인식률을 나타내었으며, 곡률은 주 곡률의 최대 곡률이 98%의 높은 인식률을 나타내었다.

  • PDF

기계학습을 이용한 단일 관련자극 P300기반 숨김정보검사 (One-probe P300 based concealed information test with machine learning)

  • 김혁;김현택
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.49-95
    • /
    • 2024
  • 국내 형사소송절차에서 진술의 진위여부 확인을 위해 사용하는 도구는 폴리그래프검사, 진술타당도분석, P300 기반 숨김정보검사 등이 있고, 이 중에서 폴리그래프검사의 사용빈도가 다른 도구들에 비하여 높다. 하지만, 검사결과를 뒷받침해 줄 수 있는 근거의 부족으로 인하여 재판과정에서 증거채택 가능성이 낮다. 폴리그래프검사를 뒷받침해 줄 수 있는 방법으로, 사전연구가 풍부한 P300기반 숨김정보검사가 주목을 받아 왔지만, 기존의 검사기법은 두 가지 제한점이 있어 실제 사건에서의 활용도는 낮은 편이다. 첫째, 검사에 필요한 관련자극만 3개 또는 6개 등, 사전에 노출되지 않은 정보가 다수 필요하기 때문에 실제 사건에서 사용 가능성이 낮다. 둘째, 기존의 P300기반 숨김정보검사 프로토콜에서는 관련자극과 무관련자극에 대한 P300요소 전위값을 명확하게 구분하기 위하여 오드볼패러다임을 사용하기 때문에 무관련자극에 대한 P300요소 전위값이 과소 추정될 가능성이 있다. 본 연구에서는 검사의 사용 가능성을 높이기 위하여 사전에 노출되지 않은 정보가 단 하나만 있어도 검사가 가능한 단일 관련자극을 사용하는 수정된 P300기반 숨김정보검사 프로토콜을 탐색하였고, 오드볼패러다임 사용으로 인한 무관련자극에 대한 P300요소 전위값이 과소 추정되는 문제를 보완하기 위하여 다양한 기계학습의 분류 알고리즘을 비교하였다. 연구결과 단일 관련자극으로 여성과 남성의 얼굴자극을 사용할 경우, 자극은 400ms 지속시간으로 60회 제시하고, 절단값을 유죄집단은 90%로 무죄집단은 30%로 하여 정점-정점 방법으로 P300요소 전위값을 분석하는 것이 적합함을 확인하였다. 단어자극의 경우, 지속시간을 300ms로 60회 제시하고, P300요소 전위값 분석방법은 얼굴자극과 동일하게 시행하는 것이 적합하다는 것을 확인하였다. 또한 관련자극과 무관련자극에 대한 정점-정점 P300요소 전위값을 6가지 기계학습 분류 알고리즘을 사용하여 분석한 결과, 로지스틱 회귀(LR), 선형 판별 분석(LDA), K-최근접 이웃(KNN) 알고리즘이 관련자극과 무관련자극의 분류에 적합하다는 것을 확인하였다.

차세대염기서열 분석을 이용한 소, 돼지, 닭의 장내 미생물 군집 분석 및 비교 (Comparative Analysis of Gut Microbiota among Broiler Chickens, Pigs, and Cattle through Next-generation Sequencing)

  • 정호진;하광수;신수진;정수지;류명선;양희종;정도연
    • 생명과학회지
    • /
    • 제31권12호
    • /
    • pp.1079-1087
    • /
    • 2021
  • 본 연구는 국내 가축의 장내 미생물 군집 분포와 시료간 미생물학적 차이에 대하여 차세대 염기서열 분석법(NGS)을 이용하여 분석하였다. 전국의 축사에서 닭, 돼지, 소의 분변시료를 무작위로 채집하여 α-diversity를 분석한 결과, 종 추정치와 종 풍부도가 세 종류의 가축 모두에서 통계학적 유의성을 가지면서 소, 돼지, 닭 순으로 높게 분석되었다. 그러나 조류에 속하는 닭과 포유류에 속하는 돼지, 소에 대한 각 사이의 종 다양성은 통계학적 유의성이 있는 것으로 분석되었으나, 돼지와 소의 사이의 종 다양성은 통계학적 유의성이 없는 것으로 분석되었다. 각 가축 내 장내 미생물 군집의 분포를 분석한 결과, 문 수준에서 세 종류의 가축 모두 Firmicutes가 우점한 것으로 나타났으며, 속 수준에서는 닭의 분변시료는 Weissella, 돼지의 분변시료는 Prevotella, 소의 분변시료는 Acinetobacter가 우점 속으로 나타났다. 각 가축 분변시료의 미생물 군집 분포에 차이가 있는지 분석하기 위해 PERMANOVA 분석을 수행한 결과, 닭, 돼지, 소의 분변시료 내 미생물 군집의 중심과 산포는 통계학적으로 유의성을 가진 것으로 나타났다. 또한 각 가축 분변시료의 미생물 군집을 대표하는 biomarker를 분석하기 위해 LEfSe 분석을 수행한 결과, Weissella와 Lactobacillus는 닭의 분변을 다른 두 가축과 구분할 수 있는 미생물로, Preveotella는 돼지의 분변을 다른 두 가축과 구분할 수 있는 미생물로, Acinetobacter는 소의 분변을 다른 두 가축과 구분할 수 있는 미생물로 분석되었다. 본 연구를 기반으로 축사 여건에 적합한 체증 관련 미생물의 탐색, 생애주기별 장내 미생물 군집과 유전체 분석 및 각 가축에 특화된 생균제 개발 등 추가적인 연구 진행에 필요한 미생물학적 기초자료로 활용할 수 있을 것으로 기대된다.

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.