• 제목/요약/키워드: binary vector

검색결과 368건 처리시간 0.023초

Salt cress 유전자의 형질전환을 통한 내염성 식물체 선별 (Screening of salt-tolerance plants using transgenic Arabidopsis that express a salt cress cDNA library)

  • 백동원;최원균;강송화;신길옥;박수정;김찬민;박형철;윤대진
    • Journal of Plant Biotechnology
    • /
    • 제41권2호
    • /
    • pp.81-88
    • /
    • 2014
  • 식물생명공학 연구에 있어서 모델 식물인 Arabidopsis thaliana (애기장대)와 아주 유사한 염생 식물인 salt cress (Thellungiella halophila 또는 Thellungiella parvula)는 고염 스트레스에 대하여 강한 내성을 가지고 있다. 본 연구에서는 고염에 저항성을 가지는 유용유전자를 선별하기 위하여, 200 mM NaCl을 처리한 T. halophila 또는 T. parvula 식물로부터 mRNA를 분리하여 cDNA library를 작성하였다. Full length cDNA library를 Agrobacteria-methods 형질전환 방법에 필요한 binary vector pool을 작성하고 Arabidopsis에 형질전환 시켰다. 형질전환되어진 Arabidopsis를 항생제 Basta 선별을 통하여 형질전환체 pool을 구축하였다(305,400 종자). 이와 같은 방법을 통해 구축 되어진 pool중에서 168,500 종자를 이용하여 고염 스트레스 조건하에서 종자 발아율과 뿌리 생장 촉진되는 현상이 나타나는 내염성 형질전환체를 1차 선별하였다(7,157 개체; 4.24%). 1차 선별된 형질전환체 중에서 1,551개체를 이용하여 2차 선별을 수행하여 내염성 형질전환체 165 개체를 확보하였다(10.6%). 선별된 형질전환체 중 대부분 개체는 고염 스트레스에 대응하여 종자 발아 및 뿌리 생장 모두 야생형보다 촉진된 표현형을 보였다. 그 중 몇 몇의 형질전환체는 야생형에 비하여 특이적인 기관 발달 현상이 나타났다. 예를 들면, 꽃과 줄기의 발달이 야생형과는 다른 표현형을 보이는 형질전환체가 선별되었다. 이렇게 스트레스에 내성을 가지는 형질전환체로부터 유전자 분리 방법을 통하여 해당 유용유전자를 확보할 수가 있다. 본 연구에서는 향후 halopyte 식물체를 이용하여 고염 뿐만 아니라 다양한 환경스트레스(건조, 냉해, 고열, 호르몬 등) 신호전달에 관여하는 유용유전자를 보다 쉽게 확보하는 방법을 제시함으로서, 환경재해극복에 관여하는 신호전달 기작을 보다 쉽게 이해할 수 있을 것으로 사료된다.

아그로박테리움을 이용한 Actinobacillus pleuropneumoniae ApxIIA (ApxII toxin) 유전자 발현 옥수수 형질전환체 개발 (The development of transgenic maize expressing Actinobacillus pleuropneumoniae ApxIIA gene using Agrobacterium)

  • 김현아;유한상;양문식;권석윤;김진석;최필선
    • Journal of Plant Biotechnology
    • /
    • 제37권3호
    • /
    • pp.313-318
    • /
    • 2010
  • 돼지 흉막폐렴백신을 개발하기 위해 옥수수 HiII genotype 으로부터 유도한 type II형의 배발생캘러스를 식물발현벡터 pMYV611, pMYV613, pMYV616, V621, V622 및 V623로 형질전환시킨 Agrobacterium (C58C1)과 공동배양 하였다. 이들 식물발현벡터는 paromomycin 항생제 저항 유전자인 NPTII 선발마커와 표적 유전자로서 흉막폐렴균의 여러 가지 혈청을 생산하는 apxIIA유전자로 재조합하여 구축하였다. 식물발현벡터pMYV611, pMYV613, pMYV616, V621, V622 및V623의 경우 각각 4,120개, 5,959개, 7,581개, 52,329개, 48,948개 및 56,188개의 캘러스 클론을 Agrobacterium과 공동한 후 NPTII assay kit에 의해 nptII유전자의 발현빈도를 조사한 결과 각 벡터별로 2.3-4.4%의 캘러스 클론에서 항체결합 양성반응을 보였고, 이들 중 최종적으로 선발된 형질전환 캘러스 클론은 pMYV611에서 3개 (0.07%), pMYV613에서 4개 (0.07%), pMYV616에서 2개 (0.02%), V621에서 51개 (0.1%), V622에서 72개 (0.15%) 및 V623에서 102개 (0.18%)를 각각 얻었다. 형질전환된 캘러스 클론으로부터 재분화된 식물체에서 유전자 도입여부를 Southern 분석으로 통해 확인한 결과 pMYV613에서 2개 식물체 및 V623에서 얻은 2개 식물체에서 각각 확인되었다.

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

Agrobacterium을 이용하여 형질전환시킨 배추에서 T-DNA Right Border 인접염기서열 분석 (Analysis of right border flanking sequence in transgenic chinese cabbage harboring integrated T-DNA)

  • 안홍일;신공식;우희종;이기종;김효성;박용환;서석철;조현석;권순종
    • Journal of Plant Biotechnology
    • /
    • 제38권1호
    • /
    • pp.15-21
    • /
    • 2011
  • Agrobacterium tumefaciens와 운반체 416을 이용하여 cryIAc1 유전자가 형질전환된 배추 14개체를 선발하였다. Southern blot을 통하여 분석한 결과 1 사본 유전자가 도입된 개체가 6개이었으며 backbone 염기서열이 포함되지 않은 경우는 4개체이었다. LB 인접서열 분석 결과, 416-2과 416-3은 23 bp의 LB 부위가 남아있는 동일한 염기서열을 보였고, 416-9 경우 15 bp가 남았으며, 416-17 경우 LB를 포함하여 안쪽의 염기서열의 최대 36 bp의 결실이 확인되었다. T-DNA의 염기서열을 제외한 배추 gDNA의 499 bp의 LB 인접염기서열은 B. oleracea의 염기서열과 96% 상동성을 가진 유전자로 확인되었다. RB border 인접서열 분석용 primer를 제작하여 PCR을 수행한 결과 모두 834 bp의 염기서열을 확인하였고, vector의 구성 요소 중 cryIAc1의 3' 말단 부위, nos-terminator 부위와 52 bp 및 배추 gDNA RB 인접염기서열로 확인되었다. RB 염기서열은 확인할 수 없었으며 nos-terminator 3' 말단의 21개의 염기를 포함하여 모두 58개의 염기서열이 결실된 것을 확인하였다. 형질전환식물체를 제작할 경우 발생하는 전이유전자나 식물의 염색체에 염기 결실은 매우 다양한 형태로 나타난다. 이번 실험의 경우, 전이유전자가 삽입된 위치에서 약 10 bp의 배추의 gDNA 염기가 결실된 것이나 삽입된 전이유전자의 RB 말단부분이 결실된 것은 예상할 수 있는 결과였지만, 특히 전이유전자의 말단인 nos-terminator 3' 끝에 65 bp 정도의 배추의 다른 유전자가 삽입되어 있다는 것을 확인하였고 이는 기대하지 않았던 결과였다. 삽입된 다른 배추유전자의 절편은 앞으로 더 많은 연구를 통하여 위치와 기능확인이 필요할 것이다.

Development of System-Wide Functional Analysis Platform for Pathogenicity Genes in Magnaporthe oryzae

  • Park, Sook-Young;Choi, Jaehyuk;Choi, Jaeyoung;Kim, Seongbeom;Jeon, Jongbum;Kwon, Seomun;Lee, Dayoung;Huh, Aram;Shin, Miho;Jung, Kyungyoung;Jeon, Junhyun;Kang, Chang Hyun;Kang, Seogchan;Lee, Yong-Hwan
    • 한국균학회소식:학술대회논문집
    • /
    • 한국균학회 2014년도 추계학술대회 및 정기총회
    • /
    • pp.9-9
    • /
    • 2014
  • Null mutants generated by targeted gene replacement are frequently used to reveal function of the genes in fungi. However, targeted gene deletions may be difficult to obtain or it may not be applicable, such as in the case of redundant or lethal genes. Constitutive expression system could be an alternative to avoid these difficulties and to provide new platform in fungal functional genomics research. Here we developed a novel platform for functional analysis genes in Magnaporthe oryzae by constitutive expression under a strong promoter. Employing a binary vector (pGOF1), carrying $EF1{\beta}$ promoter, we generated a total of 4,432 transformants by Agrobacterium tumefaciens-mediated transformation. We have analyzed a subset of 54 transformants that have the vector inserted in the promoter region of individual genes, at distances ranging from 44 to 1,479 bp. These transformants showed increased transcript levels of the genes that are found immediately adjacent to the vector, compared to those of wild type. Ten transformants showed higher levels of expression relative to the wild type not only in mycelial stage but also during infection-related development. Two transformants that T-DNA was inserted in the promotor regions of putative lethal genes, MoRPT4 and MoDBP5, showed decreased conidiation and pathogenicity, respectively. We also characterized two transformants that T-DNA was inserted in functionally redundant genes encoding alpha-glucosidase and alpha-mannosidase. These transformants also showed decreased mycelial growth and pathogenicity, implying successful application of this platform in functional analysis of the genes. Our data also demonstrated that comparative phenotypic analysis under over-expression and suppression of gene expression could prove a highly efficient system for functional analysis of the genes. Our over-expressed transformants library would be a valuable resource for functional characterization of the redundant or lethal genes in M. oryzae and this system may be applicable in other fungi.

  • PDF

비용효율적 지능형 침입탐지시스템 구현을 위한 유전자 알고리즘 기반 통합 모형 (An Integrated Model based on Genetic Algorithms for Implementing Cost-Effective Intelligent Intrusion Detection Systems)

  • 이현욱;김지훈;안현철
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.125-141
    • /
    • 2012
  • 본 연구는 최근 그 중요성이 한층 높아지고 있는 침입탐지시스템(IDS, Intrusion Detection System)의 침입탐지모형을 개선하기 위한 방안으로 유전자 알고리즘에 기반한 새로운 통합모형을 제시한다. 본 연구의 제안모형은 서로 상호보완적 관계에 있는 이분류 모형인 로지스틱 회귀분석(LOGIT, Logistic Regression), 의사결정나무(DT, Decision Tree), 인공신경망 (ANN, Artificial Neural Network), 그리고 SVM(Support Vector Machine)의 예측결과에 적절한 가중치를 부여해 최종 예측결과를 산출하도록 하였는데, 이 때 최적 가중치의 탐색을 위한 방법으로는 유전자 알고리즘을 사용한다. 아울러, 본 연구에서는 1차적으로 오탐지율을 최소화하는 최적의 모형을 산출한 뒤, 이어 비대칭 오류비용 개념을 반영해 오탐지로 인해 발생할 수 있는 전체 비용을 최소화할 수 있는 최적 임계치를 탐색, 최종적으로 가장 비용 효율적인 침입탐지모형을 도출하고자 하였다. 본 연구에서는 제안모형의 우수성을 확인하기 위해, 국내 한 공공기관의 보안센서로부터 수집된 로그 데이터를 바탕으로 실증 분석을 수행하였다. 그 결과, 본 연구에서 제안한 유전자 알고리즘 기반 통합모형이 인공신경망이나 SVM만으로 구성된 단일모형에 비해 학습용과 검증용 데이터셋 모두에서 더 우수한 탐지율을 보임을 확인할 수 있었다. 비대칭 오류비용을 고려한 전체 비용의 관점에서도 단일모형으로 된 비교모형에 비해 본 연구의 제안모형이 더 낮은 비용을 나타냄을 확인할 수 있었다. 이렇게 실증적으로 그 효과가 검증된 본 연구의 제안 모형은 앞으로 보다 지능화된 침입탐지시스템을 개발하는데 유용하게 활용될 수 있을 것으로 기대된다.