• 제목/요약/키워드: Bayesian

검색결과 2,727건 처리시간 0.031초

Phylogenetic analysis of Neottia japonica (Orchidaceae) based on ITS and matK regions

  • SO, Ji-Hyeon;LEE, Nam-Sook
    • 식물분류학회지
    • /
    • 제50권4호
    • /
    • pp.385-394
    • /
    • 2020
  • To elucidate the molecular phylogeny of Neottia japonica, which is a terrestrial orchid distributed in East Asia, the internal transcribed spacer (ITS) of nuclear DNA and the matK of chloroplast DNA were used. A total 22 species of 69 accessions for ITS and 21 species of 114 accessions for matK phylogeny were analyzed with the maximum parsimony and Bayesian methods. In addition, we sought to establish a correlation between the distribution, morphology of the auricles and genetic association of N. japonica with phylogenetic data. The phylogenetic results suggest that N. japonica is monophyletic and a sister to N. suzukii in terms of the ITS phylogeny, while it is paraphyletic with N. suzukii in terms of the matK phylogeny. N. japonica and N. suzukii show similar morphologies of the lip and column, they both flower in April, and they are both distributed sympatrically in Taiwan. Therefore, it appears to be clear that N. japonica and N. suzukii are close taxa within Neottia, although there is incongruence between the nrDNA and cpDNA phylogenies of N. japonica. The incongruence between the two datasets may have various causes, meaning that further studies are needed to confirm the evolutionary process of N. japonica. The phylogenetic status of N. kiusiana, which was not included in previous studies, was as a sister to N. nidus-avis. Meanwhile, the ITS and matK phylogenies are unsuitable for identifying genetic associations with the characteristic of auricles. The phylogenetic topologies of Korean, Taiwanese and mainland Chinese individuals suggest that the populations of N. japonica in Korea originated from China's mainland and island areas. The characterization of regional gene differences could provide useful preliminary data for future studies.

n-Gram 색인화와 Support Vector Machine을 사용한 스팸메일 필터링에 대한 연구 (A study on the Filtering of Spam E-mail using n-Gram indexing and Support Vector Machine)

  • 서정우;손태식;서정택;문종섭
    • 정보보호학회논문지
    • /
    • 제14권2호
    • /
    • pp.23-33
    • /
    • 2004
  • 인터넷 환경의 급속한 발전으로 인하여 이메일을 통한 메시지 교환은 급속히 증가하고 있다. 그러나 이메일의 편리성에도 불구하고 개인이나 기업에서는 스팸메일로 인한 시간과 비용의 낭비가 크게 증가하고 있다. 이러한 스팸메일에 대한 문제들을 해결하기 위하여 많은 방법들이 연구되고 있으며, 대표적인 방법으로 키워드를 이용한 패턴매칭이나 나이의 베이지안 방식과 같은 확률을 이용한 방법들이 있다. 본 논문에서는 기존의 연구에 대한 문제점을 보완하기 위하여 패턴 분류문제에 있어서 우수한 성능을 보이는 Support Vector Machine을 사용하여 정상적인 메일과 스팸메일을 분류하는 방안을 제시하였으며, 특히 n-Gram을 사용하여 생성된 색인어와 단어사전을 학습데이터 생성에 사용함으로서 효율적인 학습을 수행하도록 하였다. 결론에서는 제안된 방법에 대한 성능을 검증하기 위하여 기존의 연구 결과와 비교함으로서 제안된 방법의 성능을 검증하였다.

Native API 의 효과적인 전처리 방법을 이용한 악성 코드 탐지 방법에 관한 연구 (Malicious Code Detection using the Effective Preprocessing Method Based on Native API)

  • 배성재;조재익;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제22권4호
    • /
    • pp.785-796
    • /
    • 2012
  • 본 논문에서는 악성코드의 시스템 콜 빈도수를 특징값으로 행위 기반 탐지(behavior-based detection)를 할 때, 시스템 콜의 속성 개수보다 학습데이터 개수가 적더라도 효과적으로 악성 코드를 탐지하는 기법을 제안한다. 이 연구에서는, 프로그램 코드가 동작할 때, 발생시키는 윈도우 커널 데이터인 Native API를 수집하여 빈도수로 정규화한 것을 기본적인 속성 값으로 사용하였다. 또한 악성코드와 정상 코드를 효과적으로 분류할 수 있으면서, 악성코드를 분류하기 위한 기본적인 속성의 개수보다 학습데이터 개수가 적어도 적용 가능한 GLDA(Generalized Linear Discriminant Analysis)를 사용하여, 새로운 속성 값들로 전환하였다. 분류 기법으로는 베이지언 분류법의 일종인 kNN(k-Nearest Neighbor) 분류법을 이용하여 악성 코드를 탐지하였다. 제안된 탐지 기법의 성능을 검증하기 위하여 수집된 Native API 로 기존의 연구 방법과 비교 검증하였다. 본 논문에 제안된 기법이 탐지율(detection rate) 100%인 Threshold 값에서, 다른 탐지 기법보다 낮은 오탐율(false positive rate)을 나타내었다.

엔트로피를 이용한 분산 서비스 거부 공격 탐지에 효과적인 특징 생성 방법 연구 (An Effective Feature Generation Method for Distributed Denial of Service Attack Detection using Entropy)

  • 김태훈;서기택;이영훈;임종인;문종섭
    • 정보보호학회논문지
    • /
    • 제20권4호
    • /
    • pp.63-73
    • /
    • 2010
  • 최근 분산 서비스 거부 공격의 근원인 악성 봇 프로그램이 널리 유포되고 있으며 보안이 유지되지 않는 PC를 통하여 악성 봇이 설치된 PC의 수가 기하급수적으로 증가하고 있다. 이를 통한 분산 서비스 거부 공격이 계속적으로 발생하고 있으며 최근 금품을 요구하는 사례도 발견되었다. 따라서 분산 서비스 거부 공격에 대응하기 위한 연구가 필요하며 본 논문에서는 네트워크 패킷 헤더의 속성에 대해 불확실성을 나타내는 척도인 엔트로피를 이용하는, 분산 서비스 거부 공격 탐지에 효과적인 특정 생성 방법을 제안한다. DARPA 2000 데이터셋과 직접 실험을 통해 구성한 분산 서비스 거부 공격 데이터셋에 대해 향상된 엔트로피 수식과 효율적인 엔트로피 계산 기법, 다양한 엔트로피 특징 값을 사용하는 제안 기법을 적용해보고 베이지안 네트워크 분류기를 이용하여 분류함으로써 제안하는 방법이 효과적인지를 검증해 본다.

Reliability of microarray analysis for studying periodontitis: low consistency in 2 periodontitis cohort data sets from different platforms and an integrative meta-analysis

  • Jeon, Yoon-Seon;Shivakumar, Manu;Kim, Dokyoon;Kim, Chang-Sung;Lee, Jung-Seok
    • Journal of Periodontal and Implant Science
    • /
    • 제51권1호
    • /
    • pp.18-29
    • /
    • 2021
  • Purpose: The aim of this study was to compare the characteristic expression patterns of advanced periodontitis in 2 cohort data sets analyzed using different microarray platforms, and to identify differentially expressed genes (DEGs) through a meta-analysis of both data sets. Methods: Twenty-two patients for cohort 1 and 40 patients for cohort 2 were recruited with the same inclusion criteria. The 2 cohort groups were analyzed using different platforms: Illumina and Agilent. A meta-analysis was performed to increase reliability by removing statistical differences between platforms. An integrative meta-analysis based on an empirical Bayesian methodology (ComBat) was conducted. DEGs for the integrated data sets were identified using the limma package to adjust for age, sex, and platform and compared with the results for cohorts 1 and 2. Clustering and pathway analyses were also performed. Results: This study detected 557 and 246 DEGs in cohorts 1 and 2, respectively, with 146 and 42 significantly enriched gene ontology (GO) terms. Overlapping between cohorts 1 and 2 was present in 59 DEGs and 18 GO terms. However, only 6 genes from the top 30 enriched DEGs overlapped, and there were no overlapping GO terms in the top 30 enriched pathways. The integrative meta-analysis detected 34 DEGs, of which 10 overlapped in all the integrated data sets of cohorts 1 and 2. Conclusions: The characteristic expression pattern differed between periodontitis and the healthy periodontium, but the consistency between the data sets from different cohorts and metadata was too low to suggest specific biomarkers for identifying periodontitis.

낙동강 유역에서 하천 TP 농도의 공간적 변동성에 영향을 미치는 주요 유역특성 (Major Watershed Characteristics Influencing Spatial Variability of Stream TP Concentration in the Nakdong River Basin)

  • 서지유;원정은;최정현;김상단
    • 한국물환경학회지
    • /
    • 제37권3호
    • /
    • pp.204-216
    • /
    • 2021
  • It is important to understand the factors influencing the temporal and spatial variability of water quality in order to establish an effective customized management strategy for contaminated aquatic ecosystems. In this study, the spatial diversity of the 5-year (2015 - 2019) average total phosphorus (TP) concentration observed in 40 Total Maximum Daily Loads unit-basins in the Nakdong River watershed was analyzed using 50 predictive variables of watershed characteristics, climate characteristics, land use characteristics, and soil characteristics. Cross-correlation analysis, a two-stage exhaustive search approach, and Bayesian inference were applied to identify predictors that best matched the time-averaged TP. The predictors that were finally identified included watershed altitude, precipitation in fall, precipitation in winter, residential area, public facilities area, paddy field, soil available phosphate, soil magnesium, soil available silicic acid, and soil potassium. Among them, it was found that the most influential factors for the spatial difference of TP were watershed altitude in watershed characteristics, public facilities area in land use characteristics, and soil available silicic acid in soil characteristics. This means that artificial factors have a great influence on the spatial variability of TP. It is expected that the proposed statistical modeling approach can be applied to the identification of major factors affecting the spatial variability of the temporal average state of various water quality parameters.

자료기반 물환경 모델의 현황 및 발전 방향 (Data-Driven Modeling of Freshwater Aquatic Systems: Status and Prospects)

  • 차윤경;신지훈;김영우
    • 한국물환경학회지
    • /
    • 제36권6호
    • /
    • pp.611-620
    • /
    • 2020
  • Although process-based models have been a preferred approach for modeling freshwater aquatic systems over extended time intervals, the increasing utility of data-driven models in a big data environment has made the data-driven models increasingly popular in recent decades. In this study, international peer-reviewed journals for the relevant fields were searched in the Web of Science Core Collection, and an extensive literature review, which included total 2,984 articles published during the last two decades (2000-2020), was performed. The review results indicated that the rate of increase in the number of published studies using data-driven models exceeded those using process-based models since 2010. The increase in the use of data-driven models was partly attributable to the increasing availability of data from new data sources, e.g., remotely sensed hyperspectral or multispectral data. Consistently throughout the past two decades, South Korea has been one of the top ten countries in which the greatest number of studies using the data-driven models were published. Among the major data-driven approaches, i.e., artificial neural network, decision tree, and Bayesian model, were illustrated with case studies. Based on the review, this study aimed to inform the current state of knowledge regarding the biogeochemical water quality and ecological models using data-driven approaches, and provide the remaining challenges and future prospects.

OGLE-2017-BLG-1049: ANOTHER GIANT PLANET MICROLENSING EVENT

  • Kim, Yun Hak;Chung, Sun-Ju;Udalski, A.;Bond, Ian A.;Jung, Youn Kil;Gould, Andrew;Albrow, Michael D.;Han, Cheongho;Hwang, Kyu-Ha;Ryu, Yoon-Hyun;Shin, In-Gu;Shvartzvald, Yossi;Yee, Jennifer C.;Zang, Weicheng;Cha, Sang-Mok;Kim, Dong-Jin;Kim, Hyoun-Woo;Kim, Seung-Lee;Lee, Chung-Uk;Lee, Dong-Joo
    • 천문학회지
    • /
    • 제53권6호
    • /
    • pp.161-168
    • /
    • 2020
  • We report the discovery of a giant exoplanet in the microlensing event OGLE-2017-BLG-1049, with a planet-host star mass ratio of q = 9.53 ± 0.39 × 10-3 and a caustic crossing feature in Korea Microlensing Telescope Network (KMTNet) observations. The caustic crossing feature yields an angular Einstein radius of θE = 0.52 ± 0.11 mas. However, the microlens parallax is not measured because the time scale of the event, tE ≃ 29 days, is too short. Thus, we perform a Bayesian analysis to estimate physical quantities of the lens system. We find that the lens system has a star with mass Mh = 0.55+0.36-0.29 M⊙ hosting a giant planet with Mp = 5.53+3.62-2.87 MJup, at a distance of DL = 5.67+1.11-1.52 kpc. The projected star-planet separation is a⊥ = 3.92+1.10-1.32 au. This means that the planet is located beyond the snow line of the host. The relative lens-source proper motion is μrel ~ 7 mas yr-1, thus the lens and source will be separated from each other within 10 years. After this, it will be possible to measure the flux of the host star with 30 meter class telescopes and to determine its mass.

인간 및 인공지능의 초지능 협력사회 실현을 위한 현대 인공지능 기술의 한계점 분석과 인문사회학적 통찰력에 대한 메타 연구 (A meta-study on the analysis of the limitations of modern artificial intelligence technology and humanities insight for the realization of a super-intelligent cooperative society of human and artificial intelligence)

  • 황수림;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권8호
    • /
    • pp.1013-1018
    • /
    • 2021
  • 최근 자율주행 자동차가 일으킨 사고 때문에 인공지능의 윤리적 측면에 대한 논의가 활발히 진행되고 있다. 본 논문은 인공지능이 윤리적 요소와 필연적으로 결부되어 있음을 로봇-인공지능 윤리 관련 개념과 공학기술로부터 확인하고 윤리적 측면이 사후적으로 발생하는 것이 아니라 내장되어 있음을 논한다. 또한, 자율주행 자동차와 관련된 윤리적 문제의 실마리가 될 수 있는 트롤리 딜레마에 대한 해결방법을 고안한다. 우선적으로 베이지안 네트워크를 작성하고 전처리 과정을 거쳐 중요하고 영향력 있는 데이터만 남도록 하며, 네트워크의 정확한 수치를 계산하기 위해 크라우드 소싱과 외삽법을 이용한다. 이러한 과정을 통해 알고리즘 및 모델을 구현할 때에 인간의 주관이 필연적으로 포함될 수밖에 없음을 주장하고 인공지능 시스템에 관한 왜곡과 편향을 방지하기 위해 전공 교육과 구분되는 공학 교양 교육, 특히 윤리 교육의 필요성과 방향에 대해 논한다.

기계학습기법을 이용한 부산-울산-경남 지역의 증발수요 가뭄지수 예측 (Evaporative demand drought index forecasting in Busan-Ulsan-Gyeongnam region using machine learning methods)

  • 이옥정;원정은;서지유;김상단
    • 한국수자원학회논문집
    • /
    • 제54권8호
    • /
    • pp.617-628
    • /
    • 2021
  • 가뭄은 심각한 사회적 경제적 손실을 초래하는 주요 자연재해이다. 지역 가뭄 예측은 가뭄 대비에 중요한 정보를 제공할 수 있다. 본 연구에서는 한반도 동남부 부산-울산-경남 지역에서 1981년부터 2020년까지 10개 관측소의 과거 가뭄지수 및 기상 관측자료를 사용하여 가뭄을 예측하는 새로운 기계학습모델을 제안한다. 베이지안 최적화기법을 이용하여 하이퍼 파라미터가 튜닝된 Random Forest, XGBoost, Light GBM 모델을 구축하여 1개월 뒤의 6개월 시간 척도의 증발 수요 가뭄지수를 예측하였다. 단일 지점별 모델과 지역 모델을 각각 구성하여 모델 성능을 비교하였다. 또한 지역 모델을 기반으로 개별 지점의 자료에 대해 미세조정된 모델을 구성하여 모델 성능을 높일 가능성을 살펴보았다.