• 제목/요약/키워드: 분류 비율

검색결과 1,529건 처리시간 0.026초

한국식물분류학회 50년사: 인력양성과 연구활동 (The 50-year history of the Korean Society of Plant Taxonomists: Professional manpower training and research activity)

  • 이남숙
    • 식물분류학회지
    • /
    • 제48권4호
    • /
    • pp.363-369
    • /
    • 2018
  • 한국식물분류학회가 1968년 12월 13일에 설립된 이래, 전문인력 양성과 학회지 논문에 나타난 연구활동에 대해 분석하였다. 조사 방법은 한국식물분류학회 홈페이지와 식물분류학회지에 나타난 자료를 이용하였으며, 전문인력 분석은 각 대학에서 제공한 자료를 바탕으로 하였다. 지난 50년 동안 식물분류학의 전문인력은 총 680명이 양성되었으며, 그 중 석사학위 소지자는 30개 대학에서 약 537명(남성 274명, 여성 263명) 이고, 박사학위 소지자는 26개 대학에서 143명(남성 97명, 여성 46명)이 양성되었으며, 그 수는 특히 1998년 부터 크게 증가하였다. 연구분야의 변화를 10년 단위로 보면, 분류군 실험논문은 1988-1997년에 72%로 가장 많았으나, 최근 10년에는 51%로 감소하였다 반면, 미기록종 논문이 28%로 높아졌다. 학회지에 게재된 전체 연구논문들 중 분류군을 검토한 논문이 629편이며, 그 중 49%를 차지하는 논문의 대상 분류군들은 국화과, 미나리아재비과, 사초과, 백합과, 장미과, 콩과, 미나리과, 꿀풀과, 난과, 물푸레나무과, 대극과, 마디풀과, 수선화과로 나타났다. 10년 단위로 연구방법의 변화를 볼 때 형태논문은 6%에서 51%로 증가되었고, 화분논문은 20%에서 최근에 2%로 낮아졌다. 염색체 연구는 약 3-4%, 성분연구는 약 2%로 낮고, DNA연구의 비율도 3-16%로 낮았다. 10년 단위별 전체 논문 수중 영문논문의 비율은 최근에 43% 정도로 향상되었는데, 이는 주로 미기록 분류군들의 논문이 증가한 데 기인한다.

데이터 불균형 문제에서의 SVM 앙상블 기법의 적용 (SVM Ensemble Techniques for Class Imbalance Problem)

  • 강필성;이형주;조성준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.706-708
    • /
    • 2004
  • 대부분의 기계학습 알고리즘은 학습 데이터에서 각각의 범주간의 비율이 동일하거나 비슷하다는 가정 하에 문제를 풀게 된다. 그러나 실제 문제에서는 그 비율이 동일하지 않으며 매우 큰 차이를 보이기도 하는데, 이는 분류 성능을 저하시키는 요인이기도 하다 따라서 본 논문에서는 이러한 데이터의 불균형 문제를 해소하는 방안으로 SVM 앙상블 기법을 적용한 샘플링을 제안하고 이를 실제 불균형 데이터에 적용함으로써 제안된 방법이 기존의 방법들에 비해 향상된 성능을 나타내는 것을 보였다.

  • PDF

상완골의 특징에 의한 동남아시아산 과일박쥐류(대이익수아목)의 분류.동정 (Identification of belonging to the Pteropodidae(Megachiroptera) Collected from from Southeast Asia by the Humeral Characters)

  • 윤명희
    • 한국동물학회지
    • /
    • 제30권1호
    • /
    • pp.79-88
    • /
    • 1987
  • 동남아시아에서 채집된 대익수아목 Megachiroptera, 과일박쥐과 Pteropodidae에 속하는 5속, 6종, 1아종에 대하여, 상완골의 특징을 기재했다. 또한, 계통적으로 하등한 대익수아목 Megachiroptera과 고등한 소익수아목 Megachiroptera 간의 비상적응성의 차이에 대하여, 상완골의 형태, 상완골의 DW/PW(원위단독의 근위단독에 대한 비율) 및 익형율(제3지장의 5지장에 대한 비율)을 통하여 고찰하였다.

  • PDF

21세기의 연료와 동력전망 (Fuel and Power in the 21th Century)

  • 편집실
    • 전기의세계
    • /
    • 제21권4호
    • /
    • pp.45-47
    • /
    • 1972
  • 최근까지의 관습적인 예측으로보면 인간의 동력사용은 앞으로 수십년에 걸쳐 현재와 같은 비율로 지수함수적으로 증가할 것이며 이로 인해 당연히 전세계의 한정된 화석연료자원이 급속히 고갈되지 않을까 하는 우려가 제기된다. 그러므로 인간의 실수요에 대해 타당한 예측을 하는것이 우선적 문제인데, 이것은 세계인구수와 1년 1인당의 예상수요의 산출로 분류할 수 있다. 인구수에 관해서는 다음과 같은 낙관적인 견해가 있다. 즉 인구는 2,000년까지 현재의 비율(년간 2%)로 계속 증가하여 현 3.5*$10^{9}$에서 6.6*$10^{9}$ 이 될 것이나, 21세기중에는 일정한 수에 머무를 것이다. 동력의 1인당 실수요 평가에 있어서는 여러가지 요인을 고려해야 한다.

  • PDF

SPAM 기반 영상 스테그아날리시스의 범용성에 대한 실험적 검증 (Experimental Verification of the Versatility of SPAM-based Image Steganalysis)

  • 김재영;박한훈;박종일
    • 방송공학회논문지
    • /
    • 제23권4호
    • /
    • pp.526-535
    • /
    • 2018
  • 많은 스테가노그래피 알고리즘들이 연구되어왔고 스테가노그래피의 연구로 인해서 스테가노그래피 알고리즘이 적용된 스테고 영상을 검출하기 위한 스테그아날리시스 또한 연구되어왔다. 특히 영상 스테그아날리시스의 경우에 ALE, SPAM, SRMQ와 같은 통계적인 특성에 기반한 수제 특징이 영상으로부터 추출되고 이 특징을 기계학습 알고리즘을 사용하여 스테고 영상의 분류에 사용하였다. 하지만 이러한 연구들은 단지 단일 영상의 크기, 비밀 정보 삽입 비율에 대해서만 고려하였으며 다양한 영상의 크기, 가로세로 비, 비밀 정보의 비율들에 대해서는 고려하지 않았다. 결과적으로 SPAM 특징이 다양한 조건하에서도 범용성있게 사용가능한지에 대한 검증은 이루어지지 않았다. 본 논문에서는 SPAM 기반의 영상 스테그아날리시스를 사용하여 영상의 크기, 가로 세로 비 비밀 정보 삽입 비율의 다양한 조건에 대한 분류율을 분석하여 SPAM 특징이 일관적인 분류 결과를 보여줄 수 있는지 확인해본다.

데이터 불균형 해소를 위한 유전알고리즘 기반 최적의 오버샘플링 비율 (Optimal Ratio of Data Oversampling Based on a Genetic Algorithm for Overcoming Data Imbalance)

  • 신승수;조휘연;김용혁
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.49-55
    • /
    • 2021
  • 최근에는 데이터베이스의 발달로 금융, 보안, 네트워크 등에서 생성된 많은 데이터가 저장 가능하며, 기계학습 기반 분류기를 통해 분석이 이루어지고 있다. 이 때 주로 야기되는 문제는 데이터 불균형으로, 학습 시 다수 범주의 데이터들로 과적합이 되어 분류 정확도가 떨어지는 경우가 발생한다. 이를 해결하기 위해 소수 범주의 데이터 수를 증가시키는 오버샘플링 전략이 주로 사용되며, 데이터 분포에 적합한 기법과 인자들을 다양하게 조절하는 과정이 필요하다. 이러한 과정의 개선을 위해 본 연구에서는 스모트와 생성적 적대 신경망 등 다양한 기법 기반의 오버샘플링 조합과 비율을 유전알고리즘을 통해 탐색하고 최적화 하는 전략을 제안한다. 제안된 전략과 단일 오버샘플링 기법으로 신용카드 사기 탐지 데이터를 샘플링 한 뒤, 각각의 데이터들로 학습한 분류기의 성능을 비교한다. 그 결과 유전알고리즘으로 기법별 비율을 탐색하여 최적화 한 전략의 성능이 기존 전략들 보다 우수했다.

고속 발화음에 대한 음성 인식 향상 (Improvements on Speech Recognition for Fast Speech)

  • 이기승
    • 한국음향학회지
    • /
    • 제25권2호
    • /
    • pp.88-95
    • /
    • 2006
  • 본 논문에서는 대화체 음성에 대한 음성 인식의 성능을 향상시키기 위한 방법으로, 고속 발화음에 대해 강인한 음성 인식 방법을 제안하고 성능을 평가하였다. 제안된 기법은 입력된 음성의 속도를 정량화하여 나타내기 위한 부가적인 음성 인식 과정이 필요치 않으며, 특정 대역내의 에너지 분포를 이용하여 모음 구간을 판정하고, 단위 시간당 모음의 개수를 구하여 음성의 속도를 측정하였다. 빠른 발성음에 대한 음성 인식의 성능을 향상시키기 위해, 기존의 방법은 표준 음소 길이와 측정된 음소 길이간의 비율을 이용하여 특징 벡터를 시간축으로 확장하였다. 제안된 방법에서는 발성 속도에 따라 음성을 분류하고, 분류된 음성에 대해 서로 다른 시간축 확장 비율을 정하도록 하였다. 여기서 분류에 필요한 문턱치들과 시간축 확장 비율들은 최대 우도 방법을 이용하여 구하였다. 10자리 이동 전화 번호에 대한 음성 인식의 실험 결과, 제안된 기법에 의해 전체적으로 $17.8\%$ 오류율이 감소되는 것을 확인할 수 있었다.

공간 데이터의 분포를 고려한 공간 엔트로피 기반의 의사결정 트리 기법 (A Spatial Entropy based Decision Tree Method Considering Distribution of Spatial Data)

  • 장윤경;유병섭;이동욱;조숙경;배해영
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.643-652
    • /
    • 2006
  • 의사결정 트리는 데이터 마이닝의 분류와 예측 작업에 주로 사용되는 기법 중의 하나이다. 실생활에서 공간의사결정을 위한 분류를 수행할 때에는 인접 데이터의 위치와 분산도를 고려하는 것이 매우 중요하다. 기존의 공간 의사결정 트리는 데이터의 공간적 특성을 표현하기 위해 각 객체간의 유클리디안 거리비율을 엔트로피로 반영하여 트리 구축 시 이용하였다. 그러나 이것은 공간 객체간의 거리 비율만을 설명할 뿐 공간 차원에서의 데이터 분산 정도와 각 분류된 클래스간의 연관관계 등은 파악할 수 없다는 한계점이 있었다 본 논문에서는 분산도와 차별도 기반의 공간 엔트로피를 이용하여 공간 데이터의 분포도를 반영하는 공간 의사결정 트리를 제안한다 분산도는 분류된 클래스 내의 공간 객체 분포도를 나타내고 차별도는 다른 클래스 내 공간 객체와의 분포도 및 관계성을 나타낸다. 이러한 분산도와 차별도의 비율을 엔트로피 계산 시 이용함으로써 비공간적 속성으로 분류된 각 클래스가 공간적으로는 얼마나 뚜렷하게 분류되는지 알 수 있게 한다. 제안 기법은 정확성과 계산 비용에 있어서 기존 기법보다 각각 약 18%, 11%의 성능 향상을 보였다.

Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템 (A Document Classification System Using Modified ECCD and Category Weight for each Document)

  • 한정석;박상용;이수원
    • 정보처리학회논문지B
    • /
    • 제19B권4호
    • /
    • pp.237-242
    • /
    • 2012
  • 웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류 시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어 모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 'Modified ECCD' 기법 및 '문서별 범주 가중치' 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 'Modified ECCD' 기법이 ${\chi}^2$ 및 ECCD 기법에 비해 높은 분류 성능을 보였으며, '문서별 범주 가중치' 특징 변수를 'Modified ECCD' 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에 더 높은 분류 성능을 보였다.

경험기법을 사용한 SNS 스팸의 클러스터링에 관한 연구 (A Study on Clustering of SNS SPAM using Heuristic Method)

  • 권영만;이인락;김명관
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.7-12
    • /
    • 2014
  • SNS는 친구들의 친목과 인맥유지를 위한 순기능을 가지고 있다. 그러나 각종 기업, 개인 스패머들이 팔로잉을 통해 스팸 트윗하여 다수의 이용자들에게 노출, 불편을 끼치고 있다. 기존 연구에서 이러한 스팸 트윗에 대해 연구를 실시한경우가 있다. 그러나 정교함의 부족함과 여러 원인들로 인해 보다 정확한 분류 및 검출이 어려운 결과를 나타내었다. 본 논문에서는 스패머들의 특징, 분류기준, 분류방법에 대해 기술하였다. 또한 이러한 특징 중 링크율과 자신을 팔로워한 부류와 자신이 팔로잉한 부류와의 차이를 통하여 스패머 계정에 대한 분류기준을 제시하였다. 실험은 무작위 스팸 계정과 일반 계정을 선정하였으며 분류기준에 따라 진행하였다. 결과로 스팸 계정은 링크율 68%, 팔로워 / 팔로잉 비율은 27581.5 였고 일반 계정은 6.12%, 팔로워 / 팔로잉 비율은 1.26 였다.