• 제목/요약/키워드: automatic classification

검색결과 877건 처리시간 0.023초

이메일 추천 시스템의 분류 향상을 위한 3단계 전처리 알고리즘 (A Three-Step Preprocessing Algorithm for Enhanced Classification of E-Mail Recommendation System)

  • 조동섭;정옥란
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제54권4호
    • /
    • pp.251-258
    • /
    • 2005
  • Automatic document classification may differ significantly according to the characteristics of documents that are subject to classification, as well as classifier's performance. This research identifies e-mail document's characteristics to apply a three-step preprocessing algorithm that can minimize e-mail document's atypical characteristics. In the first 5go, uncertain based sampling algorithm that used Mean Absolute Deviation(MAD), is used to address the question of selection learning document for the rule generation at the time of classification. In the subsequent stage, Weighted vlaue assigning method by attribute is applied to increase the discriminating capability of the terms that appear on the title on the e-mail document characteristic level. in the third and last stage, accuracy level during classification by each category is increased by using Naive Bayesian Presumptive Algorithm's Dynamic Threshold. And, we implemented an E-Mail Recommendtion System using a three-step preprocessing algorithm the enable users for direct and optimal classification with the recommendation of the applicable category when a mail arrives.

CT 영상에서 골다공증 판별 방법의 성능 향상 (A Performance Enhancement of Osteoporosis Classification in CT images)

  • 정성태
    • 한국멀티미디어학회논문지
    • /
    • 제19권8호
    • /
    • pp.1248-1259
    • /
    • 2016
  • Classification methods based on dual energy X-ray absorptiometry, ultrasonic waves, and quantitative computed tomography have been proposed. Also, a classification method based on machine learning with bone mineral density and structural indicators extracted from the CT images has been proposed. We propose a method which enhances the performance of existing classification method based on bone mineral density and structural indicators by extending structural indicators and using principal component analysis. Experimental result shows that the proposed method in this paper improves the correctness of osteoporosis classification 2.8% with extended structural indicators only and 4.8% with both extended structural indicators and principal component analysis. In addition, this paper proposes a method of automatic phantom analysis needed to convert the CT values to BMD values. While existing method requires manual operation to mark the bone region within the phantom, the proposed method detects the bone region automatically by detecting circles in the CT image. The proposed method and the existing method gave the same conversion formula for converting CT value to bone mineral density.

차량길이와 축거의 추세선을 이용한 차종분류 알고리즘 개발 (Developing a Vehicle Classification Algorithm Based on the Trend Line to Vehicle Lengths and Wheelbases)

  • 김형수;김민성;오주삼
    • 대한교통학회지
    • /
    • 제27권4호
    • /
    • pp.55-61
    • /
    • 2009
  • 차종분류는 교통의 흐름 및 안전에 미치는 영향을 분석하고 도로의 포장 및 시설의 설계를 위하여 이루어진다. 국내에서는 국토해양부의 12종 분류에 따라 고속국도, 일반국도, 지방도의 차종분류 자료가 제공되고 있다. 기계식 차종분류를 위한 AVC(Automatic Vehicle Classification) 장비는 차량길이, 축거, 내민 거리(overhang) 등의 측정값과 미리 입력된 모든 차량 모델의 제원값을 비교하여 차종을 판단한다. 하지만, 기존의 방법은 센서의 관리상태에 분류 정확도가 크게 영향받게 된다. 본 연구에서는 실제 조사지점에서 발생하는 장비 오차와 차량 제원정보에 민감하지 않은 차종분류 알고리즘을 개발하였다. 알고리즘을 단순화하기 위하여 차량길이와 축거 중심으로 추세선을 이용하여 차종을 분류하므로 센서의 정확도 변화의 영향을 감소시켰다. 개발된 알고리즘의 평가를 위하여 일반국도에 설치된 AVC 장비에서 축수, 차량길이, 축거, 내민거리를 추출하여 비디오 판독 결과와 비교하였다. 실험 결과는 전체 차량에 대하여 88.2%의 정확도를 얻었다. 본 연구에서 개발된 차종분류 알고리즘은 센서의 감도 변화 등 현장 환경의 변화에 덜 영향을 받도록 설계되어 차종분류를 위한 기계식 장비의 안정적 정확도 유지에 활용될 수 있을 것으로 기대된다.

기계학습을 이용한 문서 자동분류에 관한 연구 (A Study on the Documents's Automatic Classification Using Machine Learning)

  • 김성희;엄재은
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.47-66
    • /
    • 2008
  • 본 논문에서는 수작업 분류 시 초래하는 여러 가지 한계점을 극복하고, 이용자에게 보다 빠르고 정확한 분류 서비스를 제공하기 위해 4개의 다양한 기계학습 알고리즘을 적용하였다. 연구대상으로는 MeSH의 8개의 주제별 범주로 각각 100개의 문헌 타이틀을 선정하였으며, 4개의 기계학습 알고리즘으로 실험을 수행하였다. 그 결과 신경망 기법과 C5.0 기법을 병행하여 사용했을 경우 단일 기법을 사용했을 경우보다 2.5%, 3.75%가 상승하여 분류 효율이 83.75%로 측정되었다. 이 수치는 4개의 분류 실험 결과 중 가장 높은 정확률을 나타내었다. 따라서 신경망 기법과 C5.0 기법의 장점을 이용하여 분류 서비스를 실행하면 단일 기법을 사용한 경우보다 높은 정확률을 나타낼 수 있을 것이라 기대된다.

Performance Enhancement of Automatic Wood Classification of Korean Softwood by Ensembles of Convolutional Neural Networks

  • Kwon, Ohkyung;Lee, Hyung Gu;Yang, Sang-Yun;Kim, Hyunbin;Park, Se-Yeong;Choi, In-Gyu;Yeo, Hwanmyeong
    • Journal of the Korean Wood Science and Technology
    • /
    • 제47권3호
    • /
    • pp.265-276
    • /
    • 2019
  • In our previous study, the LeNet3 model successfully classified images from the transverse surfaces of five Korean softwood species (cedar, cypress, Korean pine, Korean red pine, and larch). However, a practical limitation exists in our system stemming from the nature of the training images obtained from the transverse plane of the wood species. In real-world applications, it is necessary to utilize images from the longitudinal surfaces of lumber. Thus, we improved our model by training it with images from the longitudinal and transverse surfaces of lumber. Because the longitudinal surface has complex but less distinguishable features than the transverse surface, the classification performance of the LeNet3 model decreases when we include images from the longitudinal surfaces of the five Korean softwood species. To remedy this situation, we adopt ensemble methods that can enhance the classification performance. Herein, we investigated the use of ensemble models from the LeNet and MiniVGGNet models to automatically classify the transverse and longitudinal surfaces of the five Korean softwoods. Experimentally, the best classification performance was achieved via an ensemble model comprising the LeNet2, LeNet3, and MiniVGGNet4 models trained using input images of $128{\times}128{\times}3pixels$ via the averaging method. The ensemble model showed an F1 score greater than 0.98. The classification performance for the longitudinal surfaces of Korean pine and Korean red pine was significantly improved by the ensemble model compared to individual convolutional neural network models such as LeNet3.

머신러닝을 이용한 R&D과제의 연구분야 추천 서비스 (Recommendation System for Research Field of R&D Project Using Machine Learning)

  • 김윤정;신동구;정회경
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1809-1816
    • /
    • 2021
  • 국가연구개발사업 관련 데이터를 이용한 최신 연구동향 파악, 의미 있는 정보의 생산과 활용을 위해 국가R&D 정보 서비스에도 자동 분류 기술 적용이 요구되어 R&D과제의 연구분야를 자동 분류하고 추천하기 위한 연구를 진행했다. 2013~2020년 국가R&D 과제 데이터 약 45만 건을 수집하여 학습과 평가에 사용했다. 수집 데이터 중 유효한 데이터를 대상으로 데이터 전처리 및 분석, 실험을 통한 성능 분석 후 모델을 선정했다. 최적의 모델 조합 도출을 목적으로 Word2vec, GloVe, fastText 성능을 비교했다. 실험 결과, 과제정보의 필수 항목으로 사용되는 소분류만의 정확도는 90.11%이다. 이 모델은 국가과학기술표준분류 연구분야와 유사한 계층 구조를 가진 다른 분류체계의 자동 분류 연구에 활용 가능할 것으로 기대한다.

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

Classification of White Blood Cell Using Adaptive Active Contour

  • Theerapattanakul, J.;Plodpai, J.;Mooyen, S.;Pintavirooj, C.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1889-1891
    • /
    • 2004
  • The differential white blood cell count plays an important role in the diagnosis of different diseases. It is a tedious task to count these classes of cell manually. An automatic counter using computer vision helps to perform this medical test rapidly and accurately. Most commercial-available automatic white blood cell analysis composed mainly 3 steps including segmentation, feature extraction and classification. In this paper we concentrate on the first step in automatic white-blood-cell analysis by proposing a segmentation scheme that utilizes a benefit of active contour. Specifically, the binary image is obtained by thresolding of the input blood smear image. The initial shape of active is then placed roughly inside the white blood cell and allowed to grow to fit the shape of individual white blood cell. The white blood cell is then separated using the extracted contour. The force that drives the active contour is the combination of gradient vector flow force and balloon force. Our purposed technique can handle very promising to separate the remaining red blood cells.

  • PDF

SAR 영상을 이용한 자동 표적 식별 기법에 대한 연구 (A Study on Automatic Target Recognition Using SAR Imagery)

  • 박종일;김경태
    • 한국전자파학회논문지
    • /
    • 제22권11호
    • /
    • pp.1063-1069
    • /
    • 2011
  • 레이더 영상이나 광학 영상, 적외선 영상 등을 이용하여 표적을 식별하는 기술을 NCTR(Non-Cooperative Target Recognition) 또는 ATR(Automatic Target Recognition)이라 한다. 그 중에서 SAR(Synthetic Aperture Radar) 영상을 이용하여 자동으로 지상 표적을 식별하는 것을 SAR ATR이라고 한다. 일반적으로 SAR ATR은 탐지, 변별 및 식별 단계로 구성된다. 본 논문에서는 ISAR(Inverse Synthetic Aperture Radar) 영상 식별을 위해 개발된 극사상식별기(polar mapping classifier)를 수정하여 SAR 표적 식별에 이용하였으며, 전처리 과정을 통해 클러터 화소의 영향을 줄이고 표적의 그림자 화소들 표적 식별에 이용하여 식별 성능을 향상시켰다.

해외 데이터베이스의 통제키워드에 기초한 국내 학술지 논문의 자동분류 성능 향상에 관한 실험적 연구 (An Experimental Study on the Performance Improvement of Automatic Classification for the Articles of Korean Journals Based on Controlled Keywords in International Database)

  • 김판준;이재윤
    • 한국문헌정보학회지
    • /
    • 제48권3호
    • /
    • pp.491-510
    • /
    • 2014
  • 학술지 논문의 효율적인 관리 및 검색을 위한 주요 요소인 키워드는 통제키워드와 비통제키워드로 구분할 수 있다. 그러나 현재 국내 데이터베이스에서 대부분의 학술지 논문에는 비통제키워드인 저자키워드만이 부여되어 있을 뿐, 망라적인 탐색을 돕는 통제키워드로서 디스크립터는 제공되지 않고 있다. 이 연구에서는 해외 데이터베이스의 학술지 논문에 부여된 통제키워드를 학습한 분류기를 사용하여, 국내 학술지 논문에 디스크립터를 자동 할당하는 실험을 수행하였다. 그 결과, 국외 데이터베이스의 디스크립터 학습을 통해 영문 초록이 있는 국내 학술지 논문에 통제키워드를 자동 할당할 수 있는 가능성을 확인하였다. 또한, 다양한 분류기 및 분류기 결합을 통하여 이러한 디스크립터 자동 할당의 성능 향상을 모색하였다.