• 제목/요약/키워드: 이진 분류

검색결과 605건 처리시간 0.028초

데이타마이닝 기법을 이용한 문서 자동 분류 모델 (An Automatic Text Classification Model using Association Rules)

  • 김영인;이진용;문현정;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.101-108
    • /
    • 2000
  • 기업에서 보유한 전문 지식 정보가 급속도로 증가함에 따라 대량의 문서에 저장된 지식 정보를 효과적으로 탐색하여 기업 경영에 활용하기 위한 지식경영시스템 도입이 확산되고 있다. 이러한 지식경영시스템에서 핵심적인 구성 요소는 전문 분야의 지식 정보를 체계적으로 분류하고 효율적으로 검색하기 위한 지식 탐사 기법이다. 본 논문에서는 데이타마이닝 기법을 이용하여 문서를 자동적으로 분류하기 위한 새로운 모델을 제안하였다. 연관 규칙 탐사 알고리즘을 이용하여 학습용 문서 집합으로부터 세부 분야를 대표하는 색인어 집합을 구성하였다. 세부 분야별 색인어 집합에 대하여 전체 문서에 대한 비중에 따라 가중치 배열을 구성하여 문서를 자동으로 분류하기 위한 기준으로 삼았다. 임의의 문서를 자동적으로 분류하는 실험을 통하여 제안된 방법의 효율성을 검정하였다.

  • PDF

OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구 (Hierarchic Document Clustering in OPAC)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.93-117
    • /
    • 2004
  • 본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

비감독형 학습 기법을 사용한 심각도 기반 결함 예측 (Severity-based Fault Prediction using Unsupervised Learning)

  • 홍의석
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.151-157
    • /
    • 2018
  • 소프트웨어 결함 예측에 관한 기존의 연구들은 대부분 모델의 입력 모듈이 결함을 가지고 있는지 여부를 판단하는 이진 감독형 분류 모델들에 관한 것들이었다. 하지만 이진 분류 모델은 결함의 복잡한 특성들을 고려하지 않고 단순히 입력 모듈의 결함 유무만을 판단한다는 문제점이 있고, 감독형 모델은 대부분의 개발 집단이 보유하고 있지 않은 훈련 데이터 집합을 필요로 한다는 한계점이 있다. 본 논문은 이러한 두 가지 문제점을 해결하기 위해 비감독형 알고리즘을 사용한 심각도 기반 삼진 분류 모델을 제안하였으며, 평가 실험 결과 제안 모델이 감독형 모델들에 필적하는 예측 성능을 보였다.

영역 확장법을 이용한 연기검출 (Smoke Detection using Region Growing Method)

  • 김동근
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.271-280
    • /
    • 2009
  • 본 논문에서는 옥외 비디오 영상에서 영역 확장법을 이용한 연기 영역검출 방법을 제시한다. 제안된 방법은 차영상에 의한 초기 변화영역 검출 단계, 경계선 검출 및 확장 단계, 특징 검출 및 연기분류의 3단계로 구성된다. 초기 변화영역 검출 단계에서는 배경영상으로 차영상을 계산하고, 초기 임계치를 이용하여 이진영상을 구하고, 잡음 제거를 위하여 모폴로지 연산을 수행한다. 경계선 검출 및 확장 단계는 레이블링 알고리즘에 의해 이진영상에서 변화영역을 검출하고, 각 변화영역의 경계선을 검출한 다음, 차영상과 경계선을 이용하여 확장된 경계선을 계산한다. 특징 검출 및 연기분류 단계에서는 확장된 경계선에 모멘트를 이용하여 타원을 추정하고 타원의 시간에 따른 특징정보를 이용하여 연기 영역을 분류한다.

퍼지 클러스터링 알고리즘을 이용한 타이어 접지면 패턴의 분류 (Tire Tread Pattern Classification Using Fuzzy Clustering Algorithm)

  • 강윤관;정순원;배상욱;김진헌;박귀태
    • 한국지능시스템학회논문지
    • /
    • 제5권2호
    • /
    • pp.44-57
    • /
    • 1995
  • 본논문에서는 GFI(Generalized Fuzzy Isodata)와 FI(Fuzzy Isodata) 알고리즘에 관한 이론을 고찰하고 이를 타이어 접지면 패턴 분류에 적용해 보았다. GFI 알고리즘은 FI 알고리즘의 일반화된 형태로서 분할된 군집에 대해서도 퍼지 분할 행렬(fuzzy partition matrix)을 고려해 다시 군집화(clustering)를 가능하게 하는 알고리즘이다. GFI 알고리즘을 사용하여 이진 트리를 구성함에 있어서 각 노드에서의 분할 여부, 즉 군잡화의 타당성(clustering validity) 점검 및 최종적인 이진 트리의 완성은 FDH(Fuzzy Divisve Hierarchical) 군집화알고리즘을 통해 이루어진다. 타이어 접지면에 대한 표준 특징량을 선정하거나 패턴 분류를 수행함에 있어서 이들 알고리즘은모두 우수한 성능을 가짐을 알 수 있었다. 패턴의 특징량으로는 전처리된 타이어 접지면 영상에 나타나는 윤곽선(edge)의 각도 성분을 선정하였으며 이렇게 선정된 특징량은 패턴의 특징을 잘 표현해 주는 유용한 정보를 가진 것으로 생각된다.

  • PDF

단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구 (A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation)

  • 이용구
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.193-210
    • /
    • 2011
  • 이 연구는 단어 중의성 해소를 위해 SVM 분류기가 최적의 성능을 가져오는 문맥창의 크기와 다양한 가중치 방법을 파악하고자 하였다. 실험집단으로 한글 신문기사를 적용하였다. 문맥창의 크기로 지역 문맥은 좌우 3단어, 한 문장, 그리고 좌우 50바이트 크기를 사용하였으며, 전역문맥으로 신문기사 전체를 대상으로 하였다. 가중치 부여 기법으로는 단순빈도인 이진 단어빈도와 단순 단어빈도를, 정규화 빈도로 단순 또는 로그를 취한 단어빈도 ${\times}$ 역문헌빈도를 사용하였다. 실험 결과 문맥창의 크기는 좌우 50 바이트가 가장 좋은 성능을 보였으며, 가중치 부여 방법은 이진 단어빈도가 가장 좋은 성능을 보였다.

Kapur 방법과 퍼지 추론 규칙을 이용한 자궁 경부진 핵 인식 (Nucleus Recognition of Uterine Cervical Pap-Smears using Kapur Method and Fuzzy Reasoning Rule)

  • 강경민;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.241-247
    • /
    • 2007
  • 자궁 경부 세포진 영상의 핵 추출을 위해서는 영상의 배경과 핵 그리고 세포질 영역의 구분이 중요하다. 또한 정상 세포핵과 암종 세포핵의 구분 및 인식을 위해서는 세포핵들의 형태학적 특징을 이용한 분류 기준을 세워야한다. 본 논문에서는 자궁 경부 세포진 영상에서 세포핵의 후보 영역과 핵을 추출하기 위해 현미경 400배율 확대 사진을 획득하는 과정에서 훼손된 컬러 영상을 복원하기 위한 방법으로 Lighting Compensation을 적용하여 영상을 보정한다. 그리고 배경 영역과 세포핵 영역을 구분하기 위해 영상의 R,G,B 영역의 히스토그램의 분포를 이용하여 배경을 제거한다. 배경이 제거된 영상을 그레이 영상으로 변환 한 후, 히스토그램 명암도의 값을 이용하여 세포핵 영역과 세포질을 분류하여 세포핵 영역을 추출한다. 그리고 Kapur 방법을 적용하여 세포핵 영역의 엔트로피 누적확률을 구한 후, 영상을 이진화 한다. Kapur 방법이 적용된 이진화 영상에서 세포핵 영역의 중심과 주위 화소를 비교하는 $3\times3$ 마스크를 적용하여 영상의 미세한 잡음을 제거 한 후, 8방향 윤곽선 추적 알고리즘을 적용하여 최종적으로 세포핵 영역을 추출한다. 추출된 세포핵의 영역을 분류 및 인식하는 과정으로 세포의 외각의 방향성 정보, 핵의 크기, 그리고 면적 비율의 특징을 이용하여 퍼지 소속 함수를 설계한 후, 소속 함수의 소속도를 구하고 퍼지 추론 규칙을 적용하여 자궁 경부 세포진 영상에서 정상 세포핵 및 암종 세포핵을 인식한다.

  • PDF

자동차 번호판 이진화 방법에 대한 성능 비교 (Comparative Performance Evaluation of Binarization Methods for Vehicle License Plate)

  • 김민기
    • 한국콘텐츠학회논문지
    • /
    • 제9권8호
    • /
    • pp.9-17
    • /
    • 2009
  • 자동차 번호 인식에 대한 연구가 활발히 이루어져 왔으나, 번호판 이진화 방법들에 대한 비교 연구는 거의 이루어지지 않았다. 이로 인하여 관련 연구자들마다 효과적인 이진화 방법을 찾기 위하여 유사한 시행착오를 겪어 왔다. 본 연구에서는 이러한 시행착오를 줄일 수 있도록 기존의 번호판 이진화 방법들을 구현하여 성능을 양적으로 비교 제시하였다. 이진화 성능 측정은 저수준 척도와 고수준 척도를 모두 사용함으로써 이진화 자체에 대한 평가뿐만 아니라 후속 단계에서의 유용성을 함께 고려하였다. 그리고 이진화 방법들의 특성을 파악하기 위하여 조도의 특성에 따라 번호판 영상을 세 그룹으로 분류하여 이진화 성능을 측정하였다. 실험 결과 조도의 강도보다는 조도의 균일성 여부가 이진화 성능에 더 큰 영향을 미치는 것으로 나타났다. 조도가 균열한 영상은 Otsu의 방법이 가장 효과적이었으며, 조도가 불균일한 영상은 파라미터를 보정한 Niblack 방법이 가장 좋은 결과를 나타냈다.

블룸 필터를 사용한 길이에 대한 2차원 이진검색 패킷 분류 알고리즘 (Two-Dimensional Binary Search on Length Using Bloom Filter for Packet Classification)

  • 최영주;임혜숙
    • 한국통신학회논문지
    • /
    • 제37권4B호
    • /
    • pp.245-257
    • /
    • 2012
  • 패킷 분류는 인터넷 라우터가 수행하는 가장 중요한 기능 중 하나로써 들어오는 모든 패킷을 선 속도로 처리하기를 요구한다. 영역분할을 사용한 사분트라이 구조에 길이 별 이진 검색을 적용한 알고리즘은 2차원 필드를 동시에 검색하면서 검색영역을 반으로 줄여나갈 수 있으므로 매우 효율적인 구조이다. 하지만 트라이의 레벨에 노드가 없는 경우에도 해시 테이블에 접근하는 문제점이 존재한다. 따라서 본 논문에서는 해시 메모리로의 불필요한 접근을 줄이기 위해서 영역분할을 사용한 사분 트라이의 길이별 이진 검색에 블룸 필터를 적용하는 패킷분류 구조를 제안한다. 현재 사용되는 ACL, FW, IPC 룰 타입의 1000, 5000, 10000개의 룰 셋으로 실험한 결과, 블룸 필터를 적용함으로써 검색 성능이 21~33%까지 향상되는 결과를 얻었다.

컴퓨터 기법을 이용한 초음파 영상에서의 지방간 분류 (The Classification of Fatty Liver by Ultrasound Imaging using Computerizing Method)

  • 장현우;김광백;김창원
    • 한국정보통신학회논문지
    • /
    • 제17권9호
    • /
    • pp.2206-2212
    • /
    • 2013
  • 본 논문은 Fuzzy Contrast Enhancement 기법과 FCM을 이용하여 대비를 개선한 후, Fuzzy Contrast Enhancement를 간과 신장의 초음파 영상에 적용하여 지방간 농도 수치를 분류하는 방법을 제시한다. 간, 신장 영역을 촬영한 초음파 영상에서 촬영 정보나 눈금자 등과 같이 필요 없는 부분을 잡음으로 간주하여, 제거한 ROI 영상을 추출하고, Fuzzy Contrast Enhancement 알고리즘을 이용하여 명암 대비를 강조한다. Fuzzy Contrast Enhancement 기법이 적용된 간, 신장 영역 영상에서 평균 이진화를 적용한 후, 평균 이진화를 적용한 영상에 Blob 알고리즘을 적용하여 간, 신장 실질 영역의 ROI 영상을 추출한다. 추출한 간 영역과 신장영역의 ROI 영상을 FCM을 이용하여, 10개의 명암도 Level로 각 각 분류한 후, 분류된 간, 신장 실질 영역의 명암도 Level 중 많이 분포된 명암도 Level을 기준으로 간, 신장 실질 영역의 대표 명암도를 추출한다. 제안된 방법을 간, 신장 영역을 촬영한 초음파 영상에 적용하여 간의 지방도를 분류한 결과, 영상의학과 전문의의 판독과 일치하여 향후 지방간의 진단에 효과적으로 적용할 수 있는 방법이 될 수 있을 것으로 사료된다.