• 제목/요약/키워드: 문서 불균등 분포

검색결과 2건 처리시간 0.021초

문서의 불균등 분포를 고려한 단어 불순도 기반 특징 선택 방법 (An Enhanced Feature Selection Method Based on the Impurity of Words Considering Unbalanced Distribution of Documents)

  • 강진범;양재영;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.804-816
    • /
    • 2007
  • 기계 학습 과정에서 수집된 많은 정보들 중에는 학습하고자 하는 개념과 관련이 없거나 중복된 정보를 가진 경우가 많다. 또한 자료 자체에 오류가 있기도 하다. 이와 같이 학습 모델 생성을 위해 수집된 정보를 신뢰할 수 없다면, 학습 과정에서도 정확한 지식 습득이 어렵다. 그래서 기계 학습은 학습 과정에서 정확한 지식 습득을 위해 특징 선택 방법을 사용한다. 특징 선택은 학습할 클래스와 관련이 없거나 중복된 정보를 학습 모델 생성 이전에 제거함으로써 학습 알고리즘의 성능을 향상시킨다. 기존의 특징선택 방법들은 적절한 특징을 선택하기 위하여 문서가 균등하게 분포되어 있다고 가정한다. 하지만, 실제로는 그렇지 않으며, 문서의 수 또는 문서의 길이가 모두 동일한 학습 예제를 준비하는 것도 매우 어렵다. 본 논문에서는 보다 효율적으로 특징을 선택하기 위해 클래스 별 단어의 불순도와 문서의 불균등 분포를 고려한 특징 선택 방법을 제안한다. 클래스를 대표할 수 있는 특징 후보들을 단어의 불순도 측정을 통해 얻고, 문서의 불균등 분포를 고려하여 특징을 선택한다. 실험을 통해 보다 좋은 성능을 보임을 입증한다.

국소 영역별 대비 개선과 쌍선형 보간에 의한 불균등 대비 영상의 효율적 적응 이진화 (An Adaptive Thresholding of the Nonuniformly Contrasted Images by Using Local Contrast Enhancement and Bilinear Interpolation)

  • 정동현;조상현;최흥문
    • 전자공학회논문지S
    • /
    • 제36S권12호
    • /
    • pp.51-57
    • /
    • 1999
  • 본 논문에서는 불균등 대비 영상에서 국소 영역별 대비개선과 문턱치 평면의 쌍선형 보간을 이용한 효과적인 적응 이진화 방법을 제안하였다. 제안한 방법에서는 먼저 영상을 국소 영역으로 나누고, 영역별로 흐리거나 대비가 낮은 부분의 명도차를 증대시켜 전체적으로 대비를 개선한 후, 대비 개선된 국소 영역별 명도 분포로부터 해당 영역의 최적 문턱치를 구하였다. 국소 영역간에 이웃하는 문턱치들을 쌍선형 보간하여 전역적으로 영역별 문턱치들간의 불연속성을 없앰으로써 불균등 대비 영상에 대해서도 관심 영역이나 문자 부분에서의 불연속을 줄이도록 하였다. 불균등 대비를 갖는 일반문서 및 PCB나 웨이퍼상의 문자 영상을 제안한 방법과 기존 방법으로 이진화한 영상들로부터 문자들을 추출하고, 동일 조건하에서 같은 역전파 신경회로망으로 인식 실험하여 제안한 방법의 실효성을 확인하였다.

  • PDF