• 제목/요약/키워드: contents classification

검색결과 1,142건 처리시간 0.024초

유해어 필터링과 SVM을 이용한 유해 문서 분류 시스템 (Harmful Document Classification Using the Harmful Word Filtering and SVM)

  • 이원휘;정성종;안동언
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.85-92
    • /
    • 2009
  • 오늘날 웹이 일반화되면서 사람들은 원하는 정보를 웹을 통해 얻고, 또한 제공하고 있다. 웹이 다양한 정보의 제공과 습득의 장이라는 편의성을 제공하고 있지만, 반면에 너무 많은 정보, 무분별한 유해 정보의 범람 등 여러 가지 문제를 내포하고 있다. 현재 유해 웹 문서를 분류하기 위한 다양한 방법이 연구되고 사용되고 있다. 그러나 각각의 방법들이 갖는 단점들로 인해 획기적인 성과를 내지 못하고 있다. 본 논문에서는 유해 정보로부터 사회적으로 보호를 받아야 할 사용자들을 보호하기 위한 수단으로 유해 웹 문서 차단 방법에 대해 제안하고자 한다. 본 논문에서는 키워드 필터링과 SVM 알고리즘을 이용한 2단계 분류 과정을 통해 분류의 정확률을 높이고자 하였다.

Topic Extraction and Classification Method Based on Comment Sets

  • Tan, Xiaodong
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.329-342
    • /
    • 2020
  • In recent years, emotional text classification is one of the essential research contents in the field of natural language processing. It has been widely used in the sentiment analysis of commodities like hotels, and other commentary corpus. This paper proposes an improved W-LDA (weighted latent Dirichlet allocation) topic model to improve the shortcomings of traditional LDA topic models. In the process of the topic of word sampling and its word distribution expectation calculation of the Gibbs of the W-LDA topic model. An average weighted value is adopted to avoid topic-related words from being submerged by high-frequency words, to improve the distinction of the topic. It further integrates the highest classification of the algorithm of support vector machine based on the extracted high-quality document-topic distribution and topic-word vectors. Finally, an efficient integration method is constructed for the analysis and extraction of emotional words, topic distribution calculations, and sentiment classification. Through tests on real teaching evaluation data and test set of public comment set, the results show that the method proposed in the paper has distinct advantages compared with other two typical algorithms in terms of subject differentiation, classification precision, and F1-measure.

A new approach for content-based video retrieval

  • Kim, Nac-Woo;Lee, Byung-Tak;Koh, Jai-Sang;Song, Ho-Young
    • International Journal of Contents
    • /
    • 제4권2호
    • /
    • pp.24-28
    • /
    • 2008
  • In this paper, we propose a new approach for content-based video retrieval using non-parametric based motion classification in the shot-based video indexing structure. Our system proposed in this paper has supported the real-time video retrieval using spatio-temporal feature comparison by measuring the similarity between visual features and between motion features, respectively, after extracting representative frame and non-parametric motion information from shot-based video clips segmented by scene change detection method. The extraction of non-parametric based motion features, after the normalized motion vectors are created from an MPEG-compressed stream, is effectively fulfilled by discretizing each normalized motion vector into various angle bins, and by considering the mean, variance, and direction of motion vectors in these bins. To obtain visual feature in representative frame, we use the edge-based spatial descriptor. Experimental results show that our approach is superior to conventional methods with regard to the performance for video indexing and retrieval.

패턴정보를 이용한 디자인패턴 검색 시스템 설계 (A Design of Design Pattern Retrieval System using Pattern Information)

  • 김귀정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.440-443
    • /
    • 2006
  • 본 연구는 디자인패턴의 효율적인 관리와 재사용을 위하여 패턴 정보를 이용한 디자인패턴 검색 시스템을 설계하였다. 패턴 정보는 패턴 속성정보와 패턴 메타정보로 구성하였고, 패턴 속성정보는 패턴 패싯 분류와 패턴 검색을 위한 유사도 측정에 이용되며, 패턴 구조를 UML로 모델링하기 위하여 패턴 메타 정보를 이용하였다. Gamma 분류 방법을 확장하여 각 디자인패턴이 사용될 수 있는 여러 경험적 상황을 패싯 항목으로 설정하고 패턴 정보로 관리하였다.

  • PDF

디지털 유전자를 사용하는 추상 이미지의 분류 (Classification of Abstract Images using Digital Chromosome)

  • 서동수;이혜리
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.870-874
    • /
    • 2009
  • 추상 이미지를 자동 생성하는 기법으로 유전자 알고리즘을 이용하는 방법은 다양한 형태의 이미지를 자동 생성할 수 있는 기법으로 유용하게 쓰일 수 있다. 그러나 다수의 자동 생성된 이미지를 보관하고 검색하는 과정에서 적절한 분류 방법이 제공되지 않아 관리의 어려움이 존재한다. 본 연구에서는 아핀 추상 이미지를 효과적으로 분류하기 위한 체계로 형태요소, 감성요소, 색채요소를 이용한 분류 방법을 제안하고 이를 검색할 수 있는 데이터베이스를 설계한다.

  • PDF

비상운전절차서 작성과정의 인적오류 저감을 위한 지침서 제안에 관한 연구 (Suggestion of a New Writer's Guideline to Reduce Human Errors Found in the Emergency Operation Procedures of a Nuclear Power Plant)

  • 이동하;장통일;이용희
    • 대한인간공학회지
    • /
    • 제29권1호
    • /
    • pp.129-138
    • /
    • 2010
  • Gori-I nuclear power plant has been examining the effectiveness and efficiency of the current emergency operation procedures from human factors viewpoint. Previous study showed that some mistakes that the procedures did not comply with the writers' guidelines. Reviewing the current writers' guidelines for emergency operating procedures revealed that they lack of some important human factors rules such as enumeration of switching conditions and detailed action requirements, definite expression for setup points, description for anticipated results, and recommendation for use of present tense, affirmative sentence and active voice. This study suggested a new classification system for the writers' guideline contents supplementing the deficiencies of the current emergency operation procedure text.

Classification of Cognitive States from fMRI data using Fisher Discriminant Ratio and Regions of Interest

  • Do, Luu Ngoc;Yang, Hyung Jeong
    • International Journal of Contents
    • /
    • 제8권4호
    • /
    • pp.56-63
    • /
    • 2012
  • In recent decades, analyzing the activities of human brain achieved some accomplishments by using the functional Magnetic Resonance Imaging (fMRI) technique. fMRI data provide a sequence of three-dimensional images related to human brain's activity which can be used to detect instantaneous cognitive states by applying machine learning methods. In this paper, we propose a new approach for distinguishing human's cognitive states such as "observing a picture" versus "reading a sentence" and "reading an affirmative sentence" versus "reading a negative sentence". Since fMRI data are high dimensional (about 100,000 features in each sample), extremely sparse and noisy, feature selection is a very important step for increasing classification accuracy and reducing processing time. We used the Fisher Discriminant Ratio to select the most powerful discriminative features from some Regions of Interest (ROIs). The experimental results showed that our approach achieved the best performance compared to other feature extraction methods with the average accuracy approximately 95.83% for the first study and 99.5% for the second study.

패턴인식 문제에 대한 다층퍼셉트론의 설계 방법 (Design of Multilayer Perceptrons for Pattern Classifications)

  • 오상훈
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.99-106
    • /
    • 2010
  • 다층퍼셉트론 혹은 전방향 신경회로망이 임의의 함수를 근사시킬 수 있다는 이론적 연구결과에 기초하여 많은 분야에 응용되고 있다. 이 다층퍼셉트론을 실제 문제에 응용하는 경우에 여러 가지 파라미터 혹은 학습 방법 등을 결정하여야 한다. 이 논문에서는 패턴인식 문제에 다층퍼셉트론을 적용하는 경우에 실제 결정하여야 할 파라미터의 결정방법과 학습 방법에 대하여 논의한다. 이 논의는 각층의 노드 수 결정 방법, 다층 퍼셉트론의 가중치 초기화, 그리고, 성능향상을 위하여 학습에 사용되는 여러 가지 오차 함수, 데이터 불균형 문제의 학습, 깊은 구조 등을 다루었다.

음성 분석을 이용한 사상 체질 분류에 관한 연구 (A Study on Sasang Constitution Classification Using Voice Analysis)

  • 조동욱;김봉현;이세환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
    • /
    • pp.513-517
    • /
    • 2005
  • 우리나라 전통의학이며, 세계 의료시장에서 경쟁력이 있는 독특한 체질의학이 사상의학이다. 사상의학은 누구나 쉽게 접근할 수 있으며, 체질에 맞는 생활 습관으로 건강한 삶을 누릴 수 있다. 본 논문에서는 음성 분석을 통한 사상 체질의 분류 방법을 제안하고자 한다. 이를 위해 음성 분석으로 각 사상체질에 나타나는 특성들을 살펴보았으며, 이를 통해 사람의 목소리만으로 간단히 사상 체질을 분류해 보는 방법에 대해 기술하고자 한다.

  • PDF

인지이론과 ART 신경회로망에 기반한 한글 문자 분류 모델 (Hangeul Character Classification Model Based on Cognitive Theory and ART Neural Network)

  • 박중양;박재흥;장재혁
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.33-42
    • /
    • 2005
  • 본 논문에서는 ART 신경회로망의 성능을 개선하기 위해, 불필요한 클러스터의 생성과 변화를 억제하여 효율적인 패턴 분류가 가능하도록 하는 학습 알고리즘을 제안한다. 또한, 패턴 분류의 정확성을 향상시키기 위해 한글의 구조적 특징을 이용한 위치추출 알고리즘을 적용하였다. 제안하는 학습 알고리즘은 현재 학습되는 패턴과 최초 패턴간의 일치도를 비교한 후 리세트 시스템을 작동케 한다. 그 결과, 신경회로 망은 이미 입력되었던 패턴이 다시 입력되어도 새로운 클러스터의 생성을 방지하여 오인식율을 줄이게 된다.

  • PDF