• 제목/요약/키워드: semantic categorization

검색결과 46건 처리시간 0.03초

Learning Probabilistic Kernel from Latent Dirichlet Allocation

  • Lv, Qi;Pang, Lin;Li, Xiong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권6호
    • /
    • pp.2527-2545
    • /
    • 2016
  • Measuring the similarity of given samples is a key problem of recognition, clustering, retrieval and related applications. A number of works, e.g. kernel method and metric learning, have been contributed to this problem. The challenge of similarity learning is to find a similarity robust to intra-class variance and simultaneously selective to inter-class characteristic. We observed that, the similarity measure can be improved if the data distribution and hidden semantic information are exploited in a more sophisticated way. In this paper, we propose a similarity learning approach for retrieval and recognition. The approach, termed as LDA-FEK, derives free energy kernel (FEK) from Latent Dirichlet Allocation (LDA). First, it trains LDA and constructs kernel using the parameters and variables of the trained model. Then, the unknown kernel parameters are learned by a discriminative learning approach. The main contributions of the proposed method are twofold: (1) the method is computationally efficient and scalable since the parameters in kernel are determined in a staged way; (2) the method exploits data distribution and semantic level hidden information by means of LDA. To evaluate the performance of LDA-FEK, we apply it for image retrieval over two data sets and for text categorization on four popular data sets. The results show the competitive performance of our method.

현대 예술의상에 표현된 조형성의 텍스트 분석 (제1보) - 1980년대 이후 서구작가 작품을 중심으로 - (The Text Analysis of Plasticity Expressed in the Modern Art to Wear (Part I) - Focused on the West Art Works since 1980s -)

  • 서승미;양숙희
    • 한국의류학회지
    • /
    • 제29권6호
    • /
    • pp.793-804
    • /
    • 2005
  • The new paradigm of the 21st century demand an openly different world of formative ideologies in respect to art and design. The purpose of this study is focused on trying to comprehend aesthetic essence of clothing as an, with the investigation of artistic theories manifested by art philosophers. Art to Wear was categorized into style to understand its artistic meaning as well as to analyze its character. Upon the foundation of semiotics theory, the feature of Art to Wear and its analysis category were argued in the context of Charles Morris three dimension of semiotics analysis. The conclusion to the research is like so. The feature and analysis category of Art to Wear upon a semiotics perspective was divided into syntactic dimension, semantic dimension and pragmatic dimension. The analytical categorization upon the perspective of syntactic dimension fell into the category of topology, shape and color. The semantic dimension of Art to Wear was divided into categories of denotation and connotation. In addition, the pragmatic dimension of Art to Wear analytical categorization was divided into a delivering function and common function.

사진 콘텐츠 분류를 위한 태그 클러스터링 기법 및 태그 추천 (A Tag Clustering and Recommendation Method for Photo Categorization)

  • 원지현;이종우;박희민
    • 인터넷정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.1-13
    • /
    • 2013
  • 개인이 사용할 수 있는 스마트 기기가 다양해지면서 여러 기기로 생산된 사진 콘텐츠가 어떤 기준이나 규칙 없이 분산되어 있어 콘텐츠를 관리하고 원하는 콘텐츠를 검색하는 것이 어려워졌다. 따라서 본 논문에서는 개인 사진 콘텐츠를 효과적으로 분류하기 위하여 의미적 유사도를 기반으로 한 태그 클러스터링 기법과 개인이 사진에 태그를 넣을 때 초기 클러스터를 기반으로 태그를 추천하는 방법을 제안한다. 태그들 사이의 유사도를 계산하여 서로 관련이 있다고 판단되는 태그들을 클러스터링 하는데, 태그가 같은 클러스터에 포함되어 있으면 그 태그를 가진 사진들도 유사성을 가진다고 볼 수 있으므로 개인 사진들을 의미에 따라 분류하는데 이용할 수 있다. 또한 분류된 초기 클러스터로 태그를 추천하여 개인 사용자가 태그를 분류에 맞게 추가할 수 있어 사진 분류 관리가 용이해진다.

Modern Linguistics: Theoretical Aspects of the Development of Cognitive Semantics

  • Nataliia Mushyrovska;Liudmyla Yursa;Oksana Neher;Iryna Pavliuk
    • International Journal of Computer Science & Network Security
    • /
    • 제23권6호
    • /
    • pp.162-168
    • /
    • 2023
  • This article presents an examination of the major cognitive-semantic theories in linguistics (Langacker, Lakoff, Fillmore, Croft). The CST's foundations are discussed concerning the educational policy changes, which are necessary to improve the linguistic disciplines in the changing context of higher education, as well as the empowerment and development of the industry. It is relevant in the light of the linguistic specialists' quality training and the development of effective methods of language learning. Consideration of the theories content, tools, and methods of language teaching, which are an important component of quality teaching and the formation of a set of knowledge and skills of students of linguistic specialties, remains crucial. This study aims to establish the main theoretical positions and directions of cognitive-semantic theory in linguistics, determine the usefulness of teaching the basics of cognitive linguistics, the feasibility of using methods of cognitive-semantic nature in the learning process. During the research, the methods of linguistic description and observation, analysis, and synthesis were applied. The result of the study is to establish the need to study basic linguistic theories, as well as general theoretical precepts of cognitive linguistics, which remains one of the effective directions in the postmodern mainstream. It also clarifies the place of the main cognitive-semantic theories in the teaching linguistics' practice of the XXI century.

위키피디아를 이용한 분류자질 선정에 관한 연구 (An Experimental Study on Feature Selection Using Wikipedia for Text Categorization)

  • 김용환;정영미
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.155-171
    • /
    • 2012
  • 텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.

그룹치료가 실어증자들의 언어수행력에 미치는 영향: 사례연구 (The Effects of Group Therapy on the Language Performance of Aphasics: 4 Cases)

  • 이옥분;권영주;정옥란
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.113-120
    • /
    • 2002
  • The purpose of this study was to determine the effects of group therapy on the language performance of aphasic patients. Four aphasic subjects participated in group therapy. Their aphasic types were TCMA (transcortical motor aphasia), conduction, anomie, and Broca's aphasia. The focus of the therapy was to stimulate cooperative learning skills. For this purpose, categorization tasks, semantic association tasks, convergent thinking, and divergent thinking tasks were employed. The results showed that all of the aphasic subjects demonstrated some improvement in writing ability, categorization ability, and speaking ability in sentences.

  • PDF

의미정보의 효율적인 분류를 위한 계층적 중복 문서 클러스터링 (Hierarchical Overlapping Document Clustering for Efficient Categorization of Semantic Information)

  • 강동혁;주길홍;이원석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.175-177
    • /
    • 2001
  • 기존의 문서 클러스터링 알고리즘은 모든 문서가 각각 하나의 클러스터에만 할당되도록 설계되어 문서에 여러 개의 주제가 포함되어 있을지라도 문서는 유사도 비교에 의해 오직 하나의 플러스터에 포함된다는 단점이 있다. 본 연구에서는 이러한 문서 플러스터링 방법의 한계를 파악하기 위해 문서가 여러 개의 클러스터에 포함될 수 있는 계층적 중복 문서 클러스터링을 제안한다. 또한, 문서 클러스터링의 정확도를 높이기 위해서 불용어 제거 알고리즘을 이용해 불용어를 제거하여 클러스터링에 사용되는 키워드를 선별하고, 단어가중치 산출을 위한 TF*NHDF 공식을 제안한다.

  • PDF

빅 데이터 환경에서 계층적 문서 유형 분류를 위한 클러스터링 기반 다중 SVM 모델 (Multi-class Support Vector Machines Model Based Clustering for Hierarchical Document Categorization in Big Data Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.600-608
    • /
    • 2017
  • 최근 인터넷의 급격한 확장에 따른 정보의 양이 기하급수적으로 증가하고 있다. 그러나 실제 사용자에게 필요한 정보는 극히 일부분으로 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 따라서 검색어로 검색된 문서에 대한 유사도 평가를 통한 계층적 유사 정보와 검색 우선순위에 대한 정보를 제공할 필요성이 있다. 이를 위해서 검색어를 구성하고 있는 키워드의 동시 발생 빈도를 고려한 검색 문서에 대한 유사도를 기반으로 문서 클러스터를 구성하고 SVM을 적용한 빅 데이터 기반 계층적 유형 분류 모델을 제안한다. 계층적 분류방법과 SVM 분류기의 결합은 문서의 계층이 기하급수적으로 늘어나는 웹 문서의 경우에 높은 성능을 얻을 수 있다. 제안된 모델은 정확하고 신속한 검색을 제공하는 정보검색시스템의 응용 모델로 활용될 수 있다.

한국학 연구 논문의 의미 구조 기반 메타데이터 연구 (A Study on the Metadata based on the Semantic Structure of the Korean Studies Research Articles)

  • 송민선;고영만
    • 한국도서관정보학회지
    • /
    • 제46권3호
    • /
    • pp.277-299
    • /
    • 2015
  • 본 연구의 목적은 복합학의 특성을 띠는 한국학 분야 연구 논문을 대상으로 의미적 탐색 시스템 구축을 위한 메타데이터를 체계적으로 구조화하기 위한 것이다. 이를 위해 먼저 학술 자료의 내용적 의미 구조를 정리한 기존의 연구들을 비교 분석하고, 이어서 한국학 분야 연구 논문에 수록된 저자키워드의 유형별 범주화 작업을 통해 한국학 분야에서 필요로 하는 연구 논문의 의미적인 구조를 분석하였으며, 두 작업의 결과를 기반으로 한국학 분야 연구 논문의 의미적 탐색 시스템을 구축하기 위한 의미구조 메타데이터 항목 16개를 도출하여 체계화 하였다. 본 연구는 실제 한국학 분야 연구자들이 필요로 하는 학술적 지식을 반영할 수 있는 의미적 메타데이터 구성 방법론을 체계적으로 제시하였으며, 특히 한국학 분야 연구 자료의 내용적 특성을 살펴보는데 있어 실제 연구자들이 부여한 키워드를 유형화하고 분석하여 반영하였다는데 의의가 있다.

남성 의복착용자의 의복유형과 얼굴의 매력성이 인상에 미치는 영향(II) -직업관련특성 및 외모특성 추론을 중심으로- (The Effect of Clothing Type and Facial Attractiveness of Men Clothed on Impressions (ll))

  • 이선경;고애란
    • 한국의류학회지
    • /
    • 제19권4호
    • /
    • pp.565-579
    • /
    • 1995
  • The purpose of this study was 1) to investigate the effect of male clothing type and facial attractiveness on the subjects' inferences of occupational and appearance characteristics for the wearers. The subjects 'inferences of occupational and appearance characteristics for the wearers were measured by means of semantic-differential scales and open-ended questionnaires. The stimuli were composed of 18 color photographs which were made of 3 levels of facial attractiveness in combination with 6 types of clothing. The subjects were 216 male and 216 female university students. The results were as follows: First, the responses to the semantic-differential scales were factor analyzed to identify the underlying constructs of occupational characteristics. As the result, 4 factors were emerged. The first factor was interpreted to Appearance·Ability, the second, Individuality, the third, Dominance, and the fourth, Naivety. Second, the type of clothing influenced on all the 4 factors, and was more influencial than the facial attractiveness which influenced on the 3 factors except the Naivety factor. Third, There were differences perceptions for the wearers beteen subjects 'sex type; The male subjects perceived for the wearers with categorization more exactly than the female's. Fourth, there were accordances between free-association and inference in semantic-differential scales for the wearers.

  • PDF