• Title/Summary/Keyword: 카테고리

Search Result 810, Processing Time 0.043 seconds

Automatic Image Categorization using Combination of Multiple Features (다중 특징값의 조합을 이용한 자동적 이미지 카테고리화 방법)

  • Yang, Seung-Ji;Yoon, Jeong-Hyun;Ro, Yong-Man
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.39-42
    • /
    • 2002
  • 본 논문에서는 내용 기반 이미지 검색 및 필터링 시스템을 위한 카테고리 식별 방법을 제안한다. 제안된 방법에서는 식별 가능한 카테고리를 사전에 정의하고, 정의된 카테고리를 대표할 수 있는 이미지들을 수집한다. 다음으로, 이들로부터 다중의 내용 기반 특징값을 추출하고, 추출된 특징값들로 카테고리 데이터베이스를 구성한다. 카테고리를 식별할 질의 이미지가 입력으로 들어오면, 질의 이미지로부터 추출된 다중 특징값들을 각 카테고리의 단일 특징값과 각각 비교함으로써, 카테고리를 대표하는 다중의 유사도 거리값을 측정한다. 각 카테고리를 대표하는 다중의 유사도 거리값들은 두 가지 연산 방법에 의해 조합되는데, 조합 방법은 각각의 단일 특징값이 각 카테고리 식별에 미치는 영향을 고려하여 정의된다. 최종적으로, 각 카테고리의 조합된 유사도 거리값을 비교한 다음, 가장 유사도가 큰 카테고리를 해당 질의 이미지의 카테고리로 식별한다.

  • PDF

Feasibility Study on Cross-Product Category User Profiling in Collaborative Filtering Based Personalization (협업 필터링 기반 개인화에서의 상품군 중립적 사용자 프로파일링 타당성 검토)

  • Kim, Jong-Woo;Park, Soo-Hwan;Lee, Hong-Ju
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2005.10a
    • /
    • pp.257-263
    • /
    • 2005
  • 초기에 하나의 상품 카테고리만을 다루던 전자상거래 사이트들이 브랜드 확립 후에 다른 상품 카테고리까지 확대해 나가는 모습을 많이 보아왔다. 고객이 아직 방문하지 않은 신규 상품 카테고리의 상품에 대하여 기존 상품 카테고리에서 만들어진 사용자 프로파일을 활용하여 개인화된 추천을 할 수 있다면, 고객이 다양한 상품 카테고리를 방문하도록 유도할 수 있을 것이다. 하지만 일반적으로 전자상거래 사이트에서는 상품 카테고리별로 사용자의 선호도를 파악하여 개인화된 추천을 수행하기 때문에, 해당 카테고리 내 상품의 구매나 방문 기록이 없다면 개인화된 추천을 수행하기가 어렵다 . 본 논문에서는 협업 필터링을 통해 신규 상품카테고리 내의 상품을 추천하기 어려운 고객들을 대상으로 기존의 사용자 선호도 데이터를 활용하여 신규 상품 카테고리 내의 상품을 추천하는 방안의 타당성을 살펴보도록 한다. 즉, 기존 사용자의 특정상품 카테고리 선호도 데이터를 통해 사용자간 유산도를 계산하고, 이를 추천하려는 타 상품 카테고리 내의 상품들에 대한 예측 선호도 계산에 활용 타당성을 살펴본다. 이를 실증적으로 검토하기 위해서, Yes24 사이트의 서적, 음반, DVD 3개의카테고리 내의 상품을 방문한 웹 패널 데이터를 이용하여 타당성 분석을 수행하였다. 분석 결과, 동일 상품 카테고리 내의 선호도 정보를 가지고 현업 필터링을 수행하는 것보다는 추천 성과가 낮았지만 활용할만한 추천 성과를 보였으며, 활용하는 상품 카테고리와 예측하는 상품 카테고리별로 추천성과가 상이했다.

  • PDF

A Study of Classification System for Online Bookstore in Korea: Categories and Book Classification (한국 인터넷서점 분류체계 연구 - 카테고리와 도서 분류를 중심으로 -)

  • Kwak, Chul-Wan
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.47 no.1
    • /
    • pp.221-247
    • /
    • 2013
  • The purpose of the study is to investigate and analyze the categories of online bookstores and to propose improvements. For the study, the category conformity was compared among eight Korean online bookstores selected; the book classification on the categories was compared from them. The results show that the category conformity was high among online bookstores, but the book classification on the categories was different on the bookstores. ISBN contents classification codes for books might not help to classify the books on the categories. Thus, the study proposes a new publication category for the book classification on categories of online bookstores.

The mall offers user-centric categorys Using Card sorting methods (Card sorting기법을 이용한 사용자 중심의 쇼핑몰 카테고리 제안)

  • Yun, Jung-Min;Han, Mi-Ran;Park, Peom
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.11a
    • /
    • pp.291-295
    • /
    • 2009
  • 최근 인터넷 쇼핑몰이 활성화 되면서 각 쇼핑몰의 카테고리 분류 체계에 대한 사용자의 접근 편이성이 중요한 요소로 부각되었다. 따라서, 카테고리 분류체계에 대한 사용성 평가를 통하여 각 카테고리의 타당성 검증 및 개선에 대한 필요성이 대두되고 있다. 본 논문에서는 D 쇼핑몰의 각 카테고리 항목을 대상으로 카드 소팅 기법을 실시하여 새로운 카테고리 분류체계를 제안하였다. 뿐만 아니라 기존의 카테고리와 새로 제안된 카테고리의 사용성 평가를 실시하여 비교 및 검증을 실시하였다. 본 연구는 기존 온라인 쇼핑몰의 카테고리의 분류 체계를 재정립하며, 사용자 중심의 인포메이션 아키텍처를 설계하는데 활용 가능할 것이다.

  • PDF

ISA Relation Extraction from Wikipedia Category Structure (위키피디아 카테고리 구조를 이용한 상하위 관계 추출)

  • Choi, DongHyun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.1-5
    • /
    • 2009
  • 상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 위키피디아 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자하는 위키피디아 카테고리 구조뿐만이 아닌, 그와 관련된 다른 위키피디아 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

  • PDF

Reconstruction of Categories on the National Petition Site Using K-Means clustering and Topic Modeling (K-means 클러스터링과 토픽 모델링을 기반으로 한 국민청원 사이트의 카테고리 재구성)

  • Woo, Yun Hui;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.302-305
    • /
    • 2019
  • 국민 청원 사이트가 뛰어난 접근성과 신속성으로 인하여 국민들로부터 많은 관심을 받고 있다. 현재 국민청원 사이트의 카테고리 분류는 '미래', '성장동력' 등을 포함한 16개의 카테고리 및 기타로 구성되어 있으나 그 기준이 모호하여 많은 청원글들이 기타 카테고리로 분류되고 있는 상황이다. 이는 청원글의 내용을 명확히 반영하지 않고 미리 정의된 카테고리 구조를 사용하고 있는데서 기인한다고 할 수 있다. 본 논문에서는 보다 구체적으로 정의된 카테고리를 정의하고자 추천 순으로 1,500개의 청원글을 수집하였고, 수집된 청원글의 내용을 바탕으로 카테고리 구조를 추출하였다. 먼저, k-평균 알고리즘을 적용하여 청원글을 군집하여 대분류를 정의하였고, 보다 구체적인 세부 분류를 정의하기 위하여 토픽모델링을 실시하였다. 본 논문에서 제시하는 계층적 카테고리 구조는 청원글의 내용을 바탕으로 대분류와 세부분류로 구성된 것이므로 새로운 청원글을 등록하거나 분류하는 데 적절한 것으로 보인다.

A Study on Relation Analysis between Book and Category in Bibliotherapy Catalog (독서치료 독서목록에서의 카테고리와 치유서의 관계 분석 연구)

  • Baek, Jae Eun
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.26 no.2
    • /
    • pp.217-239
    • /
    • 2015
  • For bibliotherapy, users should understand their own life situation, select and access the book (self-help book). User access to book through situation catalog (or list) in reading list, but user is difficult to define and simplify in one word after understanding their own situation. Catalog of bibliotherapy reading list classifies books using one situation category or maximum of two categories other than the age-specific classification. In this study, the author approached and analyzes based on the result of the research on the relationship between bibliotherapy and reading list, in order that access more efficiently to book what user wants. Bibliotherapy reading-list by using mapping and crosswalk between categories, and analyzes category of reading lists through comprehensive review.

Semantic Query Expansion based on a Question Category Concept List in QA system (질의 응답 시스템에서 질의 카테고리별 개념리스트 구축에 기반한 의미적 질의 확장)

  • 김혜정;강보영;박성배;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.178-180
    • /
    • 2004
  • 질의 응답(Question Answering) 시스템은 질의에서 요구하는 정답 유형(Answer tyype) 및 질의에 사용된 용어를 적용하여 보다 정확한 답을 추출하고자 한다. 그러나 질의에 사용된 용어들이 문서의 정답문장에 그대로 사용되지 않고 같은 의미의 다른 어휘로 출현하기도 하며, 혹은 다른 문법적 정보를 가진 카테고리로 등장하여 정답 추출에 어려움이 따른다. 따라서, 본 논문은 질의별 카테고리 개념 리스트를 구축하여 효과적인 의미적 질의 확장 방법론을 제안한다. 제안된 방법은 먼저 질문 문장의 패턴 린 질의 정보 유형을 파악하여 질의 카테고리 및 카테고리별 개념 리스트를 구축한다. 그런 후 구축된 질의 개념 카테고리 및 리스트를 활용하여 질의 유형을 학습하고, 새로운 질의가 입력되면 해당 개념 카테고리로 분류한 후, 개념 리스트를 기반으로 개념별 질의 확장을 수행한다. 제안된 시스템의 성능 명가를 위하여, TREC-9의 질의와 TREC 문서 중 1991년도 WSJ(Wall Street Journal) 42,654건을 대상으로 실험한 결과 질의 확장을 수행하지 않는 시스템의 경우 MRR(Mean reciprocal ratio) 측정에서 0.223의 결과를 보인 반면 제안된 시스템의 경우 0.50의 향상된 결과를 보였다.

  • PDF

A Methodology for Automatic Multi-Categorization of Single-Categorized Documents (단일 카테고리 문서의 다중 카테고리 자동확장 방법론)

  • Hong, Jin-Sung;Kim, Namgyu;Lee, Sangwon
    • Journal of Intelligence and Information Systems
    • /
    • v.20 no.3
    • /
    • pp.77-92
    • /
    • 2014
  • Recently, numerous documents including unstructured data and text have been created due to the rapid increase in the usage of social media and the Internet. Each document is usually provided with a specific category for the convenience of the users. In the past, the categorization was performed manually. However, in the case of manual categorization, not only can the accuracy of the categorization be not guaranteed but the categorization also requires a large amount of time and huge costs. Many studies have been conducted towards the automatic creation of categories to solve the limitations of manual categorization. Unfortunately, most of these methods cannot be applied to categorizing complex documents with multiple topics because the methods work by assuming that one document can be categorized into one category only. In order to overcome this limitation, some studies have attempted to categorize each document into multiple categories. However, they are also limited in that their learning process involves training using a multi-categorized document set. These methods therefore cannot be applied to multi-categorization of most documents unless multi-categorized training sets are provided. To overcome the limitation of the requirement of a multi-categorized training set by traditional multi-categorization algorithms, we propose a new methodology that can extend a category of a single-categorized document to multiple categorizes by analyzing relationships among categories, topics, and documents. First, we attempt to find the relationship between documents and topics by using the result of topic analysis for single-categorized documents. Second, we construct a correspondence table between topics and categories by investigating the relationship between them. Finally, we calculate the matching scores for each document to multiple categories. The results imply that a document can be classified into a certain category if and only if the matching score is higher than the predefined threshold. For example, we can classify a certain document into three categories that have larger matching scores than the predefined threshold. The main contribution of our study is that our methodology can improve the applicability of traditional multi-category classifiers by generating multi-categorized documents from single-categorized documents. Additionally, we propose a module for verifying the accuracy of the proposed methodology. For performance evaluation, we performed intensive experiments with news articles. News articles are clearly categorized based on the theme, whereas the use of vulgar language and slang is smaller than other usual text document. We collected news articles from July 2012 to June 2013. The articles exhibit large variations in terms of the number of types of categories. This is because readers have different levels of interest in each category. Additionally, the result is also attributed to the differences in the frequency of the events in each category. In order to minimize the distortion of the result from the number of articles in different categories, we extracted 3,000 articles equally from each of the eight categories. Therefore, the total number of articles used in our experiments was 24,000. The eight categories were "IT Science," "Economy," "Society," "Life and Culture," "World," "Sports," "Entertainment," and "Politics." By using the news articles that we collected, we calculated the document/category correspondence scores by utilizing topic/category and document/topics correspondence scores. The document/category correspondence score can be said to indicate the degree of correspondence of each document to a certain category. As a result, we could present two additional categories for each of the 23,089 documents. Precision, recall, and F-score were revealed to be 0.605, 0.629, and 0.617 respectively when only the top 1 predicted category was evaluated, whereas they were revealed to be 0.838, 0.290, and 0.431 when the top 1 - 3 predicted categories were considered. It was very interesting to find a large variation between the scores of the eight categories on precision, recall, and F-score.

Covering Problem for Virtual Machine Code (가상기계 코드의 커버링 문제)

  • 남동근;오세만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.247-249
    • /
    • 2003
  • 임베디드 시스템을 위한 가상기계 기술은 모바일 디바이스와 디지털 TV등의 다운로드 솔루션에 꼭 필요한 소프트웨어 기술이다. 현재 EVM(Embedded Virtual Machine)이라 명명되어진 임베디드 시스템을 위한 가상기계에 대한 연구가 진행 중이며, EVM의 중간 언어로 SIL(Standard Intermediate Language)이 설계되었다. 본 논문에서는 임베디드 시스템을 위한 가상기계의 표준 중간 언어로서 SIL의 완벽성을 증명한다. 기존에 이미 널리 사용되고 있는 가상기계 코드를 SIL 카테고리에 매핑시킴으로써 구조적으로 SIL의 완벽성을 증명한다. SIL은 표준 중간 언어로서의 요구 사항을 갖추고 있으며 6개의 메인 카테고리와 16개의 서브 카테고리로 나누어진다. Oolong과 .NET IL등 기존의 가상기계 코드들의 카테고리는 SIL카테고리에 매핑된다.

  • PDF