• 제목/요약/키워드: 카테고리

검색결과 815건 처리시간 0.028초

다중 특징값의 조합을 이용한 자동적 이미지 카테고리화 방법 (Automatic Image Categorization using Combination of Multiple Features)

  • 양승지;윤정현;노용만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.39-42
    • /
    • 2002
  • 본 논문에서는 내용 기반 이미지 검색 및 필터링 시스템을 위한 카테고리 식별 방법을 제안한다. 제안된 방법에서는 식별 가능한 카테고리를 사전에 정의하고, 정의된 카테고리를 대표할 수 있는 이미지들을 수집한다. 다음으로, 이들로부터 다중의 내용 기반 특징값을 추출하고, 추출된 특징값들로 카테고리 데이터베이스를 구성한다. 카테고리를 식별할 질의 이미지가 입력으로 들어오면, 질의 이미지로부터 추출된 다중 특징값들을 각 카테고리의 단일 특징값과 각각 비교함으로써, 카테고리를 대표하는 다중의 유사도 거리값을 측정한다. 각 카테고리를 대표하는 다중의 유사도 거리값들은 두 가지 연산 방법에 의해 조합되는데, 조합 방법은 각각의 단일 특징값이 각 카테고리 식별에 미치는 영향을 고려하여 정의된다. 최종적으로, 각 카테고리의 조합된 유사도 거리값을 비교한 다음, 가장 유사도가 큰 카테고리를 해당 질의 이미지의 카테고리로 식별한다.

  • PDF

협업 필터링 기반 개인화에서의 상품군 중립적 사용자 프로파일링 타당성 검토 (Feasibility Study on Cross-Product Category User Profiling in Collaborative Filtering Based Personalization)

  • 김종우;박수환;이홍주
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2005년도 추계학술대회 및 정기총회
    • /
    • pp.257-263
    • /
    • 2005
  • 초기에 하나의 상품 카테고리만을 다루던 전자상거래 사이트들이 브랜드 확립 후에 다른 상품 카테고리까지 확대해 나가는 모습을 많이 보아왔다. 고객이 아직 방문하지 않은 신규 상품 카테고리의 상품에 대하여 기존 상품 카테고리에서 만들어진 사용자 프로파일을 활용하여 개인화된 추천을 할 수 있다면, 고객이 다양한 상품 카테고리를 방문하도록 유도할 수 있을 것이다. 하지만 일반적으로 전자상거래 사이트에서는 상품 카테고리별로 사용자의 선호도를 파악하여 개인화된 추천을 수행하기 때문에, 해당 카테고리 내 상품의 구매나 방문 기록이 없다면 개인화된 추천을 수행하기가 어렵다 . 본 논문에서는 협업 필터링을 통해 신규 상품카테고리 내의 상품을 추천하기 어려운 고객들을 대상으로 기존의 사용자 선호도 데이터를 활용하여 신규 상품 카테고리 내의 상품을 추천하는 방안의 타당성을 살펴보도록 한다. 즉, 기존 사용자의 특정상품 카테고리 선호도 데이터를 통해 사용자간 유산도를 계산하고, 이를 추천하려는 타 상품 카테고리 내의 상품들에 대한 예측 선호도 계산에 활용 타당성을 살펴본다. 이를 실증적으로 검토하기 위해서, Yes24 사이트의 서적, 음반, DVD 3개의카테고리 내의 상품을 방문한 웹 패널 데이터를 이용하여 타당성 분석을 수행하였다. 분석 결과, 동일 상품 카테고리 내의 선호도 정보를 가지고 현업 필터링을 수행하는 것보다는 추천 성과가 낮았지만 활용할만한 추천 성과를 보였으며, 활용하는 상품 카테고리와 예측하는 상품 카테고리별로 추천성과가 상이했다.

  • PDF

한국 인터넷서점 분류체계 연구 - 카테고리와 도서 분류를 중심으로 - (A Study of Classification System for Online Bookstore in Korea: Categories and Book Classification)

  • 곽철완
    • 한국문헌정보학회지
    • /
    • 제47권1호
    • /
    • pp.221-247
    • /
    • 2013
  • 본 연구의 목적은 국내 인터넷서점들의 카테고리 및 판매도서의 분류의 특징을 조사 및 분석하여 그 개선 방안을 제시하는데 있다. 이를 위해, 국내의 8개 인터넷서점을 선정하여 각 서점의 1차 카테고리 명칭의 일치 여부와, 판매도서의 카테고리 분류를 상호 비교하였다. 카테고리 비교를 위해서 일치도 변인, 카테고리 분류 비교를 위해서 분류 일치성 변인을 사용하였다. 연구 결과, 인터넷서점의 카테고리 일치도는 상당히 높았지만, 카테고리 분류는 판매도서에 따라 인터넷서점 간 차이가 많았다. 일부 인터넷서점에서 활용하고 있는 ISBN 내용분류기호는 판매도서의 카테고리 분류에 효과적인 역할을 하지 못하고 있었다. 개선방안으로 서점에 판매도서 분류에 활용할 수 있는 출판물 카테고리 개발을 제안하였다.

Card sorting기법을 이용한 사용자 중심의 쇼핑몰 카테고리 제안 (The mall offers user-centric categorys Using Card sorting methods)

  • 윤정민;한미란;박범
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 추계학술대회
    • /
    • pp.291-295
    • /
    • 2009
  • 최근 인터넷 쇼핑몰이 활성화 되면서 각 쇼핑몰의 카테고리 분류 체계에 대한 사용자의 접근 편이성이 중요한 요소로 부각되었다. 따라서, 카테고리 분류체계에 대한 사용성 평가를 통하여 각 카테고리의 타당성 검증 및 개선에 대한 필요성이 대두되고 있다. 본 논문에서는 D 쇼핑몰의 각 카테고리 항목을 대상으로 카드 소팅 기법을 실시하여 새로운 카테고리 분류체계를 제안하였다. 뿐만 아니라 기존의 카테고리와 새로 제안된 카테고리의 사용성 평가를 실시하여 비교 및 검증을 실시하였다. 본 연구는 기존 온라인 쇼핑몰의 카테고리의 분류 체계를 재정립하며, 사용자 중심의 인포메이션 아키텍처를 설계하는데 활용 가능할 것이다.

  • PDF

위키피디아 카테고리 구조를 이용한 상하위 관계 추출 (ISA Relation Extraction from Wikipedia Category Structure)

  • 최동현;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-5
    • /
    • 2009
  • 상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 위키피디아 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자하는 위키피디아 카테고리 구조뿐만이 아닌, 그와 관련된 다른 위키피디아 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

  • PDF

K-means 클러스터링과 토픽 모델링을 기반으로 한 국민청원 사이트의 카테고리 재구성 (Reconstruction of Categories on the National Petition Site Using K-Means clustering and Topic Modeling)

  • 우윤희;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.302-305
    • /
    • 2019
  • 국민 청원 사이트가 뛰어난 접근성과 신속성으로 인하여 국민들로부터 많은 관심을 받고 있다. 현재 국민청원 사이트의 카테고리 분류는 '미래', '성장동력' 등을 포함한 16개의 카테고리 및 기타로 구성되어 있으나 그 기준이 모호하여 많은 청원글들이 기타 카테고리로 분류되고 있는 상황이다. 이는 청원글의 내용을 명확히 반영하지 않고 미리 정의된 카테고리 구조를 사용하고 있는데서 기인한다고 할 수 있다. 본 논문에서는 보다 구체적으로 정의된 카테고리를 정의하고자 추천 순으로 1,500개의 청원글을 수집하였고, 수집된 청원글의 내용을 바탕으로 카테고리 구조를 추출하였다. 먼저, k-평균 알고리즘을 적용하여 청원글을 군집하여 대분류를 정의하였고, 보다 구체적인 세부 분류를 정의하기 위하여 토픽모델링을 실시하였다. 본 논문에서 제시하는 계층적 카테고리 구조는 청원글의 내용을 바탕으로 대분류와 세부분류로 구성된 것이므로 새로운 청원글을 등록하거나 분류하는 데 적절한 것으로 보인다.

독서치료 독서목록에서의 카테고리와 치유서의 관계 분석 연구 (A Study on Relation Analysis between Book and Category in Bibliotherapy Catalog)

  • 백재은
    • 한국비블리아학회지
    • /
    • 제26권2호
    • /
    • pp.217-239
    • /
    • 2015
  • 올바른 독서치료를 위해서 이용자는 자신의 상황과 증상에 대한 자가판단과 함께 치유서의 올바른 선정및 접근이 필요하다. 이용자는 독서치료 독서목록의 상황별 카테고리를 이용해서 치유서에 접근하지만, 독서치료를 원하는 이용자가 자신의 복잡한 상황 및 증상을 간략하게 정리하여 하나의 단어 혹은 키워드로 정의하는 것은 어렵다. 국내 독서치료 독서목록은 연령별 카테고리를 제외한 1개 혹은 최대 2개의 상황별 카테고리를 제공하며, 이로 치유서를 분류하고 있다. 이용자가 복잡한 상황을 가지고 카테고리에 접근하는 만큼, 이용자의 접근 효율성과 용이성을 높이기 위해서는 1개의 카테고리 보다는 복수의 카테고리 제공이 필요하다. 이에 본 연구에서는 독서치료를 원하는 이용자가 원하는 치유서에 보다 효율적으로 접근할 수 있도록, 기초 연구로서 국내의 독서치료 독서목록과 치유서의 관계에 대해 분석하였다. 국내 대표 독서치료 독서목록을 이용하여 카테고리간의 매핑과 크로스워크를 실시하였고, 독서치료 독서목록의 전반적인 조사를 통해서 국내 독서치료 독서목록 카테고리를 분석하였다.

질의 응답 시스템에서 질의 카테고리별 개념리스트 구축에 기반한 의미적 질의 확장 (Semantic Query Expansion based on a Question Category Concept List in QA system)

  • 김혜정;강보영;박성배;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.178-180
    • /
    • 2004
  • 질의 응답(Question Answering) 시스템은 질의에서 요구하는 정답 유형(Answer tyype) 및 질의에 사용된 용어를 적용하여 보다 정확한 답을 추출하고자 한다. 그러나 질의에 사용된 용어들이 문서의 정답문장에 그대로 사용되지 않고 같은 의미의 다른 어휘로 출현하기도 하며, 혹은 다른 문법적 정보를 가진 카테고리로 등장하여 정답 추출에 어려움이 따른다. 따라서, 본 논문은 질의별 카테고리 개념 리스트를 구축하여 효과적인 의미적 질의 확장 방법론을 제안한다. 제안된 방법은 먼저 질문 문장의 패턴 린 질의 정보 유형을 파악하여 질의 카테고리 및 카테고리별 개념 리스트를 구축한다. 그런 후 구축된 질의 개념 카테고리 및 리스트를 활용하여 질의 유형을 학습하고, 새로운 질의가 입력되면 해당 개념 카테고리로 분류한 후, 개념 리스트를 기반으로 개념별 질의 확장을 수행한다. 제안된 시스템의 성능 명가를 위하여, TREC-9의 질의와 TREC 문서 중 1991년도 WSJ(Wall Street Journal) 42,654건을 대상으로 실험한 결과 질의 확장을 수행하지 않는 시스템의 경우 MRR(Mean reciprocal ratio) 측정에서 0.223의 결과를 보인 반면 제안된 시스템의 경우 0.50의 향상된 결과를 보였다.

  • PDF

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.

가상기계 코드의 커버링 문제 (Covering Problem for Virtual Machine Code)

  • 남동근;오세만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.247-249
    • /
    • 2003
  • 임베디드 시스템을 위한 가상기계 기술은 모바일 디바이스와 디지털 TV등의 다운로드 솔루션에 꼭 필요한 소프트웨어 기술이다. 현재 EVM(Embedded Virtual Machine)이라 명명되어진 임베디드 시스템을 위한 가상기계에 대한 연구가 진행 중이며, EVM의 중간 언어로 SIL(Standard Intermediate Language)이 설계되었다. 본 논문에서는 임베디드 시스템을 위한 가상기계의 표준 중간 언어로서 SIL의 완벽성을 증명한다. 기존에 이미 널리 사용되고 있는 가상기계 코드를 SIL 카테고리에 매핑시킴으로써 구조적으로 SIL의 완벽성을 증명한다. SIL은 표준 중간 언어로서의 요구 사항을 갖추고 있으며 6개의 메인 카테고리와 16개의 서브 카테고리로 나누어진다. Oolong과 .NET IL등 기존의 가상기계 코드들의 카테고리는 SIL카테고리에 매핑된다.

  • PDF