• 제목/요약/키워드: Category analysis

검색결과 2,206건 처리시간 0.034초

온라인 상품 카테고리 내 주요 가격대 식별 (Identifying the Main Price Ranges of Online Product Category)

  • 김준우;임광혁
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.733-741
    • /
    • 2012
  • 최근 많은 소비자들이 관심 있는 물품 카테고리에 대한 정보를 얻기 위한 목적으로 종합 쇼핑몰이나 가격 비교 사이트를 방문하고 있다. 하지만, 이러한 웹 사이트들은 종종 이들에게 많은 상품들과 판매자가 포함된 지나치게 방대한 정보를 제공하여 소비자들의 구매 결정을 효과적으로 지원하지 못한다. 따라서 현대 온라인 쇼핑 에이전트들은 검색된 정보를 사용자들에게 제공하기 전에 보다 지능적인 방법으로 이를 가공할 필요가 있다. 본 논문은 특정 물품 카테고리 내에서 많은 상품들이 분포하고 있는 주요 가격대를 식별하는 방법을 제안하고자 한다. 이를 위해 한 개 카테고리 내 상품의 가격들을 벡터로 표현하고, 여기에 k-means 군집 분석을 적용하여 서로 비슷한 가격 벡터들을 포함하는 군집을 형성한 다음, 각 군집에서 주요 가격대를 추출하는 방법을 적용하였다. 일반적으로 가격은 소비자들의 구매 결정에서 가장 중요한 요인 중 하나이기 때문에, 추출된 주요 가격대들은 온라인 쇼핑 이용자들이 효과적으로 상품을 검색하는데 도움이 될 것으로 기대된다.

브랜드 개성 평가를 통한 선도브랜드의 전형성 분석 연구 (Analysis for Typicality of the Leading Brand by Evaluation of Brand Personality)

  • 박범순
    • 한국콘텐츠학회논문지
    • /
    • 제18권3호
    • /
    • pp.568-577
    • /
    • 2018
  • 본 연구에서는 특정 제품군 내 선도 브랜드가 가지는 전형성을 브랜드 개성 평가를 통해 분석하였다. 사전조사를 통해 인스턴트 원두커피가 분석 대상 제품군으로 선정되었고, 일반 매장 판매 브랜드인 '카누', '루카', '수프리모' 세 개의 브랜드가 분석에 사용되었다. 연구결과, 선도 브랜드인 카누가 해당 제품군을 대표하는 브랜드 전형성을 확보하고 있는 것을 확인할 수 있었다. 카누의 경우, 진실, 능력, 성공, 세련 등 제품군이 보유하는 4가지 개성 차원을 동일하게 가지고 있었다. 루카의 경우, 능력, 진실, 세련 등 세 가지 개성차원이 공통적인 것으로, 수프리모의 경우는 세련과 능력 두 개의 개성차원만이 공통적인 것으로 나타났다. 각 개성차원을 구성하는 구성개념에 있어서도 카누의 경우가 다른 경쟁 브랜드들에 비해 상대적으로 높은 공통성을 보이고 있었다. 연구를 통해 브랜드 개성 평가를 바탕으로 한 브랜드의 전형성 평가에 대한 가능성도 확인할 수 있었다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

재가 뇌졸중 환자 가족의 주간재활간호 서비스 요구와 관련요인 (The Need for Rehabilitation Day Care Program Service of Stroke Survivor's Family)

  • 서문자;김금순;김인자;조남옥;최희정;정성희
    • 재활간호학회지
    • /
    • 제4권2호
    • /
    • pp.207-218
    • /
    • 2001
  • This study was carried out to find out the basic data required to plan and develop Rehabilitation Day Care Program for the stroke survivor's family in Korea. The subjects comprised of 92 stroke survivor's family who discharged from 4 hospitals in Seoul during the past 2 years. The data were collected from August 3, 1998 to September 18, 1998, through interviews with questionnaires about general characteristics, activities of daily living, depression and service need of rehabilitation day care program at the outpatient clinics by trained nursing graduates. Data were analyzed with descriptive analysis, Pearson's correlation analysis, and Stepwise multiple linear regression analysis using SPSS/WIN 10.0 program. The results obtained are as follows; 1. The mean score of the general need of rehabilitation day care program of stroke survivor's family was 3.10(range 1-4). The highest need among the service categories of the rehabilitation day card program was self-care and restorative activities category(3.30), and health services referral category, recreation category, psychosocial activities category in order. The needs of each category are as follows. In the health services referral category, the need for dental examination and medical examination were highest, followed by the need for physical therapy and occupational therapy. In the psychosocial activities category, the need for family counselling was highest. In the self-care and restorative activities category, the need for ROM exercise training was highest, followed by bowel training, and ambulation training. 2. The need of family for rehabilitation day care program service displayed a correlation with the level of education, ADL, and the level of depression, and a reverse correlation with age, illness intrusiveness, depression, knowledge, subject and object burden and relationship with stroke survivors. 3. The stepwise multiple linear regression analysis revealed following results. For the need for rehabilitation day care program service, 22.6% of the variance was initially explained by level of family's knowledge about caring method for stroke survivors, 8.8% was the level of subjective burden and 5.4% was relationship with stroke survivors. In conclusion, above characteristics should be considered to develop stroke survivors' rehabilitation day care program.

  • PDF

주성분 분석과 동적 분류체계를 사용한 자동 이메일 분류 (Automatic e-mail classification using Dynamic Category Hierarchy and Principal Component Analysis)

  • 박선;김철원;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.576-579
    • /
    • 2009
  • 인터넷 사용의 보편화로 이메일의 양이 급속히 증가하고 있다. 따라서 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 주성분 분석(PCA, Principal Component Analysis)을 기반으로 한 자동 카테고리 생성 방법과 동적 분류 체계 방법을 결합한 새로운 자동 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

Various Men's Body Shapes and Drops for Developing Menswear Sizing Systems in the United States

  • HwangShin, Su-Jeong;Istook, Cynthia L.;Lee, Jin-Hee
    • 한국의류학회지
    • /
    • 제35권12호
    • /
    • pp.1454-1465
    • /
    • 2011
  • Menswear body types are often labeled on garments (to indicate how the garments are designed to fit) with indicators of a size category such as regular, portly, and stout, athletic, or big and tall. A drop (relationships between the chest and waist girths) is related to the fit of a tailored suit. However, current standards are not designed for various drops or body types. There is not enough information of categorizing men's body shapes for the apparel sizing systems. In this article, a set of men's data from SizeUSA sizing survey was analyzed to investigate men's body shapes and drops. Factor analysis and a cluster analysis method were used to categorize men's body shapes. In the results, twenty-five variables were selected through the factor analysis and found four factors: girth factor, height factor, torso girth factor, and slope degree factor. According to the factor and cluster analysis, various body shapes were found: Slim Shape (SS - tall ectomorphy), Heavy Shape (HS - athletic, big & tall, endomorphy and mesomorphy), Slant Inverted Triangle Shape (SITS - regular, slight ectomorphy and slight mesomorphy weight range from normal to slightly overweight), Short Round Top Shape (SRTS - portly and stout, endomorphy). Body shapes were related to fitting categories. SS and HS were related to big & tall fitting category. SITS was related to regular. SRTS was related to portly and stout. Shape 1 (31%) and Shape 2 (26%) were related to current big & tall category. Shape 3 (34%) were related to regular. Shape 4 (9%) were in portly and stout category. ASTM D 6240 standard was the only available standard that presented a regular fitting category. Various drops were found within a same chest size group; however, this study revealed great variances of drops by body shape.

A Comparison Study of Multiclass SVM Methods in Microarray Data

  • Hwang, Jin-Soo;Lee, Ji-Young;Kim, Jee-Yun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.311-324
    • /
    • 2006
  • The Support Vector Machine(SVM) is very functional and efficient classification method to any other classification analysis method. However, its optimal extension to more than two classes is not obvious. In this paper several multi-category SVM methods are introduced and compared using simulation and real data sets. Also comparison with traditional multi-category classification and SVM based methods is performed.

  • PDF

Combinatory Categorial Grammar for Korean

  • 한성국;박찬곤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.164-171
    • /
    • 1990
  • A commutative productive category is proposed to the current CCG for the syntactic analysis of free word order languages like Korean. The introduction of this sort of category is quite natural for categorial lexicon and functional operations. We present the theorical basis of productive category and examine the linguistic availability through typical syntactic structures of Korean.

  • PDF

발전용 증기터빈 밸브 케이싱의 유한요소해석과 주조결함 평가 방법 (Finite Element Analysis and Evaluation of Casting Defects of Steam Turbine Valve Casings of Power Plants)

  • 이부윤;김원진;신현명
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제29권5호
    • /
    • pp.571-578
    • /
    • 2005
  • Stresses of main stop valve and control valve casings for the steam turbines of power plants are analyzed by the finite element method. The stress intensity is obtained to check the results on the basis of the design criteria of ASME boiler and pressure vessel code. To verify accuracy of the finite element analysis. analyzed stresses are compared with those measured during the hydrostatic pressure test. Stress category drawings. which play an important role in evaluating casting defects, are produced from the analysis results, and important points in casting of the valve casings are discussed in terms of the stress category.

Analysis of Similarity of Twitter Topic Categories among Regions

  • Yun, Hong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제10권1호
    • /
    • pp.27-32
    • /
    • 2012
  • Twitter can spread and share all kinds of information such as facts, opinions, and ideas in real time. In this paper, we empirically compare and analyze the topic categories in Twitter with all top 100 users in each of geographic region. We mainly consider the relationships among regions and selected four regions: Global, Seoul, Tokyo, and Beijing. Each of the top 100 users in Twitter is classified into a specific category and then statistical analysis is conducted. Among eight topic categories, the "Arts" category is the largest and the second is "Life". The correlation between global and Seoul groups has the lowest value among the six pairs of relationships between regional groups, and this difference is statistically significant. We find that the Seoul, Tokyo, and Beijing regional Twitter groups, all in East Asia, have high topical similarity. Based on the correlation analysis, Seoul and Tokyo saliently show a sticky trend. The correlation coefficient presents very a strong positive correlation between Seoul and Tokyo. The correlation between the global group and the East Asian groups is relatively lower than that among the East Asian groups.