• 제목/요약/키워드: Topic signature

검색결과 19건 처리시간 0.02초

Topic Signature를 이용한 댓글 분류 시스템 (Comments Classification System using Topic Signature)

  • 배민영;차정원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권12호
    • /
    • pp.774-779
    • /
    • 2008
  • 본 논문에서는 토픽 시그너처(Topic Signature)를 이용하여 댓글을 분류하는 시스템에 대해서 설명한다. 토픽 시그너처는 자질을 선택하는 방법으로 문서요약이나 문서분류에서 사용하는 방법이다. 댓글은 문장의 길이가 짧고 띄어쓰기가 거의 없으며 특수문자들이 많은 특성을 가지고 있다. 따라서 우리는 댓글을 7개의 음절로 나누고 이를 다시 Tri-gram으로 나누어 분류의 기본단위로 본다. 이 Tri-gram을 토픽 시그너처를 이용한 학습 단위로 사용하고, 학습한 자질을 베이지안(Bayesian) 모델을 사용하여 분류한다. 다양한 방법의 모델과 비교 실험을 통하여 구현한 시스템의 성능이 기존의 방법보다 상승되었음을 실험 결과를 통해 알 수 있었다.

지지 벡터 기계와 토픽 시그너처를 이용한 댓글 분류 시스템 언어에 독립적인 댓글 분류 시스템 (Comments Classification System using Support Vector Machines and Topic Signature)

  • 배민영;은지현;장두성;차정원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.263-266
    • /
    • 2009
  • 댓글은 일반적인 글에 비해 작성가능한 문장의 길이가 짧고, 띄어쓰기나 마침표를 잘 쓰지 않는 등 비정형화된 형식 구조를 가진다. 이러한 댓글의 악성 여부를 판별하기 위하여 본 논문에서는 문장을 n-gram으로 나누고 문서요약이나 문서분류에서 자질 선택에 많이 사용되는 토픽 시그너처(Topic Signature)를 이용하여 자질을 추출한다. 또한 지지 벡터 기계(Support Vector Machines)을 사용하여 댓글의 악성 여부를 판별한다. 본 논문에서는 한글과 영어 댓글에 대한 악성 여부를 판별하는 실험을 통하여 복잡한 전처리과정을 요구하는 기존에 제안된 방법들 보다 우수한 성능을 보이는 것을 확인할 수 있었다.

  • PDF

Company Name Discrimination in Tweets using Topic Signatures Extracted from News Corpus

  • Hong, Beomseok;Kim, Yanggon;Lee, Sang Ho
    • Journal of Computing Science and Engineering
    • /
    • 제10권4호
    • /
    • pp.128-136
    • /
    • 2016
  • It is impossible for any human being to analyze the more than 500 million tweets that are generated per day. Lexical ambiguities on Twitter make it difficult to retrieve the desired data and relevant topics. Most of the solutions for the word sense disambiguation problem rely on knowledge base systems. Unfortunately, it is expensive and time-consuming to manually create a knowledge base system, resulting in a knowledge acquisition bottleneck. To solve the knowledge-acquisition bottleneck, a topic signature is used to disambiguate words. In this paper, we evaluate the effectiveness of various features of newspapers on the topic signature extraction for word sense discrimination in tweets. Based on our results, topic signatures obtained from a snippet feature exhibit higher accuracy in discriminating company names than those from the article body. We conclude that topic signatures extracted from news articles improve the accuracy of word sense discrimination in the automated analysis of tweets.

Topic Signature와 동시 출현 단어 쌍을 이용한 문서 범주화 (Text Categorization using Topic Signature and Co-occurrence Features)

  • 배원식;한요섭;차정원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.262-267
    • /
    • 2008
  • 본 논문에서는 문서 내에서 동시에 출현하는 단어 쌍을 자질 추출 단위로 하는 문서 범주화 시스템에 대하여 기술한다. 자질 추출 단위를 단어 쌍으로 정의한 것은 문서에서 빈번하게 동시에 출현하는 단어들은 서로 연관관계가 높으며, 단어 하나보다는 연관관계가 높은 단어들의 쌍이 특정 범주의 문서에서만 나타날 확률이 높아지므로 문서 분류 능력을 높이는데 좋은 요인으로 작용할 수 있을 것이라는 가정 때문이다. 그리고 문서 요약 분야에서 제안된 Log-likelihood Ratio를 기반으로 하는 Topic Signature Term Extraction 방법을 사용하여 자질 추출을 하고, Naive Bayes 분류기를 이용하여 문서를 분류한다. 본 연구는 Reuters-21578 문서 집합을 이용한 성능평가에서 좋은 결과를 보였으며, 이는 앞으로의 연구에도 기여할 수 있을 것이라 기대한다.

  • PDF

Topic signatur e와 n-gram을 이용한 댓글 분류 시스템 (Comments Classification System using Topic Signature and n-gram)

  • 배민영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-194
    • /
    • 2008
  • 본 논문에서는 토픽 시그너처(Topic Signature)와 n-gram을 이용한 댓글 분류 시스템을 개발한다. 토픽 시그너처는 문서요약이나 문서분류에서 자질 선택을 위한 방법으로 많이 사용되어지며, n-gram은 모든 언어에 적용 가능한 장점이 있다. 악성댓글은 대체로 문장 길이가 짧고 유행어나 변형어의 출현 빈도가 높으며 비정형화된 특징이 있다. 따라서 우리는 댓글을 n-gram으로 나누어 자질로 선택한다. 분류를 위해 베이지안(Bayesian)모델을 사용하였다. 본 논문에서는 한글과 영어 댓글에 대한 판별 실험을 통하여 구현한 시스템이 복잡한 전처리 과정이 필요한 기존에 제안된 방법들보다 더 나은 성능을 보이며, 언어에 관계없이 적용 가능하다는 것을 실험 결과를 통해 확인할 수 있었다.

  • PDF

Automatic Payload Signature Update System for the Classification of Dynamically Changing Internet Applications

  • Shim, Kyu-Seok;Goo, Young-Hoon;Lee, Dongcheul;Kim, Myung-Sup
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1284-1297
    • /
    • 2019
  • The network environment is presently becoming very increased. Accordingly, the study of traffic classification for network management is becoming difficult. Automatic signature extraction system is a hot topic in the field of traffic classification research. However, existing automatic payload signature generation systems suffer problems such as semi-automatic system, generating of disposable signatures, generating of false-positive signatures and signatures are not kept up to date. Therefore, we provide a fully automatic signature update system that automatically performs all the processes, such as traffic collection, signature generation, signature management and signature verification. The step of traffic collection automatically collects ground-truth traffic through the traffic measurement agent (TMA) and traffic management server (TMS). The step of signature management removes unnecessary signatures. The step of signature generation generates new signatures. Finally, the step of signature verification removes the false-positive signatures. The proposed system can solve the problems of existing systems. The result of this system to a campus network showed that, in the case of four applications, high recall values and low false-positive rates can be maintained.

카드사용자의 비밀번호 기반 이중서명을 이용한 전자 지불 프로토콜의 설계 (The Design of Electronic Payment Protocol Using Dual Signature based on Cardholder's Secret Number)

  • 김성열;이옥빈;배용근
    • 한국정보통신학회논문지
    • /
    • 제3권2호
    • /
    • pp.411-420
    • /
    • 1999
  • 전자상거래는 컴퓨터 기술 분야에서 중요한 주제로서 이는 공중망에서 전자 정보를 교환함으로써 금융 거래를 수행하게 되기 때문에 다양한 종류의 위험을 내포하게 된다. 따라서 전자상거래 시스템 구축할 때는 기밀성, 무결성, 인증과 부인봉쇄와 같은 보안요소를 고려해야 한다. 본 논문에서는 이중서명 기법을 이용한 신용카드 기반의 지불프로토콜을 제시한다 이 프로토콜은 카드사용자가 지불하는 은행에게는 지불정보를 제공하지만 구매정보는 주지 않으며, 상인에게는 구매정보를 제공하지만 카드번호를 비롯한 지불정보는 알리지 않기 때문에 카드사용자의 개인정보를 보호하게 된다. 프로토콜을 수행하기 위해서 이중서명은 사용자의 신용카드 비밀번호를 사용한 공통키와 공개키 방식을 사용함으로써 실행한다.

  • PDF

A Study on the Characteristics of the Manufacturing Method of Handbags by Brand

  • Youshin Park
    • 패션비즈니스
    • /
    • 제27권6호
    • /
    • pp.66-84
    • /
    • 2023
  • Handbags are a part of fashion and while their significance and value are increasing, research on this topic is lacking. This study defines handbags and categorizes the materials used for making handbags, sewing methods, expression techniques, and terminologies related to accessories. A total of 1,743 handbags that were released from the Spring 2020 to Fall 2023, Ready-to-Wear collections by 8 selected brands (Hermes, Dior, Fendi, Chanel, Louis Vuitton, Prada, Gucci, and Alexander McQueen), were analyzed. Out of these, 732 unique designs, excluding those with only color variations, were studied. The most common sewing methods were 'Cut, sewing, and edge painting', 'Cylinder arm sewing', 'Cut, edge painting, and sewing', and 'Inverted seam', in that order. Slim strap designs primarily used the 'Cut, sewing, and edge painting' method, whereas the body, especially with narrow and hard leather, was best suited for the 'Cylinder arm sewing machine'. For expression techniques, the most frequently used methods were 'Quilting', 'Metal Eyelet', 'Embossing', 'Printing', 'Punching', and 'Weaving', respectively. The characteristics of each brand's production methods, expression techniques, and accessories were as follows: First, the exposure of logos and monograms is prominent. Unlike clothing, handbags often prominently feature the brand's logo or monogram. Second, signature quilting is a prominent feature. Quilting effectively conveys the brand's signature style, providing cushioning, volume, and pattern effects. Third, sustainable development is a growing trend. Brands are increasingly applying eco-friendly and socially responsible designs.

웹 서비스 발견을 위해 프로세스 정보를 기술하는 온톨로지 (Ontology describing Process Information for Web Services Discovery)

  • 유정연;이규철
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.151-175
    • /
    • 2007
  • 지금까지 시맨틱 웹 서비스 발견은 WSMO나 OWL-S의 프로파일을 이용하여 수행되어 왔다. 그러나 이 연구들은 서비스의 이름과 input/output만을 이용하여 검색함으로써, 배송 후 지불을 하는 도서 판매 서비스를 찾아라.' 와 같이 서비스의 내부 정보에 대한 질의를 수행할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 TM-S 온톨로지와 TMS-QL을 제시한다. TM-S 온톨로지는 프로세스 정보를 이용하여 서비스의 행동을 기술하며, 3가지 하위 온톨로지인 프로세스 시그니처 온톨로지, 프로세스 구조 온톨로지, 프로세스개념 온톨로지로 구성되어 있다. TMS-QL은 사용자가 TM-S 온톨로지에 대해 질의 요구를 기술할 수 있는 언어를 제공한다.

  • PDF