• Title/Summary/Keyword: 태그 정보 추출

Search Result 211, Processing Time 0.03 seconds

Mining Semantically Similar Tags from Delicious (딜리셔스에서 유사태그 추출에 관한 연구)

  • Yi, Kwan
    • Journal of the Korean Society for information Management
    • /
    • v.26 no.2
    • /
    • pp.127-147
    • /
    • 2009
  • The synonym issue is an inherent barrier in human-computer communication, and it is more challenging in a Web 2.0 application, especially in social tagging applications. In an effort to resolve the issue, the goal of this study is to test the feasibility of a Web 2.0 application as a potential source for synonyms. This study investigates a way of identifying similar tags from a popular collaborative tagging application, Delicious. Specifically, we propose an algorithm (FolkSim) for measuring the similarity of social tags from Delicious. We compared FolkSim to a cosine-based similarity method and observed that the top-ranked tags on the similar list generated by FolkSim tend to be among the best possible similar tags in given choices. Also, the lists appear to be relatively better than the ones created by CosSim. We also observed that tag folksonomy and similar list resemble each other to a certain degree so that it possibly serves as an alternative outcome, especially in case the FolkSim-based list is unavailable or infeasible.

Extraction method of spatial relation by analyzing location tag in folksonomy (폭소노미에서 위치태그 분석을 통한 공간관계 추출 기법)

  • Choi, Yun-Hee;Yong, Hwan-Seung
    • Journal of Korea Multimedia Society
    • /
    • v.12 no.8
    • /
    • pp.1043-1054
    • /
    • 2009
  • As the semantic web receives higher concern with an intensified necessity in these days, the research on the ontology as its core technology has been carried out in various fields. The ontology has been adopted as an alternative to work out lots of problematic issues resulted from the insufficient vocabulary selection rules in folksonomy, widely accepted under Web 2.0. Therefore the importance of research to complementarily consolidate the two disciplines, the folksonomy and the ontology, has been increased. Based on this idea this research proposes a system, which pulls out, using open services, the location information tags from folksonomy-based metadata, ultimately extracts, following location information analyses, spatial relationships among tags, and in turn automatically constructs self-correcting location information domain ontology. The system devised in this study will associate data derived from easily accessible folksonomy with meaningful and technological information from ontology.

  • PDF

Automatic Annotation of Image using its Content (내용 정보를 이용한 이미지 자동 태깅)

  • Jang, Hyun-Woong;Cho, Soosun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.841-844
    • /
    • 2015
  • 이미지 인식과 내용분석은 이미지 검색과 멀티미디어 데이터 활용 분야에서 핵심기술이라 할 수 있다. 특히 최근 스마트폰, 디지털 카메라, 블랙박스 등에서 수집되는 영상 데이터 양이 급격히 증가하고 있다. 이에 따라 이미지를 인식하고 내용을 분석하여 활용할 수 있는 기술에 대한 요구가 점차 증대되고 있다. 본 논문에서는 이미지 내용정보를 이용하여 자몽으로 이미지로부터 태그정보를 추출하는 방법을 제안한다. 이 방법은 기계학습 기법인 CNN(Convolutional Neural Network)에 ImageNet의 이미지 데이터와 라벨을 학습시킨 후, 새로운 이미지로부터 라벨정보를 추출하는 것이다. 추출된 라벨을 태그로 간주하고 검색에 활용한다면 기존 검색시스템의 정확도를 향상시킬 수 있다는 것을 실험을 통하여 확인하였다.

RFID-based Automatic Entity Information Management System for Smart Refrigerator (스마트 냉장고를 위한 RFID 기반 물품 정보 자동 관리 시스템)

  • Lee, Ju-Dong;Kim, Hyung-Suk;Kim, Tae-Hyoun;Suh, Hyo-Joong
    • Journal of Internet Computing and Services
    • /
    • v.9 no.1
    • /
    • pp.43-54
    • /
    • 2008
  • In this paper, we implement an automatic entity information management system for smart refrigerator using RFID technology in which objects containing electronic tags are automatically identified using radio wave. Unlike current "smart" refrigerators, the system presented in this paper implements smart tag information acquisition mechanism and real-time information management system to provide various information on entities in refrigerators to local and remote users. As the first step, this paper analyzes the requirements for smart refrigerator system based on the RFID and suggests design considerations. Based on the analysis, we propose and implement an efficient tag location tracking method based on antenna transfer method and an intelligent tag information management system based on embedded database and web server. We also provide a wide range of experimental results on the number of tags identified at a time and the tag recognition ratio according to the RFID antenna transfer speed and the angle between tag reader and tags.

  • PDF

Hashtag Analysis Scheme for Topic based Tweet Categorization (토픽 기반의 트윗 분류를 위한 해시태그 분석 기법)

  • Kim, Yongsung;Jun, Sanghoon;Rew, Jehyeok;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.737-740
    • /
    • 2014
  • 최근 SNS 사용자가 급증하면서 매우 다양하고 방대한 양의 글이 여러 종류의 SNS를 통해 생성되고 있다. 그중 트위터는 정보의 전달 및 확산에 상당히 유용한 도구로 사용되고 있다. 이러한 트위터의 사용자 트윗은 뉴스, 음악, 사진, 여행 등 다양한 형태로 등장한다. 또한 트위터는 해시태그라는 사용자 정의 태그를 사용하는데 이는 트윗의 키워드 및 핵심을 쉽게 표현할 수 있도록 해주는 효과적인 수단이다. 최근 상당히 많은 양의 트윗의 생성에도 불구하고 이를 다양한 카테고리별로 분류할 수 있는 연구가 많이 진행되지 않았다. 따라서 본 논문에서는 해시태그를 이용해 트윗의 핵심을 파악하고 수많은 트윗을 다양한 토픽별로 분류할 수 있는 기법을 제안한다. 우선 다양한 카테고리의 인기 해시태그가 포함된 트윗을 수집하고 수집한 트윗에서 해시태그별 키워드를 추출한다. 그리고 코사인 유사도를 통해 해시태그별 내용 유사도를 파악하여 각 카테고리 내의 해시태그가 얼마나 유사한 내용을 지니고 있는지 파악한다. 마지막으로 사용자 트윗이 입력되면 모든 카테고리와 유사도를 비교하여 가장 유사도가 높은 카테고리를 찾아 추천해준다. 제안된 기법을 바탕으로 프로토타입을 구현하고 실험을 통해 성능을 평가한다.

Answer Constraints Extraction on User Question for Wikipedia QA (위키피디아 QA를 위한 질의문의 정답제약 추출)

  • Wang, JiHyun;Heo, Jeong;Lee, Hyungjik;Bae, Yongjin;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.248-250
    • /
    • 2017
  • 질의응답 시스템에서 정답을 제약하기 위한 위키피디아 영역의 정답제약 9개를 정의하고 질문 문장에서 제약표현을 추출하는 방법을 제안한다. 다어절의 정답제약 표현을 추출하기 위해서 언어분석 결과를 활용하여 정답제약 후보를 생성하며 후보단위로 정답제약 표현을 학습하기 위한 자질을 제시한다. 기계학습 방법을 이용하여 정답제약 후보 별로 정답제약 태그를 분류하여 정답제약 표현을 추출한다. 성능 실험은 각 정답제약 태그 별로 F1-Score 평가를 수행하였다.

  • PDF

Automatic Tagging for Social Images using Convolution Neural Networks (CNN을 이용한 소셜 이미지 자동 태깅)

  • Jang, Hyunwoong;Cho, Soosun
    • Journal of KIISE
    • /
    • v.43 no.1
    • /
    • pp.47-53
    • /
    • 2016
  • While the Internet develops rapidly, a huge amount of image data collected from smart phones, digital cameras and black boxes are being shared through social media sites. Generally, social images are handled by tagging them with information. Due to the ease of sharing multimedia and the explosive increase in the amount of tag information, it may be considered too much hassle by some users to put the tags on images. Image retrieval is likely to be less accurate when tags are absent or mislabeled. In this paper, we suggest a method of extracting tags from social images by using image content. In this method, CNN(Convolutional Neural Network) is trained using ImageNet images with labels in the training set, and it extracts labels from instagram images. We use the extracted labels for automatic image tagging. The experimental results show that the accuracy is higher than that of instagram retrievals.

HTML Text Extraction Using Tag Path and Text Appearance Frequency (태그 경로 및 텍스트 출현 빈도를 이용한 HTML 본문 추출)

  • Kim, Jin-Hwan;Kim, Eun-Gyung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.25 no.12
    • /
    • pp.1709-1715
    • /
    • 2021
  • In order to accurately extract the necessary text from the web page, the method of specifying the tag and style attributes where the main contents exist to the web crawler has a problem in that the logic for extracting the main contents. This method needs to be modified whenever the web page configuration is changed. In order to solve this problem, the method of extracting the text by analyzing the frequency of appearance of the text proposed in the previous study had a limitation in that the performance deviation was large depending on the collection channel of the web page. Therefore, in this paper, we proposed a method of extracting texts with high accuracy from various collection channels by analyzing not only the frequency of appearance of text but also parent tag paths of text nodes extracted from the DOM tree of web pages.

Robust Tag Detection Algorithm for Tag Occlusion of Augmented Reality (증강 현실의 태그 차단 현상에 강인한 태그 탐지 알고리즘)

  • Lee Seok-Won;Kim Dong-Chul;Han Tack-Don
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.55-57
    • /
    • 2006
  • 본 논문에서는 컬러코드를 이용하여 증강현실 시스템에 사용 가능한 태그를 탐지하는 알고리즘을 설계하고 차단 현상에 강인한 알고리즘을 제안하였다. 기존의 ARToolkit에서 태그의 일부분이 사용자 또는 다른 물체에 의해 가려지게 될 경우 증강되었던 객체가 순간 사라져 버리는 불안정성 (Instability) 문제를 해결하기 위한 방법에 초점을 맞춘다. 불안정성의 문제는 이미지 안에 태그가 존재하지만 해당하는 객체를 증강시키지 못하는 False Negative 에러와 태그가 존재하지 않는 곳에 잘못된 객체를 증강시키는 False Positive 에러로 분류 될 수 있다. 제안된 탐지 알고리즘으로 특정 컬러 영역을 분리하여 모서리 여부를 판별하고 모서리인 경우 가려진 꼭지점의 위치를 추출하여 태그가 차단에 의하여 가려졌을 때에도 객체를 안정적으로 증강시킬 수 있다. 기존 AR 시스템들의 태그를 가지고 Daylight 65, Illuminant A. CWF, TL84의 4가지의 표준 조명하에 컬러코드 4종류, ARToolkit 태그 4개, ARTag 4개를 이용하여 실험을 진행하여 차단 현상이 발생하면 전혀 객체를 증강시킬 수 없었던 ARToolkit에서도 DayLight65의 경우 50%의 False Negative. False Positive rate을 보여 기존 증강현실 시스템에서 보였던 불안정성 문제를 개선하였다.

  • PDF

Weighting of XML Tag using User's Query (사용자 질의를 이용한 XML 태그의 가중치 결정)

  • Woo Seon-Mi;Yoo Chun-Sik;Kim Yong-Sung
    • The KIPS Transactions:PartD
    • /
    • v.12D no.3 s.99
    • /
    • pp.439-446
    • /
    • 2005
  • XML is the standard that can manage systematically WWW documents and increase retrieval efficiency. Because XML documents have the information of contents and that of structure in single document, users can get more suitable retrieval result by retrieving the information of content as well as that of logical structure. In this paper, we will propose a method to calculate the weights of XML tags so that the information of XML tag is used to index decision. A proposed method creates term vector and weight vector for XML tags, and calculates weight of tag by reflecting user's retrieval behavior (user's query). And it decides the weights of index terms of XML document by reflecting the weights of tags. And we will perform an evaluation of proposed method by comparison with existing researches using weights of paragraphs.