• Title/Summary/Keyword: 태깅시스템

Search Result 197, Processing Time 0.023 seconds

Automatic semantic annotation of web documents by SVM machine learning (SVM 기계학습을 이용한 웹문서의 자동 의미 태깅)

  • Hwang, Woon-Ho;Kang, Sin-Jae
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.12 no.2
    • /
    • pp.49-59
    • /
    • 2007
  • This paper is about an system which can perform automatic semantic annotation to actualize "Semantic Web." Since it is impossible to tag numerous documents manually in the web, it is necessary to gather large Korean web documents as training data, and extract features by using natural language techniques and a thesaurus. After doing these, we constructed concept classifiers through the SVM (support vector machine) teaming algorithm. According to the characteristics of Korean language, morphological analysis and syntax analysis were used in this system to extract feature information. Based on these analyses, the concept code is mapped with Kadokawa thesaurus, which made it possible to map similar words and phrase to one concept code, to make training vectors. This contributed to rise the recall of our system. Results of the experiment show the system has a some possibility of semantic annotation.

  • PDF

A Qualitative Exploration of Folksonomy Users' Tagging Behaviors (폭소노미에 따른 웹 분류 연구 - 이용자 태깅 행위 분석을 중심으로 -)

  • Park, Hee-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.45 no.1
    • /
    • pp.189-210
    • /
    • 2011
  • This study aims to explore how users are tagging in order to utilize a folksonomy and whether they understand the social and interactive aspects of tagging in three different folksonomic systems, Connotea (www.connotea.org), Delicious(http://delicious.com), and CiteULike(www.citeulike.org). The study uses internet questionnaires, qualitative diary studies, and follow-up interviews to understand twelve participants' tagging activities associated with folksonomic interactions. The flow charts developed from the twelve participants showed that tagging was a quite complex process, in which each tagging activity was interconnected, and a variety of folksonomic system features were employed. Three main tagging activities involved in the tagging processes have been identified: item selection, tag assignment, and tag searching and discovery. During the tag assignment, participants would describe their tagging motivations related to various types of tags. Their perception of the usefulness of types of tags was different when their purpose was for social sharing rather than personal information management. While tagging, participants recognized the social potential of a folksonomic system and used interactive aspects of tagging via various features of the folksonomic system. It is hoped that this empirical study will provide insight into theoretical and practical issues regarding users' perceptions and use of folksonomy in accessing, sharing, and navigating internet resources.

Korean Part-of-Speech Tagging System Using Resolution Rules for Individual Ambiguous Word (어절별 중의성 해소 규칙을 이용한 혼합형 한국어 품사 태깅 시스템)

  • Park, Hee-Geun;Ahn, Young-Min;Seo, Young-Hoon
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.13 no.6
    • /
    • pp.427-431
    • /
    • 2007
  • In this paper we describe a Korean part-of-speech tagging approach using resolution rules for individual ambiguous word and statistical information. Our tagging approach resolves lexical ambiguities by common rules, rules for individual ambiguous word, and statistical approach. Common rules are ones for idioms and phrases of common use including phrases composed of main and auxiliary verbs. We built resolution rules for each word which has several distinct morphological analysis results to enhance tagging accuracy. Each rule may have morphemes, morphological tags, and/or word senses of not only an ambiguous word itself but also words around it. Statistical approach based on HMM is then applied for ambiguous words which are not resolved by rules. Experiment shows that the part-of-speech tagging approach has high accuracy and broad coverage.

Hybrid Part-of-Speech Tagging using Context Information among Words (어절간 문맥 정보를 이용한 혼합형 품사 태깅)

  • Lim, Hee-Dong;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.376-380
    • /
    • 2000
  • 본 논문에서는 규칙 정보와 통계 정보의 상호 보완적 특성을 이용한 혼합형 방법을 기반으로 규칙 정보와 통계 정보의 추출 및 적용 시에 어절간 문맥 정보를 보다 효율적으로 이용하는 혼합형 품사 태깅 시스템을 제안한다. 먼저 규칙이 적용되는 중의성들에 대해서 높은 정확률로 태깅을 수행한 후, 규칙으로 해결할 수 없는 중의성들에 대해서는 통계 정보를 이용하여 태깅을 수행한다. 규칙 정보는 중의성을 갖는 어절과 주변 어절들의 형태소 및 태그를 이용하여 정의하고 통계 정보는 문맥에 영향을 많이 미치고 많은 중의성의 원인이 되는 조사와 어미의 형태를 그대로 활용하여 추출함으로써 어절간 문맥을 보다 효율적으로 이용한다.

  • PDF

Design of GeoSpatial Tagging and Retrieval Framework for GeoSemantic Web (GeoSemantic Web을 위한 공간정보태깅 및 검색 프레임워크의 설계)

  • Ha, Su-Woo;Ha, Tae-Seok;Yang, Pyung-Woo;Jeong, Yong-Hee;Jeong, Hae-Choon;Nam, Kwang-Woo
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.340-343
    • /
    • 2010
  • 이 논문은 GeoSemantic Web을 위한 공간정보 태깅 및 검색 프레임워크를 제안한다. 웹상의 문서들은 다양한 공간정보를 포함하고 있으며, 이러한 텍스트 공간정보를 실제 공간정보로 변환하여 태깅함으로서 공간정보시스템을 웹의 영역까지 확장할 수 있다. 즉, 기존의 GIS와 결합하여 자신과 가까운 문서의 정보를 검색 또는 관심주제의 문서내 위치 등을 확인하는데 사용할 수 있으며, 이 공간정보를 이용하여 Semantic Web의 지식 링크와 연결하기 위한 기본 시스템으로 이용될 수 있다.

  • PDF

Parts-Of-Speech Tagging System Using Grammar Rule and Eojeol Relativity (문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템)

  • Do, Mi-Sook;Choe, Ho-Seop;Ock, Cheol-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.481-484
    • /
    • 2003
  • 본 논문에서는 문법 규칙과 어절 상관도를 이용한 품사 태깅 시스템을 제안한다. 원시 말뭉치와 품사태그 부착 말뭉치에서 중의 어절(ambiguity eojeol)의 앞뒤 어휘와 품사 정보를 파악하여 문법 규칙을 마련하였으며, 한국어의 품사와 문장성분적 요소를 고려한 7개의 어절 태그를 설정하여 이 어절 태그간의 확률값을 이용해 어절간의 상관도를 구하였다. 이러한 방법들을 이용하여 품사 태깅을 실험한 결과, 150 만 어절의 학습 말뭉치와 3 만 어절의 실험 말뭉치에서 각각 평균 92%와 91%의 정확률을 보였다.

  • PDF

A Web Contents Ranking Algorithm using Bookmarks and Tag Information on Social Bookmarking System (소셜 북마킹 시스템에서의 북마크와 태그 정보를 활용한 웹 콘텐츠 랭킹 알고리즘)

  • Park, Su-Jin;Lee, Si-Hwa;Hwang, Dae-Hoon
    • Journal of Korea Multimedia Society
    • /
    • v.13 no.8
    • /
    • pp.1245-1255
    • /
    • 2010
  • In current Web 2.0 environment, one of the most core technology is social bookmarking which users put tags and bookmarks to their interesting Web pages. The main purpose of social bookmarking is an effective information service by use of retrieval, grouping and share based on user's bookmark information and tagging result of their interesting Web pages. But, current social bookmarking system uses the number of bookmarks and tag information separately in information retrieval, where the number of bookmarks stand for user's degree of interest on Web contents, information retrieval, and classification serve the purpose of tag information. Because of above reason, social bookmarking system does not utilize effectively the bookmark information and tagging result. This paper proposes a Web contents ranking algorithm combining bookmarks and tag information, based on preceding research on associative tag extraction by tag clustering. Moreover, we conduct a performance evaluation comparing with existing retrieval methodology for efficiency analysis of our proposed algorithm. As the result, social bookmarking system utilizing bookmark with tag, key point of our research, deduces a effective retrieval results compare with existing systems.

Distance Learning and Re-Ranking based Broadcasting Contents Tagging with Blog Postings (거리 학습과 재서열화를 이용한 방송 콘텐츠에 대한 블로그 포스팅 태깅)

  • Son, Jeong-Woo;Kim, Sun-Joong;Kim, Hwa-Suk;Cho, Keeseong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.882-885
    • /
    • 2014
  • 이미지 혹은 영상에 대한 자동 태깅은 해당 콘텐츠에 대한 추가적인 정보를 자동으로 시스템에 제공하는 기술로써 영상 인식, 콘텐츠 매시업, 정보 검색 등 다양한 기술/서비스 분야에서 여러 목적으로 활용되고 있다. 특히, 방송 콘텐츠는 많은 양의 정보를 제한된 영역 및 시간에 축약하여 담고 있기 때문에 영상 처리 기술을 통한 객체 인식이나, 콘텐츠 매시업, 추천 서비스 등의 성능 향상을 위해 자동 혹은 수동 태깅을 통한 정보 제공이 요구된다. 본 논문에서는 블로그를 이용한 프레임 단위의 방송 콘텐츠 태깅 기술을 제안한다. 제안하는 기술은 기존의 콘텐츠 단위의 정보 제공이나, 수동 태깅 된 정보를 제공하는 기술들과 달리, 영상의 각 프레임에 대한 자동 태깅을 목표로 한다. 제안하는 방법은 거리 학습을 통해 영상의 각 프레임이 가지는 특성을 고려한 모델을 구축한 후, 이를 토대로 영상의 프레임들과 블로그의 이미지를 매칭한다. 매칭된 결과를 기반으로 특정 블로그는 영상 내 특정 프레임 구간에 태깅 된다. 제안한 방법은 이미지 매칭 성능을 측정하여 평가하였다. 블로그 이미지에 대해 Top 1 매칭 프레임을 살펴본 결과, 70%의 정확률을 보였다. 소프트 매칭(Top n)의 경우, 최대 90%의 성능을 얻을 수 있음을 실험을 통해 알 수 있었다.

An Implementation of RFID Feeding History System with Improved Tagging Methods in land-based Aquaculture Farms (육상 수조식 양식장에서 개선된 태깅 방법에 의한 RFID 급이 이력 시스템 구현)

  • Ye, Seoung-Bin;Jung, Sung-Ju;Ceong, Hee-Taek;Han, Soon-Hee
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.14 no.3
    • /
    • pp.745-753
    • /
    • 2010
  • Many studies using RFID which can identify the movement of targeted objects has been conducted actively. In this paper, we propose improved tagging method to check exactly the amount of fish feed by the aquaculture tank in a land-based aquaculture farm and design the RFID feeding system to perform auto feeding history. Also, we implement the prototype system which it includes development program for auto-identification and auto-recording and self-made RFID feeding cart equipped the weight device, RFID reader, control module and display device.

Loanword Recognition Using Deep Learning (심층학습을 이용한 음절태깅 기반의 외래어 인식 시스템)

  • Park, Ho-Min;Kim, Chang-Hyun;Cheon, Min-Ah;Noh, Kyung-Mok;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.71-75
    • /
    • 2017
  • 외래어란 외국어로부터 들어와 한국어에 동화되고 한국어로서 사용되는 언어이다. 나날이 우리의 언어사용 문화에서 외래어의 사용 비율은 높아져가는 추세로, 전문분야에서는 특히 두드러진다. 그러므로 더 효율적이고 효과적인 자연언어처리를 위해서 문서 내 외래어 인식은 중요한 전처리 과정이다. 따라서 본 논문에서는 bidirectional LSTM(이하 bi-LSTM)-CRF 모형의 심층학습을 이용한 음절태깅 기반의 외래어 인식 시스템을 제안한다. 제안하는 시스템의 외래어 인식 학습 과정은 다음과 같다. 첫째, 학습용 말뭉치 자료의 한글 음절들과 공백, 마침표(.)를 토대로 word2vec을 통해 학습용 피쳐(feature) 자료를 생성한다. 둘째, 학습용 말뭉치 자료와 학습용 피쳐 자료를 결합하여 bi-LSTM 모형 학습 자료를 구축한다. 셋째, bi-LSTM 모형을 거쳐 학습된 결과물을 CRF 모형에서 로그 가능도(log likelyhood)와 비터비(Viterbi) 알고리즘을 통해 학습 결과물을 내놓는다. 넷째, 학습용 말뭉치 자료의 정답과 비교한 뒤 모형 내부의 수치들을 조정한다. 다섯째, 학습을 마칠 때까지 반복한다. 본 논문에서 제안하는 시스템을 이용하여 자체적인 뉴스 수집 자료에 대해서 높은 정확도와 재현율을 기록하였다.

  • PDF