• 제목/요약/키워드: 유사태그

검색결과 136건 처리시간 0.024초

전문 웹 사이트에서의 통계적 기법과 태그 정보를 이용한 문서 분류 (Web Document Clustering Using Statistical Techniques & Tag Information on the Specific-Domain Web site)

  • 조은휘;변영태
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.297-302
    • /
    • 2002
  • 특정 영역에 대해 사용자에게 관련 정보를 제공하는 서비스를 위해 정보 에이전트를 개발하고 있다. 이 시스템은 웹 상에서 문서를 수집해 오는데 특정 영역과 관련한 지식베이스를 토대로 하고 있는데, 이들 중 몇몇 전문 사이트 내의 정보가 많이 포함되어 있음을 볼 수 있다. 그러므로 전문 사이트 내의 관련 문서 수집은 중요한 의의가 있다. 본 논문에서는 이들 전문 사이트 내의 전문 문서 수집을 위해 문서간의 유사성을 토대로 클러스터링 한다. 즉, 문서내의 텀(term)과 HTML 태그(tag), 지식베이스의 WordNet 계층구조를 data로 하고 SVD(Singular Value Decomposition)을 사용하여 문서간의 관계를 밝혀내었다.

  • PDF

글로벌 해운물류 실시간 위치 추적 시뮬레이션 시스템 개발 (Development of Simulation System For Real-Time Location Tracking In Global Shipping Logistics)

  • 박병권;최형림;김채수;이강배;박민선
    • 한국정보통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1235-1242
    • /
    • 2015
  • 글로벌 해운물류에서 계속적으로 이동하는 화물의 위치 정보를 추적하고 관리하는 것은 물류주체에게 중요한 일이다. 화물에 부착된 태그의 GPS 좌표 흐름을 분석하면 물류거점을 기반으로 한 화물의 위치정보를 쉽게 추적할 수 있다. 즉, 태그와 물류거점간의 동적인 위치변화를 이용하여 거점 단위의 위치 이동을 추적할 수 있다. 본 논문에서는 전세계 물류거점을 대상으로 이러한 거점 단위 위치추적 알고리즘의 정확성과 오동작을 측정하기 위해 시뮬레이션 시스템을 개발하였다. 실제 태그를 제작하여 실험하기에는 많은 제약이 따르기 때문에 실제 태그와 유사하게 동작하는 태그 에뮬레이터를 개발하여 가상 태그를 생성한다. 실제 태그와 같은 통신 프로토콜을 이용하여 위치추적 시스템에 데이터를 전송함으로써 위치추적 시스템이 잘 동작함을 보인다.

태그 네트워크를 이용한 개인화 북마크 추천시스템 (Personalized Bookmark Recommendation System Using Tag Network)

  • 엄태영;김우주;박상언
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.181-195
    • /
    • 2010
  • 웹 2.0을 이끌어가는 원동력이라고 할 수 있는 일반 개인 사용자의 참여와 공유는 블로그, 소셜 네트워크(Social Network), 집단지성, 소셜 북마크(Social Bookmark), 태깅(Tagging) 등의 다양한 형태로 나타나고 있다. 이 중에서 소셜 북마크는 개인이 사용하는 북마크를 웹에 추가하여 공유함으로써, 다수의 사람들이 유용하다고 생각하는 북마크에 대한 정보를 기반으로 한 다양한 서비스를 제공하는 개념이다. 딜리셔스(Delicious.com)는 소셜 북마크 서비스의 대표적인 사례라고 할 수 있으며, 북마크에 사용자들이 붙인 태그를 이용하여 검색 서비스를 제공한다. 본 논문은 북마크 검색에 대해 개인화된 검색결과를 추천하기 위하여 사용자 태그를 기반으로 하여 딜리셔스가 제공하는 북마크들의 순위를 재순위화 하는 방법론을 제안하였다. 또한 태그유사도를 기반으로 한 태그 네트워크를 이용하여 사용자의 검색어에 의미적으로 유사한 다른 태그들도 순위에 반영될 수 있도록 하였다. 그리고 실험을 통하여 딜리셔스가 제시하는 순위에 비해 본 논문에서 제안하는 시스템의 재순위화 결과가 사용자들에게 더 만족스러우며 정확성도 높음을 확인하였다.

언어모델을 활용한 콘텐츠 메타 데이터 기반 유사 콘텐츠 추천 모델 (Similar Contents Recommendation Model Based On Contents Meta Data Using Language Model)

  • 김동환
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.27-40
    • /
    • 2023
  • 스마트 기기의 보급률 증가와 더불어 코로나의 영향으로 스마트 기기를 통한 미디어 콘텐츠의 소비가 크게 늘어나고 있다. 이러한 추세와 더불어 OTT 플랫폼을 통한 미디어 콘텐츠의 시청과 콘텐츠의 양이 늘어나고 있어서 해당 플랫폼에서의 콘텐츠 추천이 중요해지고 있다. 콘텐츠 기반 추천 관련 기존 연구들은 콘텐츠의 특징을 가리키는 메타 데이터를 활용하는 경우가 대부분이었고 콘텐츠 자체의 내용적인 메타 데이터를 활용하는 경우는 부족한 상황이다. 이에 따라 본 논문은 콘텐츠의 내용적인 부분을 설명하는 제목과 시놉시스를 포함한 다양한 텍스트 데이터를 바탕으로 유사한 콘텐츠를 추천하고자 하였다. 텍스트 데이터를 학습하기 위한 모델은 한국어 언어모델 중에 성능이 우수한 KLUE-RoBERTa-large를 활용하였다. 학습 데이터는 콘텐츠 제목, 시놉시스, 복합 장르, 감독, 배우, 해시 태그 정보를 포함하는 2만여건의 콘텐츠 메타 데이터를 사용하였으며 정형 데이터로 구분되어 있는 여러 텍스트 피처를 입력하기 위해 해당 피처를 가리키는 스페셜 토큰으로 텍스트 피처들을 이어붙여서 언어모델에 입력하였다. 콘텐츠들 간에 3자 비교를 하는 방식과 테스트셋 레이블링에 다중 검수를 적용하여 모델의 유사도 분류 능력을 점검하는 테스트셋의 상대성과 객관성을 도모하였다. 콘텐츠 메타 텍스트 데이터에 대한 임베딩을 파인튜닝 학습하기 위해 장르 분류와 해시태그 분류 예측 태스크로 실험하였다. 결과적으로 해시태그 분류 모델이 유사도 테스트셋 기준으로 90%이상의 정확도를 보였고 기본 언어모델 대비 9% 이상 향상되었다. 해시태그 분류 학습을 통해 언어모델의 유사 콘텐츠 분류 능력이 향상됨을 알 수 있었고 콘텐츠 기반 필터링을 위한 언어모델의 활용 가치를 보여주었다.

RFID 미들웨어 평가를 위한 테스트 데이터셋의 품질 지표 (Quality Metrics for RFID Test Dataset to Evaluate RFID Middleware)

  • 류우석;권준호;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.141-143
    • /
    • 2012
  • RFID 미들웨어의 평가를 위한 방법으로서, 테스트 데이터셋을 이용한 시뮬레이션은 일반적으로 사용되는 평가 방법이다. 태그 식별자에 따라 순차생성된 가상 데이터셋이나 랜덤 생성된 데이터셋의 경우 미들웨어의 단순 처리량을 평가하기에는 유용하나 미들웨어의 정확성이나 실행 가능성를 평가하기에는 한계가 있다. 테스트 데이터셋은 실제 리더에서 생성된 데이터셋과 매우 유사하여야 함에도 불구하고, 테스트 데이터셋의 품질 기준이 정의되어 있지 않음에 따라 테스트 데이터셋이 얼마만큼 실제 데이터셋과 유사한 지를 평가하기가 어려운 문제가 있다. 이를 위해 본 논문에서는 RFID 미들웨어의 평가에 사용되는 테스트 데이터셋의 품질을 평가하기 위한 품질 지표를 제안한다. 제안하는 품질 지표는 실제 RFID 리더에 태그가 통과할 때 생성되는 데이터 셋을 기반으로 하여 정의하였으며, RFID 무선 인식의 고유의 특성, 즉 중복성과 불확실성을 수치화해서 표현하는 특징이 있다. 또한 제안한 품질 지표를 실제 RFID 리더를 통해 생성한 데이터셋에 적용하여 비교 검토함으로써 품질 지표의 유용성을 입증한다.

태그 간 동의어 집합을 통한 XML 문서 유사도 측정 (Similarity Measurement for XML Documents Using Tag Synonyms)

  • 이강석;송인상;김응모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.29-34
    • /
    • 2007
  • 월드와이드웹에서의 정보를 재사용, 공유할 수 있도록 기준을 제시한 XML은 많은 곳에서 사용 중에 있으며, 널리 확산되고 있다. 사용자 정의태그를 이용한 XML의 특징은, 같은 도메인의 문서라도 사랑의 인식이 아닌 컴퓨터와 같은 기계적으로는 다르게 인식될 수 있다는 문제점을 드러내기도 한다. 본 논문에서는 이러한 문제점을 해결하고자 시소러스와 온톨로지 등을 이용해 XML 문서간 유사도를 측정하는 방법을 제시하며 이를 바탕으로 제작한 프로그램인 #XML Similarity Calculation# 를 이용하여 제시한 방법이 타당하다는 것을 증명하게 된다. 또한 주어진 예시자료를 가지고 이 프로그램의 성능평가를 통해 정확성과 효율성을 평가하고 앞으로의 연구방향을 제시한다.

  • PDF

충돌 정보와 m-bit인식을 이용한 적응형 RFID 충돌 방지 기법 (Adaptive RFID anti-collision scheme using collision information and m-bit identification)

  • 이제율;신종민;양동민
    • 인터넷정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.1-10
    • /
    • 2013
  • RFID(Radio Frequency Identification)시스템은 하나의 RFDI리더, 다수의 RFID태그 장치들로 이루어진 비접촉방식의 근거리 무선 인식 기술이다. RFID태그는 자체적인 연산 수행이 가능한 능동형 태그와 이에 비해 성능은 떨어지지만 저렴한 가격으로 물류 유통에 적합한 수동형 태그로 나눌 수 있다. 데이터 처리 장치는 리더와 연결되어 리더가 전송받은 정보를 처리한다. RFID 시스템은 무선주파수를 이용해 다수의 태그를 빠른 시간에 인식할 수 있다. RFID시스템은 유통, 물류, 운송, 물품관리, 출입 통제, 금융 등 다양한 분야에서 응용되고 있다. 하지만 RFID시스템을 더욱 확산시키기 위해서는 가격, 크기, 전력소모, 보안 등 해결할 문제가 많다. 그 문제들 중에서 본 논문에서는 다수의 수동형 태그를 인식할 때 발생하는 충돌 문제를 해결하기 위한 알고리즘을 제안한다. RFID 시스템에서 다수의 태그를 인식하기 위한 충돌 방지 기법에는 확률적인 방식과 결정적인 방식 그리고 이를 혼합한 하이브리드 방식이 있다. 본 논문에서는 우선 기존에 있던 확률적 방식의 충돌방지기법인 알로하 기반 프로토콜과 결정적 방식의 충돌방지기법인 트리 기반 프로토콜에 대해 소개한다. 알로하 기반 프로토콜은 시간을 슬롯 단위로 나누고 태그들이 각자 임의로 슬롯을 선택하여 자신의 ID를 전송하는 방식이다. 하지만 알로하 기반 프로토콜은 태그가 슬롯을 선택하는 것이 확률적이기 때문에 모든 태그를 인식하는 것을 보장하지 못한다. 반면, 트리 기반의 프로토콜은 리더의 전송 범위 내에 있는 모든 태그를 인식하는 것을 보장한다. 트리 기반의 프로토콜은 리더가 태그에게 질의 하면 태그가 리더에게 응답하는 방식으로 태그를 인식한다. 리더가 질의 할 때, 두 개 이상의 태그가 응답 한다면 충돌이라고 한다. 충돌이 발생하면 리더는 새로운 질의를 만들어 태그에게 전송한다. 즉, 충돌이 자주 발생하면 새로운 질의를 자주 생성해야하기 때문에 속도가 저하된다. 그렇기 때문에 다수의 태그를 빠르게 인식하기 위해서는 충돌을 줄일 수 있는 효율적인 알고리즘이 필요하다. 모든 RFID태그는 96비트의 EPC(Electronic Product Code)의 태그ID를 가진다. 이렇게 제작된 다수의 태그들은 회사 또는 제조업체에 따라 동일한 프리픽스를 가진 유사한 태그ID를 가지게 된다. 이 경우 쿼리 트리 프로토콜을 이용하여 다수의 태그를 인식 하는 경우 충돌이 자주 일어나게 된다. 그 결과 질의-응답 수는 증가하고 유휴 노드가 발생하여 식별 효율 및 속도에 큰 영향을 미치게 된다. 이 문제를 해결하기 위해 충돌 트리 프로토콜과 M-ary 쿼리 트리 프로토콜이 제안되었다. 하지만 충돌 트리 프로토콜은 쿼리 트리 프로토콜과 마찬가지로 한번에 1비트씩 밖에 인식을 못한다는 단점이 있다. 그리고 유사한 태그ID들이 다수 존재할 경우, M-ary 쿼리 트리 프로토콜을 이용해 인식 하면, 불필요한 질의-응답이 증가한다. 본 논문에서는 이러한 문제를 해결하고자 M-ary 쿼리 트리 프로토콜의 매핑 함수를 이용한 m-비트 인식, 맨체스터 코딩을 이용한 태그 ID의 충돌정보, M-ary 쿼리 트리의 깊이를 하나 감소시킬 수 있는 예측 기법을 이용하여 성능을 향상시킨 적응형 M-ary 쿼리트리 프로토콜을 제안한다. 본 논문에서는 기존의 트리기반의 프로토콜과 제안하는 기법을 동일한 조건으로 실험하여 비교 분석 하였다. 그 결과 제안하는 기법은 식별시간, 식별효율 등에서 다른 기법들보다 성능이 우수하다.

능동형 RFID 시스템의 성능 향상을 위한 연구 (Study on the Performance Improvement of Active RFID System)

  • 김지태;김진성;이강원
    • 한국통신학회논문지
    • /
    • 제40권5호
    • /
    • pp.871-885
    • /
    • 2015
  • 본 연구에서는 우선 고속으로 태그 수집을 위한 2.4 GHz 능동형 RFID 시스템의 시뮬레이션 모델을 구축 하였다. 그리고 단순화 된 Collection 명령과 Ack 절차, 슬롯의 충돌 확률(k1)과 충돌이 발생한 슬롯의 평균 태그 수($k_2$)를 이용하여 태그수를 예측하는 새로운 방법을 제안하였다. 이들에 따른 능동형 RFID 시스템의 성능 추적을 구축한 시뮬레이션 모델을 통해 획득하였다. Query 명령을 사용하여 Collection 명령과 Ack를 간소화하고 $k_1$$k_2$를 이용하여 태그수를 예측하는 방법의 조합이 모든 성능 면에서 가장 우수한 것으로 나타났다. 이는 Query 명령을 이용한 Collection 명령과 Ack의 간소화는 태그 인식 속도를 줄이는데 기여했고 $k_1$$k_2$를 이용하여 태그수를 예측하는 방법은 Throughput을 향상시킬 뿐만 아니라 이로 인해 Collection 라운드 횟수를 줄여 태그 인식 속도를 줄일 수 있었다. 본 연구에서 제안한 방법은 Throughput, 평균 인식 시간, 1초 안의 평균 인식률 모두에서 이상적인 경우의 성능값과 매우 유사하게 나타나 제안한 방법의 유효성을 확인 할 수 있었다.

HTML 태그 순서를 이용한 불법 사이트 탐지 자동화 기술 (An Automated Technique for Illegal Site Detection using the Sequence of HTML Tags)

  • 이기룡;이희조
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1173-1178
    • /
    • 2016
  • 2001년 비트토렌트 프로토콜이 설계된 후로 음악, 영화, 소프트웨어 등 모든 것을 다운로드할 수 있게 되었다. 이를 통해 저작권이 있는 파일이 무분별하게 공유가 되었고 저작권자들은 많은 피해를 입었다. 이 문제를 해결하기 위해 국가에서는 관련법을 제정하였고 ISP는 불법 사이트를 차단하였다. 이러한 노력들에도 불구하고 pirate bay와 같은 불법 사이트들은 도메인을 바꾸는 등 쉽게 사이트를 재오픈하고 있다. 이에 우리는 재오픈된 불법 사이트를 쉽게 탐지하는 기술을 제안한다. 이 자동화 기술은 구글 검색엔진을 이용하여 도메인을 수집하고, 최장공통부분수열(LCS) 알고리즘을 이용하여 기존 웹페이지 태그와 검색된 웹페이지 태그를 비교, 유사도를 측정한다. 실험을 위해 총 2,383개의 검색 결과를 구글 검색으로 얻었다. LCS 유사도 알고리즘을 적용하여 검사한 결과 44개의 해적 사이트를 탐지하였다. 또한 해외 불법 사이트에 적용한 결과 805개 검색 도메인에서 23개의 불법 사이트를 탐지하였다. 이를 통해 제안된 탐지 자동화 기술을 사용한다면 불법 사이트가 재 오픈을 하더라도 쉽게 탐지할 것으로 보인다.

얼굴 인식과 RFID를 이용한 실시간 인증 시스템 (The Authentication System in Real-Time using Face Recognition and RFID)

  • 지정규
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.263-272
    • /
    • 2008
  • 본 논문은 RFID 보안 시스템에서 2단계 인증 과정을 통하여 RFID시스템의 안정성을 높이는 방법을 제안한다. 제안하는 시스템은 RFID 태그 인증 후 추가적으로 사용자를 인증하기 위하여 카메라를 통하여 입력된 사용자의 이미지 정보에서 특징을 추출 한다. 출입구에서 인증을 위해 먼저 RFID태그를 사용하여 인증하고, 다음으로 카메라를 통하여 획득한 사용자 이미지로부터 특징 정보를 추출하여 시스템에 등록된 사용자 정보와 유사도 비교를 통하여 최종 인증하는 시스템을 제안한다. RFID 시스템에서 사용하는 태그는 2.450Hz 대역의 다양한 주파수를 발진하는 능동형 태그를 사용한다. 또한 사용자 이미지의 특징 정보는 윤곽선 정보와 색상 특징 정보를 이용하여 시스템에 등록된 정보와 일치 하는지 유사도를 비교하여 인증할 수 있도록 하였다.

  • PDF