• Title/Summary/Keyword: 태그 기반 정보검색

Search Result 136, Processing Time 0.033 seconds

LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services (의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계)

  • Kim, June-gyeom;Seo, Jin-beom;Cho, Young-bok
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.75-77
    • /
    • 2021
  • A variety of search engines are currently in use. The search engine supports the retrieval of data required by users through three stages: crawling, index generation, and output of search results based on meta-tag information. However, a large number of documents obtained by searching for keywords are often unrelated or scarce. Because of these problems, it takes time and effort to grasp the content from the search results and classify the accuracy. The index of search engines is updated periodically, but the criteria for weighted values and update periods are different from one search engine to another. Therefore, this paper uses the LSTM model, which extracts the relationship between keywords entered by the user and documents instead of the existing search engine, and improves the relationship between keywords and documents by entering keywords that the user wants to find.

  • PDF

Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship (의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법)

  • Lee Dongjoo;Lee Taehee;Lee Sang-goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

Robust Part-of-Speech Tagger using Statistical and Rule-based Approach (통계와 규칙을 이용한 강인한 품사 태거)

  • Shim, Jun-Hyuk;Kim, Jun-Seok;Cha, Jong-Won;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.60-75
    • /
    • 1999
  • 품사 태깅은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 부분인 구문 분석, 의미 분석의 전처리로 사용되고, 독립된 응용으로 언어의 정보를 추출하거나 정보 검색 등의 응용에 사용되어 진다. 품사 태깅은 크게 통계에 기반한 방법, 규칙에 기반한 방법, 이 둘을 모두 이용하는 혼합형 방법 등으로 나누어 연구되고 있다. 포항공대 자연언어처리 연구실의 자연 언어 처리 엔진(SKOPE)의 품사 태깅 시스템 POSTAG는 미등록어 추정이 강화된 혼합형 품사 태깅 시스템이다 본 시스템은 형태소 분석기, 통계적 품사 태거, 에러 수정 규칙 후처리기로 구성되어 있다. 이들은 각각 단순히 직렬 연결되어 있는 것이 아니라 형태소 접속 테이블을 기준으로 분석 과정에서 형태소 접속 그래프를 생성하고 처리하면서 상호 밀접한 연관을 가진다. 그리고, 미등록어용 패턴사전에 의해 등록어와 동일한 방법으로 미등록어를 처리함으로써 효율적이고 강건한 품사 태깅을 한다. 한편, POSTAG에서 사용되는 태그세트와 한국전자통신연구원(ETRI)의 표준 태그세트 간에 양방향으로 태그세트 매핑을 함으로써, 표준 태그세트로 태깅된 코퍼스로부터 POSTAC를 위한 대용량 학습자료를 얻고 POSTAG에서 두 가지 태그세트로 품사 태깅 결과 출력이 가능하다. 본 시스템은 MATEC '99'에서 제공된 30000어절에 대하여 표준 태그세트로 출력한 결과 95%의 형태소단위 정확률을 보였으며, 태그세트 매핑을 제외한 POSTAG의 품사 태깅 결과 97%의 정확률을 보였다.

  • PDF

The implementation of the depth search system for relations of contents information based on Ajax (콘텐츠 정보의 연관성을 고려한 Ajax기반의 깊이 검색 시스템 구현)

  • Kim, Woon-Yong;Park, Seok-Gyu
    • Journal of Advanced Navigation Technology
    • /
    • v.12 no.5
    • /
    • pp.516-523
    • /
    • 2008
  • Recently, the Web has been constructed based on collective intel1igence and growing up quickly. User created contents have been made the mainstream in this environments. So it's required to make an efficient technique of searching for the contents. The current searching technique mainly is achieved by key words. Semantic Web based on similarity and relationship of a language and using user tags in web2.0 also have been researched with activity. Generally, the web of the participation architecture has a lot of user created contents, various forms and classification. Therefore, it is necessary to classify and to efficiently search for a lot of user created contents. In this paper, we propose a depth searching technique considering the relationship among the tags that descript user contents. It is expected that the proposed depth searching techniques can reduce the time taken to search for the unwanted contents and the increase the efficiency of the contents searching using a service of suggestion words in tags groups.

  • PDF

A Study on Design and Implement of S&T Information Personalization Service (과학기술정보 개인화 서비스 설계 및 구현)

  • Han, Heejun;Choi, Sungpil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.206-207
    • /
    • 2018
  • 방대한 정보를 사용자에게 제공하기 위해 검색 엔진은 다양한 알고리즘을 통해 사용자마다의 최적화된 정보를 구성한다. 과제, 논문, 특허, 연구보고서 등 과학기술정보를 서비스 하는 주체 역시 나름의 검색 알고리즘으로 정보를 제공하지만, 질의어와 문서간의 적합도만을 측정하여 검색 결과를 제시할 뿐 사용자의 관심 분야나 요구를 반영하지 않고 있다. 특히 관심 분야에 적합한 과학기술정보를 사용자가 접근하기 쉽게 제공하는 것은 매우 중요하다. 본 논문에서는 사용자 관심분야를 서비스 이용행태로부터 결정하여 이를 과학기술정보 개인화에 반영하는 서비스에 대해 제안하였다. 이를 위해 실시간 관심분야 추적, 관심 태그 클라우드 제공, 관심분야 기반 추천정보 제공, 검색 결과 개인화 네 가지 기능으로 구성된 과학기술정보 개인화 서비스를 설계하고 구현하였다.

Design of Ontology-based Interactive Image Annotation System using Social Image Database (소셜 이미지 데이터베이스를 이용한 온툴로지 기반 대화형 이미지 어노테이션 시스템의 설계)

  • Jeong, Jin-Woo;Lee, Dong-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.300-303
    • /
    • 2011
  • 이미지 어노테이션 기법은 효과적인 이마지 공유 및 검색을 위하여 활발하게 연구되고 있는 연구분야 중 하나로서, 최근에는 사용자들에 의하여 제작되는 방대한 양의 이미지 데이터 및 태그 정보를 제공하는 Flick와 같은 소셜 이마지 데이터베이스를 활용함으로써 이미지 어노테이션 및 이미지 검색을 효과적으로 수행하고자 하는 다양한 연구들이 시도되고 있다. 본 논문에서는 이미지 지식정보의 관리 및 공유를 위한 온톨로지와 소셜 이마지 데이터베이스를 활용하여 이미지 어노테이션을 수행하기 위한 시스템을 제안한다. 본 논문에서 제안하는 시스템은 소셜 이미지 데이터베이스를 활용하여 의미 있는 개념들을 이미지 어노테이션에 활용하며, 지식 관리 체계인 온툴로지를 이용하여 이미지 데이터베이스 내의 이미지 및 개념간에 존재하는 의미적 관련성을 기반으로 보다 효율적인 이미지 검색을 수행하고자 한다.

The Effective Blog Search Algorithm based on the Structural Features in the Blogspace (블로그의 구조적 특성을 고려한 효율적인 블로그 검색 알고리즘)

  • Kim, Jung-Hoon;Yoon, Tae-Bok;Lee, Jee-Hyong
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.7
    • /
    • pp.580-589
    • /
    • 2009
  • Today, most web pages are being created in the blogspace or evolving into the blogspace. A blog entry (blog page) includes non-traditional features of Web pages, such as trackback links, bloggers' authority, tags, and comments. Thus, the traditional rank algorithms are not proper to evaluate blog entries because those algorithms do not consider the blog specific features. In this paper, a new algorithm called "Blog-Rank" is proposed. This algorithm ranks blog entries by calculating bloggers' reputation scores, trackback scores, and comment scores based on the features of the blog entries. This algorithm is also applied to searching for information related to the users' queries in the blogspace. The experiment shows that it finds the much more relevant information than the traditional ranking algorithms.

Reordering Scheme of Location Identifiers for Indexing RFID Tags (RFID 태그의 색인을 위한 위치 식별자 재순서 기법)

  • Ahn, Sung-Woo;Hong, Bong-Hee
    • Journal of KIISE:Databases
    • /
    • v.36 no.3
    • /
    • pp.198-214
    • /
    • 2009
  • Trajectories of RFID tags can be modeled as a line, denoted by tag interval, captured by an RFID reader and indexed in a three-dimensional domain, with the axes being the tag identifier (TID), the location identifier (LID), and the time (TIME). Distribution of tag intervals in the domain space is an important factor for efficient processing of a query for tracing tags and is changed according to arranging coordinates of each domain. Particularly, the arrangement of LIDs in the domain has an effect on the performance of queries retrieving the traces of tags as times goes by because it provides the location information of tags. Therefore, it is necessary to determine the optimal ordering of LIDs in order to perform queries efficiently for retrieving tag intervals from the index. To do this, we propose LID proximity for reordering previously assigned LIDs to new LIDs and define the LID proximity function for storing tag intervals accessed together closely in index nodes when a query is processed. To determine the sequence of LIDs in the domain, we also propose a reordering scheme of LIDs based on LID proximity. Our experiments show that the proposed reordering scheme considerably improves the performance of Queries for tracing tag locations comparing with the previous method of assigning LIDs.

Design and Implementation of Location-Aware Smart Bus Guide System using Social Tagging (위치 인식 기반 태깅 기술을 이용한 모바일 버스 안내 시스템 설계 및 구현)

  • Shin, Hyun-Jeong;Yun, Hye-Jin;Chang, Byung-Mo
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.05a
    • /
    • pp.483-486
    • /
    • 2009
  • 본 연구의 목적은 사용자에 의한 정보를 이용하여 버스 정보 안내를 효율적으로 하는 시스템을 개발하는 것이다. 본 연구에서는 이를 위해 PDA를 사용하여 태깅 기술을 이용한 모바일 버스 안내 시스템을 개발하였다. 이 시스템은 관광객들에게 현재 위치를 기반으로 하여 버스 정류장을 안내하고 해당 정류장에 사용자 생산 정보를 태그로 등록하며, 등록된 정보를 이용하여 사용자에게 목적지까지의 경로를 안내한다. 사업자의 자세한 정보 등록이 가능하며, 사용자에게는 등록 정보 검색 시 간단한 키워드 만으로 해당 목적지에 대한 정보 안내 및 경로를 검색할 수 있도록 한다.

  • PDF

A Mobile Printing System based on Wi-Fi for Smartphones using NFC Tag (NFC 태그를 이용한 Wi-Fi 접속 기반 모바일 프린팅 시스템)

  • Song, Chang-Woo;Kim, Eun-Ju;Kim, Sun-Jeong;Song, Chang-Geun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1315-1317
    • /
    • 2012
  • 스마트폰의 빠른 보급과 Wi-Fi 의 대중화로 모바일을 이용한 응용 컨텐츠 개발이 활발하게 진행되고 있다. 본 논문은 공공 장소에서 사용할 수 있는 컨텐츠 기술로 모바일 프린팅 시스템을 개발하였다. 모바일 프린팅 시스템은 NFC 태그가 장착된 시스템으로 Wi-Fi 접속이 가능한 공공의 장소에서 무선 공용 프린터를 바로 이용할 수 있고, Wi-Fi 검색 시간과 비밀번호 입력 단계를 생략하여 태그에 모바일 기기를 접촉하는 것만으로 접속 문제를 해결할 수 있다.