• 제목/요약/키워드: 태그 기반 정보검색

검색결과 137건 처리시간 0.034초

의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계 (LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services)

  • 김준겸;서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • 현재 다양한 검색엔진들이 사용되고 있다. 검색엔진은 메타태그 정보를 기본으로 크롤링, 색인생성, 검색 결과 출력의 3단계를 거치며, 사용자가 원하는 자료의 검색을 도와준다. 그러나 키워드를 기반으로 검색해서 얻은 방대한 문서가 관련이 없거나 적은 문서일 경우도 많다. 이러한 문제점 때문에 검색 결과에서 내용을 파악하여 정확도를 분류를 해야 하는 번거로운 일이 발생하게 된다. 다양한 검색엔진을 통해 추출된 결과의 경우 검색엔진의 인덱스는 주기적으로 업데이트 되지만 가중치에 대한 기준과 업데이트 주기는 검색엔진마다 다르고 검색 순위 산정 기준이 서로 다르기 때문에 동일한 키워드를 검색어로 입력하고도 서로 다른 검색 순위를 보여주는 단점을 가지고 있다 따라서 본 논문에서는 기존 검색엔진 대신 사용자가 입력한 키워드와 문서의 연관성을 추출하여 사용자가 찾고자 하는 키워드를 입력했을 때 키워드와 문서의 연관성을 향상 시킬 수 있는 LSTM모델을 설계하고자 한다.

  • PDF

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

통계와 규칙을 이용한 강인한 품사 태거 (Robust Part-of-Speech Tagger using Statistical and Rule-based Approach)

  • 심준혁;김준석;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.60-75
    • /
    • 1999
  • 품사 태깅은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 부분인 구문 분석, 의미 분석의 전처리로 사용되고, 독립된 응용으로 언어의 정보를 추출하거나 정보 검색 등의 응용에 사용되어 진다. 품사 태깅은 크게 통계에 기반한 방법, 규칙에 기반한 방법, 이 둘을 모두 이용하는 혼합형 방법 등으로 나누어 연구되고 있다. 포항공대 자연언어처리 연구실의 자연 언어 처리 엔진(SKOPE)의 품사 태깅 시스템 POSTAG는 미등록어 추정이 강화된 혼합형 품사 태깅 시스템이다 본 시스템은 형태소 분석기, 통계적 품사 태거, 에러 수정 규칙 후처리기로 구성되어 있다. 이들은 각각 단순히 직렬 연결되어 있는 것이 아니라 형태소 접속 테이블을 기준으로 분석 과정에서 형태소 접속 그래프를 생성하고 처리하면서 상호 밀접한 연관을 가진다. 그리고, 미등록어용 패턴사전에 의해 등록어와 동일한 방법으로 미등록어를 처리함으로써 효율적이고 강건한 품사 태깅을 한다. 한편, POSTAG에서 사용되는 태그세트와 한국전자통신연구원(ETRI)의 표준 태그세트 간에 양방향으로 태그세트 매핑을 함으로써, 표준 태그세트로 태깅된 코퍼스로부터 POSTAC를 위한 대용량 학습자료를 얻고 POSTAG에서 두 가지 태그세트로 품사 태깅 결과 출력이 가능하다. 본 시스템은 MATEC '99'에서 제공된 30000어절에 대하여 표준 태그세트로 출력한 결과 95%의 형태소단위 정확률을 보였으며, 태그세트 매핑을 제외한 POSTAG의 품사 태깅 결과 97%의 정확률을 보였다.

  • PDF

콘텐츠 정보의 연관성을 고려한 Ajax기반의 깊이 검색 시스템 구현 (The implementation of the depth search system for relations of contents information based on Ajax)

  • 김운용;박석규
    • 한국항행학회논문지
    • /
    • 제12권5호
    • /
    • pp.516-523
    • /
    • 2008
  • 최근 웹은 집단지성을 근간으로 참여형 구조를 형성하고 이를 바탕으로 빠르게 성장하고 있다. 이 환경에서 사용자에 의해 생성된 콘텐츠는 정보의 주류를 형성하고 있으며 이들의 효율적인 검색기법이 요구된다. 현재 콘텐츠의 검색은 주로 키워드용 기반으로 운영 되고 있으며, 언어의 유사성과 관계를 고려한 시맨틱 웹(Semantic web)에 대한 연구나 웹2.0환경의 사용자 태그 활용에 대한 연구가 활발히 진행되고 있다. 일반적으로 참여형 구조의 웹 환경은 사용자에 의해 생성된 대량의 콘텐츠와 다양한 형태 및 분류 구조를 가진다. 그 결과 이들의 효율적인 분류와 검색 기법이 요구된다. 이에 본 논문에서는 콘텐츠 검색을 위한 태그들 간의 연관성을 고려한 깊이 검색 시스템을 제시한다. 이를 통해 불필요한 콘텐츠 검색을 줄이고 집단에 포함된 제시어 서비스를 통해 콘텐츠 검색의 효율성을 증가시킬 수 있을 것이다.

  • PDF

과학기술정보 개인화 서비스 설계 및 구현 (A Study on Design and Implement of S&T Information Personalization Service)

  • 한희준;최성필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.206-207
    • /
    • 2018
  • 방대한 정보를 사용자에게 제공하기 위해 검색 엔진은 다양한 알고리즘을 통해 사용자마다의 최적화된 정보를 구성한다. 과제, 논문, 특허, 연구보고서 등 과학기술정보를 서비스 하는 주체 역시 나름의 검색 알고리즘으로 정보를 제공하지만, 질의어와 문서간의 적합도만을 측정하여 검색 결과를 제시할 뿐 사용자의 관심 분야나 요구를 반영하지 않고 있다. 특히 관심 분야에 적합한 과학기술정보를 사용자가 접근하기 쉽게 제공하는 것은 매우 중요하다. 본 논문에서는 사용자 관심분야를 서비스 이용행태로부터 결정하여 이를 과학기술정보 개인화에 반영하는 서비스에 대해 제안하였다. 이를 위해 실시간 관심분야 추적, 관심 태그 클라우드 제공, 관심분야 기반 추천정보 제공, 검색 결과 개인화 네 가지 기능으로 구성된 과학기술정보 개인화 서비스를 설계하고 구현하였다.

소셜 이미지 데이터베이스를 이용한 온툴로지 기반 대화형 이미지 어노테이션 시스템의 설계 (Design of Ontology-based Interactive Image Annotation System using Social Image Database)

  • 정진우;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.300-303
    • /
    • 2011
  • 이미지 어노테이션 기법은 효과적인 이마지 공유 및 검색을 위하여 활발하게 연구되고 있는 연구분야 중 하나로서, 최근에는 사용자들에 의하여 제작되는 방대한 양의 이미지 데이터 및 태그 정보를 제공하는 Flick와 같은 소셜 이마지 데이터베이스를 활용함으로써 이미지 어노테이션 및 이미지 검색을 효과적으로 수행하고자 하는 다양한 연구들이 시도되고 있다. 본 논문에서는 이미지 지식정보의 관리 및 공유를 위한 온톨로지와 소셜 이마지 데이터베이스를 활용하여 이미지 어노테이션을 수행하기 위한 시스템을 제안한다. 본 논문에서 제안하는 시스템은 소셜 이미지 데이터베이스를 활용하여 의미 있는 개념들을 이미지 어노테이션에 활용하며, 지식 관리 체계인 온툴로지를 이용하여 이미지 데이터베이스 내의 이미지 및 개념간에 존재하는 의미적 관련성을 기반으로 보다 효율적인 이미지 검색을 수행하고자 한다.

블로그의 구조적 특성을 고려한 효율적인 블로그 검색 알고리즘 (The Effective Blog Search Algorithm based on the Structural Features in the Blogspace)

  • 김정훈;윤태복;이지형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권7호
    • /
    • pp.580-589
    • /
    • 2009
  • 오늘날, 대부분의 웹 페이지는 블로그영역에서 생성되고 기존의 웹 페이지 또한 블로그영역으로 전환되어가고 있다. 블로그 페이지는 트랙백연결, 블로거, 태그, 댓글과 같은 기폰 웹 페이지에는 존재 하지 않는 특징이 있다. 따라서 이러한 차이를 반영하지 않는 전통적인 웹 페이지 랭킹 알고리즘을 블로그 페이지에 단순히 적용하는 것은 효율적인 검색을 위해 적절하지 않다. 본 논문에서는 이러한 문제를 해결하기 위해 블로그 검색을 위한 "블로그-랭크" 알고리즘을 제안한다. 제안하는 알고리즘은 블로그의 구조적특징들을 활용하여 트랙백 연결성, 블로거의 명성, 사용자 반응성을 평가하고 이를 기반으로 블로그 페이지를 랭크 한다. 우리는 알고리즘의 검색효율성을 증명하기 위해 제안한 알고리즘을 적용한 블로그 검색 시스템을 구현하고 기존의 블로그 검색시스템과 검색효율성을 비교하였으며, 그 결과 블로그 랭크 알고리즘을 적용한 검색시스템이 기존의 검색시스템보다 더욱 뛰어난 검색효율성을 보임을 확인하였다.

RFID 태그의 색인을 위한 위치 식별자 재순서 기법 (Reordering Scheme of Location Identifiers for Indexing RFID Tags)

  • 안성우;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권3호
    • /
    • pp.198-214
    • /
    • 2009
  • RFID 태그의 시공간 이력정보는 리더에 의해 수집된 선분인 태그간격으로 모델링될 수 있으며, 태그 식별자(TID), 위치 식별자(LID), 시간(TIME)을 축으로 하는 3차원 도메인에서 색인될 수 있다. 도메인 공간에서 태그간격의 분포는 태그 위치추적 질의의 성능을 결정짓는 주요 요소이며 이는 각 도메인 좌표의 정렬에 따라 달라진다. 특히, 시간에 따라 변경되는 태그의 위치 이력을 검색하는 태그 위치추적 질의는 위치정보를 제공하는 LID가 도메인에서 정렬되는 순서에 따라 성능이 달라진다. 따라서, 색인에 저장된 태그간격의 검색 성능 향상을 위해서는 최적의 LID 순서를 결정하는 것이 필요하다. 이를 위하여 이 논문에서는 LID 간의 새로운 순서화 기준으로써 적용하기 위한 LID 근접성을 정의하고, 질의 시 함께 접근되는 태그간격을 색인에서 근접 저장하기 위한 LID 근접성 함수를 제안한다. 또한, 이를 기반으로 이미 부여된 LID의 재순서 기법을 제안한다. 성능 평가 결과 이 논문에서 제안한 LID 재순서 기법을 색인에 적용했을 때 기존의 LID 부여방식보다 월등한 질의 성능 향상을 보여주고 있다.

위치 인식 기반 태깅 기술을 이용한 모바일 버스 안내 시스템 설계 및 구현 (Design and Implementation of Location-Aware Smart Bus Guide System using Social Tagging)

  • 신현정;윤혜진;창병모
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 춘계학술대회
    • /
    • pp.483-486
    • /
    • 2009
  • 본 연구의 목적은 사용자에 의한 정보를 이용하여 버스 정보 안내를 효율적으로 하는 시스템을 개발하는 것이다. 본 연구에서는 이를 위해 PDA를 사용하여 태깅 기술을 이용한 모바일 버스 안내 시스템을 개발하였다. 이 시스템은 관광객들에게 현재 위치를 기반으로 하여 버스 정류장을 안내하고 해당 정류장에 사용자 생산 정보를 태그로 등록하며, 등록된 정보를 이용하여 사용자에게 목적지까지의 경로를 안내한다. 사업자의 자세한 정보 등록이 가능하며, 사용자에게는 등록 정보 검색 시 간단한 키워드 만으로 해당 목적지에 대한 정보 안내 및 경로를 검색할 수 있도록 한다.

  • PDF

NFC 태그를 이용한 Wi-Fi 접속 기반 모바일 프린팅 시스템 (A Mobile Printing System based on Wi-Fi for Smartphones using NFC Tag)

  • 송창우;김은주;김선정;송창근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1315-1317
    • /
    • 2012
  • 스마트폰의 빠른 보급과 Wi-Fi 의 대중화로 모바일을 이용한 응용 컨텐츠 개발이 활발하게 진행되고 있다. 본 논문은 공공 장소에서 사용할 수 있는 컨텐츠 기술로 모바일 프린팅 시스템을 개발하였다. 모바일 프린팅 시스템은 NFC 태그가 장착된 시스템으로 Wi-Fi 접속이 가능한 공공의 장소에서 무선 공용 프린터를 바로 이용할 수 있고, Wi-Fi 검색 시간과 비밀번호 입력 단계를 생략하여 태그에 모바일 기기를 접촉하는 것만으로 접속 문제를 해결할 수 있다.