• 제목/요약/키워드: 유사 키워드

검색결과 311건 처리시간 0.037초

조세심판 문서 검색 효율 향상 모델에 관한 연구 (A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment)

  • 이후영;박구락;김동현
    • 한국융합학회논문지
    • /
    • 제10권6호
    • /
    • pp.41-47
    • /
    • 2019
  • 조세 심판에 대한 선결정례는 법원 판례의 경우 유사 심판례를 검색하여 파악하는 것이 매우 중요한 상황이다. 그러나 기존 심판문에 대한 검색은 사용자가 입력하는 키워드를 통하여 검색하는 방법을 사용하고 있으나, 정확한 키워드의 입력이 필요하며, 키워드를 모르는 경우 필요한 문서를 검색하는 것은 불가능하다. 또한 검색된 문서 중에는 내용이 다른 경우도 발생한다. 이에 본 논문에서는 정확한 심판례의 검색을 위하여 문서를 3차원 공간에 벡터화하고, 코사인 유사도를 계산하여, 거리상 가까운 문서를 검색하는 방법의 효율성을 향상시키기 위하여 심판례에서 사용되고 있는 단어들의 유사도를 분석한 후, 최빈값을 추출하여 본문의 텍스트에 삽입하는 방법으로 검색하고자 하는 문서의 코사인 유사도를 향상시키는 방안을 제안한다. 제안 모델을 통하여 조세와 관련된 심판례를 검색하고자 하는 사용자에게 신속하고, 정확한 검색을 제공할 수 있을 것으로 기대된다.

토픽 기반의 트윗 분류를 위한 해시태그 분석 기법 (Hashtag Analysis Scheme for Topic based Tweet Categorization)

  • 김용성;전상훈;유제혁;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.737-740
    • /
    • 2014
  • 최근 SNS 사용자가 급증하면서 매우 다양하고 방대한 양의 글이 여러 종류의 SNS를 통해 생성되고 있다. 그중 트위터는 정보의 전달 및 확산에 상당히 유용한 도구로 사용되고 있다. 이러한 트위터의 사용자 트윗은 뉴스, 음악, 사진, 여행 등 다양한 형태로 등장한다. 또한 트위터는 해시태그라는 사용자 정의 태그를 사용하는데 이는 트윗의 키워드 및 핵심을 쉽게 표현할 수 있도록 해주는 효과적인 수단이다. 최근 상당히 많은 양의 트윗의 생성에도 불구하고 이를 다양한 카테고리별로 분류할 수 있는 연구가 많이 진행되지 않았다. 따라서 본 논문에서는 해시태그를 이용해 트윗의 핵심을 파악하고 수많은 트윗을 다양한 토픽별로 분류할 수 있는 기법을 제안한다. 우선 다양한 카테고리의 인기 해시태그가 포함된 트윗을 수집하고 수집한 트윗에서 해시태그별 키워드를 추출한다. 그리고 코사인 유사도를 통해 해시태그별 내용 유사도를 파악하여 각 카테고리 내의 해시태그가 얼마나 유사한 내용을 지니고 있는지 파악한다. 마지막으로 사용자 트윗이 입력되면 모든 카테고리와 유사도를 비교하여 가장 유사도가 높은 카테고리를 찾아 추천해준다. 제안된 기법을 바탕으로 프로토타입을 구현하고 실험을 통해 성능을 평가한다.

국내외 문헌정보학 저널의 키워드 비교 분석 (A Comparative Analysis on Keywords of International and Korean Journals in Library and Information Science)

  • Kim, Eungi
    • 한국도서관정보학회지
    • /
    • 제48권1호
    • /
    • pp.207-225
    • /
    • 2017
  • 본 연구의 목적은 키워드 특징 면에서 문헌정보 저널에서 나타나는 유사점과 차이점을 조사하여 다양한 문헌 정보학 연구 영역을 발견하는 데 있다. 이 연구를 수행하기 위해 2004 년부터 2016 년까지 네 개의 한국 저널의 키워드가 RISS 데이타베이스에서 수집 되었고(http://www.riss.co.kr) 그리고 여섯 개의 국제저널의 키워드가 SCOPUS 데이타베이스에서 수집 되었다(http://www.scopus.com). 키워드의 특징은 한국 및 국제저널에 관하여서 자주 사용 되었던 키워드와 자주 사용되었던 독특한 키워드를 검증하는 연구이었다. 독특한 키워드란 한 분야에서는 나타나지만 다른 분야에서는 나타나지 않는 키워드를 말한다. 이 연구의 결과는 다음과 같다. 가) 키워드 빈도 분석 결과는 한국의 문헌정보 학의 연구주제와 연구특색을 보여 주는 것으로 나타났다. 나) 일반적으로 한국 저널에서 사용 된 키워드는 도서관과 관련된 주제의 영역을 나타냈고, 국제 저널에 사용되는 키워드는 서지 측정법과 관련된 주제 영역을 나타냈다. 다) 빈번히 사용되었던 독특한 키워드에서도 이러한 전반적인 연구 테마를 명백히 나타냈다. 라) 어떤 키워드는 쓰이는 범위가 한 국가나 지역으로 한정되어 있는 것으로 나타냈다. 이 연구의 중요한 시사점은 가장 자주 사용되는 키워드와 가장 자주 사용되는 독특한 키워드는 둘 다 문헌정보 학의 주제 영역을 적절하게 반영하고 있는 것으로 보인다는 것이다.

휴대전화를 위한 메뉴검색 지원도구의 사용성 평가 (Usability evaluation of navigation aid for searching menu items on mobile phone)

  • 박원규;한성호;채병기;차주형;김세나
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.169-174
    • /
    • 2006
  • 최근의 휴대전화는 음성 통화뿐만 아니라 메시지 및 이메일 송/수신, 사진/동영상 촬영 등 다양한 종류의 작업을 수행할 수 있으며, 그 기능이 점차 확장되고 있는 추세이다. 그러나 화면 공간의 제약으로 인한 메뉴 항목명의 축약, 메뉴 항목수의 증가, 메뉴 구조의 복잡화 등의 원인 때문에 많은 사용자들이 메뉴검색에 불편함을 겪고 있다. 이러한 문제점을 해결하기 위해, 본 연구에서는 기존의 메뉴 네비게이션을 통한 검색 방식, 하위 메뉴항목 제시 방식 이외에, 키워드 검색방식 및 유사 키워드 검색 방식을 개발하고 4가지 메뉴 검색방식의 사용성 평가실험을 수행하였다. 사용성 평가 실험 결과, 수행도 측면에서는 메뉴 검색 방식간의 차이가 유의하지 않았지만, 사용자 만족도 측면에서는 통계적으로 유의한 차이가 존재하였다. 4가지 메뉴 검색 방식 중 유사 키워드 방식은 사용자 만족도 측면에서 가장 선호되는 방식으로써, 추후 실제 휴대전화에 적용될 경우 사용자 만족도를 제고할 수 있을 것으로 기대된다.

  • PDF

키워드를 이용한 효율적인 웹서비스 및 openAPI 검색 엔진 개발 (Development of Efficient Search Engine for Web services and openAPIs by Keyword)

  • 천동석;차승준;김경옥;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.159-164
    • /
    • 2008
  • 최근 많이 주목을 받고 있는 웹 2.0은 사용자의 참여, 개방, 네트워크 효과에 기반하여 누구나 데이터를 생산하고 공유할 수 있는 사용자 중심의 인터넷 환경이다. openAPI는 웹 2.0의 근본 개념인 데이터의 개방 및 공유를 구현할 수 있는 핵심 기술로 포털은 자신의 서비스를 공개한다. 하지만 기존의 웹서비스와 openAPI 검색은 효율적인 검색 방법을 제공하지 않았다. 본 논문에서는 Lee[1]의 논문에서 제공하는 효율적인 웹서비스 검색 방법을 이용하여 검색 엔진을 개발하였다. 하지만 이 연구는 웹서비스와 유사한 구조를 가지는 openAPI를 수용하지 못한다. 따라서 본 논문에서는 openAPI의 정의 및 사용법이 웹서비스와 유사하다는 점을 활용하여 openAPI의 효과적인 검색을 위한 검색기법을 개발하였다. 이러한 검색기법은 사용자가 키워드를 입력하여 키워드 기반 검색을 통해 원하는 서비스를 찾아주고, 매쉬업 서비스나 다른 openAPI와의 조합(Composition)을 위해 템플릿 기반 검색을 통해 효과적인 검색을 제공해준다.

  • PDF

자막 분석을 통한 교육 영상의 카테고리 분류 방안 (Classification of Education Video by Subtitle Analysis)

  • 이지훈;이현섭;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.88-90
    • /
    • 2021
  • 본 논문은 교육 영상의 자막을 한글 형태소 분석기를 통해 추출하고 추출된 형태소 정보를 바탕으로 영상의 카테고리를 분류하는 방안에 대해 소개한다. 시스템에서 사람의 실수로 잘못된 정보가 입력되어 아이템의 특성으로 반영하게 될 경우 추천 시스템에서 정확도의 문제를 미치는 경우들이 있다. 이를 방지하기 위해 미리 분류된 영상에서 추출한 형태소 정보를 이용하여 각 카테고리에 해당하는 키워드 테이블을 생성하고, 각 카테고리 키워드 테이블과 영상의 형태소의 유사도를 비교하여 가장 유사도가 높은 키워드 테이블을 이용해 교육 영상의 카테고리를 분류한다. 이를 통해서 사람의 개입을 줄이고 시스템이 직접 영상을 분류하여 추천 시스템의 정확도를 높이는 것을 목표로 한다.

  • PDF

쉽고빠른인터넷세상여는 한글키워드 서비스

  • 김문영
    • 디지털콘텐츠
    • /
    • 11호통권150호
    • /
    • pp.42-46
    • /
    • 2005
  • ‘ www’는인터넷의상징과도같다. 지금처럼인터넷이폭넓게보급될수있었던이유중하나는어려운숫자도메인(IP Address)을간단한영문으로바꿔입력할수 있는시스템이등장했기때문이다. 이를기반으로몇몇얼리어댑터혹은전문가급유저만의전유물처럼여겨지던인터넷이대중화되기시작했다. 국내에서도이와 유사한움직임이나타나고있다. 영문에익숙하지않은어린이, 노인등의계층도쉽게인터넷을접하고이용할수있도록한글키워드서비스가시작된것. 한글키워 드서비스보급의선봉에우뚝선넷피아닷컴과디지털네임즈를분석했다.

  • PDF

NLM Medical Text Indexer를 활용한 우리나라 의학문헌의 MeSH Semi Indexing 방안 (MeSH Semi Indexing of the Korean Biomedical Literature, using NLM Medical Text Indexer)

  • 정소나;이춘실
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2010년도 제17회 학술대회 논문집
    • /
    • pp.21-28
    • /
    • 2010
  • 본 연구에서는 PubMed에 등재되었으나 Medical Subject Headings(MeSH)가 부여되지 않은 국내 의학학술지의 문헌을 대상으로 미국국립의학도서관 (NLM: National Library of Medicine)의 Medical Text Indexer(MTI)를 활용하여 MeSH 용어를 추천받은 후, PubMed 레코드의 유사주제문헌 (Relation Citations, PRC)에 부여된 MeSH와의 일치여부를 분석하였다. 또한 논문의 저자가 부여한 키워드(저자키워드)와 PRC MeSH의 일치여부도 비교하였다. PRC MeSH와 MTI MeSH 추천어의 일치율은 주표목이 21.1%였고, 체크태그는 18.1%, 부표목은 16.5%로 나타났다. 우리나라 의학논문에 나타난 저자키워드의 중요한 특징은 MeSH 주표목 위주이고, 체크태그와 부표목은 거의 사용하지 않는 것이다. 따라서 저자키워드와 PRC MeSH 주표목과의 일치율은 23.4%에 이르지만, 체크태그와 부표목의 일치율은 각각 1%, 2.1%였다. 색인전문가가 통제어휘를 사용하여 색인하는 과정에서 PRC와 MTI의 MeSH 주표목과 저자키워드가 일치하는 용어를 주표목으로 부여하고, PRC와 MTI가 추천하는 체크태그와 부표목을 활용하는 등 국내 의학문헌의 MeSH 용어 부여 작업을 반자동화(semi-indexing)하면, 정확하고 신속한 MeSH 부여 작업이 가능할 것이다.

  • PDF

온톨로지 기반의 계층적 개념 인덱싱을 이용한 사용자 관심사 학습 (Learning User Interest using Hierarchical Concept indexing based on Ontology)

  • 박지현;김흥남;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.646-648
    • /
    • 2005
  • 인터넷의 급속한 성장과 더불어 사용자들은 인터넷을 통해 많은 정보를 얻을 수 있게 되었으며 최신 뉴스를 실시간으로 접근할 수 있게 되었다. 이에 따라 방대한 정보 속에 사용자 관심사에 맞는 정보를 효과적으로 검색하기 위한 여러 방법들이 연구되어 왔다. 하지만 기존의 많은 선행 연구들은 단어 빈도 기반의 키워드 벡터 모델을 이용하여 사용자의 관심사를 학습하고 있다. 이러한 키워드 벡터 모델은 사용자의 선호도를 명확하게 기술하지 못하고 키워드를 이용한 특징 벡터 (feature-vector)는 개념들 사이의 관계를 찾기 어려운 한계를 가지고 있다. 이를 개선하기 위해 본 논문에선 계층적 개념 인덱싱(Hierarchical Concept Indexing)을 이용한 온톨로지 형태의 개인화된 사용자 프로파일을 만드는 방법을 제안한다. 생성된 사용자 프로파일에 개념 간의 유사도와 개념에 대한 사용자의 관심도를 고려하여 보다 개인의 선호도에 맞는 기사를 제공한다. 실험에서는 제안된 방법의 성능 평가를 위해서 기존의 키워드 벡터 모델의 학습 방법인 WebMate 시스템과 비교 분석하였다. 그 결과 제안하는 방법이 키워드 벡터를 이용한 학습 방법보다 향상된 성능을 보였다.

  • PDF

효율적인 키워드 검색을 지원하는 학습자료의 구조화 방법 연구 (A Study on Structuring Method of Study Data Supporting Efficient Keyword Search)

  • 김은경;최진오
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1063-1066
    • /
    • 2005
  • 다양한 학습 자료를 저장해두고 검색하는 시스템들은 주로 키워드 검색을 지원하고 있다. 여기서, 키워드 매칭 방식은 같은 분야의 자료라 하더라도 사용자가 입력한 키워드와 정확한 매칭이 되지 않을 경우 검색되지 못하는 문제점을 안고 있다. 또한 학습 테스트를 위한 학습 문제 자료는 키워드로 검색하기에는 포함한 정보의 양이 너무 적어 적용되기 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위하여 학습문서를 입력할 때 문서에 포함되어 있는 각 단어들을 형태소 분석에 의하여 중요 명사들을 추출하고 데이터베이스화하는 기법을 도입하고 미리 마련한 유사한 용어 지식 데이터베이스를 활용하여 지능적이고 효율적인 학습자료 검색 기법을 제안한다.

  • PDF