• Title/Summary/Keyword: 유사 키워드

Search Result 311, Processing Time 0.027 seconds

A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment (조세심판 문서 검색 효율 향상 모델에 관한 연구)

  • Lee, Hoo-Young;Park, Koo-Rack;Kim, Dong-Hyun
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.6
    • /
    • pp.41-47
    • /
    • 2019
  • It is very important to search for and obtain an example of a similar judgment in case of court judgment. The existing judge's document search uses a method of searching through key-words entered by the user. However, if it is necessary to input an accurate keyword and the keyword is unknown, it is impossible to search for the necessary document. In addition, the detected document may have different contents. In this paper, we want to improve the effectiveness of the method of vectorizing a document into a three-dimensional space, calculating cosine similarity, and searching close documents in order to search an accurate judge's example. Therefore, after analyzing the similarity of words used in the judge's example, a method is provided for extracting the mode and inserting it into the text of the text, thereby providing a method for improving the cosine similarity of the document to be retrieved. It is hoped that users will be able to provide a fast, accurate search trying to find an example of a tax-related judge through the proposed model.

Hashtag Analysis Scheme for Topic based Tweet Categorization (토픽 기반의 트윗 분류를 위한 해시태그 분석 기법)

  • Kim, Yongsung;Jun, Sanghoon;Rew, Jehyeok;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.737-740
    • /
    • 2014
  • 최근 SNS 사용자가 급증하면서 매우 다양하고 방대한 양의 글이 여러 종류의 SNS를 통해 생성되고 있다. 그중 트위터는 정보의 전달 및 확산에 상당히 유용한 도구로 사용되고 있다. 이러한 트위터의 사용자 트윗은 뉴스, 음악, 사진, 여행 등 다양한 형태로 등장한다. 또한 트위터는 해시태그라는 사용자 정의 태그를 사용하는데 이는 트윗의 키워드 및 핵심을 쉽게 표현할 수 있도록 해주는 효과적인 수단이다. 최근 상당히 많은 양의 트윗의 생성에도 불구하고 이를 다양한 카테고리별로 분류할 수 있는 연구가 많이 진행되지 않았다. 따라서 본 논문에서는 해시태그를 이용해 트윗의 핵심을 파악하고 수많은 트윗을 다양한 토픽별로 분류할 수 있는 기법을 제안한다. 우선 다양한 카테고리의 인기 해시태그가 포함된 트윗을 수집하고 수집한 트윗에서 해시태그별 키워드를 추출한다. 그리고 코사인 유사도를 통해 해시태그별 내용 유사도를 파악하여 각 카테고리 내의 해시태그가 얼마나 유사한 내용을 지니고 있는지 파악한다. 마지막으로 사용자 트윗이 입력되면 모든 카테고리와 유사도를 비교하여 가장 유사도가 높은 카테고리를 찾아 추천해준다. 제안된 기법을 바탕으로 프로토타입을 구현하고 실험을 통해 성능을 평가한다.

A Comparative Analysis on Keywords of International and Korean Journals in Library and Information Science (국내외 문헌정보학 저널의 키워드 비교 분석)

  • Kim, Eungi
    • Journal of Korean Library and Information Science Society
    • /
    • v.48 no.1
    • /
    • pp.207-225
    • /
    • 2017
  • The aim of this study was to discover various Library and Information Science (LIS) research areas by examining similarities and differences between LIS journals in terms of keyword characteristics. To conduct this study, for the years from 2004 to 2016, the keywords of 6 international journals were downloaded from Scopus database (http://www.scopus.com), and the keywords of 4 Korean journals were downloaded from the RISS database (http://www.riss.co.kr). The characteristics of keywords were investigated by examining frequently used keywords and frequently used distinctive keywords pertaining to international and Korean journals. The distinctive keywords are referred to as the keywords that appear in one domain but not in another. The result of this study indicated the following: a) a frequency analysis of the keywords showed major research themes and unique traits concerning Korea. b) In general, the keywords used in Korean journals frequently reflected the library as a major subject area of research, while keywords used in international journals reflected bibliometrics and information retrieval as major subject areas of research. c) The overarching themes of each created dataset were clearly noticeable in frequently used distinctive keywords. d) Some keywords were bound by a nation or by a region due to their scope of usage. The important implication of this study is that both most frequently used keywords and most frequently used distinctive keywords seemed to adequately represent the LIS subject areas.

Usability evaluation of navigation aid for searching menu items on mobile phone (휴대전화를 위한 메뉴검색 지원도구의 사용성 평가)

  • Park, Won-Kyu;Han, Sung-H.;Chae, Byung-Kee;Cha, Joo-Hyoung;Kim, Se-Na
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.169-174
    • /
    • 2006
  • 최근의 휴대전화는 음성 통화뿐만 아니라 메시지 및 이메일 송/수신, 사진/동영상 촬영 등 다양한 종류의 작업을 수행할 수 있으며, 그 기능이 점차 확장되고 있는 추세이다. 그러나 화면 공간의 제약으로 인한 메뉴 항목명의 축약, 메뉴 항목수의 증가, 메뉴 구조의 복잡화 등의 원인 때문에 많은 사용자들이 메뉴검색에 불편함을 겪고 있다. 이러한 문제점을 해결하기 위해, 본 연구에서는 기존의 메뉴 네비게이션을 통한 검색 방식, 하위 메뉴항목 제시 방식 이외에, 키워드 검색방식 및 유사 키워드 검색 방식을 개발하고 4가지 메뉴 검색방식의 사용성 평가실험을 수행하였다. 사용성 평가 실험 결과, 수행도 측면에서는 메뉴 검색 방식간의 차이가 유의하지 않았지만, 사용자 만족도 측면에서는 통계적으로 유의한 차이가 존재하였다. 4가지 메뉴 검색 방식 중 유사 키워드 방식은 사용자 만족도 측면에서 가장 선호되는 방식으로써, 추후 실제 휴대전화에 적용될 경우 사용자 만족도를 제고할 수 있을 것으로 기대된다.

  • PDF

Development of Efficient Search Engine for Web services and openAPIs by Keyword (키워드를 이용한 효율적인 웹서비스 및 openAPI 검색 엔진 개발)

  • Chun, Dong-Suk;Cha, Seung-Jun;Kim, Kyong-Ok;Lee, Kyu-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.159-164
    • /
    • 2008
  • 최근 많이 주목을 받고 있는 웹 2.0은 사용자의 참여, 개방, 네트워크 효과에 기반하여 누구나 데이터를 생산하고 공유할 수 있는 사용자 중심의 인터넷 환경이다. openAPI는 웹 2.0의 근본 개념인 데이터의 개방 및 공유를 구현할 수 있는 핵심 기술로 포털은 자신의 서비스를 공개한다. 하지만 기존의 웹서비스와 openAPI 검색은 효율적인 검색 방법을 제공하지 않았다. 본 논문에서는 Lee[1]의 논문에서 제공하는 효율적인 웹서비스 검색 방법을 이용하여 검색 엔진을 개발하였다. 하지만 이 연구는 웹서비스와 유사한 구조를 가지는 openAPI를 수용하지 못한다. 따라서 본 논문에서는 openAPI의 정의 및 사용법이 웹서비스와 유사하다는 점을 활용하여 openAPI의 효과적인 검색을 위한 검색기법을 개발하였다. 이러한 검색기법은 사용자가 키워드를 입력하여 키워드 기반 검색을 통해 원하는 서비스를 찾아주고, 매쉬업 서비스나 다른 openAPI와의 조합(Composition)을 위해 템플릿 기반 검색을 통해 효과적인 검색을 제공해준다.

  • PDF

Classification of Education Video by Subtitle Analysis (자막 분석을 통한 교육 영상의 카테고리 분류 방안)

  • Lee, Ji-Hoon;Lee, Hyeon Sup;Kim, Jin-Deog
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.88-90
    • /
    • 2021
  • This paper introduces a method for extracting subtitles from lecture videos through a Korean morpheme analyzer and classifying video categories according to the extracted morpheme information. In some cases incorrect information is entered due to human error and reflected in the characteristics of the items, affecting the accuracy of the recommendation system. To prevent this, we generate a keyword table for each category using morpheme information extracted from pre-classified videos, and compare the similarity of morpheme in each category keyword table to classify categories of Lecture videos using the most similar keyword table. These human intervention reduction systems directly classify videos and aim to increase the accuracy of the system.

  • PDF

쉽고빠른인터넷세상여는 한글키워드 서비스

  • Kim, Mun-Yeong
    • Digital Contents
    • /
    • no.11 s.150
    • /
    • pp.42-46
    • /
    • 2005
  • ‘ www’는인터넷의상징과도같다. 지금처럼인터넷이폭넓게보급될수있었던이유중하나는어려운숫자도메인(IP Address)을간단한영문으로바꿔입력할수 있는시스템이등장했기때문이다. 이를기반으로몇몇얼리어댑터혹은전문가급유저만의전유물처럼여겨지던인터넷이대중화되기시작했다. 국내에서도이와 유사한움직임이나타나고있다. 영문에익숙하지않은어린이, 노인등의계층도쉽게인터넷을접하고이용할수있도록한글키워드서비스가시작된것. 한글키워 드서비스보급의선봉에우뚝선넷피아닷컴과디지털네임즈를분석했다.

  • PDF

MeSH Semi Indexing of the Korean Biomedical Literature, using NLM Medical Text Indexer (NLM Medical Text Indexer를 활용한 우리나라 의학문헌의 MeSH Semi Indexing 방안)

  • Jeong, Sona;Lee, Choon Shil
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2010.08a
    • /
    • pp.21-28
    • /
    • 2010
  • 본 연구에서는 PubMed에 등재되었으나 Medical Subject Headings(MeSH)가 부여되지 않은 국내 의학학술지의 문헌을 대상으로 미국국립의학도서관 (NLM: National Library of Medicine)의 Medical Text Indexer(MTI)를 활용하여 MeSH 용어를 추천받은 후, PubMed 레코드의 유사주제문헌 (Relation Citations, PRC)에 부여된 MeSH와의 일치여부를 분석하였다. 또한 논문의 저자가 부여한 키워드(저자키워드)와 PRC MeSH의 일치여부도 비교하였다. PRC MeSH와 MTI MeSH 추천어의 일치율은 주표목이 21.1%였고, 체크태그는 18.1%, 부표목은 16.5%로 나타났다. 우리나라 의학논문에 나타난 저자키워드의 중요한 특징은 MeSH 주표목 위주이고, 체크태그와 부표목은 거의 사용하지 않는 것이다. 따라서 저자키워드와 PRC MeSH 주표목과의 일치율은 23.4%에 이르지만, 체크태그와 부표목의 일치율은 각각 1%, 2.1%였다. 색인전문가가 통제어휘를 사용하여 색인하는 과정에서 PRC와 MTI의 MeSH 주표목과 저자키워드가 일치하는 용어를 주표목으로 부여하고, PRC와 MTI가 추천하는 체크태그와 부표목을 활용하는 등 국내 의학문헌의 MeSH 용어 부여 작업을 반자동화(semi-indexing)하면, 정확하고 신속한 MeSH 부여 작업이 가능할 것이다.

  • PDF

Learning User Interest using Hierarchical Concept indexing based on Ontology (온톨로지 기반의 계층적 개념 인덱싱을 이용한 사용자 관심사 학습)

  • Park Ji-Hyun;Kim Heung-Nam;Jo Geun-Sik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.646-648
    • /
    • 2005
  • 인터넷의 급속한 성장과 더불어 사용자들은 인터넷을 통해 많은 정보를 얻을 수 있게 되었으며 최신 뉴스를 실시간으로 접근할 수 있게 되었다. 이에 따라 방대한 정보 속에 사용자 관심사에 맞는 정보를 효과적으로 검색하기 위한 여러 방법들이 연구되어 왔다. 하지만 기존의 많은 선행 연구들은 단어 빈도 기반의 키워드 벡터 모델을 이용하여 사용자의 관심사를 학습하고 있다. 이러한 키워드 벡터 모델은 사용자의 선호도를 명확하게 기술하지 못하고 키워드를 이용한 특징 벡터 (feature-vector)는 개념들 사이의 관계를 찾기 어려운 한계를 가지고 있다. 이를 개선하기 위해 본 논문에선 계층적 개념 인덱싱(Hierarchical Concept Indexing)을 이용한 온톨로지 형태의 개인화된 사용자 프로파일을 만드는 방법을 제안한다. 생성된 사용자 프로파일에 개념 간의 유사도와 개념에 대한 사용자의 관심도를 고려하여 보다 개인의 선호도에 맞는 기사를 제공한다. 실험에서는 제안된 방법의 성능 평가를 위해서 기존의 키워드 벡터 모델의 학습 방법인 WebMate 시스템과 비교 분석하였다. 그 결과 제안하는 방법이 키워드 벡터를 이용한 학습 방법보다 향상된 성능을 보였다.

  • PDF

A Study on Structuring Method of Study Data Supporting Efficient Keyword Search (효율적인 키워드 검색을 지원하는 학습자료의 구조화 방법 연구)

  • Kim, Eun-Kyung;Choi, Jin-Oh
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.1063-1066
    • /
    • 2005
  • Most reading systems that supply various study data generally support keyword search. But the usual keyword matching techniques have a problem to require the exact keyword matching, and could not find similar field materials. Futhermore, testing materials have too little information to apply the keyword matching search. To solve these problems, this thesis proposes the method to extract the important keyword from study data and to construct the database automatically when the data are stored at the storage. And using prepared similar terminology database, we suggest the intelligent and efficient technique to find study materials.

  • PDF