• Title/Summary/Keyword: 키워드 기반 기법

Keyword Automatic Extraction Scheme with Enhanced TextRank using Word Co-Occurrence in Korean Document (한글 문서의 단어 동시 출현 정보에 개선된 TextRank를 적용한 키워드 자동 추출 기법)

  • Song, KwangHo;Min, Ji-Hong;Kim, Yoo-Sung
    • 한국어정보학회:학술대회논문집
    /
    • 2016.10a
    /
    • pp.62-66
    /
    • 2016
  • 문서의 의미 기반 처리를 위해서 문서의 내용을 대표하는 키워드를 추출하는 것은 정확성과 효율성 측면에서 매우 중요한 과정이다. 그러나 단일문서로부터 키워드를 추출해 내는 기존의 연구들은 정확도가 낮거나 한정된 분야에 대해서만 검증을 수행하여 결과를 신뢰하기 어려운 문제가 있었다. 따라서 본 연구에서는 정확하면서도 다양한 분야의 텍스트에 적용 가능한 키워드 추출 방법을 제시하고자 단어의 동시출현 정보와 그래프 모델을 바탕으로 TextRank 알고리즘을 변형한 새로운 형태의 알고리즘을 동시에 적용하는 키워드 추출 기법을 제안하였다. 제안한 기법을 활용하여 성능평가를 진행한 결과 기존의 연구들보다 향상된 정확도를 얻을 수 있음을 확인하였다.

Open API-based Conversational Voice Interaction Scheme for Intelligent IoT Applications for the Digital Underprivileged (디지털 소외계층을 위한 지능형 IoT 애플리케이션의 공개 API 기반 대화형 음성 상호작용 기법)

  • Joonhyouk, Jang
    • Smart Media Journal
    • /
    • v.11 no.10
    • /
    • pp.22-29
    • /
    • 2022
  • Voice interactions are particularly effective in applications targeting the digital underprivileged who are not proficient in the use of smart devices. However, applications based on open APIs are using voice signals only for short, fragmentary input and output due to the limitations of existing touchscreen-oriented UI and API provided. In this paper, we design a conversational voice interaction model for interactions between users and intelligent mobile/IoT applications and propose a keyword detection algorithm based on the edit distance. The proposed model and scheme were implemented in an Android environment, and the edit distance-based keyword detection algorithm showed a higher recognition rate than the existing algorithm for keywords that were incorrectly recognized through speech recognition.

Keyword Extraction from News Corpus using Modified TF-IDF (TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법)

  • Lee, Sung-Jick;Kim, Han-Joon
    • The Journal of Society for e-Business Studies
    • /
    • v.14 no.4
    • /
    • pp.59-73
    • /
    • 2009
  • Keyword extraction is an important and essential technique for text mining applications such as information retrieval, text categorization, summarization and topic detection. A set of keywords extracted from a large-scale electronic document data are used for significant features for text mining algorithms and they contribute to improve the performance of document browsing, topic detection, and automated text classification. This paper presents a keyword extraction technique that can be used to detect topics for each news domain from a large document collection of internet news portal sites. Basically, we have used six variants of traditional TF-IDF weighting model. On top of the TF-IDF model, we propose a word filtering technique called 'cross-domain comparison filtering'. To prove effectiveness of our method, we have analyzed usefulness of keywords extracted from Korean news articles and have presented changes of the keywords over time of each news domain.

Indexed-Sequential Search Approach on Multi-Node Global Directory in Peer-to-Peer Systems (P2P 시스템에서의 다중 노드 전역 디렉토리 기반 색인 순차 검색 기법)

  • 강인성;최성진;이화민;백맹순;황종선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.193-195
    • /
    • 2004
  • 저렴한 비용으로 기존의 클라이언트 서버 시스템을 대체할 수 있는 P2P 시스템에서 서로 공유하고자 하는 파일의 리스트를 얼마나 빠르고 효과적으로 검색하느냐는 시스템 성능을 좌우하는 중요한 항목 중 하나이다. 그러나 기존의 P2P 시스템에서의 검색 기법들은 목적 파일들에 대한 검색 시간의 단축과 키워드 검색이라는 두 가지 설계 목표 중 어느 한 쪽에만 치중하여 설계됨으로써 종합적인 검색 기능이 요구되는 실제 시스템에 적용되기에는 매우 불완전하다. 본 논문에서는 P2P 시스템에 참여하여 파일을 공유하고자 하는 노드들의 모든 공유파일 목록을 하나의 전역 디렉토리로 구성하고 이를 이진 값의 순서대로 저장함으로써 높은 검색 속도로 키워드 검색 기능을 제공하는 다중 노드 전역 디렉토리 기반 색인 순차 검색 기법을 제안한다. 제안된 기법은 높은 겅색 속도와 키워드 검색을 지원함으로써 P2P 시스템의 검색 속도 성능 개선과 사용자 편의성을 제공한다.

The study of Query Method for keyword disambiguation based on TMDR (TMDR 기반의 키워드 모호성 해결을 위한 질의 기법에 관한 연구)

  • Jung, Gye-Dong;Hwang, Chi-Gon;Shin, Hyo-young;Choi, Young-Gun
    • Annual Conference of KIPS
    • /
    • 2010.04a
    • /
    • pp.177-179
    • /
    • 2010
  • 키워드의 모호성으로 인한 검색 결과가 부정확하게 되는 문제를 해결하기 위한 질의기법을 제안한다. 제안하는 질의 기법은 TMDR을 이용한다. TMDR은 로컬 데이터베이스를 통합하기 위한 스키마 정보의 통합 관리하기위한 MDR과 데이터 접근을 위해 온톨로지 지식 저장소로 토픽맵으로 구성된다. 토픽맵은 연관관계 분석을 통한 데이터 모호성 해결을 지원한다. 이를 이용하여 기존 시스템의 이질적 문제를 해결한다. 토픽맵은 지식을 제공하고, 지식 간의 관계성을 제공하므로 키워드의 모호성을 해결할 수 있다. 본 논문에서는 이러한 TMDR을 이용하여 키워드의 모호성과 기존 시스템의 이질적 환경을 적응하기 위한 질의기법을 제안한다.

Development of Internet Advertising Method based on Text Keyword according to Mouse Action (마우스의 움직임에 따른 텍스트 키워드 기반 인터넷광고기법 개발)

  • 진교홍;이혜원
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.7 no.8
    • /
    • pp.1691-1697
    • /
    • 2003
  • The Internet is standing in the spotlight of a new medium of advertisement with explosive growth of market share of electronic commerce, several Internet advertising methods have been implemented. Among them, the banner advertising method is typically being used in the Internet, but the users are not willing to see the banner advertising, moreover that method shows low click rate. Accordingly we propose a new Internet advertising method that makes expose advertising content according to proper text keyword in the article of web pages. During user is reading a article of web page, when user puts mouse pointer over a text keyword, previously specified advertising content is appeared on the web page. The proposed method is based on the keyword advertising, and unlike banner advertising, various shape of images can be applied. Also whole web page could be used for advertising area, and the method does not affect loading delay time of web page.

Topic based Web Document Clustering using Named Entities (개체명을 이용한 주제기반 웹 문서 클러스터링)

  • Sung, Ki-Youn;Yun, Bo-Hyun
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.5
    • /
    • pp.29-36
    • /
    • 2010
  • Past clustering researches are focused on extraction of keyword for word similarity grouping. However, too many candidates to compare and compute bring high complexity, low speed and low accuracy. To overcome these weaknesses, this paper proposed a topical web document clustering model using not only keyword but also named entities such as person name, organization, location, and so on. By several experiments, we prove effects of our model compared with traditional model based on only keyword and analyze how different effects show according to characteristics of document collection.

Software Testing by a keyword driven test automation method and Effects (키워드 기반 자동 테스트 구현 및 적용 사례)

  • 이영석;하영민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.604-606
    • /
    • 2001
  • 소프트웨어의 본질인 변경 문제로 인해 상용 테스트 도구의 단순 적용만으로는 자동 테스트의 실질적인 효과를 기대하기 어려운 것이 현실이다. 이러한 문제를 해결하기 위해 변경에 영향 받지 않는 다양한 자도 테스트 기법이 시도되어 오고 있다. 그 중에서 가장 주목받는 것으로 키워드 기반 자동 테스트(Keyword Driven Automated Test)를 들 수 있으며 이 방법의 궁극적인 목적은 대상 소프트웨어의 변경에 따른 테스트 자원의 유지보수를 쉽게 하기 위한 것이라 할 수 있다. 테스트 자원의 구축, 실행 및 발생하는 변경으로 인한 유지보수까지의 전 과정에서 키워드 기반 자동 테스트가 보다 효율적이며 다른 프로젝트, 제품 테스트에서도 일부 함수 추가, 재정의만으로 재사용 가능한 장점을 가지고 있다. 키워드 기반 자동 테스트를 위해서는 기존의 테스트 도구를 사용하여 대상 소프트웨어에 맞게 테스트 도구가 제공하는 자체 프로그래밍 언어를 사용하여 개발해야 한다.

Public Key Encryption with Keyword Search for Restricted Testability (검증 능력이 제한된 검색 가능한 공개키 암호시스템)

  • Eom, Ji-Eun;Rhee, Hyun-Sook;Lee, Dong-Hoon
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.21 no.4
    • /
    • pp.3-10
    • /
    • 2011
  • To provide efficient keyword search on encrypted data, a public key encryption with keyword search (PEKS) was proposed by Boneh et al. A sender encrypts an e-mail and keywords with receiver's public key, respectively and uploads them on a server. Then a receiver generates a trapdoor of w with his secret key to search an e-mail related with some keyword w. However, Byun et al. showed that PEKS and some related schemes are not secure against keyword guessing attacks. In this paper, we propose a public key encryption with keyword search for restricted testability (PEKS-RT) scheme and show that our scheme is secure against keyword guessing attacks.