• 제목/요약/키워드: Search Keyword Extraction

검색결과 43건 처리시간 0.028초

TFIDF를 이용한 키워드 추출 시스템 설계 (Design of Keyword Extraction System Using TFIDF)

  • 이말례;배환국
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.1-11
    • /
    • 2002
  • 본 논문에서는 먼저 Anchor Text의 단어들이 키워드로 적합한지 TFIDF를 이용하여 테스트하였다. 그 결과는 가중치가 높아서 키워드로 적합한 단어가 있었는가 하면. 아예 문서에 나오지도 않는 단어가 있어 키워드로 적합하지 않은 단어도 있었다. 이를 해결하기 위하여 새로운 키워드 추출 방법을 제시하였다. 본 논문에서는 적합하지 않은 키워드를 제거함으로써 새로운 키워드를 만들어 내고 TFIDF값을 각 키워드의 가중치로 이용하여 Ranking이 가능하게 하였다. 이렇게 추출된 키워드는 기존의 방법보다 정확도가 높아졌음 증명했다.

  • PDF

수식 관계를 이용한 키워드 추출을 통한 검색 과정의 효율성 향상 (Keyword Extraction Using Modifying Relation to Improve Search Experience)

  • 문욱성;이신목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.228-232
    • /
    • 2007
  • 정보화 시대에 방대한 양의 정보에서 필요한 정보를 효율적으로 찾아내는 것은 그 무엇보다도 중요하다. 이를 위해 많은 검색 엔진이 효율적인 검색 결과 제공을 위해 노력하고 있지만 그 인터페이스의 문제로 인하여 사용자가 검색결과를 효율적으로 받아들이기 어려우며 또한 원하는 정보를 검색하기 위해서는 일정 수준 이상의 검색 능력을 필요로 한다. 이 논문에서는 기존의 검색 엔진의 인터페이스 변경을 통하여 시각적인 연관성 정보를 제공하며 이를 통해 사용자가 검색 능력에 구애받지 않고 정확한 답을 얻을 수 있도록 유도한다. 또한 이 과정에서 기존의 키워드 추출 알고리즘의 문제점을 발견하여 이를 단어간의 수식 관계를 이용하여 해결하였다. 또한 단어간의 수식 관계를 이용하여 효율적으로 문서간의 연관성을 생성할 수 있는 알고리즘을 제시하였다.

  • PDF

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

Analysis of Major Changes in Press Articles Related to 'High School Credit System'

  • Kwon, Choong-Hoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권7호
    • /
    • pp.183-191
    • /
    • 2020
  • 본 연구의 목적은 최근 교육정책 중 관심거리가 되고 있는 '고교학점제' 관련 언론사 기사들의 최근 변화(2017년~2019년: 3년간) 모습을 객관적으로 분석하여 제시하는 것이다. 주요 연구방법론은 BIGKinds 서비스의 특정 검색어 뉴스 검색, 뉴스 트렌드 분석, 키워드 추출 및 워드클라우드 구현, 네트워크 분석 및 네트워크 그림 제시 등 이었다. 연구결과는 첫째, 2017년~2019년 3년간 국내 주요 언론사에 등장한 고교학점제 관련 기사건수는 총 3,649건이며, 정부(교육부)의 관련 정책발표를 계기로 4번 정도 특정 시점에서 기사건수가 급격하게 증가하는 뉴스 트렌드를 보였다. 둘째, 분석대상 3년간의 고교학점제 관련 언론사 기사들에서 추출한 상위출현빈도 20위 키워드들을 제시하였으며, 연도별 키워드의 변화가 나타난 것을 확인하였다. 셋째, 고교학점제 관련 언론사 기사들의 연도별 네트워크는 인물, 기관, 키워드 별로 다른 모습으로 시각화하여 제시하였다. 이와 같은 연구결과는 고교학점제 교육정책이 문재인 정부의 대표적인 교육정책으로 채택되어, 정책 결정 단계를 거쳐 정책 집행 단계로 진행되고 있음을 확인해 주었다.

이미지 인식을 활용한 문화유산 검색 어플리케이션 개발 (Development and Performance Analysis of a Cultural Heritage Search Application Utilizing Image Recognition)

  • 김현지;신태현;정현빈;김다현;백재순;유용한;김성진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.181-183
    • /
    • 2024
  • 본 논문은 이미지 인식, 지도 기반 검색, 그리고 키워드 검색을 활용한 문화유산 검색 어플리케이션의 개발과 성능 분석에 대한 연구를 다룬다. 우리는 이러한 다양한 기술과 기능을 결합하여 사용자에게 맞춤형 문화유산 정보를 제공하는 어플리케이션을 설계하고 구현하였다. 더불어, 어플리케이션의 성능을 평가하고 향상시키기 위한 실험과 분석을 수행하였다. 연구 결과, 이미지 인식 및 지도 기반 검색을 활용한 어플리케이션은 문화유산 관련 정보를 빠르고 정확하게 제공함으로써 사용자의 경험을 향상시킬 수 있음을 확인하였다. 이러한 연구는 문화유산 검색 어플리케이션의 개발과 성능 향상을 위한 중요한 기여를 제공할 것으로 기대된다.

  • PDF

문서 분석 기반 주요 요소 추출 시스템 (Document Analysis based Main Requisite Extraction System)

  • 이종원;여일연;정회경
    • 한국정보통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.401-406
    • /
    • 2019
  • 본 논문에서는 XML 형태의 논문이나 보고서로 작성된 문서를 분석하는 시스템을 제안한다. 논문이나 보고서에서 지정한 키워드를 추출하고 이를 사용자에게 보여준 뒤 사용자가 해당 문서 내에서 검색을 원하는 키워드를 입력하면 각 키워드들을 포함하고 있는 문단들을 추출한다. 시스템은 사용자가 입력한 키워드들의 빈도수를 확인하고 가중치를 계산한 뒤 가중치가 가장 낮은 키워드만을 포함한 문단들을 제거한다. 또한, 정제된 문단들을 10개의 영역으로 나눈 뒤 영역별 문단들의 중요도를 계산하고 각 영역들의 중요도를 비교하여 가장 높은 중요도를 갖는 주요 영역을 사용자에게 알려준다. 이러한 특징들로 인해 제안하는 시스템을 활용할 경우 기존의 문서 분석 시스템을 활용하여 논문이나 보고서를 분석하는 것보다 압축률이 높은 형태로 주요 문단들을 제공받을 수 있다. 이로 인해 문서를 이해하는데 필요한 시간을 줄일 수 있을 것으로 사료된다.

Wavelet을 이용한 내용기반 검색에 관한 연구 (A Study on Contents-based Retrieval using Wavelet)

  • 강진석;박재필;나인호;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1051-1066
    • /
    • 2000
  • 디지털 압축기술의 발달과 컴퓨팅 능력이 발전함에 따라서 많은 양의 이미지, 그래픽, 오디오, 비디오 정보가 인터넷을 통한 멀티미디어 시스템에서 활발히 이용되고 있다. 이에 따라 사용자가 원하는 멀티미디어 컨텐츠를 탐색하기 위한 다양한 검색기법이 요구되고 있으며, 특히 단순한 텍스트형 키워드에 의한 검색보다는 내용에 의한 검색 기법이 절실히 요구되고 있다. 본 논문에서는 여러 가지 전처리 과정을 통해 영상을 분류하고, 여기에 색상의 공간적, 질감적 특징을 선별적으로 적용함으로서 처리 효율을 높이면서 검색 성능을 증가시킬 수 있는 내용기반 색인 및 검색 알고리즘을 제안하였다. 또한, 특정 상표에 대한 내용기반 데이터 검색요청 및 수행 결과 분석을 통해 제안된 기법의 성능을 평가하였고, 그 결과를 기술하였다.

  • PDF

역사객체 기반의 기계학습 기법을 활용한 웹 문서의 시간정보 추출 방안 제안 (A Proposal of Methods for Extracting Temporal Information of History-related Web Document based on Historical Objects Using Machine Learning Techniques)

  • 이준;권용진
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.39-50
    • /
    • 2015
  • 최근 검색엔진을 통한 정보검색 과정에서 특정 시구간 상황에 대응하는 문서를 검색하고자 하는 경우가 있다. 예를 들면, 임진왜란 이전의 시대적 상황과 관련된 문서를 검색하기 위해, 키워드 '임진왜란'으로 검색하면 시간에 관계없이 임진왜란 당시나 전후의 모든 문서가 검색되어 추가적인 작업이 요구된다. 또한, 역사관련 문서의 경우는 문서내용에 대응하는 시간 정보가 문서 생성시간과 일치하지 않는 경우가 대부분이다. 만약 웹 문서의 내용에 대응하는 시간 정보를 추출 할 수 있다면 효과적인 정보검색은 물론 다양한 응용에 적용 가능할 것이다. 따라서 본 논문은 문서 내용에 대응하는 시간정보 추출을 목적으로, 조선시대를 대상으로 한 역사문헌을 활용하여 조선시대 역사관련 문서의 시간추출에 대한 연구를 진행한다. 역사 문헌과 웹으로부터 수집된 역사관련 문서를 바탕으로 역사객체를 정의하고, 이를 기반으로 다양한 기계학습 기법을 활용하여 웹 문서의 시간정보 추출에 대한 가능성을 확인한다. 또한 기계학습 과정에 있어서 객체의 유사도에 기반 한 여과과정을 제안하고 이를 적용한 효율적인 시간정보 추출 및 정확도 향상에 대한 결과를 비교 분석한다.

워드넷 의미정보로 선별된 우선 태그와 이를 이용한 웹 이미지의 검색 (Web Image Retrieval using Prior Tags based on WordNet Semantic Information)

  • 권대현;홍준혁;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제12권7호
    • /
    • pp.1032-1042
    • /
    • 2009
  • 본 연구는 태깅된 웹 이미지의 검색에서 태그들의 의미정보를 미리 추출하여 검색 시에 이용하고자 하는 것이다. 일반적으로 웹 이미지의 태그들은 사용자들에 의해 순서 구분 없이 무작위로 매겨지며 많게는 그 수가 100여개에 이른다. 본 논문에서는 이 태그들 간에 의미정보가 많이 공유된 것일수록 해당 이미지를 설명하는 중요 태그가 될 것임에 착안하여 이미지와 태그 정보가 업 로드되는 시점에 중요도에 따른 우선 태그를 결정하고 이를 검색에 활용하는 방법을 소개한다 제안된 방법은 워드넷에 기반하여 태그의 연관성점수를 계산하고 이를 이용하여 다단계 검색으로 태징된 웹 이미지를 검색한다. 평가를 위하여 제안된 방법으로 검색된 결과와 검색어와 태그의 단순 비교방식인 기존의 검색을 비교하였으며 실험 결과, 정확도와 재현율에서 본 시스템의 우수함을 확인할 수 있었다.

  • PDF

족부백선의 한의학 논문에 대한 고찰 (Review on Studies of Korean Medicine about Tinea Pedis)

  • 박선영;서형식
    • 한방안이비인후피부과학회지
    • /
    • 제29권3호
    • /
    • pp.42-49
    • /
    • 2016
  • Objectives : The purpose of this study is to analyze research trends on tinea pedis in studies of Korean medicine.Methods : We searched papers using NDSL, KISS, RISS and KTKP(Korean Traditional Knowledge Portal). The first search used the keyword "Tinea pedis" in NDSL, KISS, RISS and KTKP. Used searching duration was not specified.Results : Studies found in NDSL, KISS and RISS were 122 and 118 studies were excluded. Studies found in KTKP were five papers and four studies of them were excluded. Finally five studies were selected and analyzed. Two studies of five selected ones were experimental researches and three studies were clinical researches. Among 2 researches of experimental researches, one of them was about antifungal efficacy of herbal medicines and ethahol extract of the mixture of Sophorae Subprostratae Radix, Aconiti Radix and Hibisci Syriaci Cortex and hot water extract of Phellodendri Cortex were effective. The other was about antifungal effect of the medicinal herb extraction method and vinegar extract was effective. Among 3 researches of clinical researches, there were one clinical study and two case studies. Functional soap containing herbal medicines and bee venom therapy were effective.Conclusions : As we looked for five researches, which were two experimental studies, one clinical study and two case studies. It is possible to treat tinea pedis with korean medical approach by conclusions of 5 researches. We expect that further researches will be proceeded and following results can be actively used as clinical treatments.