통합 검색 | Korea Science

Performance Evaluations of Text Ranking Algorithms

Kim, Myung-Hwi;Jang, Beakcheol
- 한국컴퓨터정보학회논문지
- /
- 제25권2호
- /
- pp.123-131
- /
- 2020
텍스트 순위 알고리즘은 키워드 추출을 위한 대표적인 방법이며 그 중요성이 강조되고 있다. 본 논문에서는 텍스트 랭킹 알고리즘에서 대표적으로 사용되는 TF-IDF, SMART, INQUERY, CCA 알고리즘이 적용된 최근 연구와 실험해비교한다. 먼저, 각 알고리즘을 설명한 후 뉴스와 트위터 데이터를 기반으로 알고리즘의 성능을 분석한다. 실험 결과에 따르면 네 가지 알고리즘 모두 뉴스 데이터에서 특정 단어의 추출 성능이 좋다는 것을 알 수 있다. 그러나 Twitter의 경우 CCA는 특정 단어를 추출하는 최고의 성능을 가지며 INQUERY는 가장 낮은 성능을 보여준다. 또한 6 가지 비교 메트릭을 통해 알고리즘의 정확성을 분석한다. 실험 결과 CCA가 뉴스 데이터에서 최고의 정확도를 보여주고, 트위터의 경우 TF-IDF와 CCA는 비슷한 성능을 보이며 높은 정확도를 보인다.
https://doi.org/10.9708/jksci.2020.25.02.123 인용 PDF KSCI

소셜 북마킹 시스템에서의 북마크와 태그 정보를 활용한 웹 콘텐츠 랭킹 알고리즘 (A Web Contents Ranking Algorithm using Bookmarks and Tag Information on Social Bookmarking System)

박수진;이시화;황대훈
- 한국멀티미디어학회논문지
- /
- 제13권8호
- /
- pp.1245-1255
- /
- 2010
현재 웹 2.0 환경에서의 핵심 기술 중 하나는 사용자가 관심 있는 웹페이지를 태깅 및 북마킹 하는 소셜 북마킹 기술이다. 소셜 북마킹은 웹 콘텐츠에 태깅된 북마크 정보 및 태깅 결과를 기반으로 검색, 분류, 공유를 통해 효율적인 정보 제공을 주목적으로 하고 있다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하는 방식을 사용하고 있다. 이는 소셜 북마킹 시스템에서 중요한 특징을 가지는 북마크와 태깅 기술을 효율적으로 활용하지 못하는 결과가 된다. 이에 본 연구에서는 태그 클러스터링을 통한 연관 태그 추출에 관한 선행연구를 기반으로, 북마크 정보와 혼합하기 위한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론들과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 북마크와 태그 정보를 함께 활용한 소셜 북마크 시스템이 기존 시스템보다 효율적인 검색결과를 도출하였다.
PDF KSCI

온톨로지를 이용한 웹문서의 시맨틱 검색 (Semantic search of web documents using ontology)

오성균;김병곤
- 디지털콘텐츠학회 논문지
- /
- 제15권5호
- /
- pp.603-612
- /
- 2014
사용자들에게 좀 더 정확하고 편리한 검색결과를 제공하기 위하여 정보의 구조적인 특징 등을 사용하는 시맨틱 검색의 개념이 널리 연구되고 있다. 이를 위하여, 최근의 정보검색분야와 데이터구축 분야의 연구에서는 데이터의 구조적인 표현과 검색 메카니즘을 구현하기 위하여 온톨로지를 강조하고 있다. 본 연구에서는 웹 환경에서의 검색 정확도와 만족도를 향상시키기 위하여 온톨로지를 이용한 시맨틱 검색 방법을 제안한다. 온톨로지와 KB(KnowledgeBase)를 이용하여 검색 대상을 키워드간의 관계를 유추한 사실(fact)과 관계키워드들을 지니는 웹문서들로 크게 나누고 이들을 서로 유기적으로 검색을 진행하는 시맨틱 검색 질의 처리기법을 제안하였다. 또한 결과에 대한 사용자의 검색 만족도를 높이기 위하여 결과 문서와 사실에 대한 랭킹 방법을 제안하였다. 실험을 통하여 주어진 식의 값을 달리하여 랭킹을 올바로 구현하는 요소로 키워드의 빈도와 온톨로지상의 클래스 레벨이 영향을 미치는 것을 확인 할 수 있었고, 이를 통하여 적합한 형태의 계수 값을 제시하였다.
https://doi.org/10.9728/dcs.2014.15.5.603 인용 PDF KSCI

연관 태그 및 유사 사용자 가중치를 이용한 웹 콘텐츠 랭킹 시스템 (A Web Contents Ranking System using Related Tag & Similar User Weight)

박수진;이시화;황대훈
- 한국멀티미디어학회논문지
- /
- 제14권4호
- /
- pp.567-576
- /
- 2011
웹 2.0의 발전에 따라 다양한 기술들이 제공되며 그 중 대두되는 기술로 사용자가 관심 있는 웹페이지를 태깅 및 북마킹하는 소셜 북마킹 기술이다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 중요 정보인 다른 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하며 또한, 다른 사용자들과의 유사도를 반영하지 못하여 소셜 북마킹 시스템의 특징을 반영하지 못한 검색결과를 도출하고 있는 실정이다. 이에 본 연구에서는 선행 연구를 기반으로 태그 클러스터링을 통한 연관 태그 추출 및 북마크 정보와 다른 사용자의 유사도를 혼합한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론 및 선행 연구의 방법론과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 태그 정보 및 북마크 수와 유사도를 활용한 방법이 기존 방법론보다 효율적인 결과를 도출하였다.
https://doi.org/10.9717/kmms.2011.14.4.567 인용 PDF KSCI

유튜브 은닉 질적 정보 분석 기반 유튜브 채널 랭킹 기법 (YouTube Channel Ranking Scheme based on Hidden Qualitative Information Analysis)

이지현;오하영
- 한국정보통신학회논문지
- /
- 제23권7호
- /
- pp.757-763
- /
- 2019
현 시대를 유튜브 시대라고 불릴 정도로 유튜브가 큰 인기를 얻고 있다. 동영상 시청자뿐만 아니라 실제 영상 제작자, 즉 유튜버들도 늘어나고 있어 다양한 주제의 컨텐츠들을 이용할 수 있게 되었다. 사용자와 컨텐츠의 수가 증가하면서 정보 선택의 폭은 커지고 있다는 장점을 갖고 있지만 사용자의 필요에 맞는 정보를 골라내기는 더욱 어렵다. 따라서 본 연구에서는 사용자가 필요로 하는 주제의 채널을 다각도에서 분석하고, 해당 채널의 랭킹을 제공하고자 한다. 채널을 크롤링하고 통계정보인 양적 데이터와 댓글의 은닉 질적 데이터 분석을 통해 채널과 채널 영상의 평균 인지도를 측정한다. 최종적인 사례 연구로써 수치 데이터 통계와 감성분석 결과 기반 사용자에게 영어 학습 채널을 추천하여 시공간에 구애 받지 않는 플립드 러닝 효과의 극대 성을 보인다.
https://doi.org/10.6109/jkiice.2019.23.7.757 인용 PDF KSCI HTML

파인블랭킹 공정에서 전단면의 크기 변형에 관한 연구 (A Study on the share surface size deformation of Fine Blanking Process)

이춘규;김영춘
- 한국산학기술학회논문지
- /
- 제14권8호
- /
- pp.3650-3655
- /
- 2013
파인블랭킹 금형을 제작하는 주목적은 전단면의 크기를 최대가 되도록 하기 위함이다. 본 연구에서는 전단면의 크기에 가장 크게 영향을 미치는 클리어런스는 재료 두께의 1%로 고정시키고 전단라인에서 Vee-Ring 중심까지의 거리 변화, V-Ring 각도의 변화, 전단 속도를 변화시키면서 전단 면적의 크기 변화를 연구 고찰하였다. 각 실험으로부터 시편을 채취하여 전단면의 크기를 분석한 결과 V-링의 거리는 2mm, 각도는 외측$45^{\circ}$/내측$30^{\circ}$일 때, 전단 속도는 6.4m/min일 때 전단면의 크기가 가장 크게 됨을 알 수 있었다.
https://doi.org/10.5762/KAIS.2013.14.8.3650 인용 PDF KSCI

재전송 정보를 활용한 트위터 랭킹의 정확도 평가 (An Evaluation of Twitter Ranking Using the Retweet Information)

장재영
- 한국전자거래학회지
- /
- 제17권2호
- /
- pp.73-85
- /
- 2012
최근 들어 트위터나 페이스북과 같은 SNS가 대중화되면서 이에 관련한 연구도 활발히 진행되고 있다. 하지만 SNS가 비교적 최근에 시작된 만큼 관련 연구도 아직 초보적인 수준이다. 특히 포털 사이트와 같은 검색 엔진에서는 트위터에 대한 검색 결과를 최근에 등록된 순으로 보여주는 수준에 머물러 있다. 트위터에서의 검색은 기존의 TF-IDF로 대표되는 웹 검색 방식과는 달라야한다. 본 논문에서는 트위터 환경에서 사용자가 원하는 게시글을 효율적으로 검색하는 방법을 제안한다. 제안된 방법에서는 사용자들의 재전송 빈도를 검색결과의 주요한 평가요소로 활용한다. 재전송 정보는 사용자가 직접 게시글의 가치를 판단하는 중요한 평가 척도가 될 수 있다. 또한 실험을 통하여 제안된 방법이 트위터 검색에 효율적으로 적용될 수 있음을 보여준다.
https://doi.org/10.7838/jsebs.2012.17.2.073 인용 PDF KSCI

콜드스타트 문제 완화를 위한 기저속성 추출 기반 추천시스템 제안 (Toward Preventing Cold-start Problem: Basis Recommendation System)

이정섭;문현석;박찬준;강명훈;이승준;안성민;박정배;임희석
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
- /
- pp.427-430
- /
- 2022
추천시스템에서 콜드스타트 문제를 해결하기 위해 다양한 연구들이 진행되고 있다. 하지만, 대부분의 연구는 아직도 사용자 기반의 히스토리 데이터셋을 반드시 필요로 하여, 콜드스타트 문제를 완벽히 해결하지 못하고 있다. 이에 본 논문은 콜드스타트 문제를 완화할 수 있는 기저속성 기반의 추천시스템을 제안한다. 제안하는 방법론을 검증하기 위해, 직접 수집한 한국어 영화 리뷰 데이터셋을 기반으로 성능을 검증하였으며, 평가 결과 제안한 방법론이 키워드와 사용자의 리뷰 점수를 효과적으로 반영한 추천시스템임을 확인할 수 있었고, 데이터 희소성 및 콜드스타트 문제를 완화하여 기존의 텍스트 기반 랭킹 시스템의 성능을 압도하는 것을 확인하였다. 더 나아가 제안된 기저속성 추천시스템은 추론 시에 GPU 컴퓨팅 자원을 요구하지 않기에 서비스 측면에서도 많은 이점이 있음을 확인하였다.
PDF

가중치 기반 웰빙식품 정보 검색 시스템 (Weight-based Wellbeing Food Retrieval System)

편광범;윤은일;류근호
- 인터넷정보학회논문지
- /
- 제11권3호
- /
- pp.75-86
- /
- 2010
건강에 대한 관심이 높아지면서 웰빙 관련 정보의 필요성이 중요해졌다. 웰빙 정보검색은 인터넷 검색 엔진이나 블로그, 개인 홈페이지 또는 대중매체를 이융한다. 하지만, 웰빙 식품에 관한 정보는 구하기 어렵다. 그래서 검색엔진은 웰빙식품에 대한 정보검색이 필요하게 되었다. 본 논문은 가중치기반의 웰빙식품 검색엔진을 설계하고 구현한다. 수많은 페이지를 탐색해 웰빙 식품 키워드가 포함되어있으면 이것을 식별하여 가중치를 추가하는 방식이다. 사용자가 키워드를 이용하여 검색하면 웰빙 관련 페이지가 우선적으로 나올 수 있게 구현했다. 웰빙관련 식품의 식별에 사용되는 키워드들은 사전형식으로 되어있다. 그래서 삽입, 삭제, 수정이 가능하다. 역 파일은 직접파일인 해싱 방식으로 저장한다. 본 논문의 엔진을 이용하여 성능평가를 한 결과 웰빙식품 키워드에 대하여 타 검색엔진에 비해 5~15%의 향상된 결과를 보였다. 본 논문에서는 검색엔진의 설계방식과 웰빙식품에 특화된 랭킹선정방식을 제안한다.
PDF KSCI

블로그 검색 성능 향상을 위한 주제-랭크 기법 (The Topic-Rank Technique for Enhancing the Performance of Blog Retrieval)

신현일;윤은일;류근호
- 한국컴퓨터정보학회논문지
- /
- 제16권1호
- /
- pp.19-29
- /
- 2011
1인 미디어인 블로그에 대한 관심이 증가함에 따라, 블로그 검색과 관련된 다양한 랭킹 알고리즘들이 제안되었다. 이러한 알고리즘들은 블로그가 웹 페이지와 다르게 갖는 구조적 특징에 맞게 변형되었으며, 각 블로그간의 연결이나, 댓글, 트랙백들을 통해 이루어진 상호소통 속에서 나타난 결과들을 바탕으로 블로그의 평판이나 인기도를 수치화하여 검색 시스템에 반영한다. 하지만 실제 블로그 검색에서는 블로그 자체의 랭크뿐만 아니라 검색어와 블로그 글과의 적합성과시간등의요소를복합적으로사용하게된다. 그런데기존에알려진요소만으로는검색결과의품질이낮을수 있다. 본 논문에서는 블로그의 주제와 관련도가 가장 높은 블로그를 찾아 낼 수 있는 주제-랭크 기법을 제안한다. 이 기법은 블로그와 블로그 글의 색인어뿐만 아니라, 블로그 글을 대표하는 주제와의 관계까지 랭킹을 매기는 방법이다. 제안된 기법을 통해 블로그 검색에서 검색어와 블로그의 연관성에 따라 랭킹을 효과적으로 부여할 수 있다. 본 논문 제안하는 주제-랭크 기법을 적용한 블로그 검색 시스템의 정확률과 적용률을 국내의 다른 블로그 검색 시스템들과 비교해 본 결과, 주제-랭크 기법을 사용한 블로그 검색 시스템의 성능이 타 시스템에 비해 더 우수함을 알 수 있었다.
https://doi.org/10.9708/jksci.2011.16.1.019 인용 PDF KSCI

검색결과 161건 처리시간 0.024초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)