• 제목/요약/키워드: 논문 랭킹

검색결과 161건 처리시간 0.025초

학술 데이터베이스에서 논문 랭킹을 위한 방안들의 평가 (Evaluating Ranking Methods in a Scientific Literature Database)

  • 채수민;황원석;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.613-614
    • /
    • 2010
  • 본 논문에서는 논문 랭킹 방안의 바탕이 되는 개념을 이해하고, 그 개념을 바탕으로 기존 논문 랭킹 방안들에 대한 특징을 파악한다. 또한 각 방안의 정확도를 비교하여, 논문 랭킹의 정확도를 높이는 요인이 무엇인지 판단한다.

잠재적인 참조를 고려한 논문 랭킹 방안 (Scientific Literature Ranking Considering Latent Citations)

  • 황세미;배덕호;김상욱
    • 정보처리학회논문지D
    • /
    • 제19D권1호
    • /
    • pp.15-20
    • /
    • 2012
  • 본 논문에서는 예전 논문의 기득권 현상을 해결하기 위해 한 논문이 현재 다른 논문들로부터 받은 참조뿐만 아니라, 해당 논문의 잠재적인 참조도 함께 고려하는 랭킹 방안을 제안한다. 더 나아가, 논문의 정확한 랭킹 측정을 위해 두 논문 간의 내용 연관성도 함께 고려하는 랭킹 방안을 제안한다. 마지막으로, 실제 논문 데이터를 이용한 다양한 실험들을 통해, 제안 방안의 우수성을 입증한다.

스크랩 기능을 지원하는 블로그 공간에서 포스트 랭킹 방안: 알고리즘 및 성능 평가 (Post Ranking in a Blogosphere with a Scrap Function: Algorithms and Performance Evaluation)

  • 황원석;도영주;김상욱
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.101-110
    • /
    • 2011
  • 블로그의 사용량이 증가함에 따라 다수의 포스트들이 블로고스피어 내에 작성되고 있으며, 이는 검색에서 웹 서퍼가 양질의 포스트를 찾기 어렵게 하는 문제를 가져왔다. 이로 인하여 포스트 검색에서 랭킹을 부여하기 위한 랭킹 알고리즘의 필요성이 부각되고 있다. 기존에 웹 문서를 위한 다양한 랭킹 알고리즘들이 있었으나, 웹 문서와 포스트의 차이로 인하여 직접 적용하기 어렵다는 문제점이 존재한다. 본 논문에서는 블로거들이 포스트에 남긴 블로그 액션을 이용하여 포스트에 랭킹을 부여하는 방안인 포스트 랭킹 알고리즘들을 제안한다. 그리고 실제 블로그 데이터를 이용하여 포스트 랭킹 알고리즘들의 성능을 분석하고, 이를 바탕으로 블로그에 적합한 포스트 랭킹 알고리즘을 선별한다.

태그쌍의 의미유사도 기반 태그 랭킹 시스템 (Tag Ranking System based on Semantic Similarity of Tag-pair)

  • 이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1305-1314
    • /
    • 2013
  • 기존의 태그 기반 시스템들은 콘텐츠에 태깅된 태그들을 활용한 단일 태그 매칭을 통해 검색결과를 제공함에 따라 정확도가 낮은 검색결과를 제공하고 있으며, 또한 사용자들이 콘텐츠에 태깅 시 태그간의 연관관계 및 우선순위는 고려하지 않아 태그가 가지고 있는 콘텐츠와 관련된 정보들을 효율적으로 제공하지 못하고 있다. 이에 본 논문에서는 위의 문제점을 해결하기 위해 태그 기반 시스템에 적합한 태그간 의미 유사도를 추출하여 콘텐츠에 태깅된 태그들을 재 랭킹하기 위한 태그 랭킹 시스템을 제안하였다. 제안 시스템의 성능 평가는 이미지에 태깅된 태그(baseline)와 태그 동시출현 빈도수 기법을 적용한 랭킹(frequency) 결과를 본 논문에서 제안한 태그 랭킹 시스템에 의해 추출된 랭킹 결과와 비교 실험하였다.

분산메모리 머신에서의 병렬 윤곽선 랭킹 (Parallel Contour Ranking in a Distributed-Memory Machine)

  • 정용화;박진원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.741-743
    • /
    • 1998
  • 본 논문에서는 분산메모리 머신에서 병렬 이미지 윤곽선 랭킹 문제를 해결하는 새로운 알고리즘을 제안한다. 윤곽선 랭킹 문제는 주어진 이미지의 에지 윤곽선으로부터 에지 윤곽선의 선형적 표현 방식을 생성시키는 것으로, 에지점간의 순차적인 데이터 종속관계를 갖는 이 문제를 분산메모리 머신에서 수행하려면 입력 이미지에 의한 데이터의 불균형 분포와 불규칙적인 프로세서간 데이터 종속 문제를 해결해야 한다. 본 논문에서는 이 두 가지 문제를 동시에 해결할 수 있는 병렬 알고리즘을 제안하고, 제안된 알고리즘을 IBM SP2에 구현하였으며, 그 결과 윤곽선 랭킹 문제가 효과적으로 해결되었음을 확인하였다.

  • PDF

질의 응답 시스템에서 구문 근접성에 기반한 정답 후보 랭킹 방법 (Answer Candidate Ranking based on Syntactic Proximity in Question Answering)

  • 나승훈;강인수;권오옥;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.478-480
    • /
    • 2002
  • 질의 응답 시스템의 성능을 높이기 위해서는 정답 후보(Answer Candidate)를 랭킹하는 방법이 매우 중요하다. 본 논문에서는 기존의 정답 후보 랭킹을 위해 사용하던 위치 근접성의 문제점을 제시하고, 이를 보완하기 위한 구문 근접성을 이용하는 방법에 대해 제안한다. 실험 결과는 논문에서 제안한 구문 근접성을 사용한 정답 후보 랭킹 방법이 위치 근접성을 이용만 방법보다 더 개선된 방법임을 보여준다

  • PDF

블로그 환경을 위한 포스트 랭킹 알고리즘 (Post Ranking Algorithms in Blog Environment)

  • 황원석;도영주;배덕호;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.189-193
    • /
    • 2008
  • 블로그는 개인의 생각을 온라인상의 문서인 포스트로 남기는 일종의 개인 홈페이지이다. 웹 문서와 포스트는 다른 특징을 가지고 있기 때문에 웹 문서 랭킹 알고리즘을 포스트에 적용하기에는 문제점이 존재한다. 본 논문에서는 포스트의 랭킹을 위한 포스트-블로거 그래프를 정의하고, 기존의 웹 문서 랭킹 알고리즘을 포스트-블로거 그래프에 적합하게 변형한 포스트 랭킹 알고리즘을 제안한다. 그리고 실제 블로그 데이터를 통하여 포스트 랭킹 알고리즘의 성능을 분석하고, 이를 바탕으로 블로그에 적합한 포스트 랭킹 알고리즘을 선별한다.

  • PDF

클러스터링 및 랭킹 기법을 활용한 트위터 인플루엔셜 추출 연구 (A study on finding influential twitter users by clustering and ranking techniques)

  • 최준일;장중혁
    • 한국산업정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.19-26
    • /
    • 2015
  • 최근 SNS 서비스의 확산과 스마트 장치의 일반적인 보급에 따라 수많은 사용자들이 트위터를 비롯한 SNS를 이용하고 있다. 본 논문에서는 영향력 높은 트위터 사용자를 찾기 위한 방법으로 클러스터링 및 랭킹 기법을 적용하는 연구를 수행하였다. 트위터에서 일반적으로 중요하다고 여겨지는 follow, Retweet을 포함한 총 5가지의 랭킹 요소를 제안하고 해당 랭킹 요소들을 클러스터링을 위한 초기 중심점 선정 시 기준으로 설정함으로써 클러스터링 결과의 향상을 위한 비교 실험을 수행하였다. 이를 통해 트위터 인플루엔셜 추출의 새로운 방향을 제시할 수 있을 것으로 사료된다.

랭킹 결합에 의한 기술용어 패러프레이즈 추출 (Terminological Paraphrase Extraction with Ranking Combination)

  • 최성필;조민희;정한민;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-180
    • /
    • 2012
  • 기술용어 패러프레이즈 (Terminological Paraphrase, TP)는 학술 문헌 내에서 기술 용어의 개념 및 정의를 다른 형태로 풀어서 알기 쉽게 서술적 문구 (descriptive expression) 를 의미한다. 이러한 TP들에 대한 효율적인 식별과 추출은 학술 정보에 대한 개념적 접근이나 학술 정보 검색의 재현율 향상에 매우 중요하다. 본 논문은 생명 공학 분야의 논문에 나타나는 다양한 형태의 TP들을 효율적으로 추출하기 위한 정보 검색 기반의 추출 방법론을 제시하고 총 여섯 가지의 추출 랭킹 모델을 기반으로 이를 결합함으로써 TP추출의 확장 가능성에 대한 실험적 연구를 수행한다. 실험 결과, 활용된 랭킹 모델이 서로 상호 보완적인 관계에 있음을 알 수 있었으며, 랭킹 결합에 의한 성능 개선 효과를 얻을 수 있었다.

  • PDF

랭킹 SVM과 RDBMS의 밀결합 통합 (Tightly Coupled Integration of Ranking SVM and RDBMS)

  • 송재환;오진오;양은석;유환조
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.247-253
    • /
    • 2009
  • 지난 십 년간 랭킹은 데이터 마이닝 분야의 활발한 연구분야였다. 그러나 랭킹은 다른 데이터 마이닝 기법들과 비슷하게 RDBMS와는 독립적으로 개발되었고, 그로 인해 기존에 널리 사용되고 있는 RDBMS들과의 연동성이 떨어진다는 단점이 존재하게 되었다. 다른 데이터 마이닝 기법들은 소결합이나 밀결합 접근법을 이용하여 RDBMS와 연동하기 위한 연구가 활발하게 진행되어 왔고, 그 결과 실제로 사용 가능한 응용시스템들이 나오게 되었다. 그러나 랭킹에서는 이와 같은 노력들이 잘 이루어지지 않고 있다. 본 논문에서는 랭킹 작업을 RDBMS에 연동하여 효율적으로 수행하기 위하여 MySQL에 Ranking SVM을 통합하는 작업을 진행하였다. 밀결합 접근법을 기반으로 하는 우리의 구현은 MySQL에 랭킹을 위한 새로운 SQL 명령어를 추가하였고 랭킹 작업의 효율성을 확인하기 위해서 소결합 접근법을 기반으로 하는 Ranking SVM과 성능을 비교 평가하여 훈련단계에서 $10{\sim}40%$, 예측단계에서 평균 60%의 성능향상을 확인할 수 있었다.