• 제목/요약/키워드: 인용레코드

검색결과 9건 처리시간 0.02초

자동 인용 색인 구축을 위한 템플릿을 적용한 인용 레코드 추출 (Citation Record Extraction Using Template For Construction of Automatic Citation Index)

  • 구희관;황미녕;홍순찬;정한민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.188-190
    • /
    • 2012
  • 인용 레코드 추출은 인용 색인 구축의 모든 프로세스 입력으로 사용되기 때문에 이후의 과정에 미칠 수 있는 부작용을 고려해서 최대한 정확한 정보가 추출되어야 한다. 본 논문에서는 수집한 논문의 참고문헌 영역을 인식하고 이를 참고문헌 영역 내의 특징들을 이용하여 인용 레코드를 추출하는 템플릿 기반 인용 레코드 추출을 제안한다. 제안된 추출 방법은 기존 방법보다 18% 성능이 증가했으며 전체 인용 레코드에 대한 추출성능은 0.98(F1)의 성능을 보인다. 이는 향후 논문 저장소에서 논문을 대상으로 영역 인식을 통한 정보 추출에 유용하게 활용될 수 있으리라 기대된다.

인용 필드 정규화와 타입이 인용매칭에 미치는 영향 (Influence of Normalization and Types of Citation Fields on Citation Matching)

  • 구희관;정한민;성원경
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.395-403
    • /
    • 2008
  • 본 논문은 인용필드의 정규화와 타입이 인용매칭에 미치는 영향에 대한 분석을 제시한다. 인용매칭은 같은 논문을 참조하는 인용레코드를 군집화하는 일련의 과정을 지칭한다. 인용매칭은 인용레코드를 구성하고 있는 인용필드들 간의 비교 결과들을 조합하여 인용레코드의 일치 여부를 판별하는 것이다. 인용매칭 단계 내의 인용필드 간 비교를 위하여 인용필드 정규화 및 인용필드 타입에 대한 연구가 필요하였으나, 인용매칭 방법에 대한 연구에 비해 상대적으로 미흡하였다. 본 연구에서는 인용매칭 성능이 인용필드의 정규화 및 인용필드 타입에 따라 달라진다는 것을 보였다. 추가적으로, 정규화를 적용한 다중 필드 결합을 이용한 인용매칭 성능을 분석하였다. 실험결과에 의하면, 인용필드는 정규화를 통하여 전반적인 성능향상이 있었으며, 인용필드 타입에 따라 성능 양상이 다르게 나타났다.

사회연계망 구축을 위한 인용 매칭에서의 인용 필드 분해 영향 분석 (Influence of Citation Field Segmentation on Citation Matching for Social Network Construction)

  • 구희관;강인수;정한민;이승우;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.194-201
    • /
    • 2007
  • 인용 매칭(Citation Matching, CM)은 동일한 논문을 지칭하는 인용레코드(Citation Record)를 군집화하는 것으로 인용 관계를 가진 사회연계망 구축시 필요한 기술의 하나이다. 인용 매칭의 전단계로써, 인용 레코드를 저자, 논문 제목, 게재지명, 발행연도 등의 필드로 구분하는 인용 필드 분해가 고려될 수 있다. 본 논문은 인용 필드 분해(Citation Field Segmentation, CFS)와 인용 매칭의 상관관계를 분석하고자 한다. 즉, 인용 필드 분해가 인용 매칭에 필수적인 단계인지를 밝히고 개별 인용 필드가 인용 매칭에 미치는 영향을 분석한다. 실험을 통해 인용 필드 분해를 한 인용 매칭(CFS-based CM)이 인용 필드 분해를 적용하지 않은 인용 매칭(CFS-free CM)에 비해 1% 내외의 성능의 차이를 보이므로, 인용매칭의 성능에 크게 영향을 미친다고 보기 어려웠다. 이는 인용 레코드의 서로 다른 필드들 사이에서 어휘 중복 비율이 크게 낮기 때문에 따로 필드를 구별하지 않아도 필드가 구별되는 특성때문이었다.

  • PDF

인용 필드 정규화와 인용매칭의 관계 연구 (Study on the Relation of Field Normalization with Citation Matching)

  • 구희관;강인수;정한민;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-74
    • /
    • 2008
  • 본 논문은 인용필드 정규화와 인용매칭의 관계에 대한 분석을 제시한다. 인용매칭은 논문에서 수집된 인용레코드의 인용필드들 간의 비교 결과를 조합하여 동일 논문의 참조여부를 판별하여 인용레코드를 군집화한다. 따라서 인용매칭에 성능을 높일 수 있는 인용필드와 인용매칭 성능의 관계에 대한 연구가 필요하다. 본 논문에서는 인용필드 정규화 및 필드 별 결합에 의하여 인용매칭 성능이 변화하는 것을 보였다. 또한, 인용매칭 성능을 인용필드 유사도와의 관점에서 분석하였다. 앞으로, 인용필드 정규화 및 특성이 인용매칭에 미치는 영향에 대한 이해를 넓혀, 이를 인용매칭에 활용할 수 있으리라 여겨진다.

  • PDF

개별 인용 필드의 인용 매칭에 대한 영향력 평가 (Evaluating an Influence of Individual Citation Field on Citation Matching)

  • 구희관;강인수;정한민;이승우;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.414-417
    • /
    • 2007
  • 인용 매칭(Citation Matching, CM)은 동일한 논문을 지칭하는 인용레코드(Citation Record)를 군집화하는 방법이다. 일반적으로, 저자, 논문제목, 게재지명이나 출판연도 등의 인용 필드로 구분하는 인용 필드 분해가 인용 매칭 보다 선행하게 된다. 상당히 많은 연구가 인용 매칭과 인용 필드 분해의 문제를 해결하고자 했지만, 인용 필드 분해와 인용 매칭과의 상관관계에 대한 연구는 부족하였다. 인용 매칭에 대한 인용 필드 분해의 여러 측면 중에, 본 논문은 인용 매칭에 가장 영향력이 있는 인용 필드를 밝히고자 한다. 첫 번째 시도로, 수작업으로 인용 필드 분해를 수행한 다양한 크기의 인용 필드 집합에 대하여 인용 매칭의 성능을 비교하였고, 그 결과 많은 인용 필드를 사용한 인용 매칭이 인용 레코드를 더 잘 군집화 할 수 있다는 것을 확인하였다.

  • PDF

이학분야 국내학술논문의 DOI기반 인용분석 연구 (A Study on the Citation Analysis of korea science journal based on Digital Object Identifier)

  • 정은경;곽승진
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2012년도 제19회 학술대회 논문집
    • /
    • pp.115-119
    • /
    • 2012
  • 본 연구의 목적은 이학분야 국내학술지 중 DOI를 기반으로 하여 인용정보를 제공하고 있는 학술지를 대상으로 피인용정보를 분석하고 WoS, Scopus와 비교를 통해 유사점과 차이점을 찾는 것이다. DOI를 등록하고 있고 WoS, Scopus에 공통으로 등재되어있는 5종의 이학분야 학술지의 CrossRef 피인용정보를 분석한 결과 논문수가 많은 2개 학술지의 인용률이 높았으며 모두 낮은 자기인용률을 보이고 있다. 전체적으로 CrossRef의 고유논문은 논문수와 인용수가 가장 큰 학술지 1종만이 11%이고 나머지 4종의 학술지는 5% 미만으로 대부분 WoS, Scopus 논문에 포함되었다. DB별 비교를 위해 3년간(2008~2010) 발행된 논문의 피인용도를 확인한 결과 모든 학술지에서 WoS의 인용률이 가장 높았고 CrossRef의 경우 레코드 수는 많지만, 전문색인DB가 아니고 참고문헌 등록이 모두 이뤄지지 않아 인용률이 가장 낮았다. 하지만 CrossRef 고유논문비율이 11%인 학술지의 경우 Scopus 보다 인용률이 높은 것으로 나타났다.

  • PDF

공공도서관 온라인 목록의 보강된 콘텐츠에 관한 연구 (A Study on the Enriched Contents of OPACs of Public Libraries in Korea)

  • 윤정옥
    • 한국도서관정보학회지
    • /
    • 제50권4호
    • /
    • pp.181-201
    • /
    • 2019
  • 이 연구의 목적은 우리나라 공공도서관 OPAC이 제공하는 보강 콘텐츠의 현황 및 내용을 분석하고 도서관의 역할을 검토하는 것이다. 2019년 9월부터 10월 사이 국립중앙도서관의 '국가자료종합목록(KOLIS-NET)'에서 검색한 『전두환 회고록』 소장 125개 공공도서관 및 『반일 종족주의』 소장 260개 공공도서관 OPAC을 조사한 결과, 책 소개, 요약, 서평 등 보강 콘텐츠는 대부분 알라딘 인터넷 서점, 네이버, 다음 등 포털이 제공하였으며, 출판사의 일방적 홍보성 책 소개와 본문 인용만을 포함하였다. 보강 콘텐츠는 서지레코드에서 '외부정보' 등 별도 필드에서 링크 제공, 서지레코드 내에서 직접 전부 혹은 일부 디스플레이, 책 소개를 포함한 여러 보강 콘텐츠를 바로 보여주는 방식 등으로 제공되었다. 그러나 객관적, 전문적 서평 없이, 출판사의 일방적 홍보성 책 소개와 본문 인용에 한정된 보강 콘텐츠는 이용자의 책 이해에 크게 기여하기 어려움에 따라, 사서들의 적극적 평가와 직접적 작성 등 개입이 필요함을 지적하였다.

의학학술지 평가지표의 변별력 측정연구 (An Analysis of the Discriminating Power of Medical Journal Evaluation Criteria)

  • 이춘실
    • 한국비블리아학회지
    • /
    • 제14권1호
    • /
    • pp.199-218
    • /
    • 2003
  • 본 연구에서는 대한의학학술지편집인협의회가 1997년부터 1999년 사이에 평가한 76종의 국내 의학학술지가 받은 총 33개 평가항목의 각 항목별 평가점수와 총평점의 분포, 그리고 이들의 상관관계를 분석하여 각 평가지표의 변별력을 측정하였다. 한국 의학학술지의 대표적인(변별력이 높은) 평가지표는 투고논문의 상호심사와 관련된 평가항목과, 학술지가 일정한 형식으로 일관성 있게 잘 만들어지고 있는지를 평가하는 항목으로 판명되었다. 논문상호심사제도(peer review system)가 학술지의 질관리에 있어서 매우 중요하다는 것은 주지의 사실이다. 학술지의 철저한 편집(quality of editorial work)과 출판품질 관리(production quality)가 학술지 평가의 좋은 척도가 될 수 있다는 것은 학술지 평가사업의 경제성과 효율성의 측면에서 매우 고무적인 일이다. 편집인 교체빈도나 연간 발행회수 등은 변별력이 거의 없는 평가지표로 나타났다. 평가대상 학술지가 우리나라 의학도서관에 비치되어 있는 정도나 권말색인 작성여부 등 변별력이 낮은 평가항목의 변별력을 높이기 위해서는 평가방법의 개선이 필요하며, 자체학술지 인용비율, SCI 인용빈도나 영향력지표 등의 평가항목은 평가배점 구간의 조정이 필요한 것으로 나타났다. SCI에서의 인용과 국제 데이터베이스 등재여부만이 아니라, 국내 학술지가 인용하는 빈도나 영향력지표, 국내에서 구축되고 있는 의학관련 데이터베이스 등재 여부, 레코드 입력율 등의 새로운 평가지표 개발이 필요하다.

  • PDF

온라인 검색(檢索)에 있어서 검색전략(檢索戰略)과 전술(戰術) (The Strategy and the Tactics for Online Searching)

  • 이혁제
    • 정보관리연구
    • /
    • 제26권1호
    • /
    • pp.80-98
    • /
    • 1995
  • 검색전략(檢索戰略)은 효과적인 탐색을 수행하는 수단이다. 검색전략(檢索戰略)의 여러 연구 중에서 베이츠의 탐색전술은 자주 인용되고 소개되어 왔으나, 대부분의 연구는 피상적이었다. 본 논문에서는 베이츠의 탐색전술의 내용을 자세하게 조사하고 베이츠의 탐색전술에 기초하여 실제 온라인 탐색과정을 기술하려고 노력하였다. 사용된 전술(戰術)을 구분하기 위하여 다음의 3가지 유형의 조사가 이루어 졌다. (1) 다른 유형의 조직에 속하고, 다른 유형의 데이터베이스를 사용하는 7명의 탐색자와의 면담 (2) 온라인 탐색 레코드의 분석 (3) 1년간 신문 데이터베이스의 검색 신청서의 분석 결론적으로 베이츠 전술의 일부가 빠지고 자주 사용된 새로운 전술이 추가되었다. 다음의 5가지 요소가 온라인 검색행위(檢索行爲), 검색전략(檢索戰略), 검색전술(檢索戰術)에 영향을 미친다. (1) 탐색요구의 난이도 (2) 데이터베이스의 내용 (3) 온라인 탐색의 요금정책(검색비용의 부담자) (4) 탐색과정에서 이용자의 동석여부 (5) 탐색자의 온라인 경험 제한된 조건에서 전형적인 전술이 제안되었다. 그러나 전술의 사용유형을 일반화하기 위해서는 많은 조사연구가 필요하다.

  • PDF