• 제목/요약/키워드: 주제연관성

검색결과 252건 처리시간 0.024초

Scopus에 설정된 주제분류 활용도 및 상호 연관성에 대한 고찰 (Assessing the Utilization and Interrelatedness of Scopus Subject Categories)

  • Kim, Eungi
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.251-272
    • /
    • 2019
  • 본 연구는 Scopus의 분류시스템에서 설정된 주제분류의 활용도와 상호연관성을 조사했다. 연구 수행의 범위는 2017년도 Scopus 색인에 포함된 저널의 대 주제 분류 및 소 주제분류를 포함하였다. 연구의 결과는 Scopus의 주제 분류별 활용도에서의 빈도수나 주제분류간 상호연관성에서도 다양한 양상을 보였다. 이 가운데 대 주제분류활용률과 상호연관성의 양상은 의학과 사회과학분야에서 가장 활발하고 다양하게 나타났다. 한편, 소 주제분류에서는 "2700 General Medicine"이 상호연관 측면에서 최고의 다양성을 보여주었다. 이외에 쌍을 이루는 소 주제분류 간의 동시 빈도수 분석에서 특징적인 상호연관성을 보이는 경우들을 발견하였는데 같은 분야의 주제어가 비슷한 연관성, 분야는 다르지만 주제가 연결된 연관성, 주제어간 상,하위범주의 연관성의 경우들이다. 소수의 소 주제분류간에는 매우 유사한 주제어를 사용한 경우들도 있었다. 이러한 주제분류별 활용도와 주제분류간의 상호연관성들이 보여주는 다양한 양상들로 인해 연구수행에 있어서 대 주제분류뿐만 아니라 대주제 분류에 많은 영향을 미치는 소 주제분류까지도 면밀하게 살펴볼 필요가 있다.

주제어 기반 문서 클러스터링 알고리즘 (Keyword-based Document C lustering Algorithm)

  • 장성호;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.469-471
    • /
    • 2002
  • 높은 연관성을 갖는 문서들을 서로 집단화시키는 문서 클러스터링은 문서와 문서간의 연관성을 확인할 수 있는 문서의 주제어 추출이 중요한 문제이며 일반적인 정보검색 시스템에서 사용하는 출현빈도에 의한 주제어 추출은 성능 향상에 한계가 있다. 또한, 문서 클러스터링은 문서를 집단화시키기 위해 문서간 연관성을 확인하기 위해 유사도 계산에 따른 시간과 공간을 많이 소비하는 문제를 가지고 있다. 본 논문에서는 주제어 추출 기법을 적용하여 주제어 연관성에 의해 문서들을 집단화시키는 새로운 방법의 문서 클러스터링 알고리즘을 제안한다.

  • PDF

텔레비전 뉴스 영상의 구조적 요소와 주제연관성 시계열 분석 (Time Analysis of Structural Element and Theme Association of Television News Imagery)

  • 박덕춘
    • 한국콘텐츠학회논문지
    • /
    • 제11권7호
    • /
    • pp.100-109
    • /
    • 2011
  • 본 논문은 텔레비전 뉴스에 있어서 '현장성'과 '사실성'의 지표가 될 수 있는 뉴스 영상의 구조적 요소와 주제연관성이 시대적 배경에 따라 어떤 차이가 있는지 그리고 그 함의가 무엇인지 살펴본 내용연구이다. 기존의 텔레비전 뉴스에 관한 여러 연구들은 대부분 동시대의 뉴스를 대상으로 한 횡적 연구에 집중하여 시대적 변화를 반영하는 종적 연구에는 상대적으로 소홀한 감이 없지 않았다. 따라서 본 연구에서는 1987년부터, 2007년까지 MBC뉴스데스크에서 방송된 뉴스를 대상으로, 5년 간격으로 체계적 무선표집방법을 통해 추출한 총 729개 아이템의 11,945개의 샷을 분석하였다. 본 연구를 통해서 1987년과 2007년의 텔레비전 뉴스 영상에는1992년과 2002년에 비해 '현장성'과 '사실성'을 충실히 반영한 '사운드바이트'와 '사건화면', 그리고 주제와의 연관성이 높은 '직접연관' 화면의 비중이 높게 나타났으나, 1997년에는 이들 요소의 비중이 상대적으로 낮게 나타나고, '현장성'과 '사실성' 측면에서 취약한 '로케이션 화면', '구성화면' '자료화면', 그리고 '간접연관'과 '축어적 연관' 화면의 비중이 크게 나타남으로써, 현실기반의 뉴스 보도가 충실히 이루어지지 못하였음을 알 수 있었다.

공공도서관 동시 대출 도서의 주제 연관성 분석 연구 (A Study on the Topical Associations of Simultaneously Borrowed Books in Public Libraries)

  • 강우진;정인영;이종욱
    • 한국도서관정보학회지
    • /
    • 제54권3호
    • /
    • pp.33-55
    • /
    • 2023
  • 공공도서관 대출데이터를 활용하여 이용자의 정보 이용행위를 이해하려는 노력이 꾸준히 이어지고 있다. 본 연구에서는 공공도서관 이용자가 동시에 대출한 도서들의 주제 분야를 살펴보고, 이들 간의 연관성을 파악하고자 하였다. 이를 위해 2019년에 이루어진 대출 도서 984,790권의 한국십진분류기호를 활용하여 같은 날 동일한 이용자에 의해 대출된 도서 목록의 집합인 동시 대출 건수 22,443,699에 대해 ITEM2VEC 기법을 적용하여 분류기호를 벡터로 변환하였다. 다음으로 연관성이 높은 분류기호를 10개씩 추출하였으며, 총 522개의 분류기호를 활용하여 네트워크를 생성하였다. 네트워크에서는 15개 커뮤니티를 식별하였으며, 커뮤니티별 주요 특성을 파악하였다. 15개의 커뮤니티 가운데 두 개 이상의 주류로 구성된 커뮤니티에서는 요목 수준에서 의미 있는 주제적 연관성을 파악할 수 있었다. 본 연구는 이용자의 도서 이용행위에 기초하여 함께 대출될 가능성이 있는 자료의 주제를 파악한 것으로 도서관 장서 구성 및 배치, 관련 주제 분야 자료 추천, 분류표 개정 등에 유익한 시사점을 제공할 수 있을 것이다.

빅데이터 연구 논문의 주제 분야 연관관계 분석: 동시 인용 관계를 적용하여 (Subject Association Analysis of Big Data Studies: Using Co-citation Networks)

  • 곽철완
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.13-32
    • /
    • 2018
  • 본 연구의 목적은 빅데이터 연구 논문의 주제 분야 간의 연관관계를 분석하는데 있다. 동시 인용관계를 적용하여 분석 대상의 주제 분야를 추출하였으며, R 프로그램의 Apriori 알고리즘을 이용하여 연관관계의 규칙을 분석하고, arulesViz 패키지를 사용하여 시각화하였다. 연구 결과 22개 주제 분야가 추출되었는데, 이들 주제 분야는 3가지 군집으로 구분되었다. 주제 분야의 연관관계 유형을 분석한 결과, 연관관계의 복잡성에 따라 '전문형', '일반형', '확대형'으로 구분되었다. 전문형에는 문헌정보학, 신문방송학 등이 포함되었고, 일반형에는 정치외교학, 무역학, 관광학 등이 포함되었고, 확대형에는 기타인문학, 사회과학일반, 관광학일반 등이 포함되었다. 이 연관관계는 빅데이터 연구자가 한 주제분야를 인용할 때 관계가 있는 다른 주제 분야를 인용하는 경향을 보여주는 것으로, 도서관에서 학술정보서비스를 위해 연관관계를 활용한 서비스를 고려해야 할 필요가 있다.

전자문화지도에서의 주제별 중첩 기능 활용 방안 (Application Plans of Thematic Overlap Function in Electronic Cultural Atlas)

  • 이동열;강지훈;문상호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.445-447
    • /
    • 2014
  • 최근에 전자문화지도에 대한 관심이 늘어나면서 다양한 주제를 기반으로 한 전자문화지도들이 연구 및 개발되고 있는 추세이다. 그러나 기존의 전자문화지도들은 대부분 단일 주제로 제작되므로 주제들 간의 연관성 분석이 어렵고, 전자문화지도들이 서로 연계되어 있지 않아 다양한 관점을 기반으로 한 활용이 미흡한 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 하나의 전자문화지도에 레이어 기능을 활용하여 다양한 주제들을 표현하는 방안을 제시한다. 또한, 이를 기반으로 전자문화지도에서의 주제별 중첩 기능을 활용하여 주제들 간의 연계 관계를 효율적으로 파악하고 다양한 주제들의 연관 관계를 통해 새로운 지식을 도출해 낼 수 있는 활용 방안을 제시하고자 한다.

  • PDF

연관도를 계산하는 자동화된 주제 기반 웹 수집기 (An Automated Topic Specific Web Crawler Calculating Degree of Relevance)

  • 서혜성;최영수;최경희;정기현;노상욱
    • 인터넷정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.155-167
    • /
    • 2006
  • 인터넷을 사용하는 사람들에게 그들의 관심사와 부합하는 웹 페이지를 제공하는 것은 매우 중요하다. 이러한 관점에서 본 논문은 각 웹 페이지의 주제와 연관된 정도를 계산하여 웹 페이지 군(cluster)을 형성하며, 단어빈도/문서빈도 엔트로피(entropy) 및 컴파일된 규칙을 이용하여 수집된 웹 페이지를 정제하는 주제 기반 웹 수집기를 제안한다. 실험을 통하여 주제 기반 웹 수집기에 대한 분류의 정확성, 수집의 효율성 및 수집의 일관성을 평가하였다. 첫째, C4.5, 역전패(back propagation) 및 CN2 기계학습 알고리즘으로 컴파일한 규칙을 이용하여 실험한 웹 수집기의 분류 성능은 CN2를 사용한 분류 성능이 가장 우수 하였으며, 둘째, 수집의 효율성을 측정하여 각 범주별로 최적의 주제 연관 정도에 대한 임계값을 도출할 수 있었다. 마지막으로, 제안한 수집기의 수집정도에 대한 일관성을 평가하기 위하여 서로 다른 시작 URL을 사용하여 수집된 웹 페이지들의 중첩정도를 측정하였다. 실험 결과에서 제안한 주제 기반 웹 수집기가 시작 URL에 큰 영향을 받지 않고 상당히 일관적인 수집을 수행함을 알 수 있었다.

  • PDF

딥러닝 기반의 뉴스 분석을 활용한 주제별 최신 연관단어 추출 기법 (A Topic Related Word Extraction Method Using Deep Learning Based News Analysis)

  • 김성진;김건우;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 정보검색의 효율성을 위해 데이터를 분석하여 해당 데이터를 가장 잘 나타내는 연관단어를 추출 및 추천하는 연구가 활발히 이루어지고 있다. 현재 관련 연구들은 출현 빈도수를 사용하는 방법이나 LDA와 같은 기계학습 기법을 활용해 데이터를 분석하여 연관단어를 생성하는 방법을 제안하고 있다. 기계학습 기법은 결과 값을 찾는데 사용되는 특징들을 전문가가 직접 설계해야 하며 좋은 결과를 내는 적절한 특징을 찾을 때까지 많은 시간이 필요하다. 또한, 파라미터들을 직접 설정해야 하므로 많은 시간과 노력을 필요로 한다는 단점을 지닌다. 이러한 기계학습 기법의 단점을 극복하기 위해 인공신경망을 다층구조로 배치하여 데이터를 분석하는 딥러닝이 최근 각광받고 있다. 본 논문에서는 기존 기계학습 기법을 사용하는 연관단어 추출연구의 한계점을 극복하기 위해 딥러닝을 활용한다. 먼저, 인공신경망 기반 단어 벡터 생성기인 Word2Vec를 사용하여 다양한 텍스트 데이터들을 학습하고 룩업 테이블을 생성한다. 그 후, 생성된 룩업 테이블을 바탕으로 인공신경망의 한 종류인 합성곱 신경망을 활용하여 사용자가 입력한 주제어와 관련된 최근 뉴스데이터를 분석한 후, 주제별 최신 연관단어를 추출하는 시스템을 제안한다. 또한 제안한 시스템을 통해 생성된 연관단어의 정확률을 측정하여 성능을 평가하였다.

공공도서관의 주제별 자료 이용 현황 분석: 서울특별시 A구 산하 공공도서관을 중심으로 (A Study on Collection Use of an Public Libraries Focused of the Clustering Analysis of Circulation Statistics of the Seoul Borough A Library Users)

  • 김완종
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.353-369
    • /
    • 2014
  • 본 연구는 서울특별시 A구 산하 9개 도서관 이용자들의 대출 기록을 모두 조사하여 주제별 장서이용 행태를 분석하고 주제 분야 간 어떠한 연관성을 지니고 있는가를 알아보는데 그 목적이 있다. 이를 위하여 2006년 6월부터 2014년 6월까지 발생한 2,723,115건의 대출 기록을 수집하여 분석하였다. 한국십진분류(KDC)에 따라 총류(000)부터 역사(900)까지 10개 대분류와 총류(000)부터 전기(990)까지 100개 중분류로 나누어 주제별 대출빈도를 분석하였으며, 도서관 이용자들의 대출기록 기록을 중분류에 따른 상관계수에 근거한 군집분석을 통하여 주제별 연관성을 분석하였다.

그래프 분할을 이용한 문장 클러스터링 기반 문서요약 (Document Summarization Based on Sentence Clustering Using Graph Division)

  • 이일주;김민구
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.149-154
    • /
    • 2006
  • 문서요약은 여러 개의 하위 주제로 구성되어 있는 문서에 대해 문서의 복잡도를 줄이면서 하위 주제를 모두 포함하는 요약문을 생성하는 것이 목적이다. 본 논문은 그래프 분할을 이용하여 하위 주제별로 중요 문장을 추출하는 요약시스템을 제안한다. 문장별 공기정보에 의한 단어의 연관성 분석을 통해 선정된 대표어를 이용하여 문서를 그래프로 표현한다. 그래프는 연결정보에 의해 하위 주제를 의미하는 부분 그래프로 분할되며 부분 그래프는 긴밀한 관계를 갖는 문장들이 클러스터링된 형태이다. 부분 그래프별로 중요 문장을 추출하면 하위 주제별 핵심 내용들로만 요약문을 구성하게 되어 요약 성능이 향상된다.