• 제목/요약/키워드: 저자키워드

검색결과 145건 처리시간 0.03초

개념기반 복합키워드 추출방법 (Concept-based Compound Keyword Extraction)

  • 이상곤;이태헌
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.23-31
    • /
    • 2003
  • 인간은 문서를 읽고 그 내용을 머릿속에서 개념적으로 정리하여 적은 수의 복합단어를 이용하여 문서를 대표하는 적당한 키워드로 정리한다. 본 논문은 이러한 점에 착안하여 문서를 대표하는 키워드를 추출하는 방법을 제안한다. 학술논문을 실험 예로 사용하여 저자가 자신의 문서에 부여한 키워드가 문서의 본문 중에 출현하지 않는 경우에도 동작하도록 출현단어의 개념정보를 기초로 복합어 생성규칙을 구축한다. 문서의미와 상관없는 키워드의 추출을 억제하기 위해 중요도 결정법을 새로 제안한다. 추출된 키워드의 타당성 여부는 자연언어와 음성언어에 관한 논문의 제목과 요약을 수집하여 실험하였다. 또한 저자가 부여한 키워드와 본 시스템이 출력한 키워드를 비교 한 결과, 상위 한 개의 정확율이 96%가 되어 제안방법의 유용성을 확인하였다.

  • PDF

개념 규칙을 이용한 키워드 도출방법 (The Method of Deriving Keywords Using Concept Rules)

  • 이태헌;박기홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.685-687
    • /
    • 2002
  • 일반적으로 인간이 사용하는 몇 개의 주요단어를 이용하여, 문서의 분야나 주제어가 되는 일본어 키워드를 추출하는 점에 주목한다. 먼저, 학술논문에서 저자 자신이 부여한 키워드 중 분야 명이나 주제어가 문서 중에 출현하지 않는 경우를 분석하고, 단어의 개념정보를 기초로 복합어 생성규칙을 구축한다. 문서 의미와 상관없는 키워드의 추출을 억제하기 위해 중요도 결정법을 새롭게 제안한다. 추출된 키워드의 타당성 검사를 위해 자연.음성언어에 관한 일본어 논문 65파일의 타이틀과 초록부분을 이용하여 추출된 키워드의 타당성에 대한 실험을 한 결과 추출 정밀도는 중요도의 상위 1개를 출력한 경우 75%가 되어 제안방법의 유효성을 확인할 수 있었다.

  • PDF

지적구조 규명을 위한 키워드서지결합분석 기법에 관한 연구 (Introducing Keyword Bibliographic Coupling Analysis (KBCA) for Identifying the Intellectual Structure)

  • 이재윤;정은경
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.309-330
    • /
    • 2022
  • 학문의 구조, 특성, 하위 분야 등을 계량적으로 규명하는 지적구조 분석 연구가 최근 급격히 증가하는 추세이다. 지적구조 분석 연구를 수행하기 위하여 전통적으로 사용되는 분석기법은 서지결합분석, 동시인용분석, 단어동시출현분석, 저자서지결합분석 등이다. 이 연구의 목적은 키워드서지결합분석(KBCA, Keyword Bibliographic Coupling Analysis)을 새로운 지적구조 분석 방식으로 제안하고자 한다. 키워드서지결합분석 기법은 저자서지결합분석의 변형으로 저자 대신에 키워드를 표지로 하여 키워드가 공유한 참고문헌의 수를 두 키워드의 주제적 결합 정도로 산정한다. 제안된 키워드서지결합분석 기법을 사용하여 Web of Science에서 검색된 'Open Data' 분야의 1,366건의 논문집합을 대상으로 분석하였다. 1,366건의 논문집합에서 추출된 7회 이상 출현한 63종의 키워드를 오픈데이터 분야의 핵심 키워드로 선정하였다. 63종의 핵심 키워드를 대상으로 키워드서지결합분석 기법으로 제시된 지적구조는 열린정부와 오픈사이언스라는 주된 영역과 10개의 소주제로 규명되었다. 이에 반해 단어동시출현분석의 지적구조 네트워크는 전체 구성과 세부 영역 구조 규명에 있어 미진한 것으로 나타났다. 이러한 결과는 키워드서지결합분석이 키워드 간의 서지결합도를 사용하여 키워드 간의 관계를 풍부하게 측정하기 때문이라고 볼 수 있다.

JASIST 편집위원회의 연구분야와 JASIST 논문의 키워드에 관한 연구 (The JASIST Editorial Board Members' Research Areas and Keywords of JASIST Research Articles)

  • 김현정
    • 정보관리학회지
    • /
    • 제31권3호
    • /
    • pp.227-247
    • /
    • 2014
  • 본 논문은 JASIST(Journal of the Association for Information Science and Technology)의 편집위원회 구성원들의 연구분야와 JASIST에 수록된 연구논문의 키워드에 연관성이 있는지에 대한 연구로서, 저자동시인용분석을 이용하여 JASIST 편집위원회 구성원들의 특성을 파악하였고 네트워크분석을 통해 저자동시인용네트워크에서 중심성이 높은 구성원들의 연구분야를 조사하여 2013년 한 해 동안 JASIST에 수록된 연구논문의 키워드와 비교하였다. 이를 통해 JASIST 편집위원회 구성원들 중 저자동시인용네트워크에서 중심성이 높은 구성원들은 주로 정보행태, 정보검색, 정보시스템과 계량정보학에 관련된 연구를 하는 것으로 나타났으며 이는 JASIST에 수록된 연구논문의 키워드에도 가장 많이 나타나는 분야인 것으로 조사되었다.

키워드 네트워크 분석을 이용한 연구데이터 관련 국내 연구 동향 분석 (An Analysis of Domestic Research Trend on Research Data Using Keyword Network Analysis)

  • 한상우
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.393-414
    • /
    • 2023
  • 본 연구는 연구데이터 관련 국내 연구의 동향을 파악하기 위하여 RISS에서 연구데이터 관련 논문을 수집하였으며, 데이터 정제 후 총 58건의 연구논문을 대상으로 134개의 저자 키워드를 추출하여 키워드 네트워크 분석을 수행하였다. 분석 결과, 첫째, 아직까지 국내에서 연구데이터 관련 연구의 수가 58건에 지나지 않아 추후 많은 관련 연구가 진행될 필요가 있음을 알 수 있었다. 둘째, 연구데이터 관련 연구 분야는 대부분 복합학 중 문헌정보학에 집중되어 있었다. 셋째, 연구데이터 관련 저자 키워드의 빈도분석 결과 '연구데이터관리', '연구데이터공유', '데이터리포지터리', '오픈사이언스' 등이 다빈도 주요 키워드로 분석되어 연구데이터 관련 연구는 위의 키워드를 중심으로 진행되고 있음을 알 수 있었다. 키워드 네트워크 분석 결과에서도 다빈도 키워드는 연결 중심성 및 매개 중심성에서 중심적인 위치를 차지하며 관련 연구에서 핵심 키워드에 위치하고 있음을 알 수 있었다. 본 연구의 결과를 통하여 최근의 연구데이터 관련 동향을 파악할 수 있었고, 향후 집중적으로 연구해야 하는 분야를 확인할 수 있었다.

해외 데이터베이스의 통제키워드에 기초한 국내 학술지 논문의 자동분류 성능 향상에 관한 실험적 연구 (An Experimental Study on the Performance Improvement of Automatic Classification for the Articles of Korean Journals Based on Controlled Keywords in International Database)

  • 김판준;이재윤
    • 한국문헌정보학회지
    • /
    • 제48권3호
    • /
    • pp.491-510
    • /
    • 2014
  • 학술지 논문의 효율적인 관리 및 검색을 위한 주요 요소인 키워드는 통제키워드와 비통제키워드로 구분할 수 있다. 그러나 현재 국내 데이터베이스에서 대부분의 학술지 논문에는 비통제키워드인 저자키워드만이 부여되어 있을 뿐, 망라적인 탐색을 돕는 통제키워드로서 디스크립터는 제공되지 않고 있다. 이 연구에서는 해외 데이터베이스의 학술지 논문에 부여된 통제키워드를 학습한 분류기를 사용하여, 국내 학술지 논문에 디스크립터를 자동 할당하는 실험을 수행하였다. 그 결과, 국외 데이터베이스의 디스크립터 학습을 통해 영문 초록이 있는 국내 학술지 논문에 통제키워드를 자동 할당할 수 있는 가능성을 확인하였다. 또한, 다양한 분류기 및 분류기 결합을 통하여 이러한 디스크립터 자동 할당의 성능 향상을 모색하였다.

한국학술지인용색인(KCI)의 인문학, 사회과학, 예술체육 분야 저자키워드의 의미적 관계 유형 최적화 연구 (A Study on the Optimization of Semantic Relation of Author Keywords in Humanities, Social Sciences, and Art and Sport of the Korea Citation Index (KCI))

  • 고영만;송민선;이승준
    • 한국문헌정보학회지
    • /
    • 제49권1호
    • /
    • pp.45-67
    • /
    • 2015
  • 본 연구의 목적은 KCI의 인문, 사회, 예술체육 분야 저자키워드를 기반으로 구축한 구조적 학술용어사전 데이터베이스 시스템 STNet에 실제 입력된 용어들의 의미적 관계들을 분석하여 관계 유형을 최적화하고 관계명을 세분화하는 방안을 기술하는 것이다. 분석 결과, 관계 유형과 관계명을 최적화하기 위해서는 빈도수에 의한 관계명 신설 또는 관계의 유형화 제한, 관계의 방향성 고려, 기존 관계명 반영의 4가지 논리적 기준이 필요한 것으로 나타났다. STNet의 "실존인물" 클래스를 테스트베드로 삼아 이 기준을 적용해 관계 유형을 최적화하고 관계명을 세분화한 결과 원래 RT, RT_X, RT_Y로 연결된 1,743건의 관계 중 1,135건이 세분화되는 것으로 나타났다. 이는 약 65%의 RT 관계가 구체화된 것으로 사전 구축 및 검색 단계에서의 유용성 측면에서 상당한 의미가 있음을 보여주는 것이다.

한국학술지인용색인(KCI)의 인문학, 사회과학, 예술체육 분야 저자키워드의 의미적, 형태적 분석에 의한 개념범주 텍사노미 연구 (A Study on a Conceptual Taxonomy of Author Keywords of Humanities, Social Sciences, and Art and Sport in the Korea Citation Index (KCI) by Analysis of its Meaning and Lexical Morpheme)

  • 고영만;김비연;민혜령
    • 한국문헌정보학회지
    • /
    • 제48권4호
    • /
    • pp.297-322
    • /
    • 2014
  • 본 연구의 목적은 KCI의 인문학, 사회과학, 예술체육 분야 저자키워드를 대상으로 의미적, 형태적 분석을 통해 기존에 연구된 개념범주 텍사노미의 적합성을 확인하고 실용적인 개선 방안을 제시하는 것이다. 연구를 통해 '실체, 추상, 일반/공통, 개체'의 네 개 최상위수준의 개념범주를 보다 구체적이고 핵심 개념이 반영된 일곱 개의 범주 '개체, 활동/기능, 특성, 이론/방법, 형식/틀, 일반/공통, 인스턴스'로 변경하였다. 중위범주와 하위범주의 경우 신설, 세분화, 통합, 삭제, 이동 등의 방법으로 개념범주의 계층 구조를 단순화시키고 범주 간 용어분포의 불균형을 개선하였다. 구조적학술용어사전(STNet)을 테스트베드로 삼아 수정된 개념범주 텍사노미를 적용한 결과 용어의 분포가 균형적으로 이루어지고, 용어의 속성 표현이 상세화되는 효과를 보이는 것으로 나타났다.

연관규칙 기반 동시출현단어 분석을 활용한 기술경영 연구 주제 네트워크 분석 (Exploring the Research Topic Networks in the Technology Management Field Using Association Rule-based Co-word Analysis)

  • 전익진;이학연
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.101-126
    • /
    • 2016
  • 본 연구는 동시출현단어(co-word) 분석을 이용하여 기술경영 분야의 연구 주제 네트워크를 구축하고, 핵심 연구 주제 및 연구 주제 간 상호연관관계를 도출한다. 동시출현 빈도수의 정규화를 통해 키워드 간 유사성을 도출하여 무방향 네트워크를 분석하는 기존 연구들과는 달리 본 연구는 연관규칙분석(association rule)을 통해 키워드 간 신뢰도(confidence)를 도출하여 유방향 네트워크 분석을 수행한다. 2011~2014년 기술경영 분야 9개 국제 학술지에 게재된 2,456개의 논문의 저자키워드를 대상으로 빈도수 상위 200개 키워드를 추출하고, 주제(THEME), 방법(METHOD), 분야(FIELD)의 세 가지 유형으로 키워드를 분류한다. 각 유형별 일원(one-mode) 네트워크를 구축하여, 함께 많이 연구가 이루어진 키워드들을 찾아내고, 핵심 키워드를 도출한다. 또한 두 가지 유형의 키워드 간의 이원(two-mode) 네트워크를 구축하여, 연구 주제별로 함께 많이 활용된 방법 및 대상 분야를 탐색한다. 본 연구 결과는 최근 성숙기에 접어든 기술경영 분야의 연구 흐름 및 지식 구조를 키워드 수준에서 구체적으로 제시함으로써, 기술경영 분야 연구자들의 연구 주제 탐색 및 연구방향 설계에 활용될 수 있을 것으로 기대된다.

검색 엔진을 이용한 키워드 연관성 분석 (The Keyword Relationship Analysis Using Searching Engine)

  • 이주연;노정현;조수현;이중화;박유현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.1077-1080
    • /
    • 2014
  • 대량으로 발생하는 키워드들 간의 연관성을 분석하고자 하는 연구는 꾸준히 진행되어 왔다. 많은 용어들의 관계를 분석하기 위한 방법으로 전문가 집단의 인력과 시간을 수행할 수 있지만, 시간과 비용이 많이 소모된다. 이를 해결하기 위한 방법으로 이미 관련 키워드 서비스를 제공하기 위한 시스템을 구축해 놓은 검색엔진을 사용해서 키워드들 간의 관계를 분석해 볼 수 있다. 본 논문에서는 IT분야의 논문에서 저자들이 자유롭게 작성하는 관심 분야를 키워드로 선정하고, 이 키워드들 간의 관계를 분석하기 위해 검색 엔진에서 출력하는 검색 결과 수를 사용한다. 검색 엔진에서 제공하는 검색 결과 수가 높을수록 다른 키워드와 연관성이 높은 키워드임을 알 수 있다.