• 제목/요약/키워드: Co-word

검색결과 309건 처리시간 0.033초

저자명 모호성 해결을 위한 개념망 기반 카테고리 유틸리티 (WordNet-Based Category Utility Approach for Author Name Disambiguation)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.225-232
    • /
    • 2009
  • 동명이인의 저자를 구분하는 것은 웹에서 문서 색인과 검색의 성능을 향상시킨다. 동명이인의 저자 구분은 웹사이트 상에서 같은 이름을 갖는 여러 명의 사람이 존재했을 때 야기되는 여러 가지 문제점을 해결한다. 본 논문은 동명이인의 저자 구분을 위해 개념망 기반의 카테고리 유틸리티를 제안한다. 따라서 본 논문에서는 학술회의 웹 사이트를 대상으로 제안하고자 하는 방법을 설명한다. 제안된 방법은 저자가 가지고 있는 다양한 속성(제목, 요약, 공동저자, 소속)을 반영한 저자 온톨로지와 개념망을 활용한다. 저자 온톨로지는 OWL API와 휴리스틱한 방법을 사용하여 반자동으로 구축 되었다. 저자명 모호성 해결은 개념망 기반 카테고리 유틸리티를 사용하여 저자 온톨로지 내에 존재하는 동명이인 저자(Candidate Authors)들로부터 해당 논문에 관련된 정확한 저자를 결정한다. 카테고리 유틸리티는 각각의 저자간의 intra-class 유사성 와 inter-class 비유사성을 기본적인 개념으로 하는 평가 함수다. 이에 비해 개념망 기반 카테고리 유틸리티는 모호성 해결을 위해 개념망이 갖는 개념 정보를 추가로 활용한다. 실험 결과를 분석한 결과 개념망 기반 카테고리 유틸리티가 일반적인 카테고리 유틸리티에 비교해서, 저자명 모호성 해결에 있어서 10% 정도 우수한 성능을 보였으며, 전체적으로 98%의 정확도를 보였다.

공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구 특징 분석 (The Research Features Analysis of Leisure and Recreation based on Co-authors Network and Topic Model)

  • 박성건;박광원;강현욱
    • 한국체육학회지인문사회과학편
    • /
    • 제57권2호
    • /
    • pp.279-289
    • /
    • 2018
  • 본 연구의 목적은 워드 클라우드와 LDA 토픽 모델링을 이용하여 공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구의 특징을 분석하는 것이다. 웹 크롤러로 수집된 논문은 2008년 1월~2017년 3월 최근 10년 간 한국체육학회 홈페이지에 게재된 총 2,697편이며, 분석 대상은 여가레크리에이션 관련 문헌 369편이다. 분석 결과, 여가레크리에이션 분야 연구자들의 주요 관심사는 참가자와의 관계와 관련된 요인 분석, 다른 변인 간의 관계, 집단별 효과 차이 검증, 운동 참여, 스포츠 참여형태에 관한 연구로 나타났다. 연구자 네트워크에 링크된 수는 451개이며, 연구자들은 평균 1.52회의 관계를 맺고 있고, 연구자 간 평균 거리는 2.33로 나타났다. 대표저자의 연결정도 중심성에서 Lee. K. M., Hwang. S. H., Lee. C. S. 순으로 높게 나타났고, 근접 중심성은 Seo. K. B., Han. J. H., Kim. K. J. 순으로 나타났다. 마지막으로 매개 중심성은 Lee. C. W., Seo. K. B. 순으로 높게 나타나 여가레크리에이션과 관련된 학술 논문의 연구자들 사이를 연결해주는 역할을 가장 활발히 하는 것으로 나타났다. 향후 연구에서는 미래 여가 연구의 추이와 방향성에 관련하여 학자들 간의 논의가 필요하다.

국내 포유류 연구의 주제와 동향 (Mammalian Research Topics and Trends in Korea)

  • 고병준;어수형
    • 한국환경생태학회지
    • /
    • 제31권1호
    • /
    • pp.30-41
    • /
    • 2017
  • 국내에서 포유류는 축산학, 수의학, 실험동물학, 생태학, 유전학 등 다양한 분야에서 활발하게 연구되고 있으며, 최근 생물다양성의 중요성이 강조되면서 이들의 보전 및 관리는 국민적으로도 많은 관심을 받고 있다. 하지만 전문 연구와 국민 관심의 증가에도 불구하고 국내 포유류 연구동향을 파악한 사례는 아직까지 찾아보기 힘들다. 이 연구는 국내 포유류의 연구동향을 파악하여 향후 세부연구영역의 계획과 관련 정책 제시를 위한 기초자료 제공을 목표로 하였다. 2015년까지 국내에서 발행된 포유류 학술논문 392편을 분석 대상으로 하였으며, 최근 각광받는 연구영역을 파악하기 위해 텍스트마이닝과 동시출현단어 분석을 이용하였다. 그 결과, 국내 포유류 연구논문 발행 수는 점차 증가하였으며, 연구대상 종 역시 점차 다양해진 것으로 나타났다. 텍스트마이닝과 동시출현단어 분석을 통해 파악된 주된 포유류 연구영역은 (1)진화/계통/유전학, (2)환경/생태학, (3)발생/생식/세포생물학, (4)기생충/수의학, (5)설치류/기생충학, (6)세균/바이러스학, (7)해부/세포생물/실험동물학, (8)형태/해부수의학, (9)축산학, (10)해양포유류학, (11)익수목 연구 등 11개로 구분되었다. 환경/생태학 연구는 11개 연구영역 중에서 최근 가장 활발하였으며, 과거에 비해 연구비율이 급격히 증가한 분야로 나타났다. 환경/생태학 연구분야는 생물다양성 보전의 핵심으로, 최근 생물다양성의 중요성이 강조됨에 따라 국내 서식 포유류의 생태연구에 대한 연구자들의 관심 역시 더욱 증가한 것으로 보인다. 이 연구결과가 미래 국내 포유류 연구의 계획과 관련 정책 수립을 위한 기초자료로 유용하게 활용되기를 희망한다.

동시출현단어 분석을 활용한 오픈액세스 분야의 지적구조 분석: 2013년부터 2018년까지 출판된 문헌정보학 저널을 기반으로 (Domain Analysis on the Field of Open Access by Co-Word Analysis: Based on Published Journals of Library and Information Science during 2013 to 2018)

  • 김선겸;김완종;서태설;최현진
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.333-356
    • /
    • 2019
  • 기존 상업 출판사 중심의 학술 커뮤니케이션 체제가 가져온 위기를 해소할 수 있는 대안으로 오픈액세스가 등장하였다. 본 연구는 계량정보분석 기법 가운데 하나인 동시출현단어 분석을 활용하여 오픈액세스 분야의 최신 연구 경향을 반영하는 지적구조를 제시하고 주제영역이 어떻게 구성되었는지 확인하는 것을 주된 목적으로 두며, 기존에 수행되었던 오픈액세스 지적구조 분석 연구와 비교분석하였다. 이를 위해 Web of Science로부터 오픈액세스 관련 키워드 검색을 통하여 2013년 1월 1일부터 2018년 11월 31일까지 출판된 문헌정보학 분야 논문 총 761편을 수집하였으며, 이들 논문 가운데 제목과 초록으로부터 명사구 형태의 키워드 총 2,321개를 추출하였다. 오픈액세스 지적구조 분석을 위해 네트워크 분석을 통하여 13개의 세부 주제영역이 추출되었으며, 지적관계를 시각화하여 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하고 이 결과를 다차원축적지도에 표시하여 키워드들과의 상관관계를 분석하였다. 이를 통해 앞으로 오픈액세스 영역에서의 연구 방향성 모색에 도움이 될 것으로 기대한다.

동시출현단어 분석을 활용한 비탈면 붕괴 예측 및 분석 연구에 관한 지적구조 분석 (Domain Analysis of Research on Prediction and Analysis of Slope Failure by Co-Word Analysis)

  • 김선겸;김승현
    • 지질공학
    • /
    • 제31권3호
    • /
    • pp.307-319
    • /
    • 2021
  • 최근 드론 및 빅데이터, 인공지능 등 디지털 기술을 활용한 비탈면 연구를 수행하고 있으나 다소 미흡한 실정이며, 여전히 비탈면 붕괴 대비에 취약하다. 이러한 이유로 비탈면 붕괴에 효과적으로 대처하기 위해 디지털 기술을 활용한 비탈면 붕괴 예측 및 분석 연구에 대한 발전방향을 제시하는 것이 필연적이며, 이를 위해 비탈면 붕괴 예측 및 분석에 관한 이해가 선제되어야 한다. 본 연구는 비탈면 붕괴 예측 및 분석 연구의 지적구조를 규명하여 연구방향을 제시하기 위해 2016년 1월 1일부터 2020년 12월 31일까지의 5년간의 Web of Science 기반으로 문헌 데이터를 수집하고 이를 동시출현단어를 활용하여 분석하였다. 네트워크 분석을 통하여 세부 주제 영역을 밝히고, 키워드 간의 지적 관계를 시각화하여 관계, 중심성 분석을 통한 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하여 형성된 군집을 다차원축적지도에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 비탈면 붕괴 분석 및 예측 연구의 지적구조를 밝히고, 향후 연구 방향을 찾는데 도움이 될 것으로 기대한다.

동시출현단어 분석을 활용한 한국어교육에서의 학습전략 연구 동향 탐색 (Exploring the Research Trends of Learning Strategies in Korean Language Education Using Co-word Analysis)

  • 허영수;박지홍
    • 정보관리학회지
    • /
    • 제38권2호
    • /
    • pp.65-86
    • /
    • 2021
  • 외국어 교육 분야에서 학습자는 교육의 한 축을 이루는 중요한 부분이지만 한국어교육의 경우 교육 내용, 교수 방법, 교재 등에 비해 학습자 연구는 미진한 면이 있었다. 이에 학습자 연구, 그중에서도 학습전략 연구가 어떻게 이루어져 왔는지를 분석하고 더 나은 교육을 위해 연구가 필요한 부분을 도출해 보는 것은 의미가 있다. 본 연구에서는 한국어교육 분야에서 학습전략 연구의 현황을 분석하기 위해 학술지와 학위논문의 제목에 대해 동시출현단어 분석을 진행하였다. 연구 결과, 한국어 학습자의 학습전략 관련 가장 많은 연구가 이루어진 분야는 '읽기'이고, 대상은 '중국인 유학생'과 '결혼이민자'였다. 또한, 연구 주제에 대한 서브그룹 분석 결과를 보면 주요 서브그룹이 네 개가 나타나는데 '학문 목적 읽기' 관련 그룹, '요청, 거절, 대화 등 화행' 관련 그룹, '쓰기' 관련 그룹, '어휘, 듣기' 관련 그룹이다. 이를 통해 한국어 학습자의 학습전략과 관련해 연구자들의 주요 관심 분야가 '읽기, 화행' 등임을 알 수 있으며, 연구 대상과 연구 분야가 부분적으로 편중되어 있는 상황이므로 다양한 분야와 대상으로 연구를 확대할 필요가 있음을 알 수 있다.

복합문서 개체 검색 시스템- [IN2] DOR (Composite Document Object Retrieval and Searching System-[IN2] DOR)

  • 안태성;임중수;김명훈;안우람;이경일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.113-118
    • /
    • 2003
  • 기존 문서 검색 시스템의 경우 단순히 문서 내에서 텍스트를 추출한 후 그 텍스트를 색인, 검색하는 형태를 가지고 있었다. 본 논문에서는 MS Word, Excel, HWP 등 다양한 형태의 문서에서 텍스트, 표, 이미지, 차트, 동영상 등의 문서 개체를 분석, 색인하고 이를 검색하는 시스템의 개발 방법을 제외하였다. 제안된 시스템은 문서의 내부 자료 구조를 CDML(Composite Document Markup Language)로 변환하고, 이를 색인, 저장함으로 기존의 전문 검색 시스템의 한계를 효과적으로 극복했으며, 문서 내의 검색 대상 개체로 자동 이동하고 하일라이팅 시키는 기술을 구현함으로 사용자 편익성을 높였다. 개발된 시스템의 성능을 평가한 결과, 다양한 문서 형식에 대해 평균 97% 이상의 CDML변환 성공률과 개체 검색 성공률을 보였으며, 이진 파일에서 직접 개체를 추출함으로 매우 높은 분석 및 색인 속도가 달성되었음을 확인할 수 있었다. 본 논문에서 소개된 새로운 패러다임의 문서 검색 솔루션을 통해 다양한 기술적 상업적 파급 효과가 기대되고 있다.

  • PDF

빅데이터 기반한 미세플라스틱 지적네트워크 분석 (Microplastics Intellectual Network Analysis based on Bigdata)

  • 김영희;장관종
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.239-259
    • /
    • 2022
  • 2019년 이후부터 전 세계적으로 미세플라스틱(Microplastics)에 관한 연구가 활발하게 진행되고 있어 국내·외 미세플라스틱 연구에 대한 차이점을 분석하는 것은 국내연구 방향 수립에 이정표가 될 수 있다. 본 연구에서는 KCI와 WoS에서 미세플라스틱 논문들을 발췌하여 저자 키워드동시출현단어분석, 논문동시인용분석, 저자동시인용분석 등 빅데이터를 기반으로 한 네트워크 분석방법론으로 국내외 연구 차이점을 분석했다. 분석결과, 연구주제 분석은 인간의 생체에 영향을 미칠 수 있는 연구와 일상에서의 미세플라스틱의 처리에 관한 연구가 국내에서 추가로 필요함을 확인하였다. 연구 품질을 살펴보는 논문 인용 깊이 분석에서는 국외 2.25와 국내 1.39로 국내가 아직 부족함을 보였고, 다양한 연구자들이 참여하고 정보를 공유하는 공동연구전선 구성형태 분석은 국내는 22개 군집 중에서는 3개가 Star형 구조가 있고, 국외의 경우는 19개 군집 모두가 Mesh 구조로 되어 있어 국내는 특정 연구 분야에서는 정보의 흐름과 공유가 부족함도 확인할 수 있었다. 이런 연구 결과는 미세플라스틱의 연구주제 확장과 연구 질의 향상, 더불어 다양한 연구자들이 참여하는 연구 추진체계 개선 등이 필요함을 확인하였다. 추가로 주제 모델링(Topic Modeling)을 기반으로 자동화 프로그램 개발을 한다면 실시간 분석이 가능한 시스템 구축도 가능할 것이다.

동시출현 단어 분석을 통한 지식 구조의 파악 : 인공지능 분야를 대상으로 (Exploration of Intellectual Structure of Artificial Intelligence Field Using Co-word Analysis)

  • 이미경;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.245-251
    • /
    • 2003
  • 이 연구에서는 통제된 색인어를 이용하여 파악한 지식 구조와 통제되지 않은 키워드를 이용한 지식 구조를 비교하여 두 구조가 어떤 차이점을 보이는지를 살펴보았다. 또한 색인효과가 어떻게 나타나는지, 비통제어를 사용한 경우가 실제적으로 더 상세한 하위 영역을 표현하는지를 확인하고자 하였다. 실험 결과 통제된 색인어인 주제명표목을 사용한 영역지도와 비통제 색인어인 키워드를 사용한 영역지도 둘 다 인공지능 분야의 주요 분야들을 비슷하게 나타냈지만, 주제명표목을 사용한 경우에 색인효과가 일부 나타났다. 그리고 대체적으로 주제명표목에 기반한 영역지도보다는 키워드에 기반한 영역지도가 더 상세하게 나타났다.

  • PDF

단어 공기 확률 추정을 위한 차원 축소 모델 (Dimension-Reduced Model for Word Co-occurrence Probability Estimation)

  • 김길연;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.137-142
    • /
    • 2000
  • 본 논문에서는 확률적 자연언어 처리에서 중요한 문제인 자료 희귀(data sparseness)의 어려움을 해결하는 새로운 방법으로 차원 축소 모델을 제시한다. 세 가지의 세부 방법이 제안되었으며 Katz의 back-off 방법의 성능을 최저로 했을 때에 비해 약 60%정도의 성능이 향상되었다. 현재까지 최고의 성능을 보이고 있는 유사도 기반의 방법에 비해서도 약 5∼20%의 성능이 향상되었다. 따라서 차원 축소 모델은 확률 추정의 새로운 방법으로 쓰일 수 있다.

  • PDF