• 제목/요약/키워드: 문헌 군집화

검색결과 50건 처리시간 0.023초

지적 구조 분석을 위한 MDS 지도 작성 방식의 비교 분석 (A Comparison Analysis of Various Approaches to Multidimensional Scaling in Mapping a Knowledge Domain's Intellectual Structure)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제41권2호
    • /
    • pp.335-357
    • /
    • 2007
  • 다차원척도법(MDS)은 지적 구조의 시각화를 위해서 오랫동안 사용되어 왔다. 그러나 MDS는 지적 구조를 시각적으로 표현하는데 있어서 세부 구조의 표현력이 취약하다는 약점을 가지고 있다. 이 연구에서는 상관계수 행렬의 가공 방식과 MDS 알고리즘을 조합한 여섯 가지 MDS 지도 작성 방식을 파악한 다음, 실제 지적 구조 데이터에 적용하여 비교해보았다. 실험 결과에서 가장 나쁜 방식으로 파악된 것은 가장 널리 사용되고 있는 방식으로서, 상관계수행렬로부터 유클리드 거리를 산출한 후 ALSCAL 알고리즘으로 MDS 지도를 작성하는 방식인 것으로 나타났다. 반면에 가장 좋은 방식은 상관계수를 z점수로 표준화하여 유클리드 거리를 산출한 후 PROXSCAL 알고리즘를 사용하는 방식이었다. 결론적으로 MDS 처리 과정을 주의깊게 구성한다면 더 구체적이고 명확한 지적 구조를 파악할 수 있음이 확인되었다.

동시출현단어 분석을 활용한 오픈액세스 분야의 지적구조 분석: 2013년부터 2018년까지 출판된 문헌정보학 저널을 기반으로 (Domain Analysis on the Field of Open Access by Co-Word Analysis: Based on Published Journals of Library and Information Science during 2013 to 2018)

  • 김선겸;김완종;서태설;최현진
    • 한국도서관정보학회지
    • /
    • 제50권1호
    • /
    • pp.333-356
    • /
    • 2019
  • 기존 상업 출판사 중심의 학술 커뮤니케이션 체제가 가져온 위기를 해소할 수 있는 대안으로 오픈액세스가 등장하였다. 본 연구는 계량정보분석 기법 가운데 하나인 동시출현단어 분석을 활용하여 오픈액세스 분야의 최신 연구 경향을 반영하는 지적구조를 제시하고 주제영역이 어떻게 구성되었는지 확인하는 것을 주된 목적으로 두며, 기존에 수행되었던 오픈액세스 지적구조 분석 연구와 비교분석하였다. 이를 위해 Web of Science로부터 오픈액세스 관련 키워드 검색을 통하여 2013년 1월 1일부터 2018년 11월 31일까지 출판된 문헌정보학 분야 논문 총 761편을 수집하였으며, 이들 논문 가운데 제목과 초록으로부터 명사구 형태의 키워드 총 2,321개를 추출하였다. 오픈액세스 지적구조 분석을 위해 네트워크 분석을 통하여 13개의 세부 주제영역이 추출되었으며, 지적관계를 시각화하여 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하고 이 결과를 다차원축적지도에 표시하여 키워드들과의 상관관계를 분석하였다. 이를 통해 앞으로 오픈액세스 영역에서의 연구 방향성 모색에 도움이 될 것으로 기대한다.

하이브리드 방식에 의한 경제.인문.사회 분야 표준분류체계 개선에 관한 연구 (An Hybrid Approach to Improve the Standard Classification System in the Domains of Economics, Humanities, and Social Science)

  • 정은경;박지연
    • 한국비블리아학회지
    • /
    • 제20권3호
    • /
    • pp.129-147
    • /
    • 2009
  • 분류체계의 역할은 유사한 주제의 정보객체가 함께 모일 수 있도록 하는 것이며, 이러한 분류체계의 사용은 궁극적으로 효율적인 정보관리와 서비스를 가능하게 한다. 경제 인문 사회 계열의 정부출연 연구기관을 관장하는 경제 인문사회연구회는 개별 연구기관에서 생산하는 연구성과물을 통합적으로 관리 및 평가하기 위해 해당 분야의 표준분류체계의 도입을 시도하였고, 2008년 정부기능연계모델(BRM)과 분류담당자와의 설문조사를 바탕으로 표준분류체계 모델을 제시하였다. 그러나 이 표준분류체계는 연구성과물을 조직의 기능별로 분류할 수 있어 효율적인 반면 주제별로 분류하는데 있어서는 제한적이다. 이에 본 연구는 기존의 표준분류체계를 개선하기 위해 다양한 접근 방식이 통합된 하이브리드 방식을 적용하였다. 정부기능연계모델과 이용자 수요조사를 바탕으로 한 기존의 표준분류체계, 전통적인 표준분류체계인 KDC와 연구성과물에서 추출한 키워드의 군집화 실험결과를 종합적으로 비교 분석하여 표준분류체계 개선안을 제시하였다. 이렇게 하이브리드 방식으로 제안된 표준분류체계 개선안은 연구성과물을 체계적으로 관리 운영하는데 있어서 핵심이 될 것으로 사료되며, 궁극적으로 연구성과물의 표준분류체계를 근간으로 한 연구과제 관리시스템에 적용되어 효율적으로 연구 및 과제를 관리할 수 있을 것으로 기대된다.

동시출현단어 분석에 기반한 메타데이터 분야의 지적구조에 관한 연구 (A Study on the Intellectual Structure of Metadata Research by Using Co-word Analysis)

  • 최예진;정연경
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.63-83
    • /
    • 2016
  • 다양한 매체와 유형으로 생산되는 정보자원에 대한 이용이 높아짐에 따라, 정보자원을 기술하기 위한 정보조직의 도구로서 메타데이터에 대한 중요성이 높아지고 있다. 본 연구에서는 메타데이터 분야의 연구 영역을 파악할 수 있도록 동시출현단어 분석을 사용하여 메타데이터 분야의 지적 구조를 규명하고자 하였다. 이를 위하여 1998년 1월 1일부터 2016년 7월 8일까지 Web of Science 핵심컬렉션에 등재된 저널에 게재된 문헌을 대상으로 'metadata'라는 질의어로 Topic 검색을 수행하여, 총 727건의 논문에 대한 서지정보를 수집하였다. 이 중 저자 키워드를 가진 410건의 논문의 저자 키워드로 수집하고, 전처리 과정을 거쳐 저자 키워드 총 1,137개를 추출하여 최종적으로 빈도수 6회 이상의 키워드 37개를 분석대상으로 선정하였다. 이후 메타데이터 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 2개 영역 9개 군집을 도출하였으며, 메타데이터 분야 키워드들의 지적 관계를 시각화하고, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 6개의 군집을 다차원축적지도상에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 메타데이터 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 향후 메타데이터 관련 교육과 연구의 방향성 모색에 유용하게 사용될 수 있을 것이다.

동시출현단어 분석을 활용한 비탈면 붕괴 예측 및 분석 연구에 관한 지적구조 분석 (Domain Analysis of Research on Prediction and Analysis of Slope Failure by Co-Word Analysis)

  • 김선겸;김승현
    • 지질공학
    • /
    • 제31권3호
    • /
    • pp.307-319
    • /
    • 2021
  • 최근 드론 및 빅데이터, 인공지능 등 디지털 기술을 활용한 비탈면 연구를 수행하고 있으나 다소 미흡한 실정이며, 여전히 비탈면 붕괴 대비에 취약하다. 이러한 이유로 비탈면 붕괴에 효과적으로 대처하기 위해 디지털 기술을 활용한 비탈면 붕괴 예측 및 분석 연구에 대한 발전방향을 제시하는 것이 필연적이며, 이를 위해 비탈면 붕괴 예측 및 분석에 관한 이해가 선제되어야 한다. 본 연구는 비탈면 붕괴 예측 및 분석 연구의 지적구조를 규명하여 연구방향을 제시하기 위해 2016년 1월 1일부터 2020년 12월 31일까지의 5년간의 Web of Science 기반으로 문헌 데이터를 수집하고 이를 동시출현단어를 활용하여 분석하였다. 네트워크 분석을 통하여 세부 주제 영역을 밝히고, 키워드 간의 지적 관계를 시각화하여 관계, 중심성 분석을 통한 전역 및 지역 중심성이 높은 키워드를 도출하였다. 또한 군집분석을 실시하여 형성된 군집을 다차원축적지도에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 비탈면 붕괴 분석 및 예측 연구의 지적구조를 밝히고, 향후 연구 방향을 찾는데 도움이 될 것으로 기대한다.

텍스트 마이닝을 이용한 공군 부사관 지원자 자기소개서의 차별적 특성 분석 (Analyzing the discriminative characteristic of cover letters using text mining focused on Air Force applicants)

  • 권혁;김우주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.75-94
    • /
    • 2021
  • 저출산 문제로 인한 병역자원 감소와 병 복무기간 단축에 따른 군 간부 대비 병 복무 선호 현상은 우수한 군 간부확보정책에 대한 추가적인 고찰을 필요로 한다. 이와 관련된 연구들은 대부분 사회과학에서 주로 사용되는 방법론으로 분석하였으나, 본 연구는 대량의 문헌조사에 적합한 텍스트 마이닝의 방법론으로 접근한다. 이를 위해, 본 연구는 공군 부사관 지원자 자기소개서에서 차별적인 특성의 단어들을 추출하고 합격 및 불합격의 극성을 분석한다. 본 연구는 총 3단계로 이루어졌다. 첫번째, 지원분야를 일반분야와 기술분야로 나누고, 자기소개서에서 특성을 가지는 단어들을 분야별 빈도수 비율의 차이대로 순서화 한다. 각 지원분야별 비율의 차이가 클수록 해당 지원분야의 특성을 나타내는 것으로 정의하였다. 두번째, 이 특성을 나타내는 단어들을 LDA를 통해 단어들의 Topic을 군집화하고 이를 바탕으로 Label을 정의하였다. 세번째, 이 군집화 된 지원분야별 단어들을 L-LDA를 통해 합격과 불합격의 극성을 분석하였다. L-LDA값의 차이가 합격에 가까울수록 합격자들이 많이 사용하는 단어로 정의하였다. 본 연구를 통해, 공군 부사관 자기소개서의 차별적 특성을 추출하기에는 LDA보다 L-LDA가 더 적합함을 알 수 있다. 또한, 이러한 방법론은 별도의 서면 또는 대면 설문 방식이 아니라, 대량 문서에 대한 텍스트 마이닝 기법을 적용하여 분석시간을 단축하고, 전체 모집단에 대한 신뢰성을 높일 수 있다. 따라서 본 연구인 공군 부사관 선발결과 분석을 통해, 선발제도 및 홍보제도에 활용 가능한 정보를 제공하고, 군 인력획득 분야 연구에 있어 활용 가능한 방법론을 제안하고자 한다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

키워드 프로파일링에 기초한 국외 공공도서관 프로그램 분야의 연구 동향 분석 (Research Trends Analysis in the field of Overseas Public Library Programs based on Keyword Profiling)

  • 김판준
    • 한국문헌정보학회지
    • /
    • 제56권3호
    • /
    • pp.27-46
    • /
    • 2022
  • 오늘날 공공도서관은 다양한 프로그램을 통해 이용자의 요구를 파악하고 대응하기 위한 능력과 서비스를 강화하면서 우리사회에 깊이 기여하고 있다. 그러나 공공도서관 프로그램의 연구 현황이나 시간의 흐름에 따른 변화를 분석한 연구는 찾아보기 어렵다. 따라서 국외 공공도서관 프로그램 분야의 연구 동향을 체계적으로 파악하기 위한 목적으로, 키워드 프로파일링에 기초한 지적구조 분석을 수행하였다. 구체적으로 LISTA 데이터베이스에서 검색한 학술지 논문의 통제키워드(주제어)에 기초하여 주제어 분석, 네트워크 분석 및 군집 분석, 시기별/연도별 분석을 수행하였다. 그 결과로 첫째, 전역·인기·지역주제에 모두 해당하는 9개 주제들이 국외 공공도서관 프로그램 분야의 연구를 주도하고 있는 것으로 나타났다. 둘째, 국외 공공도서관 프로그램 분야의 5개 연구 영역(문화 프로그램, 아웃리치 프로그램, 활동 프로그램, 공공서비스, 지역사회)을 시각화하여 명확하게 식별할 수 있었다. 셋째, 국외 공공도서관 프로그램 분야의 연구는 1990년대 후반에 본격적으로 시작되어 2000년대 중반부터 2010년대 초반까지 활성화되었고, 그 이후 최근까지는 다소 정체된 상황에 있는 것으로 나타났다. 본 연구는 최근 공공도서관의 주요 업무로 부상한 프로그램에 대한 연구 동향을 구체적으로 규명한 결과로서, 향후 공공도서관 프로그램의 발전 방향을 모색할 수 있는 기초적인 데이터 및 사전 지식으로 활용될 수 있을 것이다.

머신러닝을 활용한 기상조건에 따른 공공도서관 도서대출 수요분석 (Analysis of public library book loan demand according to weather conditions using machine learning)

  • 오민기;김건욱;신세영;이진명;장원준
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.41-52
    • /
    • 2022
  • 국내 공공도서관은 1, 2차 도서관 발전 종합계획을 토대로 양적 성장을 이루었으나, 질적으로는 다소 부족한 점이 있어 이를 개선하기 위한 다양한 연구가 수행되었다. 대다수 선행연구에서는 사회·경제적 요인과 통계분석에 한정되어 수행된 한계점이 있다. 이에 본 연구에서는 시공간적 개념을 적용하여 강우와 폭염으로 인한 공공도서관 대출 수요 감소를 정량적으로 산출하고, 기상 변화로 도서 대출 수요 감소가 높은 지역과 그렇지 않은 지역을 군집화하여 공공도서관 내·외부 요인들과 결합한 후 기상변화에 따른 공공도서관 대출 수요 변화를 분석하였다. 분석 결과 공공도서관별 기상으로 인한 감소 차이가 존재하였으며, 공공도서관의 특성과 공간적 위치에 따라 일부 다르게 나타났다. 또한, 기온이 35℃ 이상인 폭염일 경우 도서 대출 수요 감소 폭이 많이 증가하였으며, 랜덤포레스트 모형으로 분석한 결과 유의미한 요인이 도출되었다. 내적 요인으로는 좌석 수, 장서 수, 면적이 도출되었으며, 외적 요인으로는 공공도서관 접근 경사로, 카페, 독서실, 10대 유동인구, 30/40대 여성 유동인구가 중요한 변수로 분석되었다. 이러한 분석 결과는 특정 시즌 기상을 고려한 공공도서관 이용 활성화 정책 수립에 이바지할 것으로 판단되며, 연구의 한계점도 제시하였다.

감염병 확산에 따른 레스토랑 선택속성 변화 분석: 텍스트마이닝 기법 적용 (Analysis of Changes in Restaurant Attributes According to the Spread of Infectious Diseases: Application of Text Mining Techniques)

  • 유준일;이은지;구철모
    • 경영정보학연구
    • /
    • 제25권4호
    • /
    • pp.89-112
    • /
    • 2023
  • 2020년 3월, 코로나바이러스 팬데믹으로 선포되면서, 다양한 방역 조치가 취해져 왔다. 이에 따라, 관광 및 환대 산업 내의 많은 변화들이 야기되었다. 특히 레스토랑 산업에서는 비대면 서비스 및 좌석 간 거리두기 등 방역 지침이 시행되었다. 전통적으로 레스토랑 선택속성에 대한 연구는 분위기, 서비스 품질, 음식의 품질을 포함한 3가지 속성의 중요성이 강조해 온 데 반해, 코로나19 이후 레스토랑 이용자를 대상으로 레스토랑 선택속성을 탐색한 연구는 미비한 실정이다. 이에 따라, 본 연구에서는 코로나19라는 환대 산업 내의 환경적 변화에 대한 이해에 기반하여, 국내 온라인 리뷰 데이터 상에서 새로운 레스토랑 경험적 속성을 확인하기 위한 탐색적인 접근을 시도하였다. 본 연구는 서울 을지로 지역에 위치한 일반음식점 및 휴게음식점 475개로 네이버 플레이스에 등록된 총 31,115개의 온라인 리뷰를 분석 단위로 고려하였다. 분석 방법은 단어 빈도와 역문서 빈도의 곱으로 산출된 TF-IDF와 잠재적 토픽들을 추출하는 확률적 모델 알고리즘인 LDA 토픽모델링 기법을 통해 온라인 리뷰 내에서 단어들의 군집화를 통해 레스토랑 선택속성을 재분류하고자 하였다. 분석 결과, 분위기, 서비스 품질, 음식 품질과 함께 코로나19 이후 레스토랑의 새로운 속성으로 "감염병 예방"요인이 도출되었다. 본 연구는 기존 레스토랑 선택속성에서 제시하는 세 가지 속성들을 범주화하고, 나아가 새로운 속성을 제시하였다는 점에서 기존 레스토랑 선택속성 문헌을 확장하여 학술적 의의가 있다. 나아가, 분석 결과에 기반하여 레스토랑 운영의 측면 및 정책적 관점에서의 실무적 제언을 시도하였다.