• 제목/요약/키워드: 단어 동시출현

검색결과 127건 처리시간 0.021초

빅데이터 분석 기법을 활용한 도서관발전종합계획 동향 분석 연구 (Analysis Study on Trends of Library Development Plan by Using Big Data Analysis)

  • 김동석;노영희
    • 한국비블리아학회지
    • /
    • 제29권2호
    • /
    • pp.85-108
    • /
    • 2018
  • 본 연구에서는 도서관발전종합계획에 대한 언론보도를 빅데이터 분석 기법을 활용하여 시기별 동향과 시사점을 도출하고자 하였다. 이를 위해 국내 주요 포털 사이트를 통해 2009년부터 2017년까지 관련 데이터를 수집하였다. 수집된 데이터는 텍스트 마이닝 과정을 통해 정제된 단어를 도출하였고 이를 바탕으로 빈도분석 및 중심성 분석, 구조적 등위성 분석 등을 수행하였다. 분석 결과 제1 2차 도서관발전종합계획이 시행되는 동안 도서관 정책의 흐름이 외연적 성장에서 도서관 운영의 내실화 고도화의 흐름으로 변화하고 있었으며, 도서관 시설 확충과 같은 특정 정책에 국한되어 언론보도가 이루어짐을 확인할 수 있었다. 이러한 연구 결과는 도서관발전종합계획으로 대변되는 도서관 정책을 어떤 관점에서 인식하고 이해하고 있는지 확인하는데 유용한 자료로 사용될 수 있으며, 향후 도서관발전종합계획의 비전을 모색하는데 활용되기를 바란다.

마이크로블로그를 통한 그래프 기반의 토픽 추출에 관한 연구 (A Study on Graph-based Topic Extraction from Microblogs)

  • 최돈정;이성우;김재광;이지형
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.564-568
    • /
    • 2011
  • 오늘날 마이크로블로그는 스마트폰의 보급과 더불어 대중적인 정보전달 방식의 하나로 자리 잡고 있으며, 기존의 정보매체에 비해 사용자들의 관심사 변화를 보다 빠르게 반영하는 특징을 지닌다. 특히 다수 사용자의 관심을 끌고 있는 토픽의 경우, 다양한 정보 출처로부터 풍부한 정보를 제공할 수 있는 잠재력을 보유하고 있기도 하다. 그럼에도 불구하고 높은 비율로 존재하는 노이즈 등으로 인해 마이크로블로그로부터 유용한 정보를 획득하기란 쉽지 않은 문제로 남아있다. 지금까지 특정 문서로부터 주제를 효율적으로 추출, 추적하는 다양한 방법이 제안되었으나, 마이크로블로그와 같은 단문의 문서가 대량으로 생산되는 경우에 활용하기에는 미흡한점이 있었다. 본 논문에서는 특정 주제어가 주어졌을 때, 키워드 그래프를 구성함으로써 그에 대한 사용자들의 관심사가 어떻게 변화하는지를 효과적으로 파악하는 방법을 제안한다. 제안 방법은 크게 마이크로블로그 내에서의 단어 동시출현빈도를 이용하여 단어간 키워드 그래프를 생성하는 과정과, 네트워크 분할 기법을 이용하여 그래프를 적절히 분할함으로써 사용자의 관심사 별로 나누는 과정을 포함한다. 선별된 주제어에 대해 제안된 방법을 적용해 봄으로서 적은 비용으로 효과적인 주제 발견 및 분할이 가능함을 확인하였다.

인용가중 저자프로파일링을 이용한 학교도서관 연구의 지적구조 분석 (Analyzing the Intellectual Structure of School Library Researches with Citation-Weighted Author Profiling)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제54권2호
    • /
    • pp.197-223
    • /
    • 2020
  • 이 연구에서는 지적구조 분석기법인 저자프로파일링 기법과 저자동시인용 분석기법의 장점을 결합한 새로운 방안으로 인용가중 저자프로파일링(citation-weighted author profiling) 기법을 개발하였다. 기존의 저자프로파일링 기법에서는 저자가 주로 연구한 주제를 반영하는 단어를 분석하지만, 인용을 고려한 저자프로파일링 기법에서는 인용이 많이 된 논문에 출현한 단어를 분석함으로써 저자가 주로 영향을 끼친 주제를 파악하는데 도움이 된다. 이를 통해 기존 저자 프로파일링 기법의 장점인 세부적인 주제 파악이 가능함과 동시에 저자동시인용 분석 기법과 같이 저자의 영향력을 측정할 수 있다. 제안한 인용가중 저자프로파일링 기법을 국내 학교도서관 연구의 지적구조를 분석하는데 적용해본 결과, 각 저자의 인용 영향력이 높은 주요 주제를 세부적으로 파악할 수 있었고 시기별 영향력의 변화도 명확하게 드러났다. 인용가중 저자프로파일링 기법은 저자가 얼마나 많은 논문을 발표했는가라는 연구 생산성 관점이 아니라, 어떤 주제에 관해서 얼마나 많이 인용되었는가라는 연구 영향력 관점에서 세부 주제를 파악할 수 있는 기법으로 활용될 것으로 기대된다.

디지털 보존 관련 학술연구 및 교과 주제분석 (Analysis on Topics of Digital Preservation Researches and Courses)

  • 정의연;최상희
    • 한국문헌정보학회지
    • /
    • 제53권3호
    • /
    • pp.25-43
    • /
    • 2019
  • 디지털 자원의 급속한 증가에 따라 디지털 보존 및 디지털 큐레이션에 대한 관심이 높아지고 있다. 이 연구는 디지털 보존과 디지털 큐레이션과 관련된 국외논문과 미국, 영국, 아일랜드, 캐나다, 뉴질랜드의 대학 기록관리 과정의 교과를 대상으로 제목 키워드 프로파일링 기법 및 네트워크 분석을 통해 논문 및 교과의 핵심 주제영역을 도출하고 논문 및 교과의 내용을 살펴보고자 하였다. 분석결과 논문 및 교과의 핵심 주제영역은 논문은 아카이브 시스템 영역, 교과는 큐레이션 교육 및 업무 영역이 주요 영역으로 나타났다. 논문 및 교과 내용분석에 있어서는 논문에서는 전략설계, 교과에서는 기록관리업무가 주요 내용으로 나타났으며 공통적으로 디지털 자원의 포맷이 중요한 이슈로 출현하였다.

Development of big data based Skin Care Information System SCIS for skin condition diagnosis and management

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.137-147
    • /
    • 2022
  • 피부상태의 진단과 관리는 뷰티산업종사자와 화장품산업종사자에게 그 역할을 수행함에 있어서 매우 기초적이며 중요한 기능이다. 정확한 피부상태 진단과 관리를 위해서는 고객의 피부상태와 요구사항을 잘 파악하는 것이 필요하다. 본 논문에서는 피부상태 진단 및 관리를 위해 소셜미디어의 빅데이터를 사용하여 피부상태 진단 및 관리를 지원하는 빅데이터기반 피부관리정보시스템 SCIS를 개발하였다. 개발된 시스템을 사용하여 텍스트 정보 중심의 피부상태 진단과 관리를 위한 핵심 정보를 분석하고 추출할 수 있다. 본 논문에서 개발된 피부관리정보시스템 SCIS는 빅데이터 수집단계, 텍스트전처리단계, 이미지전처리단계, 텍스트단어분석단계로 구성되어 있다. SCIS는 피부진단 및 관리에 필요한 빅데이터를 수집하고, 텍스트 정보를 대상으로 핵심단어의 단순빈도분석, 상대빈도분석, 동시출현분석, 상관성분석을 통해 핵심단어 및 주제를 추출하였다. 또한 추출된 핵심단어 및 정보를 분석하고 산포도, NetworkX, t-SNE 및 클러스터링 등의 다양한 시각화 처리를 함으로써 피부상태 진단 및 관리에 있어 이를 효율적으로 사용할 수 있도록 하였다.

단어동시출현분석을 통한 한국의 국가 R&D 연구동향에 관한 탐색적 연구 (An Exploratory Study on the Korean National R&D Trends Using Co-Word Analysis)

  • 서원철;박현석;윤장혁
    • Journal of Information Technology Applications and Management
    • /
    • 제19권4호
    • /
    • pp.1-18
    • /
    • 2012
  • This paper identifies technology trends of national research and development (national R&D) by exploiting Korean national R&D patents, ranging from 2007 to 2010. In this paper, co-word analysis (CWA), which is a method to identify the relationship among technology terms by using their co-occurrences, is incorporated into network analysis to visualize the relationships among technology keywords of national R&D patents and calculate network indexes concerning inter-relationship diversity and strength of technology keywords. As a result, this research found that inter-relationship among technology keywords in national R&D are getting increasingly strengthening in an overall sense. In addition, the keyword inter-relationship diversity-strength map proposed in this paper revealed some significant technological keywords of national R&D : core technology keywords including "sensor", "film" and "fuel" and emerging keywords including "biosensor" and "thermoelectric". Because the proposed approach helps identify interdisciplinary trends of technology keywords from a massive volume of national R&D patents in a visual and quantitative way, we expect that the approach can be incorporated as a preliminary into the R&D planning process to assist R&D policy makers to understand technology convergence of national R&D and develop relevant R&D policies.

학위논문 주제어 중심 연구동향 분석 -국어국문학, 국어교육학, 한국어교육학 분야를 중심으로- (esearch Trend Analysis Focused on Thesis Key Words: in the Fields of Korean Language and Literature, Korean Language Education, and Korean Language Education as a Foreign Language)

  • 김은실;강승혜
    • 한국어교육
    • /
    • 제29권2호
    • /
    • pp.25-48
    • /
    • 2018
  • The aim of this study was to analyze research trends in the fields of Korean Language and Literature, Korean Language Education, and Korean Language Education as a Foreign Language. To this end, key words were extracted from 29,470 academic theses published between 2000 and 2017. The results of the analysis are as follows. First, in the field of Korean Language and Literature, there is greater quantity in studies about Korean language than about literature, and starting from 2010, there was an increase in studies similar to those from the field of Korean Language Education as a Foreign Language. Next, in comparison to the other fields, the field of Korean Language Education has greater variance in its research theme-in particular, numerous studies related to the site of education. Finally, the field of Korean Language Education has the following trends: a) there are copious studies focused on Korean language learners in comparison to other fields, b) there are a greater number of studies focused on culture, and c) the key words change by time period which suggest that research demands transformed over time. Overall, a total of 64 highest frequency key words from the three academic fields were investigated. Of these, 22 were common key words and 42 were differential key words. In this way, it was possible to illuminate the identity of each field.

저출산 원인 확인을 위한 데이터 분석연구 (Data Analysis Research to Analyze the Cause of Low Birth Rate)

  • 이정원;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.496-498
    • /
    • 2021
  • 우리나라는 1980년 이전 높은 출산율을 기반으로 총인구는 지속적으로 증가하여 왔으며, 1980년대 중반 이후 출산율은 급격하게 떨어지면서 인구대체 수준 이하까지 떨어지게 되었다. 지역 내 저출산의 원인은 자발적 거부라기보다는 지역 사회 구조적인 원인을 다각적으로 파악하여 원인을 찾아내는 것이 필요하다. 여러 지역 중 출산율이 매우 낮은 예산 지역을 기준으로 지역 인터넷 뉴스 및 산모들이 많이 참여하는 지역 대표 카페 데이터를 수집하였다. 인구감소, 저출산, 육아 복지 등에 관하여 이슈화 되었던 동시출현단어의 빈도를 분석하여 출산 저해 원인을 분석하였다.

  • PDF

무인항공기 기술진화 탐색 및 유망기술 발굴 연구 (Research Technology Evolution of UAV(Unmanned Aerial Vehicle) and to Prospect Promising Technology)

  • 주성현
    • 항공우주시스템공학회지
    • /
    • 제13권6호
    • /
    • pp.80-89
    • /
    • 2019
  • 효과적인 유망기술 발굴을 위해 미래 사회 변화를 전망하고, 미래기술 도출 방법론 및 프로세스 개선 연구가 필요하며, 연구소·기업에서 기술기획에 활용할 기초자료의 필요성이 꾸준히 대두되고 있다. 따라서 본 연구는 국내 무인항공기산업과 같은 신성장동력산업의 국제적 기술 경쟁력 확보와 시장성 확보 및 산업성장이 가능한 미래유망 기술을 도출하는 방법론을 제시하는 것이다. 이에 본 연구는 KrKwic, Excel, NetMiner등의 분석툴을 활용하여 무인항공기산업 분야의 특허데이터를 대상으로 동시출현 단어를 활용한 소셜네트워크분석과 하위그룹분석, 인지지도분석 방법을 제시하였다. 이를 통해, 무인항공기산업 분야의 기술진화를 탐색하고 유망기술을 예측하는 방법을 제시하였다. 그 결과, '체계연동/통합 기술', '시험평가/감항인증 기술', '항공전자 기술', '비행제어 기술', '피아식별 기술', '비행통제 시스템 기술', '지원장비 기술' 등은 향후 유망한 기술로 선정하여 집중 투자할 필요성이 큰 기술이라 볼 수 있었다.

빅카인즈를 활용한 5·18 관련 국내 기사 분석 연구 (An Analysis of Domestic Newspaper Articles on 5.18 using the Bigkinds System)

  • 박주현;박현지;김영범
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.107-132
    • /
    • 2024
  • 이 연구에서는 한국언론진흥재단의 빅카인즈에서 제공하는 1990년부터 2022년까지 약 30년간의 5·18 관련 뉴스데이터를 빈도분석과 네트워크 분석하였다. 구체적으로 시기별과 지역별 기사량을 분석하여 양적 변화 추이를 살펴보았으며 동시 출현 키워드를 활용한 정부별 네트워크 분석을 통해 정부별 주요 키워드 간의 연결 구조를 탐색하였다. 분석 결과, 시기적으로는 사회적 이슈가 많았던 2019년의 보도량이 가장 많은 것으로 나타났으며 지역적으로는 전라권의 보도량이 가장 많은 것으로 나타났다. 그리고 네트워크 분석 결과, 정권이 5·18을 바라보는 인식과 정책에 따라 뉴스데이터 내 5·18과 관련된 단어에 차이가 있었다. 5·18 뉴스데이터 분석을 종합한 결과, 5·18이 지역과 상관없이 시간이 지남에 따라 민주화운동으로 자리매김해 나가고 있었으나 동시에 5·18에 대한 왜곡이 해소되지 못하고 있음을 확인하였다.