• 제목/요약/키워드: 주요 키워드

검색결과 769건 처리시간 0.033초

텍스트마이닝을 활용한 농업 R&D 키워드 분석 (A Study on the Analysis of Agricultural R&D Keywords Using Textmining Method)

  • 김지훈;김성섭
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.721-732
    • /
    • 2021
  • 본 연구는 농업 R&D의 추세를 살펴보고자 텍스트마이닝 기법을 활용하여 농업 R&D에 해당하는 키워드를 분석하였다. 분석자료는 NTIS의 국가연구개발사업 과제정보를 활용하였으며, 2003년부터 2018년까지의 농업 R&D의 주요 키워드를 연도별 및 연구개발단계별로 구분하였다. 텍스트마이닝을 위해 키워드의 TF-IDF를 계산하여 점수별로 순위를 매기었으며, 유사한 키워드별로 그룹화하여 해석하였다. 주요 분석 결과는 다음과 같다. 첫 번째, 신기술의 도입과 외부 환경에 변화에 따른 농업 R&D 트렌드가 변화해가고 있다. 시간이 흐를수록 새로운 키워드가 대두되고 있으며, 기초연구 단계에서는 '기후변화'가, 응용연구 단계에서는 'ICT'와 '스마트팜'이, 개발연구 단계에서는 '수출' 키워드가 주되게 등장하고 있다. 두 번째, 연구개발 단계에서 시차를 가지고 키워드 변화가 나타나고 있다. 기초연구-응용연구-개발연구 순으로 주요 키워드가 변화하고 있으며, 대표적으로 '기후변화'와 '신품종' 키워드가 연구개발단계별로 연계되어 있었다. 세번째, 농업 R&D의 대표적인 키워드는 '벼' 키워드로 나타났다. 그러나 '녹색 및 기후변화 대응'과 '가공 및 유통기술' 같이 국내외 농업 환경 변화에 따라 연구의 방향성과 목적이 변화하고 있었다.

디스크립터 자동 할당을 위한 저자키워드의 재분류에 관한 실험적 연구 (A Study on the Reclassification of Author Keywords for Automatic Assignment of Descriptors)

  • 김판준;이재윤
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.225-246
    • /
    • 2012
  • 본 연구는 국내 주요 학술 DB의 검색서비스에서 제공되고 있는 저자키워드(비통제키워드)의 재분류를 통하여 디스크립터(통제키워드)를 자동 할당할 수 있는 가능성을 모색하였다. 먼저 기계학습에 기반한 주요 분류기들의 특성을 비교하는 실험을 수행하여 재분류를 위한 최적 분류기와 파라미터를 선정하였다. 다음으로, 국내 독서 분야 학술지 논문들에 부여된 저자키워드를 학습한 결과에 따라 해당 논문들을 재분류함으로써 키워드를 추가로 할당하는 실험을 수행하였다. 또한 이러한 재분류 결과에 따라 새롭게 추가된 문헌들에 대하여 통제키워드인 디스크립터와 마찬가지로 동일 주제의 논문들을 모아주는 어휘통제 효과가 있는지를 살펴보았다. 그 결과, 저자키워드의 재분류를 통하여 디스크립터를 자동 할당하는 효과를 얻을 수 있음을 확인하였다.

SNS를 이용한 잠재적 광고 키워드 추출 시스템 설계 및 구현 (Design and Implementation of Potential Advertisement Keyword Extraction System Using SNS)

  • 서현곤;박희완
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.17-24
    • /
    • 2018
  • 빅데이터 처리 분야에서 중요한 이슈 중 하나는 인터넷의 주요 키워드를 추출하고 이것을 이용하여 필요한 정보를 가공하는 것이다. 현재까지 제안된 대부분의 키워드 추출 방법들은 대형 포털 사이트의 검색기능을 기반으로 이미 게시된 글이나 작성된 문서 또는 고정된 내용에 기반하고 있다. 본 논문에서는 SNS에 게시되는 다양한 이슈, 대화, 관심 분야, 의견 등 동적인 메시지를 기반으로 이슈 키워드 및 연관 키워드를 추출하여 잠재적 쇼핑 연관 키워드 광고 마케팅에 도움을 주는 시스템(KAES: Keyword Advertisement Extraction System based on SNS)을 개발한다. KAES 시스템은 특정 계정 리스트를 작성하여 SNS에서 빈도수가 가장 많은 핵심 키워드 및 연관 키워드를 추출한다.

뉴스 기사 키워드 추출을 위한 구묶음 주석 말뭉치 구축 (Chunking Annotation Corpus Construction for Keyword Extraction in News Domain)

  • 김태영;김정아;김보희;오효정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.595-597
    • /
    • 2020
  • 빅데이터 시대에서 대용량 문서의 의미를 자동으로 파악하기 위해서는 문서 내에서 주제 및 내용을 포괄하는 핵심 단어가 키워드 단위로 추출되어야 한다. 문서에서 키워드가 될 수 있는 단위는 복합명사를 포함한 단어가 될 수도, 그 이상의 묶음이 될 수도 있다. 한국어는 언어적 특성상 구묶음 개념이 적용되는 데, 이를 통해 주요 키워드가 될 수 있는 말덩이 추출이 가능하다. 따라서 본 연구에서는 문서에서 단어뿐만 아니라 다양한 단위의 키워드 묶음을 태깅하는 가이드라인 정의를 비롯해 태깅도구를 활용한 코퍼스 구축 방법론을 고도화하고, 그 방법론을 실제로 뉴스 도메인에 적용하여 주석 말뭉치를 구축함으로써 검증하였다. 본 연구의 결과물은 텍스트 문서의 내용을 파악하고 분석이 필요한 모든 텍스트마이닝 관련 기술의 기초 작업으로 활용 가능하다.

  • PDF

대학 핵심역량 관련 연구들의 주요 키워드와 네트워크 분석 (Keyword and Network Analysis of University Core Competency Studies)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.133-134
    • /
    • 2021
  • 본 연구는 최근 고등학교기관(대학)의 평가에서 가장 중심 단어가 되고 있는 있는 '핵심역량' 관련 최근 연구들의 주요 키워드들과 그들간의 네트워크를 분석하고자 한다. 본 연구에서는 2011년부터 2020년까지(최근 10년간)의 '대학 핵심역량' 관련 등재지(등재 후보지 포함)에 발표된 총 176건의 관련 연구물들을 언어 네트워크 분석 방법론을 활용하여, 주요 키워드 추출 및 워드클라우드 제시, 주요 핵심어들 간의 관계성(의미망 네트워크) 분석 등을 진행하고자 한다. 이와 같은 연구 결과는 관련 학자들이 연구를 진행할 때, 대학 관계자가 학교단위 교육활동 계획 기획 및 평가활동을 할 때 매우 중요한 기초 자료로 활용될 것으로 기대된다.

  • PDF

Keyword Analysis of COVID-19 in News Big Data : Focused on 4 Major Daily Newspapers

  • Kwon, Seong-Wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.101-107
    • /
    • 2020
  • 본 논문은 장기전에 접어든 코로나19와 관련한 국내 주요 4개 일간지의 뉴스 빅데이터(빅카인즈)를 활용하여 진보와 보수신문의 정치적 성향 등에 따른 주요 키워드를 비교 분석하는 것을 목적으로 한다. 이를 위해 2020년 1월 20일부터 9월 15일까지 보도된 93,917건의 뉴스를 4단계로 구분하여 4개 신문사의 주요 키워드를 워드클라우드로 구현하여 분석하였다. 분석 결과, 보수신문은 진보신문보다 '정부', '대통령', '사태', '마스크' 키워드를 더 많이 언급함으로써 정부의 대응과 비판, 중국의 책임 등에 주목하였으며, 진보신문은 질병의 심각성과 위험 상황 발생을 강조하는 키워드를 많이 사용하는 것으로 나타났다. 조선일보는 대규모 집단감염 발생(2.18~5.15)기에 다양한 키워드의 사용으로 다양성을 나타내기도 하였으며 특히, 중앙일보가 코로나19와 같은 감염병 보도와 관련해서는 정부 정책을 비판하는 키워드를 사용하기도 하지만 진보신문이 사용하는 질병의 심각성과 위험한 상황 발생을 강조하는 키워드도 함께 사용한다는 점을 밝혀냈다.

키워드 네트워크 분석을 통한 난독증과 학습장애 관련 연구 동향 분석 (A Study on the Research Trend in the Dyslexia and Learning Disability Trough a Keyword Network Analysis)

  • 이우진;김태강
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.91-98
    • /
    • 2019
  • 본 연구는 난독증과 학습장애 관련 연구 동향과 키워드 네트워크 분석을 통한 관련 변인의 중심성을 알아보는데 그 목적이 있다. 2008년부터 2018년까지 학술교육학술정보원에서 제공하는 학술연구정보서비스 사이트 데이터베이스를 활용하여 연구 목록을 수집하였다. 분석대상으로 선정된 407편의 연구 주제는 키워드 클렌징 작업을 거쳐 KrKwic 프로그램을 이용하여 주요 키워드를 추출하였고 키워드 간 연결중심성을 시각화를 하기 위해 NodeXL프로그램을 활용하였다. 분석결과 다음과 같은 연구결과를 도출하였다. 첫째, 난독증과 학습장애 연구주제 총 72개의 키워드가 추출되었고 주요키워드에는 학습장애, 읽기장애, 난독증, 중재반응모형 순으로 제시하고 있었다. 둘째, 난독증과 학습장애의 관련 매개 키워드 중심성을 분석한 결과 학습장애가 국내 난독증 및 학습장애 관련 연구에서 주요한 키워드로 볼 수 있다. 이러한 연구결과를 통해 난독증과 학습장애와 관련해 정량적 분석과 정성적 분석을 절충한 연구동향 분석방법을 제시하였다는 점에서 의의가 있다고 할 수 있다.

텍스트마이닝을 활용한 숭례문 관련 기사의 트렌드 분석 (Trend Analysis of News Articles Regarding Sungnyemun Gate using Text Mining)

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제17권3호
    • /
    • pp.474-485
    • /
    • 2017
  • 국보 제1호인 숭례문은 2008년 2월 10일 화재로 일부가 소실되었으나 화재 이후 복구 작업을 통해 2013년 5월 4일 시민에게 공개되었다. 이로 인해 숭례문은 국가적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되었다. 본 연구는 문화재로서 숭례문을 키워드로 하여 2002년부터 2016년까지 신문 기사에 대한 빈도분석을 통해 숭례문 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 숭례문 관련 키워드들간 연관관계 분석을 통해 키워드간 연결의 맥락을 파악하고 분석하였다. 다음으로 숭례문 화재 전후, 언론사별 주요 키워드 추출을 통해 공통점과 차이점을 보여줌으로써 관점의 다양성을 제공하였다. 본 연구를 통해 문화재로서 숭례문 관련 키워드는 화재 이후에 나타난 키워드가 전체 기사에서 고빈도어로 나타남을 알 수 있었고 몇 가지 키워드간 상관관계가 높게 나타났다. 또한 화재 전후 키워드에는 명확한 차이를 보이고 있었으며 언론사별 키워드에서 상위 키워드들은 명확한 차이는 보여주지 않았지만 차상위 키워드들은 차이가 발생하여 언론사별로 주로 다루어진 기사들의 내용은 차이가 있다는 것을 발견했다. 본 연구는 문화재로서 숭례문 관련 기사에 대해 텍스트마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있으며 정보생산자 및 정보소비자들에게 숭례문 관련 기사의 동향과 정보를 제공할 수 있을 것이라 기대한다.

트위터에 나타난 미투운동의 키워드 연관성 및 키워드 네트워크 분석 (Analysis of Keyword Association and Keyword Network of #MeToo Movement on Twitter)

  • 곽수정;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.311-314
    • /
    • 2018
  • 최근 '미투운동'이 활발히 진행되면서 새로운 페미니즘의 물결을 맞이하였다. 이전의 페미니즘 운동과의 차이점은 SNS 를 통해 익명으로 활동하며 전파속도가 굉장히 빠르다는 것이다. 본 연구는 미투운동의 이러한 특성을 고려하여 실제 트위터 데이터에서 주요 키워드를 파악하고, 해당 키워드의 연관성 및 네트워크 분석으로 사회적 맥락을 알아본다.

텍스트 마이닝을 활용한 대학도서관과 공공도서관의 장서개발 정책 키워드 분석 (A Keyword Analysis of Collection Development Policies of University and Public Libraries Using Text Mining)

  • 이다현;신동희
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.285-302
    • /
    • 2024
  • 장서개발 정책은 도서관 서비스의 근간이며, 도서관의 성격과 정체성이 드러나는 성문화된 문서이다. 본 연구에서는 국립중앙도서관에서 원문 추출이 가능한 장서개발 정책 관련 원문 11개를 대상으로 빈도분석, 토픽 모델링, 네트워크 분석을 수행하였다. 장서개발 정책과 관련된 주요 키워드를 추출하고, 해당 키워드 간의 관계를 분석하였다. 그 후 대학도서관과 공공도서관의 관종별 장서개발 정책의 특징을 도출하기 위해 파이 계수 분석을 수행하였다. 분석 결과 '자료', '도서관', '장서개발', '이용자', '수집' 등의 키워드가 빈도 분석과 네트워크 중심성에서 주요 키워드로 나타났으며, 파이 계수 분석 결과 대학도서관은 '대학(0.73)', '구축', '학생', '대상', '비용' 등의 키워드가 나타나므로, 이용자의 학술적 요구와 디지털 자원에 대한 논의가, 공공도서관은 '성인', '설문조사', '특징', '종교' 등 다양한 이용자계층의 정보 요구와 관련된 키워드가 주요 쟁점으로 드러났다.