• 제목/요약/키워드: 텍스트 출현 빈도

검색결과 102건 처리시간 0.02초

문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석 (Weighted Subject - Method Network Analysis of Library and Information Science Studies)

  • 이기헌;정효정;송민
    • 한국문헌정보학회지
    • /
    • 제49권3호
    • /
    • pp.457-488
    • /
    • 2015
  • 본 연구는 1990년부터 2014년까지 25년 간 국외 유수 문헌정보학 학술지들에 게재된 논문들을 대상으로 연구 주제와 연구 방법을 구분하여 현 선도 학술지의 연구 누적 현황을 분석하였다. 연구 주제와 연구 방법을 구분하고 그들 간의 관계를 살펴보기 위해 가중 주제-방법 네트워크를 개발하였다. 이는 주제와 방법으로 구성된 네트워크이며, 해당 토픽 소속 단어의 동시 출현 빈도를 기초로 주제와 방법에 가중치를 준다. 본 연구 결과에 따르면, 지난 25년간 경영정보시스템, 정보요구분석, 계량서지연구, 정보정책 등이 상위 연구 주제들이었다. 또한, 모델링, 개념/문헌연구, 연구협업분석, 웹데이터 분석 등이 상위 연구 방법들이었으며, 최근 텍스트 마이닝의 비상이 괄목할 만하다. 빈번히 짝을 이루는 연구 주제들과 연구 방법들의 지난 25년간의 군집들과 최근 5년간의 군집들을 살펴보면, 계량서지연구가 네트워크분석 방법들을 다수 적용하면서 그 저변을 넓히며 자리를 확고하게 하고 있으며, 텍스트 마이닝이 의료정보시스템, 이용자인터페이스에 특화되고 있음을 확인할 수 있다. 이러한 연구 결과는 문헌정보학의 선도 연구자들의 관심 연구 영역과 관점을 확인시켜주고, 향후 문헌정보학 발전을 위한 연구 설계의 기초자료로 활용될 수 있다.

토픽모델링과 연결망 분석을 활용한 국내 조경 분야 연구 동향 분석 - 한국조경학회지를 대상으로 - (The Research Trends in Journal of the Korean Institute of Landscape Architecture using Topic Modeling and Network Analysis)

  • 박재민;김용환;성종상;이상석
    • 한국조경학회지
    • /
    • 제49권2호
    • /
    • pp.17-26
    • /
    • 2021
  • 지난 반세기 동안 한국조경학회지는 국내 조경학 연구를 주도하며, 조경 전 분야의 다양한 영역의 주제를 포용적으로 수용하며 발전해 왔다. 이에 본 연구에서는 게재된 1,802편의 논문 초록을 수집하여 분석하였다. 연구방법은 토픽모델링을 이용하여 연구 주제 유형을 구분하고, 시계열적 연구 경향을 살펴보았으며, 연결망 분석을 이용한 키워드 사이의 관계성과 군집 특성을 해석하였다. 연구 결과, 총 27개 유형의 주제를 확인하였다. 전반적으로 주제의 시계열적 변동성은 적었지만, 근대성, 커뮤니티, 도시재생 등은 새롭게 성장하는 핫토픽이었고 생태조경 관련 주제들은 감소하는 콜드토픽으로 나타났다. 주제별 차이는 있었지만 2000년대 이후 연구 주제의 변동성이 크게 나타났다. 학회지의 상징적 키워드는 '공원'으로 나타났으며, '경관' 또한 학회지가 선도하는 주요한 영역임을 확인하였다. 연결망과 출현빈도를 토대로 보면, 학회지는 '공원'과 '경관', '공간'을 대상으로 '활용', '이용' '조성' 관련 연구를 하고 있음을 알 수 있었다. 본 연구는 텍스트마이닝의 토픽모델링과 연결망 분석을 이용하여, 학회지의 총체적 연구 경향성을 파악하였다는데 의의가 있다.

소셜미디어 데이터 분석을 활용한 COVID-19 전후 박쥐의 인식변화 연구 (A Study on the Perception Change of Bats after COVID-19 by Social Media Data Analysis)

  • 이주경;김벼리;김선숙
    • 환경영향평가
    • /
    • 제31권5호
    • /
    • pp.310-320
    • /
    • 2022
  • 본 연구는 국내 최대 소셜 네트워크인 블로그 글을 대상으로 텍스트마이닝 및 네트워크 분석을 통해 COVID-19 발생 후 '박쥐'에 대한 대중들의 인식 변화를 파악하였다. 국내에서 COVID-19 발생전 2019년부터 2020년까지 9,241건의 네이버 블로그 글을 수집하였다. 수집된 자료는 파이썬(Python)과 NetMiner 4.3.2으로 분석하였고, 시기별로 도출된 키워드와 키워드 간 연관성을 통해 박쥐에 대한 대중들의 인식을 심층적으로 분석하였다. 분석결과, 2020년 박쥐 키워드의 출현 빈도는 2019년에 비해 25배 이상 증가하였고, 중심성 수치 또한 3배 이상 증가되었다. 네트워크 분석 결과, '박쥐'에 대한 인식은 COVID-19 발생전과 후 차이를 나타냈다. COVID-19 이전에 박쥐는 야생동물의 한 종(Species)으로 인식되는 경향성이높았던 반면, COVID-19 발생 초기인 2020년 상반기에는 전염병 및 건강 분야와 연관시켜 인간사회를 위협할 수 있는 존재로 강하게 인식하였고, 하반기에는 생태 및 문화 유형 비중이 높아지면서 박쥐에 대한 관심영역이 확장된 것을 확인하였다. 본 연구는 COVID-19 발생 이후 질병 숙주로서 박쥐의 잠재적인 영향에 대한 대중들의 관심과 인식 변화에 대한 정보를 제공함으로써 질병연구의 확장과 공중보건 관리, 미래감염병 대응을 위한 방향을 제시하였다.

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

주제어 프로파일링 및 동시출현분석을 통한 지능정보시스템 연구의 정체성에 관한 연구 (A Study on the Intelligence Information System's Research Identity Using the Keywords Profiling and Co-word Analysis)

  • 윤승정;김민용
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.139-155
    • /
    • 2016
  • 본 연구는 한국지능정보시스템학회의 고유한 연구영역을 파악하고자 지능정보연구 학술지에 최근 3년 동안 게재된 논문들을 대상으로 키워드를 수집하여 프로파일링 기법과 동시출현빈도를 분석하였다. 이를 통하여 지능정보시스템 연구의 정통성과 정체성을 밝히는 동시에 향후 추구해야할 연구영역을 제시하고자 한다. 연구 정체성에 대한 상대적 위치를 파악하기 위하여 한국지능정보시스템학회 뿐만 아니라 유사학회에 해당하는 한국경영정보학회 그리고 한국정보시스템학회의 키워드 및 연구방법론을 수집하여 비교하였다. 또한, 한국지능정보시스템학회에서 인공지능/데이터마이닝, 지능형인터넷, 지식경영에 대한 주요 분야를 중점적으로 다루고 있음을 고려할 때 각 분야의 대표적인 학회로 한국빅데이터서비스학회 및 한국빅데이터학회, 한국인터넷전자상거래학회, 한국지식경영학회의 연구 경향을 각각 비교 분석하였다. 키워드 분석 결과만을 요약하면, 한국지능정보시스템학회는 키워드 부문에서는 텍스트마이닝, 데이터 마이닝 및 추천시스템에 집중하고 있다는 것을 알 수 있었다. 인공지능/데이터마이닝 분야에서는 빅데이터 개념 자체와 감성분석에 초점을 두고 있고, 지능형인터넷 분야에서는 SNS와 구매의도, 신뢰, 기술수용모델에 집중하고 있었다. 지식경영 분야에서는 지식관리, 지식 공유 키워드에 집중함을 발견할 수 있었다. 더 나아가 한국지능정보시스템학회 뿐만 아니라 유사 연구 분야에서 생태계 전반적 융합 가능성을 진단해 보았다.

네트워크 분석을 활용한 국내·외 복합재난 연구 동향 분석 (A Comparative Analysis of Complex Disaster Research Trends Using Network Analysis)

  • 김우식;최연우;홍유정;윤동근
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.908-921
    • /
    • 2022
  • 연구목적: 도시의 물리적·비물리적 구조간 연결이 확대되고 복잡해짐에 따라 재난으로 인한 피해가 복합적으로 발생하는 복합재난의 위험성이 증가하고 있다. 이러한 복합재난에 대비하기 위해서는 복합재난으로 전개될 수 있는 재난들을 선제적으로 식별하여 관리하는 것이 중요하다. 이러한 배경에서 본 연구는 국내외 복합재난 관련 연구의 동향을 분석함으로써 복합재난으로 연구된 재난 유형을 분석하고, 이를 통해 향후 복합재난 관리의 방향성을 제시하고자 한다. 연구방법: 본 연구는 재난과 관련된 국내외 학술지에 최근 20년(2002-2021년)간 등재된 복합재난 관련 993편의 서지정보에 기반하여 동시출현 빈도분석을 수행하여 재난 유형 간 네트워크를 구축하였으며, 네트워크 분석을 통해 복합재난 연구 동향에 관한 국내외 및 시기별 비교분석을 수행하였다. 연구결과: 국내에서는 풍수해(집중호우, 태풍등), 기반시설 붕괴, 화재와 관련한 복합재난 연구의 비중이 높았으며, 최근 들어 지진과 산사태와 관련된 복합재난 연구가 증가하는 것으로 분석되었다. 반면, 국외에서는 풍수해 및 지진과 더불어 기반시설 붕괴에 관한 연구의 비중이 높았으며, 지진해일과 정전 등 재난 연계 유형이 다양하게 나타났다. 결론:본 연구는 복합재난 연구 동향에 대한 이해도를 높이고, 앞으로 국내 복합재난 연구가 가져야 할 방향성을 제안하는 데 활용할 수 있을 것으로 기대된다.

심리학적 언어분석 프로그램 개발을 위한 융합연구: 기존 프로그램의 비교와 관련 문헌의 동향 분석 (A Convergence Study for Development of Psychological Language Analysis Program: Comparison of Existing Programs and Trend Analysis of Related Literature)

  • 김영준;최원일;김태훈
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.1-18
    • /
    • 2021
  • 내용어 기반 빈도 분석은 의도적 기만이나 반어적 표현에 분명한 한계가 있지만, 많이 사용되는 한국어 분석 프로그램인 KLIWC는 기능어 분석을, KrKwic는 동시출현빈도를 시각화하는 방법으로 발전했다. 하지만 개발된 지 십수 년이 지나 여러 문제점으로 개선이 필요한 상황이다. 그래서 KLIWC와 KrKwic를 분석하여 새 심리학적 언어분석 프로그램을 개발하고자 하였다. 첫째로 두 프로그램의 특징을 분석하였다. 특히, 기능어 분석기능 제고를 위해서 KLIWC와 한국어 형태소 분석기의 형태소 분류를 비교하였고, 심리적 분석의 강화를 위해 심리사전의 구조와 체계를 분석하였다. 분석 결과 한나눔 품사 분석기가 가장 세분화되었지만, 인칭대명사에서는 KLIWC가, 어미와 어말어미에서는 KKMA의 품사 분류가 더 세분화되어 있어, 기능어 분석 강화를 위해 여러 품사 분석기의 통합적 사용을 제안하였다. 둘째로 이 프로그램들로 텍스트를 분석한 연구들의 연구동향을 분석하였다. 분석 결과 두 프로그램이 복합학 분야 등 다양한 학술분야에서 사용되고 있었다. 특히 논문과 보고서의 분석에는 KrKwic가 많이 사용되었고, 글쓴이의 생각, 정서, 성격 비교 연구에는 KLIWC가 많이 사용되었다. 이 결과를 바탕으로 새로운 심리학적 언어분석 프로그램의 필요성과 개발 방향에 대해 제언하였다.

빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로 (A Study on the Factors of Well-aging through Big Data Analysis : Focusing on Newspaper Articles)

  • 이종형;강경희;김용하;임효남;구진희;김광환
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.354-360
    • /
    • 2021
  • 사람들은 개인의 삶의 만족을 위하여 일과 삶의 균형을 맞추며 건강하고 행복하게 살아가는 것을 희망하고 있다. 따라서 걱정 없이 행복하고 건강하게 나이가 들어가는 것을 의미하는 웰에이징(well-aging)에 대한 관심이 높아지고 있다. 본 연구는 웰에이징 관련 신문기사를 분석하여 웰에이징과 연관된 요인들을 파악하고자 하였다. 파이썬(Python) 기반의 웹 크롤링(web crawling)을 활용하여 2020년 11월까지 포탈 사이트 다음(daum)의 뉴스 서비스에 게재된 1,199편의 기사를 수집하였으며, 이중 연구 주제에 일치하는 기사 374편을 연구대상으로 선정하였다. 텍스트마이닝의 빈도분석 결과, '노인', '건강', '피부', '웰에이징', '제품', '사람', '노화', '여성', '국내', '은퇴' 등의 순서로 상위 10개의 키워드가 중요하게 파악되었다. 또한 출현 빈도가 높은 45개의 중요 키워드를 기반으로 사회 네트워크 분석을 수행한 결과 '피부-주름', '피부-노화', '노인-건강'이 강한 연결 관계를 나타났다. CONCOR 분석을 수행한 결과 45개의 중요 키워드들은 '삶과 행복', '질병과 죽음', '영양과 운동', '힐링', '헬스산업', '노화와 안티에이징', '건강', '노인서비스'의 8개 군집으로 구성되어, 신문기사들을 기반으로 나타나는 웰에이징과 관련된 요인들을 유추할 수 있었다.

빅데이터를 통해 본 한국사회의 미래: 언론사 뉴스기사와 사회과학 학술논문의 '미래사회' 관련 키워드 분석 (Forecasting the Future Korean Society: A Big Data Analysis on 'Future Society'-related Keywords in News Articles and Academic Papers)

  • 김문조;이왕원;이혜수;서병조
    • 정보화정책
    • /
    • 제25권4호
    • /
    • pp.37-64
    • /
    • 2018
  • 본 연구는 빅데이터 분석을 통해 한국사회의 미래를 예견해보고자 한 것이다. 이러한 목적을 위해 일차적으로 국내 127개 주요 언론사의 뉴스기사(매체지) 및 사회과학 우수학술지 논문초록(학술지) DB에서 '미래사회' 관련 텍스트를 선정한 후, 해당 기사의 제목 및 논문 키워드로부터 주제어를 추출하였다. 추출한 핵심 주제어의 출현 빈도, 연도별 추세 및 주제어/연관어 연결망구조에 의거해 한국사회의 미래적 관심사를 탐지한 결과, 매체지의 미래 관심사는 '경제', '정치', '과학기술', 학술지의 그것은 '심리', '직무', '문화' 관련 사항들이 주축을 이루고 있음이 확인되었다. 여기에 $J{\ddot{u}}rgen$ Habermas의 '체계와 생활세계(system and life-world)' 개념틀을 적용하면, 매체지와 학술지의 미래 관심은 각기 '체계' 및 '생활세계' 범주에 집중되어 있다는 결론에 이르게 된다. 이 같은 미래 관심사의 분화 양상에 착안해 사회적 도전 과제들을 상이한 여건이나 가치들 간의 불일치의 소산으로 인식하는 '부조화론(mismatch theory)'을 미래연구를 위한 대안적 패러다임으로 제시함으로써, 절대적 혹은 상대적 빈곤 문제에 천착해 온 미래사회의 인식 수준을 한 단계 높이고자 한다.

디지털 전환: D.N.A.(Data, Network, AI) 키워드를 활용한 토픽 모델링 (Digital Transformation: Using D.N.A.(Data, Network, AI) Keywords Generalized DMR Analysis)

  • 안세환;고강욱;김영민
    • 지식경영연구
    • /
    • 제23권3호
    • /
    • pp.129-152
    • /
    • 2022
  • 디지털 전환의 핵심 인프라로서 데이터·네트워크·인공지능(D.N.A.) 분야의 확산과 유망 산업의 등장은 경제 전반에 걸쳐 활발한 디지털 혁신의 기반이 되고 있다. 본 연구에서는 텍스트마이닝 방법론을 적용하여 WoS 데이터베이스의 SCIE 급 색인에 해당하는 연구의 초록, 출판연도 및 연구분야를 입력변수로 활용하여 주요 토픽을 도출하였다. 우선, 단어 출현 빈도에 기반한 TF 및 TF-IDF 분석을 통해 주요 키워드를 확인하고, 이어서 g-DMR(Generalized Dirichlet-Multinomial Regression)을 이용하여 토픽 모델링을 수행하였는데, 다양한 형태의 변수를 메타정보로 활용 가능한 해당 토픽 모형의 이점으로 단순하게 토픽을 도출하는 것 이상의 의미를 적절하게 탐색할 수 있었다. 분석 결과에 따르면, 비즈니스 인텔리전스, 제조 생산 시스템, 서비스 가치 창출, 원격 진료, 디지털 교육 등의 토픽들이 디지털 전환에서 주요 연구주제인 것으로 식별되었다. 토픽 모델링의 결과를 요약하자면, 1) COVID-19 이후 비즈니스 인텔리전스를 주제로 하는 연구가 전 영역에서 활발하게 수행되고 있으며, 2) 제조 분야에서 지능형 제조 솔루션 및 메타버스 등의 이슈가 등장함에 따라 제조 생산 시스템에 관한 주제가 다시 한번 주목받고 있음을 확인하였다. 마지막으로, 3) 주제어 자체는 기술과 서비스의 측면에서 분리하여 볼 수 있지만, 다수의 연구에서 해당 기술들을 접목하여 적용된 다양한 서비스를 포괄적으로 다루고 있으므로 이를 별개로 해석하는 것이 바람직하지 못하다는 점을 알 수 있었다.