• 제목/요약/키워드: 텍스트 빈도 분석

검색결과 332건 처리시간 0.026초

텍스트마이닝을 활용한 숭례문 관련 기사의 트렌드 분석 (Trend Analysis of News Articles Regarding Sungnyemun Gate using Text Mining)

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제17권3호
    • /
    • pp.474-485
    • /
    • 2017
  • 국보 제1호인 숭례문은 2008년 2월 10일 화재로 일부가 소실되었으나 화재 이후 복구 작업을 통해 2013년 5월 4일 시민에게 공개되었다. 이로 인해 숭례문은 국가적으로 큰 이슈가 되어 언론의 관심을 받으며 동시에 많은 연구의 대상이 되었다. 본 연구는 문화재로서 숭례문을 키워드로 하여 2002년부터 2016년까지 신문 기사에 대한 빈도분석을 통해 숭례문 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 숭례문 관련 키워드들간 연관관계 분석을 통해 키워드간 연결의 맥락을 파악하고 분석하였다. 다음으로 숭례문 화재 전후, 언론사별 주요 키워드 추출을 통해 공통점과 차이점을 보여줌으로써 관점의 다양성을 제공하였다. 본 연구를 통해 문화재로서 숭례문 관련 키워드는 화재 이후에 나타난 키워드가 전체 기사에서 고빈도어로 나타남을 알 수 있었고 몇 가지 키워드간 상관관계가 높게 나타났다. 또한 화재 전후 키워드에는 명확한 차이를 보이고 있었으며 언론사별 키워드에서 상위 키워드들은 명확한 차이는 보여주지 않았지만 차상위 키워드들은 차이가 발생하여 언론사별로 주로 다루어진 기사들의 내용은 차이가 있다는 것을 발견했다. 본 연구는 문화재로서 숭례문 관련 기사에 대해 텍스트마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있으며 정보생산자 및 정보소비자들에게 숭례문 관련 기사의 동향과 정보를 제공할 수 있을 것이라 기대한다.

텍스트 마이닝을 활용한 대학도서관과 공공도서관의 장서개발 정책 키워드 분석 (A Keyword Analysis of Collection Development Policies of University and Public Libraries Using Text Mining)

  • 이다현;신동희
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.285-302
    • /
    • 2024
  • 장서개발 정책은 도서관 서비스의 근간이며, 도서관의 성격과 정체성이 드러나는 성문화된 문서이다. 본 연구에서는 국립중앙도서관에서 원문 추출이 가능한 장서개발 정책 관련 원문 11개를 대상으로 빈도분석, 토픽 모델링, 네트워크 분석을 수행하였다. 장서개발 정책과 관련된 주요 키워드를 추출하고, 해당 키워드 간의 관계를 분석하였다. 그 후 대학도서관과 공공도서관의 관종별 장서개발 정책의 특징을 도출하기 위해 파이 계수 분석을 수행하였다. 분석 결과 '자료', '도서관', '장서개발', '이용자', '수집' 등의 키워드가 빈도 분석과 네트워크 중심성에서 주요 키워드로 나타났으며, 파이 계수 분석 결과 대학도서관은 '대학(0.73)', '구축', '학생', '대상', '비용' 등의 키워드가 나타나므로, 이용자의 학술적 요구와 디지털 자원에 대한 논의가, 공공도서관은 '성인', '설문조사', '특징', '종교' 등 다양한 이용자계층의 정보 요구와 관련된 키워드가 주요 쟁점으로 드러났다.

발신번호 특징 및 음절단위 기계학습을 통한 모바일 스팸 SMS 필터링 시스템 (A Mobile Spam SMS Filtering System using Machine learning about syllable and the features of caller ID)

  • 유환일;채동규;임을규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.219-222
    • /
    • 2011
  • 본 논문에서는 스팸 SMS 발신번호와 메시지 텍스트의 특징을 기계학습한 스팸 필터링 시스템을 논한다. 최근 변화하는 스팸SMS에 대한 적응력을 위해서, 각 트레이닝 셋의 수신 텍스트를 음절단위로 분석 할 것을 제안한다. 그리고 기존의 분류기는 성능이 미흡하거나 구현의 복잡성으로 인해 실제로 스펨 필터엔진으로 활용되지 않는 점을 극복하기 위해서 보다 단순한 분류기를 사용한다. 제안하는 시스템은 트레이닝 셋의 발신번호 및 수신 텍스트의 음절단위를 빈도수와 묶어 학습데이터를 구성하고, 테스트 셋을 스팸적 논스팸적으로 분석하여 스팸일 확률을 계산한다. 또한 Naive baysian를 바탕으로 한 경계값 기반 분류기를 통해, 타 분류기에 비해 구현 및 활용면에서 실용성이 높으면서도 성능이 뒤처지지 않는 시스템을 제안한다.

텍스트마이닝을 활용한 국외 노인작업치료의 연구동향 분석 (Study on the Research Trend of Overseas Elderly Occupational Therapy Using Text Mining)

  • 김아람;이태권;정인재;박혜연
    • 재활치료과학
    • /
    • 제10권1호
    • /
    • pp.7-17
    • /
    • 2021
  • 목적 : 본 연구는 텍스트마이닝을 활용하여 국외 노인 작업치료의 양적 변화와 현황 파악을 정량적으로 분석하고자 하였다. 연구 방법 : 2009~2019년까지 PubMed를 활용하여 Elderly, Health, Occupational therapy가 들어간 제목과 초록이 존재하는 연구논문을 분석대상으로 선정하여 초록의 단어들을 수집하였다. 수집된 정보를 통해 연도별 발생 논문 편수, 핵심어 분석, 연도별 핵심어 분석, 단어들 간의 관계성을 분석하였다. 결과 : 2009-2019년에 발표된 논문은 9,941편이며, 2009년부터 점차적으로 증가하여 2017년 또는 2018년에 최다 빈도를 보인 후 2019년에 감소하는 추이를 보였다. 최근 5년간 빈도수가 많은 단어는 Care, Group, Intervention, Pain, Treatment, Work이었다. 최근 11년간 평균적인 빈도수를 기준으로 단어 간의 관계성을 파악한 결과, Function, Health, Intervention, Participation이 단어들 간의 높은 관계성을 보였다. 결론 : 본 연구는 텍스트마이닝이라는 새로운 연구방법을 적용하여 작업치료의 동향을 실증적, 체계적으로 분석하여 거시적이고 종합적인 결과를 제시했다는 점에 의의가 있다. 이를 토대로 노인과 관련된 작업치료 임상 및 연구 현장에서 새로운 연구방향을 설정하는데 도움이 될 것으로 기대한다.

텍스트 마이닝 기법을 활용한 기후변화관련 식품분야 논문초록 분석 (Analysis of the abstracts of research articles in food related to climate change using a text-mining algorithm)

  • 배규용;박주현;김정선;이영섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1429-1437
    • /
    • 2013
  • 빅 데이터 분석기법 중 비정형데이터 분석기법인 텍스트 마이닝 기법을 이용하여 기후변화 관련 식품분야 논문 초록에서 용어들의 출현빈도를 분석하였다. 이를 위하여 용어-문헌 행렬을 만들고, 용어들간의 비유사성 측도를 바탕으로 계층적 군집분석기법을 적용하여 문서들을 군집화하였다. 군집화된 문서들간의 상호 연관성과 군집별로 특정용어의 빈도를 파악하여 문서군집을 특정주제별로 분류하였다. 이러한 연구를 통하여 식품분야의 기후변화 관련 논문들의 추세와 관심주제어를 파악할 수 있었으며, 향후 기후변화 적응 및 대응 체계 로드맵 작성 시 연구 개발 기초 자료로 활용할 수 있을 것이다.

Web of Science 빅데이터를 활용한 텍스트 마이닝 기반의 정보윤리 이슈 탐색 (Exploring Information Ethics Issues based on Text Mining using Big Data from Web of Science)

  • 김한성
    • 컴퓨터교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.67-78
    • /
    • 2019
  • 본 연구의 목적은 Web of Science(WoS)에서 제공하는 학술 빅데이터를 활용하여 정보윤리 이슈를 탐색하고 향후 정보과 정보윤리 교육을 위한 시사점을 제공하는 것에 있다. 이를 위해 WoS에서 제공하는 학술논문 중 정보윤리와 관련해 출판된 318편의 논문을 텍스트 마이닝 하였다. 구체적으로는 R을 활용해 주요키워드에 대한 빈도 분석(TF, DF, TF-IDF), 토픽 모델링 기반의 정보윤리 이슈 분석, 그리고 각 이슈에 대한 연도별 출연 빈도를 분석하여 정보윤리 연구의 경향성을 탐색하였다. 주요 결과를 살펴보면 다음과 같다. 첫째, TF-IDF를 통해 'digital', 'student', 'software', 'privacy' 등의 단어가 주요 키워드임을 확인하였다. 둘째, 토픽 모델링 분석 결과, 'Professional value', 'Cyber-bullying', 'AI and Social Impact' 등을 포함한 총 8개 이슈로 분석되었고, 그 중, 'Professional value'와 'Cyber-bullying' 이슈가 상대적으로 높은 비율을 차지하고 있었다. 본 연구는 이러한 분석 결과를 기초로 우리나라 정보윤리 교육을 시사점을 논의하였다.

텍스트마이닝을 활용한 국내외 기록서비스 연구동향 분석 (Analysis of Research Trends on Archival Information Services Using Text Mining)

  • 박서희;이혜은
    • 한국기록관리학회지
    • /
    • 제24권1호
    • /
    • pp.89-109
    • /
    • 2024
  • 본 연구는 국내외 기록정보서비스의 연구 동향을 분석한 것으로 2003년부터 2022년까지 한국학술지인용색인(KCI)에 수록된 학술논문 136편과 LISTA(Library, Information Science & Technology Abstracts)에 수록된 학술논문 74편을 대상으로 연도별, 연구 유형별, 연구자 유형별, 연구 대상별, 연구목적별 현황을 살펴보았다. 또한 텍스트마이닝 기법을 적용하여 빈도분석, 동시출현 빈도분석, 중심성분석, 토픽모델링을 진행하였다. 연구의 결과 국내 논문은 특정 기관이나 기록물에 집중되었고 이용자 중심의 만족도조사 연구, 콘텐츠 중심의 연구 등이 진행되었다. 국외논문은 아키비스트와 이용자 간의 관계를 연구하는 흐름과 함께 평가 중심의 연구, 자료·자원·컬렉션 등의 정보제공 연구가 다수 진행되었음을 확인하였다. 정보자원의 관리는 국내외 논문 공통의 토픽으로 확인되었으나 국내는 정보자원의 품질 유지를, 국외는 정보의 저장과 검색에 집중된 연구 흐름을 파악할 수 있었다.

텍스트마이닝기법을 활용한 남녀 학생의 인구문제에 관한 인식 분석: 인구교육의 시사점 도출을 위하여 (A Study on the Recognition of Population Problems of Male and Female Students using Text-mining: To Drive the Implications of Population Education)

  • 왕석순;심준영
    • 한국가정과교육학회지
    • /
    • 제31권3호
    • /
    • pp.73-90
    • /
    • 2019
  • 이 연구는 인구 문제에 대한 남녀 학생들의 인식의 차이를 규명하여 인구교육의 시사점을 도출하기 위한 것을 목적으로 하였다. 이를 위해 J 대학교의 인구교육 강좌인 「인구와 사회」수업을 수강한 학생이 개인별로 최종 제출한 보고서를 분석 자료로 활용하였다. 분석 자료는 텍스트 마이닝 기법을 활용하여 성별에 따라 인구 문제에 대한 인식에 차이가 있는 가를 분석하였다. 우선, 출현 빈도가 높은 단어를 중심으로 성별에 따른 차이를 확인하고, 핵심단어를 추출하여 의미연결망 분석을 하고 시각화를 실시하였다. 분석 결과는 다음과 같다. 첫째, 상위 출현 빈도 단어 100개를 기준으로 살펴본 결과, 10위까지의 단어는 '인구', '교육', '문제', '결혼', '사회', '출산', '심각', '사람', '우리' 등으로 남녀가 동일하였다. 또 출현 빈도, 연관분석에 따라 핵심단어를 추출한 후, 의미 연결망을 시각화한 결과, 출현 빈도를 기준으로 한 경우, 의미 연결망 중앙에 위치하는 단어에 남녀 차이가 없었다. 둘째, 연관분석에 따라 추출된 핵심 단어와 바이그램 단위로 추출한 핵심 단어는 성별에 따라 큰 차이를 보였다. 즉, 여학생의 단어의 의미 연결망에서 '생활'-'결혼'-'출산'-'임신'의 연결망이 독립적으로 나타나서, 인구 문제에 대해 분리된 객관적 연결망을 보이는 남학생과 구별되었다. 따라서 남학생과 여학생은 인구 문제에 대해 다른 인식 구조를 갖는 이질적인 집단으로 봐야 하고, 인구 교육에 있어 내용과 방법을 성별에 따라 다르게 접근해야 할 것이라는 시사점을 도출하였다.

변혁적 리더십의 연구동향 분석: 최근 10년(2007-2016)간 국내 학술지 중심으로 (Research Trends in Transformational Leadership: Focusing on Domestic Journals Published in 2007-2016)

  • 함병우;고근영;전주성
    • 한국콘텐츠학회논문지
    • /
    • 제17권8호
    • /
    • pp.490-505
    • /
    • 2017
  • 이 연구의 목적은 최근 10년 동안 국내 학술지에 게재된 변혁적 리더십 관련 논문을 분석하여 연구동향을 파악하고, 이를 토대로 향후 연구에 관한 시사점을 모색하는데 있다. 이를 위해 2007년부터 2016년까지 발표된 변혁적 리더십 관련 논문 337편을 대상으로 하였으며, 연구방법은 빈도 및 백분율에 의한 기술통계와 네트워크 텍스트 분석방법을 이용하였다. 주요 연구결과는 다음과 같다. 첫째, 연도별 학술지 게재 논문수는 연간 평균 33편 정도였다. 둘째, 학술지별로 보면 '인적자원관리연구'가 가장 많았다. 셋째, 연구대상은 일반기업종사자(49.8%)가 주를 이루었다. 넷째, 연구방법은 양적연구(96.7%)가 가장 많이 활용되고 있었다. 다섯째, 학술지 논문의 초록에 제시된 주제어는 '거래적 리더십'이 가장 높은 빈도를 보였다. 여섯번째, 네트워크 텍스트 분석을 실시한 결과 변혁적 리더십과 연결 중심성이 가장 높은 '거래적 리더십'은 '직무만족'과 최단경로를 이루고 있어 이들이 밀접한 관련성을 가지고 함께 연구되는 경향성이 발견되었다.

텍스트 마이닝을 이용한 국가 물관리 정책 변화 시점별 수문조사사업의 방향 분석 (How National Water Management Plans lead Hydrological Survey Projects?)

  • 김찬우;김민국;고정환;한승원;최인재;현동호;박석근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.429-429
    • /
    • 2023
  • 우리나라의 물 관련 정책 방향이 환경 중심의 수자원 관리에서 친수공간 및 정보의 확보와 같은 안전한 물관리로 확대되면서 정책추진에 기초가 될 수 있는 신뢰도 높은 수문자료의 생산이 보다 중요시되고 있다. 국가 수문조사사업은 이러한 정책기조에 맞춰 제도적인 뒷받침과 함께 조사의 범위와 기술, 품질관리 등의 영역을 넓히며 그 기능을 활발히 하고 있으나, 물관리 정책의 경향에 따른 수문조사사업의 방향성과 특징을 구조적으로 살펴본 연구는 부족한 것으로 파악된다. 따라서 본 연구는 친수·친환경적 물관리가 강조된 시기('97~현재)를 중점으로 하여 물관리 정책과 관련 계획의 변화가 수문조사사업에 어떠한 영향을 주는지 고찰하였다. 이를 위해 물관리 여건의 변화에 따라 달라진 관련 정책별 주제어의 분포와 수문조사사업과 연관된 주요어의 출현빈도 및 경향을 살펴보고, 주요 연관어와 연계한 사업의 방향과 구조를 분석하였다. 분석자료로는 물관리 관련 법령 등의 제도와 언론기사자료, 정책별 추진방향을 활용하였다. 정책의 추진방향은 1) 수자원의 종합적 개발에서 친환경적 측면과 지속가능성이 강조된 수자원장기종합계획(3-1차~4-3차)과 2) 사람과 자연이 함께 고려된 맑고 안전한 물, 통합물관리 등의 전략이 수록된 국가물관리기본계획(1차), 3) 정책의 기조에 따라 수립 및 보완된 수문조사 기본계획(1~2차)을 바탕으로 하였다. R프로그램을 통한 텍스트 마이닝을 활용하여 각 자료에서의 주제어 분포와 출현빈도를 분석하고, 정책별 추진방향과 수문조사사업의 연계성을 나타내었다. 연구의 함의를 담은 결과로서 물관리 여건이 변화된 시점별 주요연관어를 중심으로 한 정책동향과 수문조사사업의 특징 및 방향을 요약·비교하여 제시하였으며, 이는 물관리 분야에서의 국정운영 목표와 연계하여 국가 수문조사사업의 사업성을 고찰하는 연구의 기반이 될 수 있으리라 생각된다.

  • PDF