• 제목/요약/키워드: 키워드 추출 방법

검색결과 355건 처리시간 0.029초

텍스트 마이닝을 활용한 한국학 주경로(Main Path) 분석: '한국'을 키워드로 포함하는 SCOPUS 문헌을 대상으로 (The Main Path Analysis of Korean Studies Using Text Mining: Based on SCOPUS Literature Containing 'Korea' as a Keyword)

  • 김혜진
    • 정보관리학회지
    • /
    • 제37권3호
    • /
    • pp.253-274
    • /
    • 2020
  • 이 연구는 한국학의 주류를 이루는 연구영역들의 기원과 발전경로를 파악하기 위하여 텍스트 마이닝과 주경로 분석(main path analysis, MPA) 기법을 수행하였다. 이를 위하여 전통적인 인문학 연구방법론이 아닌 디지털 텍스트를 기반으로 한 정량적 분석을 시도하였고 인용 데이터베이스를 활용하여 인용정보가 포함된 한국학 관련 문헌들을 수집하고 직접 인용 네트워크를 구축하여 한국학 분야 주경로를 추출하였다. 주경로 추출 결과, 한국학 인문분야에서는 키루트(key-route) 주경로 탐색에서 두 개의 주경로 군집(①한국 고대 농경문화(역사·문화·고고학), ②한국인의 영어습득(언어학))이 발견되었고, 한국학 인문·사회분야에서는 키루트 주경로 탐색에서 네 개의 주경로 군집(①한국 지역(공간)개발·조경, ②한국 경제발전(경제원조·소프트파워), ③한국의 산업(정치경제학), ④한국의 인구구성(남아선호)·북한경제(빈곤·중국협력))이 발견되었다. 이 연구의 결과가 한국학의 정체성을 파악하는데 기존의 지엽적 분석에서 벗어나 한국학이라는 학문에서 논의되고 있는 주 영역의 발전과 진화를 거시적으로 분석·제시함으로써 한국학이 가지는 포괄성과 모호성을 다소 해소하고 한국학 외연을 가시적으로 조망하는데 기여할 수 있으리라 기대한다.

범죄발생 위험요소와 연관된 SNS 데이터의 효율적 추출 방법에 관한 연구 (A study on the efficient extraction method of SNS data related to crime risk factor)

  • 이종훈;송기성;강진아;황정래
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.255-263
    • /
    • 2015
  • 본 연구에서는 매년 증가하는 범죄에 대한 예방 측면에서 범죄발생 위험요소에 관한 정보를 사전에 파악하고 범죄발생을 예방하기 위해 SNS 데이터를 활용하는 방안을 제시한다. 최근에 SNS(Social Network Service) 데이터는 다양한 분야에서 선제적 예방 대응체계를 구축하는데 활용됨에 따라 그 중요성 또한 점점 증가하고 있다. 하지만 SNS 데이터를 단순 키워드로 수집하는 경우 관련되지 않은 데이터가 다수 포함되어 정확도 저하와 데이터 분석에 혼란을 초래할 우려가 있다. 이에, SNS 데이터의 텍스트 마이닝 분석을 통해 범죄발생 위험요소의 검색 정확도를 향상시켜 효율적으로 추출할 수 있는 방안을 제시한다.

텍스트마이닝을 이용한 국내 만성질환자 대상 모바일 헬스 중재연구 동향 분석 (Analysis of research trends on mobile health intervention for Korean patients with chronic disease using text mining)

  • 손연정;이수경
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.211-217
    • /
    • 2019
  • 국내 만성질환 관리에서 모바일 헬스 적용이 임상적으로 유용하다는 보고가 증가됨에 따라, 본 연구는 텍스트 마이닝 기법을 적용하여 국내 외 학술지에 게재된 국내 만성질환자 대상 모바일 헬스 중재연구의 특성 및 중심 키워드의 변화를 파악하고자 시도된 이차분석연구이다. 분석대상 논문은 2005년부터 2018년까지 학술지에 게재된 최종 20편으로, 추출한 텍스트는 Microsoft Excel을 활용하여 논문별 분석을 실시하였고, Text Analyzer를 사용하여 주제어를 추출하였다. 연구결과, 모바일 헬스 중재 연구는 고혈압, 당뇨병, 뇌졸중 관상동맥질환자에 주로 적용되었다. 가장 많이 사용된 중재 유형은 애플리케이션 개발이었으며, 최근 연구에서는 주로 '유용성', '모바일 헬스', '결과측정' 등의 단어들이 가장 많이 출현하였다. 추후 만성질환자 대상 모바일 헬스 중재에 관한 국내 외 연구 모두를 포함하여 주제어 간의 연관성을 확인할 수 있는 사회연결망 분석방법을 적용하여 그 효용성을 확인해볼 것을 제안한다.

웹 로봇 에이전트의 하이퍼링크 분석기법을 이용한 음란메일 차단 시스템의 구현 (Implementation of Anti-Porn Spam System based on Hyperlink Analysis Technique's of the Web Robot Agent)

  • 이승만;정희석;한상;송우석;이도한;홍지영;반의환;양준영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.332-335
    • /
    • 2007
  • 이메일은 누구나 쉽게 정보를 교환할 수 있는 편리함 때문에 인터넷에서 가장 중요한 수단으로 사용되고 있다. 그러나 순수한 의사소통의 수단이 아닌 스팸메일의 범람은 성인뿐만 아니라, 어린이 청소년에게도 무차별적으로 전송됨으로써 심각한 부작용을 낳고 있다. 본 논문은 점차 지능화 되는 신 유형의 음란 스팸메일로부터 청소년을 보호하기 위하여 새로운 방법의 음란메일 차단시스템을 제안하고자 한다. 기존의 스팸메일 차단시스템은 사용자가 직접 음란한 메일이라고 판단되는 메일에 대해 일일이 키워드를 설정하거나, 메일 내용 중에 텍스트만을 추출하여 패턴 매칭방법으로 분류하는 것이 대부분이었지만, 본 논문은 기존 방법의 문제점을 해결하기 위하여 이미지 내 Skin-Color분포의 Human Detection 알고리즘과 웹 로봇 에이전트의 하이퍼링크 분석기법을 사용하였다. 성능 측정결과, 형태소 분석과 Human Detection 알고리즘을 병합하여 적용한 경우 성능 측정에서 90% 정도의 F-measure를 보였지만, 추가적으로 웹 로봇 에이전트의 하이퍼링크 분석기법을 병합하여 적용한 경우 97% 이상의 F-measure를 보이며, 신뢰성이 높은 음란스팸메일 차단 시스템을 구현할 수 있다는 것을 증명하였다.

  • PDF

키워드 네트워크 분석을 활용한 치위생과학회지 연구동향 분석 (Analysis of Journal of Dental Hygiene Science Research Trends Using Keyword Network Analysis)

  • 강용주;윤선주;문경희
    • 치위생과학회지
    • /
    • 제18권6호
    • /
    • pp.380-388
    • /
    • 2018
  • 본 연구는 키워드 네트워크 분석 방법을 활용하여 치위생과학회지 2001년부터 2018년 3호까지 게재된 논문 953편의 키워드를 추출하여 연구 구조를 파악하기 위해 키워드 분석과 핵심어를 파악하기 위해 중심성 분석을 실시하였다. 그리고 5년 단위로 1기를 2001년부터 2005년까지, 2기를 2006년부터 2010년까지, 3기를 2011년부터 2015년까지, 4기를 2016년부터 2018년까지로 구분하여 연구동향을 분석하여 다음과 같은 결론을 얻었다. 치위생과학회지에서 도출된 총 1,454개의 단어 중에서 17년간 치위생과학회지 투고 논문에서 가장 많이 쓰인 단어는 'Health'이며 'Dental', 'Oral', 'Hygiene', 'Hygienist'에 관한 논의가 가장 활발하였음을 알 수 있었다. 중심성 분석을 통해 치위생과학회지에서 핵심이 되는 단어들과 연결되며 중심을 형성하고 있는 단어들은 'Health', 'Dental', 'Oral', 'Hygiene', 'Hygienist', 'Behavior' 등이며, 매개중심성 상위 단어들은 'Dental', 'Health', 'Oral', 'Hygiene', 'Student' 등으로 나타났다. 시기별 연결중심성 핵심 키워드를 살펴본 결과, 1기에서는 Health (0.227), Dental (0.136), Hygiene (0.136) 등, 2기에서는 Health (0.242), Dental (0.177), Hygiene (0.113) 등, 3기에서는 Health (0.200), Dental (0.176), Oral (0.082) 등, 4기에서는 Dental (0.235), Health (0.206), Oral (0.147) 등의 단어들이 나타났다. 각 시기별로 매개중심성은 1기에서는 Oral (0.281)과 Health (0.199)의 매개중심성이 높게 나타났으며, 2기에서는 Dental (0.205)과 Health (0.169)가 높게 나와 매개역할의 비중이 높다가 Hygiene (0.112), Hygienist (0.054), Oral (0.053) 등으로 매개역할의 비중이 분산되는 것을 알 수 있었다. 3기에서는 Health (0.258)와 Dental (0.246)의 매개중심성이 높게 나타났으며, 4기에서는 Oral (0.364)과 Health (0.353), Dental (0.333)의 매개중심성이 높게 나타났다. 이상의 결과를 바탕으로 향후 치위생학 연구에 있어 학문 주제에 대한 다양성과 다각화를 모색하여 많은 연구가 이루어지길 기대한다.

비지도학습 기반의 행정부서별 신문기사 자동분류 연구 (A Study on Automatic Classification of Newspaper Articles Based on Unsupervised Learning by Departments)

  • 김현종;유승의;이철호;남광우
    • 한국산학기술학회논문지
    • /
    • 제21권9호
    • /
    • pp.345-351
    • /
    • 2020
  • 행정기관은 정책 대응성을 제고하기 위해 빅데이터 분석에 관심을 기울이고 있다. 빅데이터 중 뉴스 기사는 정책 이슈와 정책에 대한 여론을 파악하는데 중요한 자료로 활용될 수 있다. 한편으로 새로운 온라인 매체의 등장으로 뉴스 기사의 생산은 급격히 증가하고 있어 문서 자동분류를 통해 기사를 수집할 필요가 있다. 그러나 기존 뉴스 기사의 범주와 키워드 검색방법으로는 특정 행정기관 및 부서별로 업무에 관련된 기사를 자동적으로 수집하는 것에 한계가 있었다. 또한 기존의 지도학습 기반의 분류 기법은 다량의 학습 데이터가 필요한 단점을 가지고 있다. 이에 본 연구에서는 행정부서의 업무특징을 포함한 분류사전을 활용하여 기사의 분류를 효과적으로 처리하기 위한 방법을 제안한다. 이를 위해 행정 기관의 업무와 신문기사를 Word2Vec와 토픽모델링 기법으로 부서별 특징을 추출하여 분류사전을 생성하고, 행정 부서별로 신문기사를 자동분류 한 결과 71%정도의 정확도를 얻었다. 본 연구는 행정부서별 신문기사를 자동분류하기 위해 부서별 업무 특징 추출 방법과 비지도학습 기반의 자동분류 방법을 제시하였다는 학문적·실무적 기여점이 있다.

구문 의미 이해 기반의 VOC 요약 및 분류 (VOC Summarization and Classification based on Sentence Understanding)

  • 김문종;이재안;한규열;안영민
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권1호
    • /
    • pp.50-55
    • /
    • 2016
  • VOC(Voice of Customer)는 기업의 제품 또는 서비스에 대한 고객의 의견이나 요구를 파악할 수 있는 중요한 데이터이다. 그러나 VOC 데이터는 대화체의 특징으로 인해 내용의 분절이나 중복이 다수 존재할 뿐 아니라 다양한 내용의 대화가 포함되어 유형을 파악하는데 어려움이 있다. 본 논문에서는, 문서에서 중요한 의미를 갖는 키워드와 품사, 형태소 등을 언어 자원으로 선정하였고, 이를 바탕으로 문장의 구조 및 의미를 이해하기 위한 LSP(Lexico-Semantic-Pattern, 어휘 의미 패턴)를 정의하여 구문 의미 이해 기반의 주요 문장을 요약문으로 추출하였다. 요약문을 생성함에 있어 분절된 문장을 연결하고 중복된 의미를 갖는 문장을 줄이는 방법을 제안하였다. 또한 카테고리 별로 어휘 의미 패턴을 정의하고 어휘 의미 패턴에 매칭된 주요 문장이 속한 카테고리를 기반으로 문서를 분류하였다. 실험에서는 VOC 데이터를 대상으로 문서를 분류하고 요약문을 생성하여 기존의 방법들과 비교하였다.

사회적 재난에 대한 트위터 여론 수렴 모델: '가습기 살균제' 사건을 중심으로 (A Collecting Model of Public Opinion on Social Disaster in Twitter: A Case Study in 'Humidifier Disinfectant')

  • 박준형;류법모;오효정
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.177-184
    • /
    • 2017
  • 최근 점차 복잡해져가는 사회구조 속에서 사회적 재난은 빈번하게 발생되고 있으며, 그 피해 규모 또한 점차 대형화되고 있다. 따라서 사회적 재난에 신속하게 대응함으로써, 추가 피해를 방지할 수 있는 체계화된 방법이 필요하다. 그 중에서도 소셜미디어, 특히 트위터는 신속성 및 확장성이 높아 재난에 대한 대응책으로 새롭게 주목받고 있다. 다양한 대중들의 관심이 드러나는 트위터의 여론을 수렴하는 것은 재난 발생에 신속하게 대응하고, 추가적인 피해를 방지하는데 유용한 수단으로 활용될 수 있다. 따라서 본 연구는 키워드 분석 및 이슈 트윗 추출, 시계열 분석 과정을 통해 사회적 재난에 대한 트위터 여론 수렴 방법을 제안하였으며, 최근 사회적으로 이슈화된 가습기 살균제 사건을 연구 대상으로 선정, 실제 적용가능성을 보이는데 의의가 있다.

비디오 서버에서 온톨로지를 이용한 의미기반 장면 검색 (Semantic-based Scene Retrieval Using Ontologies for Video Server)

  • 정민영;박성한
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.32-37
    • /
    • 2008
  • 최근 멀티미디어 정보의 양이 빠른 속도로 증가함에 따라 비디오 자료에 대한 효율적 관리는 매우 중요한 의미를 가지게 되었다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있어 신속하고 효율적으로 비디오 검색을 하기 위해서는 정확한 특징 정보를 추출하여 비디오 색인 구조를 구축해야 한다. 비디오 색인 구조는 전통의 데이터베이스와는 다른 모델링 방법과 검색 방법을 사용한다. 따라서 비디오 색인 구조에서 검색의 속도와 정확도를 향상시키기 위해서는 새로운 비디오 색인 구조가 필요하다. 본 논문에서는 의미적으로 비디오를 장면단위로 검색할 수 있는 비디오 온톨로지 시스템을 제안한다. 비디오 온톨로지 시스템은 장면의 내용에 대한 키워드를 구조화 시킨 장면이름 온톨로지와 장면이 가지는 특징 정보에 대한 정보를 가지는 장면 모델 온톨로지로 구성된다. 장면 이름 온톨로지는 색인된 내용에 대한 의미적 검색이 가능하도록 단어들을 트리구조로 저장된다. 그리고 장면 모델 온톨로지는 색상, 모양, 재질과 같은 저수준 정보와 객체, 이벤트 같은 고수준 정보의 의미적 차이를 극복해 줌으로써 의미기반 검색이 가능하게 해준다.

토픽모델링을 활용한 교통경찰 민원 분석 (An Analysis of Civil Complaints about Traffic Policing Using the LDA Model)

  • 이상엽
    • 한국ITS학회 논문지
    • /
    • 제20권4호
    • /
    • pp.57-70
    • /
    • 2021
  • 본 연구는 민원데이터를 분석함으로써 교통경찰에 대한 국민의 치안 수요를 탐색하고자 하였다. 이를 위해 교통경찰 관련 국민신문고 민원데이터 2,062건을 대상으로, 토픽모델링 방법 중 하나인 잠재 디리클레 할당(Latent Dirichlet Allocation)을 통해 주요 토픽을 추출하고 높은 비중을 차지한 위반신고에 대해 추가분석을 시도하였다. 이 과정에서 키워드와 대표문서의 일관성과 합치성을 함께 고려하였다. 분석 결과 교통경찰 관련 민원은 시설개선, 신호에 따른 교차로통행방법, 번호판 영치, 개인형 이동장치 등 41개의 토픽으로 분류할 수 있었다. 교차로내 위반과 이륜자동차의 위반에 대한 단속을 강화하고 무인교통단속장비, 횡단보도, 신호등의 설치 및 운영에 대한 선제적인 조치, 최근 개정된 법령과 시행된 정책, 경찰교통민원 사이트, 단속 사후 절차에 대한 더욱 활발한 홍보가 필요한 것으로 판단된다.