• 제목/요약/키워드: Keywords Extraction

검색결과 139건 처리시간 0.025초

키워드 네트워크 분석을 활용한 기후변화 교육 관련 연구동향 분석 (Keyword Network Analysis of Trends in Research on Climate Change Education)

  • 김순식;이상균
    • 대한지구과학교육학회지
    • /
    • 제13권3호
    • /
    • pp.226-237
    • /
    • 2020
  • 본 연구의 목적은 연구제목에서 추출한 키워드를 중심으로 네트워크 분석을 활용하여 기후변화 교육 관련 연구동향을 분석하는 것이다. 이를 위하여 2015년부터 2020년 11월까지 한국연구재단(KCI) 등재(후보)지에 게재된 기후변화 교육 관련 논문의 연도별, 학습지별 동향을 파악하고, 논문에 제시된 키워드에 대한 네트워크 분석을 실시하였다. 분석절차는 분석 대상 선정, 키워드 추출과 정제, 키워드 네트워크 분석 및 시각화의 과정으로 진행되었다. 자료처리는 Textom 분석 프로그램, Ucinet 6.0, NetDraw 프로그램을 활용하였다. 연구결과는 다음과 같다. 첫째, 2011년부터 2020년 사이 총 62편의 기후변화 교육 관련 논문이 게재되었으며, 학술지는 '에너지기후변화 교육'에서 가장 많은 기후변화 교육 관련 논문이 게재된 것으로 나타났다. 둘째, 키워드 '프로그램' 키워드가 가장 높은 빈도를 보였으며, 그 다음으로 '에너지', '분석', '초등학교', '초등학생', '개발', '영향' 등이 높은 빈도를 보였다. 셋째, 연결정도 중심성 분석결과 '프로그램', '초등학생', '초등학교' 지수가 가장 높게 나타났으며, 가장 큰 군집은 '교수·학습 프로그램 개발과 효과'가 형성되었다. 본 연구는 전반적인 기후변화 교육 관련 연구동향을 탐색하고, 향후 연구주제에 대한 방향성을 파악하였다는 데 의의가 있다.

빅데이터 분석을 통한 인터넷 뉴스 포털에서의 탈세 논란이 기업 가치에 미치는 영향 연구 (A study on the effect of tax evasion controversy on corporate values in internet news portals through big data analysis)

  • 이상민;박명호;김병준;박대근
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.51-57
    • /
    • 2021
  • 기업의 세금을 절약 혹은 회피하는 행동은 과세관청에 의해 합법적 절세가 아닌 탈세로 판단될 경우 기업은 조세적 비용뿐 아니라 일련의 탈세관련 보도 기사로 인해 기업이미지 손상 및 주가하락과 같은 비조세적 비용까지 부담하게 된다. 이에 본 연구는 인터넷 뉴스 포털에 나타난 탈세 논란 키워드들의 출현빈도를 해당 사건의 심각성을 측정하는 요인으로 정하고 이러한 출현빈도가 기업가치에 미치는 영향을 분석한다. 우리나라 유가증권시장에서 시가총액기준 상위 업체들을 대상으로 탈세 논란 키워드들을 활용하여 인터넷 뉴스 포털로부터 관련 기사를 크롤링하고, 기업별로 탈세 논란 키워드들의 출현빈도에 대한 시계열을 생성하여 출현빈도가 장부가 대비 시가총액에 미치는 영향을 분석한다. 패널회귀분석과 충격반응분석을 통해 분석한 결과 출현빈도는 기업가치에 부정적인 영향을 미치며 12개월까지 점진적으로 효과가 감소되는 것으로 분석된다. 이 연구는 한국기업들을 대상으로 탈세 논란 사안이 기업가치에 영향을 미치는지를 실증적으로 분석한 연구로서, 경영자는 절세전략을 수립 시 이러한 영향력을 고려하는 것이 필요하다는 것을 시사한다.

낚시성 인터넷 신문기사 검출을 위한 특징 추출 (Feature Extraction to Detect Hoax Articles)

  • 허성완;손경아
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1210-1215
    • /
    • 2016
  • 스마트 기기의 발달로 많은 사람들이 인터넷 신문기사를 이용하고 있다. 하지만 인터넷 언론사간의 치열한 경쟁으로 조회수를 올리기 위한 낚시성 기사가 범람하고 있다. 낚시성 신문기사는 제목을 통해 올바른 기사의 줄거리가 제공되지 않았을 뿐만 아니라, 독자로 하여금 잘못된 내용을 떠올리게 한다. 낚시성 신문기사는 핵심에서 벗어난 유명인사 인용, 애매한 문장의 마무리, 제목과 내용의 불일치 등의 특징을 갖는다. 본 논문에서는 이러한 낚시성 기사를 분류하기 위한 특징을 추출하고 성능을 검증해 본다. 기사에 달린 댓글의 키워드를 활용하여 대용량 학습데이터를 생성하고 이를 기반으로 다섯 가지 분류 특징을 추출하였다. 추출된 특징들은 서포트 벡터 머신 분류기를 이용한 실험에서 92%의 정확도를 보여 낚시성 인터넷 신문기사를 분류하는데 적합하다고 판단된다. 뿐만 아니라 제목과 본문의 일관성을 측정하기 위한 전처리 방법으로 고안한 선택적 바이그램 모델은 낚시성 인터넷 신문기사 분류 외에도 일반적인 단문 분석을 위한 전처리 방법으로 유용할 것으로 기대된다.

마이크로블로그를 통한 그래프 기반의 토픽 추출에 관한 연구 (A Study on Graph-based Topic Extraction from Microblogs)

  • 최돈정;이성우;김재광;이지형
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.564-568
    • /
    • 2011
  • 오늘날 마이크로블로그는 스마트폰의 보급과 더불어 대중적인 정보전달 방식의 하나로 자리 잡고 있으며, 기존의 정보매체에 비해 사용자들의 관심사 변화를 보다 빠르게 반영하는 특징을 지닌다. 특히 다수 사용자의 관심을 끌고 있는 토픽의 경우, 다양한 정보 출처로부터 풍부한 정보를 제공할 수 있는 잠재력을 보유하고 있기도 하다. 그럼에도 불구하고 높은 비율로 존재하는 노이즈 등으로 인해 마이크로블로그로부터 유용한 정보를 획득하기란 쉽지 않은 문제로 남아있다. 지금까지 특정 문서로부터 주제를 효율적으로 추출, 추적하는 다양한 방법이 제안되었으나, 마이크로블로그와 같은 단문의 문서가 대량으로 생산되는 경우에 활용하기에는 미흡한점이 있었다. 본 논문에서는 특정 주제어가 주어졌을 때, 키워드 그래프를 구성함으로써 그에 대한 사용자들의 관심사가 어떻게 변화하는지를 효과적으로 파악하는 방법을 제안한다. 제안 방법은 크게 마이크로블로그 내에서의 단어 동시출현빈도를 이용하여 단어간 키워드 그래프를 생성하는 과정과, 네트워크 분할 기법을 이용하여 그래프를 적절히 분할함으로써 사용자의 관심사 별로 나누는 과정을 포함한다. 선별된 주제어에 대해 제안된 방법을 적용해 봄으로서 적은 비용으로 효과적인 주제 발견 및 분할이 가능함을 확인하였다.

웹2.0에서 의견정보의 실시간 모니터링을 위한 웹 콘텐츠 마이닝 시스템 (Web Contents Mining System for Real-Time Monitoring of Opinion Information based on Web 2.0)

  • 김영춘;주해종;최혜길;조문택;김영백;이상용
    • 한국지능시스템학회논문지
    • /
    • 제21권1호
    • /
    • pp.68-79
    • /
    • 2011
  • 본 연구에서 제안하는 시스템은 인터넷 상에 존재하는 여러 웹사이트들에 흩어져 있는 웹 콘텐츠에서 사용자 의견 정보들을 자동 추출 및 분석함으로써, 긍정/부정 의견별로 검색 및 통계를 확인할 수 있는 의견 검색 서비스를 제공한다. 그 결과 의견 검색 사용자들은 특정 키워드에 대하여 다른 사용자들의 의견을 손쉽게 한눈에 검색 및 모니터링하는 시스템을 용이하게 사용할 수 있으며, 웹 콘텐츠에서의 의견 추출 및 분석하는 기능을 제공받는다. 제안한 기법들은 다른 기법들과의 비교 실험을 수행하여 실제 성능이 우수함을 증명하였다. 성능 평가는 긍정/부정 의견 정보를 추출하는 기능의 성능 평가, 다국어 정보 검색을 위한 동적 윈도우 기법과 토크나이저 기법을 적용한 성능 평가, 그리고 정확한 다국어 음차표기를 추출 기법에 성능 평가를 실시하였다. 그 적용 사례로 대표적인 영화 리뷰 문장과 위키디피아 실험 데이터를 대상으로 실험하고 그 결과를 분석하였다.

텍스트 마이닝을 활용한 2017년 한국 대선 분석 (An Analysis of the 2017 Korean Presidential Election Using Text Mining)

  • 안은희;안정국
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.199-207
    • /
    • 2020
  • 최근 빅데이터 분석은 대량의 데이터로부터 미래를 예측하여 가치를 창출할 수 있어 다양한 분야에서 주목받고 있으며, 정치 캠페인 운영이나 결과 예측에도 활용되고 있다. 하지만 기존의 연구는 특정 SNS 데이터만을 분석하여 후보자들에 대한 정보를 취합하는데 한계가 있었다. 이에 본 연구는 2017년 한국 대선 후보별 뉴스와 댓글을 수집하여 뉴스 생성 추이, 토픽 추출, 감성 분석, 키워드 분석, 키워드 감성 분석을 하였다. 분석 결과, 대선 후보 간 다양한 토픽들이 생성되는 것을 확인하였으며, 후보별 이슈가 되는 중점 키워드와 이에 대한 유권자들의 호응도가 추출되었다. 본 연구는 포털 뉴스에서 생성되는 대선 캠페인에 대한 동향을 마이닝 할 수 있게 했다는 점과 감성 분석을 통해 대권주자들에 대한 유권자들의 관심과 의견들을 정량화하여 수치화한 것에 의의가 있다. 본 연구가 여론 수렴의 도구적 방법을 제시함으로써 이를 바탕으로 전략적인 행동 방안을 도출할 수 있을 것을 기대한다.

LDA 기반 사용자 감정분석을 위한 문서 토픽 추출 시스템에 대한 연구 (A Study on the Document Topic Extraction System for LDA-based User Sentiment Analysis)

  • 안윤빈;김학영;문용현;황승연;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.195-203
    • /
    • 2021
  • 최근 IT 분야의 주요 기술인 빅데이터는 다양한 산업 분야로 확장되고 있으며 활용 방안에 대한 연구가 활발하게 진행 중이다. 대부분의 인터넷 산업 분야에서 사용자 리뷰는 이용자가 상품 구매를 결정하는 데 많은 도움을 준다. 그러나 방대한 제품 리뷰에서 긍정, 부정적 의미와 도움이 되는 리뷰를 선별하는 과정은 제품 구매 결정에 있어 많은 시간을 요구한다. 따라서 본 논문에서는 빅데이터 분석 기술인 LDA를 이용해 키워드를 분석 및 종합하여 사용자에게 의미 있는 정보를 제공하는 시스템을 설계하고 구현한다. 문서 토픽 추출을 위해 본 연구에서는 국내 도서 산업을 도메인으로 데이터를 크롤링하고, 빅데이터 분석을 실시한다. 이를 통해 사용자 리뷰의 토픽 및 감정단어를 바탕으로 상품에 대한 종합적인 정보를 제공함으로써 구매자에게 도움을 주고 나아가 리뷰 현황 분석을 통해 상품의 전망 또한 파악할 수 있다.

Research on analysis of articleable advertisements and design of extraction method for articleable advertisements using deep learning

  • Seoksoo Kim;Jae-Young Jung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.13-22
    • /
    • 2024
  • 기사성광고의 필요성과 긍정적인면도 존재하나, 일부 무분별한 '기사성 광고'로 인하여 과장되고 위장된 정보를 전달함에 따라 독자들은 일반기사와 기사성 광고의 구별이 어려움에 따라 많은 정보의 오인과 혼란을 하고 있다. 독자들은 앞으로도 계속 새로운 정보를 획득하고 이러한 정보를 적재적소에 적용하여 많은 가치를 가져와야 하기에, 정확한 일반기사와 기사성 광고를 식별하는 것이 더욱이 중요하다고 판단된다. 따라서 일반기사와 기사성 광고의 구별된 정보를 필요로 하기에, 이러한 일환으로, 인터넷신문에서 이러한 무분별한 기사성 광고로 인한 정확한 정보식별의 어려움이 많은 독자들을 위해, 본 논문에서는 IT기술과 AI기술을 접목한 시스템측면에서 해결할 수 있는 방법을 제시하고자 하였으며, 이러한 방법은 광고성 키워드를 찾아내어 정제해주는 지식기반 자연어처리 방법과 딥러닝기술을 이용한 기사성 광고를 추출하고자 설계 하였다.

정보추출을 이용한 학습기반의 웹 인터페이스 에이전트 (Web Interface Agent based on Learning using Information Extraction)

  • 이말례;배금표
    • 정보관리학회지
    • /
    • 제19권1호
    • /
    • pp.5-22
    • /
    • 2002
  • 사용자는 원하는 자료를 검색하기 위해서 각 위치에 대한 정보를 저장하고 있는 검색엔진을 이용하는 경우가 대부분이다. 하지만 자료의 양이 방대해 짐에 따라 사용자에게 실제로 필요한 정보가 아닐 경우가 많이 발생한다. 본 논문에서는 이러한 문제를 해결할 수 있는 개인형 릴 인터페이스 에이전트 시스템인 7f 가이드를 제안하였다. 웹 가이드는 사용자의 행동과 에이전트의 방문을 키워드를 중심으로 각각의 사례로 저장하는 사례기반 학습 방법을 이용, 특징 개인 사용자가 웹 상에서 검색하고자 하는 자료를 입력받은 후부터 사용자의 방문 행동을 학습하여 보다 빠른 시간 내에 원하고자 하는 자료를 검색할 수 있도록 도와주는 에이전트 시스템이다.

스팸 문자 필터링을 위한 변형된 한글 SMS 문장의 정규화 기법 (A Normalization Method of Distorted Korean SMS Sentences for Spam Message Filtering)

  • 강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권7호
    • /
    • pp.271-276
    • /
    • 2014
  • 휴대폰에서 문자 메시지 전송 기능은 현대인들에게 매우 편리한 새로운 형태의 의사소통 방식이다. 반면에 문자 메시지 기능을 악용한 광고성 문자들이 너무 많이 쏟아져서 휴대폰 사용자들은 스팸 문자 공해에 시달리는 심각한 부작용을 낳게 되었다. 광고성 문자를 발송하는 사람들은 문자 메시지가 자동으로 차단되는 것을 회피하기 위해 한글 문장을 다양한 형태로 변형하거나 왜곡시키고 있으며, 이러한 문자 메시지를 자동으로 차단하기 위해서는 변형되거나 왜곡된 문장들을 정상적인 한글 문장으로 정규화하는 기술이 필수적이다. 본 논문에서는 변형되거나 왜곡된 광고성 문자 메시지를 정상적인 문장으로 정규화하고 정규화된 문장으로부터 자동 띄어쓰기 및 복합명사 분해 과정을 거쳐 키워드를 추출하기 위한 방법을 제안하였다.