• Title/Summary/Keyword: Search trends

검색결과 557건 처리시간 0.024초

태권도 뉴스기사의 연도별 주제어 비교분석: 토픽모델링 적용 (Comparative Analysis of the Keywords in Taekwondo News Articles by Year: Applying Topic Modeling Method)

  • 전민수;임효성
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.575-583
    • /
    • 2021
  • 이 연구는 토픽모델링을 적용하여 뉴스기사에 따른 태권도 동향을 연도별로 분석하는 것에 목적이 있다. 언론보도를 통한 태권도 동향을 살펴보기 위해 한국언론재단의 빅카인즈를 통해 뉴스기사와 태권도 전문 언론에 대한 기사를 수집하였다. 검색기간은 2000년 이전, 2001년~2010년, 2011년~2020년 3개의 구간으로 구분하여 검색하여 총 12,124개를 연구자료로 선정하였다. 토픽분석을 위해 전처리 과정을 거쳤으며, LDA 알고리즘을 활용하여 토픽분석을 수행하였다. 이때 모든분석은 python 3을 적용하였다. 그 결과 첫째, 연도별에 따른 언론기사 주제를 분석한 결과 2000년이전 1위는 '세계'. 2위는 '남북', 3위는 '올림픽'으로 나타났으며, 2001년~2010년 1위는 '세계', 2위는 '협회', 3위는 '세계태권도연맹'으로 조사되었다. 2011년~2020년 1위는 '세계', 2위는 '시범', 3위는 '국기원'으로 나타났다. 둘째, 2000년이전 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 2가지로 구분되었다. 구체적으로 Topic 1은 '남·북 체육교류', Topic 2는 '올림픽 시범종목 채택'으로 선정되었다. 셋째, 2001년~2010년 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 3가지로 선정되었다. Topic 1은 '태권도 시범공연 및 비리', Topic 2는 '무주태권도공원 조성', Topic 3은 '세계태권도축제'로 선정되었다. 넷째, 2011년~2020년 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 3가지로 선정되었다. Topic 1은 '2018 평창동계올림픽 성공 개최', Topic 2는 '남북 태권도 합동시범공연 ', Topic 3은 '2017 무주세계태권도선수권대회'로 선정되었다.

연구주제 분석을 통한 한국창작무용 경향 탐색 : 텍스트 마이닝의 적용 (Exploring the Trend of Korean Creative Dance by Analyzing Research Topics : Application of Text Mining)

  • 유지영;김우경
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권6호
    • /
    • pp.53-60
    • /
    • 2020
  • 이 연구는 현상의 흐름과 연구의 경향이 맥락적으로 일치한다는 가정을 바탕에 두고 있다. 이에 텍스트 마이닝을 활용하여 한국창작무용 연구의 주제 분석을 통해 춤의 경향을 탐색하는 것에 목적이 있다. 이에 논문 검색 웹사이트에 구축되어 있는 616편의 논문제목에서 1,291개의 단어를 분석하였다. 데이터의 수집 및 정제, 분석은 모두 R 3.6.0 SW을 사용하였다. 연구결과 첫째, 2000년대 이전에는 시대를 나타내는 키워드가 높은 빈도를 나타내었으나 교육 및 신체훈련 측면에서의 한국창작무용 연구유형도 발견되었다. 둘째, 2000년대 이후에는 무용단의 공연활동과 관련된 키워드의 빈도가 높게 나타났으나 최승희가 여전히 한국창작무용 연구에서 중요한 위치에 있다는 것이 확인되었다. 셋째, 한국창작무용 연구의 전체 연구주제를 분석한 결과 '근대시대 최승희의 예술', '현대 전통의 수용 양상과 가치', '전통춤의 안무적 표현 및 활용', '국립무용단의 공연 활동', '시대별 춤 표현', '교육 프로그램의 적용'으로 총 6개의 토픽이 추출되었다. 이 중 '근대시대 최승희의 예술'에 관한 연구가 가장 높은 비중을 차지하고 있는 것으로 나타났다. 넷째, 2000년을 기준으로 상승하고 있는 Hot 토픽은 '국립무용단의 공연 활동'과 '전통춤의 안무적 표현 및 활용'으로 나타났다. 그러나 최근 국립무용단의 공연 기조가 '전통을 기반으로 한 현대화'를 표방하고 있으므로 2000년대 이후 한국창작무용의 경향이 전통춤을 모티프로 한 안무적 표현과 그 활용에 공통적으로 집중되어 있음이 확인되었다. 다섯째, 2000년을 기준으로 하락하고 있는 Cold 토픽은 '시대별 춤 표현'에 관한 연구로 나타났다. 이것은 한국창작춤의 장르적 정착 이후 다양한 춤 스타일의 혼재에 따른 경향으로 연구에 대한 관심도 역시 저하된 것으로 판단되었다.

빅데이터환경에서 텍스트마이닝 기법을 활용한 한국의 석면 트렌드 (1918년~2027년) (Asbestos Trend in Korea from 1918 to 2027 Using Text Mining Techniques in a Big Data Environment)

  • 노열;정현이;박병노;김채원;김유미;서민아;신행수;김현욱;성예지
    • 자원환경지질
    • /
    • 제56권4호
    • /
    • pp.457-473
    • /
    • 2023
  • 석면은 악성중피종과 폐암 등 치명적인 질병을 유발하기 때문에 국내에서 2009년부터 그 사용이 전반적으로 금지되었다. 그러나 국내에서 지난 수십년 간 석면이 생산 및 수입되어 다양한 산업에서 사용되어 왔기 때문에 우리 주변에는 여전히 석면함유물질이 많이 존재하고 있어 안전한 관리가 절실하다. 이 연구는 지난 32년(1991년 ~ 2022년)동안의 빅데이터를 바탕으로 석면관련 주요키워드를 이용하여 석면관련 트렌드 변화를 살펴보고자 한다. 또한 국내 과거(1990년 이전)의 석면의 생산, 수입, 사용 실태와 더불어 현재(2023년~2027년)의 석면관련 정책 동향을 살펴보고자 하였다. 1991~2000년에는 국내 석면의 생산과 수입 그리고 이용으로 인하여 석면에 대한 발암성이 부각되는 시기로 연구, 근로자, 발암물질, 환경등과 관련된 키워드가 주를 이루었다. 2001~2010년에는 석면의 발암성과 관련하여 미국, 일본 등에서 소송이 시작되었던 시기로 폐암, 소송, 발암물질, 노출, 기업 등의 키워드가 주를 이루었다. 2011~2020년에는 국내에서도 석면문제의 심각성을 인지하는 키워드인 발암물질, 야구장, 학교, 슬레이트, 건축물, 폐석면광산 등이 지속적으로 상위권 키워드로 검색되었다. 2021년부터는 주로 검색되는 키워드는 학교, 슬레이트, 건축물 등과 조경석, 환경영향평가, 아파트, 시멘트 등의 키워드가 나타났다.

온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구 (A Study on Ontology and Topic Modeling-based Multi-dimensional Knowledge Map Services)

  • 정한조
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.79-92
    • /
    • 2015
  • 미래 핵심 가치 기술 발굴 및 탐색을 위해서는 범국가적인 국가R&D정보와 과학기술정보의 연계 융합이 필요하다. 본 논문에서는 국가R&D정보와 과학기술정보를 온톨로지와 토픽모델링을 사용하여 연계 융합하여 지식베이스를 구축한 방법론을 소개하고, 이를 기반으로 한 다차원 연계 지식맵 서비스를 소개한다. 국가R&D정보는 국가R&D과제와 참여인력, 해당 과제에 대한 성과 정보, 논문, 특허, 연구보고서 정보들을 포함한다. 과학기술정보는 논문, 특허, 동향 등의 과학기술연구에 대한 기술 문서를 일컫는다. 본 논문에서는 지식베이스에서의 지식 처리 및 관리의 효율성을 높이기 위해 Lightweight 온톨로지를 사용한다. Lightweight 온톨로지는 국가R&D과제 참여자와 성과정보, 과학기술정보를 과제-성과 관계, 문서-저자 관계, 저자-소속기관 관계 등의 단순한 연관관계를 이용하여 국가R&D정보와 과학기술정보를 융합한다. 이러한 단순한 연관관계만을 이용함으로써 지식 처리의 효율성을 높이고 온톨로지 구축 과정을 자동화한다. 보다 구체적인 Concept 레벨에서의 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 국가R&D정보와 과학기술정보 문서들의 토픽 주제어를 추출하고 각 문서 간 연관관계를 추출한다. 일반적인 Concept 레벨에서의 Fully-Specified 온톨로지를 구축하기 위해서는 거의 100% 수동으로 해야 하기 때문에, 많은 시간과 비용이 소모된다. 본 연구에서는 이러한 수동적인 온톨로지 구축이 아닌 자동화된 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 온톨로지 구축에 필요한 문서와 토픽 키워드 간의 관계, 문서 간 의미 상 연관관계를 자동으로 추출한다. 마지막으로, 이와 같이 구축된 지식베이스의 트리플(Triple) 정보를 활용하여, 연구자들의 공동저자관계, 문서간의 공통주제어관계 등을 연구자, 주제어, 기관, 저널 등의 다차원 연관관계를 방사형 네트워크 형식을 이용하여 시각화한 지식맵 서비스들을 소개한다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

해방 이후 우리나라 산업보건관리에 관한 문헌분류 및 연구동향 (Trends of Study and Classification of Reference on Occupational Health Management in Korea after Liberation)

  • 하은희;박혜숙;김영복;송현종
    • Journal of Preventive Medicine and Public Health
    • /
    • 제28권4호
    • /
    • pp.809-844
    • /
    • 1995
  • 산업보건관리영역의 범위를 정하고 이를 분류하기 위해 우선적으로 저자들이 정의한 산업보건관리영역의 범위에 따라 분류하고 이에 대하여 설문조사를 실시한 후 의견수렴과정을 거쳐 재분류하였다. 이를 토대로 해방 이후 우리나라의 산업보건관리문헌을 분류하여 연구동향을 파악하고자 정기간행물기사색인에 수록된 21종의 문헌을 분석하였으며 산업보건관리내용에 대한 우선순위 및 향후 산업보건관리 연구 방향을 조명함으로써 앞으로 산업보건관리의 방향설정에 대한 기초자료를 제공하고자 하였으며 다음과 같은 결과를 얻었다. 1 대부분의 응답자들이 산업보건을 전공하고(71.6%) 있었고, 대학에서 근무하고 있었으며(68.3%), 남자가 많았고 연령은 40세 이상이었다. 산업보건관리영역의 분류에 대찬 의견으로는 분류가 필요하다는 찬성의견이 70.0%였고 반대의견은 100.0%였다. 2. 응답자들의 의견수렴을 거쳐 재분류한 산업보건 관리영역을 크게 산업보건사법과 산업보건사업을 지지해 주는 산업보건관리체계 및 이를 평가하는데 도움을 주는 여러 가지 방법론들로 구분하였다. 3. 산업보건관리 문헌 총 510편을 연도별로 살펴본 결과 연도별로 서서히 증가하다가 1986년 이후에 급격 히 증가하고 있었으며, 학술지별 분포는 대한산업의학회지(18.2%), 한국의 산업의학(15.1%), 예방의학회지(15.1%) 순으로 나타났다. 연구 내용별로는 산업보건관리체계에 대한 연구는 33편(6.5%)에 지나지 않았으며 산업보건사업에 대한 연구가 477편(93.5%)으로 주를 이루고 있었다. 산업보건관리체계에 대한 연구는 산업보건자원체계에 대한 연구가 15편(45.5%), 산업보건재원조달체계 8편(24.2%), 산업보건관리운영체계 6편(18.2%), 산업보건조직체계 3편(9.1%), 산업보건서비스전달체계 1편 (3.0%)의 순이었으며 산업보건사업에 대한 연구는 질병관리 269편(57.2%),보건관리 116편(24.7%),작업환경관리 85편(18.1%)으로 질병관리에 관한 연구가 가장 많았다. 연구대상별로는 일반근로자 대상이 185편(71.1%)으로 가장 많았으며 여성근로자, 전문직, 서비스근로자 순이었다. 4. 산업보건관리내용의 우선순위에 대한 의견으로는 산업장근로자들에 대한 건강관리, 작업환경관리, 보건교육 등의 산업보건사업이 가장 필요하다고 하였고 다음으로는 산업보건인력에 대한 교육훈련 및 직무내용, 성인병 및 직업병 의뢰체계, 산업보건조직 등에 관한 산업보건의료체계에 관한 분석 등을 순위로 제시하였다. 5. 산업보건관리영역의 향후 연구방향에 대하여 병의 응답자가 48건의 의견을 제시하였으며 산업보건사업에 관한 실제적인 연구가 31.3%로 가장 많았으나 조직, 체계에 대한 연구(27.1%), 정보망구축에 관한 연구(8.3%) 등 산업보건체계에 관한 연구도 필요하다고 하였다. 건강진단에 대한 비용-편익분석 (10.4%), 산업보건사업평가(4.2%), 유해물질폭로평가(2.1%), 노동조건에 관한 연구(6.2%)등 다양한 새로운 분야의 연구에 대한 의견을 제시하였다. 본 연구에서 해방 이후 우리나라의 산업보건관리에 관한 연구는 1945년부터 서서히 증가하다가 1986년 이후부터 활발히 진행되어졌고, 대부분의 연구가 산업보건사업에 치중되어 있으며 산업보건관리체계에 대한 연구는 미약함을 알 수 있었다 산업보건사업에 관한 연구의 대부분도 직업병 실태와 건강관련행태 및 실태를 파악하는 수준에 머무르고 있으며 산업보건관리체계의 경우도 대부분 인력의 실태 파악에 그치고 있어 산업장에서 실제로 활용할 수 있는 연구가 절실히 필요하다고 여겨진다. 따라서 우리나라의 현실에 비추어볼 때 산업보건사업에 관한 연구는 계속적으로 활발히 이루어져야 하며, 이와 더불어 산업보건관리체계 및 근로자참여, 경제성분석, 보건사업 후 평가, 연구방법론(역학연구)등의 연구들도 산업보건관리의 중요한 부분으로서 향후 보다 더 적극적으로 연구되어져야 할 것이다.

  • PDF

사고가 시각을 바꾼다: 조절 초점에 따른 소비자 감성 기반 웹 스타일 평가 모형 및 추천 알고리즘 개발 (Individual Thinking Style leads its Emotional Perception: Development of Web-style Design Evaluation Model and Recommendation Algorithm Depending on Consumer Regulatory Focus)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.171-196
    • /
    • 2018
  • 본 연구는 디자인 영역 중 웹 스타일에 대해서 소비자 감성과 만족과의 관계를 연구했다. 기존 웹 스타일 연구들은 웹의 레이아웃과 구조도 등과 색상 등이 감성에 미치는 영향에서 연구했다. 본 연구는 기존 연구들과 차별되게 웹의 구성 요소를 배제하고 소비자의 감성 지표만을 갖고 소비자 만족과의 관계를 분석했다. 분석을 위해 검증을 위해 소비자 204명을 대상으로 40개 웹 스타일 테마를 선정, 각 소비자에게 4개씩 평가하도록 하였다. 소비자에게 평가하도록 한 감성 형용사는 18개의 대비되는 쌍을 갖는 감성 형용사로 구성하였고, 요인 분석을 통해 상위 감성 지표를 추출했다. 각 감성 지표들은 '부드러움', '모던함', '명확함', '꽉 참' 이었으며, 감성지표들이 소비자 만족에 미치는 영향이 다를 것으로 판단하여 가설을 수립했다. 분석 결과에 따라 가설 1과 2, 3은 채택되었으며, 가설 4의 경우는 기각되었다. 가설 4의 경우 기각되었지만 정의 방향이 아닌 부의 방향으로 유의한 것으로 나타났다. 이때, 조절 초점 성향이 감성이라는 정보처리 과정에서 소비자 만족에 미치는 영향이 다를 것으로 판단했다. 조절 초점 성향은 조직 행동 및 의사결정에 영향을 주기도 하며, 정치, 문화, 윤리적 판단 및 행동은 물론 광범위적 심리적 문제와 사고 프로세스, 감정적 반응에도 영향을 미친다. 때문에 각 감성 지표에 대한 조절 초점 간 차이를 확인할 필요성이 있고, 각 감성 지표에 대한 세부 가설을 수립했다. 세부 가설을 검증하기 위해 조절 회귀 분석을 수행했다. 분석 결과 가설 5는 부분적으로 지지됐고, 가설 5.3만 지지되었고, 5.4의 경우 기각되었지만 가설과의 반대 방향으로 지지되었다. '명확함'의 경우 향상 초점이 소비자 만족에 더 큰 영향을 보였고, 예방 초점일수록 '꽉 참'을 더 선호한 것으로 나타났다. 분석 결과를 바탕으로 조절 초점 성향을 향상, 예방, 중간 성향으로 3집단으로 구분, 소비자 감성 기반으로 웹 스타일에 대한 추천을 할 수 있는 알고리즘을 개발했다.