• 제목/요약/키워드: 검색어 추출

검색결과 328건 처리시간 0.023초

NFT(Non-Fungible Token) Patent Trend Analysis using Topic Modeling

  • Sin-Nyum Choi;Woong Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.41-48
    • /
    • 2023
  • 본 논문은 여러 산업 분야에서 범용적으로 활용될 수 있는 NFT(Non-Fungible Token)에 대해 토픽 모델링 기법을 활용하여 최근의 NFT 산업 동향에 대한 분석 결과를 제시한다. 본 연구에서는 산업 동향을 파악하기 위해 특허 데이터를 활용하였으며, NFT 표준안이 처음으로 발표되었던 2017년부터 2023년 10월까지 특허정보검색서비스 키프리스에 등록된 NFT 관련 국내·외 특허 각각 371건, 454건의 특허 데이터를 수집하였다. 다음으로 전처리 작업에서 불용어, 표제어를 제거 후 명사 단어만을 추출하였고, 분석 방법으론 빈도수에 따른 상위 50개의 단어를 나열하고, 단어마다 계산된 TF-IDF 값을 같이 확인하여 산업 동향의 핵심 키워드를 도출하였다. 다음으로, LDA 알고리즘을 활용해 국내·외 별로 특허 데이터에서 잠재된 4개의 주요 주제를 도출하였다. 도출한 주제별로 내용을 분석하고, 실제 NFT 산업사례를 근거로 들어 NFT 산업 동향 분석내용을 제시하였다. 선행연구에서는 논문 데이터를 통해 학술적 관점에서 동향을 제시하였다면 본 연구는 현장 실무에 기반을 둔 데이터를 활용하여 실용적인 동향 내용을 제공했다는 점에서 의의가 있으며, NFT 산업계 관련자들이 시장 현황 파악 및 새로운 아이템 창출을 위한 참고용으로 활용될 것으로 기대한다.

텍스트마이닝과 동시출현단어분석을 이용한 한국, 중국, 일본의 우제목 연구 동향 분석 (The Tresnds of Artiodactyla Researches in Korea, China and Japan using Text-mining and Co-occurrence Analysis of Words)

  • 이병주;김백준;이제민;어수형
    • 한국환경생태학회지
    • /
    • 제33권1호
    • /
    • pp.9-15
    • /
    • 2019
  • 우제목은 짝수 개의 발굽을 갖는 포유동물로 다양한 종이 전 세계적으로 광범위하게 서식하고 있다. 최근 국내에서는 멧돼지, 고라니와 같은 야생 우제목 동물에 의한 농작물 피해, 로드킬 등의 급증과 산양, 사향노루 등 일부 종의 개체수 급감으로 사회적 관심을 받고 있다. 그러나 이러한 사회적 관심에도 불구하고 우제목 관련 국내 연구는 매우 부족하며, 국내 우제목의 연구 동향 분석도 이루어지지 않아 실질적인 문제점을 파악하는데 어려움이 있다. 최근 연구 동향분석에 있어 텍스트마이닝과 동시출현단어분석은 연구 문헌들에서 나타나는 주요 단어들을 추출하고 단어들 간의 연관성을 정량화하는데 활용되고 있으며, 연구 주제의 분류에 있어 객관성을 증가시킨다. 본 연구에서는 텍스트마이닝과 동시출현단어분석을 통해 한국, 중국, 일본 3국의 우제목 연구 논문을 분석하고 국가별 연구 주제를 비교하여, 국내 우제목 연구에서의 부족한 점과 향후 필요한 점을 알아보고자 하였다. 각 국가별로 우제목과 관련된 연구 논문을 검색하여 수집한 665편의 논문들에 대한 텍스트마이닝 결과, 총 199개 단어가 추출되었다. 추출된 단어들에 대한 동시출현단어분석 결과 3개의 단어군이 형성되었다. 각 단어군에 포함된 단어들을 살펴본 결과, 단어군1은 "서식환경/생태", 단어군2는 "질병", 단어군3은 "보전유전학/분자생태"와 관련 있는 것으로 판단된다. 국가별로 각 단어군의 비율을 살펴본 결과, 중국과 일본은 비교적 고른 단어군 비율을 나타낸 반면, 한국은 "질병"과 관련된 단어군2의 비율이 69%로 상당히 큰 편중을 나타내었다. 연도에 따른 각 단어군별 단어수 회귀 분석 결과에서도 중국과 일본은 3개의 단어군에 해당하는 단어수가 시간 경과에 따라 비교적 고르게 증가하였지만, 한국은 단어군2의 증가율이 나머지 단어군의 5배 이상을 나타냈다. 국내 우제목 연구는 중국과 일본에 비해 질병과 관련된 연구 위주로 진행된 것으로 판단되며, 서식 특성, 행동, 분자생태를 포함한 연구는 매우 적게 수행된 것으로 판단된다. 향후 국내 야생 우제목 동물에 의한 피해 조절과 멸종위기종 보호를 위한 합리적인 정책 수립을 위해, 야생 우제목에 대한 생태 연구를 집중적으로 실시하여 기초생태 자료를 축적시켜 나가야 할 것이다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

소셜 네트워크 빅데이터 분석을 통한 마라톤 대중화 : JTBC 마라톤대회를 중심으로 (Popularization of Marathon through Social Network Big Data Analysis : Focusing on JTBC Marathon)

  • 이지수;김지영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권3호
    • /
    • pp.27-40
    • /
    • 2020
  • 마라톤은 남녀노소 누구나 즐길 수 있는 대표적인 생활체육으로 자리 잡은 지 오래이다. 최근 삶의 균형을 뜻하는 워라밸(Work and Life Balance) 트렌드가 전 사회로 확대되면서 진입 장벽이 비교적 낮은 마라톤은 20-30대 젊은 층에게 인기를 끌고 있다. 마라톤 대회의 이슈와 연관단어를 분석하여 2030 젊은 층들에게 인기 있는 마라톤 대회의 스포테인먼트적인 요소를 키워드를 통해 분석하여 차별화된 대회를 위한 발전방안을 제시하고자 한다. 키워드 및 연관단어 분석을 위해 네이버(Naver)와 다음(Daum)에서 제공하는 블로그, 카페, 뉴스가 분석채널로 선정되었고, 빅데이터 자료 검색을 위한 키워드는 'JTBC마라톤'과 '문화'를 주제어로 추출하였다. 자료 분석 기간은 2019년 JTBC 마라톤대회 참가 신청이 시작된 2019년 8월 13일부터 2019년 11월 13일까지 3개월간의 기간으로 한정하였다. 자료수집 및 분석을 위하여 소셜 매트릭스 프로그램인 텍스톰(Textom)을 통해 빈도 및 매트릭스 데이터를 추출하였다. 또한 텍스톰을 활용하여 단어들 간의 연결 구조와 연결정도 중심성을 분석하여 관계의 정도를 계량화 하였다. 분석결과를 살펴보면 첫째, 마라톤은 개인 운동임에도 불구하고 젊은 층들은 '러닝'이라는 공통분모를 공유하며 다른 젊은 층들과 '러닝크루'라는 새로운 문화 집단을 형성하였다. 이를 통해 홀로 외로이 뛰며 자신과의 싸움을 벌이는 마라톤의 이미지에서 벗어나 같이 훈련하고 같이 참가하며 같이 즐기는 축제의 장으로써의 마라톤 대회문화가 형성된 것을 확인할 수 있었다. 둘째, '훈련'의 과정을 중시하고 이를 다른 이들과 SNS를 통해 공유하는 문화가 확산되었음을 알 수 있었다. 세 번째, 유명인과 관련된 단어가 다양하게 도출되었다. 이는 마라톤대회에 참가하여 함께 레이스를 펼친 유명인은 물론 대회가 끝난 후 '애프터공연'에 출연하는 연예인에 대한 참가자들의 높은 관심을 반영한 결과라 하겠다. 네 번째, '후기'와 관련된 단어가 빈번히 도출되었다. 이는 젊은 마라토너들이 마라톤 준비과정은 물론 대회 당일의 경험을 타인들과 공유하는 문화가 반영된 것이라 분석된다. 다섯 번째, 공연과 관련된 단어가 상위 순위에서 도출되었다. 여섯 번째, '도전', '멋진', '성공', '즐겁' 등 긍정적이고 진취적인 감정을 표현하는 단어가 다수 도출되었다. 이 연구의 결과를 통해 젊은 아마추어 마라토너들의 마라톤대회 참가 동기와 목적은 건강과 체력증진처럼 단일하거나 단편적이지 않으며 다양하고 복합적인 종합 문화체험 행사로 마라톤 대회에 참가하고 있음을 확인할 수 있었다. 결국, 젊은 마라토너들의 마라톤 참여는 참가자체에 목적을 두는 '체력증진'의 목적보다는 대회를 선정하고 대회를 크루멤버들과 함께 준비하고 대회를 끝맺음하기까지의 일련의 과정을 하나의 '축제'로 여기는 것을 엿볼 수 있었다.

교회학교 유치부 관련 연구 동향 분석 : 국내 학위 논문 중심으로 (Analysis of Research Trends Related to Children's Department of Church School : Focusing on Domestic Dissertations)

  • 김민정
    • 기독교교육논총
    • /
    • 제71권
    • /
    • pp.181-210
    • /
    • 2022
  • 본 연구는 교회학교 유치부 관련 연구 동향을 알아보고자 하였다. 교회학교 유치부와 관련된 연구의 연구시기, 연구내용, 연구방법, 연구대상을 분석하여 교회학교 유치부 연구를 위한 기초자료를 제시하는데 목적이 있다. 본 연구를 위해 '교회학교', '유치부' 주제어로 국회도서관과 학술연구정보서비스(RISS)를 통해 검색된 국내 석·박사학위논문 50편을 추출하였다. 교회학교 유치부 관련 연구를 연구시기, 연구내용, 연구방법, 연구대상의 네 가지 준거로 분석하여 빈도와 백분율을 산출하였다. 연구결과, 첫째, 교회학교 유치부 연구논문의 연구시기별 동향은 1980년부터 2022년까지 석사학위 49편(98%), 박사학위 1편(2%)으로 나타났다. 연구시기별 동향은 석사학위 중심으로 연구가 이루어지고 있다. 둘째, 연구내용별 동향은 실천연구 27편(54%), 기초연구 23편(46%)으로 나타났다. 교회학교 유치부 관련 연구는 실천연구가 기초연구에 비해 상대적으로 높은 비율을 차지하였다. 셋째, 연구방법별 동향은 문헌연구 30편(60%), 양적연구 19편(38%), 질적연구 1편(2%) 순으로 나타났다. 교회학교 유치부 관련 연구는 문헌연구 중심으로 활발하게 이루어지고 있다. 넷째, 연구대상별 동향은 물적대상 35편(70%), 인적대상 15편(30%)으로 물적대상 중심으로 연구가 이루어졌다. 물적대상에서 교회학교, 매체 중심으로 연구가 이루어져서 교회학교와 가정 연계 연구가 필요하다. 교회학교 유치부 관련 연구는 성인(교사, 부모, 교육전도사) 중심의 연구가 이루어지고 있어, 교회학교의 유아에 대한 심층적 연구와 교회학교 유치부 현장의 목소리가 담긴 질적연구가 요구된다.

기독교 그림책 관련 연구 동향 분석 : 국내 학위 논문 중심으로 (Analysis of Research Trends Related to Christian Picture Books : Focusing on Domestic Dissertations)

  • 김민정
    • 기독교교육논총
    • /
    • 제68권
    • /
    • pp.245-277
    • /
    • 2021
  • 본 연구는 기독교 그림책 관련 연구 동향을 알아보고자 하였다. 기독교 그림책과 관련된 연구의 연구시기, 연구내용, 연구방법 연구대상을 분석하여 기독교 그림책 분야의 다양하고 균형 있는 연구를 위한 기초자료를 제시하는데 목적이 있다. 본 연구를 위해 '기독교 그림책', '성경 그림책', '기독교 동화', '성경 동화'를 주제어로 국회도서관과 학술연구정보서비스(RISS)를 통해 검색된 국내 석·박사학위논문 45편을 추출하였다. 기독교 그림책 관련 연구를 연구시기, 연구내용, 연구방법, 연구대상의 네 가지 준거로 분석하여 빈도와 백분율을 산출하였다. 연구결과, 첫째, 기독교 그림책 연구논문의 연구시기별 동향은 1999년부터 2021년까지 석사학위 43편(95.6%), 박사학위 2편(4.4%)으로 석사학위 중심으로 기독교 그림책 관련 연구들이 이루어지고 있다. 둘째, 연구내용별 동향은 기초연구 12편(26.6%), 실천연구 33편(73.4%)로 나타났다. 기독교 그림책 관련 연구는 기초연구보다 실천연구 중심으로 활발히 이루어지고 있다. 셋째, 연구방법별 동향은 양적연구 33편(73.4%), 문헌연구 11편(24.4%), 질적연구 1편(2.2%) 순으로 나타났다. 기독교 그림책 관련 연구는 양적연구 중심으로 이루어지고 있고, 상대적으로 문헌연구와 질적연구가 낮은 비율을 차지하였다. 넷째, 연구대상별 동향은 인적대상 35편(77.8%), 물적대상 10편(22.2%)으로 인적대상으로 이루어진 연구가 많았다. 인적대상에서 단일대상 33편(73.4%), 혼합대상 2편(4.4%)로 나타났고, 단일대상 중 유아·아동을 대상으로 하는 연구가 30편(66.7%)으로 높게 나타났다. 즉, 기독교 그림책 관련 연구는 유아-유아, 유아-교사, 유아-부모 간의 혼합대상보다 단일대상인 유아로 이루어진 연구 비율이 높았다.

숲놀이 관련 연구 동향 분석: 국내 학위 논문 중심으로 (Analysis of Research Trends Related to Forest Play: Focusing on Domestic Dissertations)

  • 김민정
    • 기독교교육논총
    • /
    • 제69권
    • /
    • pp.77-104
    • /
    • 2022
  • 본 연구는 숲놀이 연구 동향을 알아보고자 하였다. 숲놀이 연구의 연구시기, 연구내용, 연구방법 연구대상을 분석하여 숲놀이 연구의 활성화를 위한 기초 자료를 제공하고자 한다. 본 연구를 위해 '숲', '놀이', '숲놀이'를 주제어로 국회도서관과 학술연구정보서비스(RISS)를 통해 검색된 국내 석·박사학위논문 57편을 추출하였다. 숲놀이 연구를 연구시기, 연구내용, 연구방법, 연구대상의 네 가지 준거로 분석하여 빈도와 백분율을 산출하였다. 연구결과, 첫째, 숲놀이 연구의 시기별 동향은 2011년부터 2021년까지 석사학위 49편(85.9%), 박사학위 8편(14.1%)으로 석사학위 중심으로 숲놀이 연구가 이루어지고 있다. 둘째, 연구내용별 동향은 기초연구 16편(28.1%), 실천연구 41편(71.9%)으로 나타났다. 숲놀이 연구는 실천연구 중심으로 활발히 이루어지고 있다. 셋째, 연구방법별 동향은 양적연구 39편(68.4%), 질적연구 17편(29.8%), 문헌연구 1편(1.8%) 순으로 나타났다. 숲놀이 연구는 양적연구 중심으로 이루어지고 있고, 상대적으로 질적연구와 문헌연구가 낮은 비율을 차지하였다. 넷째, 연구대상별 동향은 단일대상 연구가 56편(98.2%).으로 나타났다. 단일대상은 아동 52편(91.2%), 교사 3편(5.2%), 부모 1편(1.8%) 순으로 나타났다. 혼합대상은 아동과 부모를 대상으로 한 연구가 1편(1.8%)으로 혼합대상으로 이루어진 연구가 필요하다. 물적대상 연구는 자연환경 42편(73.7%), 교육기관 13편(22.8%), 매체 2편(3.5%) 순으로 나타났다. 숲놀이 관련 가정환경 연구는 부족하여, 추후 숲놀이와 관련된 부모, 어린이-부모, 가정환경 등에 대한 연구가 이루어져야 한다.