• 제목/요약/키워드: 키워드검색기법

검색결과 254건 처리시간 0.018초

NFT(Non-Fungible Token) Patent Trend Analysis using Topic Modeling

  • Sin-Nyum Choi;Woong Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.41-48
    • /
    • 2023
  • 본 논문은 여러 산업 분야에서 범용적으로 활용될 수 있는 NFT(Non-Fungible Token)에 대해 토픽 모델링 기법을 활용하여 최근의 NFT 산업 동향에 대한 분석 결과를 제시한다. 본 연구에서는 산업 동향을 파악하기 위해 특허 데이터를 활용하였으며, NFT 표준안이 처음으로 발표되었던 2017년부터 2023년 10월까지 특허정보검색서비스 키프리스에 등록된 NFT 관련 국내·외 특허 각각 371건, 454건의 특허 데이터를 수집하였다. 다음으로 전처리 작업에서 불용어, 표제어를 제거 후 명사 단어만을 추출하였고, 분석 방법으론 빈도수에 따른 상위 50개의 단어를 나열하고, 단어마다 계산된 TF-IDF 값을 같이 확인하여 산업 동향의 핵심 키워드를 도출하였다. 다음으로, LDA 알고리즘을 활용해 국내·외 별로 특허 데이터에서 잠재된 4개의 주요 주제를 도출하였다. 도출한 주제별로 내용을 분석하고, 실제 NFT 산업사례를 근거로 들어 NFT 산업 동향 분석내용을 제시하였다. 선행연구에서는 논문 데이터를 통해 학술적 관점에서 동향을 제시하였다면 본 연구는 현장 실무에 기반을 둔 데이터를 활용하여 실용적인 동향 내용을 제공했다는 점에서 의의가 있으며, NFT 산업계 관련자들이 시장 현황 파악 및 새로운 아이템 창출을 위한 참고용으로 활용될 것으로 기대한다.

NATM 터널 공정리스크 데이터베이스 구축 및 리스크 분류체계 개발 (Establishment of Risk Database and Development of Risk Classification System for NATM Tunnel)

  • 김현비;바타갈래 위누리 키만디가 가루나라내;김병수
    • 한국건설관리학회논문집
    • /
    • 제25권1호
    • /
    • pp.32-41
    • /
    • 2024
  • 건설산업은 안전사고뿐 아니라 공기지연, 원가상승, 환경오염 등의 여러 복합적인 리스크가 발생하며 이를 해결하기 위한 관리기술이 필요하다. 그 중에서 프로젝트에 직접적인 영향을 미치는 공정리스크의 관리는 그 중요성에 비해 관련정보가 부족한 실정이다. 본 연구는 각 프로젝트마다 상이한 분류체계 사용으로 인한 리스크 정보검색의 어려움을 해소하기 위하여 MATM 터널 공정리스크분류체계를 개발하고자 하였다. 리스크수집은 기존 문헌검토와 Experience Mining 기법을 사용하였고 DB구축은 자연어처리 개념을 활용하였다. 분류체계의 구조는 자료의 호환성을 고려하여 기존 WBS 구조를 채택하였고, WBS의 공종과 연결된 RBS를 구축하였다. 연구결과 공종별 리스크를 쉽게 파악하고 리스크에 연결된 리스크특성과 리스크요인이 직관적으로 드러나는 리스크분류체계가 완성되었다. 구축된 분류체계의 활용성 검증결과 사용자의 키워드 입력으로 공종별 리스크와 리스크요인이 쉽게 식별되어 분류체계는 유효한 것으로 나타났다. 본 연구를 통해 NATM터널 계획 및 설계 시 작업공종에 따르는 리스크를 미리 식별하고 그 요인에 맞는 대응방안을 수립하여 비용과 공사기간의 증가를 방지하는데 기여할 수 있을 것으로 기대된다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

경의선숲길 조성 전후의 연남동 방문자의 경험 분석 - 블로그 텍스트 분석을 중심으로 - (The Analysis of the Visitors' Experiences in Yeonnam-dong before and after the Gyeongui Line Park Project - A Text Mining Approach -)

  • 김세령;최윤원;윤희연
    • 한국조경학회지
    • /
    • 제47권4호
    • /
    • pp.33-49
    • /
    • 2019
  • 선형공원은 도시조직과 교류가 활발한 만큼, 인근 지역에 다양한 영향을 미친다. 공원 관리에 있어 지역 방문자의 경험과 행태를 파악하는 것은 필수적이다. 본 연구에서는 이 점에서 착안하여 선형공원의 조성 전후를 포괄하는 기간 동안 인근 지역 방문자의 경험이 변화하는 추이를 알아보고자 하였다. 이를 위하여 블로그 글을 대상으로 텍스트 마이닝 기법을 사용하였으며, 연구 대상지는 경의선숲길과 연남동으로 하였다. 2013년 6월부터 2017년 5월까지 '연남동', '경의선', '연트럴파크'라는 키워드로 검색된 네이버 블로그 포스팅을 수집한 후 정제 및 무작위 추출을 이용해 분석 대상 자료를 선별하였다. 이를 1년 단위의 4개 시기로 구분한 후, 각 시기별 형태소 분석 및 사전구축, 빈도 분석을 실시했다. 그 후 중심성 분석과 응집성 분석을 수행해 연남동 방문자들의 주요 경험을 도출하였다. 연구 결과는 다음과 같다. 전체 기간 동안 연남동 방문자들의 가장 주된 경험은 꾸준히 식문화였지만, 마켓, 구경, 구매 등이 부수적인 활동들이 점점 많이 일어나고 있었다. 또한 경의선숲길 조성 후 공원에서 발생하는 산책, 놀기, 쉬기 등의 활동이 새롭게 등장했다. 뿐만 아니라, 공원 조성 후 연남동에 관해 더욱 다양한 의견이 블로그 상에서 오고 갔으며, 연남동은 여러 가지의 활동을 향유할 수 있는 공간으로 인식되고 있었다. 마지막으로 연남동 방문자들이 '식문화'에 대해 얘기할 때 함께 등장하는 하위 주제가 '먹다', '사진', '수다' 등의 단순한 주제에서 '마켓', '구경', '걷다' 등으로 그 범위가 넓어졌으며, '공원'과 함께 등장하는 주제 역시 초기에는 쉬기, 걷기 등의 일차적인 활동이었으나, 경의선 책거리의 등장과 함께 다양한 주제로 확대되었다. 본 연구는 텍스트 마이닝이라는 정량적 방법론으로 지역 방문자의 경험 변화를 공원 조성 전후를 포괄하여 비교적 객관적으로 분석했다. 하지만 텍스트 마이닝의 특성상 정제의 과정을 거치며, 부득이하게 주관이 이입된 점은 추후 보완되어야 한다. 또한 이러한 변화들과 공원 조성과의 직접적인 인과관계를 더욱 세밀하게 밝혀내는 후속 연구가 필요하다.