• 제목/요약/키워드: 키워드 추출 방법

검색결과 355건 처리시간 0.029초

빅데이터 분석을 활용한 콜라겐 키워드에 대한 패턴 (A Pattern Study on Keyword of the Collagen through Utilizing Big Data Analysis)

  • 유옥경;진찬용;남수태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.124-125
    • /
    • 2016
  • 빅데이터 분석은 기존 데이터베이스 관리 도구로부터 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 말한다. 또한 대량의 정형 또는 비정형 데이터 집합으로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 해당된다. 글로벌 리서치 기관들은 빅데이터를 2011년 이래로 최근 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 가치 창출을 위한 노력을 기울이고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석도구인 소셜 매트릭스를 활용하여 키워드 분석을 통해 콜라겐 키워드에 대한 의미를 분석하고자 한다. 또한 분석결과를 바탕으로 실무적 시사점을 제시하고자 한다.

  • PDF

Efficient Keyword Extraction from Social Big Data Based on Cohesion Scoring

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.87-94
    • /
    • 2020
  • 블로그나 SNS 피드 등의 소셜 리뷰는 고객 관점의 의견이나 불만 사항을 반영한 키워드를 추출하기 위한 목적으로 광범위하게 활용되고 있으며, 최근 트렌드를 반영한 신조어나 고유명사를 포함하는 경우가 많다. 이들 단어는 사전에 포함되어 있지 않아 기존 형태소 분석기가 잘 인지하지 못하는 경우가 많으며, 동시에 상당한 처리 시간이 소요되어 키워드 분석 결과를 실시간으로 제공하는데 어려움이 있다. 본 논문에서는 응집도 점수 개념을 기반으로 소셜 리뷰로부터 키워드를 효율적으로 추출하기 위한 방법을 제안한다. 응집도 점수는 단어의 빈도수를 기반으로 계산되어 별도의 사전이 필요없다는 장점이 있으나, 띄어쓰기가 되지 않은 입력 데이터에 대해서는 정확도가 떨어질 수 있다. 이와 관련하여 본 논문에서는 단어 트리 구조를 이용하여 기존의 응집도 점수 계산 방법을 개선한 알고리즘을 제시한다. 또한 실험을 통해 제안하는 방법이 15.5%의 오류율을 보이는 동시에, 1,000개의 리뷰를 처리하는데 0.008초 정도 소요됨을 확인하였다.

실감형 360도 영상저작물 객체 추출을 통한 추천광고 매칭방법 (A Matching Method of Recommendations Advertisements by Extracting Immersive 360-degree Video Object)

  • 장세영;박병찬;김영모;유인재;이재청;김석윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.231-233
    • /
    • 2020
  • 최근 360도 형태로 영상을 촬영하고 제공하는 경우가 많아 일반적인 동영상과 달리 360도 형태의 영상저작물에 적절하고 효과적인 방법으로 광고를 삽입하여 노출 시킬 수 있는 방법이 필요하게 되었다. 따라서 본 논문에서는 실감형 360도 영상저작물 객체 추출을 통한 추천 광고 매칭방법을 제안한다. 360도 영상저작물 내에 광고를 매칭하고 추출된 객체와 연관된 광고를 추출하여 해당 프레임에 자동으로 삽입 노출이 가능하도록 하는 방법으로 이 방법을 이용함으로써 사용자의 현재 시점 영역 내에 광고 영상이 노출되도록 광고의 삽입 위치를 이동시켜 영상이 재생되도록 하거나, 광고 영상이 삽입된 좌표로 사용자의 현재 시점을 이동시켜 영상이 재생되게 할 수 있다.

  • PDF

키워드 네트워크를 이용한 국내 관광연구의 최근 연구동향 분석 (The Study on Recent Research Trend in Korean Tourism Using Keyword Network Analysis)

  • 김민선;엄혜미
    • 한국산학기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.68-73
    • /
    • 2016
  • 관광에 대한 학문적 실무적 관심과 소비가 지속적으로 증가하고 있음에 따라 본 연구에서는 최근 약 6년간의 관광분야 주요 등재지에 실린 키워드 데이터를 이용하여 국내 관광연구 동향과 지식구조를 정리해보고자 하였다. 이를 위해 첫 번째, 관광분야의 대표적인 국내 저널들을 선정하고 저널에 게재된 논문 별 키워드를 추출하였다. 두 번째, 동일한 논문에 동시 등장한 키워드들을 링크로 연결하여 키워드 네트워크를 구성하였다. 마지막으로, 여러 논문에서 동시에 키워드로 사용된 키워드들 간의 유사성 분석을 통해 관광 논문들에서 가장 자주 사용된 주요 키워드를 추출하고 전체 네트워크에 대한 컴포넌트 분석을 통해 거시적인 관광연구동향 및 지식구조를 파악하였다. 분석 결과, 국내 관광연구 주제들은 몇몇 주제에 고착되어 있지 않고 빠르고 다양하게 변화하는 양상을 보인다고 할 수 있다. 물론 조직이나 종사원 차원의 주제와 같이 지속적으로 선호되는 연구주제들도 있지만 시간이 지남에 따라 연구대상의 내재적, 외재적 요인들이 점차 세분화되고 연구대상들도 종사 분야에 따라 다양하고 구체적으로 선정되어 진행되고 있음을 확인할 수 있었다. 본 연구는 기존의 계량적 분석방법과 키워드 중심성 분석방법이 아닌 컴포넌트 분석을 수행함으로써 국내관광연구의 구체적 연구주제를 파악할 수 있고 이들 간의 관계를 살펴볼 수 있어 앞으로 이 분야에서의 새로운 주제를 선정하는데 참고할 유용한 정보로 활용될 수 있다.

형태소 분석을 이용한 발화관련 기기의 새로운 입력 키워드 추출 (New Input Keyword Extraction of Equipments Involved in Ignition Using Morphological Analysis)

  • 김은주;최정우;류정우
    • 한국화재소방학회논문지
    • /
    • 제28권2호
    • /
    • pp.91-97
    • /
    • 2014
  • 급변하는 사회에서 기존에는 없었던 새로운 화재 사고가 발생하거나, 또는 과거에는 자주 발생된 화재 사고가 발생하지 않는 경우가 많아지고 있다. 본 논문에서는 화재분류체계를 개선할 때 사용할 수 있는 새로운 명사를 화재조사데이터로부터 추출하는 방법을 제안하였다. 화재조사데이터는 화재 조사관에 의해 작성된 화재사고 관련 데이터이다. 제안한 방법은 기타 소분류에 포함된 화재조사데이터의 제품명과 발화개요를 형태소 분석하여 발화관련 기기의 소분류 범주로 사용할 수 있는 새로운 입력 키워드를 추출하였다. 본 논문에서는 제품명을 분석하여 발화관련 기기 대분류인 농업용장비와 계절용 기기의 새로운 소분류 범주로 "건조기"와 "보일러"를 추출하였다. 또한 발화개요를 분석하여 발화관련 기기 대분류인 상업장비와 영상, 음향기기의 새로운 소분류 범주로 "수족관"과 "모니터"를 추출하였다. 이 네 가지의 새로운 소분류 범주로 화재조사데이터를 재분류하였을 때 총 3,808건 중 14.39%인 548건이 재분류되었다.

퍼지추론과 신경망을 사용한 유즈넷 뉴스그룹 결정 (Determination of Usenet News Groups by Fuzzy Inference and Neural Network)

  • 김종완;김희재;김병만
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.401-404
    • /
    • 2004
  • 본 연구에서는 다양한 뉴스그룹들 중에서 사용자의 취향과 유사한 뉴스그룹들을 코호넨 신경망을 이용하여 추천해주는 방법을 제시한다. 신경망을 학습시키기 위한 뉴스 문서의 키워드들을 선택하기 위해 여러 문서들로부터 후보 용어들을 추출하고 퍼지 추론을 적용하여 대표 용어들을 선택한다. 하지만 신경망의 학습패턴을 관찰해 보면, 맡은 부분이 비어있는 희소성 문제를 발견할 수 있다. 이에 본 연구에서는 통계적인 결정계수를 도입하여 불필요한 차원을 제거한 후 신경망을 학습시키는 새로운 방법을 제안한다. 제안된 방법은 모든 차원을 활용할 때 보다 클러스터내 거리와 클러스터간 거리의 척도를 이용한 클러스터 중첩도 면에서 우수한 분류 성능을 보여줌을 확인하였다.

  • PDF

검색결과의 브라우징을 위한 계층적 클러스터링 (A Hierarchical Clustering for Browsing Retrieval Results)

  • 윤보현;김현기;노대식;강현규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.342-344
    • /
    • 2000
  • 대부분 웹 검색엔진들의 검색결과로 수십 혹은 수백만건의 문서가 제시되어 사용자가 원하는 문서를 찾는데 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 검색 결과의 브라우징을 위한 검색 결과 문서에 대한 자동 클러스터링 방법을 제안한다. 문서간 유사도를 계산하기 위해 공통 키워드 빈도를 이용하고, 클러스터링 방법은 계층적 클러스터링을 사용하고, 각 클러스터에 대한 디스트립터를 추출하기 위해 빈도를 이용한다. 실험 결과, 완전 연결 방법이 가장 나은 정확도를 보였지만 계산시간이 많이 소요되어 동적 환경에 부적합하다는 것을 보였다. 아울러 집단 평균 연결이 정확도나 계산 시간 측면에서 우수함을 알수 있었다.

  • PDF

방탄헬멧 기술분야 키워드에 대한 네트워크 분석 (A Network Analysis of Ballistic Helmet Technology Keyword)

  • 강진우;박재우;김지훈
    • 한국산학기술학회논문지
    • /
    • 제18권4호
    • /
    • pp.311-316
    • /
    • 2017
  • 네트워크 분석 방법론은 특정 학술분야에 대한 인용, 공저, 키워드 등과 같은 다양한 지식관계를 네트워크로 표현하고 분석할 수 있기 때문에 다양한 분야의 학술영역에서 새로운 연구방법론으로 주목 받고 있다. 방탄기술은 소재역학, 구조역학 및 탄도학 등 다양한 학문들이 융합된 종합기술분야로서, 각 분야 사이의 최신연구 및 기술동향을 파악하는 것이 필수적이다. 따라서 본 논문에서는 키워드 기반의 네트워크 분석기법을 방탄기술에 접목하여 최신 연구 동향을 파악하고자 하였다. 먼저 학술 검색엔진인 'google scholar'를 이용하여 주요 핵심 키워드인 'Composite', 'Model', 'Head'를 추출하였고, 추출된 핵심 키워드의 중심성 분석을 통해서 방탄기술의 핵심이 되는 소재분야(Composite, Material, Fiber 등)와 피탄 충격을 최소화 할 수 있는 구조분야(Model, Design, Simulation) 그리고 피탄 후 사용자가 받는 충격영향에 대한 연구(Head, Brain, Injury) 등의 3가지 영역에서 관련 연구가 활발히 진행 중인 것을 파악할 수 있었다. 본 논문에서 시행한 방탄분야에 대한 키워드 네트워크 분석은 기존에 보고되지 않은 방식이며, 차후 방탄기술과 관련한 국방기술기획 및 연구개발의 방향성을 제시하기 위한 기반자료로서 활용 가능할 것으로 판단된다.

연관규칙 기반 동시출현단어 분석을 활용한 기술경영 연구 주제 네트워크 분석 (Exploring the Research Topic Networks in the Technology Management Field Using Association Rule-based Co-word Analysis)

  • 전익진;이학연
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.101-126
    • /
    • 2016
  • 본 연구는 동시출현단어(co-word) 분석을 이용하여 기술경영 분야의 연구 주제 네트워크를 구축하고, 핵심 연구 주제 및 연구 주제 간 상호연관관계를 도출한다. 동시출현 빈도수의 정규화를 통해 키워드 간 유사성을 도출하여 무방향 네트워크를 분석하는 기존 연구들과는 달리 본 연구는 연관규칙분석(association rule)을 통해 키워드 간 신뢰도(confidence)를 도출하여 유방향 네트워크 분석을 수행한다. 2011~2014년 기술경영 분야 9개 국제 학술지에 게재된 2,456개의 논문의 저자키워드를 대상으로 빈도수 상위 200개 키워드를 추출하고, 주제(THEME), 방법(METHOD), 분야(FIELD)의 세 가지 유형으로 키워드를 분류한다. 각 유형별 일원(one-mode) 네트워크를 구축하여, 함께 많이 연구가 이루어진 키워드들을 찾아내고, 핵심 키워드를 도출한다. 또한 두 가지 유형의 키워드 간의 이원(two-mode) 네트워크를 구축하여, 연구 주제별로 함께 많이 활용된 방법 및 대상 분야를 탐색한다. 본 연구 결과는 최근 성숙기에 접어든 기술경영 분야의 연구 흐름 및 지식 구조를 키워드 수준에서 구체적으로 제시함으로써, 기술경영 분야 연구자들의 연구 주제 탐색 및 연구방향 설계에 활용될 수 있을 것으로 기대된다.

빅데이터 클러스터에서의 추출된 형태소를 이용한 유사 동영상 추천 시스템 설계 (A Design of Similar Video Recommendation System using Extracted Words in Big Data Cluster)

  • 이현섭;김진덕
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.172-178
    • /
    • 2020
  • 최근 널리 이용되고 있는 동영상 공유 서비스에서는 콘텐츠 추천 시스템이 매우 중요한 요소이다. 콘텐츠 추천을 위해서 일반적으로 사용자 선호도와 동영상(아이템) 유사도를 동시에 고려하는 협업 필터링을 사용하고 있다. 그러한 서비스는 주로 사용자의 검색 키워드와 시청시간과 같은 개인 선호도를 활용하여 사용자의 편의를 도모한다. 또한 동영상에 지정한 키워드를 중심으로 랭킹화한다. 그러나 한정된 키워드만을 이용한 동영상 유사도를 분석한다는 한계가 있다. 이런 경우 지정한 키워드가 아이템을 제대로 반영하지 못하는 경우 그 문제가 심각해진다. 이 논문에서는 교육 동영상으로부터 차별화된 의미를 갖는 모든 단어를 고려하여 유사도를 분석하며, 이런 경우 데이터와 연산의 규모가 방대하기 때문에 빅데이터 클러스터에서 처리하는 방법을 적용한다. 제안한 시스템은 빅데이터 영상 분석을 통해 동영상 공유 서비스 플랫폼의 기본 모듈로 활용될 것으로 기대한다.