• 제목/요약/키워드: keyword extraction

검색결과 192건 처리시간 0.02초

Analysis of trends in deep learning and reinforcement learning

  • Dong-In Choi;Chungsoo Lim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.55-65
    • /
    • 2023
  • 본 논문에서는 딥러닝 및 강화학습 연구에 대해 KeyBERT(Keyword extraction with Bidirectional Encoder Representations of Transformers) 알고리즘 기반의 토픽 추출 및 토픽 출현 빈도 분석으로 급변하는 딥러닝 관련 연구 동향 분석을 파악하고자 한다. 딥러닝 알고리즘과 강화학습에 대한 논문초록을 크롤링하여 전반기와 후반기로 나누고, 전처리를 진행한 후 KeyBERT를 사용해 토픽을 추출한다. 그 후 토픽 출현 빈도로 동향 변화에 대해 분석한다. 분석된 알고리즘 모두 전반기와 후반기에 대한 뚜렷한 동향 변화가 나타났으며, 전반기에 비해 후반기에 들어 어느 주제에 대한 연구가 활발한지 확인할 수 있었다. 이는 KeyBERT를 활용한 토픽 추출 후 출현 빈도 분석으로 연구 동향변화 분석이 가능함을 보였으며, 타 분야의 연구 동향 분석에도 활용 가능할 것으로 예상한다. 또한 딥러닝의 동향을 제공함으로써 향후 딥러닝의 발전 방향에 대한 통찰력을 제공하며, 최근 주목 받는 연구 주제를 알 수 있게 하여 연구 주제 및 방법 선정에 직접적인 도움을 준다.

구문트리에서 키워드 추출을 이용한 프로그램 유사도 평가 (A Program Similarity Evaluation using Keyword Extraction on Abstract Syntax Tree)

  • 김영철;최재영
    • 정보처리학회논문지A
    • /
    • 제12A권2호
    • /
    • pp.109-116
    • /
    • 2005
  • 본 논문에서는 프로그램의 분석 과정에서 생성된 구문트리에서 키워드만을 추출하여 유사도 평가하는 방법을 소개한다. 이 방법은 기존의 구조 기반 방법과 같이 프로그램 구조적 특징에 상관없이 유사도를 평가한 수 있으며, 구문트리의 키워드만을 평가에 이용함으로써 기존 시스템의 단점이었던 속도를 개선할 수 있었다. 따라서 본 논문에서는 유사도 평가 모델을 제시하고, 생성된 구문트리에서 키워드를 추출하는 방법을 제시하였다. 본 논문의 평가 부분에서는 기존 시스템에 비해 본 시스템이 구조적 특징이나 속도 면에서 많이 개선되었다는 것을 보여주었다. 따라서 본 시스템은 향후에 텍스트 위주의 문서의 유사도나 XML과 같은 전자 문서의 유사도 평가에 지대한 영향을 줄 것으로 기대된다.

SELIS OPAC에 있어서 키워드탐색의 이용과 이해 (The Use and Understanding of Keyword Searching in SELIS Online Public Access Catalogs)

  • 구본영
    • 한국문헌정보학회지
    • /
    • 제33권2호
    • /
    • pp.119-139
    • /
    • 1999
  • 이 논문의 목적은 SELIS(SEoul Women's University Library and Information System) OPAC 시스템에서 키워드와 불연산자 탐색이 어떻게 처리되는지에 대한 이용자의 이해를 분석하는데 있다. 연구문제를 통하여 분석한 결과 SELIS OPAC시스템이 처리하는 키워드 추출에 대한 이해도는 전체 298명에서 정답자 67명$(22.48\%){\cdot}$오답자 231명$(77.52\%)$, 키워드탐색에서 불연산자 OR 사용에 대한 이해도는 전체 297명에서 정답자 115명$(22.48\%){\cdot}$오답자 182명$(77.52\%)$, 키워드탐색에서 불연산자 AND 사용에 대한 이해도는 전체 296명에서 정답자 98명$(33.11\%){\cdot}$오답자 198명$(66.89\%)$, 불연산자 사용방법 및 연산자 심볼에 대한 이해도는 전체 285명에서 정답자 109명$(36.49\%){\cdot}$오답자 181명$(63.51\%)$으로 전체적으로 이해도가 저조한 것으로 분석되었다. 또한 SELIS OPAC 시스템에서 키워드 탐색 경험에 따라 키워드 탐색 이해도에 차이가 나는지를 분석한 결과 유의수준 $5\%$에서 상관관계가 없는 것으로 분석되었고, 불연산자 탐색 경험에 따라 불연산자 사용방법에 대한 이해도는 유의수준 $5\%$내에서 상관관계가 있는 것으로 분석되었다.

  • PDF

텍스트마이닝 기법을 이용한 모바일 피트니스 애플리케이션 주요 요인 분석 : 사용자 경험 관점 (An Analysis on Key Factors of Mobile Fitness Application by Using Text Mining Techniques : User Experience Perspective)

  • 이소현;김진솔;윤상혁;김희웅
    • 한국IT서비스학회지
    • /
    • 제19권3호
    • /
    • pp.117-137
    • /
    • 2020
  • The development of information technology leads to changes in various industries. In particular, the health care industry is more influenced so that it is focused on. With the widening of the health care market, the market of smart device based personal health care also draws attention. Since a variety of fitness applications for smartphone based exercise were introduced, more interest has been in the health care industry. But although an amount of use of mobile fitness applications increase, it fails to lead to a sustained use. It is necessary to find and understand what matters for mobile fitness application users. Therefore, this study analyze the reviews of mobile fitness application users, to draw key factors, and thereby to propose detailed strategies for promoting mobile fitness applications. We utilize text mining techniques - LDA topic modeling, term frequency analysis, and keyword extraction - to draw and analyze the issues related to mobile fitness applications. In particular, the key factors drawn by text mining techniques are explained through the concept of user experience. This study is academically meaningful in the point that the key factors of mobile fitness applications are drawn by the user experience based text mining techniques, and practically this study proposes detailed strategies for promoting mobile fitness applications in the health care area.

국한문 혼용 텍스트 색인어 추출기법 연구 『시사총보』를 중심으로 (An Experimental Approach of Keyword Extraction in Korean-Chinese Text)

  • 정유경;반재유
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.7-19
    • /
    • 2019
  • 본 연구는 국한문 혼용 텍스트를 대상으로 한글 형태소 분석 기법과 한문 어조사를 반영한 색인어 추출기법을 제안하였다. 국한문 혼용체로 작성된 『시사총보』 논설을 대상으로 해당 시기에 사용된 고유명사 및 한자어 사전을 보완하였으며 한자어 불용어 리스트를 고려하여 색인어를 추출하였다. 본 연구에서 제안한 국한문 색인 시스템은 수작업 색인 결과를 기준으로, 중국어형태소 분석기에 비해 재현율과 정확률 측면에서 상대적으로 높은 성능을 보였으며, 어문법이 확립되지 않은 근현대 시기의 국한문 혼용체를 대상으로 한 첫 번째 색인어 추출기법을 제안하였다는 데에서 연구의 차별점이 있다.

자동차 멀티미디어 시스템에서의 사진과 음악을 이용한 음악스토리 비디오 자동생성 기술 (Automatic Music-Story Video Generation Using Music Files and Photos in Automobile Multimedia System)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제9권5호
    • /
    • pp.80-86
    • /
    • 2010
  • 본 논문에서는 차량 내의 멀티미디어 시스템에 장착되는 엔터테인먼트 기능 중의 하나인 음악스토리 자동생성 기술을 소개한다. 음악스토리 비디오 자동생성 기술은 개인이 소지하고 있는 휴대폰을 차량 내의 멀티미디어 시스템과 연결하여, 휴대폰 안에 저장된 음악과 사진의 결합을 통해 음악비디오를 자동으로 생성하는 멀티미디어 요소기술로서, 사용자에게 분위기에 맞게 음악을 들으면서 생성된 음악스토리 비디오를 즐기는 기능을 제공한다. 음악스토리 비디오 자동생성 기술에 대한 성능은 음악분류, 사진분류, 핵심단어 검출 등의 정확도와 생성된 음악스토리 비디오를 시청한 사용자의 MOS 결과를 통해 측정되었다.

KP AGENT를 이용한 기술정보공간의 구축 (ICPIS Construction using KP Agent)

  • 박경우;배상현
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.14-21
    • /
    • 2000
  • 이용자의 학술정보 데이터베이스의 기능을 보충하는 새로운 지식표현 패러다임으로 기술정보공간(ICPIS: Information Communication Papers Intelligent Surveyor)을 제안한다. 이것은 기술정보로부터 자동적으로 구축되어 그 중에서 이용자가 자유롭게 탐방 할 수 있는 정보 공간이다. 구축방법과 탐방기능을 명확히 하여 실 시스템을 구축, 평가하는 것이 연구의 목적이다. 이를 위해 ICPIS는 Keyword로 기술된 논문군을 입력하여 논문내용의 항목별 요약, 유사논문의 시각적 표시와 비교, 인과관계의 추출을 시작으로 논문의 요약정보, Survey정보를 사용자에게 제공한다. ICPIS에서 중심적 역할을 나타내는 것은 KP(Knowledge Piece)로 불리고, 이는 기술정보의 추출법과 구조화법을 일체화한 Domain지식의 패키지이다. ICPIS는 KP별로 기술된 Keyword에서 자연언어처리에 해당되는 기술정보를 논문 중에서 추출하여 KP에서 규정된 요약구조로 생성한다.

  • PDF

한국어 발화음성에서 중점단어 탐색을 위한 기본주파수에 대한 연구 (A Study of Fundamental Frequency for Focused Word Spotting in Spoken Korean)

  • 권순일;박지형;박능수
    • 정보처리학회논문지B
    • /
    • 제15B권6호
    • /
    • pp.595-602
    • /
    • 2008
  • 각 문장 별 중점단어는 발화음성을 인식하고 그 의미를 이해하는데 도움을 준다. 발화된 음성신호로부터 중점단어를 탐색할 수 있는 방법을 찾기 위한 노력의 일환으로 실험을 통하여 문장 내에서 중점단어와 그 외의 단어들의 기본주파수의 평균과 분산, 그리고 평균 에너지를 분석해 보았다. 한국어로 된 100개의 발화문장의 음성데이터를 가지고 실험을 한 결과 중점단어는 그 외의 단어들에 비해 대부분 상대적으로 높은 기본주파수의 평균값을 나타내거나 상대적으로 높은 기본주파수의 분산 값을 나타냈다. 이 연구 결과를 이용하면 한국어의 구어문장에서 운율적 특성을 알 수 있을 뿐만 아니라, 자연어 처리를 이용한 핵심어를 추출하는 데에도 도움이 될 것이다.

아시아전자문화지도의 첫걸음, 조선족문화지도 (Chinese-Korean Cultural Map, the First Step to Asian Electronic Cultural Map)

  • 김동훈;문현주
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.377-381
    • /
    • 2008
  • 조선족문화지도는 아시아전자문화지도 구현을 위한 첫 단계로 기획된 프로토타입 전자문화지도이다. 조선족은 조선어와 한어를 함께 사용하며 한민족 고유의 유 무형 전통문화와 중국의 문화를 융합된 형태로 지닌 소수민족 특유의 문화특징을 보여주며, 이러한 소수민족적 특징은 다민족적이고 다문화적인 아시아 문화를 이해하고 표현하는데 있어 중요한 요소중 하나이다. 본 논문에서는 조선족 문화지도 설계를 위해 관련 자료의 수집 분류, 키워드추출, 유사항목 분류, 문화지도요소 추출, 전자문화지도 기술요소 추출 및 프로토타입 설계, 전자문화지도의 구현 등 아시아전자문화지도 전체에 적용될 설계방법론을 제시하고 있다.

  • PDF