• 제목/요약/키워드: 주제어

검색결과 635건 처리시간 0.022초

주제어구 추출과 질의어 기반 요약을 이용한 문서 요약 (Document Summarization using Topic Phrase Extraction and Query-based Summarization)

  • 한광록;오삼권;임기욱
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.488-497
    • /
    • 2004
  • 본 논문에서는 추출 요약 방식과 질의어 기반의 요약 방식을 혼합한 문서 요약 방법에 관해서 기술한다. 학습문서를 이용해 주제어구 추출을 위한 학습 모델을 만든다. 학습 알고리즘은 Naive Bayesian, 결정트리, Supported Vector Machine을 이용한다. 구축된 모델을 이용하여 입력 문서로부터 주제어구 리스트를 자동으로 추출한다. 추출된 주제어구들을 질의어로 하여 이들의 국부적 유사도에 의한 기여도를 계산함으로써 요약문을 추출한다. 본 논문에서는 주제어구가 원문 요약에 미치는 영향과, 몇 개의 주제어구 추출이 문서 요약에 적당한지를 실험하였다. 추출된 요약문과 수동으로 추출한 요약문을 비교하여 결과를 평가하였으며, 객관적인 성능 평가를 위하여 MS-Word에 포함된 문서 요약 기능과 실험 결과를 비교하였다.

한국 고기능 자폐 아동의 자연발화에 나타난 주제 지속성 (Topic Continuity in Naturalistic Speech Data by Korean High-Functioning Autistic Children)

  • 지민정;홍은미;송영완;박선언;조숙환
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.261-266
    • /
    • 2005
  • 본 논문은 고기능 자폐 아동들이 담화 주제어 연속성(topic continuity)을 어떻게 습득하는지에 대해 검토하였다. 연구의 목적을 위하여 세 고기능 자폐 아동(9;11-12:2)의 자연 발화를 관찰 분석하였다. 사전 연구에 의하면, 자폐아동들은 의사소통의 기본적인 규칙을 잘 이해하지 못할 뿐만 아니라 타인의 사고와 기대 등에 민감하지 못하여 담화 주제를 적절히 유지하거나 전환하는(topic shift) 일에 많은 어려움을 겪는다. 본 연구는 한국 자폐아동들이 주제어의 유지와 전환 등, 담화 화용적(discourse-pragmatic) 기능의 발달 양상을 규명하는 것을 주요 목표로 한다. 본 연구의 자료는 세 자폐 아동의 자연 발화 내용으로서 1주-2주에 한번씩 매번 방문 시 120분 동안 녹음하였다. 분석 결과 다음의 몇 가지 습득 양상을 발견하였다. 첫째, 세 자폐 아동들에게서 발견된 주제 유지 빈도는 정상 아동들에 비해 낮았다. 한편. 이 아이들은 가끔 화제를 자신의 담화 주제로 돌려 자신의 주제 중심으로 대화를 지속했다. 이 아동들은 대화 상대자의 주제에 대해서는 민감하지 않지만 자신의 주제를 유지하려는 경향을 보이기도 한다. 둘째, 개별 아동을 검토한 결과, 담화 주제의 지속성이 높은 발화를 하는 아동은 현재 담화 주제에 더 민감하고 반향어를 산출할 때에도 자기 자신의 말 반복과 담화 상대자의 말을 반복하는 빈도가 별로 차이가 나지 않았다. 반면, 담화 주제의 지속성이 낮은 발화를 하는 아동은 이전 담화 주제에 더 민감하고, 반향어는 담화 상대자의 말 보다는 자기 자신의 말을 반복하는 비율이 더 높았다. 본 연구의 결과는 자폐 아동들이 담화 주제를 지속하는 능력이 많이 부족하지만, 담화 주제의 연속성은 다른 발화 유형과 상호 작용을 하면서 발달될 수 있다는 가능성을 보여 주었다. 따라서 본 연구 결과는 앞으로 자폐 아동의 연구가 집단 간의 연구뿐만 아니라 개별 아동의 발화에 쓰인 유형 간의 상호 관계를 주목함으로써 자폐 아동의 개별적 언어 치료에 새로운 시각을 심어 줄 가능성을 시사한다.

  • PDF

뉴노멀(New Normal) 시대 언어네트워크 분석에 의한 예술정책 방향 연구 (A Study on the Direction of Art Policy through Semantic Network Analysis in New Normal Era)

  • 김미연;권병웅
    • 예술경영연구
    • /
    • 제58호
    • /
    • pp.153-177
    • /
    • 2021
  • 본 연구는 코로나19로 촉발된 뉴노멀 시대의 예술정책에 관한 이론과 국내외 정책 동향을 바탕으로 언어네트워크 분석을 시도하였다. 이를 위해 2020년 3월부터 9월까지의 '코로나'와 '예술'의 키워드가 들어간 자료를 구글(Google)뉴스와 웹(web)문서에서 수집하여 227개의 정제된 주제어를 추출하였고, 추출된 주제어를 넷마이너 프로그램을 통해 주제어 빈도분석과 중심성을 지표로 분석하였다. 또한 각 주제어 간의 관계 분석을 위해 언어네트워크의 시각화 분석을 시도하였다. 분석결과 가장 많은 빈도수를 드러낸 주제어는 '코로나'였고, '문화예술', '예술', '공연', '온라인', '지원'이 최다 빈도수를 기록한 그룹에 포함되었다. 중심성 분석에서는 '코로나'가 가장 빈도가 높았고, '시대', '이후', '포스트', '예술', '문화예술' 순으로 나타나 빈도수가 높은 '코로나'와 '예술', '문화예술'은 대부분의 중심성에서도 우위를 차지했다. 특히, 주제어 빈도수와 중심성 분석에서 공통으로 상위를 차지하는 주제어는 '온라인'과 '지원' '정책'이다. 이는 코로나19로 인해 사회적 거리두기의 일상화에 따라 비대면·온라인콘텐츠의 급부상과 예술계에 대한 지원정책이 필요함을 나타내고 있다고 볼 수 있다.

주제어에 따른 시왕의 디지털 콘텐츠 구현 (Implementation of Digital Contents of the Ten Kings of Hell according to Keyword)

  • 김경덕;김영덕
    • 한국콘텐츠학회논문지
    • /
    • 제20권4호
    • /
    • pp.530-539
    • /
    • 2020
  • 본 논문에서는 불교 신화에 등장하는 10명의 지옥 왕을 주제어에 따라 시각화하는 디지털 콘텐츠를 구현한다. 10명의 지옥 왕은 시왕으로 불리며, 탱화와 같은 유형문화재로서 일반 사찰에서 찾아볼 수 있다. 시왕은 저승 세계를 관장하는 대왕으로 무속 및 불교문화 속에서 다양한 모습으로 전래되고 있다. 본 논문에서는 고문헌에 등장하는 시왕을 지옥별로 그 특징을 분석하여 주제어를 선별하고, 일반인이 특정 주제어를 선택하면 그에 따른 지옥과 왕을 시각적으로 나타내는 디지털 콘텐츠를 구현한다. 응용 분야로는 게임 및 문화 캐릭터의 개발, 전통문화를 활용한 디지털 스토리텔링, 불교문화와 교리 교육, 게임 등에 그 활용을 기대할 수 있다.

국내 뉴스 보도 연구 동향에 관한 주제어 연결망 분석 (Examining News Report Research Trends Using Keyword Network Analyses)

  • 조이영;안도현
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.278-291
    • /
    • 2016
  • 이 연구는 2006년부터 2015년까지 최근 10년간 뉴스 보도를 다룬 국내 학술 논문의 주제어에 대한 연결망을 통해 연구의 흐름과 경향을 살펴보았다. 총 1,108편의 논문에 제시된 4,410건의 주제어 연결망 분석을 실시한 결과, 국내 언론 보도를 다룬 연구에서 프레임, 의제설정, 제삼자효과, 선택적노출, 이용과충족 등이 주요 이론으로 다뤄진 것으로 나타났다. 이중 프레임에 대한 연구가 압도적으로 많았다. 연구영역으로는 정치, 경제, 과학보도, 국제뉴스 및 관광 등을 다루었으나, 문화, 스포츠 및 생활뉴스 등의 분야에 대한 연구는 나타나지 않았다. 매체별로는 전통매체와 새로운 매체에 대한 연구가 모두 활발하게 이뤄졌다. 특히 방송뉴스와 온라인뉴스 및 소셜미디어에 대한 연구가 빈번하게 나타났다.

2-포아송 모형을 이용한 한글 주제어 선정에 관한 연구 (A Study on the Applicability of 2-Poisson Model for Selecting Korean Subject Words)

  • 정영미;최대식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.129-148
    • /
    • 2000
  • 최근 구축된 한글 실험문헌 집단을 대상으로 2-포아송 모형의 Z값의 주제어 식별력을 측정하였으며, 역문헌빈도와 2 포아송 모형간의 상관관계를 분석하였다. 이를 위해 Z와 수정 $\beta$값 및 IDF와 수정 TF.IDF 가중치를 하위 실험집단별로 각기 산출, 비교하였다. 실험 결과 Z값의 주제어 선정능력은 3개의 하위 실험집단 가운데 과학기술분야에서만 확인되었다. 2-포아송 모형의 Z값과 역문헌빈도 가중치간의 상관관계 분석에서는 전문(full text)인 여성학분야 실험집단에 비해 초록 및 신문기사와 같이 단문(short text)으로 구성된 과학기술분야 및 일반사회 분야 실험집단에서 상관관계가 더 크게 나타 났다.

  • PDF

주성분 분석과 비정칙치 분해를 이용한 문서 요약 (Text Summarization using PCA and SVD)

  • 이창범;김민수;백장선;박혁로
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.725-734
    • /
    • 2003
  • 본 논문에서는 통계적 분석 기법인 주성분 분석과 비정칙치 분해를 이용한 문서 방법을 제안한다. 제안한 방법은 문서내의 주제어를 추출한 후, 추출된 주제어와 문장간의 거리가 가장 짧은 문장들을 중요 문장으로 추출하여 요약으로 제시한다. 주제어를 추출하기 위해서는 주성분 분석을 이용하였으며, 이는 문서 자체내의 빈도 정보와 단어간의 연관 정보를 이용한 것이다. 그리고, 중요 문장을 추출하기 위해 비정칙치 분해를 시행하여 문장 벡터와 주제어 벡터론 획득한 후, 두 벡터간의 유클리디언 거리를 계산하였다. 신문 기사를 대상으로 실험한 결과, 제안한 방법이 출현 빈도만을 이용한 방법과 주성분 분석만을 이용한 방법보다 성능이 우수함을 알 수 있었다.

주성분 분석을 이용한 문서 주제어 추출 (Document Thematic words Extraction using Principal Component Analysis)

  • 이창범;김민수;이기호;이귀상;박혁로
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권10호
    • /
    • pp.747-754
    • /
    • 2002
  • 본 논문에서는 문서의 내용을 대표할 수 있는 주제어를 추출하는데 있어 다변량 통계 분석 기법 중의 하나인 주성분 분석을 이용하는 모델을 제안한다. 제안한 모델은 고유값과 고유벡터를 이용하여 문서 자체내의 단어의 흐름을 파악한 후 주제어를 추출하는 방법이다. 제안한 모델을 문서 요약에 적용하여 그 성능을 평가하였다. 신문기사를 대상으로 실험한 결과 제안한 모델이 단어의 출현 빈도를 고려하는 방법, 시소러스를 이용하는 방법 모두에 비해 더 좋은 성능을 보였다. 제안한 모델은 정보검색, 정보추출, 문서요약 등에 이용될 수 있으리라 기대된다.

플랩제어시스템 주제어밸브의 모델기반 설계 및 성능해석 (Model-based Design and Performance Analysis of Main Control Valve of Flap Control System)

  • 조현준;안만진;주춘식
    • 항공우주시스템공학회지
    • /
    • 제13권4호
    • /
    • pp.50-59
    • /
    • 2019
  • 플랩제어시스템의 주요 구성품인 주제어밸브의 설계는 실제 제작 경험을 바탕으로 반복-오차 방법에 의존하여 수행하였다. 본 논문에서는 모델 기반의 부품 설계 방법을 제안하였다. 플랩제어시스템은 주제어 밸브, 고장-안전 밸브, 솔레노이드 밸브, LVDT, 구동 모터 등으로 구성된다. 주제어밸브는 주로 스풀과 슬롯으로 구성된다. 주제어밸브의 중요한 설계변수는 슬롯의 폭 (Slot Width), 오버 랩(Overlap) 및 간극(Clearance)이다. AMESim을 활용하여 주 제어 밸브의 유로를 모델링하고 해석하였다. 제안된 설계절차를 적용한 결과 허용된 가공오차 범위 내에서 요구 성능을 충족함을 확인하였다.

텍스트 네트워크분석을 활용한 국방분야 연구논문 지식구조 분석 (Knowledge Structure Analysis on Defense Research Using Text Network Analysis)

  • 이용규;윤성웅;이상훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.526-529
    • /
    • 2018
  • 본 연구에서는 텍스트 네트워크분석을 활용하여 국방분야 연구의 핵심 주제어와 연구주제를 분석하고 이를 통해 전체 지식구조를 파악하고자 하였다. 이를 위해 2010년부터 2017년까지의 국방대학교 학위과정 논문을 대상으로 국방분야 연구현황을 진단하고 지식구조를 구성하였다. 8년간 누적된 논문 710건의 초록을 분석하여 총 6,883개의 단어를 추출한 후, 단어의 논문 등장 빈도수와 단어간 링크수를 파레토 법칙에 따라 상위 20%의 기준으로 총 270개의 단어로 추출하였고, 컴포넌트 분석을 통해 최종 170개의 핵심 주제어를 도출하였다. 이 핵심 주제어를 통해 중심성 분석과 응집구조를 분석하여, 국방분야에 대한 총 6개의 지식구조 그룹을 도출하였다.

  • PDF