• 제목/요약/키워드: 핵심주제

검색결과 633건 처리시간 0.051초

TF-IDF를 활용한 k-means 기반의 효율적인 대용량 기사 처리 및 요약 알고리즘 (Article Analytic and Summarizing Algorithm by facilitating TF-IDF based on k-means)

  • 장민서;오수진;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.271-274
    • /
    • 2018
  • 본 논문에서는 뉴스기사 데이터를 활용하여 대규모 뉴스기사를 소주제로 분류하는 군집 분석 방법을 제안한다. 또한, 분류된 뉴스기사를 사용자가 빠르게 이해하고 접할 수 있도록 핵심 문장을 추출하여 제공하는 방법을 제안한다. 분석 데이터는 포털 사이트 점유율 1위인 네이버의 경제 분야 뉴스기사를 크롤링하여 수집한다. 뉴스기사의 분석을 위해 전 처리를 통해 특수문자, 조사, 어미, 구두점 등의 불 용어 처리를 수행한다. 또한, k-means 알고리즘을 이용하여 대용량의 뉴스기사를 주제 별로 분류하는 것을 진행하며 그것을 토대로 핵심 문장을 추출한다. 추출된 핵심 문장은 분류된 뉴스기사의 주제를 나타내며 사용자에게 빠르게 정보를 전달하기 위해 활용한다. 본 논문의 연구 내용이 여러 언론사 사이트에 반영되면 사이트 품질과 사용자 만족도 향상에 기여할 수 있을 것으로 보인다.

T.D.Wilson의 연구주제 네트워크 분석 (Network analysis for research subject of T.D.Wilson)

  • 정선영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.51-54
    • /
    • 2013
  • 본 연구는 정보학 분야의 저명한 연구자 T.D.Wilson의 연구주제 분야를 네트워크 분석을 이용하여 해석해보고, 그의 연구는 물론 정보학 분야의 연구주제에 관한 이해를 도모하는 데 연구의 목적이 있다. 이를 위해 그의 저작을 대상으로 서지결합분석 방법을 이용한 군집 분석을 실시하여 연구주제를 나누어 보고 대표적인 연구주제와 논문, 그리고 인용빈도와의 관계를 규명하였다. 패스파인더 네트워크와 노드엑셀을 이용한 분석 결과, 대표적인 연구주제는 정보행위연구이고 논문으로는 "Human information behavior(2000)"로 나타났다. 더불어 '정보요구'라는 핵심 연구주제 아래 정보탐색, 정보관리, 정보이용, 웹정보에 이르는 정보학 분야의 다양한 연구가 이루어졌음을 알 수 있다.

  • PDF

문헌정보학분야 해외 연구 동향 및 유망 주제 분석 연구 (Research on Overseas Trends and Emerging Topics in Field of Library and Information Science)

  • 구본진;장덕현
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.71-96
    • /
    • 2023
  • 이 연구는 문헌정보학 분야의 연구 동향 분석을 통해 문헌정보학의 핵심 연구 영역을 파악하고 향후 유망 연구 주제로 부상할 가능성이 있는 주제를 식별하고자 하였다. 이를 위해 문헌정보학 분야의 국외 학술지 5종을 대상으로 지난 30년간 (1993~2022)의 학술논문 11,252건에서 40,897개의 저자 키워드를 수집하였으며, 저자 키워드를 활용한 키워드 분석을 통해 문헌정보학 분야의 핵심 연구 영역을 파악하였다. 이어서 논문수, 저자수, 공저논문 비율, 피인용 수를 활용하여 주성분분석과 상관관계분석을 통해 문헌정보학 분야의 미래 유망 연구 주제를 도출하였다. 분석 결과, 향후 문헌정보학 분야의 유망 연구 주제는 '머신러닝/알고리즘'과 '연구 영향력'이었으며, 이외에도 소셜미디어와 빅데이터분석, 자연어 처리, 연구 트렌드 분석, 연구성과 평가 등이 향후 주요한 연구주제로 성장할 가능성이 있는 것으로 나타났다.

신문만화 색인에 관한 연구 (A Study on the Indexing Editorial Cartoons)

  • 이지영;이나니
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.215-218
    • /
    • 1998
  • 신문만화는 신문에 실린 기사중 가장 핵심적인 내용을 간략한 그림으로 함축하여 정보를 전달한다. 그러나 만화의 함축성과 비유, 짤막한 텍스트 때문에 객관적인 색인어의 추출이 어려운 것이 사실이다. 본 연구에서는 신문만화에서 키워드를 추출하기 위하여 만화의 내용과 관련이 있는 신문기사에서 색인어를 추출하는 방안에 대해 논하였다. 연구에서는 조선일보에 게재된 한컷만화과 네컷만화를 각 1점씩 예로 들어 비주제색인어와 주제색인어를 부여하였다. 특히 주제색인어는 내용상의 연관성이 있는 신문기사를 선정하여 추출하였다.

  • PDF

자아 중심 인용 분석을 응용한 폭소노미 연구 문헌 분석 (Analyzing folksonomy research documents with ego centered citation analysis)

  • 이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2012년도 제19회 학술대회 논문집
    • /
    • pp.153-156
    • /
    • 2012
  • White가 제안한 자아 중심 인용 분석은 연구자를 대상으로 다면적인 분석을 가능하게 하는 방법이다. 이 연구에서는 자아 중심 인용 분석을 연구자 단위가 아닌 연구 주제에 대한 분석으로 응용하는 자아 중심 주제 인용 분석 기법을 제안하고, 시험적으로 폭소노미 주제의 연구문헌 집단에 응용하여 관련 연구의 핵심 문헌들과 주요 적용 이론을 반영하는 인용 정체성과 인용 이미지를 파악해보았다.

  • PDF

콘텐츠라인- 데이터 모델링 및 DB설계 핵심 기법 30題세미나

  • 김혜정
    • 디지털콘텐츠
    • /
    • 4호통권143호
    • /
    • pp.101-101
    • /
    • 2005
  • 한국데이터베이스진흥센터는 제니시스 기술과 공동 주관, 한국CA 후원으로 3월 17일 한국과학기술단체총연합회 대강당에서 ‘데이터 모델링 및 DB설계 핵심 기법 30題세미나’를 개최했다. 데이터 모델링 및 DB설계를 주제로 한 이 세미나에서는 EA도구의 이해 및 전략적 적용, 데이터 모델링 도구를 통한 활용사례 등 다양한 DB 실무 기법을 다뤘다.

  • PDF

UR에 대비한 정보산업 분야의 대응방안

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 1호통권20호
    • /
    • pp.82-98
    • /
    • 1995
  • 지난 '94.12.8일 한국종합전시장(KOEX)에서 제12회 정보산업리뷰 심포지움 'UR에 대비한 정보산업 분야의 대응방안(초고속정보통신망과 MULTIMEDIA를 중심으로)'이란 주제로 심포지움이 열렸다. 이번호에서는 MULTIMEDIA의 세계화 전략을 위한 핵심과제(하드웨어, 소프트웨어, 응용서비스의 핵심과제)를 일부 발췌하여 실었다.

  • PDF

이종관 지음 "소피아를 사랑한 스파이"

  • 조형준
    • 출판저널
    • /
    • 통권171호
    • /
    • pp.14-14
    • /
    • 1995
  • 이종관 교수의 철학소설 "소피아를 사랑한 스파이"는 가볍고 경쾌한 문체를 통해 본격적으로 현대철학의 핵심주제에 대한 비판과 통찰을 듣고 싶은 유혹을 느끼게 한다. 스파이가 된 철학자의 포스트모던한 모험을 통해 서구 철학사의 비밀과 속내를 재미있게 정탐해놓은 보고서를 읽으면서 철학적 사색의 기쁨을 맛본다.

  • PDF

말콤볼드리지 모델을 이용한 경영품질 핵심요인에 관한 연구

  • 나승균;신완선;유진성
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 춘계학술대회
    • /
    • pp.177-181
    • /
    • 2006
  • 본 연구의 주제는 경영품질 수준을 쉽게 진단하고 적용할 수 있도록 MB경영품질 진단체계를 간소화하는 것이다. MB의 전체 진단항목을 25개의 핵심진단항목으로 압축하고, 이들 진단항목의 유효성을 검증한다.

  • PDF

주제어 문장거리를 이용한 뉴스 편향성 분석 그래프 학습 (Graph Learning System for Analyzing Bias among News Using Keyword Distance Model)

  • 조찬우;조찬형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.533-538
    • /
    • 2023
  • 문서에서 저자의 의도와 주제, 그 안에 포함된 감성을 분석하는 것은 자연어 연구의 핵심적인 주제이다. 이와 유사하게 특정 글에 포함된 정치적 문화적 편향을 분석하는 것 역시 매우 의미 있는 연구주제이다. 우리는 최근 발생한 한 사건에 대하여 여러 신문사와 해당 신문사에서 생산한 기사를 중심으로 해당 글의 정치적 편향을 정량화 하는 방법을 제시한다. 그 방법은 선택된 주제어들의 문장 공간에서의 거리를 중심으로 그래프를 생성하고, 생성된 그래프의 기계학습을 통하여 편향과 특징을 분석하였다. 그리고 그 그래프들의 시간적 변화를 추적하여 특정 신문사에서 특정 사건에 대한 입장이 시간적으로 어떻게 변화하였는지를 동적으로 보여주는 그래프 애니메이션 시스템을 개발하였다. 실험을 위하여 최근 이슈에 대하여 12개의 신문사에서 약 2000여 개의 기사를 수집하였다. 그 결과, 약 82%의 정확도로 일반적으로 알려진 정치적 편향을 예측할 수 있었다. 또한, 학습 데이터에 쓰이지 않은 신문기사를 활용하여도 같은 정도의 정확도를 보임을 알 수 있었다. 우리는 이를 통하여 신문기사에서의 정치적 편향은 작성자나 신문사의 특성이 아니라 주제어들의 문장 공간에서의 거리 관계로 특성화할 수 있음을 보였다. 할 수 있다.

  • PDF