• 제목/요약/키워드: Automated keyword extraction

검색결과 6건 처리시간 0.016초

자동차 멀티미디어 시스템에서의 사진과 음악을 이용한 음악스토리 비디오 자동생성 기술 (Automatic Music-Story Video Generation Using Music Files and Photos in Automobile Multimedia System)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제9권5호
    • /
    • pp.80-86
    • /
    • 2010
  • 본 논문에서는 차량 내의 멀티미디어 시스템에 장착되는 엔터테인먼트 기능 중의 하나인 음악스토리 자동생성 기술을 소개한다. 음악스토리 비디오 자동생성 기술은 개인이 소지하고 있는 휴대폰을 차량 내의 멀티미디어 시스템과 연결하여, 휴대폰 안에 저장된 음악과 사진의 결합을 통해 음악비디오를 자동으로 생성하는 멀티미디어 요소기술로서, 사용자에게 분위기에 맞게 음악을 들으면서 생성된 음악스토리 비디오를 즐기는 기능을 제공한다. 음악스토리 비디오 자동생성 기술에 대한 성능은 음악분류, 사진분류, 핵심단어 검출 등의 정확도와 생성된 음악스토리 비디오를 시청한 사용자의 MOS 결과를 통해 측정되었다.

TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법 (Keyword Extraction from News Corpus using Modified TF-IDF)

  • 이성직;김한준
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.59-73
    • /
    • 2009
  • 키워드 추출은 정보검색, 문서 분류, 요약, 주제탐지 등의 텍스트 마이닝 분야에서 기반이 되는 기술이다. 대용량 전자문서로부터 추출된 키워드들은 텍스트 마이닝을 위한 중요 속성으로 활용되어 문서 브라우징, 주제탐지, 자동분류, 정보검색 시스템 등의 성능을 높이는데 기여한다. 본 논문에서는 인터넷 포털 사이트에 게재되는 대용량 뉴스문서집합을 대상으로 키워드 추출을 수행하여 분야별 주제를 제시할 수 있는 키워드를 추출하는 새로운 기법을 제안한다. 기본적으로 키워드 추출을 위해 기존 TF-IDF 모델을 고찰, 이것의 6가지 변형식을고안하여 이를 기반으로 각 분야별 후보 키워드를 추출한다. 또한 분야별로 추출된 단어들의 분야간 교차비교분석을 통해 불용어 수준의 의미 없는 단어를 제거함으로써 그 성능을 높인다. 제안 기법의 효용성을 입증하기 위해 한글 뉴스 기사 문서에서 추출한 키워드의 질을 비교하였으며, 또한 주제 변화를 탐지하기 위해 시간에 따른 키워드 집합의 변화를 보인다.

  • PDF

문서 요약 및 비교분석을 위한 주제어 네트워크 가시화 (Keyword Network Visualization for Text Summarization and Comparative Analysis)

  • 김경림;이다영;조환규
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.139-147
    • /
    • 2017
  • 문자 정보는 인터넷 공간에 통용되는 정보의 대다수를 차지하고 있다. 따라서 대용량의 문서의 의미를 빠르게 특히 자동적으로 파악하는 일은 빅 데이터 시대의 중요한 연구 주제중 하나이다. 이 분야의 대표적인 연구 중 하나는 문서의 의미를 요약해주는 주요 주제어의 자동 추출 및 분석이다. 그러나 단순히 추출된 개별 주제어들의 집합만으로 문서의 의미구조를 나타내기에는 부족함이 있다. 본 논문에서는 추출된 주제어들의 연관관계를 그래프로 표현하여 대상 문서의 의미구조를 보다 다양하게 표시하고 추상화할 수 있는 주제어 가시화 방법을 개발하였다. 먼저 각 주제어들 간의 연관관계를 추출하기 위해 주제어별 지배구간 모델과 단어거리 모델을 제안하였다. 이렇게 추출한 주제어 연결성과 그를 형상화한 그래프는 문서의 의미구조를 보다 함축적으로 담고 있으므로 문서의 빠른 내용파악과 요약이 가능하며 이 가시화 그래프를 비교함으로서 문서의 의미적 유사도 비교도 가능하다. 실험을 통하여 문서의 의미파악과 비교에 본 주제어 가시화 그래프는 일반적인 요약문이나 단순 주제어 리스트보다 더 유용함을 보였다.

데이터의 카테고리 연관성을 이용한 색인어 자동 추출 (Automated Keyword Extraction using Category Correlation of Data)

  • 우영호;허태성;허웅;박영배;민홍기
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.242-245
    • /
    • 2005
  • 본 논문에서는 특정 영역에서 나타날 수 있는 데이터를 카테고리별로 저장한 시소러스를 이용하여 색인어 후보를 추출한다. 그리고 각 데이터의 카테고리 간의 상호 연관성을 고려하여 검출되는 색인어의 정확도를 향상시킬 수 있는 연관 중요도를 적용한 색인어 자동 추출 시스템을 제안하였다. 제안된 시스템은 출현빈도를 고려한 방법보다 47% 시소러스를 이용한 방법보다 18% 향상된 성능을 보였다.

  • PDF

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

국가이미지 분석을 위한 위키피디아 실시간 동적 온톨로지 구축 알고리즘 및 적용 (Dynamic ontology construction algorithm from Wikipedia and its application toward real-time nation image analysis)

  • 이영환
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.979-991
    • /
    • 2016
  • 이 연구에서는 국가이미지를 실시간 측정하기 위하여 위키피디아의 키워드를 추출하여 반자동 동적 온톨로지를 구축하는 알고리즘을 개발하였다. 이 DCDKC (double-crossing double keyword collection)라 명명된 알고리즘에 의해 추출된 국가이미지 온톨로지인 위키온토 (WikiOnto)는 동적으로 변화하는 국가이미지를 실시간으로 자동 측정하여 제공할 수 있도록 하였다. 따라서 국가이미지 관리에 효율성을 기하고 뜻밖에 있을 지도 모르는 국가이미지의 급박한 변화에 선제적으로 대응할 수 있는 도구를 개발하고자 하였다. DCDKC 알고리즘은 과거 오프라인 설문조사에 상당부분 의존하던 각종 국가브랜드지수 모델과는 달리 온라인 실시간 동적 국가이미지 모니터링 시스템에 잘 적용될 수 있음을 보여주었다. DCDKC 알고리즘을 적용한 시스템의 유용성을 검증하기 위하여 아시아의 3대 수출국인 한중일 삼국의 국가이미지를 측정하기 위한 동적 온톨로지 위키온토를 구축하고 국가 이미지의 동적 변화를 실시간으로 추적가능함을 확인하였다. 결론적으로 DCDKC를 이용한 위키온토의 구축을 통한 국가이미지 실시간 관리체계에 대한 가능성을 확인하였을 뿐더러 저렴하고 탁월한 솔류션이 될 수 있음을 증명하였다.