• 제목/요약/키워드: 주제어

검색결과 635건 처리시간 0.025초

문서 요약 및 비교분석을 위한 주제어 네트워크 가시화 (Keyword Network Visualization for Text Summarization and Comparative Analysis)

  • 김경림;이다영;조환규
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.139-147
    • /
    • 2017
  • 문자 정보는 인터넷 공간에 통용되는 정보의 대다수를 차지하고 있다. 따라서 대용량의 문서의 의미를 빠르게 특히 자동적으로 파악하는 일은 빅 데이터 시대의 중요한 연구 주제중 하나이다. 이 분야의 대표적인 연구 중 하나는 문서의 의미를 요약해주는 주요 주제어의 자동 추출 및 분석이다. 그러나 단순히 추출된 개별 주제어들의 집합만으로 문서의 의미구조를 나타내기에는 부족함이 있다. 본 논문에서는 추출된 주제어들의 연관관계를 그래프로 표현하여 대상 문서의 의미구조를 보다 다양하게 표시하고 추상화할 수 있는 주제어 가시화 방법을 개발하였다. 먼저 각 주제어들 간의 연관관계를 추출하기 위해 주제어별 지배구간 모델과 단어거리 모델을 제안하였다. 이렇게 추출한 주제어 연결성과 그를 형상화한 그래프는 문서의 의미구조를 보다 함축적으로 담고 있으므로 문서의 빠른 내용파악과 요약이 가능하며 이 가시화 그래프를 비교함으로서 문서의 의미적 유사도 비교도 가능하다. 실험을 통하여 문서의 의미파악과 비교에 본 주제어 가시화 그래프는 일반적인 요약문이나 단순 주제어 리스트보다 더 유용함을 보였다.

국내 학술지 논문의 주제어를 통한 학술연구분야 관계분석 (Relation Analysis Among Academic Research Areas Using Subject Terms of Domestic Journal Papers)

  • 이혜영;곽승진
    • 한국비블리아학회지
    • /
    • 제22권3호
    • /
    • pp.353-371
    • /
    • 2011
  • 본 연구의 목적은 국내 연구자들의 연구 성과물인 학술지 논문에 나타난 학문분야의 상호관계성과 연관성에 대한 연구로 연구동향에 대한 시사점을 제시하는 것이다. 학술논문을 이용한 계량적 연구는 주로 논문의 초록, 자동추출 키워드, 논문의 풀텍스트를 활용하는 것이 일반적이나 본 연구는 실험대상 학술논문의 저자가 제시한 주제어에 초점을 두었다. 실험대상 자료는 2009년도 한국연구재단 등재학술지 80종으로 학술논문 7,616건, 주제어 58,143건이다. 자료 분석결과 공학, 농수해양, 복합학, 사회, 예술체육, 의약학, 인문, 자연과학 등의 8개 각 연구분야는 주제어 사용에서 차이점을 보였다. 특히 공학분야의 주제어가 다른 연구 분야에서도 주제어로 많이 사용되고 있었다. 또한 주제어 네트워크를 통해 연구분야를 클러스터링 한 결과, 3개 클러스터를 얻을 수 있었다. 클러스터A는 '공학', '자연과학', '사회', '복합학', '인문', 클러스터B는 '의약학', '예술체육', 클러스터C는 '농수해양'이었다.

실시간 검색어를 이용한 주제어 기반의 질의응답시스템 (Topic based Question-Answering System using Real-Time Search Terms)

  • 송일현;강상우;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-37
    • /
    • 2011
  • 본 논문에서는 실시간 검색어를 이용한 주제어 기반의 질의응답 시스템을 제안한다. 제안 시스템은 주제어로 사용자의 질의 범위를 제한함으로써 질의과정에서 발생할 수 있는 오류의 감소를 기대할 수 있다. 제안 시스템은 주제어 기반의 질의응답을 수행하기 위해 검색대상문서 색인, 질의유형결정, 검색결과의 순위화 과정을 거친다. 제안한 방법으로 기준시스템에 비해 P@5에서 질의유형별 평균 69%의 성능향상을 얻었다.

  • PDF

국제결혼 이주여성 건강관련 선행연구 분석 (An Analysis of Articles for International Marriage Immigrant Women Related to Health)

  • 안옥희;전미순;황윤영;김경애;윤미선
    • 농촌의학ㆍ지역보건
    • /
    • 제35권2호
    • /
    • pp.134-150
    • /
    • 2010
  • 본 연구는 국제결혼이주여성을 대상으로 다양한 학문분야에서 발표된 건강관련 선행연구 분석을 통하여 현재까지 진행된 연구들의 경향을 파악하고자 시도하였다. 국제결혼 이주여성을 대상으로 2004년 6월부터 2009년 6월까지 최근 6년간 발표된 국내 학회지 논문 및 학위논문 60편을 연구대상으로 선정하여 연구대상 논문의 일반적 특성, 저자의 전공분야, 건강영역별 주제어와 변수 및 주요변수의 측정도구를 분석하였으며 그 결과는 다음과 같다. 국제결혼이주여성 대상 논문 중 51편(84.9%)이 2007년 이후 발표되었으며, 발표형태는 석사논문 43편(71.7%)이 가장 높게 나타났다. 연구대상 논문 중 학회지 발표는 13편으로 한국가족복지학(3편, 23.1%)에 가장 많은 논문이 게재되었고, 석사학위논문은 사회복지학전공자가 25편(53.2%)으로 가장 많았다. 건강영역별로는 건강영역 2편(3.3%), 사회적 건강영역 18편(30.0%), 정신적 건강영역 36편(60.0%), 신체적 건강영역 4편(6.7%)이었다. 건강영역별 주제어는 사회적 건강영역에서의 주제어는 '적응'과 '의사소통' 2개이며, 정신적 건강영역의 주제어는 '결혼만족', '생활만족', '사회적지지', '스트레스', '우울', '부부갈등', '갈등' 등 7개였으며, 신체적 건강영역의 주제어는 '의료서비스기관 이용'과 '건강증진행위'로 나타났다. 연구대상 논문의 건강영역별 주제어에 따른 변수를 살펴보면, 건강영역 주제어의 변수는 삶의 질 2개, 사회적 건강영역의 주제어에 따른 변수는 적응 16개, 의사소통 5개이며, 정신적 건강영역 주제어 중 결혼만족 25개, 생활만족 11개, 사회적지지 3개, 스트레스 9개, 우울 25개, 부부갈등 25개였으며, 신체적 건강영역의 주제어에 따른 변수는 의료서비스기관 이용 6개, 건강증진행위 5개로 나타났다. 가장 많은 변수가 사용된 주제어는 변수가 25개인 결혼만족, 우울, 부부갈등으로 나타났다. 연구대상 논문의 건강영역별 주제어에 따른 주요변수의 측정도구 중 2회 이상 사용된 측정도구만을 제시한 결과, 건강 영역에서 주제어 '삶의 질'의 측정도구는 Campbell(1976)과 보건복지부(2005), 사회적 건강영역에서는 주제어 '적응'의 변수 중 문화적응의 측정도구 Sandhu & Asrabadi (1994), 정신적 건강영역에서는 주제어 '우울'의 변수 중 문화적응스트레스 측정도구 Sandhu와 Asrabadi(1994)가 가장 많이 사용되었다. 결론적으로 국제결혼 이주여성을 대상으로 한 논문은 최근 다양한 학문분야에서 다양한 주제들로 연구되고 있으나 대부분이 한국 내 정착과 관련된 근본적인 문제만을 다루고 있다. 그러나 국제결혼 이주여성에게 쉽게 적응하기 어려운 타문화권의 생활은 신체적, 정신적, 사회적 불건강상태를 초래할 수 있다. 즉, 본 연구의 주제어에서 알 수 있듯이 국제결혼 이주여성과 가족들에게 잠재적인 건강문제가 발생할 수 있음을 예측할 수 있다. 따라서 국제결혼 이주여성들의 한국 내 적응과정을 돕고 2차적으로 발생할 수 있는 건강문제를 예방하기 위하여 건강과 관련된 다각적인 연구 및 건강관리 방향을 모색할 필요가 있다고 사료된다.

이용자 중심의 주제어 기반 분류를 위한 주제명 개발에 관한 연구: 지식조직체계 분석을 바탕으로 (A Study on Construction of Subject Headings for the Word Based Classification)

  • 백지원
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.171-193
    • /
    • 2011
  • 본 연구는 도서관 장서의 분류를 위하여 기존의 문헌 분류체계 대신 주제어 기반의 분류를 적용하고자 할 때 필수적인 주제명 개발의 필요성을 논하고, 개발 방법론의 하나로 기존의 다양한 지식조직체계의 주제어를 활용하는 방법의 가능성을 모색하는데 목적이 있다. 이를 위하여 분석 대상 저작을 선정하고 이에 대하여 부여된 문헌분류, 주제명표목, 국내외 대형 서점의 분류, 서가명 및 주제어, 이용자 태그 등 다양한 지식조직체계의 주제어를 수집하여 그 특성을 비교 분석하였다. 이러한 분석의 결과, 전통적인 도서관 중심의 지식조직체계와 상업성이 중심이 되는 지식조직체계의 성격과 범주화의 방식이 다름을 확인할 수 있었다. 한편, 이용자 태그는 최상위 빈도수의 태그인 경우 전통적인 지식조직체계 및 상업적 영역의 지식조직체계와 어휘의 측면에서 거의 차이가 없는 결과를 나타냈으나, 이용자 중심의 주제어로서 독특한 특성을 가지고 있음을 파악하였다. 이러한 분석을 바탕으로 분류를 대체하는 주제명 작성을 위해 기존의 지식조직체계를 활용할 때 고려해야 할 각각의 특성 및 상호 관계를 분석하였고, 국내에서의 적용을 위한 실질적인 고려사항을 제안하였다.

슬로건에 사용된 주제어의 유형과 사례 분석: 전문대학교를 중심으로 (Types and Cases Analysis of College Slogan Key-Word)

  • 최석현
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.411-412
    • /
    • 2012
  • 본 연구는 국내 전문대학교에서 대학의 특성과 가치를 간결하게 알릴기 위한 목적으로 개발하여 사용하고 있는 슬로건(slogan)에 사용된 주제어의 유형을 조사 분석하고 이를 2005년 슬로건과 비교하여 주제어의 변화 추이를 알아보고자 한다.

  • PDF

맞춤형 광고를 위한 내용기반 영화 추천 기법 (A content-based movie recommendation method for targeted advertising)

  • 봉성용;서인식;김문식;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.269-272
    • /
    • 2011
  • 추천은 다양한 컨텐츠 중에서 사용자가 원하는 것을 선택할 수 있도록 돕는 것이다. 이러한 추천은 광고주가 자신의 광고에 적절한 컨텐츠를 찾을 때에도 활용될 수 있다. 본 논문에서는 광고를 표현하는 태그와 영화를 나타내는 주제어들을 매칭하여 광고에 적합한 영화를 추천하는 문제를 다룬다. 이 문제의 경우, 광고를 표현하는 태그의 개수가 적고, 영화의 주제어와 성격이 다른 경우가 많아 단순 매칭을 활용한 추천 기법으로는 결과를 얻을 수 없는 경우도 존재한다. 우리는 이러한 문제를 완화하기 위해 키워드 확장을 통한 추천 기법을 제안한다. 구체적으로 각 영화 컨텐츠가 가진 주제어를 위키피디아를 통해 검색하고 이를 통해 주제어를 확장한다. 광고의 태그 또한 위키피디아 검색을 통해 확장한다. 이렇게 확장된 영화 주제어와 광고 태그를 연관성 규칙에 기반하여 매칭한다. 실험 결과 단순 매칭보다 제안한 확장을 통한 매칭이 37.5%의 성능 향상을 보였다.

문서 분류를 위한 문장 응집도와 주어 주도의 주제어 추출 (Sentence Cohesion & Subject driving Keywords Extraction for Document Classification)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.463-465
    • /
    • 2005
  • 문서분류 시 문서의 내용을 표현하기 위한 자질로서 사용되는 단어의 출현빈도정보는 해당 문서의 주제어를 표현하기에 취약한 점을 갖고 있다. 즉, 키워드가 문장에서 어떠한 목적(의미)으로 사용되었는지에 대한 정보를 표현할 수가 없고, 문장 간의 응집도가 강한 문장에서 추출되었는지 아닌지에 대한 정보를 표현할 수가 없다. 따라서, 이 정보로부터 문서분류를 하는 것은 그 정확도에 있어서 한계를 갖게 된다. 본 논문에서는 이러한 문서표현의 문제를 해결하기위해, 키워드를 선택할 때, 자질로서 문장의 역할(주어)정보를 추출하여 가중치 부여방식을 통하여 주어주도정보량을 추출하였다. 또한, 자질로서 문장 내 키워드들의 동시출현빈도 정보를 추출하여 문장 간 키워드들의 연관성정도를 시소러스에 담아내었다. 그리고, 이로부터 응집도 정보를 추출하였다. 이 두 정보의 통합으로부터 문서 주제어를 결정함으로서, 문서분류를 위한 주제어 추출 시 불필요한 키워드의 삽입을 줄이고, 동시 출현하는 키워드들에 대한 선택 기준을 제공하고자 하였다. 실험을 통해 한번 출현한 키워드라도, 문장을 주도하는 주어로서 사용될 경우와 응집도 가중치가 높을 경우에 주제어로서의 선택될 가능성이 향상되고, 문서분류를 위해 좀 더 세분화된 키워드 점수화가 가능함을 확인하였다. 따라서, 선택된 주제어가 문서분류의 정확도에 있어서 향상을 가져올 수 있을 것으로 기대한다.

  • PDF

자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선 (Improving the performance of natural language information retrieval system by using non-keyword search methods.)

  • 이승률;강현규;박세영;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.374-377
    • /
    • 1994
  • 본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

  • PDF

한국안광학회지 게재 논문의 주제어와 MeSH 용어의 비교·분석 (Comparison and Analysis of Keywords in the Korean Ophthalmic Optics Society Articles to MeSH Terms)

  • 김대윤;이민형;최문성
    • 한국안광학회지
    • /
    • 제21권2호
    • /
    • pp.83-90
    • /
    • 2016
  • 목적: 한국안광학회지에 게재된 논문을 대상으로 영문 주제어(key word)와 의학용어 주제어집(MeSH-Medical Subject Headings) 용어와의 일치도를 비교 분석하여 한국안광학회지에서의 MeSH 용어의 이해도와 활용도를 높이고자 하였다. 방법: 2004년 9권 1호부터 2016년에 21권 1호까지 최근 12년 간 총 409편의 영문 주제어 1952개를 대상으로 MeSH 용어와의 일치도를 완전일치, 부분일치, 불일치로 분석하였다. 결과: 분석 결과 완전일치를 보인 주제어 수는 439개로 전체의 22.4%이고, 부분 일치한 용어의 수는 815개이며 전체의 41.8%를 차지하였다. 완전불일치한 주제어는 총 693개가 나왔으며 이는 전체의 35.5%에 해당되었다. MeSH 용어 중 가장 높은 빈도수를 보인 주제어는 Myopia, Astigmatism과 visual acuity 순서였으며, MeSH 용어와 부분일치를 보인 논문 주제어 중 Refractive error, Soft contact lens, Phoria 순서로 높은 빈도수를 나타내었다. MeSH 용어와 비교 시 불일치되는 주제어 중에서 빈도가 상위인 것은 Accommodative lag와 Pseudomonas aeruginosa 였다. 결론: 한국안광학회지가 유명 MEDLINE에서 검색되는 논문 활용성을 제고하기 위하여 영문 주제어를 선택할 때 MeSH 용어로 선택 될 수 있도록 해야 한다.