• 제목/요약/키워드: 포괄적 문서요약

검색결과 5건 처리시간 0.156초

문장군집의 응집도와 의미특징을 이용한 포괄적 문서요약 (Generic Document Summarization using Coherence of Sentence Cluster and Semantic Feature)

  • 박선;이연우;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2607-2613
    • /
    • 2012
  • 지식 기반의 포괄적 문서요약은 문장집합의 구성이 요약 결과에 영향을 받는다. 이러한 문제를 해결하기 위해서 본 논문은 의미특징에 의한 군집과 문장군집의 응집도를 이용하여 포괄적 문서요약을 하는 새로운 방법을 제안한다. 제안 방법은 비음수행렬분해에서 유도되는 의미특징을 이용하여 문장을 군집하고, 문서의 내부구조를 잘 표현하는 문장군집들로 문서의 주제 그룹을 분류할 수 있다. 또한 문장군집의 응집도와 재군집에 의한 군집의 정재를 이용하여 중요한 문장을 추출함으로써 요약의 질을 향상시킬 수 있다. 실험결과 제안방법은 다른 포괄적 문서요약 방법에 비하여 좋은 성능을 보인다.

비음수 의미 가변 행렬을 기반으로 한 자동 포괄적 문서 요약 (Automatic Generic Summarization Based on Non-negative Semantic Variable Matrix)

  • 박선;이주홍;안찬민;박태수;김덕환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.391-393
    • /
    • 2006
  • 인터넷의 급속한 확산과 대량 정보의 이동은 문서의 요약을 더욱 필요로 하고 있다. 본 논문은 비음수 행렬 인수분해로(NMF, non-negative matrix factorization) 얻어진 비음수 의미 가변 행렬(NSVM, non-negative semantic variable matrix)을 이용하여 자동으로 포괄적 문서요약 하는 새로운 방범을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 잠재의미색인에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 또한, 비지도 학습에 의한 문서요약으로 사전 전문가에 의한 학습문장이 필요 없으며, 적은 계산비용을 통하여 쉽게 문장을 추출할 수 있는 장점을 갖는다.

  • PDF

의미특징의 포괄적 중요도를 이용한 포괄적 문서 요약 (Generic Summarization Using Generic Important of Semantic Features)

  • 박선;이종훈
    • 한국항행학회논문지
    • /
    • 제12권5호
    • /
    • pp.502-508
    • /
    • 2008
  • 인터넷의 급속한 확산과 대량 정보의 이동은 문서요약을 더욱 필요 하고 있다. 본 논문은 비음수 행렬 인수분해로 얻어진 비음수 의미 가변 행렬과 의미특징의 포괄적 중요도를 이용하여 문장을 추출하여서 포괄적 문서요약을 하는 새로운 방법을 제안하였다. 제안된 방법은 인간의 인식 과정과 유사한 비음수 제약을 사용한다. 이 결과 주제의 군집방법이나 잠재의미분석을 사용한 비지도 학습방법에 비해 더욱 의미 있는 문장을 선택하여 문서를 요약할 수 있다. 실험결과 제안방법이 다른 방법들에 비하여 좋은 성능을 보인다.

  • PDF

신경망 GHSOM을 이용한 의료 문헌 정보의 군집화 (Medical Document Clustering using the Growing Hierarchical SOM)

  • 허진석;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.519-522
    • /
    • 2002
  • 일반적으로 PubMed와 같은 인터넷을 이용한 대규모 의료 문헌정보 검색시스템에서 포괄적인 주제어나 간결한 주제어를 이용한 검색을 시도할 경우, 종종 매우 다양한 세부주제의 문헌리스트들이 다량으로 검색된다. 이러한 경우 이용자는 실제로 본인이 원했던 세부주제에 부합되는 문헌들을 찾기 위해서는 검색결과로 주어진 긴 문헌리스트상의 문헌 하나하나에 대해 다시 문헌제목이나 혹은 요약 등의 내용을 직접 읽어보고 내용을 확인하여야 한다. 이러한 작업은 매우 번거럽고 시간과 노력을 많이 필요로 한다. 따라서 본 논문에서는 이러한 노력을 줄이기 위한 한 가지 방안으로, PubMed 시스템의 주제어 검색결과로 주어진 문헌들에 대해 내용의 유사성과 차별성에 따라 자동으로 몇 개의 그룹으로 나누어주는 군집화시스템 MedCluster의 설계와 구현에 대해 소개한다. MedCluster의 큰 특징은 기존의 문서 군집화 방법과는 다른 신경망 GHSOM을 이용한 군집화 방법을 사용하는 점이다. GHSOM은 미리 문서 그룹의 개수를 정해줄 필요가 없고 다양한 레벨의 문서 그룹들을 얻을 수 있는 계층적 군집화를 이루어낸다는 장점을 가지고 있다. 본 논문에서는 신경망 GHSOM의 구조와 특성에 대해 간략히 살펴보고, GHSOM을 채용한 의료문헌 군집화시스템 MedCluster의 설계와 구현에 대해 설명한다.

  • PDF

식중독 발생 위험요인 관리를 위한 외식업체 자가위생관리점검표 개발 및 현장모니터링 (Development of Self-Managed Food Sanitation Check-List and On-Site Monitoring of Food Sanitation Management Practices in Restaurants for Control of Foodborne Illness Risk Factors)

  • 정민재;최정화;류경;곽동경
    • 한국식품조리과학회지
    • /
    • 제26권5호
    • /
    • pp.603-616
    • /
    • 2010
  • 최근 외식업소에서 식중독 발생이 급증함에 따라 이에 대한 대책이 절실히 필요함이 제기되었으나, 생산과 소비가 동시에 일어나는 외식업체의 특성상 위생 감시만으로는 통제가 어려워 업소 내의 자주적인 위생관리 방안이 마련되어야 할 실정이다. 본 연구에서는 외식업체의 위생관리 수준의 향상을 목표로 외식업체의 자율적인 위생관리를 위한 식중독 발생 위험요인과 식품위생법 조항을 포괄하는 모니터링 도구를 개발하고, 이를 이용해 외식업소의 식중독 발생 위험요인과 법적기준의 준수율을 조사하였다. 본 연구의 조사 결과를 요약하면 다음과 같다. 첫째, 대상 외식업소의 전체 준수율의 평균은 68.6%였고, 영역별 준수율은 서류비치 영역이 75.6%로 가장 높았고, 시설 설비관리 영역이 74.5%, 생산단계별 위생관리 영역이 63.9%로 뒤를 이었으며 개인위생관리 영역이 63.0%로 가장 낮은 준수율을 보였다. 둘째, 운영 형태에 따라 다점포 체인업소는 85.5%, 단독 경영업소는 51.6%의 전체 준수율을 보여 p<0.001 범위의 매우 유의적인 결과를 보였다. 하지만 각각의 운영 형태내에서 업종(한식, 중식, 일식, 양식)간에 따른 차이는 전체 준수율과 영역 수준 모두에서 나타나지 않았다. 셋째, CDC에서 규명한 식중독 발생 주요 5대 요인에 기여할 수 있는 인자의 항목 25개 중 준수율이 50% 이하로 집중적인 주의와 관리가 필요한 식중독 발생 잠재 위험요인에는 시설?설비 영역에 '조리장, 창고, 냉장 냉동고의 문서화된 청소계획을 가지고 있는가?'(48.3%), '사용하기 편리한 곳에 전용 수세시설을 구비하고 있는가?'(35.0%)가 해당되었고, 개인위생 관리 영역에서는 '종업원 위생교육을 실시하고, 평가기록을 유지하는가?'(50.0%), '손 세척을 올바르게 실행하는가?'(42.3%)의 항목이 포함 되었다. 생산단계별 위생 관리 영역에서는 '검수 시 식품의 품질과 온도 및 포장상태를 확인하고 기록하는가?'(35.0%), '재가열 온도를 준수하는가?'(44.4%), '냉동식품을 올바르게 해동하고, 해동 후 즉시 사용하는가?'(32.8%), '열장 또는 냉장 보관하거나 조리완료 1시간 반 이내에제공하는가?'(50.0%), '적정 배식 도구를 사용하는가?'(44.8%)의 항목이 나타났다. 서류 비치 영역에서 50% 미만의 준수율을 보인 항목은 존재하지 않았다. 넷째, 국내 식품위생법에서 정하고 있는 기준을 나타낸항목은 시설 설비관리 영역에 11항목, 개인위생관리영역에 3항목, 생산단계별 위생관리 영역에 6항목, 문서 영역에 3항목이 포함되었고, 그 준수율은 35.0-100%로 다양하게 나타났다. 운영 형태에 따른 준수율 비교 결과, 다점포 체인업소와 단독 경영업소 간에 있어 모든 영역에서 매우 유의적인 차이를 나타내어 단독 경영업소의 위생관리 향상을 위한 노력이 많이 요구되었고, 모든 대상 업소에서 식중독 발생과 큰 연관성이 있다고 규명된 요인의 항목 중 개인위생관리와 생산단계별 위생관리 영역에서의 준수율이 많이 미흡하여 위생교육 및 훈련을 통해 손 씻기의 습관화와 검수, 해동, (재)가열, 조리 후 보관의 매 단계에서 시간과 온도관리가 보다 철저히 이루어져야 하겠다. 국내 식품위생법의 준수율의 범위가 다양하게 나타났는데, 그 중 식중독 발생과 관련성이 큰 항목이 낮은 준수율을 보여 이에 대한 법적 감시와 규제를 강화되어야 할 것으로 사료된다. 또한 무엇보다 다양한 교육매체를 개발, 제공하여 식품취급자들의 인식변화와 행동수정을 유도하는 것이 외식업소의 위생관리 수준을 한 단계 높이는 데 필수적이라 하겠다.