• 제목/요약/키워드: 도합유사도

검색결과 8건 처리시간 0.022초

2단계 문장 추출방법을 이용한 자동 문서 요약 (Automatic Text Summarization with Two Step Sentence Extraction)

  • 정운철;고영중;서정연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.910-912
    • /
    • 2004
  • 자동 문서 요약 시스템은 문서내에 담겨있는 정보를 최대한 표현하면서 문서의 크기를 줄이는 시스템이다. 본 논문에서는 문서 요약을 크게 2단계로 나누어서 수행한다. 문장내 요약본으로써의 불필요한 문장을 미리 제거하고 이에 더해 다양한 통계적 방법의 여러 장점들을 수용함으로써 보다 나은 성능 향상을 얻을 수 있었다. 비교시스템으로는 제목, 위치, 빈도, 도합유사도, 어휘 클러스터링을 이용한 시스템을 구축하여 사용하였으며 30%, 10% 문장요약에서 제안한 시스템은 모두 우수한 성능을 보였다.

  • PDF

도합유사도를 이용한 한국어 문서요약 시스템 (A Korean Text Summarization System Using Aggregate Similarity)

  • 김재훈;김준홍
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.35-42
    • /
    • 2001
  • 본 논문에서 문서는 문서관계도라고 하는 가중치 그래프로 표현된다. 노드는 문서의 구성요소인 문장을 명사벡터로 표현하고, 링크는 노드들 간의 의미적인 관계를 표현하며 의미적 유사도를 가중치로 가지고 있다. 한 노드의 인접한 노드를 사이의 유사도 합을 도합유사도라고 하며, 이를 문서에서 문장의 중요도로 간주한다. 본 논문에서는도합유사도를 이용한 한국어 문서요약 시스템을 기술한다. 실험에 사용된 평가용 요약문서는 정보처리관련 분야에서 수집된 논문 100편과 KORDIC에서 구축한 신문기사 105건을 이용하였다. 문서요약 시스템에 의해서 생상된 요약문서와 크기가 본문의 20%이고 평가용 요약문서가 논문(서론과 결론)일 경우, 재현율과 정확률은 각각 46.6%와 76.9%를 보였으며, 또한 평가용 요약문서가 신문기사일 경우, 재현율과 정확률은 각각 30.5%과 42.3%를 보였다.

  • PDF

도합유사도를 이용한 한국어 추출문서 요약 (Korean Indicative Summarization Using Aggregate Similarity)

  • 김재훈;김준홍
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.238-244
    • /
    • 2000
  • 본 논문에서 문서는 문서관계도라고 하는 그래프로 표현된다. 노드는 문서의 구성요소인 문장을 표현하고, 링크는 노드들 간의 의미적인 관계를 나타낸다. 의미적 관계는 유사도에 의해서 결정되며, 문장의 중요도는 도합유사도로 나타낸다. 도합유사도는 한 노드와 인접한 노드들 사이의 유사도 합을 말한다. 본 논문에서는 도합유사도를 이용한 한국어 문서요약 기법을 제안한다. 실험에 사용된 평가용 요약문서는 정보처리 관련 분야에서 수집된 논문 100편과 KORDIC 에서 구축한 신문기사 105 건을 이용하였다. 문서요약 시스템에 의해서 생성된 요약문서의 크기가 본문 20%이고, 본문이 논문(서론과 결론)일 경우, 재현율과 정확률은 각각 46.6%와 76.9%를 보였으며, 또한 본문이 신문기사일 경우, 재현율과 정확률은 각각 30.5%과 42.3%를 보였다. 또한 제안된 방법은 상용시스템보다 좋은 성능을 보였다.

  • PDF

도합유사도를 이용한 한국어 추출문서 요약 (Korean Indicative Summarization Using Aggregate Similarity)

  • 김재훈;김준홍
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-244
    • /
    • 2000
  • 본 논문에서 문서는 문서관계도라고 하는 그래프로 표현된다. 노드는 문서의 구성요소인 문장을 표현하고, 링크는 노드들 간의 의미적인 관계를 나타낸다 의미적 관계는 유사도에 의해서 결정되며, 문장의 중요도는 도합유사도로 나타낸다. 도합유사도는 한 노드와 인접한 노드들 사이의 유사도 합을 말한다. 본 논문에서는 도합유사도를 이용한 한국어 문서 기법을 제안한다. 실험에 사용된 평가용 요약문서는 정보처리 관련 분야에서 수집된 논문 100편과 KORDIC에서 구축한 신문기사 105건을 이용하였다. 문서 시스템에 의해서 생성된 문서의 크기가 본문의 20%이고, 본문이 논문(서론과 결론)일 경우, 재현율과 정확률은 각각 46.6%와 76.9%를 보였으며, 또한 본문이 신문기사일 경우, 재현율과 정확률은 각각 30.5%과 42.3%를 보였다. 또한 제안된 방법은 상용시스템보다 좋은 성능을 보였다.

  • PDF

문장 정보량 기반 문서 추출 요약의 효과성 제고 (Improving the effectiveness of document extraction summary based on the amount of sentence information)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제11권3호
    • /
    • pp.31-38
    • /
    • 2022
  • 문서 추출 요약 연구에서는 문장 간 관계를 기반으로 중요한 문장을 선택하는 다양한 방법들이 제안되었다. 문장의 도합유사도를 이용한 한국어 문서 요약에서는 문장의 도합유사도를 문장 정보량으로 보고, 이를 기준으로 중요한 문장을 선택하여 요약문을 추출하였다. 그러나 이는 각 문장이 전체 문서에 기여하는 다양한 중요도를 고려하지 못한다는 문제가 있다. 이에 본 연구에서는 문장의 정량적 정보량과 의미적 정보량을 기반으로 중요한 문장을 선택하여 요약문을 제공하는 문서 추출 요약 방법을 제안한다. 실험 결과, 추출 문장 일치도는 58.56%, ROUGE 점수가 34로 비교 연구보다 우수한 성능을 보였으며, 딥러닝 기반 방법과 비교해 추출 방법은 가볍지만 성능은 유사하였다. 이를 통해 문장 간 의미적 유사성을 기반으로 정보를 압축해 나가는 방식이 문서 추출 요약에서 중요한 접근 방법임을 확인하였다. 또한 빠르게 추출된 요약문을 기반으로 문서 생성요약단계를 효과적으로 수행할 수 있으리라 기대한다.

지능형 빔 재구성 시스템을 위한 3-D 빔 조향 안테나 (3-D Beam Steering Antenna for Intelligent Beam-reconfigurable System)

  • 이창용;김용진;정창원
    • 한국산학기술학회논문지
    • /
    • 제13권10호
    • /
    • pp.4773-4779
    • /
    • 2012
  • 본 논문은 지능형 또는 스마트 안테나 시스템에 사용 할 수 있는 두 종류의 3-D 빔 조향 재구성 안테나를 제안하였다. 제안된 두 안테나는 삼각형(구조1.) 및 원형(구조2.)의 루프 구조와 구부러진 다이폴 안테나의 결합형 구조를 갖는다. 제안된 안테나는 하나의 안테나 소자로 4개의 스위치 동작에 따라 xy-평면으로 3개의 빔 State (0, 1, 2) 뿐만 아니라 xz-평면으로 3개의 빔 State (3, 4, 5) 도합 6개의 방향으로 빔 조향이 가능하다. 안테나 구조1.은 급전부를 기준으로 대칭인 평형구조이며, 그라운드가 없기 때문에 다이폴 안테나와 유사한 이득을 가진다. 또한, 구조2.는 반원형태의 CPWG급전 그라운드(반사판)를 이용하여 지향성이 향상된 불 평형 구조를 갖는다. 동작 주파수는 2.5 GHz (구조1.), 2.55 GHz (구조2.)이며, 최대이득은 1.04 ~ 2,06 dBi (구조1.:전방향성 빔), 1.6 ~ 4 dBi (구조2.:지향성빔) 이다. 또한 xy-평면과 xz-평면 각각의 전체 반 전력빔폭(HPBW)은 구조1.에서 $160^{\circ}$ 이상 그리고 구조2.에서 $125^{\circ}$ 이상의 넓은 빔 폭을 갖는다.

쥐의 뇨질소함량(尿窒素含量)으로부터 뇨(尿) Energy 가(價)의 산출법(算出法) (Estimating urinary energy value of rat from the urinary nitrogen content)

  • 한인규
    • Applied Biological Chemistry
    • /
    • 제7권
    • /
    • pp.29-33
    • /
    • 1966
  • 이 시험(試驗)은 쥐오줌의 energy value와 nitrogen content와의 관계(關係)를 연구(硏究)하기 위하여 행(行)하여졌다. 이 시험(試驗)을 위하여 ad lib.구(區)에 13 마리, 2 meals구(區)에 16 마리, 도합(都合) 29 마리의 쥐가 쓰였다. 오줌의 채집(採集)은 22 일간(日間)의 본시험기간중(本試驗期間中) 8 일(日)동안 행(行)하였다. 1 일(日) 2회(回) 채식(採食)시킨 쥐들이 훨씬 많은 (p<0.05) nitrogen 을 배설(排泄)했고 아울러 더 많은 energy를 배설(排泄)하였다. 쥐오줌의 energy concentration과 nitrogen content 사이에는 직선관계(直線關係)가 있어서 nitrogen 함량(含量)이 증가(增加)하면 energy의 배설량(排泄量)이 증가(增加)된다는 사실(事實)이 밝혀 졌다. urinary nitrogen(X, gm/100 ml)으로 부터 energy value (Y, kcal/100 ml)를 산출(算出)할 수있는 공식(公式)을 유도(誘導)했는데 다음의 식(式)은 일반적(一般的)으로 이 목적(目的)을 위하여 쓰여질 수 있는 것으로 본다. Y=8.924X+0.182 (Y=urinary energy, X=urinary N) 이러한 산출(算出)에 수반(隨伴)도는 표준오차(標準誤差)는 0.788 kcal이다. nitrogen content로부터 energy concentration을 산출(算出)하는데 따르는 오차(誤差)가 이렇게 적기 때문에 또 urinary energy의 함량(含量)이 GE, DE, ME, 섭취량(攝取量)에 비(比)해 적기 때문에 유사(類似)한 Diet를 공급(供給)하는 경우(境遇) 이 식(式)은 쥐오줌의 energy value를 산출(算出)하는데 쓰일 수 있을 것이다. 따라서 오줌의 energy value의 직접측정(直接測定)에 소요(所要)되는 많은 시간(時間)과 노력(努力)이 절약(節約)되는 것이다. 쥐오줌의 energy: nitrogen의 비(比)는 9.4(ad lib.구(區)) 내지(乃至) 8.6(2 meals 구(區))으로서 채식회수(採食回數)는 이 비율(比率)에 하등(何等)의 영향(影響)이 없음이 밝혀졌다.

  • PDF

정원내 가시연꽃(Euryale ferox Salisbury) 도입을 위한 기초연구 - 식물상과 식생을 중심으로 - (A Basic Study on the Euryale ferox Salisbury for Introduction in Garden Pond - Focusing on the Flora and Vegetation -)

  • 이석우;노재현;오현경
    • 한국전통조경학회지
    • /
    • 제34권1호
    • /
    • pp.83-96
    • /
    • 2016
  • 본 연구는 가시연꽃(Euryale ferox Salisbury)을 구성종으로 하는 연못의 식재기반 조성을 위한 기초자료 획득을 목적으로, 전라북도 내의 가시연꽃 자생지 14곳에 대한 문헌 및 현장조사를 통해 자생지 식물상과 식생환경에 대한 조사분석을 통해 다음과 같은 결과를 얻었다. 1. 가시연꽃 생육지 14곳의 전체 식물상은 79과 211속 298종 2아종 30변종 6품종으로 총 336분류군이 확인되었으며, 정수성 수생식물은 17분류군, 부엽성은 가시연꽃을 포함하여 7분류군, 부유성은 5분류군 그리고 침수성 수생식물은 2분류군으로 분류되었다. 수생식물만을 대상으로 한 유사도분석 결과, 가장 유사도가 높은 정읍 한성지와 고창 석남저수지에서는 가시연꽃 이외에 부엽성식물로 연꽃과 마름이 동일하게 서식하고 있다. 따라서 가시연꽃을 주소재로 한 연못 조성시 연과 마름은 동반식물로서 생태적 지위를 보이는 것으로 파악된다. 2. 생육형별 수생식물의 출현빈도를 살펴보면, 가시연꽃 이외에 정수성식물인 뚜껑덩굴과 갈대가 각각 11회 출현하여 78.6%의 높은 빈도를 보였으며 부엽성 수생식물인 마름이 10회(71.4%), 줄이 8회(57.1%) 출현하였다. 이밖에 고마리, 겨풀, 마름, 개구리자리, 물피, 매자기, 연꽃, 어리연꽃의 순으로 출현율이 높았다. 3. IUCN 평가기준에 따른 조사대상 가시연꽃 생육지에서 발견된 희귀식물은 가시연꽃과 함께 취약종(VU)인 통발, 이외에 약관심종(LC)인 새박, 자라풀, 물질경이 등 3분류군으로 도합 5분류군이 확인되어 가시연꽃 활용 연못시 도입이 가능한 희귀식물로 분류되었다. 4. 가시연꽃 자생지의 군락유형은 대부분 가시연꽃군락이었으며 군산의 대위저수지는 마름+가시연꽃+어리연꽃군락으로 정의하였다. 자생지별 가시연꽃의 녹피율은 0.03에서 36.50으로 상당히 큰 편차를 보였으며 평균 녹피율은 9.8로 계상됨에 따라 연못 조성시 가시연꽃의 녹피율을 10% 이하의 수준으로 유지하는 것이 합리적으로 판단된다. 5. 조사대상지별 가시연꽃 자생지와 인접한 식생군락으로는 나도겨풀군락 3개소, 마름군락과 줄군락이 각각 2개소, 연꽃군락, 어리연꽃+부들군락, 마름+연꽃군락, 자라풀군락, 나도겨풀+털물참새피군락 1개소 그리고 가시연꽃+마름군락 1개소 등으로 각 저수지마다 입지조건 등에 따라 다소의 차이를 보였다. 따라서 이러한 결과는 가시연꽃을 주요 구성종으로 하는 연못의 식재설계시 동반 부엽식물의 선정 및 식피율 배분에 반영해야 할 지침으로 제안한다.