• 제목/요약/키워드: 단락검색

검색결과 47건 처리시간 0.026초

가중치가 부여된 연관 규칙을 이용한 문서 분류 (Document Classification using Weighted Associative Classifier)

  • 김흥남;이기성;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.154-156
    • /
    • 2003
  • 인터넷의 급속한 성장과 더불어 많은 정보와 데이터들을 인터넷을 통하여 얻을 수 있게 되었으며 많은 단체들이 문서들을 웹을 통하여 이용 가능하게 만들고 있다. 이에 따라 다양한 정보와 데이터를 효과적으로 분류하고 검색하는 문서 분류 (Document Classification)에 대한 알고리즘이 다양한 분야에서 널리 연구되어 왔으며 본 논문에서 초점을 두고 있는 전자 도서관 (Digital Library) 분야에서도 활발히 연구되어지고 있다. 하지만 기존의 전자 도서관의 문서 분류 알고리즘들은 문서들의 각 단락의 비중을 고려하지 않은 채 단어들의 발생 빈도에 초점을 두어 많은 잡음 단어 (Noise Term)를 포함하고 그로 인하여 분류 성능이 떨어졌다. 본 논문에서는 문서 단락의 중요도에 따라 다른 .가중치를 부여하여 단어 지지도 (Term Support)가 높은 단어들을 추출하고 그 단어들로 연관 규칙 (Association Rules)을 이용하여 분류 규칙을 생성하는 방법을 제안한다. 제안된 방법의 성능평가를 위해 문서 분류에 널리 쓰이는 나이브 베이지안 분류자 (Na$\square$ve Bayesian Classifier) 및 기존의 단순 연관 규칙 분류자 (Associative Classifier)와 비교 평가하였다. 그 결과, 각 가중치가 부여된 연관 규칙 분류 방법이 나이브 베이지안 분류 방법과 단순 연관 규칙 분류 방법보다 높은 성능을 보였다.

  • PDF

검색과 분류가 동시에 가능한 JULSE 시스템의 설계 및 구현 (Design and Implementation of Field Classification and Information Retrieval Engine;JULSE)

  • 장정효;손주성;김도연;이상곤;이원휘;안동언
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.673-676
    • /
    • 2005
  • 기존의 정보검색 엔진은 문서의 분야에 상관없이 본문 전체의 내용을 보여주므로 사용자가 적합한 내용인지를 파악하기 위해서는 본문 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 본 논문에서 제안하는 방법은 질의어가 지시하는 분야를 분야연상어를 이용하여 자동으로 파악하고, 사용자가 원하는 분야에서의 검색이 이루어지도록 하는 검색과 분류가 동시에 가능한 엔진을 설계하여 검색결과의 성능을 향상하고자 한다. 이와 함께 적당한 분야연상어가 다수 출현한 단락을 사용자에게 제공하여 본문 전체를 보지 않아도 질의어에 적당한 문서인지를 빠르게 파악하도록 설계하여 구현하였다.

  • PDF

비접지 방식의 특징과 지락보호 협조 II

  • 이성우
    • 전기기술인
    • /
    • 통권279호
    • /
    • pp.30-35
    • /
    • 2005
  • 전력계통 사고는 3상 단락에 비해 1선 지락사고가 대부분을 차지하고 있으며 적절한 접지를 통해 대지전압의 이상상승을 억제하고 보호 계전기에 의한 지락고장 검출 고장구간을 자동선택 차단하여 전력기기의 손상과 사고파급을 방지하여야 한다. 그러나 플랜트의 경우, 계통접지방식과 지락보호 시스템에 대한 이해부족으로 상기의 목적을 제대로 만족하지 못하는 사례와 정전으로 인한 2차적인 생산피해도 많이 발생하고 있다. 따라서 본론에서는 계통접지 방식 중에서 비접지 방식의 전반적인 이해를 돕고자 하며, 이를 토대로 비접지 계통의 지락보호 협조에 대하여 학습하고자 한다. 본 내용은 파워세븐엔지니어링을 검색하면 자료를 다운받을 수 있음.

  • PDF

웹에서 효율적인 텍스트 문서 브라우징 (The Efficient Text Documents Browsing on World Wide Web)

  • 김원중;조이기;손철수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.457-459
    • /
    • 2001
  • 웹의 등장으로 우리는 현재 멀티미디어 정복까지도 쉽게 이용할 수 있게 되었지만, 웹에서의 텍스트 문서정보의 브라우징(Browsing)은 많은 마우스 클릭과 스크롤링을 필요로 하고 있다. 또한 현재의 웹 텍스트 문서의 브라우징은 문서의 내용이 클 경우 검색자가 현재 브라우징하고 있는 문서가 본인이 필요로 하는 것인지, 아닌지를 판단하는데 많은 시간과 노력을 요구한다. 본 논문에서는 문서의 제목 부분과 내용 단락의 전체가 아닌 1-2줄만으로도 문서의 전체 윤곽을 쉽게 파악할 수 있다는데 착안하여 웹에서의 효율적인 텍스트 문서 브라우징 시스템을 개발하였다.

  • PDF

문서기술언어 SGML에 의한 전문 데이터베이스의 구축 (Construction of Full-text Database by SGML)

  • 김창봉
    • 정보관리연구
    • /
    • 제27권4호
    • /
    • pp.35-56
    • /
    • 1996
  • 문서기술언어 SGML(Standard Generalized Markup Language, 표준 범용 마크업 언어)과 그 전문 데이터베이스(도표나 화상 포함)에의 적용에 대하여 해설하였다. SGML을 적용한 전문데이터베이스의 구조는 SGML로 작성한 DTD (document type definition)로 표현하고 텍스트자체는 DTD에 따른 범용 마크업을 사용하여 기술한다. 본고에서는 장, 절, 단락 등의 계층구조와 각주, 도표, 화살 등의 비계층 구조로 되어 있는 문서 구조를 어떻게 표현하는가에 대하여 예를 들어 해설하였다. 그러고 SGML의 효과, 전자 출판, 검색 시스템, 하이퍼텍스트, SGML 관련 도구 등에 대해서도 해설하였다.

  • PDF

초전도체 화이버를 이용한 전류 제한 장치 (Current limit equipment for superconductor filber)

  • 황종선;김종만;김용균;장미혜;박성진
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 1995년도 추계학술대회발표논문집; 서울대학교, 서울; 30 Sep. 1995
    • /
    • pp.137-143
    • /
    • 1995
  • 현 전력 시스템 및 전기 전자 시스템의 대용량 단락 설비의 대형화에 따른 부수적인 시스템 구성을 초전도체 화이버를 이용하여 전력 손실과 빠른 차 단 시간을 가지는 차단기가 절대적으로 요구되고 있으며, 본 연구는 초전도 선재가 시스템에 코일로 구성하였을 때 자체에서 흐를수 있는 전류의 양을 검출하여 수치화하여 일반적인 전류계로써의 특징과 오실로스코프의 나타난 파형으로 시스템 자체에서 발생하는 이상 현상을 검색하여 시스템의 여러가 지 현상을 파악하고 또한 폐회로를 구성하여 계기의 부하로 인한 사고를 방 지하기 위하여 내부에 환 코일을 장착하여 단선되는 것을 방지하고 일정 전 류 이상이 되면 초전도체 화이버 자체가 trigger코일로 작동하여 전체 시스 템을 보호하고 전류제한장치의 개발 초기에 적용 가능한 평가 모델을 설계 구현하였다.

  • PDF

XML 태그 분류에 따른 가중치 결정 (The eight decision which it follows in XML tag classification)

  • 정혜진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.703-706
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

관계성 확률을 이용한 XML 태그의 가중치 결정 (Weight decision of the XML Tag using Relationship Probability)

  • 정혜진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.699-702
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하거나 HTML 문서 태그의 중요도 결정에 관한 연구들이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그의 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 인용된 문서간의 관계를 알아보고 서로 연관이 있을 확률을 계산하여 그 기대치만큼 색인어에 대한 가중치에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

사용자 질의를 이용한 XML 태그의 가중치 결정 (Weighting of XML Tag using User's Query)

  • 우선미;유춘식;김용성
    • 정보처리학회논문지D
    • /
    • 제12D권3호
    • /
    • pp.439-446
    • /
    • 2005
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐만 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있다. 이러한 연구들 대부분이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하거나 HTML 문서 태그의 중요도를 결정하는 연구들이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그의 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자의 질의에 바탕을 둔 사용자의 검색 행위를 반영한다. 그리고 기존 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

GNSS 반송파 위상을 이용한 정밀 측위에서 미지정수 전파기법 (Integer ambiguity propagation method for a precise positioning using GNSS carrier phase measurements)

  • 한덕희;윤희학;박찬식
    • 한국항공우주학회지
    • /
    • 제37권7호
    • /
    • pp.678-684
    • /
    • 2009
  • GNSS 반송파 위상 측정치를 사용하는 정밀 측위 혹은 자세결정에서 미지정수의 결정이 반드시 필요하며 많은 연구가 진행되었다. 그러나 한번 구해진 미지정수는 위성 추적상태가 변화하지 않으면 상수로 계속 사용할 수 있으므로 미지정수 검색과정을 통하지 않고 이미 구해진 미지정수를 사용할 수 있다. 본 논문에서는 ARCE를 변형하여 한번 구해진 미지정수와 새로운 측정치를 이용하여 환경 변화에서도 미지정수를 재구성할 수 있는 미지정수 전파기법을 제안하였다. 초기 미지정수는 LAMBDA로 구하며 신뢰도 향상을 위하여 여러 epoch 동안 연속해서 비율검사를 통과한 미지정수를 사용한다. 한번 구해진 미지정수는 위성의 배치, 위성 신호의 단락 등의 변화에도 미지정수 검색기법을 통하지 않고 제안한 기법을 사용하여 계속 유지될 수 있다. 이로 인하여 미지정수 결정의 성공률이 향상되며 계산량이 감소되는 효과를 얻을 수 있다. 실제 측정치를 이용한 실험으로 제안한 방법은 효과적인 방법임을 확인하였다.