• Title/Summary/Keyword: 문서과

Search Result 2,264, Processing Time 0.032 seconds

A Base System for Browing XML Documents (XML 문서를 브라우징하기 위한 기반 시스템)

  • 박준서;염세훈;안보희;유재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.443-445
    • /
    • 1998
  • Extensible Mark-up Language(XML) 문서의 활용범위가 넓어지고 수요가 크게 늘어날 것으로 예상됨에 따라서 XML 문서에 관련된 애플리케이션이 요구되는 현실에 입각해서, XML문서를 브라우징 할 수 있는 기반 시스템을 설계 및 구현하였다. 본 연구에서는 XML의 변형된 문서의 브라우저와 달리 순수한 XML 문서를 브라우징 하도록 함으로서 일반사용자에게 텍스트 형태의 문서를 시각화 해서 활용할 수 있도록 하였다. XML 문서의 브라우징을 위한 문서 처리, Stylesheet 처리 Layout 처리, User Interface 처리 등의 필수적인 부분들을 처리하도록 하였다. 결과로서 XSL 처리 기술과 XML 브라우저 제작에 관한 기반 기술을 확보할 수 있었다.

다중측면 모델을 이용한 문서화 지원 시스템

  • 이관호;김창화;백두권
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1991.10a
    • /
    • pp.476-486
    • /
    • 1991
  • 본 연구의 목적은 문서의 다중측면을 고려한 문서화 지원시스템을 구현하는 것이다. 기존의 소프트웨어 개발 문서를 지원하기 위한 시스템은 소프트웨어 개발단계 측면에서의 문서들을 작성하기 때문에 개발 완료후 소프트웨어 이용자를 위한 문서나 서비스 측면에서 필요한 문서들은 새로운 작업을 통해 작성되어야 한다. 따라서 중복되는 자료로 인한 저장 공간의 낭비와 개발비용의 상승을 가져온다. 본 연구에서는 다중 측면 모델을 이용하여 소프트웨어 문서를 정의하고 정형화된 표현으로 문서화과정을 정의했다. 또한 소프트웨어 개발 단계 측면에서 만들어지는 문서 뿐만 아니라 기능측면, 이용자측면에서의 문서를 제공함으로써 다양한 문서지원이 가능한 문서화 지원시스템을 설계한다.

  • PDF

A study on improvement of Hangul wordprocessor (한글 워드프로세서의 개선방안에 관한 연구)

  • 윤호상;백두권
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1990.04a
    • /
    • pp.32-41
    • /
    • 1990
  • 컴퓨터를 이용한 문서의 작성과 관리가 많아짐에 따라 한글 문서의 호환에 대한 문제가 심각하게 대두되었다. 한글 워드프로세서에서 사용하는 한글 코 드와 문서 형식의 차이로 인하여 타 워드프로세서의 문서는 사용하는데 많 은 어려움이 따른다. 본 논문에서는 이러한 한글 문서 호환의 문제점을 해결 하는 방안으로 한글 워드프로세서에 대해서 기능과 문서 형식에 대해서 조 사 분석하여 한글 문서화일을 관리하기 위해서 보유해야 하는 기능을 정의 하고 한글 문서화일의 문서 형식에 대해서도 연구하였다. 그리고 기존의 한 글 워드프로세서에서 코드 변환을 자동적으로 하고 문서 형식이 다른 문서 화일에 대해서도 사용할 수 있도록 하여 사용자에게 효과적인 한글 문서화 일 관리 환경을 제공하는 방안을 설계, 구현하였다.

  • PDF

Automatic Text Summarization Using Thesaurus (시소러스를 이용한 문서 자동 요약)

  • 이창범;박혁로
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.352-354
    • /
    • 2001
  • 문서 자동요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 의미기반 정보검색용 시소러스(thesaurus)를 이용한 문서 자동요약을 제안한다. 제안한 방법에서는 단어간의 연관 관계 즉, 동의어, 유의어, 상위어, 하위어 관계를 문서 요약에 이용한다. 크게 연관 사슬 형성 단계, 중심 문장 추출 단계, 요약 생성 단계의 새단계로 나누어 요약을 생성한다. 수동 요약된 신문기사를 대상으로 평가한 결과 평균 66%가 일치하였다.

  • PDF

Text Categorization Using Co-Trained Support Vector Machines (Co-Trained Support Vector Machines을 이용한 문서분류)

  • 박성배;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.259-261
    • /
    • 2002
  • 대부분의 자동문서분류 시스템은 문서에 사용된 단어의 분포만 고려하고, 또 하나의 중요한 정보인 통사 정보는 무시한다. 본 논문에서는 통사정보와 어휘정보를 모두 사용함으로써 대규모의 비구조 문서를 분류하는 방법을 제시한다. 이를 위해, 학습 데이터에 대해 독립된 두 개의 관점을 요구하는 일종의 부분 감독 학습 알고리즘인 co-training 알고리즘을 사용한다. 어휘정보와 통사정보가 각각 문서의 독립된 관점이 될 수 있으므로, 이 두 정보와 레이블이 없는 문서를 사용하여 문서 분류의 성능을 높일 수 있다. Reelers-21578 문서집합과 TREC-7 filtering 문서집합에 대한 실험 결과는 제시된 방법의 유효성을 보인다.

  • PDF

Hierarchical Overlapping Document Clustering for Efficient Categorization of Semantic Information (의미정보의 효율적인 분류를 위한 계층적 중복 문서 클러스터링)

  • 강동혁;주길홍;이원석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.175-177
    • /
    • 2001
  • 기존의 문서 클러스터링 알고리즘은 모든 문서가 각각 하나의 클러스터에만 할당되도록 설계되어 문서에 여러 개의 주제가 포함되어 있을지라도 문서는 유사도 비교에 의해 오직 하나의 플러스터에 포함된다는 단점이 있다. 본 연구에서는 이러한 문서 플러스터링 방법의 한계를 파악하기 위해 문서가 여러 개의 클러스터에 포함될 수 있는 계층적 중복 문서 클러스터링을 제안한다. 또한, 문서 클러스터링의 정확도를 높이기 위해서 불용어 제거 알고리즘을 이용해 불용어를 제거하여 클러스터링에 사용되는 키워드를 선별하고, 단어가중치 산출을 위한 TF*NHDF 공식을 제안한다.

  • PDF

Data Model for Document-Centric XML Document (문서중심 XML 문서를 위한 데이터 모델)

  • 김연희;김성완;신판섭;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.25-27
    • /
    • 2001
  • 웹 상의 데이터 표현 및 교환의 새로운 표준으로 인식되어 점차 그 교류의 앙이 중가하고 있는 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 데이터중심 문서의 특성이 두드러지는 XML 문서룬 대상으로 하는 것이 대두분이였다. 그러나 효과적인 XML 문서의 저장 및 검색을 위해서는 XML 문서의 실제 사용 목적이나 그 특성에 따라 XML 문서를 분류하여 각 특성에 맞는 저장, 접근 및 검색 기법을 개발하고 이를 통합한 XML 문서 저장 시스템의 개발이 요구된다. 따라서 본 논문에서는 통합 시스템 개발에서, 인간 이해 중심의 문서적 특성을 가지는 문서중심 문서를 위한 데이더 모델을 제안한다. 제안된 데이터 모델은 루트 노드가 존재하는 방향성과 순서가 있는 그래프 형태를 지원하며, XML 문서의 주요 구성 요소를 지원하는 여러 타입의 노드와 다양한 노드 사이의 관계를 표현하는 링크로 구성되어 XML 문서가 가지는 의미와 구조적 특징이 잗 표현되도록 하였다. 또한 모델링 후 손실되는 정보가 거의 없기 때문에, 다시 XML 문서로 변환하면 원래 XML 문서 그대로 복원되는 장점이 있어 문서중심 문서의 저장 및 검색을 위한 전용XML 저장 시스템에 적합한 데이터 모델이다.

  • PDF

Automatic Text Categorization Using Text Summarization Techniques (문서 요약 기법을 이용한 자동 문서 범주화)

  • Park, Jin-Woo;Ko, Young-Joong;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.138-145
    • /
    • 2001
  • 자동 문서 범주화란 문서의 내용에 기반하여 미리 정의되어 있는 범주에 문서를 자동으로 분류하는 작업이다. 문서 분류를 위해서는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고, 이러한 자질들을 통해 분류할 문서를 표현해야 한다. 기존의 연구들은 문장간의 구분 없이, 문서 전체에 나타난 각 자질의 빈도수를 이용하여 문서를 표현 한다. 그러나 하나의 문서 내에서도 중요한 문장과 그렇지 못한 문장의 구분이 있으며, 이러한 문장 중요도의 차이는 각각의 문장에 나타나는 자질의 중요도에도 영향을 미친다. 본 논문에서는 문서에서 사용되는 중요 문장 추출 기법을 문서 분류에 적용하여, 문서 내에 나타나는 각 문장들의 문장 중요도를 계산하고 문서의 내용을 잘 나타내는 문장들과 그렇지 못한 문장들을 구분하여 각 문장에서 출현하는 자질들의 가중치를 다르게 부여하여 문서를 표현한다. 이렇게 문장들의 중요도를 고려하여 문서를 표현한 기법의 성능을 평가하기 위해서 뉴스 그룹 데이터를 구축하고 실험하였으며 좋은 성능을 얻을 수 있었다.

  • PDF

A Design and Implementation for processing Query Links in Virtual Documents (가상문서에서 질의 링크 처리를 위한 설계 및 구현)

  • 강민구;김철수;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.169-171
    • /
    • 2001
  • XML을 기반으로 하는 가상문서는 인터넷 상의 정보 공유를 가능하게 하여 새로운 지식을 생성할 수 있도록 한다. 가상문서에서는 비정형(텍스트, 이미지, 멀티미디어 데이터)과 준정형(HTML, XML) 데이터를 링크로 연결하여 정보를 제공하고 있다. HTML과 같은 기존의 웹 문서에서는 스크립트나 CGI 같은 것을 통하여 정형 데이터(데이터베이스)의 정보를 제공하고 있으므로 가상문서에서도 자연스럽게 정형 데이터를 연결하여 사용이 가능하다. 본 논문에서는 디지털 도서관 시스템에서 정형 데이터를 지원하기 위해 질의 링크를 포함하는 가상문서를 효율적으로 처리할 수 있도록 데이터베이스를 설계 및 구현하며, 데이터베이스 스키마 정보를 관리하여 필요한 데이터베이스를 검색하여 질의 링크의 생성을 돕도록 하였다.

  • PDF

Converting HTML Documents to XML Documents through Interactions with Users (사용자와의 상호작용을 통한 HTML문서의 XML 문서로의 변환)

  • 김승원;민준기;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.103-105
    • /
    • 2002
  • 웹에 데이터를 나타내기 위해서 사용하는 HTML은 데이터를 표시(presentation)하기 위한 언어일 뿐 데이터의 의미를 나타내지는 못한다. 이러한 HTML의 단점을 극복하고 데이터의 표시(presentation)와 의미(semantic)를 나타낼 수 있도록 한 마크업 언어가 XML이다. HTML로 나타난 정보를 제대로 이용하기 위해서는 HTML 문서의 의미(semantic)정보를 알아내야만 한다. HTML 문서를 XML 문서로 변경할 수 있다면, 변경된 문서의 의미 정보를 이용할 수 있을 것이다. HTML 문서 포멧(format)을 XML 문서 포멧(format)으로 변경하기 위한 작업으로 [1]이 있다. [1]에서는 자동으로(automatic) 변환하는 방법을 사용했다. 이러한 방법은 프로그램이 HTML 문서의 의미를 파악하는데 한계가 있기 때문에 변환된 XML 문서에서 문서의 의미를 제대로 나타내기 어렵다는 단점을 안고 있다. 본 논문에서는 HTML 문서의 의미론 제대로 나타내는 XML 문서를 만들기 위해서 사용자가 어느 정도 개려하여 최종적인 XML 문서를 만드는 방법을 제안한다. 제안한 방법은 사용자의 약간의 개입으로 원래 HTML 문서의 의미를 보다 더 잘 나타내는 XML 문서를 만들어낸다.

  • PDF