• Title/Summary/Keyword: 문서

Search Result 7,090, Processing Time 0.033 seconds

효율적인 수출입문서 처리를 위한 온톨로지기반 문서변환시스템 개발

  • 임성신;이석용;박남규;서창갑
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2005.12a
    • /
    • pp.113-118
    • /
    • 2005
  • 수출입업무활동에서 업체와 공공기관별로 전달해야 하는 데이터가 날로 증가하고 있지만 전달되는 데이터를 보면 기관별 서식이 조금씩 다를 뿐 반복적인 직업의 연속이다. 그래서 이의 효율적인 처리를 위해 많은 기업은 문서변환 시스템을 개발하거나 도입하여 활용하고 있다. 하지만 기존의 문서변환 시스템은 XML 문서변환을 중심으로 개발되고 있으나, 실제 수출입 업무처리 에서는 XML 뿐만 아니라 EDL 나 자체적인 파일형식으로 문서를 교환해야 하는 경유도 많다. :XML 을 중심으로 한 기존연구에서는 수작업에 의한 XML 스키마 연결의 비효율성을 해결하기 위하여 온톨로지를 이용하고 있다. 하지만 문서변환시스템의 특성상 한번에 완벽하게 온톨로지를 구축할 수가 없다. 그래서 문서변환시스템을 사용하는 사용자에 의해 온톨로지를 추가 수정 및 삭제할 수 있는 기능이 보완되어야 한다. 이에 본 논문은 수출입 문서변환업무에 사용할 수 있도록 XML 형식뿐만 아니라, EDI 형식이나 자체파일형식으로도 변환할 수 있는 범용적인 온톨로지기반 문서변환시스템을 구현하였다. 특히 온톨로지의 효과적인 관리를 위하여 문서변환시스템에 온톨로지 저작도구를 연동하여 시스템을 구성하였다.

  • PDF

Document clustering based on summarized document using K-means algorithm (요약 문서 기반 문서 클러스터링)

  • Oh, Hyung-Jin;Ko, Ji-Hyun;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.589-592
    • /
    • 2002
  • 정보검색 시스템에서 문서 클러스터링 기법은 사용자 질의에 대하여 검색된 문서를 문서간의 관련도에 따라 클러스터로 구성하고 사용자에게 검색 결과로 보여주는 것이다. 본 논문에서는 사용자의 질의에 대하여 검색된 문서를 자동 문서 요약기를 통해 얻은 요약 문서와 문서 전문을 문서들간의 유사도를 기반으로 동적으로 클러스터링 한다. 구현한 시스템의 클러스터링 효과를 검증한 결과 검색된 문서 전문을 클러스터링 한 방식에 비해 요약 문서를 클러스터링 한 방식이 정확률 측면에서 더 나은 성능을 보였다.

  • PDF

SNS news Recommendation by Using Cosine Similarity (코사인 유사도 기법을 이용한 뉴스 추천 시스템)

  • Kim, Simon;Kim, Hyung-Jun;Han, In-Kyu
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.163-166
    • /
    • 2013
  • 사용자별로 SNS/RSS 구독 뉴스 분석을 통해 사용자가 관심이 있는 새로운 뉴스를 추천해 주는 시스템을 설계하고 구현한다. 뉴스 추천 시스템의 설계를 위해 전체 시스템에서 사용자와 서버에서의 작업을 명세하고, 이중에 주요 기능을 담당하는 부분을 구현한다. 구현된 주요 기능은 선호 문서가 들어왔을 때 특징을 추출하고 이를 저장하는 것과 새로운 문서가 들어왔을 때 선호 문서군과 얼마나 유사한지 판별하여 문서에 대한 추천 여부를 결정하는 것이다. 선호 문서의 특징 추출에 대해서는 형태소 분석을 통해 단어와 빈도를 추출하고 이를 누적하여 저장한다. 또한, 새로운 문서가 들어왔을 때 코사인 유사도를 계산하여 사용자가 선호하는 학습문서와의 유사도 비교를 통해 문서 추천 여부를 결정한다. 구현된 시스템에서 실제로 연관된 선호 문서군을 학습시키고, 연관된 새로운 문서 혹은 연관되지 않은 새로운 문서에 대한 추천 여부를 비교하는 것으로 시스템 정확도를 파악한다.

  • PDF

Document Version Management in CoDocs System (CoDocs 문서관리시스템의 버전관리)

  • 안건태;김진홍;한천용;정명희;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.290-292
    • /
    • 2000
  • 정보통신 분야에서의 최근의 기술적인 발전에 힙입어 인트라넷을 기반으로 한 조직내 업무를 자동화하고, 또한 정보 공유를 통해 생산성을 높이기 위하여 많은 정보시스템이 구축되고 있다. 이러한 정보시스템은 조직의 성격에 따라 유연성있게 변화하면서 기술문서 등 여러 가지 종류의 문서들을 효과적으로 관리할 수 있도록 지원하는 것이 바람직하다. CoDocs 시스템은 공동작업의 효과적인 지원을 위해 문서를 체계적으로 관리할 수 있는 웹 기반환경에서 구현된 문서관리 시스템이다. 본 논문에서는 CoDocs 시스템에서 구축된 문서정보조직을 기반으로 문서간의 연계성을 높이고 활용성을 증가시키기 위해 문서 버전관리기능을 설계 및 구현하였다. 버전관리는 각 문서의 버전을 저장하여 히스토리(history) 정보를 유지하고 관리하며, 문서간의 연관성을 부여하여 문서등록 및 검색 시 관련문서에 대한 참조기능을 제공한다.

  • PDF

Ontology-Based Document Classification (온톨로지 기반 웹 문서 분류)

  • 송무희;임수연;민도식;강동진;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.535-537
    • /
    • 2003
  • 본 논문에서는 웹 문서들이 가지는 용어 정보들과 어휘들의 의미구조를 계층적 형태로 표현한 온틀로지 기반 자동 문서분류 방법을 제안한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 점하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하며, 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

A Web Crawler using Hyperlink Structure and Hypertext Categorization Method (Hyperlink구조와 Hypertext 분류방법을 이용한 Web Crawler)

  • Lee, Dong-Won;Hyun, Soon-J.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1337-1340
    • /
    • 2002
  • 웹 정보검색에서 웹 문서를 수집하고, 색인을 구축하는 작업에서 Web Crawler 의 역할은 매우 중요하다. 그러나, 웹 문서의 급속한 증가로 인하여 Web Crawler 가 모든 웹 문서를 수집하는 것은 불가능하며, 웹 정보검색의 정확성을 증가시키기 위한 방법으로 특정한 영역의 문서를 수집하는 focused web crawler에 대한 연구가 활발히 진행되어 왔다. 이와 함께, 웹 문서의 link구조를 이용하여 문서의 집합에서 중요한 문서를 찾는 연구들이 많이 진행되었다. 그러나, 기존의 연구에서는 문서의 link 구조에만 초점이 맞추어져 있으며, hypertext 전체의 연결 구조를 알아야 한다는 문제점이 있다. 본 연구에서는 hyperlink의 구조와 hypertext 분류방법을 이용하여 문서에 연결된 다른 문서 중 중요한 문서를 결정하는 방법을 제시하고 이를 이용한 web crawler 를 통하여 특정영역에서 정확한 문서를 수집함을 보였다.

  • PDF

Design of a Knowledge Server for Distribution of Multimedia Contents (멀티미디어 컨텐츠 유통을 위한 지식서버 시스템의 설계)

  • 정창후;이용배;맹성현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.316-318
    • /
    • 2001
  • 인터넷의 급속한 발전으로 인해 다양한 멀티미디어 리소스를 쉽고 빠르게 활용할 수 있는 시대가 도래하였다. 그러나 이러한 멀티미디어 문서들을 새롭게 편집하고 저장하고 유통시킬 수 있는 기술적 인프라는 아직 부족하다고 보여진다. 멀티미디어 문서를 편집하는 작업에는 다양만 문서포맷을 지원하는 멀티미디어 저작 툴이 필요하며 편집된 문서를 저장할 시에는 대용량의 고속 저장강치가 필요하다. 더불어 이러한 멀티미디어 문서를 활발히 유통시키기 위해서는 디지털 문서의 지적 재산권을 보호해줄 수 있는 견고한 유통 시스템이 필수이다. 본 논문에서는 멀터미디어 컨텐츠의 유통에 기여할 수 있는 지식서버 시스템에 관하여 기술하고자 한다. 가상문서[1] 개념을 기반으로 설계된 지식서버 시스템은 기존의 멀티미디어 컨텐츠를 재구성하여 만든 가상문서를 유통시킬 수 있는 특징을 가지고 있다. 이러한 지식서버 시스템을 이용하면 대용량의 저장장치를 필요로 하지 않는 멀티미디어 문서를 저작 및 저장할 수 있고, 새롭게 저작된 멀티미디어 문서를 지식서버 시스템의 인증 서버를 통하여 쉽게 유통시킬 수 있다. 또한 유통된 가상문서가 실제 문서로 재현될 경우에 지식서버 내의 로그관리기에 의하여 로그정보가 기록되기 때문에 컨텐츠 유통 현황을 실시간으로 파악할 수 있다.

  • PDF

Design and implementation of a structure-and content-based document retrieval system for XML documents (XML 문서를 위한 구조 및 내용기반 문서검색 시스템 설계 및 구현)

  • 이정재;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.93-95
    • /
    • 1999
  • 최근 XML 문서에 대한 활용이 늘어나면서 이들 문서에 대한 저장 및 검색에 대한 요구가 증가하고 있다. XML문서는 SGML(Standard Generalized Markup Language) 문서가 가지고 있는 다양한 기능들과 구조적인 표현 능력, 그리고 사용의 용이성 등의 장점을 지닌 언어로 1996년 웹의 문서 표준으로 제안되었다. 따라서 XML 문서의 특성을 반영한 문서 검색시스템에 대한 요구가 시급한 상태이며, 기존의 시스템의 경우 구조 및 내용-기반 멀티미디어 문서검색을 효과적으로 지원하지 못하고 있다. 본 논문에서는 XML 문서의 구조정보 및 내용정보를 효과적으로 검색할 수 있는 XML 문서 저장 시스템을 설계 및 구현한다. 구현하는 시스템은 구조-기반 검색을 위해 o2store위에 역파일 인덱스를 구축하고 내용-기반 검색을 위해 X-tree를 사용한다. 또한 검색 인터페이스를 JAVA로 구현하여 효율적인 검색이 이루어지도록 한다.

  • PDF

Update conscious and depth insensitive inverted indexes for XML full-text queries (XML 문서의 변경을 고려한 XML 전문 검색 역인덱스)

  • Kwon, Guk-Bong;Hong, Dong-Kweon;Kim, Kweon-Yang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.81-84
    • /
    • 2004
  • XML 문서는 관계형 테이블과는 달리 문서의 구조가 매우 복잡하고 불규칙하여 부분적인 정보를 최대한 활용하는 전문 검색이 일반적인 구조적 검색보다 더 중요한 역할을 한다. XML 문서는 계층이 있으므로 계층을 사용하는 전문 검색 연산은 계층을 제공함으로써 검색 공간을 줄여서 검색의 정확성과 효율성을 훨씬 더 높일 수 있다. 전문 검색 연산을 효과적으로 지원하기 위한 방법으로는 역인덱스를 (inverted index) 사용하는 것이 가장 일반적인 방법이다. 지금까지의 전문 검색을 위한 XML 문서의 구조 정보를 표현, 저장하는 방법들은 문서의 내용이 변경되지 않는 정적 문서(static documents)만을 고려하여 왔다. 이 방법들은 문서가 동적으로 변화할 경우 저장된 문서의 구조 정보 중에서 많은 부분을 다시 표현해야 하는 비효율적인 면이 있다. 본 논문은 XML 문서의 동적인 변화를 지원하면서 동시에 복잡한 XML 전문 검색을 지원하기 위한 방법으로 경로 스트링을 사용하는 효율적인 역 인덱스 구축 기법을 제안하고 제안하는 방법이 복잡한 문서의 검색과 문서의 동적인 변화를 효율적으로 검색할 수 있음을 보인다.

  • PDF

인터넷 문서의 새로운 패러다임

  • Choe, Han-Seok
    • Digital Contents
    • /
    • no.9 s.76
    • /
    • pp.14-18
    • /
    • 1999
  • XML의 기본 철학은 문서의 내용(Contents), 구조(Structure), 프리젠테이션(Presentation)의 분리이다. 즉, 웹문서 및 일반적인 모든 문서는 문서구조, 내용, 출판 포맷으로 이루어 지는데, 문서 구조 및 내용을 텍스트로 처리하고 태그를 사용하여 구조와 내용을 구분한다. 이러한 문서구조는 W3C에서 제안한 XML규격 1.0 문법 형식을 따라야 한다.

  • PDF