Search | Korea Science

사용자 의도 정보를 사용한 웹문서 분류

Jang, Yeong-Cheol
- Proceedings of the Korea Society for Industrial Systems Conference
- /
- 2008.10b
- /
- pp.292-297
- /
- 2008
복잡한 시맨틱을 포함한 웹 문서를 정확히 범주화하고 이 과정을 자동화하기 위해서는 인간의 지식체계를 수용할 수 있는 표준화, 지능화, 자동화된 문서표현 및 분류기술이 필요하다. 이를 위해 키워드 빈도수, 문서내 키워드들의 관련성, 시소러스의 활용, 확률기법 적용 등에 사용자의도(intention) 정보를 활용한 범주화와 조정 프로세스를 도입하였다. 웹 문서 분류과정에서 시소러스 등을 사용하는 지식베이스 문서분류와 비 감독 학습을 하는 사전 지식체계(a priori)가 없는 유사성 문서분류 방법에 의도정보를 사용할 수 있도록 기반체계를 설계하였고 다시 이 두 방법의 차이는 Hybrid조정프로세스에서 조정하였다. 본 연구에서 설계된 HDCI(Hybrid Document Classification with Intention) 모델은 위의 웹 문서 분류과정과 이를 제어 및 보조하는 사용자 의도 분석과정으로 구성되어 있다. 의도분석과정에 키워드와 함께 제공된 사용자 의도는 도메인 지식(domain Knowledge)을 이용하여 의도간 계층트리(intention hierarchy tree)를 구성하고 이는 문서 분류시 제약(constraint) 또는 가이드의 역할로 사용자 의도 프로파일(profile) 또는 문서 특성 대표 키워드를 추출하게 된다. HDCI는 문서간 유사성에 근거한 상향식(bottom-up)의 확률적인 접근에서 통제 및 안내의 역할을 수행하고 지식베이스(시소러스) 접근 방식에서 다양성에 한계가 있는 키워들 간 관계설정의 정확도를 높인다.
PDF

Design and Implementation of a Document-Oriented and Web-Based Nuclear Design Automation System (문서중심 및 웹기반 핵설계 자동화 시스템의 설계 및 구현)

Park, Yong-Soo;Kim, Jong-Kyung
- The KIPS Transactions:PartD
- /
- v.11D no.6
- /
- pp.1319-1326
- /
- 2004
To automate nuclear design works which are time-consuming and man-power intensive, Innovative Design Processor ($IDP^{TM}$) is being developed. Two basic principles of IDP are the document-oriented design and the web-based design. The document-oriented design is that, if the designer writes a design document called active document and feeds it to a special program which has a robust parser, the finai document with complete analysis, table and plots is made automatically. The active documents can be written with ordinary HTML/XML editors or created automatically on the web, which is another framework of IDP. Using the proper mix-up of server side and client side programming under the LAMP (Linux/Apache/MySQL/PHP) environment, the design process on the web is modeled as a design wizard style so that even a novice designer makes the design document easily.
https://doi.org/10.3745/KIPSTD.2004.11D.6.1319 인용 PDF KSCI

TENT PRISM / 어도비 PDF 솔루션 구축 사례

Sin, Jong-Hun
- Digital Contents
- /
- no.11 s.126
- /
- pp.54-57
- /
- 2003
정부의 정부문서관리법령 개정으로 최근 각 지방자치 단체와 정부 공공기관은 전자문서 시스템 도입 준비에 안창이다. 내년 1월 이후에는 그간 중앙행정기관에서 개발적으로 유통되던 전자문서를 정부전자문서유통센터를 통해 관리함으로써 정부문서처리 전 과정을 전산화, 자동화 하기로 했기 때문이다. 기존의 종이 문서를 전자문서로 변환해 관리하기 위한 노력은 그 동안 각 기업별 또는 기관별로 꾸준히 진행돼 왔다. 특히 인터넷을 통한 각종 정보 서비스의 제공을 위해서는 전자문서 구축은 필수다. 그렇다면 남은 문제는 얼마나 우수한 시스템을 얼마나 비용 효율적으로 구축하는 가의 문제이다. 어도비시스템즈의 PDF솔루션을 통해 전자문서 시스템을 구축하고, 이를 통해 비용절감과 함께 서비스 만족도 향상등 두 가지 토끼를 한번에 해결한 사례를 살펴봤다
PDF

A XML Based Conversion System for Secure Message Exchange (안전한 메시지교환을 위한 XML 기반의 변환시스템)

오대균;홍창범;송정길
- Journal of Internet Computing and Services
- /
- v.3 no.4
- /
- pp.1-9
- /
- 2002
As a XML Schema has been settled to W3C as standard at May. 2001 and technologies like as XML. Xpath and NameSpace related with XML has been developing. XML is becoming the standard of the new document exchanging. Due to the ability expressing various types of documentstructure through XML, ebXML, RosettaNet, and BizTalk are using XML as a core technology in the part of e-Business, To make the task automatically in the B2B EC now, a standard XML document is needed. Internal documents in each company should be transformed differently without any loss to work with other companies. In this paper, transforming XML document based on JAVA servlet is considered as realization of a XML system to exchange documents safely.
PDF

Feature / 데이터 캡쳐 비용 절감을 위한 테크닉

Korea Database Promotion Center
- Digital Contents
- /
- no.9 s.124
- /
- pp.158-164
- /
- 2003
기업들은 트랜잭션 정보와 메타데이터 확보하기 위해 해마다 수십억 달러를 지출하고 있다.전자상거래 물결은 각종 트랜잭션을 자동화된 전자 프로세스로 전환시켜 이러한 비용의 상당부분을 절감할 수 있도록 하고 있다. 하지만 대부분의 기업들은 여전히 종이로 문서들을 교환하고 있다. 결과적으로 이들은 데이터 입력, 분류보관, 문서검색, 복사, 팩스, 다른 형태로의 문서 재구성에 아직도 수십억 달러를 지출하고 있다는 것이다.
PDF

Text Extraction by Skew Normalization and Block Split & Merge (기울기 보정과 블록 분할 합병을 통한 문자 추출)

김도현;차의영;강민경
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10b
- /
- pp.424-426
- /
- 2001
신문, 잡지, 공문서, 영수증 등의 문서로부터 필요한 정보를 자동화하여 처리할 수 있는 문서영상 이해 시스템의 구현에 있어서 문서영상에 존재하는 문자를 추출하는 연구는 문자 인식의 전처리 단계로서 매우 중요한 의미를 지니고 있다. 하지만 현 시점에서 문서 자체가 가지는 다양한 형태 및 배경 등에 의하여 범용화되고 일반화된 방법을 찾기란 매우 어려운 실정이다. 본 논문에서는 특히 배경이 선이나 도표 등으로 이루어진 문서 영상에서 Hough Transform을 사용하여 기울어짐을 보정하고 문자들이 선에 겹친 부분을 효과적으로 보정하며 추출된 영역에 대한 분할 및 합병 과정을 거쳐 최종적으로 완전한 문자 영역을 추출하는 방법에 대하여 다룬다.
PDF

Design and Implementation of an Automated Privacy Protection System over TPM and File Virtualization (TPS: TPM 및 파일 가상화를 통한 개인정보보호 자동화 시스템 디자인 및 구현)

Jeong, Hye-Lim;Ahn, Sung-Kyu;Kim, Mun Sung;Park, Ki-Woong
- The Journal of Korean Institute of Next Generation Computing
- /
- v.13 no.2
- /
- pp.7-17
- /
- 2017
In this paper, we propose the TPS (TPM-enhanced Privacy Protection System) which is an automated privacy protection system enhanced with a TPM (Trusted Platform Module). The TPS detects documents including personal information by periodic scanning the disk of clients at regular intervals and encrypts them. Hence, system manages the encrypted documents in the server. In particular, the security of TPS was greatly enhanced by limiting the access of documents including the personal information with regard to the client in an abnormal state through the TPM-based platform verification mechanism of the client system. In addition, we proposed and implemented a VTF (Virtual Trusted File) interface to provide users with the almost identical user interface as general document access even though documents containing personal information are encrypted and stored on the remote server. Consequently, the TPS automates the compliance of the personal information protection acts without additional users' interventions.

A Transformation of XML Documents With Semantic Constraints (DTD의 의미 구조 분석을 이용한 XML 문서의 변환)

곽동규;최종명;조용윤;유재우
- Proceedings of the Korean Information Science Society Conference
- /
- 2004.04b
- /
- pp.589.2-861
- /
- 2004
XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서를 다른 XML 어플리케이션에서 재 사용하여 사용자에게 동일한 정보를 제공하는데 있다 XML 문서는 어플리케이션 특성에 따라 한 문서에서 전달할 수 있는 정보의 량이 다르다. 따라서 문서를 변환하기 전에 어플리케이션의 특성에 따라 문서를 분할하거나 병합하여야 한다[1]. 또한, XML 문서의 정보는 속성에 따라 문법적인 특성을 가진다. 본 논문은 문벌적인 특성을 의미 속성이라 하고 의미 속성을 파악하기 위해 XML 문서의 의미 구조와 의미 구조 관계를 정의한다. 그리고 정의된 의미 구조와 의에 구조 관계를 이용하여 문서 정보의 속성을 분류하는 방법을 제안한다. 변환 규칙은 의ロP 구조 관계가 유사한 엘리먼트간의 대응으로 정의하고, 변환 규칙을 이용하여 문서 변환을 실행하여 변환 XML과 의미 관계 구조가 유사한 피 변환 XML 문서를 생성한다. 의미구조 분석을 이용한 변환은 기존의 사용 패턴을 분석한 변환에서 벗어나 DTD의 분석을 통한 자동화된 문서 변환 방법을 제공한다.
PDF

뉴우스

Korean Library Association
- KLA journal
- /
- v.21 no.5
- /
- pp.32-32
- /
- 1980
PDF

Document Version Management in CoDocs System (CoDocs 문서관리시스템의 버전관리)

안건태;김진홍;한천용;정명희;이명준
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.10b
- /
- pp.290-292
- /
- 2000
정보통신 분야에서의 최근의 기술적인 발전에 힙입어 인트라넷을 기반으로 한 조직내 업무를 자동화하고, 또한 정보 공유를 통해 생산성을 높이기 위하여 많은 정보시스템이 구축되고 있다. 이러한 정보시스템은 조직의 성격에 따라 유연성있게 변화하면서 기술문서 등 여러 가지 종류의 문서들을 효과적으로 관리할 수 있도록 지원하는 것이 바람직하다. CoDocs 시스템은 공동작업의 효과적인 지원을 위해 문서를 체계적으로 관리할 수 있는 웹 기반환경에서 구현된 문서관리 시스템이다. 본 논문에서는 CoDocs 시스템에서 구축된 문서정보조직을 기반으로 문서간의 연계성을 높이고 활용성을 증가시키기 위해 문서 버전관리기능을 설계 및 구현하였다. 버전관리는 각 문서의 버전을 저장하여 히스토리(history) 정보를 유지하고 관리하며, 문서간의 연관성을 부여하여 문서등록 및 검색 시 관련문서에 대한 참조기능을 제공한다.
PDF

Search Result 219, Processing Time 0.029 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)