• 제목/요약/키워드: document search

검색결과 383건 처리시간 0.021초

XForm 표준에 근거 한 XForm 저작기 개발에 관한 연구 (A Study on Implementation of XForm Editor based on XForm Standard)

  • 최경호;현득창;신예호
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권3호
    • /
    • pp.135-144
    • /
    • 2006
  • 오늘날 컴퓨터 기술의 발전과 네트워크의 급속한 확산에 따라 기존의 종이를 이용한 정보매체에서 전자문서로의 변화가 가속화되고 있다. 이에 따라 전자문서를 생성하고, 전자문서에 포함된 정보를 관리하는 것은 매우 중요한 이슈가 되었다. XML은 인터넷상에서 복잡하고 구조화된 문서자료의 저장, 관리, 검색을 용이하게 할 수 있을 뿐만 아니라, 나아가 전자상거래, 전자 도서관, 가상대학 등의 핵심 응용 시스템의 구축에서 중요한 역할을 하고 있다. 이러한 XML 문서를 일반 사용자가 작성하는 것은 쉬운 작업이 아니다. 따라서 본 논문은 XML 문서를 보다 쉽고 편리하게 작성하기 위한 편집 방법에 관한 연구이다. 이를 위해 본 논문에서 제시하고 있는 방안은 문서 폼(Form)을 이용해 XML 문서를 입력한다는 개념을 도입하였고, XML 문서 폼을 만드는 과정과 만들어진 XML 문서 폼을 이용해 실제 XML 문서를 만드는 과정으로 입력과정을 분리하였다. 이러한 분리된 입력방법은 XML에 대해 잘 모르는 입력자라 할지라도 전문가나 시스템에서 제공하는 XML문서 폼을 이용하면 XML문서를 쉽게 입력할 수 있기 때문에 XML입력의 효율성을 높일 수 있게 된다.

  • PDF

온라인 정보탐색의 효과변인 분석 (An Analysis on the Factors Affectingy Online Search Effect)

  • 김선호
    • 한국문헌정보학회지
    • /
    • 제22권
    • /
    • pp.361-396
    • /
    • 1992
  • The purpose of this study is to verify the correlations between the amount of the online searcher's search experience and their search effect. In order to achieve this purpose, the 28 online searchers working at the chosen libraries and information centers have participated in the study as subjects. The subjects have been classified into the two types of cognitive style by Group Embedded Figure Test. As the result of the GEFT, two groups have been identified: the 15 Field Independance ( FI ) searchers and the 13 Field Dependance ( FD ) searchers. The subject's search experience consists of the 3 elements: disciplinary, training, and working experience. In order to get the data of these empirical elements, a questionnaire have been sent to the 28 subjects. An online searching request form prepared by a practical user was sent to all subjects, who conducted searches of the oversea databases through Dialog to retrieve what was requested. The resultant outcomes were collected and sent back to the user to evaluate relevance and pertinence of the search effect by the individual. In this study, the search effect has been divide into relevance and pertinence. The relevance has been then subdivided into the 3 elements : the number of the relevant documents, recall ratio, and the cost per a relevant document. The relevance has been subdivided into the 3 elements: the number of the pertinent documents, utility ratio, and the cost per a pertinent document. The correlations between the 3 elements of the subject's experience and the 6 elements of the search effect has been analysed in the FI and in the FD searchers separately. At the standard of the 0.01 significance level, findings and conclusions made in the study are summarised as follows : 1. There are strong correlations between the amount of training and the recall ratio, the number of the pertinent documents, and the utility ratio on the part of FI searchers. 2. There are strong correlations between the amount of working experience and the number of the relevant documents, the recall ratio on the part of FD searchers. However, there is also a significant converse correlation between the amount of working experience and the search cost per a pertinent document on the part of FD searchers. 3. The amount of working experience has stronger correlations with the number of the pertinent documents and the utility ratio on the part of FD searchers than the amount of training. 4. There is a strong correlation between the amount of training and the pertinence on both part of FI and FD searchers.

  • PDF

An Improved Combined Content-similarity Approach for Optimizing Web Query Disambiguation

  • Kamal, Shahid;Ibrahim, Roliana;Ghani, Imran
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.79-88
    • /
    • 2015
  • The web search engines are exposed to the issue of uncertainty because of ambiguous queries, being input for retrieving the accurate results. Ambiguous queries constitute a significant fraction of such instances and pose real challenges to web search engines. Moreover, web search has created an interest for the researchers to deal with search by considering context in terms of location perspective. Our proposed disambiguation approach is designed to improve user experience by using context in terms of location relevance with the document relevance. The aim is that providing the user a comprehensive location perspective of a topic is informative than retrieving a result that only contains temporal or context information. The capacity to use this information in a location manner can be, from a user perspective, potentially useful for several tasks, including user query understanding or clustering based on location. In order to carry out the approach, we developed a Java based prototype to derive the contextual information from the web results based on the queries from the well-known datasets. Among those results, queries are further classified in order to perform search in a broad way. After the result provision to users and the selection made by them, feedback is recorded implicitly to improve the web search based on contextual information. The experiment results demonstrate the outstanding performance of our approach in terms of precision 75%, accuracy 73%; recall 81% and f-measure 78% when compared with generic temporal evaluation approach and furthermore achieved precision 86%, accuracy 71%; recall 67% and f-measure 75% when compared with web document clustering approach.

원자력 통합안전경영시스템을 이용한 요르단연구로사업의 문서관리 (Document Management for Jordan Research and Training Reactor Project by ANSIM)

  • 박국남;최민호;권용세
    • 산업경영시스템학회지
    • /
    • 제39권2호
    • /
    • pp.113-118
    • /
    • 2016
  • Project management is a tool for smooth operation during a full cycle from the design to normal operation including the schedule, document, and budget management, and document management is an important work for big projects such as the JRTR (Jordan Research and Training Reactor). To manage the various large documents for a research reactor, a project management system was resolved, a project procedure manual was prepared, and a document control system was established. The ANSIM (Advanced Nuclear Safety Information Management) system consists of a document management folder, document container folder, project management folder, organization management folder, and EPC (Engineering, Procurement and Construction) document folder. First, the system composition is a computerized version of the Inter-office Correspondence (IOC), the Document Distribution for Agreement (DDA), Design Documents, and Project Manager Memorandum (PM Memo) works prepared for the research reactor design. Second, it reviews, distributes, and approves design documents in the system and approves those documents to register and supply them to the research reactor user. Third, it integrates the information of the document system-using organization and its members, as well as users' rights regarding the ANSIM document system. Throughout these functions, the ANSIM system has been contributing to the vitalization of united research. Not only did the ANSIM system realize a design document input, data load, and search system and manage KAERI's long-period experience and knowledge information properties using a management strategy, but in doing so, it also contributed to research activation and will actively help in the construction of other nuclear facilities and exports abroad.

시멘틱 웹/온톨로지 기술을 이용한 개인용 전자문서 검색 시스템 (Personal Electronic Document Retrieval System Using Semantic Web/Ontology Technologies)

  • 김학래;김홍기
    • 한국전자거래학회지
    • /
    • 제12권1호
    • /
    • pp.135-149
    • /
    • 2007
  • 개인 사용자가 전자문서를 쉽게 사용하려면 전자문서를 효과적으로 분류하고, 정확하게 검색할 수 있는 기능이 필요하다. 그러나 개인 사용자의 컴퓨터에 저장된 문서를 효율적으로 관리하기 위한 방법이나 도구에 대한 연구는 상대적으로 미흡한 상태이다. 본 연구는 개인 사용자가 전자 문서를 효과적으로 관리하고 검색하기 위한 방법을 제안한다. 연구 결과인 ONTALK은 모든 전자문서의 메타데이터를 온톨로지 기반으로 생성하고, 추론엔진(inference engine)을 이용하여 의미적(semantics) 정보 검색을 제공한다.

  • PDF

완전그래프를 이용한 문서요약 연구 (Document Summarization Method using Complete Graph)

  • 유준현;박순철
    • 한국산업정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.26-31
    • /
    • 2005
  • 본 논문에서는 웹 검색엔진에서 일반적으로 사용하는 문서요약에 대한 연구로써 문서 내에 있는 문장들의 꼭짓점을 연결하는 완전그래프기법을 도입하여 요약내용을 좀 더 간결하고 함축하게 하는 통계요약기법을 제안했다. 이 요약기술을 지금까지 통계 문서요약기술에서 우수하다고 판단된 클러스터링 기법과 MMR 기법 등과 비교하였다. 특히, 요약 성능을 평가하기 위하여 인위적으로 요약된 요약문을 기준으로 한 각 요약기법들의 FScore값들과 비교하였다. 이 기술들 중에서 완전그래프기법이 약 $30\%$정도 성능향상을 보였다.

  • PDF

역사객체 기반의 기계학습 기법을 활용한 웹 문서의 시간정보 추출 방안 제안 (A Proposal of Methods for Extracting Temporal Information of History-related Web Document based on Historical Objects Using Machine Learning Techniques)

  • 이준;권용진
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.39-50
    • /
    • 2015
  • 최근 검색엔진을 통한 정보검색 과정에서 특정 시구간 상황에 대응하는 문서를 검색하고자 하는 경우가 있다. 예를 들면, 임진왜란 이전의 시대적 상황과 관련된 문서를 검색하기 위해, 키워드 '임진왜란'으로 검색하면 시간에 관계없이 임진왜란 당시나 전후의 모든 문서가 검색되어 추가적인 작업이 요구된다. 또한, 역사관련 문서의 경우는 문서내용에 대응하는 시간 정보가 문서 생성시간과 일치하지 않는 경우가 대부분이다. 만약 웹 문서의 내용에 대응하는 시간 정보를 추출 할 수 있다면 효과적인 정보검색은 물론 다양한 응용에 적용 가능할 것이다. 따라서 본 논문은 문서 내용에 대응하는 시간정보 추출을 목적으로, 조선시대를 대상으로 한 역사문헌을 활용하여 조선시대 역사관련 문서의 시간추출에 대한 연구를 진행한다. 역사 문헌과 웹으로부터 수집된 역사관련 문서를 바탕으로 역사객체를 정의하고, 이를 기반으로 다양한 기계학습 기법을 활용하여 웹 문서의 시간정보 추출에 대한 가능성을 확인한다. 또한 기계학습 과정에 있어서 객체의 유사도에 기반 한 여과과정을 제안하고 이를 적용한 효율적인 시간정보 추출 및 정확도 향상에 대한 결과를 비교 분석한다.

확률기법을 이용한 자동 문서 분할에 관한 연구 (A Study on the Automatic Document Segmentation using Stochastic Method)

  • 음호식;이명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.82-89
    • /
    • 2001
  • 문서분할이란 내용별로 문서의 경계를 정하는 일로써 정확하고 효율적인 정보검색에 필수적이다. 본 논문에서는 단어간의 상호 정보를 이용하는 확률적인 분석 방법을 이용한 자동문서 분할 시스템을 구현하고자 한다. 시스템은 윈도우의 경계를 이동시키면서 두 윈도우의 유사도를 계산해 내며 공유하는 단어들이 많을수록 그리고 공유하는 단어들의 중요도가 높을수록 두 윈도우의 응집도는 올라간다. 문서 분할 실험결과 블록의 단위가 달라지더라도 분할하고자 한곳이 정상적으로 분할됨을 보였다

  • PDF

Experience of Theory and Practice of the Process of Implementing Information Technologies in the Educational Environment

  • Melnyk, Yaroslav;Drapak, Halyna;Sverdlyk, Zoriana;Tsilyna, Maryna;Varenko, Volodymyr;Boichuk, Nelia
    • International Journal of Computer Science & Network Security
    • /
    • 제21권4호
    • /
    • pp.75-79
    • /
    • 2021
  • The article covered theoretical aspects use of information and communication technologies in teaching. Information and communication technologies are technologies that allow you to search, process and assimilate information from various sources, including the Internet. This is the presentation of information in electronic form, its processing and storage, the use of the computer, a variety of programs. The use of information and communication technologies in the work of a student gives an increase in motivation for learning; increased cognitive interest; evaluate their learning activities, identify the problems of their own educational activities; the formation of cognitive independence of students.

사용자 중심의 블로그 정보 검색 기법 (User-Centered Information Retrieving Method in Blogs)

  • 김승종
    • 한국산학기술학회논문지
    • /
    • 제11권9호
    • /
    • pp.3458-3464
    • /
    • 2010
  • 최근 빠른 주기로 많은 양의 새로운 정보가 생성되기 때문에, 사용자 중심의 정보 검색을 위해 RSS라는 신디케이션 기술이 제공되고 있다. RSS는 새롭게 갱신된 콘텐츠를 자동으로 전달받을 수 있어 신규 정보를 찾기 위해 사이트에 지속적으로 접근하지 않아도 된다. 본 논문에서는 블로그 정보 검색을 위해 RSS 문서의 주소를 수집하는 수집기와 사용자 질의에 따른 RSS 문서의 순위결정 방법을 제안한다. 제안하는 정보 검색 기법을 이용하면 사용자가 RSS 문서를 효과적으로 검색할 수 있다.