• 제목/요약/키워드: document search

검색결과 382건 처리시간 0.023초

구조화 문서 검색을 위한 다단계 역색인 기법 (A Multi-level Inverted Index Technique for Structural Document Search)

  • 김종익
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.355-364
    • /
    • 2008
  • XML로 대표되는 구조화된 문서의 검색을 위해서는 구조 조인 기법이 많이 사용되며 구조 조인 기법을 사용하기 위해서는 구조 조인에 참여하는 엘리먼트들을 추출하는 과정이 선행되어야 한다. 이 과정을 위해서 일반적으로 동일한 태그 값을 가지는 엘리먼트들을 리스트 형태로 추출해 주는 역색인을 사용한다. 하지만 이러한 기존의 기법은 경로 질의 내의 부모-자식 관계나 조상-후손 관계를 비교적 비용이 비싼 구조 조인으로 모두 처리해야 하기 때문에 경로의 길이가 길어질수록 질의 처리 비용이 크게 증가하는 단점을 가지고 있다. 본 논문에서는 기존의 역색인과는 달리 엘리먼트 추출과정에서 부모-자식 관계에 있는 엘리먼트들을 처리할 수 있는 단계별 역색인을 제안한다. 본 논문에서 제안하는 단계별 역색인은 경로 질의 내의 부모-자식 관계를 가지는 엘리먼트 쌍(pair)들의 리스트를 추출해 준다. 또한 단계별 역색인으로부터 추출된 엘리먼트 쌍들의 리스트를 처리하기 위해 기존의 구조 조인과는 다른 변형된 구조 조인 기법을 제안하며 실험을 통해 제안된 기법이 기존의 기법보다 2배에서 4배 가량의 성능향상이 있는 것을 확인하였다.

OWL 문서의 변경 탐지 및 관리 기법 (Change Detection and Management Scheme of OWL Documents)

  • 김연희;김지현
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권1호
    • /
    • pp.43-52
    • /
    • 2012
  • 정보 자원에 대한 정확한 검색을 위해서는 점진적으로 변화하는 온톨로지의 변경 내용을 효율적으로 관리할 필요가 있다. 최근에는 OWL을 이용해 온톨로지를 기술하는 경우가 많기 때문에 OWL 문서로 작성된 온톨로지의 변경 내용을 관리할 수 있는 기법이 필요하다. 이러한 요구에 따라 본 논문에서는 OWL로 기술된 온톨로지의 변화를 탐지할 수 있도록 변경 가능한 요소를 분류하고 각 요소의 특성에 맞게 변경 내용을 관리할 수 있는 저장 스키마를 제안한다. 그리고 온톨로지 버전별로 클래스나 프로퍼티에 대한 정보를 제공하는 뷰를 이용하여 질의 처리 성능을 개선할 수 있는 가능성을 제시한다. 본 논문에서 제안한 저장 스키마는 각 온톨로지 버전과 관련된 메타데이터의 변경 내용도 함께 저장한다. 또한 온톨로지가 변경되면 자동적으로 추가 또는 삭제되어야 하는 메타데이터의 내용도 추론을 통해 관리할 수 있다. 따라서 본 논문에서 제안한 저장 스키마를 이용하면 온톨로지의 변경 이력에 대한 검색이 가능하고 사용자가 선택한 온톨로지 버전에 맞는 정확하고 유효한 메타데이터를 제공할 수 있다.

개인화된 건강 자원 조회를 위한 TOS 와 HL7 FHIR 서비스간의 데이터그리드 모델 설계 (Design of a Data Grid Model between TOS and HL7 FHIR Service for the Retrieval of Personalized Health Resources)

  • 전영준;임석진;황희정
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.139-145
    • /
    • 2016
  • 질환 조기경보를 목표로 하는 ICT 힐링플랫폼에서 TOS는 개인 건강관련 데이터 공급자(provider)와 서비스 공급자 사이를 연결하여 개인화된 건강데이터를 중계한다. 이전 연구인 TOS에서는 모바일 기기를 고려하여 문서/측정 값 등의 자원에 대한 조회(retrieval) 및 관제 모니터링 방법이 제안되었다. 그러나 최근 헬스케어 분야에서, 모바일 기기를 이용한 통신 및 데이터 교환에 필요한 표준 항목들이 HL7 FHIR을 통해 정의되었다. 본 논문에서는 TOS를 통해 중계된 개인건강 자원을 FHIR bundle searchset으로 제공하기 위해서, TOS와 FHIR간의 데이터 그리드 모델을 설계하도록 한다. 제안 설계의 구성은 다음과 같다. 우선 TOS 자원 요청 방법과 FHIR observation 요청간의 유사점을 기술한다. 다음으로, IMDG 및 클러스터 기술을 기반으로 FHIR 서비스의 조회 요청을 처리하는 event-bus 모듈을 설계한다. 제안된 설계는 기존의 ICT 힐링플랫폼의 서비스 단말을 FHIR 리소스 활용이 가능한 모바일 헬스 기기로 확장하는데 활용할 수 있다.

보안문서와 트랜잭션ID 연계기반 개인정보유통경로 탐지기법 연구 (Study on Detection Technique of Privacy Distribution Route based on Interconnection of Security Documents and Transaction ID)

  • 신재호;김인석
    • 정보보호학회논문지
    • /
    • 제25권6호
    • /
    • pp.1435-1447
    • /
    • 2015
  • 금융회사에서는 내부자에 의한 개인정보유출 방지 및 내부통제 강화를 위하여 E-DRM(Enterprise-Digital Right Management), 개인정보검색, DLP(Data Loss Prevention), 출력물보안, 인터넷 망 분리시스템, 개인정보모니터링 시스템 등의 보안 솔루션을 도입 운영하고 있다. 하지만 개인정보유출 사고는 계속해서 발생하고 있으며, 이 기종 보안 솔루션간의 독립적인 로그 체계로 인하여 개인정보문서의 회사 내부유통 및 외부반출 관련한 정합성 있는 유통경로의 연관 분석이 어렵다. 본 논문은 보안문서를 기반으로 하여 업무시스템 및 이 기종 보안 솔루션간의 로그를 유기적으로 정합성 있게 연관 분석할 수 있는 연결고리 체계 방안을 제시하고, 업무시스템을 통하여 개인PC에 생성되는 보안문서나 개인이 작성한 보안문서에 대한 Life-Cycle 관리방안 및 개인정보가 포함된 보안문서에 대한 유통경로 추적을 위한 효율적인 탐지 방안을 제안하고자 한다.

Doc2Vec 모형에 기반한 자기소개서 분류 모형 구축 및 실험 (Self Introduction Essay Classification Using Doc2Vec for Efficient Job Matching)

  • 김영수;문현실;김재경
    • 한국IT서비스학회지
    • /
    • 제19권1호
    • /
    • pp.103-112
    • /
    • 2020
  • Job seekers are making various efforts to find a good company and companies attempt to recruit good people. Job search activities through self-introduction essay are nowadays one of the most active processes. Companies spend time and cost to reviewing all of the numerous self-introduction essays of job seekers. Job seekers are also worried about the possibility of acceptance of their self-introduction essays by companies. This research builds a classification model and conducted an experiments to classify self-introduction essays into pass or fail using deep learning and decision tree techniques. Real world data were classified using stratified sampling to alleviate the data imbalance problem between passed self-introduction essays and failed essays. Documents were embedded using Doc2Vec method developed from existing Word2Vec, and they were classified using logistic regression analysis. The decision tree model was chosen as a benchmark model, and K-fold cross-validation was conducted for the performance evaluation. As a result of several experiments, the area under curve (AUC) value of PV-DM results better than that of other models of Doc2Vec, i.e., PV-DBOW and Concatenate. Furthmore PV-DM classifies passed essays as well as failed essays, while PV_DBOW can not classify passed essays even though it classifies well failed essays. In addition, the classification performance of the logistic regression model embedded using the PV-DM model is better than the decision tree-based classification model. The implication of the experimental results is that company can reduce the cost of recruiting good d job seekers. In addition, our suggested model can help job candidates for pre-evaluating their self-introduction essays.

XML 데이타의 경로 유사성에 기반한 클러스터링 기법 (A Clustering Method Based on Path Similarities of XML Data)

  • 최일환;문봉기;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.342-352
    • /
    • 2006
  • 최근의 XML 저장소에 관한 연구들은 기존의 데이타 저장을 위해 주로 사용해 왔던 관계형 데이타베이스에 효율적으로 XML 데이타를 매핑하는 기법이나 XML 데이타를 위한 새로운 전용 저장소에 대한 연구들이 주를 이룬다. XML 전용 저장소에서 많이 사용되는 방식으로 XML 문서를 파싱하여 각 노드들을 개별적인 객체로 생성한 후 이를 저장하는 방식이 있다. 이러한 저장 방식에서는 개별적인 객체들의 물리적 배치, 즉 클러스터링이 성능에 영향을 미칠 수 있다. 본 논문에서는 하나의 XML 문서를 보다 효율적으로 저장하는 클러스터링 기법을 제안한다. 제안하는 기법은 데이타 노드들의 경로 유사도를 기반으로 클러스터링을 수행하여 질의 요청에 대한 결과를 반환할 때 발생하는 페이지 I/O를 줄인다. 또한 경로 질의 처리시 필요한 클러스터만을 이용하여 질의 처리를 수행하는 방법을 제안한다. 이는 질의 처리과정에서 불필요한 데이타를 제외함으로써 결과적으로 탐색 공간의 크기를 줄일 수 있어 보다 효율적인 경로 질의 처리를 가능하게 한다. 이밖에 본 논문에서는 기존의 다른 클러스터링 기법들과 제안한 기법들과의 성능 비교를 수행하고, 이를 통해 적절한 클러스터링 기법을 이용하면 XML 저장소의 성능을 향상시킬 수 있음을 보인다.

경영시스템 도입 중소기업의 품질이행율 향상을 위한 품질기록 관리운영의 표준화 사례연구 (Introduction of Management System Case Study on Standardization of Quality Record Management to Improve Quality Performance Rate of SMEs)

  • 조철희;박병화;박진이
    • 품질경영학회지
    • /
    • 제47권4호
    • /
    • pp.911-926
    • /
    • 2019
  • Purpose: In an infinite market competition, companies are adopting management systems to gain a competitive advantage. The expectancy effect of the management system is management performance improvement and accurate measurements. These can be made through quality records with integrity and maintainability. This paper examines the operation of records management standards, which are records, storage and management standards for quality records to understand the needs of records management standards and empathize with their needs. Methods: This paper examines PEC's (Pields Engineering Co., Ltd.) specific processes and standards for integrating individual management systems and establishing records management standards. We also look at the specific features of the Search Tool and Document Storage Management Standards that support records management standards. Results: The integration process of PEC's individual management system consists of five steps. A PDCA-based process was established to erode the confusion and inefficiencies caused by overlap between individual management systems. Also, by accurately grasping corporate competence, PEC established a record management standard suitable for the characteristics of the company. PEC's records management standards are used as a useful standard for organizing quality records, and have an impact on management performance improvement. Conclusion: PEC's records management standards enable the verification of quality performance rates and performance measures. Companies can implement appropriate quality improvement strategies based on the numbers identified by introducing records management standards. Companies can succeed in improving management performance when operating quality management that combines performance measurement techniques and records management standards.

국제물품매매계약에서의 교부서류에 대한 엄격일치원칙의 적용가능성 연구 (A Study on the Applicability of Strict Compliance of the Documents on the Contract for the International Sale of Goods)

  • 박남규
    • 무역상무연구
    • /
    • 제51권
    • /
    • pp.187-210
    • /
    • 2011
  • International transactions have the threat of non-payment by the buyer or non-performance by the seller. Parties tend to search for additional means of securing performance and payment beyond the mere agreement in the contract. Such security may be achieved by means of a letter of credit. When contracting parties have agreed to pay by means of a letter of credit, the buyer's bank takes upon itself the obligation to pay the purchase price when the seller tenders the documents that are stipulated in the letter of credit. The documents must comply strictly with the terms of the credit.. The documents play a crucial role in letter of credit transaction. The principles of abstraction, separability and strict compliance governing the letter of credit transaction are considered. The concept of fundamental breach of Article 25 CISG was discussed. This article examines whether a failure to deliver documents conforming to the terms of the letter of credit can constitute a fundamental breach of the sales contract as defined by Article 25 of the CISG by the seller and thereby enable the buyer to avoid the contract. For letter of credit transactions it should be accepted that the delivery of non-performing documents constitutes a fundamental breach, if the result of this breach is that the bank refuses to pay the price for the goods. On the other hand, in the interpretation of Article 25 CISG, it should be noted that if the parties have agreed to payment by means of a letter of credit, they have simultaneously agreed to apply the strict compliance principle to the delivery of documents in the sales contract. Finally the parties should ensure that inconsistency between the requirements under the documentary credit and the requirements under the contract of sale is avoided, since the buyer may be in breach of his payment obligation if the seller cannot get paid under the documentary credit when his documents conform with the contract of sale.

  • PDF

품질 정보 수집을 위한 프록시 클라이언트 코드의 자동 생성 방안에 관한 연구 (A Study on Automatic Generation Method of Proxy Client Code to Quality Information Collection)

  • 서영준;한정수;송영재
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.121-125
    • /
    • 2007
  • 본 논문에서는 모니터링 에이전트를 통한 웹 서비스 선정 과정의 자동화를 위해 프록시 클라이언트 코드를 자동 생성하는 방안을 제안한다. 본 논문의 기법은 템플릿 룰에 따라 WSDL 문서의 특정 엘리먼트의 속성 값을 가져옴으로써 서비스 사용자에게 프록시 클라이언트의 소스 코드를 제공할 수 있게 해 준다. 즉 XSLT 스크립트 파일은 클라이언트 코드 생성시 필요한 동적 호출 인터페이스 모델의 코드 골격을 제공한다. 이러한 코드 자동생성 기법은 이동 에이전트 기술과 더불어 선정 아키텍처에서의 기아 상태를 해결하기 위해 필요하다. 선정 서비스를 제외하더라도 검색 결과상의 모든 서비스들에 대한 요청 HTTP 메시지를 발생시키기 위해서는 코드 자동 생성 기법이 필요하다. 생성된 프록시 클라이언트 프로그램 코드는 검색된 서비스들에 대한 더미 메시지를 발생시킨다. 본 논문에서 제시한 클라이언트 코드 생성 방안은 자동 생성 프로그래밍 영역에서의 적용 가능성을 보여준다.

  • PDF

자율적인 웹 서비스 품질 정보 수집을 위한 프록시 클라이언트 코드의 자동 생성 방안 (Automatic Generation Method of Proxy Client Code to Autonomic Quality Information)

  • 서영준;한정수;송영재
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.228-235
    • /
    • 2008
  • 본 논문에서는 모니터링 에이전트를 통한 웹 서비스 선정 과정의 자동화를 위해 프록시 클라이언트 코드를 자동 생성하는 방안을 제안한다. 본 논문의 기법은 템플릿 룰에 따라WSDL문서의 특정 엘리먼트의 속성 값을 가져옴으로써 서비스 사용자에게 프록시 클라이언트의 소스 코드를 제공할 수 있게 해 준다. 즉 XSLT 스크립트 파일은 클라이언트 코드 생성시 필요한 동적 호출 인터페이스 모델의 코드 골격을 제공한다. 이러한 코드 자동 생성 기법은 이동 에이전트 기술과 더불어 선정 아키텍처에서의 기아 상태를 해결하기 위해 필요하다 선정 서비스를 제외하더라도 검색 결과상의 모든 서비스들에 대한 요청 HTTP 메시지를 발생시키기 위해서는 코드 자동 생성 기법이 필요하다. 생성된 프록시 클라이언트 프로그램 코드는 검색된 서비스들에 대한 더미 메시지를 발생시킨다. 본 논문에서 제시한 클라이언트 코드 생성 방안은 자동 생성 프로그래밍 영역에서의 적용 가능성을 보여준다.