• Title/Summary/Keyword: 질의응답문서

Search Result 163, Processing Time 0.042 seconds

Fine-Grained Access Control Method in XML Data Stream (XML 데이터 스트림 환경에서 세분화된 접근제어 방법)

  • An, Dong-Chan
    • KSCI Review
    • /
    • v.15 no.1
    • /
    • pp.131-139
    • /
    • 2007
  • 다양한 사용자 및 응용 프로그램들이 XML을 기반으로 정보의 분산과 공유를 요구함에 따라 안전하고 효율적으로 XML 데이터를 접근하려는 요구가 중요한 이슈로 관심을 모으고 있다. 특히, 접근제어 규칙을 XPath로 표현함으로써 문서 단위 접근 범위의 한계를 극복하고 문서의 일부분 단위의 접근을 해결하면서 접근제어를 수행할 때 발생될 수 있는 충돌에 대한 해결책을 마련하는 안전성에 초점을 둔 연구들은 많았으나 접근제어를 수행할 때의 효율성에 초점을 둔 연구는 미비하다. 본 논문은 XML 데이터 스트림의 특성을 고려하여 롤 프라임넘버 레이블링 기법을 이용한 세분화된 접근제어 방법을 제안한다. 본 논문에서 제안한 방법은 기존 시스템과 비교하여 구현의 용이성, 낮은 실행시간, 그리고 안전하고 정확한 질의응답을 보장한다. 또한, 이와 같은 장점들을 실험을 통해 분석한다.

  • PDF

Extract Snippets Suitable for Search Intent (검색의도에 적합한 스니펫 추출)

  • Lee, Hyeon-gu;Yang, Yunyeong;Kim, Eunbyul;Cha, Woojune;Roh, Yunyoung;Kim, Eunyoung;Choi, Gyuhyeon;Shin, Dongwook;Park, Chanhoon;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.241-246
    • /
    • 2021
  • 스니펫 추출은 정보검색에서 주요한 문서 정보를 짧은 문단 형태로 보여주는 것으로 사용자가 검색결과를 좀 더 효율적으로 확인할 수 있게 도와준다. 그러나 기존 스니펫은 어휘가 일치하는 문장을 찾아 보여주기에 검색의도가 반영되기 어렵다. 또한 의미적 정답을 찾기 위해 질의응답 방법론이 응용되고 있지만 오픈 도메인 환경에서 품질이 낮은 문제가 있다. 본 논문은 이러한 문제를 해결하기 위해 스니펫 추출, 의도 부착, 검증 3단계로 스니펫을 추출하여 추출된 스니펫이 질의 의도에 적합하게 추출되도록 하는 방법을 제안한다. 실험 결과 전통적인 스니펫보다 만족도가 높은 것을 보였고, 스니펫 추출만 했을 때보다 의도 부착, 검증을 하였을 때 정확도가 0.3165만큼 향상되는 것을 보였다.

  • PDF

Efficient Web Document Search based on Users' Understanding Levels (사용자의 이해수준에 따른 효율적인 웹문서 검색)

  • Shim, Sang-Hee;Lee, Soo-Jung
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.1
    • /
    • pp.38-46
    • /
    • 2009
  • With the rapid increase in the number of Web documents, the problem of information overload is growing more serious in Internet search. In order to ease the problem, researchers are paying attention to personalization, which creates Web environment fittingly for users' preference, but most of search engines produce results focused on users' queries. Thus, the present study examined the method of producing search results personalized based on a user's understanding level. A characteristic that differentiates this study from previous researches is that it considers users' understanding level and searches documents of difficulty fit for the level first. The difficulty level of a document is adjusted based on the understanding level of users who access the document, and a user's understanding level is updated periodically based on the difficulty of documents accessed by the user. A Web search system based on the results of this study is expected to bring very useful results to Web users of various age groups.

A Study on the Integration of Information Extraction Technology for Detecting Scientific Core Entities based on Large Resources (대용량 자원 기반 과학기술 핵심개체 탐지를 위한 정보추출기술 통합에 관한 연구)

  • Choi, Yun-Soo;Cheong, Chang-Hoo;Choi, Sung-Pil;You, Beom-Jong;Kim, Jae-Hoon
    • Journal of Information Management
    • /
    • v.40 no.4
    • /
    • pp.1-22
    • /
    • 2009
  • Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In this study, we define scientific as a set of 10 types of named entities and technical terminologies in a biomedical domain. in order to automatically extract these entities from scientific documents at once, we develop a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer, co-reference resolver and terminology extractor. Each module of the integrated system has been evaluated with various corpus as well as KEEC 2009. The system will be utilized for various information service areas such as information retrieval, question-answering(Q&A), document indexing, dictionary construction, and so on.

Analysis and Design of Learning Support Tool through Multi-Casting Techniques (멀티 캐스팅 기법을 통한 학습지원도구의 분석 및 설계)

  • Kim, Jung-Soo;Shin, Ho-Jun;Han, Eun-Ju;Kim, Haeng-Kon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04b
    • /
    • pp.727-730
    • /
    • 2001
  • 초고속 인터넷 서비스의 확대에 따라 이를 교육에 직 간접적으로 응용하기 위한 노력이 지속적으로 진행되어 왔다. 특히 웹 기반의 가상강의 저작도구를 통한 웹 코스웨어는 원거리 학습자들의 학습 욕구를 자기 주도적인 학습을 통해 가능케 했고 기존의 텍스트, 사운드를 통한 가상강의에서 동영상이 가미된 주문형 교육 서비스(EOD: Education On Demand)가 가능해졌다. 그러나 이를 이용하는 학습자는 전체적인 모듈의 이해를 통해 수업이 진행됨에 따라 학습과정에서는 질의응답을 튜터를 통해 웹 캐스팅이 이루어졌다. 따라서, 질의응답은 텍스트 형식의 E-mail, 채팅, 게시판, 방명록을 통해 이루어지므로 학습자가 요구한 질의 내용을 잘못 이해하고 튜터가 학습 과정에서의 피드백을 제공하지 못함으로써 개인 학습의 동기부여가 감소됨에 따라 흥미를 잃게 되었다. 본 논문에서는 이러한 문제점을 개선하기 위해 멀티 캐스팅 기법을 통해 교육용 서버를 이용한 학습지원도구를 분석, 설계한다. 가상강의는 기본적인 컨텐츠를 제시하고 그를 통해 수업이 진행되는 과정에서의 질의응답을 일대다(One-To-Many)의 멀티 캐스팅 서비스를 튜터가 지정한 교육용 서버를 통해 텍스트 형식이 아닌 강의자료로 쓰인 문서 파일에 직접 작성하여 전송하게 된다. 따라서 튜터는 메일링 서비스를 통해 질문사항을 자신의 폴더 서비스로 확인하고 즉시 학습자에게 피드백을 제공함으로써 튜터와 학습자들간의 커뮤니케이션이 활발히 이루어지며, 상호작용의 증가를 통해 웹 기반의 컨퍼런싱(WBC: Web Based Conferencing)을 가질 수 있게 된다.rver는 Client가 요청한 Content(services)를 전달 해 주는 컨텐트 전달 모듈(Content Deliver Module)과 서버 Phonebook 엑세스 모들(Server Phonebook Access Module)로 구성되어 있다.외 보다 높았다(I/O ratio 2.5). BTEX의 상대적 함량도 실내가 실외보다 높아 실내에도 발생원이 있음을 암시하고 있다. 자료 분석결과 유치원 실내의 벤젠은 실외로부터 유입되고 있었고, 톨루엔, 에틸벤젠, 크실렌은 실외뿐 아니라 실내에서도 발생하고 있었다. 정량한 8개 화합물 각각과 총 휘발성 유기화합물의 스피어만 상관계수는 벤젠을 제외하고는 모두 유의하였다. 이중 톨루엔과 크실렌은 총 휘발성 유기화합물과 좋은 상관성 (톨루엔 0.76, 크실렌, 0.87)을 나타내었다. 이 연구는 톨루엔과 크실렌이 총 휘발성 유기화합물의 좋은 지표를 사용될 있고, 톨루엔, 에틸벤젠, 크실렌 등 많은 휘발성 유기화합물의 발생원은 실외뿐 아니라 실내에도 있음을 나타내고 있다.>10)의 $[^{18}F]F_2$를 얻었다. 결론: $^{18}O(p,n)^{18}F$ 핵반응을 이용하여 친전자성 방사성동위원소 $[^{18}F]F_2$를 생산하였다. 표적 챔버는 알루미늄으로 제작하였으며 본 연구에서 연구된 $[^{18}F]F_2$가스는 친핵성 치환반응으로 방사성동위원소를 도입하기 어려운 다양한 방사성의 약품개발에 유용하게 이용될 수 있을 것이다.었으나 움직임 보정 후 영상을 이용하여 비교한 경우, 결합능 변화

  • PDF

Coreference Resolution for Korean using Mention Pair with SVM (SVM 기반의 멘션 페어 모델을 이용한 한국어 상호참조해결)

  • Choi, Kyoung-Ho;Park, Cheon-Eum;Lee, Changki
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.4
    • /
    • pp.333-337
    • /
    • 2015
  • In this paper, we suggest a Coreference Resolution system for Korean using Mention Pair with SVM. The system introduced in this paper, also be able to extract Mention from document which is including automatically tagged name entity information, dependency trees and POS tags. We also built a corpus, including 214 documents with Coreference tags, referencing online news and Wikipedia for training the system and testing the system's performance. The corpus had 14 documents from online news, along with 200 question-and-answer documents from Wikipedia. When we tested the system by corpus, the performance of the system was extracted by MUC-F1 55.68%, B-cube-F1 57.19%, and CEAFE-F1 61.75%.

Techniques of XML Query Caching on the Web (웹에서의 XML 질의 캐쉬 기법)

  • Park, Dae-Sung;Kang, Hyun-Chul
    • The Journal of Society for e-Business Studies
    • /
    • v.11 no.1
    • /
    • pp.1-23
    • /
    • 2006
  • As data on the Web is more and more in XML due to proliferation of Web applications such as e-Commerce, it is strongly required to rapidly process XML queries. One of such techniques is XML query caching. For frequently submitted queries, their results could be cached in order to guarantee fast response for the same queries. In this paper, we propose techniques for XML query performance improvement whereby the set of node identifiers(NIS) for an XML query is cached. NIS is most commonly employed as a format of XML query result,, consisting of the identifiers of the XML elements that comprise the query result. With NIS, it is suitable to meet the Web applications data retrieval requirements because reconstruction and/or modification of query results and integration of multiple query results can be efficiently done. Incremental refresh of NIS against its source updates can also be efficiently done. When the query result is requested in XML, however, materialization of NIS is needed by retrieving the source XML elements through their identifiers. In this paper, we consider three different types of NISs. proposing the algorithms of their creation, materialization, and incremental refresh. All of them were implemented using an RDBMS. Through a detailed set of performance experiments, we showed the efficiency of the proposed XML query caching techniques.

  • PDF

A Extraction of Definitional Answer Sentence for a Definitional Question-Answering System (정의형 질의응답시스템을 위한 정의형 정답 문장 추출)

  • Ko, Byeong Il;Kang, Yu Hwan;Shin, Seung Eun;S, Young Hoon
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2004.11a
    • /
    • pp.470-475
    • /
    • 2004
  • In this paper, we propose a method to extract a definitional answer sentence for a Definitional Question-Answering System. definitional answer sentence patterns are manually constructed with restriction rules to patterns, and a ranking information of the pattern using its frequency from the corpus. answer sentence pattern consists of the syntactic structure of a definitional answer sentence, and clue words. this system show 83% accuracy for untrained corpus.

  • PDF

A Hierachical Browsing System for Conceptual Search of Hanmail FAQ (한메일 FAQ의 개념적 검색을 위한 계층적 브라우징 시스템)

  • Ahn, Joon-Hyun;Kim, Hyun-Don;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.94-99
    • /
    • 2000
  • 컴퓨터의 보급과 함께 인터넷의 대중화로 많은 정보가 인터넷을 통해 제공되면서 많은 사람들이 정보통신 기반 서비스를 이용하게 되었다. 하지만 이런 서비스에 익숙하지 않은 사용자가 자신이 원하는 정보를 찾는 것은 그리 쉬운 일이 아니다. 그래서 ISP나 PC통신 업체들은 사용자들이 겪는 어려움을 해결해 주기 위한 서비스를 제공하고 있다. 그러나 사용자들의 엄청난 증가로 인해 이런 서비스를 유지하는데 많은 인력과 시간이 필요하게 되면서 질의 응답 자동화에 대한 필요성이 대두되었다. 본 논문에서는 ISP 업체 중 하나인 한메일넷의 자동 응답 시스템을 위한 FAQ 브라우징 시스템을 개발하였다. 기존의 많은 검색 서비스가 키워드들을 단순히 나열하고 이 키워드의 링크를 따라가면서 검색을 하게 하였으나 이 방식은 검색 대상에 대한 키워드 정보만을 제공하기 때문에, 문제에 대한 배경 지식이 적거나 검색 서비스 사용에 익숙치 않은 사용자가 이용하기에는 쉽지 않다. 본 시스템에서는 사용자에게 이차원상에 표현된 문서 지도를 제공해서 사용자가 쉽게 전체 검색 자료의 분포를 파악하고 검색하도록 하였다. 또한 단계별 검색이 가능하도록 해서 사용자가 효율적으로 검색할 수 있다.

  • PDF

Identification of Characteristics of a Concept through Linguistic Analysis (언어학적 분석을 통한 개념의 특성 정보 인식)

  • Paik, Hae-Seung;Kang, Young-Soo;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.233-238
    • /
    • 2001
  • 개념은 그 개념을 나타내기 위한 특성들이 결합된 지식의 단위이며 각 특성은 개념에 속한 개체들의 성질을 축약한 것으로 정의될 수 있다[4]. 이 논문은 백과사전 설명문 텍스트를 분석하여 개념을 구성하는데 필요한 정보를 몇 개의 대표적인 특성으로 분류하고, 이를 개념의 특성정보로 구축하였으며, 이를 관련 개념 문서에 적용하여 특성 정보를 인식하는 것을 보여준다. 본 연구는 백과사전이 세계 지식(world knowledge) 전반을 함축적으로 표현하고 있다는 가정에서 출발하였으며 적은 양의 데이터에 대한 수동 분석 결과를 통해 많은 양의 코퍼스를 분석한 것과 같은 의미있는 결과를 얻었다. 백과사전에 표현된 많은 개념 중 "질병"에 관하여 실험한 결과 평균 81%의 정확율로 질병의 특성 정보인 원인, 증상, 치료를 자동 인식함을 보여주었다. 개념의 요소 정보 인식은 정보의 이나 질의 응답과 같은 분야에 적용될 수 있다.

  • PDF