• Title/Summary/Keyword: TREC

Search Result 82, Processing Time 0.024 seconds

Relevance Feedback Method of an Extended Boolean Model using Hierarchical Clustering Techniques (계층적 클러스터링 기법을 이용한 확장 불리언 모델의 적합성 피드백 방법)

  • 최종필;김민구
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.10
    • /
    • pp.1374-1385
    • /
    • 2004
  • The relevance feedback process uses information obtained from a user about an initially retrieved set of documents to improve subsequent search formulations and retrieval performance. In the extended Boolean model, the relevance feedback Implies not only that new query terms must be identified, but also that the terms must be connected with the Boolean AND/OR operators properly Salton et al. proposed a relevance feedback method for the extended Boolean model, called the DNF (disjunctive normal form) method. However, this method has a critical problem in generating a reformulated queries. In this study, we investigate the problem of the DNF method and propose a relevance feedback method using hierarchical clustering techniques to solve the problem. We show the results of experiments which are performed on two data sets: the DOE collection in TREC 1 and the Web TREC 10 collection.

Economic Impact Analysis of the Introduction of RPS (RPS 도입의 경제적 효과)

  • Kim, Suduk;Moon, Choon-Geol
    • Environmental and Resource Economics Review
    • /
    • v.14 no.3
    • /
    • pp.729-751
    • /
    • 2005
  • RPS(Renewable Portfolio Standards) is an institutional device to promote use of renewable energy through market mechanism by making renewable energy to constitute a pre-announced portion of the electricity production. We measure economic impacts of the introduction of RPS to domestic electricity market at the levels of electricity market, individual industrial sectors and the economy as a whole. First, we examine the TREC(Tradable Renewable Energy Credits) market, where the credits in excess of the obligation of the renewable energy production are sold to those who have to meet the obligation through purchased credits. We then measure end-users' additional cost originating from the introduction of RPS and TREC in electricity production, and their impacts on price and supply in the retail electricity market. Next, using input-output analysis, we measure economic impacts of the changes in retail price and supply on individual industrial sectors and the economy as a whole. Among many others, we find small price effect and large GDP effect - sectoral electricity price rises at around 5%, sectoral price level rises by 0.258%, and sectoral GDP declines by 1.940% on average by the year 2011.

  • PDF

Disease Prediction By Learning Clinical Concept Relations (딥러닝 기반 임상 관계 학습을 통한 질병 예측)

  • Jo, Seung-Hyeon;Lee, Kyung-Soon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.1
    • /
    • pp.35-40
    • /
    • 2022
  • In this paper, we propose a method of constructing clinical knowledge with clinical concept relations and predicting diseases based on a deep learning model to support clinical decision-making. Clinical terms in UMLS(Unified Medical Language System) and cancer-related medical knowledge are classified into five categories. Medical related documents in Wikipedia are extracted using the classified clinical terms. Clinical concept relations are established by matching the extracted medical related documents with the extracted clinical terms. After deep learning using clinical knowledge, a disease is predicted based on medical terms expressed in a query. Thereafter, medical terms related to the predicted disease are selected as an extended query for clinical document retrieval. To validate our method, we have experimented on TREC Clinical Decision Support (CDS) and TREC Precision Medicine (PM) test collections.

Short-range Precipitation Prediction using Radar Echo Correlation (Radar Echo Correlation을 이용한 단시간 강수예측기법 개발)

  • Kim, Gwang-Seob;Kim, Jong-Pil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2005.05b
    • /
    • pp.924-927
    • /
    • 2005
  • 한반도의 강수패턴을 보면 강수일수는 감소하나 호우일수는 증가하고 있는 추세이다. 특히, 우리나라는 강수의 대부분이 하계에 집중되어 있고, 단시간에 강수의 변화가 심하기 때문에 기존의 수치예보를 보완해줄 수 있는 예보체계의 확립이 불가피한 실정이다. TREC(Tracking Radar Echoes by Correlation)기법은 폭풍에 대한 내부 움직임을 결정하기 위한 목적으로 Rinehart와 Garvey(1978)에 의해 처음 개발된 것으로 비교적 간단하게 레이더 에코를 이용하여 강수의 이동경로를 추적할 수 있다. 일정한 시간 간격으로 제공되는 레이더 반사도 자료에 대하여 설정된 두 window 사이의 상관계수의 최대치를 찾아냄으로써 강수의 움직임을 파악하였다. 개발된 기법은 레이더 에코로부터 강수의 안정된 이동방향과 이동속도를 제시하기 위하여 상관성 분석과 함께 일치성 분석 및 가중함수에 의한 이동 백터장 보정을 수행하였다. 또한 이동 백터의 외삽을 통하여 강우이동경로와 대상유역의 단시간 예측 면적 강우 산정 방법을 제시하였다. 결과는 개선된 단시간 강수예측 가능성을 보여주었다.

  • PDF

Combining Deep Learning Models for Crisis-Related Tweet Classification (재난관련 트윗 분류를 위한 딥 러닝 결합 모델)

  • Choi, Won-Gyu;Lee, Kyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.649-651
    • /
    • 2018
  • 본 논문에서는 CNN에서 클래스 활성화 맵과 원샷 러닝을 결합하여 트위터 분류를 위한 딥 러닝 모델을 제안한다. 클래스 활성화 맵은 트윗 분류에 대한 분류 주제와 연관된 핵심 어휘를 추출하고 강조 표시하도록 사용되었다. 특히 작은 학습 데이터 셋을 사용하여 다중 클래스 분류의 성능을 향상시키기 위해 원샷 러닝 방법을 적용한다. 제안하는 방법을 검증하기위해 TREC 2018 태스크의 사건 스트림(TREC-IS) 학습데이터를 사용하여 비교실험을 했다. 실험 결과에서 CNN 기본 모델의 정확도는 58.1%이고 제안 방법의 정확도는 69.6%로 성능이 향상됨을 보였다.

  • PDF

A Query Classification Method for Question Answering on a Large-Scale Text Data (대규모 문서 데이터 집합에서 Q&A를 위한 질의문 분류 기법)

  • 엄재홍;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.253-255
    • /
    • 2000
  • 어떠한 질문에 대한 구체적 해답을 얻고 싶은 경우, 일반적인 정보 검색이 가지는 문제점은 검색 결과가 사용자가 찾고자 하는 답이라 하기 보다는 해답을 포함하는(또는 포함하지 않는) 문서의 집합이라는 점이다. 사용자가 후보문서를 모두 읽을 필요 없이 빠르게 원하는 정보를 얻기 위해서는 검색의 결과로 문서집합을 제시하기 보다는 실제 원하는 답을 제공하는 시스템의 필요성이 대두된다. 이를 위해 기존의 TF-IDF(Term Frequency-Inversed Document Frequency)기반의 정보검색의 방삭에 자연언어처리(Natural Language Processing)를 이용한 질문의 분류와 문서의 사전 표지(Tagging)를 사용할 수 있다. 본 연구에서는 매년 NIST(National Institute of Standards & Technology)와 DARPA(Defense Advanced Research Projects Agency)주관으로 열리는 TREC(Text REtrieval Conference)중 1999년에 열린 TREC-8의 사용자의 질문(Question)에 대한 답(Answer)을 찾는 ‘Question & Answer’문제의 실험 환경에서 질문을 특징별로 분류하고 검색 대상의 문서에 대한 사전 표지를 이용한 정보검색 시스템으로 사용자의 질문(Question)에 대한 해답을 보다 정확하고 효율적으로 제시할 수 있음을 실험을 통하여 보인다.

  • PDF

Expansion of Surface Text Patterns for Long-Distance Dependency (장거리 의존 문제를 해결하기 위한 표층 텍스트 패턴의 확장)

  • Lee, Mee-Yeon;Cha, Jeong-Won;Park, Seung-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.138-144
    • /
    • 2004
  • 본 논문에서는 질의 응답 시스템에서 정답 추출을 위해 사용되는 표층 텍스트 패턴을 장거리 의존 문제에도 적용 가능하도록 확장하는 방법을 제안한다. 기존의 패턴 추출 시스템들의 패턴을 구성하고 있는 단어들간의 연속성과 불연속성에 대한 정보를 나타내도록 패턴 형태를 확장함으로써 장거리 의존 문제를 해결한다. 본 논문에서 제안한 형태의 패턴을 TREC-10의 질의를 이용해서 웹 데이터로 실험하여 정확도와 TREC의 평가 기준인 MRR을 사용해서 기존 시스템들과 성능을 비교했다.

  • PDF

A Wikipedia-based Query Expansion Method for In-depth Blog Distillation (주제를 깊이 있게 다루는 블로그 피드 검색을 위한 위키피디아 기반 질의 확장 방법)

  • Song, Woo-Sang;Lee, Ye-Ha;Lee, Jong-Hyeok;Yang, Gi-Joo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.11
    • /
    • pp.1121-1125
    • /
    • 2010
  • This paper proposes a Wikipedia-based feedback method for in-depth blog distillation whose goal is to find blogs that represent in-depth thoughts or analysis on a given query. The proposed method uses Wikipedia articles which are relevant to the query. TREC Blogs08 collection which is a large-scale blog corpus and English Wikipedia dump were used for experiments, The proposed method significantly increased the retrieval performance including MAP over the conventional post based feedback method.

Semantic Query Expansion based on a Question Category Concept List in QA system (질의 응답 시스템에서 질의 카테고리별 개념리스트 구축에 기반한 의미적 질의 확장)

  • 김혜정;강보영;박성배;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.178-180
    • /
    • 2004
  • 질의 응답(Question Answering) 시스템은 질의에서 요구하는 정답 유형(Answer tyype) 및 질의에 사용된 용어를 적용하여 보다 정확한 답을 추출하고자 한다. 그러나 질의에 사용된 용어들이 문서의 정답문장에 그대로 사용되지 않고 같은 의미의 다른 어휘로 출현하기도 하며, 혹은 다른 문법적 정보를 가진 카테고리로 등장하여 정답 추출에 어려움이 따른다. 따라서, 본 논문은 질의별 카테고리 개념 리스트를 구축하여 효과적인 의미적 질의 확장 방법론을 제안한다. 제안된 방법은 먼저 질문 문장의 패턴 린 질의 정보 유형을 파악하여 질의 카테고리 및 카테고리별 개념 리스트를 구축한다. 그런 후 구축된 질의 개념 카테고리 및 리스트를 활용하여 질의 유형을 학습하고, 새로운 질의가 입력되면 해당 개념 카테고리로 분류한 후, 개념 리스트를 기반으로 개념별 질의 확장을 수행한다. 제안된 시스템의 성능 명가를 위하여, TREC-9의 질의와 TREC 문서 중 1991년도 WSJ(Wall Street Journal) 42,654건을 대상으로 실험한 결과 질의 확장을 수행하지 않는 시스템의 경우 MRR(Mean reciprocal ratio) 측정에서 0.223의 결과를 보인 반면 제안된 시스템의 경우 0.50의 향상된 결과를 보였다.

  • PDF

Modeling Sedimentation Process in Ipjang Reservoir using SWAT and EFDC (SWAT-EFDC 연계 모델링을 통한 입장저수지의 유사 해석)

  • Shin, Sat Byeol;Hwang, Soon-Ho;Her, Younggu;Song, Jung Hun;Kim, Hak Kwan;Kang, Moon Seong
    • Journal of The Korean Society of Agricultural Engineers
    • /
    • v.60 no.3
    • /
    • pp.135-148
    • /
    • 2018
  • Reservoir sedimentation is a major environmental issue, and various sediment load controls and plans have been proposed to secure clean and safe water resources. The objectives of this study were to estimate soil loss in the upper basins and predict sediment deposition in Ipjang reservoir using hydrologic and hydraulic model. To do so, SWAT (Soil and Water Assessment Tool) and EFDC (Environmental Fluid Dynamics Code) was used to estimate soil loss in two upper basins and to predict spatial distribution and amount of sediment deposition in the Ipjang reservoir, respectively. The hydrologic modeling results showed that annual average soil loss from the upper basins was 500 ton. The hydraulic modeling results demonstrated that sediment particles transported to the reservoir were mostly trapped in the vicinity of the reservoir inlet and then moved toward the bank over time. If long-term water quality monitoring and sediment survey are performed, this study can be used as a tool for predicting the dredging amount, dredging location and proper dredging cycle in the reservoir. The study findings are expected to be used as a basis to establish management solutions for sediment reduction.