• Title/Summary/Keyword: TREC

Search Result 83, Processing Time 0.023 seconds

Query Expansion based on Word Graph using Term Proximity (질의 어휘와의 근접도를 반영한 단어 그래프 기반 질의 확장)

  • Jang, Kye-Hun;Lee, Kyung-Soon
    • The KIPS Transactions:PartB
    • /
    • v.19B no.1
    • /
    • pp.37-42
    • /
    • 2012
  • The pseudo relevance feedback suggests that frequent words at the top documents are related to initial query. However, the main drawback associated with the term frequency method is the fact that it relies on feature independence, and disregards any dependencies that may exist between words in the text. In this paper, we propose query expansion based on word graph using term proximity. It supplements term frequency method. On TREC WT10g test collection, experimental results in MAP(Mean Average Precision) show that the proposed method achieved 6.4% improvement over language model.

Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model (확률적 정보 검색 모델에서의 유사 적합성 피드백 실험)

  • Cho, Bong-Hyun;Lee, Chang-Kee;An, Joo-Hui;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

Analysis of the Applicability of Very Shortterm Rainfall Forecasts to Rainfall-Runoff Model (Radar를 이용한 초단시간 강우예측자료의 강우-유출 모형 적용성 분석)

  • Kim, Gwang-Seob;Kim, Jong-Pil;Bae, Dong-Jun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1896-1899
    • /
    • 2007
  • 우리나라의 태풍과 국지성 집중호우로 인한 풍수해 빈도는 점진적으로 증가하고 이와 관련된 인명 및 재산 피해 또한 증가하고 있는 실정이다. 피해저감을 위해 정확한 강우의 이동방향 및 강우량 예측은 절실하며 이를 토대로 한 유역의 강우-유출 분석이 필요하다. 본 연구에서는 강우의 이동방향과 2차원 면적강우량을 예측하기 위한 방법으로 TREC(Tracking Radar Echoes by Correlation) 기법과 실시간 Z-R 관계식을 이용하였다. 예측된 면적강우량의 강우-유출 모의에 대한 적용성을 분석하기 위하여 분포형 수문모형을 선정하여 분석하였다. 단시간 강우예측자료의 적용성을 검정하기 위하여 대상유역으로 중랑천유역을 선정하였으며 대상유역의 조도계수, 수로폭, 경사등과 같은 GIS 입력자료를 구축하였다. 검정을 위하여 중랑교 수위관측지점의 관측 수위 및 유량에 대한 분포형 강우-유출 모형의 계산 유량을 비교 분석하였다. 대상 강우사상은 2003년 9월 11일 00시에서 13일 00시까지 태풍 "매미"가 중랑천에 영향을 미친 기간을 선정하였다. 실시간 Z-R 관계식에 의한 비 예측 강우자료를 이용한 강우-유출 결과와 예측 강우에 대한 강우-유출 결과를 이용하여 단시간 강우예측의 강우-유출 모형 적용성을 분석하였다.

  • PDF

MetaSearch for Entry Page Finding Task (엔트리 페이지 검색을 위한 메타 검색)

  • Kang In-Ho
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.215-222
    • /
    • 2005
  • In this paper, a MetaSearch algorithm for navigational queries is presented. Previous MetaSearch algorithms focused on informational queries. They Eave a high score to an overlapped document. However, the overemphasis of overlapped documents may degrade the performance of a MetaSearch algerian for a navigational query. However, if a lot of result documents are from a certain domain or a directory, then we can assume the importance of the domain or directory. Various experiments are conducted to show the effectiveness of overlap of a domain and directory names. System results from TREC and commercial search engines are used for experiments. From the results of experiments, the overlap of documents showed the better performance for informational queries. However, the overlap of domain names and directory names showed the $10\%$ higher performance for navigational queries.

Spam Filter by Using X2 Statistics and Support Vector Machines (카이제곱 통계량과 지지벡터기계를 이용한 스팸메일 필터)

  • Lee, Song-Wook
    • The KIPS Transactions:PartB
    • /
    • v.17B no.3
    • /
    • pp.249-254
    • /
    • 2010
  • We propose an automatic spam filter for e-mail data using Support Vector Machines(SVM). We use a lexical form of a word and its part of speech(POS) tags as features and select features by chi square statistics. We represent each feature by TF(text frequency), TF-IDF, and binary weight for experiments. After training SVM with the selected features, SVM classifies each e-mail as spam or not. In experiment, the selected features improve the performance of our system and we acquired overall 98.9% of accuracy with TREC05-p1 spam corpus.

Semantic Query Expansion based on Concept Coverage of a Deep Question Category in QA systems (질의 응답 시스템에서 심층적 질의 카테고리의 개념 커버리지에 기반한 의미적 질의 확장)

  • Kim Hae-Jung;Kang Bo-Yeong;Lee Sang-Jo
    • Journal of KIISE:Databases
    • /
    • v.32 no.3
    • /
    • pp.297-303
    • /
    • 2005
  • When confronted with a query, question answering systems endeavor to extract the most exact answers possible by determining the answer type that fits with the key terms used in the query. However, the efficacy of such systems is limited by the fact that the terms used in a query may be in a syntactic form different to that of the same words in a document. In this paper, we present an efficient semantic query expansion methodology based on a question category concept list comprised of terms that are semantically close to terms used in a query. The semantically close terms of a term in a query may be hypernyms, synonyms, or terms in a different syntactic category. The proposed system constructs a concept list for each question type and then builds the concept list for each question category using a learning algorithm. In the question answering experiments on 42,654 Wall Street Journal documents of the TREC collection, the traditional system showed in 0.223 in MRR and the proposed system showed 0.50 superior to the traditional question answering system. The results of the present experiments suggest the promise of the proposed method.

Application of Very Short-Term Rainfall Forecasting to Urban Water Simulation using TREC Method (TREC기법을 이용한 초단기 레이더 강우예측의 도시유출 모의 적용)

  • Kim, Jong Pil;Yoon, Sun Kwon;Kim, Gwangseob;Moon, Young Il
    • Journal of Korea Water Resources Association
    • /
    • v.48 no.5
    • /
    • pp.409-423
    • /
    • 2015
  • In this study the very short-term rainfall forecasting and storm water forecasting using the weather radar data were implemented in an urban stream basin. As forecasting time increasing, the very short-term rainfall forecasting results show that the correlation coefficient was decreased and the root mean square error was increased and then the forecasting model accuracy was decreased. However, as a result of the correlation coefficient up to 60-minute forecasting time is maintained 0.5 or higher was obtained. As a result of storm water forecasting in an urban area, the reduction in peak flow and outflow volume with increasing forecasting time occurs, the peak time was analyzed that relatively matched. In the application of storm water forecasting by radar rainfall forecast, the errors has occurred that we determined some of the external factors. In the future, we believed to be necessary to perform that the continuous algorithm improvement such as simulation of rapid generation and disappearance phenomenon by precipitation echo, the improvement of extreme rainfall forecasting in urban areas, and the rainfall-runoff model parameter optimizations. The results of this study, not only urban stream basin, but also we obtained the observed data, and expand the real-time flood alarm system over the ungaged basins. In addition, it is possible to take advantage of development of as multi-sensor based very short-term rainfall forecasting technology.

Optimal Design of Stiffness of Torsion Spring Hinge Considering the Deployment Performance of Large Scale SAR Antenna (전개성능을 고려한 대형 전개형 SAR 안테나의 회전스프링 힌지의 강성 최적설계)

  • Kim, Dong-Yeon;Lim, Jae Hyuk;Jang, Tae-Seong;Cha, Won Ho;Lee, So-Jeong;Oh, Hyun-Ung;Kim, Kyung-Won
    • Journal of Aerospace System Engineering
    • /
    • v.13 no.3
    • /
    • pp.78-86
    • /
    • 2019
  • This paper describes the stiffness optimization of the torsion spring hinge of the large SAR antenna considering the deployment performance. A large SAR antenna is folded in a launch environment and then unfolded when performing a mission in orbit. Under these conditions, it is very important to find the proper stiffness of the torsion spring hinge so that the antenna panels can be deployed with minimal impact in a given time. If the torsion spring stiffness is high, a large impact load at the time of full deployment damages the structure. If it is weak, it cannot guarantee full deployment due to the deployment resistance. A multi-body dynamics analysis model was developed to solve this problem using RecurDyn and the development performance were predicted in terms of: development time, latching force, and torque margin through deployment analysis. In order to find the optimum torsion spring stiffness, the deployment performance was approximated by the response surface method (RSM) and the optimal design was performed to derive the appropriate stiffness value of the rotating springs.

생물학 도메인에서의 정보검색 : TREC의 Genomics Track을 중심으로

  • 송영인;한경수;김상범;임해창
    • Communications of the Korean Institute of Information Scientists and Engineers
    • /
    • v.22 no.4
    • /
    • pp.52-61
    • /
    • 2004
  • 생물학 분야에서 많은 과학적인 발견을 이루어내면서 그에 관한 온라인 데이터와 정보의 량도 증가하고 있다. 게놈 서열 분석 기술이 발전하고 유전자나 단백질의 구조 인식 지원 도구 등이 개발되면서, 생물학은 방대한 량의 정보를 다루어야 하는 데이터 집약적인 연구가 되었다. 이런 상황에서 지속적으로 증가하는 정보들에 어떻게 접근하고 또 그것을 어떻게 관리할 것인가가 생물학 연구자들에게는 큰 문제가 되었다. 이 문제를 극복하기 위해 생물학 도메인에서의 정보검색이 주목을 받고 있다.

Inference Network-Based Retrieval Model for Web Search Environment (웹 검색 환경에 적용할 추론 망 기반 검색모델)

  • 최익규;김민구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.19-21
    • /
    • 2001
  • 대다수의 사용자는 웹 검색에서 자신이 찾고자 하는 것을 표현할 때, 평균 2, 3개의 단어를 사용하고 있다. 벡터 모델이나 추론 망 모델에서 이런 질의 정보를 이용하여 좋은 결과를 얻기에는 몇 가지 어려움이 있다. 특히 추론 망 모델에서 많이 사용되는 유사도 계산식인 weighted-sum방법은 질의에 나타나는 단어의 수가 적고 많은 문서들이 이 단어들을 모두 가지고 있을 경우에 좋지 않은 검색결과를 보여주고 있다. 본 논문은 추론 망 모델에 적용되는 유사도 계산식인 weighted-sum방법을 개선하였고, 이를 기반으로 Web Trec 9의 자료를 검색하여 좋은 결과를 얻었다.

  • PDF