• Title/Summary/Keyword: 중요어

Search Result 864, Processing Time 0.034 seconds

Improving Performance of Web Search Engine using Query Word Senses and User Feedback (질의어 의미정보와 사용자 피드백을 이용한 웹 검색엔진의 성능향상)

  • Yoon, Sung-Hee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.8 no.2
    • /
    • pp.280-285
    • /
    • 2007
  • This paper proposes a technique improving performance using word senses and user feedback in web information retrieval, compared with the retrieval based on ambiguous user query and index. Disambiguation using word senses is very important processing for improving performance by eliminating the irrelevant pages from the result. According to semantic categories of nouns which are used as index for retrieval, we build the word sense knowledge-base and categorize the web pages. It can improve the performance of retrieval system with user feedback deciding the query sense and information seeking behavior to web pages.

  • PDF

Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model (확률적 정보 검색 모델에서의 유사 적합성 피드백 실험)

  • Cho, Bong-Hyun;Lee, Chang-Kee;An, Joo-Hui;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

Implementation of Word Sense Disambiguation System based on Korean WordNet (한국어 어휘의미망에 기반을 둔 어의 중의성 해소 시스템의 구현)

  • Kim, Minho;Hwang, Myeong-Jin;Shin, Jong-Hun;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.96-102
    • /
    • 2008
  • 자연언어처리에서 어휘의 의미를 구분하는 것은 기계번역이나 정보검색과 같은 여러 응용 분야에서 매우 중요한 역할을 한다. 국내에서도 여러 어의 중의성 해소 시스템이 소개되었으나 대부분 시스템이 의미 부착 말뭉치를 이용한 감독 학습 방식을 기반으로 두고 있다. 본 논문은 한국어 어휘의미망을 이용한 비감독 어의 중의성 해소 시스템을 소개한다. 일반적으로 감독어의 중의성 해소 시스템은 비감독 어의 중의성 해소 시스템보다 성능은 좋으나 대규모의 의미 부착 말뭉치가 있어야 한다. 그러나 본 시스템은 한국어 어휘의미망과 의미 미부착 말뭉치에서 추출한 어휘 통계정보를 이용해, 의미 부착 말뭉치에서 추출한 의미별 통계 정보를 이용하는 감독 중의성 해소 방법과 같은 효과를 낸다. 본 시스템과 타 시스템의 성능 비교를 위해 'SENSEVAL-2' 평가 대회의 한국어 평가 데이터를 이용하였다. 실험 결과는 추출된 통계 정보를 바탕으로 우도비를 이용하였을 때 정확도 72.09%, 관계어 가중치를 추가로 이용하였을 때 정확도 77.02%로 감독 중의성 해소 시스템보다 높은 성능을 보였다.

  • PDF

Study of Feature Extraction Algorithm for Harmful word Filtering (유해어 필터링을 위한 자질어 추출 알고리즘에 관한 연구)

  • Jeong Jung-Hoon;Lee Won-Hee;Lee Shin-Won;An Don-Gun;Chung Sung-Jong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.7-9
    • /
    • 2006
  • 유해 정보란 정보의 홍수 속에서 무차별적으로 제공되는 음란, 폭력 등의 내용을 담고 있는 정보를 말한다. 이러한 유해 정보들로부터 청소년 등 사회적으로 보호를 받아야 할 인터넷 이용자들을 보호하기 위한 장치가 필요하다. 현재 다양한 방법이 제안되고 연구되고 있다. 본 연구에서는 유해 문서의 필터링을 기법 중 키워드 필터링에서 사용되는 유해어 사전을 위한 자질어 추출 알고리즘에 대해서 비교/연구하였다. 키워드 필터링에서 자질어는 필터링의 성능에 많은 영향을 미친다. 따라서 필터링의 성능을 높이기 위한 자질어 추출 알고리즘 선택은 매우 중요하다. 이에 본 논문에서는 다양한 알고리즘을 비교 분석하여 정확하고 효율적인 자질어 추출 알고리즘 조합을 찾고자 하였다. 그 결과 CHI/TF-IDF 조합이 높은 성능을 보였으며 92%의 정확도를 얻을 수 있었다.

  • PDF

Discourse Analysis for Robust Spoken Dialogue System (강건한 음성 대화 시스템을 위한 담화분석 기술)

  • Lee, Chung-Hee;Jang, Myung-Gil;Oh, Hyo-Jung;Seo, Young-Hoon
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.10
    • /
    • pp.1005-1009
    • /
    • 2010
  • Elliptical and anaphoric utterances occur frequently during spoken dialogue. Because discourse analysis rests on the basic premise that linguistic items cannot be understood without reference to the context, ellipsis and anaphora resolution plays an important role in discourse analysis. In this paper, we present a spoken dialogue system improving the robustness at dialogue level based on discourse analysis, such as anaphora and ellipsis resolution. The applicability and effectiveness of the proposed method is evaluated in the TV domain.

Analysis of Fishway Location change and Fishway Efficiency Using River2D Model (River2D 모형을 이용한 어도 위치 수정 및 어도 이용효율 분석)

  • Lee, Jeong Min;Ku, Young Hun;Baek, Kyong Oh;Kim, Young Do
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.64-64
    • /
    • 2017
  • 본 연구에서는 낙동강에 위치한 강정고령보에 설치된 자연형 어도의 유인효율 증대를 위한 어도의 위치 수정 제시를 하였다. 평면 2차원 물리서식처 모형인 River2D 모형을 통해 강정고령보의 자연형어도 입구부의 유속장과 WUA(Weighted Usable Area)를 이용하여 유인효율을 분석 실시하였다. 유인효율 분석 결과 자료와 2013년도 어류모니터링 자료를 통해 WUA는 어류 유인효율 평가하는 지수로 사용 될 수 있는 것을 간접적으로 검증하였다. 어류의 소상에는 유속이 중요한 인자로 작용한다. 모의를 통한 강정고령보의 유속장을 확인해보면 자연형어도가 설치된 좌안과는 반대로 우안쪽으로 형성되는 것을 확인하였다. 어도의 모양 및 위치를 수정한 지형자료를 이용하여 River2D 모형모의를 통한 어도의 유인효율을 증대 시킬 수 있는 방법을 제시하였다. 유속장이 주로 발생하는 보 우안쪽에 설치하는 것이 유인효율을 최대로 끌어낼 수 있었지만 비용적인 부분과 유인효율을 같이 생각한다면 현재 설치된 좌안 자연형어도의 입구부를 상류쪽으로 위치하여 재설치하는 것이 어류의 유인효율을 증대시켜주는 효과적인 제시방안이 되리라 사료 된다.

  • PDF

Measurement Velocity at the Fishway Entrance Applying LS-PIV Technique (LS-PIV 기법을 적용한 어도 입구부 유속측정)

  • Kang, Nam Hyeok;Jeong, Kyu Dong;Park, Yong Sung;Kim, Young Do
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.474-474
    • /
    • 2017
  • 대하천 사업 이후 국내에서 경험하지 못한 대규모 다기능 보가 설치되었으며, 이로 인해 기존 하천에 서식하던 어류들의 군집, 이동 및 환경의 변화가 발생할 수 있으며, 산란을 위해 상류로 이동하거나 하류로 이동하려는 어류들에게는 상당히 큰 문제를 야기할 수 있다. 이러한 문제점들을 최소화하기 위해 다기능 보에는 대규모 어도가 설치되었으며, 다양한 흐름해석 모형을 이용하여 어도의 유인효율평가에 대한 연구가 이루어지고 있으나 이를 검증할 수 있는 실험적 연구는 부족한 실정이다. 어도의 유인효율평가에 있어 어도입구부 유속장 측정이 중요하다. 하지만 어도 입구부에 대한 접근성은 용이하지 못 할 뿐만 아니라, 기존에 사용하던 ADCP 장비로는 유속장 측정에 한계가 있다. 이를 극복하기 위해 드론영상을 활용한 LS-PIV기법과 GPS전자부자를 활용할 필요가 있다고 판단하였고, GPS전자부자를 어도 입구부에서 일정시간 유하시키는 동시에 드론영상촬영을 활용해 LS-PIV기법을 적용하여 유속을 측정하였다. 그 결과 LS-PIV기법을 적용한 실험이 주 흐름영역에서 안정적인 결과를 보였다. 본 실험 결과를 통해 새로운 유속 계측 방안을 보여줌으로써 접근성 및 안전성에 대한 효율적인 실험계측 방법을 제시하리라 사료된다.

  • PDF

Numerical simulation of flow developed by a sequence of lateral obstacles (연속적으로 배치된 횡단 구조물 주변 흐름 수치모의)

  • Kim, Hyung Suk
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.237-237
    • /
    • 2022
  • 우리나라 하천 내에 설치된 횡단구조물은 보 35,000개소 이상으로 전국 하천의 0.6 km마다 수공구조물이 위치해 있으며 이로 인해 종적(longitudinal) 연결성에 영향을 미치는 것으로 나타났다. 농어촌연구원의 조사에 따르면 하천 횡단구조물이 설치된 구간에 어도 설치율은 14.9%로 나타났으며 이는 수생태 관점에서 연속성이 매우 열악한 상태임을 확인 할 수 있다. 이에 우리나라 각 부처 국토교통부, 환경부 등에서는 수생태 연속성을 확보하고자하는 노력이 지속되고 있으며 대표적으로 어류의 이동통로인 어도를 설치하거나 기존 어도의 효율을 향상시키기 위하여 개보수 작업을 지속적으로 실시하고 있다. 어도의 기능을 평가하기 위해서는 어도 내의 수리특성을 정확히 파악하는 것이 중요한데 연속적인 구조물로 구성된 어도 내 흐름은 매우 복잡하다. 특히 어도 내 구조물간 상호작용에 의하여 비정상 흐름이 발생하며 구조물 뒤에서는 사수역(dead zone)이 형성된다. 사수역에서 나타나는 와류의 거동은 구조물의 기하학적 특성에 따라 변화한다. 본 연구에서는 2차원 수심적분 수치모형을 활용하였으며 벽면 근처 점성저층의 유속분포을 재현하기 위하여와 점성항에 감쇠함수(damping function)를 고려하였다. 수치모형의 검증을 위해 실내 실험수로의 직선 개수로에서 PIV(particle image velocimetry)를 활용하여 연속적으로 배치된 구조물에 의한 유속자료를 활용하였다. 이 결과는 향후 새로운 어도설계 혹은 기 설치된 어도의 수리학적 기능을 평가하는데 활용이 가능할 것으로 보인다.

  • PDF

Children's Play Facilities according to the Classification of Amusement Features (놀이속성 분류에 따른 적정 어린이 놀이시설물 연구)

  • Jeong, Kil-Taek;Shin, Min-Ji;Shin, Ji-Hoon
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.46 no.1
    • /
    • pp.29-37
    • /
    • 2018
  • This study intends to derive play attribute words to describe the nature of play by analyzing the correlation between play facilities and play attribute words. To investigate play attributes at playing facilities and supplement areas of weakness can provide a balanced play environment. Play attributes words were compiled via a literature review and the importance of each play attributes word was surveyed by experts. The keywords explaining play derived from news articles and references are defined as play attributes words. These words were classified into six broad categories and twenty-six sub-categories. The importance of major play attribute words show: Communication (0.268%) > Imagination (0.201%) > Amusement (0.190%) > Development (0.167%) > Learning (0.108%) > Intelligence (0.067%). Experts have recognized the most important elements are communication and imagination. Each play attribute associated with an amusement facility was separately identified in the amusement facilities installed in 114 children's parks in Seoul. Of the play attribute words, the amusement facilities at Seoul's Children's Park reflected a high frequency in 'development'. Furthermore, the importance of major playing attribute words such as 'Communication' and 'Imagination' were not fully reflected in cognitive play facilities. Therefore, it was judged that there is a need to actively introduce these attributes. This study proposed future improvements by determining weaknesses of amusement facilities in children's parks and analyzing the features and functions of play so as to suggest future improvements.

Web Search Personalization based on Preferences for Page Features (문서 특성에 대한 선호도 기반 웹 검색 개인화)

  • Lee, Soo-Jung
    • Journal of The Korean Association of Information Education
    • /
    • v.15 no.2
    • /
    • pp.219-226
    • /
    • 2011
  • Web personalization has focused on extracting web pages interesting to users, to help users searching wanted information efficiently on the web. One of the main methods to achieve this is by using queries, links and users' preferred words in the pages. In this study, we surveyed from the web users the features of pages that are considered important to themselves in selecting web pages. The survey results showed that the content of the pages is the most important. However, images and readability of the page are rated as high as the content for some users. Based on this result, we present a method for maintaining relative weights of major page features differently in the profile for each user, which is used for personalizing web search results. Performance of the proposed personalization method is analyzed to prove its superiority such that it yields as much as 1.5 times higher rate than the system utilizing both queries and preferred words and about 2.3 times higher rate than a generic search engine.

  • PDF