• Title/Summary/Keyword: 수식 검색

Search Result 36, Processing Time 0.022 seconds

Performance Improvement of Mathematical Formula Retrieval Using Two Different Kinds of Embedding (두 종류의 임베딩을 이용한 수식 검색 성능 개선)

  • Yang, Seon;Kim, Hyemin;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.616-618
    • /
    • 2018
  • 본 연구에서는 한글 질의어를 이용하여 MathML이라는 마크업 언어 형태로 저장된 수식을 검색하는 수식 검색 시스템을 제안하는데, 마크업 형태 자체에 대한 임베딩과 수식을 한글화 한 후의 임베딩이라는 두 가지 서로 다른 임베딩 결과를 이용하여 검색 성능을 향상시키는 것을 목표로 한다. 최근 자연어 처리의 많은 과제에서 임베딩은 거의 필수적으로 사용되고 있는데, 본 실험을 통해 자연어 문서가 아닌 마크업 형태 수식을 대상으로도 임베딩 사용이 성능 개선에 효과가 있음을 확인할 수 있다. 검색 환경을 실제와 유사하게 설정하기 위하여, 본 실험에서 사용하는 데이터에는 실험을 위해 수기로 작성된 수식들 외에도 실제 웹에서 가져온 여러 분야의 수많은 수식들이 포함된다. Indri 시스템을 이용하여 검색 실험을 수행한 결과, 임베딩을 활용하여 수식을 확장한 경우 수식 확장 이전에 비해 MRR 기준 4.8%p의 성능 향상을 확인할 수 있었다.

  • PDF

An Equation Retrieval System Based on Weighted Sum of Heterogenous Indexing Terms (이질적 색인어의 가중치 합에 기반한 수식 검색 시스템)

  • Shin, Jun-Soo;Kim, Hark-Soo
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.10
    • /
    • pp.745-750
    • /
    • 2010
  • To effectively retrieve mathematical documents including various equations, mathaware search engines are needed. In this paper, we propose a equation retrieval system which helps users effectively search structurally similar equations. The proposed system disassembles MathML equations into three types of heterogeneous indexing terms; operators, variables, and partial structures of equations. Then, it independently indexes the disassembled terms. When a user inputs a MathML equation, the proposed system searches and ranks equations using weighted sums of three language models for the heterogeneous indexing terms. In the experiments with 244,744 MathML equations, three proposed system showed reliable performances (a P@1 of 53% in the closed test and a P@1 of 63% in the open test).

Search Ranking System Using Modification Relation and Improved Search Engine Interface to Enhance Search Experience (수식 관계를 이용한 검색 결과 랭킹 시스템과 향상된 검색 엔진 인터페이스를 통한 검색 과정의 효율성 향상)

  • Moon, Ukseong;Choi, Joo-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.250-253
    • /
    • 2007
  • 본 논문에서는 현재 검색 엔진의 랭킹 방식의 문제점과 인터페이스의 문제점을 해결하기 위하여 노력하였다. 기존의 페이지간 링크와 같은 부가적 정보를 이용한 인기도 기반 랭킹의 문제점을 단어간의 수식 관계를 이용한 의미 기반 랭킹 알고리즘의 제시를 통해 해결하였다. 또한 검색어와 연관된 단어를 수식 관계를 이용하 계산, 시각화하여 제공함으로써 사용자가 잘못된 검색어로 검색을 시작하였더라도 항상 올바른 검색 결과를 얻을 수 있도록 도왔으며 각 검색 결과와 함께 원문을 요약해 제공함으로써 검색 결과를 일일이 클릭해 보지 않고도 내용을 쉽게 유추할 수 있도록 도왔다.

  • PDF

Keyword Extraction Using Modifying Relation to Improve Search Experience (수식 관계를 이용한 키워드 추출을 통한 검색 과정의 효율성 향상)

  • Moon, Uk-Seong;Lee, Sheen-Mok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.228-232
    • /
    • 2007
  • 정보화 시대에 방대한 양의 정보에서 필요한 정보를 효율적으로 찾아내는 것은 그 무엇보다도 중요하다. 이를 위해 많은 검색 엔진이 효율적인 검색 결과 제공을 위해 노력하고 있지만 그 인터페이스의 문제로 인하여 사용자가 검색결과를 효율적으로 받아들이기 어려우며 또한 원하는 정보를 검색하기 위해서는 일정 수준 이상의 검색 능력을 필요로 한다. 이 논문에서는 기존의 검색 엔진의 인터페이스 변경을 통하여 시각적인 연관성 정보를 제공하며 이를 통해 사용자가 검색 능력에 구애받지 않고 정확한 답을 얻을 수 있도록 유도한다. 또한 이 과정에서 기존의 키워드 추출 알고리즘의 문제점을 발견하여 이를 단어간의 수식 관계를 이용하여 해결하였다. 또한 단어간의 수식 관계를 이용하여 효율적으로 문서간의 연관성을 생성할 수 있는 알고리즘을 제시하였다.

  • PDF

Query-Based Automatic Text Summarization Using MMR (MMR을 이용한 질의기반 자동 문서요약)

  • Kim, Gum-Young;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.615-618
    • /
    • 2002
  • 정보검색 엔진들은 주어진 질의에 대해 방대한 양의 문서들을 검색해주며, 이 문서들은 질의와의 관련성에 따라 랭킹(Ranting)된다. 질색된 문서들중에 어떤것들은 그 내용이 서로 유사하여 사용자에게 필요 이상의 정보를 제공한다. 이는 질의와의 관련성(Relevance)만을 적용하고, 검색된 정보들간의 차별성을 고려하지 않은데서 비롯된다. MMR(Maximal Marginal Relevance)은 유사한 문서를 검색결과에서 배제할 수 있게 해주는 기법이다. MMR을 자동에 적용하면, 유사한 문장을 배제하여 상이한 정보들을 전달하는 질 높은 요약문을 생성할 수 있다. 본 논문에서는 MMR을 이용한 질의기반 자동 문서요약 시스템을 구현한다. 또한, MMR과 가중치 수식에 다양한 수치를 적용하고, 최적의 결과를 산출하는 수식을 제안한다.

  • PDF

Subtopic Mining from the View of Dependency Structure (의존 구문 구조 관점으로 본 서브토픽 마이닝)

  • Kim, Se-Jong;Lee, Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.294-296
    • /
    • 2012
  • 본 논문은 일본어 웹 문서 말뭉치로부터 의존 구문 구조 관점으로 바라본 단어들의 동시발생(co-occurrence) 정보를 사용하여 서브토픽 마이닝(subtopic mining)을 수행하는 방법론을 제안한다. 우리는 의존 구문 구조를 반영하는 간단한 패턴들을 사용하여 서브토픽들을 추출 및 생성하고, 제안한 수식을 바탕으로 순위화한다. 본 방법론은 기존의 주요 상용 검색 서비스에서 제공하는 연관 검색어 및 추천 검색어를 사용한 방법론보다 좋은 성능을 보였다.

An Improvement of Mathematics Course Using MathML in ICT Environment (MathML을 이용한 수학교과 ICT활용 교육 개선방안)

  • Hong, Eun-Pyo;Lee, Su-Hyun
    • Journal of The Korean Association of Information Education
    • /
    • v.7 no.1
    • /
    • pp.11-26
    • /
    • 2003
  • Although many mathematical teaching/learning materials are already developed in the web, diverse utilization of this materials such as calculation, searching, or reusing of expressions are limited since the expression is actually a figure. To cope with this, MathML which describing mathematical notation was developed. In the paper, we proposed the methods of developing teaching materials using MathML, making learning assistance tools which utilize MathML, and applying MathML to information exchange community for Mathematics courses in ICT environment. Using MathML to develop a teaching material makes easy to correct and reuse the mathematical notations conveniently. Furthermore, learning assistance tools made by placing MathML help teachers reorganize and utilize these materials in the classroom as well as enhancing the connection between mathematical notations and concepts. The web-board that can make a use the mathematical notations using MathML enables the teachers and students to exchange information actively. It also helps to fulfill different types of teaching using ICT such as "discussion on the web".

  • PDF

Optimization Algorithm of Skip Factor using the Statistics of Scene Change (장면 전환 특성을 이용한 동영상 검색 감격의 최적화 알고리듬)

  • 하명환;나윤정;이상길
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1998.06a
    • /
    • pp.147-155
    • /
    • 1998
  • 장면 전환 검출 알고리듬은 매 프레임마다 프레임간의 밝기차나 히스트그램 차이를 계산하므로 계산량이 많으며, 검출 속도 또한 느리게 된다. 검색 속도의 향상을 위해 시간적 표본화 방법이 제안되었으나, 적절한 검색 간격을 선택하는 어떠한 기준이나 방법도 제시되지 않았으며, 따라서 검색 간격을 경험에 의해 선택할 수밖에 없었다. 이 논문에서는 동영상의 통계적, 특성, 장면 전환 검색 간격과 장면 전환 검출 시간의 관계를 수식으로 유도하고 실험으로 확인하였다. 또한 최적의 표본화 간격을 유도된 식으로부터 구하고, 동영상의 평균 장면 전환 간격과 관계함을 보였다. 평균 장면 전환 간격이 알려져 있지 않은 동영상에 대해서 최적 검색 간격을 추정할 수 있는 알고리듬을 제안하였다.

  • PDF

Mathematical Equation Retrieval by Converting Plaintext Queries into MathML Terms (평문 질의어 MathML 용어 변환을 이용한 수학식 검색)

  • Lee, Jun-Young;Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.312-314
    • /
    • 2012
  • 본 논문은 한글로 입력된 질의어를 이용하여 웹상의 MathML (Mathematical Markup Language) 수학식을 검색하는 시스템을 제안한다. 웹상의 수학식은 과거 이미지를 이용하여 표현되는 경우가 많았지만, 현재는 대부분 MathML과 같은 수학식 표현 마크업 언어로 작성되고 있다. 그러나 이러한 수학식을 검색하기 위해서는 해당 언어를 알고 있거나 수식 입력 툴을 이용해야 하는 경우가 대부분이기 때문에, 일반 사용자들이 수학식 검색을 하는 데에는 제약점이 따랐다. 본 연구에서는 사용자들이 전통적인 검색 방법을 이용하여 특정 마크업 언어가 아닌 일반 평문으로 작성된 질의어를 입력하여 수학식을 검색 가능 하도록 하기 위해, 평문 질의어를 MathML 표현으로 변환시키는 방법을 사용한다. 질의어로 입력될 수 있는 다양한 수학식 표현을 미리 구축한 사전을 이용하여 MathML 표현으로 변환하는 간결한 기법만으로도 MRR 0.495 의 높은 성능을 얻을 수 있었다.

A Study on Use of Search Data for Evaluation of Business Idea Attractiveness (사업 아이디어 매력도 평가를 위한 검색 데이터 활용에 관한 연구)

  • Shim, Jae-Hu;Choi, Myeong-Gil
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.12a
    • /
    • pp.8-11
    • /
    • 2009
  • 성공적인 창업을 위해서는 창업가의 준비가 선행되어야 하지만, 매력적인 사업 아이디어의 계발이 뒤따라야 한다. 그러나 지금까지의 창업연구는 창업행동과 사업성과에 영향을 미치는 창업가 요인에 치우쳐 있으며, 사업 아이디어의 계발과 평가에 대한 연구는 부족한 실정이다. 이 연구는 고객이 상품을 구매하기 전 인터넷 검색엔진에서 해당 상품에 대한 검색을 하는 경우가 일반화되고 있다는 사실과 고객이 검색엔진에 입력하는 키워드는 고객의 의도를 대변한다는 사실을 기초로, 키워드로 표현된 사업 아이디어의 매력도를 객관적으로 측정하는 방법을 제시하는 것을 목적으로 한다.이 연구는 키워드로 표현된 사업 아이디어 매력도(BIA)를 구매의도를 가진 잠재고객의 자사 웹 사이트 방문수로 정의한다. 키워드로 표현된 사업 아이디어 매력도(BIA)는 [해당 키워드의 조회수(Q) ${\times}$ 구매의도 비율(R) / 경쟁 사이트의 수(S)]의 수식으로 나타낼 수 있으며, 수식을 구성하는 변수 중에서 해당 키워드의 조회수(Q)와 경쟁 사이트의 수(S)는 검색엔진에서 쉽게 제공 받을 수 있으므로, 구매의도 비율(R)만 알 수 있다면 BIA를 비교적 정확히 추정할 수 있다. 연구자는 특정 분야 키워드 100개를 선정한 다음, 전문가로 하여금 각 키워드의 구매의도 비율(R)을 추정하게 하고, 전문가 추정 없이도 구매의도 비율을 예측할 수 있도록 각 키워드의 구매의도 비율(R)을 예측하는 주요 데이터를 의사결정 나무 기법으로 도출하고, 의사결정 나무 기법으로 도출된 데이터로 구성된 회귀식을 제시함으로써 키워드로 표현된 사업 아이디어 매력도(BIA)를 객관적으로 평가하는 방법을 제시한다. 이 연구는 사업 아이디어의 계발과 평가에 대한 객관적인 기준을 제시함으로써 창업의 성공률을 높이는 데 기여할 수 있고, 창업연구에 새로운 방법론을 도입했다는 점에서 의의가있다.

  • PDF