• Title/Summary/Keyword: 수식 한글화

Search Result 8, Processing Time 0.021 seconds

Performance Improvement of Mathematical Formula Retrieval Using Two Different Kinds of Embedding (두 종류의 임베딩을 이용한 수식 검색 성능 개선)

  • Yang, Seon;Kim, Hyemin;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.616-618
    • /
    • 2018
  • 본 연구에서는 한글 질의어를 이용하여 MathML이라는 마크업 언어 형태로 저장된 수식을 검색하는 수식 검색 시스템을 제안하는데, 마크업 형태 자체에 대한 임베딩과 수식을 한글화 한 후의 임베딩이라는 두 가지 서로 다른 임베딩 결과를 이용하여 검색 성능을 향상시키는 것을 목표로 한다. 최근 자연어 처리의 많은 과제에서 임베딩은 거의 필수적으로 사용되고 있는데, 본 실험을 통해 자연어 문서가 아닌 마크업 형태 수식을 대상으로도 임베딩 사용이 성능 개선에 효과가 있음을 확인할 수 있다. 검색 환경을 실제와 유사하게 설정하기 위하여, 본 실험에서 사용하는 데이터에는 실험을 위해 수기로 작성된 수식들 외에도 실제 웹에서 가져온 여러 분야의 수많은 수식들이 포함된다. Indri 시스템을 이용하여 검색 실험을 수행한 결과, 임베딩을 활용하여 수식을 확장한 경우 수식 확장 이전에 비해 MRR 기준 4.8%p의 성능 향상을 확인할 수 있었다.

  • PDF

A Study on the Speech Conversion Formulas for Domestic Audio Book Service (국내 음성 도서 서비스를 위한 수식의 음성변환 기법에 대한 연구)

  • Lee, Jae-Hwa;Lee, Jong-Woo;Lim, Soon-Bum
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06b
    • /
    • pp.226-227
    • /
    • 2011
  • 현재 국내의 음성도서 서비스는 수식을 정확하게 읽어주지 못하며, 수식을 읽기 위한 독음규칙의 부재로 수식의 음성 서비스에 혼란을 야기 시키고 있다. 이에 본 논문은 중학교 수학 교과서를 바탕으로 수식표현의 '한글 독음규칙'을 정의해보았으며, 수식의 국내 음성 서비스를 위해, 정의된 '한글 독음 규칙'을 매스 파스 트리(Math Parse tree)와 매핑 하여 최종적으로 음성서비스가 가능한 수식의 음성 변환 기법에 관해 연구하였다.

Implementation & Usability Evaluation of Math Expression Reader for Domestic Reading Disables (국내 독서장애인을 위한 Math Expression Reader의 구현 및 사용성 평가)

  • Lee, Jae-Hwa;Lee, Jong-Woo;Lim, Soon-Bum
    • Journal of Korea Multimedia Society
    • /
    • v.15 no.7
    • /
    • pp.951-961
    • /
    • 2012
  • E-books produced in the country provide limited audio service for reading disables. The reason is that those books cannot translate the mathematical expressions and symbols in the context. In this paper, the 'Math Expression Reader' was implemented that can translate the expressions and symbols in the document into Korean speech for those who have reading disabilities. The math to speech generated by this program has been tested to both the public and reading disables and the results of this test has been compared whether they can exactly understand the speech and evaluated the reading rules.

A Mathematical Equation Retrieval System Based on Formula Patterns Expressed in Korean (한글화된 수식 패턴을 이용한 수학식 검색 시스템)

  • Kim, Shin-Il;Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.233-236
    • /
    • 2011
  • 일반적인 문서에 대한 정보 검색 연구는 활발히 진행되고 있으며, 일상 생활 속에서도 대중화되어 많이 사용되고 있다. 이에 따라 음성, 이미지 검색 등 특정 분야의 검색에 대한 연구도 활발히 진행되고 있지만, 수학식 검색에 대한 연구는 비교적으로 미비한 실정이다. 수학식 검색과 관련된 연구들은 대부분 MathML (Mathematical Markup Language), TeX 등으로 작성된 수학식을 대상으로 진행되었지만, 특정 언어나 별개의 수학 입력 툴들을 이용한 검색 방법은 일반 사용자들이 사용하기에는 쉽지 않다는 단점이 있다. 그래서, 본 논문에서는 일반 문서 검색과 마찬가지로, 수학식을 읽듯이 한글을 입력했을 때 색인어 추출 방법 및 검색 방법에 대해 제안한다. 실험을 위해서 수학 문제집에 나오는 1,432개의 수학식을 한글화 시켰고, 한글화된 결과에 대해 패턴 등을 추출하여 MRR (Mean Reciprocal Rank), $Rel_{EQ}$@N(Relevance evaluation at N)로 평가하였다. 100개의 한글 질의어에 대해 MRR@5로 계산된 수학식 검색 결과가 약 0.6 정도 되는 것을 확인할 수 있었고, 학습 데이터에 포함되지 않은 질의수학식 5개에 대해 $Rel_{EQ}$@5로 계산했을 때 평균 60% 의 정확률을 보였다.

Processing Korean Relative Adnominal Clauses (한국어 관계관형절의 전산처리)

  • Hong, Jung-Ha;Lee, Ki-Yong
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.265-271
    • /
    • 1999
  • 이 논문은 한국어 관계관형절(relative adnominal clause)의 전산처리에 적합한 통사 의미 표상 모형을 제시하고, 그 결과를 전산적 구현을 통해서 검증하는 것이 목적이다. 이를 위해 이 논문에서는 다음의 두 가지 문제를 중심으로 관계관형절의 통사 의미 표상과 전산적 구현 문제를 다룬다. 첫째, 관계관형절의 수식을 받는 머리 명사(head noun)는 관계관형절과 모문(matrix sentence)에서 각각 다른 의미역할을 하는 논항이다. 즉, 하나의 논항이 두 개의 의미역을 표상한다. 이 논문의 첫째 과제는 이러한 관계관형절 구문에서 머리 명사의 이중의미역을 표상하는 방법을 모색하는 것이다. 둘째, 관계관형절이 일항술어로 구성될 때, 서술어 단독으로 머리 명사를 수식할 수 있을 뿐만 아니라, 주격중출 구문을 관계화하여 미리 명사를 수식할 수도 있다. 그러나 모든 일항술어가 주격중출 구문을 구성할 수 있는 것은 아니기 때문에 주격중출 구문의 관계화가 가능한 경우와 그렇지 않은 경우를 구별할 필요가 있다. 이 논문의 둘째 과제는 이러한 주격중출 구문의 관계화와 그 표상의 문제를 다루는 것이다. 이 논문에서는 이러한 문제들을 단순히 기술하는 데 그치지 않고 전산 구현을 통해 문제해결을 제시한다. 이를 위해 구현 도구로 C-언어를 보강하여 개발한 문법개발 도구언어인 말라가(Malaga)를 사용하며, 분석결과를 자질구조(feature structure)로 명시하여 그 타당성을 검토한다.

  • PDF

Search Ranking System Using Modification Relation and Improved Search Engine Interface to Enhance Search Experience (수식 관계를 이용한 검색 결과 랭킹 시스템과 향상된 검색 엔진 인터페이스를 통한 검색 과정의 효율성 향상)

  • Moon, Ukseong;Choi, Joo-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.250-253
    • /
    • 2007
  • 본 논문에서는 현재 검색 엔진의 랭킹 방식의 문제점과 인터페이스의 문제점을 해결하기 위하여 노력하였다. 기존의 페이지간 링크와 같은 부가적 정보를 이용한 인기도 기반 랭킹의 문제점을 단어간의 수식 관계를 이용한 의미 기반 랭킹 알고리즘의 제시를 통해 해결하였다. 또한 검색어와 연관된 단어를 수식 관계를 이용하 계산, 시각화하여 제공함으로써 사용자가 잘못된 검색어로 검색을 시작하였더라도 항상 올바른 검색 결과를 얻을 수 있도록 도왔으며 각 검색 결과와 함께 원문을 요약해 제공함으로써 검색 결과를 일일이 클릭해 보지 않고도 내용을 쉽게 유추할 수 있도록 도왔다.

  • PDF

Accuracy Improvement Methods for String Similarity Measurement in POI(Point Of Interest) Data Retrieval (POI(Point Of Interest) 데이터 검색에서 문자열 유사도 측정 정확도 향상 기법)

  • Ko, EunByul;Lee, JongWoo
    • KIISE Transactions on Computing Practices
    • /
    • v.20 no.9
    • /
    • pp.498-506
    • /
    • 2014
  • With the development of smart transportation, people are likely to find their paths by using navigation and map application. However, the existing retrieval system cannot output the correct retrieval result due to the inaccurate query. In order to remedy this problem, set-based POI search algorithm was proposed. Subsequently, additionally a method for measuring POI name similarity and POI search algorithm supporting classifying duplicate characters were proposed. These algorithms tried to compensate the insufficient part of the compensate set-based POI search algorithm. In this paper, accuracy improvement methods for measuring string similarity in POI data retrieval system are proposed. By formulization, similarity measurement scheme is systematized and generalized with the development of transportation. As a result, it improves the accuracy of the retrieval result. From the experimental results, we can observe that our accuracy improvement methods show better performance than the previous algorithms.

Analyzing Vulnerable Software Code Using Dynamic Taint and SMT Solver (동적오염분석과 SMT 해석기를 이용한 소프트웨어 보안 취약점 분석 연구)

  • Kim, Sungho;Park, Yongsu
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.3
    • /
    • pp.257-262
    • /
    • 2015
  • As software grows more complex, it contains more bugs that are not recognized by developers. Attackers can then use exploitable bugs to penetrate systems or spread malicious code. As a representative method, attackers manipulated documents or multimedia files in order to make the software engage in unanticipated behavior. Recently, this method has gained frequent use in A.P.T. In this paper, an automatic analysis method to find software security bugs was proposed. This approach aimed at finding security bugs in the software which can arise from input data such as documents or multimedia. Through dynamic taint analysis, how input data propagation to vulnerable code occurred was tracked, and relevant instructions in relation to input data were found. Next, the relevant instructions were translated to a formula and vulnerable input data were found via the formula using an SMT solver. Using this approach, 6 vulnerable codes were found, and data were input to crash applications such as HWP and Gomplayer.