A Similarity Evaluation using Structural Information of Documents (문서구조 정보 기반의 유사도 측정)

  • Shin, Mi-Hae;Ko, Bang-Won;Kim, Young-Chul;Jeong, Jin-Yeong
    • Proceedings of the Korean Society of Computer Information Conference
    • 2010.07a
    • pp.499-502
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

Machine Reading Comprehension based on Language Model with Knowledge Graph (대규모 지식그래프와 딥러닝 언어모델을 활용한 기계 독해 기술)

  • Kim, Seonghyun;Kim, Sungman;Hwang, Seokhyun
    • Annual Conference of KIPS
    • 2019.10a
    • pp.922-925
    • 2019
  • 기계 독해 기술은 기계가 주어진 비정형 문서 내에서 사용자의 질문을 이해하여 답변을 하는 기술로써, 챗봇이나 스마트 스피커 등, 사용자 질의응답 분야에서 핵심이 되는 기술 중 하나이다. 최근 딥러닝을 이용한 기학습 언어모델과 전이학습을 통해 사람의 기계 독해 능력을 뛰어넘는 방법론들이 제시되었다. 하지만 이러한 방식은 사람이 인식하는 질의응답 방법과 달리, 개체가 가지는 의미론(Semantic) 관점보다는 토큰 단위로 분리된 개체의 형태(Syntactic)와 등장하는 문맥(Context)에 의존해 기계 독해를 수행하였다. 본 논문에서는 기존의 높은 성능을 나타내던 기학습 언어모델에 대규모 지식그래프에 등장하는 개체 정보를 함께 학습함으로써, 의미학적 정보를 반영하는 방법을 제시한다. 본 논문이 제시하는 방법을 통해 기존 방법보다 기계 독해 분야에서 높은 성능향상 결과를 얻을 수 있었다.

An Automatic Extraction of English-Korean Bilingual Terms by Using Word-level Presumptive Alignment (단어 단위의 추정 정렬을 통한 영-한 대역어의 자동 추출)

  • Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • v.2 no.6
    • pp.433-442
    • 2013
  • A set of bilingual terms is one of the most important factors in building language-related applications such as a machine translation system and a cross-lingual information system. In this paper, we introduce a new approach that automatically extracts candidates of English-Korean bilingual terms by using a bilingual parallel corpus and a basic English-Korean lexicon. This approach can be useful even though the size of the parallel corpus is small. A sentence alignment is achieved first for the document-level parallel corpus. We can align words between a pair of aligned sentences by referencing a basic bilingual lexicon. For unaligned words between a pair of aligned sentences, several assumptions are applied in order to align bilingual term candidates of two languages. A location of a sentence, a relation between words, and linguistic information between two languages are examples of the assumptions. An experimental result shows approximately 71.7% accuracy for the English-Korean bilingual term candidates which are automatically extracted from 1,000 bilingual parallel corpus.

The Development of a Schedule Management Support System Using Productivity Information of Construction Activities (단위작업 생산성 정보를 활용한 공정관리 지원시스템 개발)

  • Oh, Se-Wook;Park, Sang-Gyu;Kim, Young-Suk
    • Korean Journal of Construction Engineering and Management
    • /
    • v.6 no.6 s.28
    • pp.181-192
    • 2005
  • Labor work information can be converted into the useful construction information in an effort to analyze project status, measure performance, and design a new similar project plan. The labor work information can also be used to make productivity data, which can be used to analyze the relationship between 'as planned' and 'as built' in scheduling management of a project, and to calculate 'percent completion' as well as analyzing delay cause. It is require to effectively collect the labor work information base on the activities. In general, current project management heavily depends on the experience and judgment of project managers, according to the work progress. However, relying on the oかy experience and judgment of the project managers might deteriorate the transparency or reliability of the collected labor work information. The purpose of this research is thus to develop a computer-based system for monitoring the work information generated by labors input in activities using PDA and Barcode technologies, and to propose a application method of the productivity data for effective project management.

Modification of Unit-Segmenting Schemes for Division Problems Involving Fractional Quantities (단위분할 도식의 재구성을 통한 포함제 분수나눗셈 문제해결에 관한 연구)

  • Shin, Jae-Hong;Lee, Soo-Jin
    • School Mathematics
    • /
    • /
    • pp.191-212
    • 2012
  • In the field of arithmetic in mathematics education, there has been lack of fine-grained investigations addressing the relationship between students' construction of division knowledge with fractional quantities and their whole number division knowledge. This study, through the analysis of part of collected data from a year-long teaching experiment, presents a possible constructive itinerary as to how a student could modify her unit-segmenting scheme to deal with various fraction measurement division situations: 1) unit-segmenting scheme with a remainder, 2) fractional unit-segmenting scheme. Thus, this study provides a clue for curing a fragmentary approach to teaching whole number division and fraction division and preventing students' fragmentary understanding of the same arithmetical operation in different number systems.

A Case Study on Building a System Dynamics Model for Strategic Knowledge Management (전략적 지식경영을 위한 시스템 다이내믹스 모델 구축 사례 연구)

  • Park, Sang-Hyun;Yeon, Seung-Jun;Kim, Dong-Ho;Kim, Sang-Wook
    • Information Systems Review
    • v.7 no.2
    • pp.101-115
    • 2005
  • IT companies make a lot of effort to share and utilize the experiences of their members and transform them into organizational knowledge as a competitive core. However they face a dilemma in that they have to spend time and financial resources to perform activities around knowledge management for the long-term gains, while carrying at field-work for making short-term profits. As an initial attempt to tackle this managerial problem, this paper tries to investigate the mechanism of knowledge management in a small IT company in Korea with a synthetic view-point using system dynamics simulation model. It depicts the dynamic behaviors of knowledge management and presents some findings of political leverage. Although this model has to be further replenished, the scheme for the dynamism of knowledge management and the findings presented in the paper could be useful for the decision makers, especially of knowledge-intensive organizations.

Design of PCI/USB Interface Controller with IEEE 1149.1 Test Function (IEEE 1149.1 테스트 기능이 내장된 PCI/USB 통합 인터페이스 회로의 설계)

  • Kim, Young-Hun;Kim, Ki-Tae;Park, Sung-Ju
    • Journal of the Institute of Electronics Engineers of Korea SD
    • v.43 no.10 s.352
    • pp.54-60
    • 2006
  • In order to test the board with IEEE 1149.1 boundary scan design, the test sequence must be applied as the bit stream However it is very tedious job to generate the test bit sequence since it requires the complete hlowledge about the 1149.1. This fuper introduces a convenient PCI/USB interface controller, named as Test-Ready PCI (TRPCI) ard Test-Ready USB (TRUSB). Test Bus Controller has been developed by TI and Lucent aiming to generate the test bit stream as an instruction level, thus even the novice test engineer can easily generate the test sequence.

Decision Support System for Prediction and Estimation of Qualities Based on Neural Networks and Fuzzy Logic (퍼지 논리와 신경망에 기반한 공정 예측 및 품질 추정을 위한 공정관리 의사지원시스템)

  • Bae, Hyun;Woo, Young-Kwang;Kim, Sung-Sin;Woo, Kwang-Bang
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • 2004.04a
    • pp.334-337
    • 2004
  • 차세대 생산 시스템(Next Generation Manufacturing System: NGMS)의 핵심 개념은 분산 생산 시스템과 다품종 소량의 유연 생산 시스템의 지원이다. 이러한 시스템의 구성을 위하여 실시간 데이터에 기반한 예측 모델이 필수적인데, 이러한 예측 기능을 통하여 생산공정의 관리와 운영, 특히 전체 공정관리를 효율적으로 수행할 수 있다. 한편, 공정으로부터 전송된 데이터는 특정한 형태의 지식으로 표현된다. 이러한 지식들은 시스템에 대한 다양한 정보를 가지고 있으므로 정보를 이용하여 시스템 상태를 빠르고 쉽게 진단할 수 있다. 공정 진단은 현재 공정 상태에서 생산되는 제품의 품질을 추정할 수 있는 정보로 활용된다. 본 논문에서는 이러한 개념이 바탕이 되어 공정관리 시스템을 설계하였다. 제안된 시스템의 적용 대상은 반도체 제조 공정의 단위 공정인 에칭 공정이다. 에칭 공정은 공정 중에 연속적인 검사가 수행되지 않고 최종 제품에 대한 검사가 수행되므로 불량 원인을 찾는 것이 쉽지 않다. 따라서 본 논문에서는 공정관리를 위한 의사지원시스템을 통해 공정의 연속적인 간접진단을 수행하고자 하였다. 본 연구에서 사용된 의사지원시스템은 각 공정에서 얻어지는 데이터와 경험적 지식을 토대로 공정시스템의 해석과 진단이 가능한 시스템이다.

Sentence-Frame based English-to-Korean Machine Translation (문틀기반 영한 자동번역 시스템)

  • 최승권;서광준;김영길;서영애;노윤형;이현근
    • Proceedings of the Korean Society for Cognitive Science Conference
    • 2000.06a
    • pp.323-328
    • 2000
  • 국내에서 영한 자동번역 시스템을 1985 년부터 개발한 지 벌써 15년이 흐르고 있다. 15년의 영한 자동번역 기술개발에도 불구하고 아직도 영한 자동번역 시스템의 번역품질은 40%를 넘지 못하고 있다. 이렇게 번역품질이 낮은 이유는 다음과 같이 요약할 수 있을 것이다. $\textbullet$ 입력문에 대해 파싱할 때 오른쪽 경계를 잘못 인식함으로써 구조적 모호성의 발생문제: 예를 들어 등위 접속절에서 오른쪽 등위절이 등위 접속절에 포함되는 지의 모호성. $\textbullet$ 번역 단위로써 전체 문장을 대상으로 한 번역패턴이 아닌 구나 절과 같은 부분적인 번역패턴으로 인한 문장 전체의 번역 결과 발생. $\textbullet$ 점차 증가하는 대용량 번역지식의 구축과 관련해 새로 구축되는 번역 지식과 기구축된 대용량 번역지식들 간의 상호 충돌로 인한 번역 품질의 저하. 이러한 심각한 원인들을 극복하기 위해 본 논문에서는 문틀에 기반한 새로운 영한 자동번역 방법론을 소개하고자 한다. 이 문틀에 기반한 영한 자동번역 방법론은 현재 CNN 뉴스 방송 자막을 대상으로 한 영한 자동번역 시스템에서 실제 활용되고 있다. 이 방법론은 기본적으로 data-driven 방법론에 속한다. 문틀기반 자동번역 방법론은 규칙기반 자동번역 방법론보다는 낮은 단계에서 예제 기반 자동번역 방법론 보다는 높은 단계에서 번역을 하는 번역방법론이다. 이 방법론은 영한 자동번역에 뿐만 아니라 다른 언어쌍의 번역에서도 적용할 수 있을 것이다.

An Analysis of Elementary School Students' Informal Knowledge In Proportion (초등학생의 비례에 관한 비형식적 지식 분석)

  • Park, Sang-Eun;Lee, Dae-Hyun;Rim, Hae-Kyung
    • Communications of Mathematical Education
    • v.24 no.2
    • pp.345-363
    • 2010
  • The purpose of this study is to investigate and analyze informal knowledge of students who do not learn the conception of proportion and to identify how the informal knowledge can be used for teaching the conception of proportion in order to present an effective method of teaching the conception. For doing this, proportion was classified into direct and inverse proportion, and 'What are the informal knowledge of students?' were researched. The subjects of this study were 117 sixth-graders who did not have prior learning on direct and inverse proportion. A total eleven problems including seven for direct proportion and four for inverse proportion, all of them related to daily life. The result are as follows; Even though students didn't learn about proportion, they solve the problems of proportion using informal knowledge such as multiplicative reasoning, proportion reasoning, single-unit strategy etc. This result implies mathematics education emphasizes student's informal knowledge for improving their mathematical ability.