• Title/Summary/Keyword: Exact match

Search Result 78, Processing Time 0.026 seconds

Korean Machine Comprehension using Dual Bi-Directional Attention Flow (Dual Bi-Directional Attention Flow를 이용한 한국어 기계이해 시스템)

  • Lee, Hyeon-gu;Kim, Harksoo;Choi, Jungkyu;Kim, Yi-reun
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.41-44
    • /
    • 2017
  • 기계이해 시스템은 주어진 문서를 이해하고 질의에 해당하는 정답을 출력하는 방법으로 심층 신경망을 활용한 주의집중 방법이 발달하면서 활발히 연구되기 시작했다. 본 논문에서는 어휘 정보를 통해 문서와 질의를 이해하는 어휘 이해 모델과 품사 등장 정보, 의존 구문 정보를 통해 문법적 이해를 하는 구문 이해 모델을 함께 사용하여 기계이해 질의응답을 하는 Dual Bi-Directional Attention Flow모델을 제안한다. 한국어로 구성된 18,863개 데이터에서 제안 모델은 어휘 이해 모델만 사용하는 Bi-Directional Attention Flow모델보다 높은 성능(Exact Match: 0.3529, F1-score: 0.6718)을 보였다.

  • PDF

Korean Machine Comprehension using Dual Bi-Directional Attention Flow (Dual Bi-Directional Attention Flow를 이용한 한국어 기계이해 시스템)

  • Lee, Hyeon-gu;Kim, Harksoo;Choi, Jungkyu;Kim, Yi-reun
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.41-44
    • /
    • 2017
  • 기계이해 시스템은 주어진 문서를 이해하고 질의에 해당하는 정답을 출력하는 방법으로 심층 신경망을 활용한 주의집중 방법이 발달하면서 활발히 연구되기 시작했다. 본 논문에서는 어휘 정보를 통해 문서와 질의를 이해하는 어휘 이해 모델과 품사 등장 정보, 의존 구문 정보를 통해 문법적 이해를 하는 구문 이해 모델을 함께 사용하여 기계이해 질의응답을 하는 Dual Bi-Directional Attention Flow모델을 제안한다. 한국어로 구성된 18,863개 데이터에서 제안 모델은 어휘 이해 모델만 사용하는 Bi-Directional Attention Flow모델보다 높은 성능(Exact Match: 0.3529, F1-score: 0.6718)을 보였다.

  • PDF

Identification of a Cellular Protein Interacting with Murine Retrovirus Gag Polyproteins

  • Choi, Wonja
    • Journal of Microbiology
    • /
    • v.34 no.4
    • /
    • pp.311-315
    • /
    • 1996
  • The retroviral Gag polyprotein directs the assembly of virion particles and plays an important role in some events after entry into a host cell. The Gag polyprotein of a virus mixture is responsible for inducing murine acquired immunodeficiency syndrome (MAIDS) when injected into susceptible strains of mice. In order to identify the host cellular proteins which interact with the MAIDS virus Gag proteins and possibly mediate the function of the Gag proteins, mouse T-cell leukemic cDNA expression library was screened using the yeast GAL4 two hybrid system. Of 11 individual positive clones, the clone Y1 was selected for the study of protein-protein interaction. Its DNA sequence revealed that it was an exact match to the murine SH3 domain-containing protein SH3P8. It is expressed as 2.4 kbp transcripts in testis at higher levels and in various tissues tested at lower levels. Glutathione S-transferase-Y1 fusion protein binds tightly to $Pr60^{def-gag}$ as well as $Pr65^{eco-gag}$.

  • PDF

System Design for Supporting Keyword Search in DHT-based P2P systems (DHT 기반 P2P 시스템에서 키워드 검색 지원을 위한 시스템 디자인)

  • 진명희;이승은;손영성;김경석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.550-552
    • /
    • 2004
  • 분산 해시 테이블 (Distributed Hash Table) 을 사용한 P2P 시스템에서는 해시함수를 사용하며 파일과 노드의 ID를 정의하고 파일의 ID와 매핑 (mapping) 되는 ID를 가진 노드에 파일을 저장함으로써 시스템 전체에 파일을 완전히 분산시킨다. 이러한 시스템에서는 파일을 찾을 때 해시된 파일 ID로 찾기 때문에 정확한 매치 (exact match) 만 가능하다. 하지만 현재 P2P 파일 공유 시스템에서는 파일의 전체 이름을 정확히 알지 못하더라도 부분적인 키워드로 파일을 검색할 수 있도록 하는 키워드 검색 (keyword search) 이 요구된다. 본 논문에서는 분산 해시 테이블을 기반으로 하는 P2P 시스템에서 키워드 검색이 가능하도록 하는 방안을 제안한다.

  • PDF

SIFT-Like Pose Tracking with LIDAR using Zero Odometry (이동정보를 배제한 위치추정 알고리즘)

  • Kim, Jee-Soo;Kwak, Nojun
    • Journal of Institute of Control, Robotics and Systems
    • /
    • v.22 no.11
    • /
    • pp.883-887
    • /
    • 2016
  • Navigating an unknown environment is a challenging task for a robot, especially when a large number of obstacles exist and the odometry lacks reliability. Pose tracking allows the robot to determine its location relative to its previous location. The ICP (iterative closest point) has been a powerful method for matching two point clouds and determining the transformation matrix between the maps. However, in a situation where odometry is not available and the robot moves far from its original location, the ICP fails to calculate the exact displacement. In this paper, we suggest a method that is able to match two different point clouds taken a long distance apart. Without using any odometry information, it only exploits the features of corner points containing information on the surroundings. The algorithm is fast enough to run in real time.

Programming Methodology of the Computer Go (컴퓨터 바둑 프로그래밍 기법)

  • Kim, Yeong-Sang;Lee, Jong-Cheol
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.3
    • /
    • pp.460-470
    • /
    • 1996
  • In this paper, we describe the programming methodology which can produce computer Go.After computer Go program with the rules of Go determines a territory for itself, it must evaluate the exact next move. The common design principle of computer Go is to combine such heuristic elements as pattern match, alpha-beta pruning and influence function. In this study, we introduce many other approaches and their results on computer Go, and then show data structures and algorithms to implement computer Go project.

  • PDF

A new algorithm for finding normalized local alignment using handed Smith-Waterman algorithm (Banded Smith-Waterman 알고리즘을 이용하여 정규화된 부분배치를 찾는 새로운 알고리즘)

  • 김상태;심정섭;박희진;박근수;박현석;서정선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.592-594
    • /
    • 2001
  • 두 문자열의 부분배치(local alignment)를 찾는 대표적인 알고리즘인 Smith-Waterman 알고리즘(SW 알고리즘)은 정규화된 최적부분배치를 찾지 못하는 단점이 있다. 최근에 fractional programming 기법을 이용하여 여러 번의 SW 알고리즘을 수행함으로써 정규화된 최적부분배티를 찾는 알고리즘이 제시되었지만 이는 매우 많은 시간이 걸린다. 본 논문에서는 fractional programming 기법을 이용하여 정규화된 최적부분배치를 찾는 알고리즘에, 완전매치(Exact Match)을 이용한 휴리스틱 기법인 Banded SW 알고리즘을 적용하여, 낮은 오차를 가지면서 실용적으로 매우 빠른 정규화된 최적부분배치를 찾는 알고리즘을 제시하고 이 알고리즘과 제시하고 이 알고리즘과 기존의 알고리즘을 직접 구현하여 실험한 결과를 비교 분석한다.

  • PDF

Korean TableQA: Structured data question answering based on span prediction style with S3-NET

  • Park, Cheoneum;Kim, Myungji;Park, Soyoon;Lim, Seungyoung;Lee, Jooyoul;Lee, Changki
    • ETRI Journal
    • /
    • v.42 no.6
    • /
    • pp.899-911
    • /
    • 2020
  • The data in tables are accurate and rich in information, which facilitates the performance of information extraction and question answering (QA) tasks. TableQA, which is based on tables, solves problems by understanding the table structure and searching for answers to questions. In this paper, we introduce both novice and intermediate Korean TableQA tasks that involve deducing the answer to a question from structured tabular data and using it to build a question answering pair. To solve Korean TableQA tasks, we use S3-NET, which has shown a good performance in machine reading comprehension (MRC), and propose a method of converting structured tabular data into a record format suitable for MRC. Our experimental results show that the proposed method outperforms a baseline in both the novice task (exact match (EM) 96.48% and F1 97.06%) and intermediate task (EM 99.30% and F1 99.55%).

Research on Performance Improvement Using LoRA Techniques in RAG End2End Models (RAG End2End 모델에서 LoRA기법을 이용한 성능 향상에 관한 연구)

  • Min-Chang Kim;Sae-Hun Yeom
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.600-601
    • /
    • 2024
  • 본 논문은 RAG(Retrieval-Augmented Generation) End2End의 리소스(Resource) 과부하 문제를 해결하는 동시에 모델 성능을 향상 시키기 위해 PEFT(Parameters-Efficient Fine-Tuning)기술인 LoRA(Low Rank Adaptation)적용에 관한 연구이다. 본 논문에서는 RAG End2End 모델의 파라미터 값과 개수를 유지하면서, LRM(Low Rank Matrices)을 이용하여 추가적인 파라미터만을 미세 조정하는 방식으로, 전반적인 모델의 효율성을 극대화하는 방안을 제시하였다. 본 논문에서 다양한 도메인에 데이터 셋에 대한 제안 방식의 성능을 검증하고자 Conversation, Covid-19, News 데이터 셋을 사용하였다. 실험결과, 훈련에 필요한 파라미터의 크기가 약 6.4억개에서 180만개로 감소하였고, EM(Exact Match)점수가 유사하거나 향상되었다. 이는 LoRA를 통한 접근 법이 RAG End2End 모델의 효율성을 개선할 수 있는 효과적인 전략임을 증명하였다.

A Study on the Implementation and Performance Verification of DistilBERT in an Embedded System(Raspberry PI 5) Environment (임베디드 시스템(Raspberry PI 5) 환경에서의 DistilBERT 구현 및 성능 검증에 관한 연구)

  • Chae-woo Im;Eun-Ho Kim;Jang-Won Suh
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.617-618
    • /
    • 2024
  • 본 논문에서 핵심적으로 연구할 내용은 기존 논문에서 소개된 BERT-base 모델의 경량화 버전인 DistilBERT 모델을 임베디드 시스템(Raspberry PI 5) 환경에 탑재 및 구현하는 것이다. 또한, 본 논문에서는 임베디드 시스템(Raspberry PI 5) 환경에 탑재한 DistilBERT 모델과 BERT-base 모델 간의 성능 비교를 수행하였다. 성능 평가에 사용한 데이터셋은 SQuAD(Standford Question Answering Dataset)로 질의응답 태스크에 대한 데이터셋이며, 성능 검증 지표로는 EM(Exact Match) Score와 F1 Score 그리고 추론시간을 사용하였다. 실험 결과를 통해 DistilBERT와 같은 경량화 모델이 임베디드 시스템(Raspberry PI 5)과 같은 환경에서 온 디바이스 AI(On-Device AI)로 잘 작동함을 증명하였다.