• 제목/요약/키워드: 그래프 비교하기

검색결과 844건 처리시간 0.033초

문장의 구조 정보와 의미 정보를 이용한 문맥 독립 주장 탐지 모델 (Context independent claim detection model using semantic and structural information of sentences)

  • 박원재;최기현;김학수;김태일;최성원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.437-441
    • /
    • 2022
  • 문맥 독립 주장 탐지는 논점에 대한 정보가 주어지지 않은 상황에서 문서 내부의 문장들 또는 단일 문장에 대한 주장을 탐지하는 작업이다. 본 논문에서는 GCN 계층을 통해 얻은 구조 정보와 사전 학습된 언어 모델을 통해 얻은 의미 정보를 활용하는 문맥 독립 주장 탐지 모델을 제안한다. 특히 문장의 전체 구조 정보를 나타내는 부모-자식 그래프와 문장의 특정 구조 정보를 나타내는 조부모-조손 그래프를 활용해 추가적인 구조 정보를 활용하여 주장 탐지 성능을 향상시켰다. 제안 모델은 IAM 데이터셋을 사용한 실험에서 기본 RoBERTa base 모델과 비교하여 최대 2.66%p의 성능 향상을 보였다.

  • PDF

XH-DQN: 사실 검증을 위한 그래프 Transformer와 DQN 결합 모델 (XH-DQN: Fact verification using a combined model of graph transformer and DQN)

  • 서민택;나승훈;신동욱;김선훈;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.227-232
    • /
    • 2021
  • 사실 검증(Fact verification) 문제는 문서 검색(Document retrieval), 증거 선택(Evidence selection), 증거 검증(Claim verification) 3가지 단계로 구성되어있다. 사실 검증 모델들의 주요 관심사인 증거 검증 단계에서 많은 모델이 제안되는 가운데 증거 선택 단계에 집중하여 강화 학습을 통해 해결한 모델이 제안되었다. 그래프 기반의 모델과 강화 학습 기반의 사실 검증 모델을 소개하고 각 모델을 한국어 사실 검증에 적용해본다. 또한, 두 모델을 같이 사용하여 각 모델의 장점을 가지는 부분을 병렬적으로 결합한 모델의 성능과 증거의 구성 단위에 따른 성능도 비교한다.

  • PDF

우리나라 생면용 밀가루의 성질 (Physicochemical Properties of Korean Raw Noodle Flours)

  • 신숭녕;김성곤
    • 한국식품과학회지
    • /
    • 제37권3호
    • /
    • pp.418-424
    • /
    • 2005
  • 호주 표준 흰 밀(ASW) 단독 또는 ASW와 호주경질밀 또는 미국 밀(서부 횐 밀, 경질 붉은 겨울 밀)을 혼합 제분한 생면용 밀가루의 일반 성분과 색도, 입도분포, 호화성질, 리올로지 성질을 비교하였다. 단백질과 회분 함량은 ASW 밀가루가 평균 8.51%와 0.375%(수분 14% 기준)로서 혼합밀가루의 9.20%와 0.406%보다 낮았다. 밀가루의 색도는 명도와 황색도는 ASW 밀가루와 혼합밀가루 사이에 차이가 없었다. 밀가루의 평균 입자 크기는 ASW 밀가루가 작았으나 표면적은 두 집단별 차이가 없었다. 밀가루 팽윤부피는 ASW 밀가루가 높은 경향이였으나 유의적인 차이는 아니었다. 신속점도계에 의한 최고점도는 ASW 밀가루가 높았다. 파리노그래프와 익스텐시그래프 특성값은 두 집단 사이에 유의적인 차이가 없었다. 단백질 함량은 밀가루의 평균입자크기, 파리노그래프의 반죽안정성, 익스텐시그래프의 신장도와 (+)상관을, 팽윤부피, RVA 최고점도와는 (-)상관을 보였다. 밀가루 팽윤부피는 RVA 최고점도와 (+)상관을 보였다. 팽윤부피와 최고점도는 파리노그래프 또는 익스텐시그래프 특성 값과는 상관을 보이지 않았다.

데이터 스트림에서 그래프 기반 기법을 이용한 슬라이딩 윈도우 다중 조인 처리 (Processing Sliding Window Multi-Joins using a Graph-Based Method over Data Streams)

  • 장량;거준위;김경배;이순조;배해영;유병섭
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.25-34
    • /
    • 2007
  • 데이터 스트림 환경에서 셋 이상의 스트림들에 대한 조인연산을 위해 순서를 선택하는 기존 기법들은 항상 간단한 휴리스틱 방법을 이용하였다 그러나 기존 기법들은 조인 선택도나 데이터 수신 비율과 같은 것만 고려하여 일반적인 응용에서 비효율적이며 낮은 성능을 갖는다. 본 논문에서는 최적의 조인 순서로 그래프 기반의 슬라이딩 윈도우 다중 조인 알고리즘을 제안한다. 이 기법에서 슬라이딩 윈도우 조인 그래프를 먼저 생성하는데, 정점(vertex)은 조인 연산으로 표현되고 엣지(edge)는 슬라이딩 윈도우들 사이의 조인관계를 나타낸다. 그리고 정점 가중치(vertex weight)와 엣지 가중치(edge weight)는 각각의 조인의 비용과 조인 연산들의 상호관계를 표현한다. 이때 데이터 스트림은 빠른 처리를 해야 하므로 메모리 기반의 그래프 기법을 사용한다. 이를 이용하여 최대값만을 이용하여 조인 연산을 수행하는 MVP 알고리즘을 개선하고 이의 그래프에서 최적의 조인 순서를 찾는다. 이를 통한 최종 결과는 중첩-루프(nested loop) 조인 계획을 수행하여 얻어진다. 성능비교를 통하여 제안기법이 기존 기법들보다 우수함을 증명한다.

  • PDF

사용자 비정상 생활상태 추정을 위한 유틸리티 검침 데이터 분석 (Analysis of Utility Metering Data for Estimation of User Abnormal Life Status)

  • 백종목;김병기
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권8호
    • /
    • pp.85-93
    • /
    • 2011
  • 본 논문에서는 서울 목동에 운영 중인 PLC기반 통합원격검침시스템의 기능 요소별 역할을 분석하고 취약한 부분에 대해서는 개선 항목을 제시하였으며 수집된 에너지 사용량인 검침 데이터를 분석하여 사용자의 비정상적인 생활을 추정할 수 있는 방법을 연구하였다. 검침 데이터의 고주파 성분을 제거한 후 원본 그래프와 비교하여 변환 전의 데이터 그래프특성을 보유하고 있는지 확인하였다. 시험 결과 전체 주파수 대역이 포함된 원본 데이터 그래프에 비해서 저주파 대역만 선택하여 역변환 처리과정을 거친 그래프가 원본 데이터의 그래프 특성을 유지하면서 단순하고 매끄러운 곡선 형태를 가지고 있었다. 이 특성을 다르게 해석하면 변환 전 검침 데이터 특성 그래프는 시간영역의 순시유틸리티 사용량의 평균치 데이터로 비정상적인 소비상태를 결정하기에 부적합한 형태였지만, 주파수처리를 거친 신호는 유틸리티의 소비상태를 단순하면서 직관적인 판단이 가능한 형태를 가지고 있음을 확인할 수 있었다.

호주산 제면용 밀가루의 리올로지 성질과 입도분포 (Particle Size Distribution and Rheological Properties of Australian Noodle Flours)

  • 윤연희;김성곤
    • Applied Biological Chemistry
    • /
    • 제41권5호
    • /
    • pp.367-371
    • /
    • 1998
  • 호주산 표준흰밀(Australian Standard White, ASW)로 제분한 제면용 밀가루 4종의 리올로지 성질과 입도분포를 미국산 경질붉은겨울밀(Hard Red Winter, HRW)과 서부흰밀(Western White, WW)의 혼합밀로 제분한 밀가루와 비교하였다. ASW 밀가루는 미국산보다 단백질과 회분함량이 낮았고, 아밀로그래프 최고점도는 높았다. 파리노그래프 흡수율은 호주산 밀가루가 높았으나 반죽형성시간은 호주산과 미국산 사이에 차이가 없었다. 밀가루 반죽의 저항도와 신장도는 호주산 밀가루가 작았다. 밀가루 입자크기 분포는 시료마다 독특한 경향을 보였다. 파리노그래프 지표는 단백질 또는 익스텐시그래프 지표와 상관을 보이지 않았다. 아밀로그래프 최고점도는 단백질과 (-)상관을, 익스텐시그래프의 신장도는 단백질과 (+)상관을 보였다.

  • PDF

1997 외환위기 지식그래프: 디지털 아카이브의 관계 중심적 접근 (A Knowledge Graph of the Korean Financial Crisis of 1997: A Relationship-Oriented Approach to Digital Archives)

  • 이유경;김학래
    • 한국기록관리학회지
    • /
    • 제20권4호
    • /
    • pp.1-17
    • /
    • 2020
  • 정보기술의 발전에 따라 아카이브의 디지털화가 가속화되고 있다. 그런데 전통적인 방식의 디지털 아카이브는 기록을 효과적으로 검색하고 연계하고 이해하는 데 한계가 있다. 본 논문은 디지털 아카이브의 활용성을 극대화하기 위한 방안으로 관계 중심의 지식그래프 방식을 제안한다. 디지털 아카이브의 사례인 '1997 외환위기 아카이브'의 특징을 검토하고, 아카이브에 포함된 모든 개체와 개체 사이의 관계는 RiC-O(Records in Contexts-Ontology) 기반의 지식그래프로 구축한다. 본 연구의 결과인 외환위기 지식그래프는 1997 외환위기 아카이브의 모든 개체를 기계가 처리할 수 있는 형식으로 구축한다. 디지털 아카이브와 비교해 지식그래프 접근은 개체의 정보, 개체 사이의 관계를 정확히 탐색할 수 있고, 이를 통해 의미검색, 지능형 서비스에 활용될 수 있다.

퍼지신경망을 사용한 네이브 베이지안 분류기의 분산 그래프 학습 (Learning Distribution Graphs Using a Neuro-Fuzzy Network for Naive Bayesian Classifier)

  • 전설위;임준식
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.409-414
    • /
    • 2013
  • Naive Bayesian classifiers 네이브 베이지안 분류기는 샘플 데이터로부터 쉽게 구현될 수 있는 강력하고도 많이 사용되는 형식의 분류기다. 그러나 강한 조건부 독립성으로 인하여 효율이 저하되는 분류 결과를 초래한다. 일반적으로 네이브 베이지안 분류기는 연속성을 가진 특징 데이터의 우도를 처리하기 위해 가우시안 분산을 사용한다. 속성들의 확률밀도는 항상 가우시안 분산에 적합한 것만은 아니다. 또 다른 형식의 분류기는 지도학습을 통해 퍼지 규칙과 퍼지집합을 학습할 수 있는 퍼지신경망이다. 퍼지신경망과 네이브 베이지안 분류기간에는 구조적 유사성을 가지고 있기 때문에 퍼지신경망으로 학습된 분산 그래프를 네이브 베이지안 분류기에 적용하고자 하는 방안이 본 연구의 목적이다. 따라서 네이브 베이지안 분류기에 가우시안 분산 그래프를 사용한 결과와 퍼지 분산 그래프를 사용한 결과를 비교하였다. 이를 위해 leukemia와 colon의 DNA 마이크로어레이 데이터를 적용하여 분류하였다. 네이브 베이지안 분류기에 퍼지 분산 그래프를 사용한 결과 가우시안 분산 그래프를 사용한 결과보다 더 신뢰성이 있음을 보여주었다.

모델 그래프를 이용한 빠른 필기 인식 방법 (Fast Handwriting Recognition Using Model Graph)

  • 오세창
    • 한국정보통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.892-898
    • /
    • 2012
  • 많은 문자인식 문제에서 인식 속도를 높이기 위하여 대분류 방법이 사용된다. 이 경우 처음에 부류를 잘못 선택하면 대분류에 의해 돌이킬 수 없는 오류가 발생한다. 이러한 위험을 줄이기 위하여 각 모델을 여러 부류에 중복시키는 방법이 사용되지만, 이 또한 대분류 오류를 완전히 배제할 수는 없다. 본 논문에서는 오류를 증가시키지 않으면서도 전체 모델 중 일부를 선택적으로 정합함으로써 인식 속도를 높이기 위한 방법을 제안한다. 이 방법은 모델간의 유사도를 이용하여 그래프를 구성하고, 이 그래프 상에서 특정 모델을 시점으로 그래프 탐색을 진행함으로써, 입력 패턴과 유사도가 떨어지는 모델들과의 불필요한 정합을 줄인다. 본 논문에서는 이 방법을 숫자와 영어 대소문자를 대상으로 하는 온라인 필기 문자 인식 문제에 적용하였다. 실험에서 입력 패턴을 모든 모델과 정합하는 기본적인 방법과 제안하는 방법을 비교해 보았다. 그 결과 모델 그래프의 진출 차수와 탐색 과정에서 유지하는 후보의 개수를 적절히 조절함으로써 기본적인 방법과 동일한 인식률을 얻었으며, 인식 속도는 2.45배의 증가를 보였다.

행렬기반의 정합 알고리듬에 의한 음악 기호의 인식 (A Matrix-Based Graph Matching Algorithm with Application to a Musical Symbol Recognition)

  • 허경용;장경식;장문익;김재희
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.2061-2074
    • /
    • 1998
  • 패턴 인식의 분야에서 그래프는 복잡한 대상체의 표현 및 인식의 도구로서 많이 사용되지만, 그래프간의 유사성 비교에는 많은 시간이 소요될 뿐아니라 실제 입력되는 영상은 왜곡으로 인해 저장되어 있는 이상적인 영상과 동일함을 기대할 수 없으므로 유사한 정도를 판별하는 기준이 마련되어야만 한다. 이 논문에서는 행렬을 그래프의 표현 수단으로 사용하였다. 행렬은 표현이 간단하며, 정의되어 있는 연산을 통해 순서 배열 및 매칭 과정을 간단히 수행하루 수 있다. 이 때 그래프를 구성하는 노드(node)들을 기하학적 위치에 따라 순서 배열함으로써 그래프를 구성하는 노드들 사이의 대응 관계를 효율적으로 찾을 수 있도록 하였으며, 또한 왜곡으로 인하여 기호를 표현하는 그래프의 노드가 제대로 추출되지 못한 경우는 기호의 구조를 고려하여 보정해 줄 수 있는 분할 과정을 도입하여 해결하였다. 제안한 방법은 악보의 비음표 기호 인식을 통해 실험하였으며, 실험 결과 95% 정도의 인식률을 얻을 수 있었다.

  • PDF