• 제목/요약/키워드: 언어산출

검색결과 177건 처리시간 0.023초

사용자 그래프 기반 한국어 가짜뉴스 판별 방법 (Korean Fake News Detection with User Graph)

  • 강명훈;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-102
    • /
    • 2021
  • 최근 급격한 정보기술의 발달로 가짜뉴스가 사회문제로 대두되고 있다. 한국어 가짜뉴스 문제를 딥러닝으로 해결하기 위해서 기존의 연구들은 본문 기반의 가짜뉴스 탐지를 진행하였으며 최근에는 기사 본문 외의 보조적 정보를 활용하는 방법으로 연구가 진행되고 있다. 그러나 기존의 방식과 개선된 방식들 모두 적절한 가짜뉴스 탐지 방법을 제시하지 못하여 모델이 산출한 가짜뉴스 표현 벡터의 품질을 보장할 수 없었다. 또한 한국어 가짜뉴스 문제를 해결함에 있어서 적절한 공개 데이터셋 또한 제공되지 않았다. 따라서 본 논문은 한국어 가짜뉴스 탐지 문제에서 독자 반응정보를 추가하여 효과적인 학습을 할 수 있는 '사용자 그래프 기반 한국어 가짜뉴스 판별 방법'과 해당 모델이 적절히 학습할 수 있는 간이 데이터셋 구축 방법을 제안한다.

  • PDF

BERT 기반 한국어 문장의 유사도 측정 방법 (Measuring Similarity of Korean Sentences based on BERT)

  • 현종환;최호진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.383-387
    • /
    • 2019
  • 자연어 문장의 자동 평가는 생성된 문장과 정답 문장을 자동으로 비교 및 평가하여, 두 문장 사이의 의미 유사도를 측정하는 기술이다. 이러한 자연어 문장 자동 평가는 기계 번역, 자연어 요약, 패러프레이징 등의 분야에서 자연어 생성 모델의 성능을 평가하는데 활용될 수 있다. 기존 자연어 문장의 유사도 측정 방법은 n-gram 기반의 문자열 비교를 수행하여 유사도를 산출한다. 이러한 방식은 계산 과정이 매우 간단하지만, 자연어의 다양한 특성을 반영할 수 없다. 본 논문에서는 BERT를 활용한 한국어 문장의 유사도 측정 방법을 제안하며, 이를 위해 ETRI에서 한국어 말뭉치를 대상으로 사전 학습하여 공개한 어절 단위의 KorBERT를 활용한다. 그 결과, 기존 자연어 문장의 유사도 평가 방법과 비교했을 때, 약 13%의 성능 향상을 확인할 수 있었다.

  • PDF

자연어 추론에서의 교차 검증 앙상블 기법 (Cross-Validated Ensemble Methods in Natural Language Inference)

  • 양기수;황태선;오동석;박찬준;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

형태소 기분석 사전과 DBMS를 이장한 형태소 분석 말뭉치 구축의 한 방법 (The Method for the Construction of POS Tagged Corpus based on Morpheme Ready Made Dictionary and RDBMS)

  • 조진현;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-40
    • /
    • 2001
  • 본 논문은 1999년도에 구축된 '150만 세종 형태소 분석 말뭉치'를 바탕으로 형태소 기분석 사전을 구축하고, 이를 토대로 후처리의 수작업을 고려한 반자동 태거를 구축하는 방법론에 대해 연구한 것이다. 분석말뭉치 구축에 있어 기존 자동 태거에 의한 자동 태깅의 문제점을 분석하고, 이미 구축된 형태분석 말뭉치를 이용해 후처리 작업이 보다 용이한 1차 가공말뭉치를 구축하는 반자동 태거의 개발과 그 방법론을 제시하는데 목적을 두고 있다. 이와 같은 논의에 따라 분석 말뭉치의 구축을 위한 태거는 일반적인 언어 처리를 위한 태거와는 다르다는 점을 주장하였고, 태거에 전적으로 의존하는 태깅 방식보다는 수작업의 편의를 제공할 수 있는 태깅 방식이 필요함을 강조하였다. 본 연구에서 제안된 반자동 태거는 전체적인 태깅 성공률과 정확도가 기존의 태거에 비해 떨어지지만 정확한 단일 분석 결과를 텍스트의 장르에 따른 편차 없이 50% 이상으로 산출하고, 해결이 어려운 어절 유형에 대해서 완전히 작업자의 판단에 맡김으로써 오류의 가능성을 줄인다. 또한 분석 어절에 대해 여러 표지를 부착함으로써 체계적이고 단계적인 후처리 작업이 가능하도록 하였다.

  • PDF

AMSTAR에 기반한 국내 언어치료 분야 메타분석 논문의 방법론적 질평가 (The evaluation of methodological quality of meta-analysis studies in speech language pathology using AMSTAR)

  • 한민주;변해원
    • 한국융합학회논문지
    • /
    • 제11권2호
    • /
    • pp.161-165
    • /
    • 2020
  • 재활과학분야에서 메타분석을 이용한 연구가 증가하는 추세이지만 모든 메타분석 논문의 질적 수준이 동일한 것은 아니다. 특히, 메타분석이 가장 상위의 근거수준을 가진 연구방법임에도 불구하고, 개별 연구들 간의 이질성을 고려하지 않고 단순히 대푯값만을 통합할 경우 결과를 왜곡시킬 뿐만 아니라 잘못된 대안을 도출할 가능성이 높다. 본 연구는 2010년 1월부터 2019년 6월까지 우리나라에서 출판된 언어중재를 주제로 한 메타분석 논문을 대상으로 현황을 파악하고, A Measurement Tool to Assess the Methodological Quality of Systematic Review(AMSTAR)를 이용하여 방법론적 질을 평가하였다. 검색된 논문 98편 중 최종 5편 논문의 방법론적 질을 평가한 결과 총점 11점 중에서 평균 7.4점이 산출되어 보통 이상의 수준으로 확인되었다. 향후 언어병리학 메타연구의 질적 수준을 높이기 위해서는 출판편향에 대한 검증과 이해상충에 대한 명시를 포함해야 할 것으로 사료된다.

DES의 하드웨어 구현 (H/W Implementation of DES Algorithm)

  • 김영진;염흥열;한승조;최광윤
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 1997년도 종합학술발표회논문집
    • /
    • pp.205-213
    • /
    • 1997
  • 본 논문에서는 암호화 알고리즘의 표준으로 자리잡은 DES(Data Encryption Standard) 알고리즘을 시스템 설계 기술언어인 VHDL을 이용하여 top-down 방식으로 설계하고 시뮬레이션을 수행하여 암ㆍ복호화의 결과를 보여준다. 또한 이것을 FPGA로 구현함으로써 하드웨어가 차지하는 면적과 속도를 산출 비교하여 암호화 속도 및 크기의 최적화를 위한 설계 방식을 제안한다. 본 논문에서는 최종적으로 V-system을 이용하여 시뮬레이션을 수행하고 Synopsys의 EDA 툴을 이용하여 합성을 한 후에 Xilinx사의 xdm을 이용하여 XC4025E에 칩으로 구현하였다.

  • PDF

다중 프로브 교정 오차 보정에 관한 연구 (Development of Error Compensation Program for the Articulating Probe Calibration)

  • 김형주;이동주;정광진
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 2004년도 춘계학술대회 논문집
    • /
    • pp.9-14
    • /
    • 2004
  • 이 논문에서는 다중 프로브 교정 시 발생하는 오차를 측정하여 보정함으로써 측정 정밀도를 향상시킬 수 있는 프로그램을 개발에 대하여 연구하였다. 교정 시와 동일한 조건으로 기준구를 측정하여 오차를 산출한 다음 프로브 파라미터가 기록된 시스템 파일을 수정함으로써 교정 오차를 보정하는 프로그램을 개발하였다. 실험 결과 이론값과 실제값의 차가 CMM 분해능의 2배 이내임을 확인하였으며 프로그램은 CMM 사용자가 직접 작성 및 편집 가능하도록 DMIS 언어를 사용하였다.

  • PDF

우리나라 아동의 지역별 말소리 발달 차이 (Regional differences in Korean children's development of speech production)

  • 신문자;하지완;김영태;김수진
    • 말소리와 음성과학
    • /
    • 제11권3호
    • /
    • pp.57-67
    • /
    • 2019
  • 본 연구의 목적은 우리나라 아동들의 말소리산출 발달에 지역적 차이가 존재하는지를 알아보고자 하는 것이다. 2세 후반부터 7세에 해당하는 전라, 서울경기, 경상, 충청 지역의 아동 619명이 본 연구에 참여하였고, 대상자들에게 우리말 조음음운평가2의 단어수준 검사를 진행하였다. 수집된 데이터에 대해 지역 및 연령에 따른 단어단위정확률(PWC), 평균음운길이(PMLU), 단어단위근접률(PWP), 전체 자음정확도(Total PCC), UTAP 자음정확도(UTAPPCC)를 비교 분석하였다. 연구결과 단어단위 지표인 PWC, PMLU, PWP에서는, 2세 후반의 경우 경상도 지역에서, 3세 초반의 경우 전라도와 충청도 지역에서 서울경기 지역보다 수행력이 유의하게 낮았다. 그러나 3세 후반부터는 어떤 단어단위 지표에서도 지역 간 차이가 관찰되지 않았다. 분절음 차원의 지표인 PCC에서는, 2세 후반의 경우 Total PCC에서 경상도와 충청도가, UTAP PCC에서 충청도가 서울경기 지역보다 수행력이 유의하게 떨어졌고, 3세 초반의 경우 두 지표 모두에서 전라도와 충청도가 서울경기보다 수행력이 유의하게 떨어졌다. 그러나 3세 후반부터는 Total PCC와 UTAP PCC 모두에서 지역 간 차이가 나타나지 않았다. 이러한 결과는 어린 연령의 경우 말소리산출 능력에 국내의 지역 간 차이가 존재하며, 그 차이가 특정 지역의 특성이라기보다는 서울과 지방의 차이로 설명될 수 있음을 시사한다.

다차원 구어 단기기억에 따른 전도 실어증 환자의 언어수행력 분석 (Language performance analysis based on multi-dimensional verbal short-term memories in patients with conduction aphasia)

  • 하지완;황유미;편성범
    • 인지과학
    • /
    • 제23권4호
    • /
    • pp.425-455
    • /
    • 2012
  • 다차원 구어 단기기억 기제는 크게 음운적 통로와 어휘-의미적 통로로 구분된다. 전자를 음운단기기억, 후자를 의미단기기억이라고 할 수 있는데, 단기기억 과제를 정상적으로 수행하기 위해서는 두 통로 모두의 정보를 활발히 활용하여야 한다. 그리고 음운단기기억은 다시 음운입력완충기와 음운출력완충기로 나누어지며, 음운입력완충기는 음운자극의 입력 시, 음운출력완충기는 음운 산출 시에 작동한다. 본 연구에서는 유사한 수준의 전도 실어증 증상을 보이는 세 명의 환자에 대해, 각각의 언어 수행력을 구어 단기기억의 다차원적 측면에서 분석하였다. 그러기 위하여 세 명의 전도 실어증 환자들에게 단어 수준과 문장 수준에서 스스로 말하기, 따라말하기, 스스로 쓰기, 받아쓰기의 네 가지 양태의 언어과제를 실시하여 수행력을 비교 분석하였고, 숫자폭검사와 언어학습검사를 이용하여 음운단기기억력과 의미단기기억력을 평가하였다. 그 결과 세 대상자들은 네 양태의 언어 검사에서 다양한 수행력과 오반응 유형을 보였고, 단기기억력 검사 결과도 동일하게 나타나지 않았다. 즉 전도 실어증 환자들의 언어 수행력은 의미단기기억 또는 음운단기기억의 결함으로 설명될 수 있으며, 음운단기기억 가운데에서도 음운입력완충기, 음운출력완충기 혹은 둘 다의 결함 여부에 따라 언어특성이 상이하게 나타날 가능성을 제시하고 있다. 본 연구에서는 전도 실어증 환자들의 언어 검사와 단기기억력 검사 결과를 바탕으로, 언어와 다차원 구어 단기기억력과의 관계에 대하여 논의하고 있다.

  • PDF

SysML설계기법을 통한 전투체계 임무신뢰도 분석연구 (A Study on the Analysis of Mission Reliability in the Combat System through SysML)

  • 이정완;장중순
    • 한국시뮬레이션학회논문지
    • /
    • 제29권1호
    • /
    • pp.31-38
    • /
    • 2020
  • 임무신뢰도란 제품개발 시 목표가 되었던 요구조건하에서 임무를 완수할 확률을 나타내며, 전투체계의 경우 상용 장비와 달리 임무신뢰도가 승패를 좌우할 중요한 요소이다. 기존의 국내 전투체계의 임무신뢰도는 임무수행에 연관된 장비의 물리적 연결만을 고려해 산출되었으나, 장비들이 점차 고도화되어지고 복잡해져 물리적 연결만으로 임무연관성 판단이 불가하다. 이에 따라 본 논문에서는 물리적 연결뿐만 아니라 기능적 연결을 고려한 방법으로 시스템 설계모델링 언어인 SysML을 활용하여 정확도가 향상된 임무신뢰도를 산출하였다. 본 연구결과를 바탕으로 향후 개발되는 전투체계 임무신뢰도 검증자료로 활용 되기를 기대한다.