• 제목/요약/키워드: 한국형 모델

검색결과 6,522건 처리시간 0.048초

표층형을 이용한 BERT 기반 한국어 상호참조해결 (Korean Co-reference Resolution using BERT with Surfaceform)

  • 허철훈;김건태;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.67-70
    • /
    • 2019
  • 상호참조해결은 자연언어 문서 내에서 같은 개체를 나타내는 언급들을 연결하는 문제다. 대명사, 지시 관형사, 축약어, 동음이의어와 같은 언급들의 상호참조를 해결함으로써, 다양한 자연언어 처리 문제의 성능 향상에 기여할 수 있다. 본 논문에서는 현재 영어권 상호참조해결에서 좋은 성능을 내고 있는 BERT 기반 상호참조해결 모델에 한국어 데이터 셋를 적용시키고 표층형을 이용한 규칙을 추가했다. 본 논문의 모델과 기존의 모델들을 실험하여 성능을 비교하였다. 기존의 연구들과는 다르게 적은 특질로 정밀도 73.59%, 재현율 71.1%, CoNLL F1-score 72.31%의 성능을 보였다. 모델들의 결과를 분석하여 BERT 기반의 모델이 다양한 특질을 사용한 기존 딥러닝 모델에 비해 문맥적 요소를 잘 파악하는 것을 확인했다.

  • PDF

숫자의 대소관계 파악을 위한 Explicit Feature Extraction(EFE) Reasoner 모델 (Explicit Feature Extraction(EFE) Reasoner: A model for Understanding the Relationship between Numbers by Size)

  • 안지수;민태원;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.23-26
    • /
    • 2023
  • 본 논문에서는 서술형 수학 문제 풀이 모델의 숫자 대소관계 파악을 위한 명시적 자질추출방식 Explicit Feature Extraction(EFE) Reasoner 모델을 제안한다. 서술형 수학 문제는 자연현상이나 일상에서 벌어지는 사건을 수학적으로 기술한 문제이다. 서술형 수학 문제 풀이를 위해서는 인공지능 모델이 문장에 함축된 논리를 파악하여 수식 또는 답을 도출해야 한다. 때문에 서술형 수학 문제 데이터셋은 인공지능 모델의 언어 이해 및 추론 능력을 평가하는 지표로 활용되고 있다. 기존 연구에서는 문제를 이해할 때 숫자의 대소관계를 파악하지 않고 문제에 등장하는 변수의 논리적인 관계만을 사용하여 수식을 도출한다는 한계점이 존재했다. 본 논문에서는 자연어 이해계열 모델 중 SVAMP 데이터셋에서 가장 높은 성능을 내고 있는 Deductive-Reasoner 모델에 숫자의 대소관계를 파악할 수 있는 방법론인 EFE 를 적용했을 때 RoBERTa-base 에서 1.1%, RoBERTa-large 에서 2.8%의 성능 향상을 얻었다. 이 결과를 통해 자연어 이해 모델이 숫자의 대소관계를 이해하는 것이 정답률 향상에 기여할 수 있음을 확인한다.

중소기업의 탈추격형 기술혁신 전략 및 제언

  • 한국광학기기협회
    • 광학세계
    • /
    • 통권110호
    • /
    • pp.70-72
    • /
    • 2007
  • 외국 기술을 모방하여 그 궤적을 따라가는 추격형 기술혁신모델의 한계가 노정되면서 새로운 기술혁신모델의 필요성이 증대하고 있다. 본 연구에서는 모방에 의거한 추격형 혁신활동을 넘어서는 탈추격형(post catch-up)기술혁신활동의 특성을 조감하는 작업을 수행했다. 특히 분석대상을 중소기업에 맞추어져 이들의 탈추격형 혁신활동 사례를 살펴보았다. 기술집약형 중소기업의 혁신활동의 활성화는 그 자체가 대기업 중심의 한국혁신체제의 전환을 보여주는 의미 있는 현상이기 때문이다.

  • PDF

시간동기형 Viterbi 알고리즘과 HMM에 기반한 음성의 자동 세그멘테이션 (Auto-Segmentation of Unsegmented Speech based on HMM and Time-Synchronous Viterbi Algorithm)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.592-594
    • /
    • 2001
  • 본 연구에서는 음성인식에 있어서 음향모델의 고정도화를 위해 통계적 방법인 HMM과 시간동기형 Viterbi 알고리즘을 기반으로 한 세그멘트되지 않은 음성의 자동 세그멘테이션에 관한 연구를 수행하였다. 본 연구에서는 소량의 세그멘트된 음성에 대해 연속분포형 HMM 기본모델을 작성한 후 이를 표준패턴으로 사용하고, 세그멘트되지 않은 입력음성의 특징 피라미터에 대해 시간동기형 Viterbi 알고리즘의 프레임마다 최대가 되는 지점을 최적경계로 설정하고, 앞에서 구현 최적 경계 정보와 언어학적 지식인 발음사전 정보를 이용하여 음성을 세그멘테이션 하는 것이다. 본 연구와의 비교를 위해 HTK를 이용하여 위와 동일한 과정을 수행하였다. 이렇게 구한 음성의 세그멘테이션 정보를 이용하여 연속분포형 HMM 기본모델과 HTK의 CHMM 기본모델을 각각 작성한 후, 국어공학센터(KLE) 단어 데이터에 대해 단어인식 성능을 평가하였다. 실험결과, KLE 452 남성과 여성에 대해, 본 연구실 인식 시스템은 화자독립 단어인식률 89.4%, 85.1%, HTK의 화자독립 단어인식률 85.1%, 81.9%를 각각 얻었다.

  • PDF

객체모델을 이용한, XML DTD의 RDB 스키마로의 변환 (Transformation XML DTD to RDB Chema using Object Model)

  • 김경수;주경수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.4-6
    • /
    • 2002
  • XML이 단순한 컨텐츠에서 데이터베이스로까지 그 적용 분야가 확장되면서 XML로 표현된 정보들을 어떻게 효율적으로 저장하고 관리하는 것이다. 가장 큰 이슈 중의 하나는 기존의 관계형 데이터베이스에도 XML을 효율적으로 관리할 수 있는가 이다. 이를 위해 XML 응용과 관계형 데이터베이스 연계를 위한 다양한 연구가 이루어지고 있으나, 객체를 기본 개념에 기반을 두었으며 계층구조를 갖는 XML 데이터를 2차원 테이블의 집합인 관계형 데이터베이스에 저장하기 위해서는 많은 테이블이 필요하며, 이에 따른 죠인 연산으로 시스템 성능이 저하 될 수 있는 본질적인 한계가 있다. 따라서 XML 데이터를 데이터베이스에 저장하기 위해서는 계층적 구조를 2차원 정보로 변환하는 변환 방법을 만들어 각 구조화된 정보를 데이터베이스에 저장하고 다시 XML로 연동할 수 있는 것이다. 본 논문은 객체 모델을 토대로 XML DTD에 정의한 요소와 특성들을 객체화하여 관계형 데이터베이스 스키마로 변환하기 위한 연계 방법을 제안한다. 이를 위하여 먼저 XML DTD를 객체 모델로 변환시키기 위한 객체 변환 방안을 제시하고, 변환된 객체 모델을 관계형 데이터베이스 스키마로 변경시키기 위한 스키마 변환 방법을 제안했다.

  • PDF

개방형 서비스 API를 위한 보안모델 (A Security Model for Open Service API)

  • 이용주;최영일;이병선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1055-1058
    • /
    • 2002
  • 개인 정보의 중요성이 커지고, 침입에 대한 기술이 고도화 되어 보안의 필요성이 점점 증가되는 반면, 개방형 네트워크 구조로의 변화는 보안에 더 많은 취약점을 내포하고 있다. 본 논문에서는 개방형 네트워크로의 급속한 변화와 더불어 대두된 개방형 서비스 API 에 대해서 살펴보고, 개방형 서비스 API 보안 모델의 필요성과 현황을 분석하여 요구사항에 대한 모델을 제시하였다. 또한 이미 제정된 보안 모델에서 문제점을 분석하여 앞으로 나아갈 방향을 제시하였다.

  • PDF

생성형 언어모델을 이용한 테이블 질의응답 평가 (Evaluating Table QA with Generative Language Models)

  • 민경구;최주영;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.75-79
    • /
    • 2023
  • 문서에서 테이블은 중요한 정보들을 축약하여 모아 놓은 정보 집합체라고 할 수 있다. 이러한 테이블을 대상으로 질의응답하는 테이블 질의응답 기술이 연구되고 있으며, 이 중 언어모델을 이용한 연구가 좋은 결과를 보이고 있다. 본 연구에서는 최근 주목받고 있는 생성형 언어모델 기술을 테이블 질의응답에 적용하여 언어모델과 프롬프트의 변경에 따른 결과를 살펴보고, 단답형 정답과 생성형 결과의 특성에 적합한 평가방법으로 측정해 보았다. 자체 개발한 EXAONE 1.7B 모델의 경우 KorWiki 데이터셋에 대해 적용하여 EM 92.49, F1 94.81의 결과를 얻었으며, 이를 통해 작은 크기의 모델을 파인튜닝하여 GPT-4와 같은 초거대 모델보다 좋은 성능을 보일 수 있음을 확인하였다.

  • PDF

유비쿼터스 기술 기반의 지능형 교통시설물관리서비스를 위한 비즈니스 모델 (Business Model for Intelligent Traffic Facility Management Service Based on Ubiquitous Technology)

  • 유성열
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권12호
    • /
    • pp.41-53
    • /
    • 2009
  • 본 논문에서는 유비쿼터스 기술 기반의 지능형교통시설물 관리 서비스를 위한 비즈니스 모델과 이의 구현을 위한 시스템 구성방안 및 기술 요소들에 대하여 제안한다. 먼저 비즈니스 모델에서는 지능형교통시설물 관리의 서비스 기능과 구성, 그리고 비즈니스 프로세스 및 이해관계자들 간의 수요/공급 관계를 제시한다. 이와 함께, 비즈니스 모델 구현을 위한 시스템 구성방안을 제안한다 시스템 구성을 위해 필요한 네트워크, 인프라, 플랫폼의 관점에서 기술요소들을 살펴보고. 주요 기술들에 대한 비교 분석을 통해 교통시설물관리에 적절한 기술 구성방안을 함께 제시한다. 결론적으로, 본 연구를 통해 제안된 비즈니스 모델 및 기술 구현 방안은 지능형 교통시설물 관리를 위한 가이드라인을 제시한다.

대표적인 클러스터링 알고리즘을 사용한 비감독형 결함 예측 모델 (Unsupervised Learning Model for Fault Prediction Using Representative Clustering Algorithms)

  • 홍의석;박미경
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권2호
    • /
    • pp.57-64
    • /
    • 2014
  • 입력 모듈의 결함경향성을 결정하는 결함 예측 모델 연구들은 대부분 훈련 데이터 집합을 사용하는 감독형 모델에 관련된 것들이었다. 하지만 과거 데이터 집합이 없거나 데이터 집합이 있더라도 현재 프로젝트와 성격이 다른 경우는 비감독형 모델이 필요하며, 이들에 관한 연구들은 모델 구축의 어려움 때문에 극소수 존재한다. 본 논문에서는 기존 비감독형 모델 연구들에서 사용하지 않은 대표적인 클러스터링 알고리즘인 EM, DBSCAN을 사용한 비감독형 모델들을 제작하여, 기존 연구들에서 사용한 K-means 모델과 성능을 비교하였다. 그 결과 오류율 면에서 EM이 K-means보다 약간 나은 성능을 보였으며, DBSCAN은 두 모델에 떨어지는 성능을 보였다.

데이터형 전자기록을 위한 출처 개념 모델 개발 방향 (Toward Developing a Provenance Conceptual Model for Data-driven Electronic Records)

  • 현문수
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.305-341
    • /
    • 2024
  • 이 연구는 디지털 환경에서 데이터가 중심이 되는 전자기록의 출처에 새롭게 접근하기 위해, 데이터 출처 개념과 출처 모델을 검토하고 수용하여, 어떻게 전자기록을 대상으로 새롭게 출처 개념을 적용할 수 있을지의 가능성을 살펴보았다. 이어서 데이터 중심의 전자기록을 대상으로 한 출처 표현 모델을 개발하기 위해 기초 연구를 진행하였다. 특히 소급형 출처와 전망형 출처 개념으로 전환할 것과, 기록관리 메타데이터와는 별개의 모델을 통해 출처를 표현하고 기록과 연결할 수 있는 모델을 개발할 것을 제안하였다. 기록과 동적 관계를 맺으면서도 독립적으로 출처를 표현할 수 있는 모델을 개발할 수 있다면, 오히려 기록의 유동성을 보장할 수 있으면서도, 기록의 속성과 이를 지원할 출처의 역할을 더 충실히 수행할 수 있을 것이다. 결국, 이 연구가 제안한 기본적인 모델 개발 방향을 수용하는 출처 모델은 기록의 고정성과 활동의 재현성, 재현의 신빙성을 뒷받침할 수 있을 것이며, 디지털환경에서 적합한 출처 모델로서 역할을 할 수 있을 것이다.