• 제목/요약/키워드: Language convergence

검색결과 789건 처리시간 0.028초

퓨샷 개체명 인식을 위한 Maximal Marginal Relevance 기반의 라벨 단어 집합 생성 (Generating Label Word Set based on Maximal Marginal Relevance for Few-shot Name Entity Recognition)

  • 최효림;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.664-671
    • /
    • 2023
  • 최근 다양한 거대 언어모델(Large Language Model)들이 개발되면서 프롬프트 엔지니어링의 대한 다양한 연구가 진행되고 있다. 본 논문에서는 퓨삿 학습 환경에서 개체명 인식의 성능을 높이기 위해서 제안된 템플릿이 필요 없는 프롬프트 튜닝(Template-free Prompt Tuning) 방법을 이용하고, 이 방법에서 사용된 라벨 단어 집합 생성 방법에 Maximal Marginal Relevance 알고리즘을 적용하여 해당 개체명에 대해 보다 다양하고 구체적인 라벨 단어 집합을 생성하도록 개선하였다. 실험 결과, 'LOC' 타입을 제외한 나머지 개체명 타입에서 'PER' 타입은 0.60%p, 'ORG' 타입은 4.98%p, 'MISC' 타입은 1.38%p 성능이 향상되었고, 전체 개체명 인식 성능은 1.26%p 향상되었다. 이를 통해 본 논문에서 제안한 라벨 단어 집합 생성 기법이 개체명 인식 성능 향상에 도움이 됨을 보였다.

  • PDF

발달장애인을 위한 커뮤니케이션과 언어 학습 증진을 위한 인공지능 서비스 (An AI Service to support communication and language learning for people with developmental disability)

  • 박찬준;김양희;장윤나;;임희석
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.51-57
    • /
    • 2020
  • 언어발달 장애를 가진 아동들은 일상생활 및 사회생활에서 많은 어려움을 겪으며 이는 생애 전반을 걸쳐 지속된다. 언어발달 장애 아동들은 의사소통 수단인 언어를 이해하거나 사용하는 데에 어려움을 겪기 때문에 종종 사회적 활동에 참여할 기회를 박탈당하곤 한다. 이와 관련해서 Augmentative and Alternative Communication(AAC, 보완대체 의사소통)는 언어장애를 앓는 이들에게 실직적인 의사소통 수단으로 사용될 수 있다. 본 논문은 픽토그램을 AAC의 수단으로써 최대한 활용하여 언어발달 장애 아동이 타인과 의사소통하고 언어 이해 능력을 향상시킬 수 있도록 돕는 딥러닝 기반 인공지능 서비스를 제안한다. 본 서비스를 통해 언어 문제를 겪고 있는 이들이 자신의 의도 혹은 욕구를 보다 수월하게 표현하여 삶의 질이 향상 될 수 있을 것으로 기대한다.

임베디드 소프트웨어의 에너지 효율성과 언어 변환 지원을 위한 코드 리팩토링 기법 확장 (Extension of Code Refactoring Technique to Support Energy Efficiency and Language Conversion of Embedded Software)

  • 남승우;홍장의
    • 융합정보논문지
    • /
    • 제8권2호
    • /
    • pp.91-103
    • /
    • 2018
  • 리팩토링은 기존 레거시 코드에 대한 품질을 확보하기 위한 공학적 기술로서, 프로그램의 기능은 변하지 않으면서 내부 구조를 개선하는 작업이다. 다양한 오픈 소스 소프트웨어가 재사용되면서, 기술적 이유 또는 시장 요구로 인하여 프로그래밍 언어 변환을 통한 소스 코드 재사용이 점진적으로 요구되고 있다. 이러한 상황에서 에너지 효율성을 고려하는 언어 변환 리팩토링 기법은 임베디드 소프트웨어 개발의 생산성은 물론 품질 향상을 위한 중요한 수단으로 여겨지고 있다. 본 논문에서는 기존에 제시된 에너지 절감형 리팩토링 기법에 추가하여 프로그래밍 언어의 문법 및 구조의 비교와 매핑을 통해 다른 언어로 변환하는 코드 리팩토링 기법을 제시하였다. 제안하는 리팩토링 기법의 활용은 소프트웨어 개발 언어의 환경변화에 대처하고, 기존 코드의 재사용을 높임으로써 신속한 소프트웨어 개발 및 품질 향상을 통한 제품의 경쟁력 향상을 기대할 수 있다.

SW전공자 프로그래밍 입문 수업의 스크래치 활용 수업 모형 연구 (A Study on the Instructional Model utilizing Scratch for Introductory Programming Classes of SW-Major Students)

  • 고광일
    • 융합보안논문지
    • /
    • 제18권2호
    • /
    • pp.59-67
    • /
    • 2018
  • 프로그래밍 언어는 4차 산업혁명시대에서 그 중요성이 증대하고 있는 소프트웨어의 핵심 교육 영역이지만 수학적 지식과 논리적 사고력을 요구하고 있어 기초 학력이 낮은 많은 수의 지방 사립대나 전문대 학생들 - 심지어 SW전공 학생들에게도 매우 어려운 과목으로 인식되고 있다. 이런 문제로 인해 SW전공 학생이 프로그래밍 언어 입문 수업 도중 전공에 대한 흥미와 자신감을 잃고 전공을 변경하거나 학업 자체를 포기하는 상황이 발생하기도 한다. 이 에 본 연구는 대표적인 프로그래밍 입문 언어인 C언어 교육에 스크래치를 활용하는 수업 모형을 설계하였다. 이를 위해, C언어가 지원하는 프로그래밍 개념들 중 스크래치로 교육 가능한 개념들을 분석하고 스크래치 실습 예제들을 개발하였다. 또한, 프로그래밍 개념에 대해서 먼저 스크래치의 구현 방식 교육과 실습 예제들을 통해 명확하게 이해하고 C언어를 교육하는 수업 모형을 설계하였고, 모 지방 사립대의 SW전공 신입생들을 대상으로 실험을 진행하여 본 수업 모형의 실효성을 검증하였다. 프로그래밍 언어 교육이 보안 관련 IT 전공자들에게도 필수적으로 요구되는 상황에서 본 연구가 그들의 프로그래밍 언어 입문 교육에 도움이 되기를 기대한다.

  • PDF

대학수학능력시험 독서 영역의 교육 목표를 위한 자연어처리 기법을 통한 검증 (Verification of educational goal of reading area in Korean SAT through natural language processing techniques)

  • 이수민;김경민;임희석
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.81-88
    • /
    • 2022
  • 대학수학능력시험 국어 과목에서 중요한 비중을 차지하는 독서 영역의 주된 교육 목표는 주어진 지문을 온전히 이해할 수 있는가를 평가하는 데에 있다. 따라서 해당 지문에 포함된 질의를 주어진 지문만으로 풀이할 수 있는지는 해당 영역의 교육 목표와 관련이 깊다. 본 연구에서는 처음으로, 교육학 분야와 딥러닝을 접목하여 이러한 교육 목표가 실제로도 타당하게 실현 가능한지를 입증하고자 한다. 대학수학능력시험의 독서 영역의 개별지문과 그에 수반된 다수의 문장 쌍(sentence pair)을 정제하여 추출하고, 해당 문장 쌍을 주어진 지문에 비추어 적절하거나(T), 적절하지 않은지(F)를 판단하는 이진 분류 태스크(binary classification task)에 적용하여 평가하고자 한다. 그 결과, F1 스코어 기준 59.2%의 human performance를 뛰어넘는 성능을 62.49%의 KoELECTRA를 비롯한 대부분의 언어 모델에서 확인할 수 있었으며, 또한 데이터 전처리 과정에 변화를 줌으로써 언어 모델의 구조적 한계를 극복할 수 있었다.

딥러닝 모델의 정확도 향상을 위한 감성사전 기반 대용량 학습데이터 구축 방안 (A Method of Constructing Large-Scale Train Set Based on Sentiment Lexicon for Improving the Accuracy of Deep Learning Model)

  • 최민성;박상민;온병원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.106-111
    • /
    • 2018
  • 감성분석(Sentiment Analysis)은 텍스트에 나타난 감성을 분석하는 기술로 자연어 처리 분야 중 하나이다. 한국어 텍스트를 감성분석하기 위해 다양한 기계학습 기법이 많이 연구되어 왔으며 최근 딥러닝의 발달로 딥러닝 기법을 이용한 감성분석도 활발해지고 있다. 딥러닝을 이용해 감성분석을 수행할 경우 좋은 성능을 얻기 위해서는 충분한 양의 학습데이터가 필요하다. 하지만 감성분석에 적합한 학습데이터를 얻는 것은 쉽지 않다. 본 논문에서는 이와 같은 문제를 해결하기 위해 기존에 구축되어 있는 감성사전을 활용한 대용량 학습데이터 구축 방안을 제안한다.

  • PDF

OWL 기반의 SPARQL을 이용한 시맨틱 검색 (OWL-Based Semantic Search using SPARQL)

  • 하상범;한은영;최호준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.706-708
    • /
    • 2005
  • 시맨틱 웹의 등장으로 시맨틱 검색에 대한 관심이 높아졌다. 이에 본 논문에서는 시맨틱 웹 환경의 자원들을 이용하여 시맨틱 검색을 수행하는 검색방법을 제안한다. 기존의 SPARQL(Simple Protocol and RDF Query Language) 시맨틱 질의언어는 추론의 기능 없이 RDF(Resource Description Framework)에서 제공하는 SPO(subiect, predicate, object) 형태의 트리플 패턴 매치만을 제공한다. 본 논문의 시스템은 기존의 SPARQL질의 시스템에 시맨틱 추론기능을 추가하여 검색 결과에 효율성을 증가 시키는 것을 목적으로 한다. 본 논문에서의 시스템은 다음과 같은 특징을 갖는다. 첫째, 시맨틱 웹 환경의 온톨로지 구축을 위해서 W3C에서 온톨로지 언어로 표준화된 OWL(Web Ontology Language)를 사용하여 검색 환경을 구축한다. 둘째, 온톨로지와 메타데이터를 추론하여 시맨틱 검색을 유도하는 OWL추론기를 사용한다. 시맨틱 추론은 온롤로지의 공리(Axiom)을 충분히 활용하는 온톨로지기반 시맨틱 추론과 검색 도메인에 맞는 규칙을 활용하는 사용자 컨텍스트 기반의 시맨틱 추론으로 이루어진다. 셋째, 다양한 시맨틱 검색을 위해 W3C에서 제안되어 차세대 시맨틱 검색 질의언어로 연구중인 SPARQL을 사용한다. 이와 같은 특징은 시맨틱 검색 시스템이 시맨틱 웹 환경의 자원을 충분히 활용하는 결과를 가져온다.

  • PDF

한국어 의미역 결정을 위한 자질 정보 확장 (Expansion of Feature Information for Korean Semantic Role Labeling)

  • 조병철;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-186
    • /
    • 2015
  • 의미역 결정은 주어진 술어와 의존 관계에 있는 여러 논항들과 그 술어간의 의미 관계를 결정하는 것이다. 의미역 결정은 보통 대량의 말뭉치를 이용하여 분류의 관점에서 문제를 해결하고자 한다. 본 논문에서는 한국어 구문 표지 부착된 말뭉치에 구축한 의미역 표지 부착 말뭉치 10,000 문장을 이용한 자동 의미역 결정 방법을 제안한다. 특히, 한국어는 그 특성상 조사와 어미가 문법 관계뿐만 아니라 의미 관계 설정에도 매우 중요한 역할을 하기 때문에 기존의 의미역 결정 연구에서 미비했던 부분인 조사와 어미 정보를 개선하여 새로운 자질 (features) 로 설계하여 의미역 결정을 시도하였다. 기존의 다른 언어에서의 의미역 결정 연구에서 사용된 자질에 본 논문에서 제시된 접사 정보에 기반한 자질을 추가하게 되면 약 77.9%의 F1 점수를 얻을 수 있었는데, 이는 기존 연구에 비하여 약 10% 포인트 향상된 결과이다.

  • PDF

한국어 다중추론 질의응답을 위한 Dense Retrieval 사전학습 (Pretraining Dense retrieval for Multi-hop question answering of Korean)

  • 강동찬;나승훈;김태형;최윤수;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.588-591
    • /
    • 2021
  • 다중추론 질의응답 태스크는 하나의 문서만 필요한 기존의 단일추론 질의응답(Single-hop QA)을 넘어서 복잡한 추론을 요구하는 질문에 응답하는 것이 목표이다. IRQA에서는 검색 모델의 역할이 중요한 반면, 주목받고 있는 Dense Retrieval 모델 기반의 다중추론 질의응답 검색 모델은 찾기 어렵다. 본 논문에서는 검색분야에서 좋은 성능 보이고 있는 Dense Retrieval 모델의 다중추론을 위한 사전학습 방법을 제안하고 관련 한국어 데이터 셋에서 이전 방법과의 성능을 비교 측정하여 학습 방법의 유효성을 검증하고 있다. 이를 통해 지식 베이스, 엔터티 링킹, 개체명 인식모듈을 비롯한 다른 서브모듈을 사용하지 않고도 다중추론 Dense Retrieval 모델을 학습시킬 수 있음을 보였다.

  • PDF

강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합 (Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge)

  • 신중민;조상현;박승렬;최성기;김민호;김미연;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.289-294
    • /
    • 2022
  • 의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

  • PDF