• Title/Summary/Keyword: 언어 종류

검색결과 367건 처리시간 0.023초

다중 어댑터를 이용한 교차 언어 및 스타일 기반의 제목 생성 (Cross-Lingual Style-Based Title Generation Using Multiple Adapters)

  • 박요한;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.341-354
    • /
    • 2023
  • 문서의 제목은 문서의 내용을 가장 효율적으로 요약하여 제공해 준다. 이때 독자들이 선호하는 스타일과 언어에 따라 문서의 제목을 다르게 제공해 준다면, 독자들은 문서의 내용을 좀 더 쉽게 예측할 수 있다. 본 연구에서는 문서가 주어졌을 때 언어와 스타일에 따라 제목을 자동 생성하는'교차 언어 및 스타일 기반의 제목 생성 모델을 제안한다. 모델을 학습하기 위해서는 같은 내용을 다른 언어와 다른 스타일로 작성한 병렬데이터가 필요하다. 그러나 이러한 종류의 병렬데이터는 구축하기 매우 어렵다. 반면, 단일 언어와 단일 스타일로 구축된 제목 생성 데이터는 많으므로 본 연구에서는 제로샷(zero-shot) 학습으로 제목 생성을 수행하고자 한다. 교차 언어 및 스타일 기반의 제목 생성을 학습하기 위해 다중 언어로 사전 학습된 트랜스포머 모델에 각 언어, 스타일, 기계번역을 위한 어댑터를 추가하였다. 기계 번역용 병렬데이터를 이용하여 기계번역을 먼저 학습한 후, 동일 스타일의 제목 생성을 학습하였다. 이때, 필요한 어댑터만을 학습하고 다른 부분의 파라미터는 모두 고정시킨다. 교차 언어 및 스타일 기반의 제목을 생성할 때에는 목적 언어와 목적 스타일에 해당하는 어댑터만을 활성화시킨다. 실험 결과로는 각 모델을 따로 학습시켜 파이프라인으로 연결시킨 베이스라인에 비해 본 연구에서 제안한 제로샷 제목 생성의 성능이 크게 떨어지지 않았다. 최근 대규모 언어 모델의 등장으로 인한 자연어 생성에서의 많은 변화가 있다. 그러나 제한된 자원과 제한된 데이터만을 이용하여 자연어 생성의 성능을 개선하는 연구는 계속되어야 하며, 그런 점에서 본 연구의 의의를 모색한다.

멀티 플랫폼 이동단말기의 무선 웹 서비스를 위한 시스템 설계 및 구현 (A Design and Implementation of System for Wireless Web Service in Multi-Platform Handhold Devices)

  • 류동엽;한승현;이근수
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.355-364
    • /
    • 2005
  • 휴대폰과 같은 이동 단말기의 등장으로 무선 인터넷을 통한 정보 통신이 빠르게 증가되고 있는 추세이다. 그러나 각 통신사별 마크업 언어는 표준화가 완료되지 않았으며 이동통신 단말기의 계속적인 발달로 인하여 각 이동통신 단말기 플랫폼 별로 다른 데이터 포맷을 지원하여 모든 이동통신 단말기에서 서비스 가능하게 하기 위해서는 모든 종류의 마크업 언어와 모든 이동 단말기 별로 별도의 컨텐츠를 제작해야 하는 어려움이 있다. 기존엔 단말기별로 컨테츠를 제작하였지만 이동 단말기에 최적인 컨텐츠를 서비스하기엔 단말기의 특성 및 종류가 너무 다양하기 때문에 데이터의 재사용의 필요가 증가되었다. 본 논문에서는 이동 단말기에 서비스를 할 컨텐츠를 기술한 공통 데이터인 Template 파일을 정의하였다. 그리고 ASP 컴포넌트인 Call Manager와 XSL Generator 컴포넌트의 설계 및 구현을 통해 효과적인 무선 인터넷 서비스를 할 수 있는 방법을 제안한다. 이동 단말기가 무선 인터넷 서비스를 요청하는 시점에 Call Manager 컴포넌트를 통해 단말기가 지원하는 마크업 언어 및 단말기의 하드웨어 사양을 알아내고 Template 파일을 기반으로 XSL Generator 컴포넌트가 단말기에 최적인 XSL 스타일 시트 파일을 동적 생성하고 XSLT 엔진을 통해 각 단말기에 컨텐츠를 서비스한다.

  • PDF

테스트 시스템을 위한 프로그래밍 언어와 컴파일러 설계 (Design of a Programming Language and a Compiler for Test Systems)

  • 고훈준;유원희
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.356-365
    • /
    • 2002
  • 테스트 시스템은 다양한 종류의 반도체 제품을 검사하고 분류한다. 따라서 테스트 시스템은 여러 가지 특수기능의 하드웨어 모듈과 각 제품을 테스트할 수 있는 프로그램이 필요하다. 프로그램은 엔지니어에 의해 수정되고 컴파일되어 실행될 수 있어야 한다. 따라서 테스트 시스템은 쉽고 편리하게 프로그래밍할 수 있는 프로그래밍 언어와 테스트 프로그램을 컴파일하고 실행할 수 있는 컴파일러가 필요하다. 본 논문에서는 기존의 국내 테스트 시스템에서 사용하고 있는 테스트 프로그래밍 언어와 컴파일러의 환경을 서술한다. 그리고 산업현장에서 엔지니어가 좀 더 쉽고 편리하게 사용할 수 있고 향상된 성능을 가지는 프로그래밍 언어와 컴파일러를 설계 구현하였다. 본 논문에서 설계한 프로그래밍 언어와 컴파일러를 사용하여 테스트 시스템에 적용해 본 결과 기존 시스템보다 제품을 검사하는 실행 속도 면에서 성능이 향상되었다.

다중목표 대화형 추천시스템을 위한 사전 학습된 언어모델들에 대한 성능 평가 (Performance Evaluation of Pre-trained Language Models in Multi-Goal Conversational Recommender Systems)

  • 김태호;장형준;김상욱
    • 스마트미디어저널
    • /
    • 제12권6호
    • /
    • pp.35-40
    • /
    • 2023
  • 본 연구는 대화형 추천 시스템인 다중 목표 대화형 추천 시스템(MG-CRS)에서 사용되는 다양한 사전 학습된 언어 모델들을 고찰하고, 각 언어모델의 성능을 비교하고 분석한다. 특히, 언어 모델의 크기가 다중 목표 대화형 추천 시스템의 성능에 어떤 영향을 미치는지에 대해 살펴본다. BERT, GPT2, 그리고 BART의 세 종류의 언어모델을 대상으로 하여, 대표적인 다중 목표 대화형 추천 시스템 데이터셋인 DuRecDial 2.0에서 '타입 예측'과 '토픽 예측'의 정확도를 측정하고 비교한다. 실험 결과, 타입 예측에서는 모든 모델이 뛰어난 성능을 보였지만, 토픽예측에서는 모델 간에 혹은 사이즈에 따라 성능 차이가 관찰되었다. 이러한 결과를 바탕으로 다중 목표 대화형 추천 시스템의 성능 향상을 위한 방향을 제시한다.

한국어 "크기" 명사 부류에 대하여 (On "Dimension" Nouns In Korean)

  • 송근영;홍재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.260-266
    • /
    • 2001
  • 본 논문은 불어 명사의 의미 통사적 분류와 관련된 '대상부류(classes d'objets)' 이론을 바탕으로 한국어의 "크기" 명사 부류에 대한 의미적, 형식적 기준을 설정함으로써 자연언어 처리에의 활용 방안을 모색하고자 한다. 한국어의 일부 명사들은 어떤 대상 혹은 현상의 다양한 속성이 특정 차원에서 갖는 규모의 의미를 표현한다 예를 들어, '길이', '깊이', '넓이', '높이', '키', '무게', '온도', '기온' 등이 이에 해당하는데, 이들은 측정의 개념과도 밀접한 연관을 가지며, 통사적으로도 일정한 속성을 공유한다. 즉 '측정하다', '재다' 등 측정의 개념을 나타내는 동사 및 수량 표현과 더불어 일정한 통사 형식으로 실현된다는 점이다. 본 논문에서는 이러한 조건을 만족시키는 한국어 명사들을 "크기" 명사라 명명하며, "크기" 명사와 특징적으로 결합하는 '측정하다', '재다' 등의 동사를 "크기" 명사 부류에 대한 적정술어라 부른다. 또한 "크기" 명사는 결합 가능한 단위명사의 종류 및 호응 가능한 정도 형용사의 종류 등에 따라 세부 하위유형으로 분류할 수도 있다. 따라서 주로 술어와의 통사적 결합관계를 기준으로 "크기" 명사 부류를 외형적으로 한정하고, 이 부류에 속하는 개개 명사들의 통사적 세부 속성을 전자사전의 체계로 구축한다면 한국어 "크기" 명사에 대한 전반적이고 총체적인 의미적 통사적 분류와 기술이 가능해질 것이다. 한편 "크기" 명사에 대한 연구는 반드시 이들 명사를 특징지어주는 단위명사 부류의 연구와 병행되어야 한다. 본 연구는 한국어 "크기" 명사를 한정하고 분류하는 보다 엄밀하고 형식적인 기준과 그 의미 통사 정보를 체계적으로 제시해 줄 것이다. 이러한 정보들은 한국어 자동처리에 활용되어 "크기" 명사를 포함하는 구문의 자동분석 및 산출 과정에 즉각적으로 활용될 수 있을 것이다. 또한, 이러한 정보들은 현재 구축중인 세종 전자사전에도 직접 반영되고 있다.teness)은 언화행위가 성공적이라는 것이다.[J. Searle] (7) 수로 쓰인 것(상수)(象數)과 시로 쓰인 것(의리)(義理)이 하나인 것은 그 나타난 것과 나타나지 않은 것들 사이에 어떠한 들도 없음을 말한다. [(성중영)(成中英)] (8) 공통의 규범의 공통성 속에 규범적인 측면이 벌써 있다. 공통성에서 개인적이 아닌 공적인 규범으로의 전이는 규범, 가치, 규칙, 과정, 제도로의 전이라고 본다. [C. Morrison] (9) 우리의 언어사용에 신비적인 요소를 부인할 수가 없다. 넓은 의미의 발화의미(utterance meaning) 속에 신비적인 요소나 애정표시도 수용된다. 의미분석은 지금 한글을 연구하고, 그 결과에 의존하여서 우리의 실제의 생활에 사용하는 $\ulcorner$한국어사전$\lrcorner$ 등을 만드는 과정에서, 어떤 의미에서 실험되었다고 말할 수가 있는 언어과학의 연구의 결과에 의존하여서 수행되는 철학적인 작업이다. 여기에서는 하나의 철학적인 연구의 시작으로 받아들여지는 이 의미분석의 문제를 반성하여 본다.반인과 다르다는 것이 밝혀졌다. 이 결과가 옳다면 한국의 심성 어휘집은 어절 문맥에 따라서 어간이나 어근 또는 활용형 그 자체로 이루어져 있을 것이다.으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract 농도(濃度)가 증가(增加)함에 따라 단백질(蛋白質) 함량(含量)도 증가(增加)하였다. 7. CHS-13 균주(菌株)의 RNA 함량(含量)은 $4.92{\times}10^{-2 }\;mg/m{\ell}$이었으며 yeast extract 농도(濃度)가 증가(增加)함에 따라 증가(增加)하다가 농도(濃度) 0.2%에서 최대함량(最大含量)을 나타내고 그후는 감소(減少)하였다.

  • PDF

심한 소음환경에서 언어장애인 음성 인식률 향상을 위한 단어선정 방법 및 장치 개선에 관한 연구 (A Study on Word Selection Method and Device Improvement for Improving Speech Recognition Rate of Speech-Language-impaired in Severe Noise Environment)

  • 양기웅;이형근
    • 한국정보통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.555-567
    • /
    • 2019
  • 언어장애인, 언어 사용이 불편한 분들의 경우 조금의 잡음 환경에도 음성인식률이 저하되어 사회 생활시 어려움을 겪게 된다. 언어 사용 시 불편함을 장치로 개선시킴과 동시에, 언어 장애인의 발음 특성을 고려하여 단어 선정 시 자체 개선한 단어 선정 방법을 사용하여 280개 단어를 선정하였다. 실험에 사용된 MEMS 개발 장치는 재질, 유도선 종류, 길이, 방향을 고려하여 제작되었으며 잘못된 발음으로 인한 음성과 심한 소음에서 음성 인식률 향상을 위하여 개발된 MEMS 장치와 개발된 단어 선정 방법을 사용하여 개선시켰다. 개선 방법으론 새로운 단어 선정 방법과 mems 장치를 개선하여 진행하였으며 결과를 포함하였다.

센서 노드의 데이터를 표현하기 위한 언어 설계 (Design of Presentation Language for Sensor Node Data Representation)

  • 주강;유상근;김용운;김형준;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.893-895
    • /
    • 2012
  • 최근 인터넷의 급속한 보급과 네트워크 기술의 발전은 현재 USN(Ubiquitous Sensor Network)을 실현하기 위한 연구가 활발히 진행 중이다. USN의 센서 노드는 개별적인 센서 정보 서비스를 제공하기 위해 다양한 종류의 센서를 탑재한다. 이를 위해 불특정 사용자가 서비스를 이용하여 XML 기반의 웹 서비스 환경에서 활용할 표준화된 데이터 표현 언어가 필요하다. 본 논문에서는 필요한 센서 정보를 표준화된 형태로 표현하기 위한 USN 응용 서비스에서의 센서 데이터 표현 언어를 설계하였다. 이는 USN 분야의 기반 기술과 서비스 활성화를 위해 활용 될 것이다.

  • PDF

EPL을 활용한 초등 정보 영재 판별 도구의 개발 (Developing an Discrimination Test for the Information Gifted usign EPL at the Elementary School Level)

  • 김현수;김수환;한선관
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2011년도 동계학술대회
    • /
    • pp.203-209
    • /
    • 2011
  • 본 연구는 선행 연구 분석을 통해 찾아낸 정보 영재의 특성 중 하나인 알고리즘 능력을 측정하여 정보 영재를 판별할 수 있는 도구를 교육용 프로그래밍 언어인 스크래치를 활용하여 개발하였다. 판별 도구는 크게 단일 스프라이트, 다중 스프라이트로 나누고 각각 블록추가, 블록 순서 변경, 변수 값 수정, 블록 종류 변경으로 세분화하여 문항을 개발하였다. 본 연구에서 개발한 정보 영재 판별 도구는 프로그래밍 언어를 배우지 않은 학생들도 쉽게 조작할 수 있는 교육용 프로그래밍 언어 중 하나인 스크래치를 활용해 제작되었다, 그러므로 프로그래밍을 배우지 않은 일반 학생들을 대상으로 판별 도구를 이용해 알고리즘 능력을 측정하고 분석한다면 많은 학생들의 정보 영재성을 판별하는데 기여할 것으로 기대한다.

  • PDF

센서 노드 데이터 표현을 위한 표현 언어 설계 (Design of Presentation Language for Sensor Node Data Representation)

  • 김창수;유상근;김용운;김형준;정회경
    • 한국정보통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.378-383
    • /
    • 2012
  • 인터넷의 보급과 컴퓨터 네트워크 기술의 발전과 함께 USN(Ubiquitous Sensor Network)을 실현하기 위한 연구가 활발히 이루어지고 있다. USN의 센서 노드는 다양한 종류의 센서를 탑재하여 개별적인 센서 정보 서비스를 제공한다. 이를 위해 XML 기반의 웹 서비스 환경에서 활용되고, 불특정 사용자가 서비스를 이용할 수 있도록 표준화된 데이터 표현 언어가 필요하다. 이에, 본 논문에서는 USN 응용 서비스에 필요한 센서 정보를 표준화된 형태로 표현하기 위한 센서 데이터 표현 언어를 설계하였다. 이는 USN 분야의 기반 기술에 활용되며, 서비스 활성화를 위해 활용 될 것이다.

언어자료 검색을 위한 계층구조형 형태소 분석 프로그램 (The Layered Structural Tagging Program for Seaching)

  • 강용희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.89-96
    • /
    • 2001
  • 1999년 제1회 형태소 분석기 및 품사태거 평가 워크숍 이후 표준안에 대한 새로운 대안이나 문제제기등을 제시한 논문은 전무하다. 본 연구에서는 평가대회 참가 이후 표준안을 수정한 새로운 유형의 형태소 분석 프로그램을 제작하여 그 실용성과 앞으로의 발전 가능성과 문제점을 밝혀, 계층구조형의 형태소분석 시스템을 채택하고 있는 일본의 JUMAN을 참조 새로운 유형의 형태소 분석형식을 제시한다. 본 연구는 일본방송협회 방송기술연구소(이하 NHK기술 연구소)의 의뢰에 인한 것이며 어절단위의 표준안과 다른 형태소 단위를 기본요소로 삼고 있으며 활용형을 갖고 있는 용언에 대해서는 활용형의 전개를 하고 있다. 어절단위로 탈피한 이유는 형태소 분석의 기본요소로써 어절단위 보다는 형태소 단위를 기준으로 삼는 것이 생산성이 높다고 생각된다. 어절정보와 문장정보는 XML(extensible makrup language)등의 별도의 정보를 주는 방법을 채택했다. 음절말음이 자음인지 모음인지의 음운 정보에 따라 활용형을 차별했으며 표준안과 달리 명사의 종류와 개념을 세분화했다. 아울러 조사와 어미등의 검색어와 함께 음절을 형성하고 있는 비검색어 대상은 배제하는 프로그램과 표준안의 어절방식으로 출력하는 3가지 프로그램을 작성했다. 본 연구에서는 계층구조의 형태소분석 프로그램의 가능성과 한국어의 특성을 고려한 출력항목등을 고찰하는 것을 목적으로 한다.

  • PDF