• 제목/요약/키워드: 언어적 프레임

검색결과 241건 처리시간 0.025초

복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크 (Controllable data augmentation framework based on multiple large-scale language models)

  • 강현석;남궁혁;정지수;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

웹 출판 프레임워크를 지원하는 XQL기반 XML 문서 검색 시스템 설계 및 구현 (A Design and Implementation of XML Document Retrieval System Based on XQL supporting Web Publishing Framework)

  • 문종환;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1095-1098
    • /
    • 2001
  • 정보의 구조적 표현 가능하고 인터넷을 기반으로 하는 정보교환의 매개체로써 다양한 응용분야에 확산되고 있는 XML(extensible Markup Language)은 차세대 인터넷 전자문서 표준으로 주목받고 있다. 최근들어 기존 문서를 XML로 변환하거나 신규 문서를 XML로 작성하는 사례가 늘면서 대량의 XML문서가 생성되고 있으며 이에 따라 대량의 XML 문서를 효율적으로 검색하기 위한 XML 검색 시스템이 요구되어지고 있다. 본 논문에서는 내용기반, 구조기반, 속성기반 검색을 지원하는 XML 문서의 질의언어로 제안되어진 XQL과 XML 문서를 분석하는 문서 구조 처리기, 사용자 입력 질의를 실행하기 위한 질의 언어 처리기를 가지는 XML 문서검거 시스템을 제시하고 검색된 문서의 견과를 웹 출판 프레임워크(Web Publishing Framework) 인 Cocoon을 적용하여 다른 포맷의 문서로 전환 가능한 시스템을 설계 및 구현하였다.

  • PDF

개념 기반 질의-응답 시스템에서 개념 규칙을 이용한 해답 추출 (Answer Extraction using Concept Rules in Concept-based Question-Answering System)

  • 강유환;안영민;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-188
    • /
    • 2005
  • 본 논문에서는 개념 기반 질의-응답 시스템에서 개념 규칙을 이용하여 해답을 추출하는 방법에 대하여 기술한다. 개념 기반 질의-응답 시스템은 질의문의 각 유형별 개념 정보를 이용하여 질의문을 분석하고 해답을 추출하는 시스템이다. 질의문의 키워드들을 개념에 따라 분류하고, 질의 유형별로 공통적으로 나타나는 개념들을 이용하여 개념 프레임을 정의한다. 또한, 개념 정보와 해답이 들어 있는 문장과 문단에서 공통적으로 나타나는 구문 특성을 이용하여 해답 추출을 위한 규칙을 작성한다. 개념 규칙은 형태 정보와 구문 정보를 포함하며, 질의 유형별로 따로 작성한다. 작성된 규칙을 이용하여 문서로부터 해답이 들어 있는 문장과 문단을 추출한 후 질의문의 해답 유형에 해당하는 개체를 해답 후보로 제시한다. 실험 결과 개념 규칙을 이용한 해답 추출의 정확도가 매우 높게 나타났다.

  • PDF

분산 객체 프레임웍을 지원하기 위한 재공학 시스템의 설계 (A Reengineering System Design for Supporting Distributed Object Framework)

  • 조성림;이은주;이기열;우치수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.514-516
    • /
    • 2001
  • 소프트웨어 응용분야에서 재사용을 통한 프레임적 기반의 개발 기술이 발전하고 있으며, 특히 CORBA와 같은 분산 객체 환경과 GUI를 지원하는 프레임웍들의 구현 및 응용기술에 대한 연구가 이루어지고 있다. 본 논문에서는 객체 지향 언어인 C++로 만들어진 독립적인 시스템 또는 클라이언트/서버 환경의 시스템을 CORBA를 이용한 분산 객체 프레임웍 환경으로 이주시키는 재공학 시스템 설계를 제안한다. 이 시스템을 이용하여 레거시 시스템을 재공학 하면 신뢰성과 상호 운용성이 높은 프레임적 기반의 소프트웨어 개발을 효과적으로 지원할 수 있다.

  • PDF

웹프로그래밍 학습시스템 설계 및 구현 (Design and Implementation of Web Programming Learning System)

  • 전병호
    • 컴퓨터교육학회논문지
    • /
    • 제5권3호
    • /
    • pp.69-77
    • /
    • 2002
  • 웹프로그래밍 교육을 위한 학습 시스템은 웹 상에서 웹 프로그램을 개발하고 그 결과를 직접 확인할 수 있어야 한다. 본 연구에서는 클라이언트측 언어 뿐만 아니라 서버측 언어도 웹상에서 스크립트 편집 결과를 확인할 수 있는 학습 시스템을 제시한다. 웹 언어를 학습하는데 참조되는 스크립트를 계층적 구조로 데이터베이스화한다. 참조스크립트 데이터베이스는 스크립트를 데이터베이스로 관리함으로써 참조스크립트의 이용률을 높인다. 참조스크립트는 편집 가능한 상태로 학습자가 웹 문서의 구조나 웹 언어의 요소, 속성 및 속성 값을 변경하여 그 결과를 웹상에서 스크립트와 함께 확인할 수 있다. 참조스크립트 테스트는 프레임 테스트와 윈도우 테스트로 참조스크립트 적용성을 확인할 수 있다.

  • PDF

성격유형별 문체 특성 기반 맞춤형 광고 메시지 자동생성 연구 (Automatic Generation of Custom Advertisement Messages based on Literacy Styles of Classified Personality Types)

  • 성지민;최윤종;곽도연;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.431-436
    • /
    • 2022
  • 이 연구는 MBTI의 심리 기능지표 조합인 ST, SF, NT, NF의 유형별 특징을 반영한 마케팅 문체 프레임워크를 정의하고 모델 학습을 통해 성격유형별 맞춤화 된 광고 메시지로 생성하는 것을 목적으로 한다. 활용되는 광고 메시지 자동 생성 기술은 BART 모델에 성격유형을 Prefix로 포함한 광고문을 학습시켜 성격유형에 따라 맞춤형 광고 메시지를 생성하는 방식이다. 학습된 모델은 Prefix 조작만으로 MBTI 성격유형별 문체 특징을 갖춘 광고 메시지로 변환되는 것을 실험을 통해 확인할 수 있었다. 본 연구는 성격유형의 특징을 문체 프레임워크로써 정의하고 이에 기반한 모델 학습을 통해 성격유형별 특징을 반영한 광고 메시지를 재현해 낼 수 있다는 점에서 의의가 있다. 또한 성격유형과 연관 feature를 함께 학습하여 유형별 문체 특징과 소구점을 포함한 광고 메시지를 생성했다는 기술적 가치가 있다. 이 연구 결과를 기반으로 차후 타겟 고객층의 성격유형과 광고 도메인을 고려한 효과적인 광고 콘텐츠를 생성해 내는 모델을 개발하여 타겟 마케팅 분야는 물론이고 지역별 또는 언어별 문체 간 차이를 구조화하거나 재현해야 하는 문제에서 기반이 되는 연구로 활용될 수 있을 것으로 기대된다.

  • PDF

영화 <파워 오브 도그>의 이차 프레임 연구 - 파노프스키 도상해석학을 중심으로 (A Study on the Second Frame in Film <The Power of The Dog> -Focusing on Iconology by Panofsky)

  • 지아신위에
    • 스마트미디어저널
    • /
    • 제12권1호
    • /
    • pp.102-111
    • /
    • 2023
  • 이미지 기호는 영화의 시각언어에서 가장 직관적인 요소로서 관객들이 서사를 이해하고 감독의 의식을 연구하는 시작점이다. 이차 프레임은 하나의 이미지 기호로서 풍분한 상징적 은유를 갖고 있다. 과거의 연구에서 이차 프레임은 주로 문과 창문, 거울 등 물리적 형태로 나타났지만, <파워 오브 도그>에서는 다양한 형식의 이차 프레임을 보여주어 이차 프레임의 연구에게 더욱 많은 유형을 제공하였다. 서사 과정에서의 이차 프레임의 상징적 의미를 해석하여 영화가 전달하는 사회문화적 문제를 해석하기 위해 체계적이고 논리적으로 영화의 이미지 기호를 분석하는 것은 매우 중요한 것이다. 파노프스키의 도상해석학적 방법론은 하나의 미술사 연구 방법론이고, 이미지 기호를 연구하는 데 치밀한 삼단식 분석법을 제공하였다. 본 연구의 목적은 파노프스키의 도상해석학적 방법론을 통해 영화 <파워 오브 도그>에서 나타난 이차 프레임을 분석하여 영화 이미지 연구의 방법론을 확장하고, 과거 도상해석학을 통해 영화의 이미지를 분석할 때 항상 서사분석(도상학적 분석)에 머물러 있는 문제를 돌파하기 위한 것이다. 도상해석학적 연구방법은 시각형식에서 시작해 서사적 상징을 해석한 후 상징적 의미가 반영한 사회문화적 문제를 연구하는 것이다. 본 연구의 결과를 통해 알 수 있듯이, 이차 프레임은 서사의 요구에 따라서 다양한 시각적 표현을 갖고 있다. 그리고 <파워 오브 도그>의 서사에서 전반적으로 억압적인 영화 분위기와 캐릭터 사이의 갈등관계를 상징하였다. 또한, 캠피온 감독이 이차 프레임을 통해 표현하고자 하는 것은 여성문제가 호전된 영화계와 페미니즘 영화 창작의 주제가 이원대립적으로 여성을 표현하는 것에서 "탈주체화"적으로 다원적인 집단을 표현하는 것으로 변화되었다는 것이다.

통계에 기반한 다영영 대화형 도우미 시스템의 설계 (A Design of Dialogue Interface System Based on Statistical Approach)

  • 정형일;김동현;장효준;김학수;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-267
    • /
    • 2006
  • 대화 인터페이스 시스템(dialogue interface system)은 인간과 컴퓨터의 상호작용을 위한 도구로서 자연언어(natural language)를 사용하여 정보를 공유하거나 특정 업무를 수행하는 프로그램이다. 대화 인터페이스 시스템에 대한 기존의 연구들은 영역 의존적인 스크립트나 계획 추론을 위한 계획 지식을 이용해 왔다. 스크립트 모델(script model)은 제한적인 실용시스템 개발을 위해 주로 연구되었고 계획에 기반한 모델은 대화의 원리를 이해하는 분야에서 주로 연구되어 왔다. 그러나 기존의 모델들은 시스템 확장이 매우 어려우며 예측하지 못한 사용자 발화에 대하여 대응이 어렵기 때문에 매우 제한적인 영역이나 정해진 형태의 대화만을 처리할 수 있다. 본 논문에서는 이런 단점들을 보완하기 위하여 통계에 기반한 다 영역(multi-domain) 대화 모델을 제안한다. 제안된 시스템은 각 작업들에 대하여 해당 작업에 적합한 영역 모델(domain model)을 잘 알려진 프레임 구조를 따르면서 사용자 의도 파악과 시스템 의도 생성에 통계적 방법을 사용한다. 이러한 하이브리드 형태의 구조 덕분에 제안된 시스템은 영역 확장성과 이식성이 뛰어나다는 장점을 가진다.

  • PDF

프레임워크 기반의 모바일 생체신호 모니터링 애플리케이션 구현 (Implementation of Framework based Mobile Vital Signal Monitoring Application)

  • 김병훈;정도운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.291-292
    • /
    • 2012
  • 본 연구에서는 모바일기반의 효율적인 건강정보 모니터링 수행하기 위하여 소프트웨어 디자인 패턴 중 생체신호 모니터링 프레임워크에 적합한 패턴을 제시하고자 한다. 이를 위해 Java언어 기반의 구글 안드로이드사의 Android를 이용한 모바일 환경에서 프레임워크를 설계 하였다. 또한 모니터링 프레임워크의 설계 및 구현을 하고 실험을 통해 프레임워크 기반의 모바일 생체신호 모니터링 애플리케이션의 유용성을 확인하였다.

  • PDF

IoT 스마트 홈 환경을 위한 상황 인식 추론 프레임워크 설계 및 구현 (Design and Implementation of Context-aware Inference Framework for IoT Smart Home Environment)

  • 이정준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.247-250
    • /
    • 2015
  • 과거 유비쿼터스 기술의 출현 이후로 사물에 간단한 인식 센서를 이용한 형태의 서비스가 널리 보급되었고, 스마트 기기의 발달로 인해 PC가 아닌 환경에서도 인터넷을 사용하기 용이한 환경이 정착되어, 이들을 이용한 사물 인터넷 (Internet of Things) 환경이 빠르게 확산중이다. 본 논문에서는 상황 인식 서비스와 추론 서비스를 사물 인터넷 환경에 적용 시킨 스마트 홈 상황인식 추론 프레임 워크의 설계 및 구현을 서술한다. 해당 프레임 워크는 실질적인 상황 정보를 제공하는 이기종의 사물 인터넷 기기 간 데이터 타입을 수용하기 위해 온톨로지 언어인 OWL 규격을 사용하여 상황 정보를 수용하고, 룰 입력 모듈을 통해 다양한 환경을 모델링 할 수 있는 XML 규격의 서비스 룰을 입력받는다. 이후, 상황 정보와 서비스 룰을 기반으로 추론엔진을 통해 상황을 추론하여, 단순히 조건 만족 시 실행 구조가 아닌 상황 기반의 추론에 의한 서비스를 제공하게 된다. 프레임 워크를 활용 방안을 설명하기 위해 예제 방범 시나리오를 통해 해당 프레임 워크의 특징 및 서비스의 흐름을 서술한다.

  • PDF