• Title/Summary/Keyword: 자연어 처리 도구

Search Result 47, Processing Time 0.024 seconds

Semi-automatic Answer Template Constructor using Student Responses (학생 답안 정보를 활용한 반자동 정답 템플릿 구축 도구)

  • Jang, Eun-Seo;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.110-112
    • /
    • 2013
  • 대학수학능력시험이나 학업성취도평가와 같은 중요한 시험은 다단계의 복잡한 과정을 거쳐 채점되며, 대규모의 인적 물적 자원이 투입된다. 컴퓨터 시스템을 활용하여 채점 과정에 소모되는 자원을 절감하고 정확성을 향상시키는 등 채점 효율의 향상을 목표로 하는 연구가 진행 중에 있다. 하지만 채점하려는 문항에 대한 정보 없이 시스템이 자동으로 정 오답을 판단하는 것은 불가능하며, 채점자가 문항에 대한 정보를 일정한 형식으로 가공하여 시스템에 제공하여야 한다. 본 논문은 채점하려는 학생 답안을 정보로 이용하여 시스템이 인지할 수 있는 정답 템플릿 형식으로 구축하는 방법을 소개한다. 또한 소개한 방법으로 작성된 정답 템플릿을 이용하여 자동 채점을 수행하였을 때의 채점 결과 및 통계 자료를 수록하였다.

  • PDF

Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool (구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계)

  • Lee, Hyun-A;Park, Jae-Deuk;Jang, Myung-Gil;Park, Soo-Jun;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.489-496
    • /
    • 1996
  • 자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

  • PDF

Development of ChatGPT-based Medical Text Augmentation Tool for Synthetic Text Generation (합성 텍스트 생성을 위한 ChatGPT 기반 의료 텍스트 증강 도구 개발)

  • Jin-Woo Kong;Gi-Youn Kim;Yu-Seop Kim;Byoung-Doo Oh
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.3-4
    • /
    • 2023
  • 자연어처리는 수많은 정보가 수집된 전자의무기록의 비정형 데이터에서 유의미한 정보나 패턴 등을 추출해 의료진의 의사결정을 지원하고, 환자에게 더 나은 진단이나 치료 등을 지원할 수 있어 큰 잠재력을 가지고 있다. 그러나 전자의무기록은 개인정보와 같은 민감한 정보가 다수 포함되어 있어 접근하기 어렵고, 이로 인해 충분한 양의 데이터를 확보하기 어렵다. 따라서 본 논문에서는 신뢰할 수 있는 의료 합성 텍스트를 생성하기 위해 ChatGPT 기반 의료 텍스트 증강 도구를 개발하였다. 이는 사용자가 입력한 실제 의료 텍스트로 의료 합성 데이터를 생성한다. 이를 위해, 적합한 프롬프트와 의료 텍스트에 대한 전처리 방법을 탐색하였다. ChatGPT 기반 의료 텍스트 증강 도구는 입력 텍스트의 핵심 키워드를 잘 유지하였고, 사실에 기반한 의료 합성 텍스트를 생성할 수 있다는 것을 확인할 수 있었다.

  • PDF

A Grammar Development Environment for Feature-based APSG (자질 기반 구 구조 문법을 위한 문법 개발 환경)

  • 심광섭;양재형
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.10
    • /
    • pp.1418-1429
    • /
    • 2004
  • This paper presents GrammE, a grammar development environment for feature-based APSG. At the stage of a grammar development, analysis are be done by interpreting the grammar under development, given in a text format, it is relatively easy to diagnose the grammar. Once developed, the grammar is compiled, by using the embedded grammar compiler, into a parser program written in $C^{++}$. The parser program can be used in various types of natural language processing systems requiring syntactic analysis. GrammE is language-independent, and so far has been used for the development of Korean and Chinese grammars.

Formal Approach for Embedded System Software Development (임베디드 시스템 소프트웨어 개발을 위한 정형적 접근)

  • Lee Su-Young;Kim Jin-Hyun;Choi Jin-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.285-288
    • /
    • 2006
  • 임베디드 시스템 소프트웨어 개발과정에서, 자연어로 작성된 요구명세와 소프트웨어 엔지니어와 하드웨어 엔지니어 사이의 서로 다른 언어와 개발도구의 차이로 인해 많은 문제들이 있어왔다. 즉, 개발자의 실수로 설계가 잘못 명세 되었거나 요구명세와 실제 구현된 시스템 소프트웨어의 인터페이스 코드나 요구된 수행이 일치하지 않았다. 이를 해결하기 위해 본 논문에서는 정형기법을 이용하여 요구사항을 명세하고 설계를 검증함으로써 개발자의 실수로 인한 오류를 줄이고 개발된 시스템 소프트웨어의 인터페이스 코드 및 수행이 요구명세를 만족함을 보이도록 정형기법을 이용한 개발 프레임워크를 제안하고자 한다.

  • PDF

Syllable-based Korean POS Tagging using POS Distribution and Bidirectional LSTM CRFs (품사 분포와 Bidirectional LSTM CRFs를 이용한 음절 단위 형태소 분석기)

  • Kim, Hyemin;Yoon, Jungmin;An, Jaehyun;Bae, Kyoungman;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.3-8
    • /
    • 2016
  • 형태소 분석기는 많은 자연어 처리 영역에서 필수적인 언어 도구로 활용되기 때문에 형태소에 대한 품사를 결정하는 것은 매우 중요하다. 최근 음절 기반으로 형태소의 품사를 태깅하는 방법에 대한 연구들이 많이 진행되고 있다. 음절 단위 형태소 분석은 음절 단위로 분리된 형태소에 대해서 기계학습을 이용하여 분리된 음절 단위로 품사를 태깅하는 단계를 가진다. 본 논문에서는 기존의 CRF를 이용한 음절 단위 품사 태깅 방법을 개선하기 위해 bi-LSTM-CRFs를 이용한 방법을 제안한다. 또한, bi-LSTM-CRFs의 입력을 음절의 품사 분포 벡터를 이용해 확장함으로써 음절 단위 품사 태깅의 성능을 향상 시켰다.

  • PDF

Formal Verification for Business Rule Safety (비즈니스 룰의 안전성을 위한 증명기법)

  • Shin, Yong-Nyuo;Cha, Ree-Seo;Choi, Jin-Young;Bai, Min-O
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.519-522
    • /
    • 2001
  • 바람직한 비즈니스 룰의 기본은 어디에 어떠한 형태로 구현되더라도 유일하고, 일관적인 모델 이여야 한다는 것이다. 또한 비즈니스 룰 자체의 정립은 의사결정 시스템을 사용함으로써 경영 전략이 바뀌어도 시스템 담당자에게 의뢰할 필요 없이 기획자가 바로 코드 값만 변경시키면 기존의 시스템을 그대로 사용할 수 있을 정도의 유연성을 가지게 된 현실에 비추어 볼 때 매우 요원한 일이다. 즉, 비즈니스 룰은 DRM(Digital Rights Management) 시스템뿐만 아니라 e-CRM을 실현하는 모든 시스템에서 사용되며, 이 비즈니스 룰의 충돌로 인해서 시스템의 작동 여부가 결정될 수 있다. 룰 자체가 자연어로 기술되고 언젠가는 모순을 유발할 가능성이 높기 때문에 먼저 명확한 논리식으로 표현하고 LEGO라는 정형기법 도구를 통해 검증하도록 한다.

  • PDF

MWO(Mobile Web Office) : Web based Knowledge Management System Design for Mobile Environment (MWO(Mobile Web Office) : 이동 환경을 위한 웹 기반 지식관리 시스템 설계)

  • Park, Yuri;Yoo, Seunghee;Cho, Dongsub
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.11-14
    • /
    • 2009
  • 위키는 사용자 누구나 문서를 생성하고 수정이 가능하여 지식관리 도구로 활용이 되고 있다. 위키는 사람을 대상으로 하는 지식 공동 저작과 공유를 위한 기반 구조 중 하나로서 웹에서 운용되며, 내용은 웹 문서 서식을 위한 간단한 마크 업 언어와 자연어로 구성된다. 이 논문은 minimal Apache server 를 USB 에 저장하여 사용할 수 있는 Dokuwiki 에 지식 기능들을 추가한 MWO(Mobile Web Office)를 제안한다. 휴대 성과 이식 성이 있다는 장점을 기반으로 하여 지식 기능들을 설계하여 더욱 효율적인 시스템을 제안한다. MWO 는 공통의 업무나 관련된 그룹의 구성원들이 정보들을 공유하고 시간적, 공간적 제약을 제거하고 그룹구성원의 팀워크와 작업생산성을 향상시킴으로써 업무효율을 증대하고 조직경쟁력을 강화할 수 있다.

Instruction Tuning for Controlled Text Generation in Korean Language Model (Instruction Tuning을 통한 한국어 언어 모델 문장 생성 제어)

  • Jinhee Jang;Daeryong Seo;Donghyeon Jeon;Inho Kang;Seung-Hoon Na
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.289-294
    • /
    • 2023
  • 대형 언어 모델(Large Language Model)은 방대한 데이터와 파라미터를 기반으로 문맥 이해에서 높은 성능을 달성하였지만, Human Alignment를 위한 문장 생성 제어 연구는 아직 활발한 도전 과제로 남아있다. 본 논문에서는 Instruction Tuning을 통한 문장 생성 제어 실험을 진행한다. 자연어 처리 도구를 사용하여 단일 혹은 다중 제약 조건을 포함하는 Instruction 데이터 셋을 자동으로 구축하고 한국어 언어 모델인 Polyglot-Ko 모델에 fine-tuning 하여 모델 생성이 제약 조건을 만족하는지 검증하였다. 실험 결과 4개의 제약 조건에 대해 평균 0.88의 accuracy를 보이며 효과적인 문장 생성 제어가 가능함을 확인하였다.

  • PDF

Korean Dialogue System for Car Information Service (차량 정보 서비스용 한국어 대화 시스템)

  • Choi, Sung-Kwon;Kwon, Oh-Woog;Huang, Jin-Xia;Roh, Yoon-Hyung;Lee, Ki-Young;Kim, Young-Gil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.281-284
    • /
    • 2013
  • 한국전자통신연구원(ETRI)에서는 2010 년부터 2015 년까지 5 년간에 걸쳐 모바일 플랫폼 기반 대화모델이 적용된 자연어 음성인터페이스 기술을 개발하고 있다. 2010 년에는 대화 시스템의 전반적인 모습을 설계하였고, 2011 년에는 대상 도메인으로 도시 관광용 영어 대화 시스템을, 2012 년에는 대상 도메인으로 차량공조, 응급조치 등과 같은 차량 정보 서비스용 한국어 대화 시스템을 개발하였다. 본 논문에서는 2012 년에 개발한 차량 정보 서비스용 한국어 대화 시스템을 기술하는 것을 목표로 한다. 차량 정보 서비스용 한국어 대화 시스템의 성능 평가는 운전 경험이 있는 평가자 20 명에 의해 이루어졌다. 평가자는 웹 평가 도구에 원격으로 접속하여 주어진 40 개의 차량 정보 관련 대화 미션을 태스크로 하여 차량 정보 서비스용 대화 시스템과 대화를 하였다. 평가는 태스크 성공률과 대화턴 성공률로 나누어 측정되었으며 태스크 성공률은 87.8%, 대화턴 성공률은 86.7%였다.