• 제목/요약/키워드: 언어처리

검색결과 4,743건 처리시간 0.035초

한국어 법률 텍스트 처리를 위한 언어 모델링 연구 (A Study on Language Modeling for Korean Legal Text Processing)

  • 강예지;비립;장연지;강혜린;박서윤;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.300-304
    • /
    • 2022
  • 본 논문은 한국어 법률 텍스트 처리를 위해 세 가지 서로 다른 사전 학습 모델을 미세 조정하여 그 성능을 평가하였다. 성능을 평가하기 위해 타겟 판결 요지에 대한 판결 요지 후보를 추출하여 판결 요지 간의 유사도를 계산하였다. 또한 유사도를 바탕으로 추출된 판결 요지가 실제 법률 전문가와 일반 언어학자의 직관에 부합하는지 판단하기 위해 정성적 평가를 진행하였다. 그 결과 법률 전문가가 법률 전문 지식이 없는 일반 언어학자에 비해 판결 요지 간 유사도를 낮게 평가하였는데 법률 전문가가 법률 텍스트의 유사성을 판단하는 기준이 기계와 일반 언어학자와는 달라 전문가 자문에 기반한 한국어 법률 AI 모델 개발의 필요성을 확인하였다. 최종 연구 결과로 한국어 법률 AI 프레임워크를 제안하였다.

  • PDF

빅데이터 기반 음성언어 처리 기술 (Big data for Speech and Language Processing)

  • 나승훈;정호영;양성일;김창현;김영길
    • 전자통신동향분석
    • /
    • 제28권1호
    • /
    • pp.52-61
    • /
    • 2013
  • 음성언어 처리 분야는 인간의 자연어 발화를 컴퓨터가 자동으로 이해하고 처리하는 알고리즘을 연구하는 분야로, 자동 통번역, Siri와 같은 음성 대화 시스템, 차세대 인터페이스, 질의 응답 시스템 등 다양한 응용군을 포함한다. 특히, 음성언어 처리 기술은, 최근 빅데이터(big data) 시대를 맞이하여, 방대한 음성/텍스트 정보를 처리하기 위한 필수 기술로 각광받고 있다. 한편, 빅데이터는 그 자체가 거대한 말뭉치 데이터로서 음성언어 처리 기술의 성능을 향상시키는 주된 리소스가 된다. 이에 따라, 최근 빅데이터를 이용하여 음성언어 처리 기술의 성능을 개선시키고자 하는 연구가 활발히 진행되고 있는데, 본고에서는 이들 연구의 배경 및 연구 동향들을 소개하기로 한다.

  • PDF

자연언어처리와 인지 (Natural Language Processing and Cognition)

  • 이정민
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.161-174
    • /
    • 1992
  • 이 논의는 자연언어처리의 발전과정을 보이면서 그것이 정보 및 인지문제와 어떻게 밀접히 관련되는지를 알아본다.언어사용자인 인간을 저장된 지식-즉 문법과 사전 및 세상에 관한 백과 사전적 사실의 정보를 표상하는 구조-을 이용해 프로그램에 따라 주어진 언어구조를 처리하는 처리자로 보는 계산 모형에 입각해 SHRDLU 등의 자연언어이해 프로그램이 발전하게 되나,화행과 관련된 믿음,취지,목표,의도 및 맥락의존적인 화용론적 요인들의 처리가 아직은 풀어나가야 할 숙제 다.언어,정보 및 인지는 상호 밀접히 관현되면서 그 연구가 과학 발전에 기초가 됨을 보이고자 한다.

Linked Data를 위한 한국어 자연언어처리 플랫폼 (Korean Natural Language Processing Platform for Linked Data)

  • 함영균;임경태;;박정열;윤용운;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-20
    • /
    • 2012
  • 본 논문에서는 한국어 자연언어처리를 위해 형태소분석기와 구구조 구문분석기와 의존구조 구문분석기를 통합한 하나의 플랫폼을 제공하고, 외국의 다양한 자연언어처리 도구들의 결과물과의 국제적 상호운용성 및 Linked Data를 위한 RDF 형태로의 변환 시스템을 제시한다.

  • PDF

'와/과' 구문의 중의성 연구 (The Study of ambiguity in the 'wa/kwa')

  • 유혜원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.383-389
    • /
    • 2000
  • 본고는 한영번역기 개발을 위한 기초 작업으로 '와/과'구문에 나타나는 여러 가지 패턴을 정리하고 이들 구문에서 보이는 중의성 문제를 해결하고자 하였다. 이러한 작업을 위해서는 자료 수집 및 분석이 우선이기 때문에 코퍼스에서 '와/과'구문을 뽑아서 분석하여 규칙을 마련하였다. 여기에서 사용된 자질연산문법(FCG)은 자연언어처리를 위한 문법으로 변형규칙과 수형도의 개념 없이 자질을 이용한 연산 체계로서 언어처리를 하고자 하는 문법이다. 이 이론을 바탕으로 규칙을 세우고 실제 언어 자료를 뽑아서 테스트를 하여 95%의 성공률을 보여주었다. 그러나 여기서의 연구는 '와/과'구문의 처리를 위한 가장 뼈대가 되는 기초연구이며, 앞으로 좀 더 많은 처리가 이루어져야 하리라 생각된다.

  • PDF

통합지식표현에 의한 자연언어처리기법 : 한글 구 구조문법

  • 정희성
    • ETRI Journal
    • /
    • 제11권1호
    • /
    • pp.59-74
    • /
    • 1989
  • 컴퓨터에 의한 종래의 자연언어처리에서는 보통 생성과 인식과정에서 서로 다른 지식 표현과 프로그램을 쓰고, 음운처리, 형태처리, 통어처리, 의미처리로 분리되어 있는 것이 통례이다. 이것을 분할접근법(devide and conguer approach)이라 부른다. 분할접근법은 인간의 언어처리에 있어서의 생성, 인식간의 체계적 관계를 포착하지 못할 뿐 아니라 공학적으로도 갖가지의 문제를 안고 있다. 이 논문은 인간의 언어 생성과 인식과정의 관계를 설명하기 위하여 동일 심적 프로그램이 생성과정과 인식과정을 동시에 제어하고 있다는 가설에 선다. 이 가설을 취하는 것은 생성과 인식의 프로그램과 문법을 각각 통합하고 음운처리, 형태처리, 통어처리, 의미처리를 동시에 행해야 한다는 것을 의미한다. 이것을 통합접근법(unifying approach)이라 부른다. 통합 접근법은 예를 들어 구 구조문법 (Pharase Structure Grammar)과 단일화 (unification)에 의해서 실현할 수 있다. 구 구조 문법을 이용하여 음운정보, 형태정보, 구문정보, 의미정보를 동일의 구조중에 표현할 수 있고 그 위에 이들의 정보표현을 모두 단일화에 의해 동시에 처리할 수 있다. 단일화는 입출력의 방향을 제한하지 않으므로 생성.인식 양쪽의 문법을 얻을 수 있다. 또 단일화되는 패턴에 충족 가능한 조건을 부여함에 따라 패턴에 다양한 정보를 갖게 할 수 있으므로 처리상의 일반성을 파악할 수 있으며 처리 효율을 확보할 수 있다. 이 논문에서는 통합접근법을 도입한 한글기술문법 : KPSG(Korean Phrase Structure Grammer)의 선진성에 대해서 논의하고 있다.

  • PDF

세계어로서의 한국어 정보처리 (Information Processing of the Korean Language as a World Language)

  • 이동한
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.377-384
    • /
    • 1992
  • 보편적으로 일반 문법의 질서에 부합될 수 있는 자연언어들이 상호 번역이라는 수단을 통해 언어 변환이 가능하다면 이들 언어는 세계어이다. 한국어도 그 하나에 속한다. 본 논문에서는 한국어를 세계어라고 하는 보다 넓은 관점에서 보아 가면서, 이에 따라 고려해야할 문제들을 검토함으로서 한국어 정보처리의 개념을 정립하고, 나아가 세계 속의 한국어 위치를 다듬어 보고자 하는 것이 본 논문의 목표이다.

  • PDF

자연언어 처리를 위한 한국어 동사.명사의 개념 분류 (The Classification of Korean Noun and Verb for Natural Language Processing)

  • 박영자;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.141-149
    • /
    • 1992
  • 본 논문에서는 자연언어 처리 시스템에서 사용할 수 있는 단어의 개념 정보에 대해 연구한다. 그러기 위해 언어의 실생활에서의 쓰임 - 연세대학교 사전 편찬실의 연세 말뭉치 -을 바탕으로 한국어의 동사와 명사에 대해 개념을 조사, 분류하였으며 그 개념들이 한국어 문장 분석기에 어떻게 이용되는가를 보인다.

  • PDF

한글 프로그래밍 언어(한글 코볼)의 설계에 관한 연구 (The Design of Hangul Programing Language (Hangual Cobol))

  • 허용도;백두권
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.35-38
    • /
    • 1989
  • 컴퓨터의 소형화 추세와 더불어 퍼스널 컴퓨터가 직장과 학교는 물론 일반 가정에까지 널리 보급되기 시작하였다. 아울러 이들 퍼스널 컴퓨터 사용자들에게 편리를 제공하기 위한 응용 소프트웨어에 대한 연구가 활발히 이루어지고 있으며 특히 영어를 모르는 사용자들을 위한 컴퓨터의 한글화 문제가 매우 중요시하게 대두되었다. 더구나 오늘날 대중화되고 보편적인 이용 수단이 된 컴퓨터의 교육이나 프로그래밍 언어의 한글화는 상당히 낙후되었던 것이 사실이다. 이에 본 연구에서는 사무처리에 적합한 코볼 언어와 유사한 한글 코볼언어에 대한 설계를 하였다. 한글 코볼 언어의 설계의 궁극적인 목적은 한글의 음운체계에 맞는 좋은 프로그래밍 언어를 개발해서 프로그래머들이 프로그램 작성에 효율을 갖게 하려는데 있다. 이러한 좋은 프로그래밍 언어를 설계해서 구현하는 작업은 상당히 어려운 작업이므로 본 논문에서는 일차적으로 영문 명령어의 한글화와 조사처리에 대한 방법들을 연구하였다.

  • PDF

차량 정보 서비스용 한국어 대화 시스템 (Korean Dialogue System for Car Information Service)

  • 최승권;권오욱;황금하;노윤형;이기영;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.281-284
    • /
    • 2013
  • 한국전자통신연구원(ETRI)에서는 2010 년부터 2015 년까지 5 년간에 걸쳐 모바일 플랫폼 기반 대화모델이 적용된 자연어 음성인터페이스 기술을 개발하고 있다. 2010 년에는 대화 시스템의 전반적인 모습을 설계하였고, 2011 년에는 대상 도메인으로 도시 관광용 영어 대화 시스템을, 2012 년에는 대상 도메인으로 차량공조, 응급조치 등과 같은 차량 정보 서비스용 한국어 대화 시스템을 개발하였다. 본 논문에서는 2012 년에 개발한 차량 정보 서비스용 한국어 대화 시스템을 기술하는 것을 목표로 한다. 차량 정보 서비스용 한국어 대화 시스템의 성능 평가는 운전 경험이 있는 평가자 20 명에 의해 이루어졌다. 평가자는 웹 평가 도구에 원격으로 접속하여 주어진 40 개의 차량 정보 관련 대화 미션을 태스크로 하여 차량 정보 서비스용 대화 시스템과 대화를 하였다. 평가는 태스크 성공률과 대화턴 성공률로 나누어 측정되었으며 태스크 성공률은 87.8%, 대화턴 성공률은 86.7%였다.