• 제목/요약/키워드: 언어 종류

검색결과 364건 처리시간 0.025초

이중언어 코퍼스로부터 외래어 표기 사전의 자동구축 (Automatic Construction of a Transliteration Dictionary from Bilingual Corpus)

  • 이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.142-149
    • /
    • 1999
  • 외국문명의 영향으로 많은 외래어가 한국어 문서 내에서 사용되고 있으며, 이러한 단어는 주로 전문용어, 고유명사, 신조어 등으로 사전에 등록되지 않는 것이 많다. 본 논문에서는 이중언어 코퍼스로부터 자동으로 외래어 사전을 추출해 내는 확률적 정렬 방법과 실험결과를 소개한다. 확률적 정렬 방법은 통계적 음차 표기 모델에서 사용된 방법을 변형하여 적용한 것이며, 문서단위로 정렬된 두 종류의 영-한 이중언어 코퍼스에 대해 실험하여 재현률과 정확률을 측정하였다 성능은 전처리단계인 한국어 미등록어 추정에 영향을 많이 받았는데, 미등록어 추정을 대략하였을 경우, 재현률은 평균 58%였고, 정확률은 평균74%이었으며, 수동으로 미등록어 명사를 분리했을 경우, 재현률 평균86%, 정확률 평균91%로 외래어와 대응되는 원어를 추출해 냈다.

  • PDF

임베디드 시스템을 위한 C# MSIL 코드의 Oolong 코드 번역에 관한 연구 (A Study on Translation of C# MSIL Code into Oolong Code for Embedded Systems)

  • 최성규;정지훈;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.983-986
    • /
    • 2003
  • 마이크로소프트사는 .NET 플랫폼을 개발하면서 C/C++의 강력함과 자바나 비주얼 베이직의 높은 생산성을 매우 효과적으로 결합한 프로피래밍 언어인 C#을 만들었다. C#은 컴파일 과정을 거치며 자바의 바이트 코드와 같은 중간 언어인 MSIL 코드를 갖는 파일을 출력하게 되는데, C# 이외에도 모든 .NET 언어들은 컴파일과정을 거치면서 MSIL 코드를 얻기 때문에 여러 .NET 언어들을 이용해서 하나의 응용 프로그램을 만들 수 있다. 썬 마이크로시스템즈사의 자바는 현재 가장 널리 사용되는 프로그래밍 언어 중 하나이며, 컴파일러에 의해 플랫폼에 독립적인 바이트 코드를 바이너리 형태로 가지고 있는 클래스 파일을 생성하면 JVM에 의해 운영체제와 하드웨어에 독립적으로 수행이 가능한 차세대 언어이다. 본 논문에서는 임베디드 시스템에서의 적용을 위해 C#을 컴파일 하여 나오는 중간 언어 형태인 MSIL 코드를 자바의 중간언어의 한 종류인 Oolong 코드로 변환해 줌으로서 C#으로 구현된 프로그램이 자바 플랫폼에서 JVM에 의해 실행되도록 하는 MSIL-to-Oolong 번역기 시스템 구현하였다.

  • PDF

초거대 언어모델의 재치에 관한 고찰: 수수께끼 해결 능력을 중심으로 (A Study on Proficiency in Solving Riddles of Large Language Model)

  • 어수경;박찬준;문현석;서재형;허윤아;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-30
    • /
    • 2023
  • 초거대 언어모델은 과연 수수께끼 문제에 재치있는 답변을 할 수 있을까? 최근 초거대 언어모델(Large language model, LLM)은 강력한 성능 및 유저 만족도를 보이며 세계의 이목을 집중시키고 있다. 여러 태스크들에 대한 정량 평가를 넘어서 최근에는 LLM의 창의력 및 고도화된 언어능력을 평가하는 연구들이 등장하고 있다. 본 논문에서는 이러한 연구 흐름에 따라 LLM의 재치에 관해 고찰해본다. 이때 재치를 평가하기 위한 태스크로 이를 요구하는 말놀이인 수수께끼를 활용한다. 본 논문은 LLM이 수수께끼를 잘 수행하는지를 모델 추론을 통해 평가하며, 모델 추론 시 활용되는 프롬프트들의 성격에 따른 성능 변화를 관찰한다. 또한 수수께끼의 종류에 따른 모델의 능력을 비교 분석하며 LLM의 추론 결과에 대한 오류 분석을 수행한다. 본 논문은 실험을 통해 GPT-4가 가장 높은 성능을 보이며, 설명글이나 데이터 예시를 추가할 시 성능을 한층 더 향상시킬 수 있음을 확인한다. 또한 단어 기반보다는 특성 기반의 수수께끼에 더욱 강력한 성능을 보이며, 오류 유형 분석을 통해 LLM이 환각(hallucination) 문제와 창의력을 동시에 가지고 있다고 분석한다.

  • PDF

흐름 제어 언어의 통합 처리 (Integrate Processing Scheme of Flow Control Language)

  • 김태완;장천현
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.415-422
    • /
    • 2004
  • 산업분야에서 자동화 시스템은 제품의 설계, 생산 공정의 제어, 장애 처리, 품질검사 등과 관련된 처리 과정을 자동으로 수행할 수 있도록 하여 생산성을 향상시킨다. 이러한 자동화 시스템에서 감시 및 제어에 대한 처리 과정을 기술하는 언어를 흐름 제어 언어라 한다. 현재 사용되고 있는 흐름 제어 언어는 문자 기반의 IL, ST와 그래픽 기반의 FBD, SFC, LD가 있다. 일반적으로 감시 제어 시스템에서 사용되는 소프트웨어는 사용할 수 있는 흐름 제어 언어를 2종류 이하로 제한하고 있고, 동일한 시스템 환경에서는 언어의 혼용을 통한 통합 시뮬레이션이 불가능하다. 본 논문에서는 흐름 제어 언어의 특성을 분석하고 기존 시스템 환경에서 언어 작성 및 처리 과정에 대하여 분석하고, 언어의 통합 처리를 위하여 고급언어 형태의 ST를 확장한 EST 언어를 제안하였다. 이러한 연구를 기초로 그래픽 언어인 FBD, LD, SFC를 통합 처리하여 EST로 변환하는 그래픽 언어 편집기와 EST를 저급언어인 교로 변환하는 EST-IL변환기를 구현하였다. 이러한 편집기 및 변환기를 통한 교 기반의 시스템 구현 및 실험 결과는 흐름 제어 언어의 통합 처리 방안을 제시한 것이다.

한글 문서화일의 관리와 효과적인 코드변환에 관한 연구 (A Study on Hangul Text File Management and Effective Code Conversion)

  • 윤호상;손진곤;황종선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.191-196
    • /
    • 1989
  • 한글 문서화일을 작성할 때 한글코드로서 일반적으로 많이 사용되는 것은 2 Byte 완성형 코드와 2 Byte 조합형 코드이다. 이 두 코드체제는 각각 내제된 장점이 있으며 이로 인하여 많은 논란이 되어 왔으나, 두 코드체제를 이용하여 작성되는 한글 문서 화일은 여전히 늘어나고 있는 것이 현 실정이다. 이러한 배경에서 한글 문서화일의 코드변환에 관해서는 계속 연구되어 왔고 현재 여러종류의 변환프로그램이 실용화되어 있다. 본 논문에서는 기존의 변환프로그램에서 한글 문서화일을 화일 단위로 변환시키는 것을 표시난 (tag field) 개념을 도입하여 디스크 단위로 변환시킬 수 있도록 개선된 변환프로그램을 제시하였다. 아울러 코드변환시 변환이 필요한 화일을 쉽게 찾을 수 있도록 한글 문서화일에 대하여 그 작성 코드의 종류를 표시할 수 있는 DOS 명령어를 제시하였다.

  • PDF

글의 종류와 작업기억이 아동들의 글 읽기에 미치는 영향 (Effects of text types and working memory on children's comprehension)

  • 이은주;도경수
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.216-219
    • /
    • 2005
  • 언어 작업기억과 시공간 작업기억이 아동의 글 이해에 미치는 영향을 알아보기 위해 정상 아동과 읽기 지진아동들에게 두 개의 연구를 실시하였다. 연구 1에서는 글의 유형(설명글과 묘사글)별로 글 이해 정도와 언어작업기억과 시공간 잡기장 용량을 측정하여, 정상아동과 읽기 지진 아동 간에 차이가 있는지 알아보았다. 연구 2에서는 글 유형과 2차 기억과제와의 간섭효과를 측정하여 보다 직접적으로 글 유형에 따라 관여하는 작업기억의 종류가 다를 수 있는지를 알아보았다. 두 연구에서 읽기지진 아동은 묘사글을 읽을 때 시공간 작업기억을 사용하는 것을 밝혀내었다.

  • PDF

XML 기반의 유무선 인터넷 문서 변환 시스템의 설계 (A Design of the XML-based Converting System between Wired Internet and Wireless Internet)

  • 이미경;정병수;김원태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.250-252
    • /
    • 2001
  • 현재 무선인터넷 문서는 유선인터넷 문서와 호환되지 않으며 다양한 종류의 무선 마크업 언어들로 구성되어 있어서, 무선 인터넷 문서를 새롭게 구축해야하는 문제점을 가진다. 본 논문에서는 이를 해결하기 위한 방안으로 유선 인터넷 문서를 여러 종류의 문선 인터넷 문서로 변환할 수 있는 변환 시스템을 설계한다. 이 시스템은 기존의 무선 마크업 언어의 기능을 모두 지원해주는 XML응용인 XWML을 설계하여 유무선 문서의 중간모듈로 이용한다. 유선 인터넷 문서는 필터링과 포멧팅 과정을 거쳐 XWML문서로 변환된 후 문서생성모듈에서 WML, HDML mHTML등의 무선 인터넷용 문서를 생성한다. 따라서 유선 인터넷 문서를 다양한 문선인터넷 문서로 변환할 수 있기 때문에, 무선 인터넷 환경에 맞는 컨텐츠를 일일이 작성하지 않아도 되는 장점을 가진다.

  • PDF

확장된 변이 규칙을 이용한 용어의 점진적 획득 (An Incremental Acquisition of Terms Using Extended Variation Rules)

  • 정한민;김영길;최승권
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-117
    • /
    • 1998
  • 자연어 처리 응용 분야에서 다양하게 이용할 수 있는 용어들을 자동적으로 획득하고, 나아가 이 과정을 점진적으로 반복하여 수행함으로써 획득할 수 있는 용어의 수를 증가 시키고 그 용어들 간의 의미적 관계도 얻을 수 있다. 점진적인 용어 획득을 위하여 용어의 형태에 변이 규칙을 적용하여 새로운 용어를 획득하는 과정을 반복한다. 우리는 변이의 종류를 단어간의 변이 뿐만 아니라 단어 내의 변이 그리고 이 둘을 결합한 복합 변이로까지 확장하여 새로운 용어 획득 과정을 더욱 다양화하는 기법을 제시한다. 실험은 확장된 변이 규칙으로부터 얻은 용어들 중에서 기존의 단어간의 변이로부터 획득한 용어들의 비율이 전체의 38.6%라는 사실로부터 변이의 종류 및 규칙의 확장이 획득할 수 있는 용어들의 수를 증가 시킬 수 있다는 것을 보여준다.

  • PDF

Memory Network를 이용한 한국어 목적 대화 시스템 개발 (A Goal Oriented Korean Dialog System based on Memory Network)

  • 최민진;구명완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.596-599
    • /
    • 2018
  • 본 논문은 일정 등록을 위한 대화 시스템 개발에 대한 연구를 수행하였다. 기계는 사용자가 요구하는 일정 등록, 일정 수정 및 일정 삭제 등 다양한 목적에 따라 이에 맞는 API를 호출하게 된다. DSCT 6가 제안한 방법을 활용하여 호출되는 API의 종류에 따라 사람과 기계와의 대화를 task 라 불리는 여러 종류의 소규모 목적 대화로 분류하였다. 그 후 분류된 목적 task를 위해 Memory Network 개발에 대한 연구를 수행하였다. 첫 번째로 분류된 task에 대한 실행 결과 75%, 두 번째 task 88%, 세 번째 task 89%, 마지막 모든 task를 합쳤을 때 90%의 성능을 확인할 수 있었다.

  • PDF

제약기반 KBQA를 위한 질문분석 (Question Analysis for Constraint-based KBQA)

  • 허정;이형직;배경만;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.665-668
    • /
    • 2018
  • 본 논문에서는 제약기반 KBQA를 위한 질문분석 기술에 대해서 소개한다. 핵심개체와 속성에 대한 연결 모호성을 해소하기 위해서 세 종류의 제약정보 활용을 제안한다. 세 종류의 제약은 핵심개체에 기반한 제약, 의미정답유형에 기반한 제약, 속성단서에 기반한 제약이다. 제약을 위해서는 질문 내에서 핵심개체와 속성단서를 인식하여야 한다. 본 논문에서는 규칙과 휴리스틱에 기반한 핵심개체와 속성단서 인식 방법에 대해서 소개한다. 핵심개체와 속성단서 인식 실험은 구축된 229개의 질문을 대상으로 수행하였으며, 핵심개체와 속성단서가 모두 정확히 인식된 정확도(accuracy)가 57.21%이고, KBQA 대상질문에서는 71.08%를 보였다.

  • PDF