• Title/Summary/Keyword: 기호로서의 언어

Search Result 224, Processing Time 0.025 seconds

Korean phrase structure parsing using sequence-to-sequence learning (Sequence-to-sequence 모델을 이용한 한국어 구구조 구문 분석)

  • Hwang, Hyunsun;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.20-24
    • /
    • 2016
  • Sequence-to-sequence 모델은 입력열을 길이가 다른 출력열로 변환하는 모델로, 단일 신경망 구조만을 사용하는 End-to-end 방식의 모델이다. 본 논문에서는 Sequence-to-sequence 모델을 한국어 구구조 구문 분석에 적용한다. 이를 위해 구구조 구문 트리를 괄호와 구문 태그 및 어절로 이루어진 출력열의 형태로 만들고 어절들을 단일 기호 'XX'로 치환하여 출력 단어 사전의 수를 줄였다. 그리고 최근 기계번역의 성능을 높이기 위해 연구된 Attention mechanism과 Input-feeding을 적용하였다. 실험 결과, 세종말뭉치의 구구조 구문 분석 데이터에 대해 기존의 연구보다 높은 F1 89.03%의 성능을 보였다.

  • PDF

The Design and Implementation of Korean Text-to-Speech Conversion System on a Rule-Based Framework (한국어(韓國語) 규칙(規則) 음성(音聲) 합성(合成) 시스템의 구현(具現))

  • Son, Yung-Taek;Kim, Yong-Kap;Matsumoto, Tatsuro
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.141-148
    • /
    • 1993
  • 본고는, 한글 한자가 혼용된 입력 텍스트를 음성으로 변환 출력하는 포르만트 음성 합성 방식 즉, 한국어 규칙 음성 합성(이하에는 KTTS[Korean Text To Speech System]이라고 함)의 전반적인 처리 흐름에 대하여 소개한다. 특히, 입력 텍스트에 있어서, 한자 또는 각종 부호의 한글 변환 기능, 음성 출력용 문법 정보 추출에 필요한 입력문의 해석 및 구문경계 설정 기능, 또한 음소 기호 변환 및 파라메터 값 생성과 변경 처리기능을 중심으로 설명하고자 한다. 또한 본 시스템의 완성과 더불어 실시하였던 청취 실험 평가 결과에 대하여 덧붙이겠다.

  • PDF

Correction for Hangul Normalization (올바른 한글 정규화를 위한 수정 방안)

  • Ahn, Dae-Hyuk;Park, Young-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.73-80
    • /
    • 2006
  • 현재 유니코드에서 한글텍스트의 정규화 기법은 완성형 현대한글 음절과 옛 한글을 표현하는 조합형 한글 그리고 호환 자모등과 같이 사용할 경우 원래의 글자와는 전혀 다른 글자의 조합을 만들어내는 문제점이 있다. 이러한 문제점은 호환 한글 자모 및 기호들의 잘못된 정규화 변환과 유니코드의 한글자모 조합 규칙에서 자모와 완성형 현대한글 음절을 다시 조합하여 한글음절로 사용 할 수 있게 허용한 때문이다. 이는 정규화 형식을 처음 작성할 당시 옛 한글의 사용을 고려하지 않았거나, 한글에 대한 올바른 이해가 부족한 상태에서 작성 된데 따른 결과라 하겠다. 따라서 본 연구에서는 유니코드 환경에서의 한글코드와 특히 최근 들어 Web을 비롯하여 XML과 IDN에서 필연적으로 사용하는 정규화에 따른 문제점을 파악하고 이들을 올바르게 처리하기 위한 정규화의 수정 방안과 조합형 한글의 조합규칙에 대한 수정 방안을 제안한다.

  • PDF

Object-Oriented System Modeling using IDEF3 and UML (IDEF3와 UML을 이용한 객체지향적 시스템 모델링)

  • 김병남;이영일;김태운
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.475-484
    • /
    • 2001
  • 정보시스템 구축에 있어서 적절한 시스템 분석 및 설계를 위한 모델링 기법을 활용하는 것이 중요 과제이며, 이러한 시스템 모델링 분야에서 객체지향 기법을 적용하는 것이 업계의 표준으로 인식되어 가고 있다. 통합 모델링 언어로 불리는 UML은 시스템 개발 과정에 참여하는 모든 이들이 각자의 시각에서 이해할 수 있도록 각 분야의 설계도를 그릴 수 있는 표준을 제공하고, 그래픽 요소를 조합해서 다이어그램으로 나타낼 수 있는 장점이 있으며, 객체지향 시스템 개발그룹에서 표준으로 인정받고 있는 모델링 언어이다. IDEF3는 비즈니스 프로세서를 분석하고자 시도된 최초의 방법이고, 업무를 체계적으로 분석할 수 있으며, 쓰여지는 기호의 간편함과 명료함 때문에 쉽게 표현할 수 있는 장점이 있다. 본 논문에서는 신발을 수출하고 있는 중소기업의 반 정형화(semi-structured)된 수출/무역관리 업무 프로세서에 대하여, UML과 IDEF를 이용하여 분석하고, 이에 따른 시스템 개발 방안을 제시하고자 한다.

  • PDF

Categorization and Analysis of Error Types in the Korean Speech Recognition System (한국어 음성 인식 시스템의 오류 유형 분류 및 분석)

  • Son, Junyoung;Park Chanjun;Seo, Jaehyung;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.144-151
    • /
    • 2021
  • 딥러닝의 등장으로 자동 음성 인식 (Automatic Speech Recognition) 기술은 인간과 컴퓨터의 상호작용을 위한 가장 중요한 요소로 자리 잡았다. 그러나 아직까지 유사 발음 오류, 띄어쓰기 오류, 기호부착 오류 등과 같이 해결해야할 난제들이 많이 존재하며 오류 유형에 대한 명확한 기준 정립이 되고 있지 않은 실정이다. 이에 본 논문은 음성 인식 시스템의 오류 유형 분류 기준을 한국어에 특화되게 설계하였으며 이를 다양한 상용화 음성 인식 시스템을 바탕으로 질적 분석 및 오류 분류를 진행하였다. 실험의 경우 도메인과 어투에 따른 분석을 각각 진행하였으며 이를 통해 각 상용화 시스템별 강건한 부분과 약점인 부분을 파악할 수 있었다.

  • PDF

A Study on Considerations in the Authority Control to Accommodate LRM Nomen (LRM 노멘을 수용하기 위한 전거제어시 고려사항에 관한 연구)

  • Lee, Mihwa
    • Journal of Korean Library and Information Science Society
    • /
    • v.52 no.1
    • /
    • pp.109-128
    • /
    • 2021
  • This paper is to explore considerations in authority control to accommodate LRM nomen entities through the literature reviews, the analysis of RDA rules, and the opinion survey of domestic catalog experts. As a result, for authority control, considerations were proposed in the aspect of nomen's attribute elements, catalog description, and MARC authority format. First, it is necessary to describe in as much detail as possible the category, the scheme, intended audience, the context of use, the reference source, the language, the script, the script conversion as the attributes of the nomen with the status of identification, note, and indifferentiated name indicators added in RDA. Second, the description method of attribute elements and relational elements of nomen can be unstructured, structured, identifier, and IRI as suggested in RDA, and vocabulary encoding scheme (VES) and string encoding scheme (SES) should be written for structured description, Also, cataloging rules for structuring authorized access points and preferred names/title should be established. Third, an additional expansion plan based on Maxwell's expansion (draft) was proposed in order to prepare the MARC 21 authority format to reflect the LRM nomen. (1) The attribute must be described in 4XX and 5XX so that the attribute can be entered for each nomen, and the attributes of the nomen to be described in 1XX, 5XX and 4XX are presented separately. (2) In order to describe the nomen category, language, script, script conversion, context of use, and date of usage as a nomen attribute, field and subfield in MARC 21 must be added. Accordingly, it was proposed to expand the subfield of 368, 381, and 377, and to add fields to describe the context of use and date of usage. The considerations in authority control for the LRM nomen proposed in this paper will be the basis for establishing an authority control plan that reflects LRM in Korea.

모바일한글이야기

  • Im, Yeong-Mo
    • Digital Contents
    • /
    • no.11 s.150
    • /
    • pp.60-65
    • /
    • 2005
  • 한글’은지구상문자중에서가장과학적이고독창적인글자다. 이정의에대해누구도섣불리부인하지못할것이다. 지구상의문자들을보면낱자를일렬로나열해 사용하거나, 뜻을가진낱글자하나씩을사용하는방식의문자가대부분이다. 한글처럼자음과모음이논리적으로조합되고창의적으로생성돼하나의음절을이루 는글자는찾아볼수없다. 한글의원리를하나씩이해해나가다보면조상들의뛰어난창의력에저절로감탄이나온다. ‘ 생각’은‘ 언어’를통해서하게되며, 이언어 를기록하고전달하기위해서는‘ 문자’라는가시적인기호가필요하다. 이번호에서는민족의얼을담고있는우리말‘ 한글’이모바일환경에서어떤모습으로나타 나는지알아보고자한다.

  • PDF

포인트 / XML 기반의 수식 및 표현 및 처리 : MathML

  • Jo, Hyeon-Ju
    • Digital Contents
    • /
    • no.12 s.91
    • /
    • pp.74-79
    • /
    • 2000
  • 데이터베이스에서 기초정보로 포함되는 여러가지 수학 기호와 수식은 일반 문자들과는 다른 독특한 처리 방법을 필요로 한다. 워드프로세서에 포함되어 있는 수식 편집기가 이런 기능을 처리하는 대표적 예인데, 과학기술분야에서는 이전부터 TeX과 Tex의 매크로 패키지인 LaTeX의 규칙이 많이 이용되고 있다. 이외에도 한글의 수식편집기에도 사용되는 eqn, SGML계열의 수식 DTD등 수식표현을 위한 문법은 여러가지가 있다. 과학기술분야의 출판물이나 학술지 제공 서비스는 웹상으로 옮겨가는 추세이며, 다양한 애플리케이션간의 데이터 교환 언어로 XML이 부상하고 있다.

  • PDF

국제우주정거장 데이터 인터페이스 시뮬레이터의 UML 분석

  • 서석배;김종우;이주희;김연규;최기혁;최해진
    • Bulletin of the Korean Space Science Society
    • /
    • 2004.04a
    • /
    • pp.50-50
    • /
    • 2004
  • UML (Unified Modeling Language)은 정해진 기호와 다이어그램을 사용하여 개발할 시스템에 대한 비전을 가지도록 하며, 시스템에 관여하는 사람들에게 자신의 비전을 알리고 의견을 얻을 수 있도록 도와주는 언어이다. 본 논문에서는 이미 설계가 완료되고 구현의 막바지에 이른 국제우주정거장 (ISS; International Space Station)을 위한 데이터 인터페이스 시뮬레이터를 ULM을 이용하여 표현한다. (중략)

  • PDF

화제의 책속으로 - '미래는 어떻게 오는가'

  • Korean Federation of Science and Technology Societies
    • The Science & Technology
    • /
    • v.33 no.11 s.378
    • /
    • pp.88-90
    • /
    • 2000
  • 이 책은 생물학ㆍ정치학ㆍ철학ㆍ물리학ㆍ진화심리학ㆍ언어학ㆍ정신분석학ㆍ경제학ㆍ인류학ㆍ기호학ㆍ문학평론ㆍ인공두뇌 등 각 분야의 세계적인 석학 30인들의 21세기 전망서다. 그들은 2100년까지 어떤 학문적인 돌파구가 마련되며 그것이 우리 사회에 어떤 영향을 미칠 것인가에 화두의 초점을 맞춰 대부분 구체적인 예를 들어 정확한 언어로 먼 미래를 예측하였다. 내용이 방대하기 때문에 이미 현대생활에 큰 영향을 미치고 있는 정보기술, 생명과학분야를 요약한다.

  • PDF