• Title/Summary/Keyword: 언어 분석

Search Result 4,670, Processing Time 0.026 seconds

An Executable File Format for Virtual Machine (가상 기계를 위한 실행 파일 포맷)

  • Cheong, Han-Jong;Yum, Sung-Lim;Oh, Se-Man
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11b
    • /
    • pp.647-650
    • /
    • 2003
  • 가상 기계 개념은 목적 기계에 영향을 받지 않는 컴파일러의 중간언어로부터 시작되었다. 즉, 기존에는 실행 프로그램이 하드웨어와 운영체제에 종속적이었으나 가상 기계는 플랫폼 독립을 가능하게 한다. 임베디드 시스템이란 전용 동작을 수행하거나 또는 특정 임베디드 소프트웨어 응용 프로그램과 함께 사용되도록 디자인된 특정 컴퓨터 시스템 또는 컴퓨팅 장치를 말한다. 임베디드 시스템을 위한 가상 기계 기술은 모바일 장치와 디지털-TV 등에 탑재할 수 있는 핵심 기술과 다운로드 솔루션을 이용한 동적인 실행 기술이 요구된다. 또한 컨텐츠 개발을 쉽게 하기 위해서 다양한 언어를 지원하고 언어들 간의 통합이 가능하다. 본 논문에서는 클래스 파일 포맷, PE 파일 포맷 등 기존의 가상 기계를 위한 파일 포맷들의 분석을 기반으로 하여 임베디드 시스템을 위한 실행 파일 포맷인 EVM 파일 포맷을 제안한다. EVM 파일 포맷은 언어 통합을 지원하고 구조가 간결하며 확장이 용이한 특징을 지닌다. 또한 메타데이터와 중간언어(SIL)가 서로 독립적으로 구성되어 분석이 쉽고 타입 체크가 괸리한 구조이다.

  • PDF

Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems (담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용)

  • Lee, Ho-Joon;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

Saken: A Korean Event Recognizer (Saken: 한국어 사건 인식 시스템)

  • You, Hyun-Jo;Kim, Moonhyung;Junho, Juliano P.;Nam, Seungho;Shin, Hyopil
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.25-30
    • /
    • 2009
  • 한국어 자연언어 텍스트에서 사건을 자동으로 인식하기 위한 Saken 태거를 소개하고자 한다. Saken 태거는 한국어 사건 및 시간의 자동 인식을 위한 시스템인 한국어 TARSQI 툴킷을 구성하는 하나의 모듈로 개발된 것이나 독립적으로 사건 추출 도구로 사용될 수도 있다. Saken 태거는 미리 구축된 사건의 목록이나 특정 도메인으로 적용 대상을 제한하지 않고 보편적으로 사용될 수 있는 사건 분석기를 지향하고 있다. 이 논문에서는 사건 태깅을 위한 언어학적 배경과 Saken 태거를 구성하는 세부 모듈을 소개하고 신문 기사를 이용한 평가 실험 결과를 분석할 것이다.

  • PDF

Analysis and Reconstruction of Temporal Relations in Multimedia Fairy Tales for Digital Cinematography (디지털 영상 기법을 위한 자연언어 멀티동화 시간 관계 분석 및 재현)

  • Jang, Se-Min;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.309-316
    • /
    • 2002
  • 동화는 사건의 흐름에 따라서 이야기를 진행시킨다. 그러나 독자인 어린이들의 관심을 지속적으로 유지하기 위하여 사건을 실제 순서와 다르게 배치해놓아 극적 효과를 꾀하는 경우가 많이 있다. 동화를 애니메이션으로 생성하는데 있어서 이러한 사건의 배치에 담긴 작가의 의도를 제대로 파악하는 것은 중요한 문제이다. 본 논문에서는 이처럼 사건의 흐름을 파악하고 이를 활용하기 위해서 다루어야 할 언어적 요소들에 대하여 살펴보고, 결합범주문법을 사용하여 동화에서 나타나는 시간 관계를 분석한다. 또한 각 시간 관계에 따라 애니메이션 효과를 높이기 위한 영상 기법을 제안하고 이를 이용하여 시간 관계를 재현하는 시스템을 설명한다.

  • PDF

Word Alignment Using Chinese-Korean Linguistic Contrastive Information (중-한 대조분석정보를 이용한 단어정렬)

  • Li, Jin-Ji;Kim, Dong-Il;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.40-46
    • /
    • 2002
  • 본 논문에서는 범용 병렬코퍼스에서도 적용할 수 있는 단어정렬의 방법을 제안한다. 단어 단위로 정렬된 병렬코퍼스는 자연언어처리의 다양한 분야에 도움을 준다. 예를 들면 변환기반의 기계번역에서 변환패턴의 구축, MWTU(Multi Word Translation Unit)의 자동추출, 사전 구축, 의미 중의성 해소 등 분야에 적용된다. 중한 병렬 코퍼스의 단어정렬은 서로 다른 어족간의 관계의 규명을 포함하고 있기 때문에 본 논문에서는 통계적인 모델보다 중한 대역어 사전, 단일어 시소러스, 품사정보 및 언어학적 대조분석 정보 등 기존에 있는 리소스를 이용하여 재현율과 정확률을 높이는 방법에 대해 제시한다. 성능 평가를 위해 중앙일보에서 임의로 추출한 500개 대응문장을 이용하여 실험한 결과 82.2%의 정확률과 64.8%의 재현율을 보였다.

  • PDF

Lexicon Analysis Method for Basic Lexicon Construction included 7th Mother Language Text Books of Element School (기초 어휘 선정을 위한 초등학교 국어 교과서에 등장하는 어휘 분석 방안)

  • Chae, Young-Soog;Chae, Young-Hee
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.98-102
    • /
    • 2002
  • 초등학교 교과서에 사용된 어휘의 수준을 보기 위해 교과서에 쓰인 어휘의 사용 빈도를 포함하여 결정에 영향력을 미칠 요소를 파악하고 요소간의 관계를 설립하여 교육용 어휘 설정의 나아갈 방향을 제시하는데 목적이 있다. 7차 교육과정에 있는 초등학교 교과서에서 국어 어휘 교육 관련 항목을 살펴 이들의 단계별 학습 수준의 고려가 이루어져 있는지를 검토하고자 한다. 수준별 교육 과정에서 밝히고 있는 어휘 의미 교육의 위계가 세부적이고 치밀한 수준의 적정성을 바탕으로 하여 구성되어 있는지를 검토하고 초등학교 교육용 어휘 선정의 문제 분석을 통해 기본 어휘와 기초 어휘 분류의 적정 기준과 학습 활동에 있어 언어 사용 능력으로서의 어휘력과 언어 체계 속의 어휘력을 구분할 필요가 있음을 설명하고자 한다.

  • PDF

Korean Morpheme Restoration and Segmentation based on Transformer (트랜스포머 기반 한국어 형태소 원형복원 및 분리)

  • Hyeong Jin Shin;Jeongyeon Park;Jae Sung Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.403-406
    • /
    • 2022
  • 최근 한국어 언어 모델이나 단어 벡터 생성 등에서는 효과적인 토큰을 만들기 위해 품사 태그 없이 형태소 열만을 사용하고 있다. 본 논문에서는 입력 문장에 대해 품사 태그열 생성없이 형태소 열만을 직접 출력하는 효율적인 모델을 제안한다. 특히, 자연어처리에서 적합한 트랜스포머를 활용하기 위해, 입력 음절과 원형 복원된 형태소 조각이 1:1로 대응되는 새로운 형태소 태깅 방법을 제안한다. 세종 품사 부착 말뭉치를 대상으로 평가해 본 결과 공개 배포되어 있는 기존 형태소 분석 모델들보다 형태소 단위 F1 기준으로 약 7%에서 14% 포인트 높은 성능을 보였다.

  • PDF

Study on customized empathetic response patterns for Chatbots: focusing on MBTI psychological functions ST, NF (챗봇을 위한 성향별 청자의 공감적 반응 패턴 연구 - MBTI 심리기능 분류 ST, NF를 중심으로)

  • Jimin Seong;Hansaem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.44-49
    • /
    • 2023
  • 이 연구는 MBTI 심리기능을 근거로 사용자 유형을 ST와 NF로 구분하고, 그룹별로 나눈 일상대화를 전사 후 분석하여 대화에서 나타나는 청자의 공감적 반응이 성향에 따라 차별화되는 점을 발견하고 이를 챗봇 대화 실험에 적용하여 분석결과의 유효성을 귀납적으로 증명하였다. 고성능의 초대규모 생성모델을 필두로 한 채팅 에어전트 구현이 보편화된 시점에서 진정 가치있는 대화 모델은 유창한 언어 구사 능력뿐만 아니라 사용자의 성향에 적합한 만족스러운 대화 경험을 제공할 수 있어야 함을 시사한다. 이 연구는 리얼월드의 대화 방식을 모방하여 챗봇 대화로 재현하였다는 점에서 실질적인 B2C 대화 서비스의 질적 향상에 기여도가 높을 것으로 기대된다.

  • PDF

Analyzing Korean hate-speech detection using KcBERT (KcBERT를 활용한 한국어 악플 탐지 분석 및 개선방안 연구)

  • Seyoung Jeong;Byeongjin Kim;Daeshik Kim;Wooyoung Kim;Taeyong Kim;Hyunsoo Yoon;Wooju Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.577-580
    • /
    • 2023
  • 악성댓글은 인터넷상에서 정서적, 심리적 피해를 주는 문제로 인식되어 왔다. 본 연구는 한국어 악성댓글 탐지 분석을 위해 KcBERT 및 다양한 모델을 활용하여 성능을 비교하였다. 또한, 공개된 한국어 악성댓글 데이터가 부족한 것을 해소하기 위해 기계 번역을 이용하고, 다국어 언어 모델(Multilingual Model) mBERT를 활용하였다. 다양한 실험을 통해 KcBERT를 미세 조정한 모델의 정확도 및 F1-score가 타 모델에 비해 의미 있는 결과임을 확인할 수 있었다.

  • PDF

Implementation of Modularized Morphological Analyzer (모듈화된 형태소 분석기의 구현)

  • Lee, Woon-Jae;Kim, Sun-Bae;Kim, Gil-Yeon;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.123-136
    • /
    • 1999
  • 자연언어처리 분야에서 형태소 분석은 가장 기본적인 단계로서 응용 시스템의 목적에 따라 사용되는 형태소 분석기의 수준과 사용 정보가 달라진다. 기존의 형태소분석기의 기능을 다른 목적을 지닌 응용 시스템에서 사용하려 할 때, 분석수준과 사용정보의 이질성으로 인해 변경 또는 확장하는데 많은 어려움이 있다. 이러한 형태소 분석기의 변경과 확장에 대한 다양한 요구를 수용하기 위한 방법으로서 재사용가능한 모듈화된 형태소 분석기의 구현을 제안한다. 모듈화된 형태소 분석기는 구성 요소인 모듈들의 독립성과 재사용성을 보장하기 때문에 확장과 보수가 쉽고, 특정한 요구사항에 대하여 새로운 형태소 분석기를 구현하는데 기존의 모듈들을 사용함으로써 시스템의 개발 시간을 단축시킨다. 본 논문에서는 이러한 모듈들의 사용성을 보여주기 위해 전처리기, 형태소 분석기, 명사 추출기, 태거 등을 하나의 시스템 안에 모듈화된 개념으로 구현하였고, 형태소 분석기는 사전, 음운 변화 처리, 결합 검사, 분석 알고리즘 등을 모듈화하여 재사용할 수 있다는 것을 보여준다.

  • PDF