• 제목/요약/키워드: Modeling language

검색결과 1,027건 처리시간 0.031초

단어간 의존관계에 기반한 언어모델링 (Language Modeling based on Inter-Word Dependency Relation)

  • 이승미;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-246
    • /
    • 1998
  • 확률적 언어모델링은 일련의 단어열에 문장확률값을 적용하는 기법으로서 음성인식, 확률적 기계번역 등의 많은 자연언어처리 응용시스템의 중요한 한 요소이다. 기존의 접근방식으로는 크게 n-gram 기반, 문법 기반의 두가지가 있다. 일반적으로 n-gram 방식은 원거리 의존관계를 잘 표현 할 수 없으며 문법 기반 방식은 광범위한 커버리지의 문법을 습득하는데에 어려움을 가지고 있다. 본 논문에서는 일종의 단순한 의존문법을 기반으로 하는 언어모델링 기법을 제시한다. 의존문법은 단어와 단어 사이의 지배-피지배 관계로 구성되며 본 논문에서 소개되는 의존문법 재추정 알고리즘을 이용하여 원시 코퍼스로부터 자동적으로 학습된다. 실험 결과, 제시된 의존관계기반 모델이 tri-gram, bi-gram 모델보다 실험코퍼스에 대해서 약 11%에서 11.5%의 엔트로피 감소를 보임으로써 성능의 개선이 있었다.

  • PDF

SOAP-EJB 기반 협업 지원 시스템의 설계 및 구현 (A Design and Implementation of SOAP-EJB Based Collaboration Supporting System)

  • 김형선
    • 산업경영시스템학회지
    • /
    • 제25권1호
    • /
    • pp.20-28
    • /
    • 2002
  • A collaboration supporting system, which enables multi-user collaboration and communication in Internet environment, is being a new indispensable tool to compete and collaborate with business peers. A collaboration supporting system in distributed environment requires scalable and open system architecture to rapidly deploy a new technology and trends. In this paper, we propose such a collaboration supporting system where communication API is using XML(Extended Markup Language)-based SOAP(Simple Object Access Protocol)protocols, which Is independent on programming language and platform. In our system, server components are developed with EJB(Enterprise Java Beans). System analysis, design, and development are based on UML(Unified Modeling Language).

GROVE를 이용한 SGML 문서 저장 관리 시스템 설계 (Design of SGML Document Storage Management System using GROVE)

  • 정회경;안성옥;오일덕
    • 정보학연구
    • /
    • 제2권2호
    • /
    • pp.269-279
    • /
    • 1999
  • 정보화 사회에서 많은 문서가 전자화 됨에 따라 효율적인 처리를 위해 구조화된 전자 문서 처리가 요구되고 있다. 이에 SGML은 구조화된 정보를 생성하고 교환하기 위한 문서 표준으로써, 이러한 전자 문서를 보여주고 수정하며 새로운 문서를 생성하기에 알맞다. 이에 따라 대량의 구조화된 SGML 문서 정보의 저장, 관리에 관한 연구가 필요하다. 본 논문은 HyTime(Hypermedia Time-based Structuring Language)에서 정의된 GROVE(Graph Representation Of property ValuEs)를 이용하여 데이터 모델링 설계 및 SGML 문서 저장 관리 시스템 설계에 대해 기술한다.

  • PDF

FSN 기반의 대어휘 연속음성인식 시스템 개발 (Development of FSN-based Large Vocabulary Continuous Speech Recognition System)

  • 박전규;이윤근
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.327-329
    • /
    • 2007
  • This paper presents a FSN-based LVCSR system and it's application to the speech TV program guide. Unlike the most popular statistical language model-based system, we used FSN grammar based on the graph theory-based FSN optimization algorithm and knowledge-based advanced word boundary modeling. For the memory and latency efficiency, we implemented the dynamic pruning scheduling based on the histogram of active words and their likelihood distribution. We achieved a 10.7% word accuracy improvement with 57.3% speedup.

  • PDF

단어와 클래스 기반의 한국어 언어 모델링 (Word and class-based language modeling for Korean)

  • 김길연;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-225
    • /
    • 2001
  • 본 논문에서는 대량의 말뭉치를 바탕으로 한국어에 대해 단어 기반의 n-gram 언어 모델과 클래스 기반의 언어 모델을 구축하고, 이를 실험적으로 검증한다. 단어 기반의 n-gram 모델링의 경우 Katz의 백오프와 Kneser-ney의 스무딩(smoothing) 알고리즘에 대해 실험을 수행한다. 클래스 기반의 언어 모델의 경우에는 품사 태그를 단어의 클래스로 사용한 경우와 말뭉치로부터 자동으로 구축된 클래스를 사용한 경우로 나누어 실험한다. 마지막으로 단어 기반 모델과 클래스 기반 모델을 결합하여 각각의 모델과 그 성능을 비교한다. 실험 결과 단어 기반의 언어 모델의 경우 Katz의 백오프에 비해 Knerser-ney의 스무딩이 보다 조은 성능을 나타내었다. 클래스 기반의 모델의 경우 품사 기반의 방범보다 자동 구축된 단어 클래스를 이용하는 방법의 성능이 더 좋았다. 또한, 단어 모델과 클래스 모델을 결합한 모델이 가장 좋은 성능을 나타냈다. 논문의 모든 알고리즘은 직접 구현되었으며 KLM Toolkit이란 이름으로 제공된다.

  • PDF

실시간 시스템을 위한 소프트웨어 구조 설계 환경 (A Software Architecture Design Environment for Real-time Systems)

  • 강병도
    • 한국산업정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.39-47
    • /
    • 2001
  • 소프트웨어 구조는 시스템 컴포넌트들과 그들의 상호관계를 이해하기 위한 프레임워크로서 제공된다. 또한 소프트웨어 구조는 낮은 비용, 높은 생산성 및 일관된 품질을 이루기 위해 재사용 될 수 있다. 본 논문에서는 우리가 개발한 소프트웨어 구조 설계 환경인 HanyWork의 구조와 기능을 설명한다. HappyWork는 두 가지의 주요한 기능을 가진다. 첫째로 HappyWork는 소프트웨어 구조 다이어그램의 모델링을 위한 그래픽 에디터를 제공하고, 둘째로 HWL(HappyWork language)라는 소프트웨어 구조 기술 언어를 제공한다.

  • PDF

객체 중심 데이터베이스를 위한 관계성 관리 기법 및 질의어 (A Query Language and Relationship Management Techniques for Object-Oriented Databases)

  • 황수찬;이석호
    • 전자공학회논문지B
    • /
    • 제30B권4호
    • /
    • pp.11-20
    • /
    • 1993
  • In the new database applications such as office information systems, CAD/CAM, and AI, it is required to support not only fixed Is-A and Part-Of relationships but also various user-defined dynamic relationships including complicate constraints. However, existing object-oriented systems have many weaknesses in managing those complex relationships. This paper presents the Object-Oriented Relationship data Model (OORM) which is designed to provide facilities for modeling complex relationships into object oriented databases using abstraction concept. In the model, various integrity and consistency constraints related to the relationships can be also represented. And this paper presents a query language, ORSQL(Object Relationship SQL). ORSQL is a nonprocedural query language having similiar syntax to the standard SQL and supporting OORM's operations.

  • PDF

계층적 마스크 모델링을 이용한 언어 모델의 사후 학습 (Post-Training with Hierarchical Masked Language Modeling)

  • 전현규;정혜인;박서연;김봉수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.588-591
    • /
    • 2022
  • 최근 자연어 이해 및 생성에 있어서 사전학습 기반의 언어 모델이 널리 사용되고 있다. BERT, roBERTa 등의 모델이 있으며, 마스크 언어 모델링을 주요 과제로 하여 사전 학습을 한다. 하지만 MLM은 문법적인 정보를 활용하지 못하는 단점이 있다. 단 순히 무작위로 마스크를 씌우고 맞추기 때문이다. 따라서 본 연구에서는 입력 문장의 문법적 정보를 활용하는 방법을 소개하고, 이를 기반으로 사후 학습을 하여 그 효과를 확인해 본다. 공개된 사전학습 모델과 사후학습 모델을 한국어를 위한 벤치마크 데이터셋 KLUE에 대하여 조정학습하고 그 결과를 살펴본다.

  • PDF

Toon Image Generation of Main Characters in a Comic from Object Diagram via Natural Language Based Requirement Specifications

  • Janghwan Kim;Jihoon Kong;Hee-Do Heo;Sam-Hyun Chun;R. Young Chul Kim
    • International journal of advanced smart convergence
    • /
    • 제13권1호
    • /
    • pp.85-91
    • /
    • 2024
  • Currently, generative artificial intelligence is a hot topic around the world. Generative artificial intelligence creates various images, art, video clips, advertisements, etc. The problem is that it is very difficult to verify the internal work of artificial intelligence. As a requirements engineer, I attempt to create a toon image by applying linguistic mechanisms to the current issue. This is combined with the UML object model through the semantic role analysis technique of linguists Chomsky and Fillmore. Then, the derived properties are linked to the toon creation template. This is to ensure productivity based on reusability rather than creativity in toon engineering. In the future, we plan to increase toon image productivity by incorporating software development processes and reusability.

신경망 기반 텍스트 모델링에 있어 순차적 결합 방법의 한계점과 이를 극복하기 위한 담화 기반의 결합 방법 (A Discourse-based Compositional Approach to Overcome Drawbacks of Sequence-based Composition in Text Modeling via Neural Networks)

  • 이강욱;한상규;맹성현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권12호
    • /
    • pp.698-702
    • /
    • 2017
  • 자연 언어 처리(Natural Language Processing) 분야에 심층 신경망(Deep Neural Network)이 소개된 이후, 단어, 문장 등의 의미를 나타내기 위한 분산 표상인 임베딩(Embedding)을 학습하기 위한 연구가 활발히 진행되고 있다. 임베딩 학습을 위한 방법으로는 크게 문맥 기반의 텍스트 모델링 방법과, 기학습된 임베딩을 결합하여 더 긴 텍스트의 분산 표상을 계산하고자 하는 결합 기반의 텍스트 모델링 방법이 있다. 하지만, 기존 결합 기반의 텍스트 모델링 방법은 최적 결합 단위에 대한 고찰 없이 단어를 이용하여 연구되어 왔다. 본 연구에서는 비교 실험을 통해 문서 임베딩 생성에 적합한 결합 기법과 최적 결합 단위에 대해 알아본다. 또한, 새로운 결합 방법인 담화 분석 기반의 결합 방식을 제안하고 실험을 통해 기존의 순차적 결합 기반 신경망 모델 대비 우수성을 보인다.