• Title/Summary/Keyword: Language Conversion

검색결과 200건 처리시간 0.024초

21세기 세종계획 원시 말뭉치의 유니코드와 코드 변환 (Unicode and Code Conversion for Sejong 21 Raw Corpus)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.262-265
    • /
    • 2009
  • 21세기 세종계획은 국어정보화를 위한 범국가적 사업으로서 국어 기초 자원을 구축하는데 매우 큰 기여를 하였으며, 그 주요 결과물로 배포된 세종 말뭉치는 많은 연구자들에게 꼭 필요한 가치있는 결과물이다. 이처럼 소중한 국어 자원을 실제 연구자들이 활용하고자 할 때 불편함을 느끼는 경우가 있는데 그 이유는 균형 말뭉치의 구축이라는 말뭉치의 특성 및 원문 자료의 내용을 최대한 보존하기 위한 노력의 일환으로 사용자 정의 영역에 정의된 문자들이 다수 포함되어 있기 때문이다. 본 논문에서는 자연언어 처리, 정보검색 분야 연구자들이 세종계획 최종 결과물 중에서 원시 말뭉치를 활용하는데 있어서 말뭉치에 사용된 문자코드의 유형을 중심으로 코드 변환 문제점과 그 해결 방안을 모색하고자 한다.

  • PDF

한국어(韓國語) 규칙(規則) 음성(音聲) 합성(合成) 시스템의 구현(具現) (The Design and Implementation of Korean Text-to-Speech Conversion System on a Rule-Based Framework)

  • 손영택;김용갑;송본달랑
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.141-148
    • /
    • 1993
  • 본고는, 한글 한자가 혼용된 입력 텍스트를 음성으로 변환 출력하는 포르만트 음성 합성 방식 즉, 한국어 규칙 음성 합성(이하에는 KTTS[Korean Text To Speech System]이라고 함)의 전반적인 처리 흐름에 대하여 소개한다. 특히, 입력 텍스트에 있어서, 한자 또는 각종 부호의 한글 변환 기능, 음성 출력용 문법 정보 추출에 필요한 입력문의 해석 및 구문경계 설정 기능, 또한 음소 기호 변환 및 파라메터 값 생성과 변경 처리기능을 중심으로 설명하고자 한다. 또한 본 시스템의 완성과 더불어 실시하였던 청취 실험 평가 결과에 대하여 덧붙이겠다.

  • PDF

UML 다이어그램의 XML 문서 변환에 관한 연구 (A study on Conversion of UML Diagram to XML Documents)

  • 이정석;박해우;강병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1601-1604
    • /
    • 2003
  • XML(eXtensible Markup Language) 프로그램이나 XML을 이용한 B2B 시스템 구축과 같은 XML 프로젝트에서는 객체 지향적 설계언어인 UML을 이용해 개발하면 효율을 높일 수 있다. UHL(Unified Modeling Language)로 XML문서 구조를 표현하는 이유는 XML문서를 생성, 접근, 수정하는 XML프로그램을 체계적이고 효율적으로 설계할 수 있기 때문이다. DTD(Document Type Declaration)와 스키마(Schema)를 UML로 표현함으로써 프로그래밍을 통합적으로 추진 할 수 있다. 이러한 과정에서 XML의 문서 구조정보의 활용 증대와 UML의 확장이라는 이점을 취할 수 있다. 본 논문에서는 UIML 기반의 다이어그램에서 XML 문서서로의 변환기에 대한 모델을 제안한다.

  • PDF

Embedded ARM Processor를 이용한 MPEG-4 Simple Profile Decoder의 구현 (The Implementation of MPEG-4 Simple Profile Decoder using the Embedded ARM Processor)

  • 박성욱
    • 전기학회논문지P
    • /
    • 제52권2호
    • /
    • pp.85-90
    • /
    • 2003
  • This paper has presented the efficient implementation of MPEG-4 simple profile video decoder, which is used as video compression standard in mobile video communication. We have used the ARM9 processor in implementing this MPEG-4 simple profile, which requires much processing power and low power implementation. At first we implemented with C-language under the PC environment with ADS(ARM Developer Suite) environment, and then we have tried to reduce a clock cycle for a power consumption optimization through conversion an assembly language for C-code partly. We have verified the processor is operated at 22.47MHz operation after optimization, but 148MHz before optimization.

Java DOM Parsers to Convert KGML into SBML and BioPAX Common Exchange Formats

  • Lee, Kyung-Eun;Jang, Myung-Ha;Rhie, A-Rang;Thong, Chin Ting;Yang, San-Duk;Park, Hyun-Seok
    • Genomics & Informatics
    • /
    • 제8권2호
    • /
    • pp.94-96
    • /
    • 2010
  • Integrating various pathway data collections to create new biological knowledge is a challenge, for which novel computational tools play a key role. For this purpose, we developed the Java-based conversion modules KGML2SBML and KGML2BioPAX to translate KGML (KEGG Markup Language) into a couple of common data exchange formats: SBML (Systems Biology Markup Language) and BioPAX (Biological Pathway Exchange). We hope that our work will be beneficial for other Java developers when they extend their bioinformatics system into SBML- or BioPAX-aware analysis tools. This is part of our ongoing effort to develop an ultimate KEGG-based pathway enrichment analysis system.

Text-To-Vision Player - Converting Text to Vision Based on TVML Technology -

  • Hayashi, Masaki
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.799-802
    • /
    • 2009
  • We have been studying the next generation of video creation solution based on TVML (TV program Making Language) technology. TVML is a well-known scripting language for computer animation and a TVML Player interprets the script to create video content using real-time 3DCG and synthesized voices. TVML has a long history proposed back in 1996 by NHK, however, the only available Player has been the one made by NHK for years. We have developed a new TVML Player from scratch and named it T2V (Text-To-Vision) Player. Due to the development from scratch, the code is compact, light and fast, and extendable and portable. Moreover, the new T2V Player performs not only a playback of TVML script but also a Text-To-Vision conversion from input written in XML format or just a mere plane text to videos by using 'Text-filter' that can be added as a plug-in of the Player. We plan to make it public as freeware from early 2009 in order to stimulate User-Generated-Content and a various kinds of services running on the Internet and media industry. We think that our T2V Player would be a key technology for upcoming new movement.

  • PDF

PDF를 활용한 고문헌의 원문디지털화 방안에 대한 고찰 (Study on Methods of Digitalization of Older Books Using PDF)

  • 리상용
    • 한국문헌정보학회지
    • /
    • 제34권1호
    • /
    • pp.133-153
    • /
    • 2000
  • 본 논문은 1999년 4월에 출시된 Acrobat 4.0에서 지원하는 PDF(Portable Document Format)를 이용해서 고문헌의 원문을 디지털화하여, 웹상에서 이용자가 고문헌의 원문을 손쉽게 검색할 수 있도록 하기 위한 방안에 대해 연구한 것이다. 이전의 Acrobat 3.0판은 한글 지원에 문제가 많았으나, 이번에 개정된 4.0판에서는 다국어폰트의 지원으로 한글, 중국어, 일본어 등의 PDF변환이 가능해졌다. 따라서 <한글97>(속칭<아래아 한글>)로 구축된 고문헌의 원문파일을 PDF로 변환은 물론 편집도 가능하게 되었다. PDF파일의 뷰어인 Acrobat Reader는 웹상에서 무상으로 다운로드 받을 수 있으므로, 이 PDF를 이용하여 고문헌의 원문을 디지털화 한다면, 향후 개선되어야 할 문제가 있긴 하지만, 이용자가 인터넷상에서 손쉽게 고문헌의 원문을 검색할 수 있게 될 것이다.

  • PDF

이동통신환경에서 XHTML을 이용한 무선인터넷 문서변환기 분석 및 구현 (Analysis and Implementation of a Web Document Converter for Wireless Internet Use XHTML On Mobile Communication Environment)

  • 백진영;이종옥;조성언;조경룡
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 추계종합학술대회
    • /
    • pp.105-108
    • /
    • 2001
  • 본 논문은 사용자가 휴대용 단말기를 이용하여 기존의 웹에 접속시 웹서버내의 XHTML 문서를 WML 문서로 변환하는 도구의 설계·구현을 목적으로 한다. 사용자가 XHTML(또는 기존의 HTML문서)의 웹페이지에 접속해 정보를 요청하게 되면 본 문서 변환기는 XHTML 문서 구조를 인식하고, 기준이 되는 기준 텍스트 정보를 추출하여 이를