• Title/Summary/Keyword: 다국어화

Search Result 32, Processing Time 0.029 seconds

A Study on the Improvement of Foreign User Services in Academic Library: Focusing on the K University Library (대학도서관의 외국인 서비스 개선 방안에 대한 연구 - K대학교 도서관을 중심으로 -)

  • Lee, Ji-Wook;Lee, Yong-Jae
    • Journal of Korean Library and Information Science Society
    • /
    • v.51 no.3
    • /
    • pp.281-302
    • /
    • 2020
  • This study aims to suggest the ways to improve academic library's services for foreign users. For this purpose, this study analysed foreign user services of the libraries of universities which have more than 1,000 foreign students and also examined the K university library's foreign user services. And this research classified the information services for foreign users into four types, which are multilingual library homepage, multilingual notices, librarian dedicated to foreigners and multilingual user education. This study analysed the information services of a librarian dedicated to foreigners, user education for foreign students, library space for foreigners and specialized programs for foreign users and also examined the user education satisfactory survey of the K university library and conducted in-depth interview with foreign students and faculties of the K university to figure out the effect of foreign user services. As a result, this research suggests 'providing multilingual service through positioning a librarian for foreign users', 'study and research support services through customized user education', 'developing specialized service' and 'supporting extracurricular program by academic library' as the practical ways to improve academic library's services for foreign users.

Multilingual SPLOG classification using language independent features (언어 독립적인 자질을 이용한 다국어 스플로그 분류)

  • Hong, Seong-Hak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.284-287
    • /
    • 2011
  • 블로그는 검색 서비스에 노출되는 주요 사용자 생성 콘텐트 중 하나이며 스팸과 SEO를 위한 주요 대상이 되어왔다. 최근에는 인터넷 보급의 보편화로 비영어권 국가에서의 블로그 사용자가 증가하면서 블로그 검색에서도 여러 언어로 작성된 블로그와 스팸이 노출되고 있다. 일반적인 블로그 검색엔진에서의 스팸 필터의 경우 특정 국가나 언어를 위한 스팸 필터 시스템을 각기 구성하여 이를 별도로 사용하지만이는 자원 소모의 문제와 함께 크롤을 통해 유입되는 다양한 언어로 작성된 블로그 스팸을 미리 감지하기 어렵다. 본 논문에서는 블로그를 크롤하여 서비스하는 국제화를 지원하는 블로그 검색엔진에서 스플로그를 탐지하기 위해 속성 및 단어 기반 자질들을 이용한 다국어 공용 스플로그 감지 모델을 생성 하는 방법과 효과를 확인하기 위해 실험을 수행하였으며 가능성이 있음을 확인하였다.

A Study on the Interchangeability between a Thesaurus and an Ontology (시소러스와 온톨로지의 상호 호환성에 관한 연구)

  • Cho, Hyun-Yang;Nam, Young-Joon
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.4 s.54
    • /
    • pp.27-47
    • /
    • 2004
  • In this study, the experiment was made to transform the relationship among terms in a thesaurus to ontology language as search tools for multilingual text. As a result, the equivalent relationship in the thesaurus can be expressed by different ways in the ontology, such as equivalentClass, equivalentProperty, sameAS, and so on. On the other hand, the associative relationship can be represented by ObjectProperty, DatatypeProperty, and inverseOf. For this test, first of all, the descriptors assigned by AAT and the descriptors from bilingual thesaurus by ICCD were translated into Korean. Then, the facet was used for conceptual equivalence among terms from different languages. The result of the study showed that using rdf:Property in ontology was the most effective way of transforming multilingual thesaurus into ontology.

Classification Performance Analysis of Cross-Language Text Categorization using Machine Translation (기계번역을 이용한 교차언어 문서 범주화의 분류 성능 분석)

  • Lee, Yong-Gu
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.43 no.1
    • /
    • pp.313-332
    • /
    • 2009
  • Cross-language text categorization(CLTC) can classify documents automatically using training set from other language. In this study, collections appropriated for CLTC were extracted from KTSET. Classification performance of various CLTC methods were compared by SVM classifier using machine translation. Results showed that the classification performance in the order of poly-lingual training method, training-set translation and test-set translation. However, training-set translation could be regarded as the most useful method among CLTC, because it was efficient for machine translation and easily adapted to general environment. On the other hand, low performance was shown to be due to the feature reduction or features with no subject characteristics, which occurred in the process of machine translation of CLTC.

Service factors affecting satisfaction on academic library usage of chinese students (중국인 유학생의 대학도서관 이용만족도에 영향을 미치는 서비스 요인에 관한 연구)

  • Liu, Jiayi
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2018.08a
    • /
    • pp.91-96
    • /
    • 2018
  • 교육의 국제화로 인해 국내 대학에 재학 중인 유학생의 수가 매년 증가하고 있다. 그러나 유학생들이 학습 자원을 얻기 위한 가장 큰 정보원인 대학도서관은 유학생들을 위한 다국어 지원 서비스를 충분히 제공하고 있지 않은 상황이다. 따라서 본 연구에서는 대학도서관에서 제공하는 서비스 중 다국어 지원이 가능한 서비스 요인들을 선정하고 해당 요인들이 유학생들의 대학도서관 이용 만족도에 미치는 영향을 파악하고자 하였다. 이를 위해 먼저 선행연구를 바탕으로 사서/직원의 서비스(응답능력, 태도), 도서관 시설 이용(시설 안내, 장비 사용), 자료 접근 및 이용(홈페이지, 서가 배치), 이용자 서비스(이용자교육, 기타서비스)를 요인을 도출하였고 회귀분석을 실시하였다. 연구 결과에 따르면 도서관 시설 이용이 대학도서관 이용 만족도에 가장 큰 영향을 미치고 있었으며 사서/직원의 서비스와 이용자 서비스 또한 영향을 미치는 것으로 나타났다.

  • PDF

Multi-lingual Emergency Alert Service by Terrestrial Broadcasting Network (지상파 방송을 활용한 다국어 재난경보 서비스)

  • Suh, Young-Woo;Kwak, Chunsub
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.495-496
    • /
    • 2020
  • 재난상황에서 통신망의 불통상황에 대비하여 지상파 방송망을 통한 재난경보메시지를 전달하는 것이 사회안전망의 구축을 위해 매우 중요하게 부각되고 있다. 특히, 사회가 국제화 되고 다양한 국가의 사람들과의 경제 교류를 통해 국내 서비스라고 할지라도 외국인을 대상으로 한 재난경보 메시지도 제공 되어야 재난 상황에서 인명 피해를 최소화 할 수 있다. 지상파 방송 시스템은 비디오 등 정규 프로그램 편성 외에 데이터 채널을 활용하여 다양한 정보를 송출할 수 있으며, ATSC 3.0 방송 시스템은 IP 방식의 데이터 송출을 통해 특정 대상을 타겟으로 정보를 보내는 것이 가능하다. 따라서 이러한 지상파 방송망을 통한 IP 데이터 송출의 장점을 잘 활용하면 재난 상황에서 적은 데이터를 가지고도 효율적으로 다양한 언어로 국민들에게 안전 정보를 보낼 수 있다. 이를 통해 국내 거주 외국인들이 재난에 대비하는데 크게 기여할 수 있다. 본 연구는 디지털 방송망을 통해 다국어 재난메시지를 보내기 위한 효율적인 방법을 제안한다.

  • PDF

Knowledge Transfer in Multilingual LLMs Based on Code-Switching Corpora (코드 스위칭 코퍼스 기반 다국어 LLM의 지식 전이 연구)

  • Seonghyun Kim;Kanghee Lee;Minsu Jeong;Jungwoo Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.301-305
    • /
    • 2023
  • 최근 등장한 Large Language Models (LLM)은 자연어 처리 분야에서 눈에 띄는 성과를 보여주었지만, 주로 영어 중심의 연구로 진행되어 그 한계를 가지고 있다. 본 연구는 사전 학습된 LLM의 언어별 지식 전이 가능성을 한국어를 중심으로 탐구하였다. 이를 위해 한국어와 영어로 구성된 코드 스위칭 코퍼스를 구축하였으며, 기본 모델인 LLAMA-2와 코드 스위칭 코퍼스를 추가 학습한 모델 간의 성능 비교를 수행하였다. 결과적으로, 제안하는 방법론으로 학습한 모델은 두 언어 간의 희미론적 정보가 효과적으로 전이됐으며, 두 언어 간의 지식 정보 연계가 가능했다. 이 연구는 다양한 언어와 문화를 반영하는 다국어 LLM 연구와, 소수 언어를 포함한 AI 기술의 확산 및 민주화에 기여할 수 있을 것으로 기대된다.

  • PDF

마켓플레이스간 거래에 있어서 ebXML 등록저장소의 역할 및 기능

  • 김종락
    • Proceedings of the CALSEC Conference
    • /
    • 2002.01a
    • /
    • pp.272-275
    • /
    • 2002
  • 국제간 전자상거래 거래 주체(여기에는 이를 테면 Buyer, Seller, Market 등)가 쉽게 사용할 수 있도록 단순하고 보편화된 XML 기반의 상호 호환 가능한 솔루션 전자거래 수행 비용을 최소화 할 수 있는 솔루션 다국어가 지원되는 솔루션 국내 및 국제 교역 요건(Infra Structure 요건)을 수용하는 솔루션 업종 중심의 Vertical Market과 수평마켓을 지원하고 특히 SME를 지원할 수 있는 솔루션(중략)

  • PDF

Automatic Structuralization of Thesaurus (시소러스 자동 구조화)

  • 김해수;이남경;이원규
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.97-100
    • /
    • 1994
  • 정보과학 분야에서 필요로 하는 의미해석 기술 개발에 중요한 역할을 하는 것이 시소러스이다. 정확한 관계 정의 및 대량정보 수용의 필요성은 시소러스 구축의 커다란 장애 요인이다. 시소러스 구축에은 다방면의 전문지식 활용과 막대한 비용 및 시간 투자가 요구된다. 기계적으로 관리 운영이 가능한 시소러스내의 관계는 BT, NT로 표현되는 계층관계와 USE, UF로 표현되는 등가관계로 이루어 진다. 본 연구는 개념적인 관계를 정의하는 두 관계를 기계적으로 추출하고, 기존의 평면적인 시소러스 구조를 실세계의 정보 구조에 적합하게 조직화하여 시소러스 구축에 있어서의 문제점을 개선하는데 그 목적이 있다. 제시되는 알고리즘은 단일 언어내의 시소러스 구축 뿐만 아니라, 구축된 시소러스들의 융합 및 다국어 시소러스 구축에도 적용된다.

  • PDF

A Method for Automatic Detection of Character Encoding of Multi Language Document File (다중 언어로 작성된 문서 파일에 적용된 문자 인코딩 자동 인식 기법)

  • Seo, Min Ji;Kim, Myung Ho
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.4
    • /
    • pp.170-177
    • /
    • 2016
  • Character encoding is a method for changing a document to a binary document file using the code table for storage in a computer. When people decode a binary document file in a computer to be read, they must know the code table applied to the file at the encoding stage in order to get the original document. Identifying the code table used for encoding the file is thus an essential part of decoding. In this paper, we propose a method for detecting the character code of the given binary document file automatically. The method uses many techniques to increase the detection rate, such as a character code range detection, escape character detection, character code characteristic detection, and commonly used word detection. The commonly used word detection method uses multiple word database, which means this method can achieve a much higher detection rate for multi-language files as compared with other methods. If the proportion of language is 20% less than in the document, the conventional method has about 50% encoding recognition. In the case of the proposed method, regardless of the proportion of language, there is up to 96% encoding recognition.