• 제목/요약/키워드: Language Resources

검색결과 430건 처리시간 0.03초

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

한국 해외투자 현지법인의 인재등용 방안에 관한 연구 (A Study of Localization of Human Resources Recruitment in the Overseas Investment of the Korean Firms)

  • 김희수
    • 정보학연구
    • /
    • 제10권2호
    • /
    • pp.11-27
    • /
    • 2007
  • This thesis is analysing localization of human resources recruitment in the overseas investment of the Korean firms. The main results of the analysis can be summarized as follows: first, Korean overseas local corporations have achieved localization for physical workers. But localization above middle manager level is very poor. Second, local corporations are managed by the employee from Korean parent company. Third, parent company mentioned language ability, work process ability of local business, responsibility, leadership as selection basis for the workers in overseas local corporations. Localization propel strategy of local corporation human resources recruiting : (1) human resources recruiting strategy is the strategy of outsider. simple global human resources recruiting strategy is the recruiting of person dispatched from headquarter rather than local human resources (2) human resources recruiting strategy is the strategy of multidomestication. multidomestication human resources recruiting strategy is the strategy to use in case of stabilization in local area.

  • PDF

비동기회로 합성을 위한 병행 프로그램의 페트리 넷으로의 변환 (Translating concurrent programs into petri nets for synthesis of asynchronous circuits)

  • 유동훈;이동익
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 하계종합학술대회논문집
    • /
    • pp.883-886
    • /
    • 1998
  • We introduce a high level synthesis methodlogoy for automatic synthesis of asynchronous circuits form a language based on CSP. The input language is a high level concurrent algorithmic specification that can model complex concurrent control flow, logical and arithmetic computation and communications between them. This specification is translated into petri net which has actions. These actions are refined to synthesize the controllers and to allocate the data resources. We use the automatic synthesis through signal transition graphs (STGs) that allows to take advantage of logic synthsis methods to optimize the circuit.

  • PDF

Resources for assigning MeSH IDs to Japanese medical terms

  • Tateisi, Yuka
    • Genomics & Informatics
    • /
    • 제17권2호
    • /
    • pp.16.1-16.4
    • /
    • 2019
  • Medical Subject Headings (MeSH), a medical thesaurus created by the National Library of Medicine (NLM), is a useful resource for natural language processing (NLP). In this article, the current status of the Japanese version of Medical Subject Headings (MeSH) is reviewed. Online investigation found that Japanese-English dictionaries, which assign MeSH information to applicable terms, but use them for NLP, were found to be difficult to access, due to license restrictions. Here, we investigate an open-source Japanese-English glossary as an alternative method for assigning MeSH IDs to Japanese terms, to obtain preliminary data for NLP proof-of-concept.

한국어의 탈지역과 한국적 이산의 미학 (Displacement of the Korean Language and the Aesthetics of the Korean Diaspora)

  • 임진희
    • 영어영문학
    • /
    • 제54권1호
    • /
    • pp.149-167
    • /
    • 2008
  • Korea has persisted in the notion of "ethnic nationalism." That is "one race, one people, one language" as a homogeneous entity. This social ideal of unity prevails, even in overseas Korean communities formed by voluntary and involuntary displacement in the turmoil of modern history: communities made intermittent with the Japanese colonial occupation and with postcolonial encounters with the West. Given that the Korean people suffered from the trauma of deprivation of the language caused by the loss of the nation, nation has been equated with the language. Accordingly, "these bearers of a homeland" are also firm Korean language holders. The linguistic patriotism of unity based on the intertwining of "mother tongue" and "father country" has become prevalent in the collective memory of the people of the Korean diaspora. Korean American literature has grappled with this concept of the national history of Korea and the Korean language. The aesthetics of Korean American literature has been marked by an influx of literary resources of 'Korea' in sensibilities and structure of feelings; Korean myth, folk lore, songs, humor, traditional stories, manners, customs and historic moments. An experimental use of the Korean alphabet, Hangeul, written down as pronounced, provides an ethnic flavor in the midst of the English texts. Despite its national framework of mind, however, Korean American literature as an interstitial art reveals a keen awareness of inbetweenness, and transnational hybrid identities. By exploring the complex interrelationships of cultural and linguistic boundary-crossing practices in Korean American literature, this paper argues that the poetics of the Korean diaspora challenges the closed structure of identity formation, and offers a transnational sphere to deconstruct a rigidly demarcated national ideology of "one race, one people, one language," for the world literary history.

COMPUTER AND INTERNET RESOURCES FOR PRONUNCIATION AND PHONETICS TEACHING

  • Makarova, Veronika
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2000년도 7월 학술대회지
    • /
    • pp.338-349
    • /
    • 2000
  • Pronunciation teaching is once again coming into the foreground of ELT. Japan is, however, lagging far behind many countries in the development of pronunciation curricula and in the actual speech performance of the Japanese learners of English. The reasons for this can be found in the prevalence of communicative methodologies unfavorable for pronunciation teaching, in the lack of trained professionals, and in the large numbers of students in Japanese foreign language classes. This paper offers a way to promote foreign language pronunciation teaching in Japan and other countries by means of employing computer and internet facilities. The paper outlines the major directions of using modem speech technologies in pronunciation classes, like EVF (electronic visual feedback) training at segmental and prosodic levels; automated error detection, testing, grading and fluency assessment. The author discusses the applicability of some specific software packages (CSLU, SUGIspeech, Multispeech, Wavesurfer, etc.) for the needs of pronunciation teaching. Finally, the author talks about the globalization of pronunciation education via internet resources, such as computer corpora and speech and pronunciation training related web pages.

  • PDF

웹 기반 지도대수 처리기에 관한 연구 (A Study on the Web-based Map Algebraic Processor)

  • 박기호
    • Spatial Information Research
    • /
    • 제5권2호
    • /
    • pp.147-160
    • /
    • 1997
  • 지리정보시스템의 이론적 틀로 인식되고 있는 지도대수(Map Algebra)는 공간자료의 처리단위인 지도레이어를 피연산자로, 여러 처리소프트웨어를 연산자로 모델링하는 대수체계이다. 본 논문에서는 지도대수와 관련된 대표적 선행연구를 검토하여 그 제한점을 밝혀내어 보완하였다. 첫째 지도 레이어를 함수로 모형화하여 함수 프로그래밍의 메타 함수기능의 적용을 가능하도록 하였다. 이것은 지도대수언어에 메타연산자를 포함시켜 지리정보시스템의 사용자언어에 필요한 프로그래밍 기능을 제공하게된다 . 둘째 기존 지도대수언의 어의적.문법적 한계를 분석하고 이를 확장하여 지도 데이터 모델과 지도대수언어를 정형화한 후 지도대수 처리기으 원형을 설계하고 구현하였다. 지도대수언어 구문해석기는 기존의 지리정보시스템이 갖고 있는 이질적인 고유 명령어를 공통언어로 재구성하는 역할을 수행한다. 본 연구를 통해 구현된 맵시(MspSee)는 웹에 기반한 지도대수 처리기로써 본 논문에서 제시된 다양한 지도대수의 개념을 검증할 수 있었다. 지도대수언어를 통한 지리정보시스템의 사용자 인터페이스는 제트워크상에 분산되어 있는 지리정보와 그 처리모듈을 웹 클라이언트라는 간단하지만 강력한 인터페이스로 접근을 가?케 함으로써 인터넷 지리정보시스템의 중요 하부구조로 자리잡을 것으로 전망된다.

  • PDF

네트워크를 고려한 프로그래밍언어의 설계와 구현 (Design and Implementation of a Network Programming Language)

  • 원유훈;한태숙
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1359-1371
    • /
    • 1999
  • 대규모 네트워크 상에서 동작하는 분산 시스템의 구현을 위해 제시된 방법 중의 하나인 이동 코드 개념은 네트워크 공유 자원에 접근할 수 있는 효과적인 방법을 제시하였고 이 개념을 지원하는 많은 언어들의 개발을 가져왔다. 개발된 언어들이 가지고 있는 이동 코드를 지원하기 위한 언어 구문과 적용하려는 문제 영역의 특성을 반영한 언어 구문은 네트워크 프로그래밍을 하는데 있어서 효율과 문제 중심의 프로그램의 두 가지를 모두 가능하게 하고 있다. 본 논문에서는 현재 분산 컴퓨팅 환경에서 가장 많이 사용되고 있는 클라이언트-서버 모델을 확장하여 서버의 자원에 접근할 수 있는 또 다른 방법을 가진 모델을 제시하고, 이 모델을 표현할 수 있는 언어를 설계하였다. 설계된 언어는 이동 코드의 개념을 지원함으로써 대규모 네트워크에서 수행되는 프로그램의 작성을 가능하게 하고, 분산 범위 규칙을 채택함으로써 이동 코드의 기술을 일반 함수를 기술하듯 명확한 관점에서 할 수 있도록 하였다. 또한 네트워크 관련 자원들을 언어 구문으로 채택하여 네트워크 프로그래밍을 언어 수준에서 할 수 있도록 하였다. 언어의 이론적인 설계에 그치지 않고 설계된 언어를 수행할 수 있는 실행 시간 지원 시스템을 구현하였다. 실행 시간 지원 시스템은 언어를 해석하고 실행하는 코드 해석기와 이동 코드를 지원하는 네트워크 감독으로 구성되며 설계된 언어를 사용하여 실제로 네트워크 응용 프로그램을 작성하고 테스트 해 볼 수 있다.Abstract Some studies bring up a concept of code mobility as an innovative way to access network resources in order to develop distributed systems working on a large scale network. After that, many languages are suggested to support this concept. In these languages, language constructors for their particular application domains and mobile codes provide both problem-oriented views to the programmer and reasonable performance to the system. In this thesis, we extend the client-server model that is the most popular model in developing distributed systems these days. We propose a model to have another method to access server's resources and extend the C language to implement the proposed model for the large scale network. The new language has capability to build a software working on a large scale network by supporting mobile code and gives a consistent network programming view to the programmer by adapting distributed semantics. The language also makes network programming easy by providing network primitives at the language level. We implement a prototype of run-time system to support this language. The run-time system is composed of two major parts: code-interpreter that interprets and executes the language and network-daemon that supports mobile codes.

분야별 연구자들의 국내.외 문헌에 대한 의존도 비교 분석 (A Comparative Study on Researchers' Language Preference for Citing Documents in Different Subject Fields)

  • 조현양
    • 한국비블리아학회지
    • /
    • 제21권1호
    • /
    • pp.211-221
    • /
    • 2010
  • 이 연구는 학문분야별 연구자들이 정보를 생산하는 과정에서 참고하는 주요 정보원을 학문분야별로 비교, 분석하여 국내 문헌과 국외 문헌에 대한 학문 분야별 선호도 차이를 확인하기 위하여 수행되었다. 조사 대상 학술지는 한국연구재단의 8개 학문분야 대분류에 따라 분류된 학회에서 발간되는 학술지 가운데 선정된 학술지 8종에 대해서 '논문 수', '논문당 인용건수', '논문당 국내 문헌 인용건수', '논문당 국외 문헌 인용건수', '국내-국외 참고문헌 비율'의 차이를 검증하기 위해서 분산분석을 수행하였다. 연구결과 국내 연구자들의 연구활동에 있어서 인용하는 국내 외 문헌에 대한 선호도는 평균 인용문헌 수와 비율에 있어서 학문분야별로 차이가 있는 것으로 나타났으며, 학문분야별로 4개의 군집으로 구분되었다.

Enhanced Sign Language Transcription System via Hand Tracking and Pose Estimation

  • Kim, Jung-Ho;Kim, Najoung;Park, Hancheol;Park, Jong C.
    • Journal of Computing Science and Engineering
    • /
    • 제10권3호
    • /
    • pp.95-101
    • /
    • 2016
  • In this study, we propose a new system for constructing parallel corpora for sign languages, which are generally under-resourced in comparison to spoken languages. In order to achieve scalability and accessibility regarding data collection and corpus construction, our system utilizes deep learning-based techniques and predicts depth information to perform pose estimation on hand information obtainable from video recordings by a single RGB camera. These estimated poses are then transcribed into expressions in SignWriting. We evaluate the accuracy of hand tracking and hand pose estimation modules of our system quantitatively, using the American Sign Language Image Dataset and the American Sign Language Lexicon Video Dataset. The evaluation results show that our transcription system has a high potential to be successfully employed in constructing a sizable sign language corpus using various types of video resources.