• 제목/요약/키워드: Transfer Dictionary

검색결과 18건 처리시간 0.024초

Annotation of a Non-native English Speech Database by Korean Speakers

  • Kim, Jong-Mi
    • 음성과학
    • /
    • 제9권1호
    • /
    • pp.111-135
    • /
    • 2002
  • An annotation model of a non-native speech database has been devised, wherein English is the target language and Korean is the native language. The proposed annotation model features overt transcription of predictable linguistic information in native speech by the dictionary entry and several predefined types of error specification found in native language transfer. The proposed model is, in that sense, different from other previously explored annotation models in the literature, most of which are based on native speech. The validity of the newly proposed model is revealed in its consistent annotation of 1) salient linguistic features of English, 2) contrastive linguistic features of English and Korean, 3) actual errors reported in the literature, and 4) the newly collected data in this study. The annotation method in this model adopts the widely accepted conventions, Speech Assessment Methods Phonetic Alphabet (SAMPA) and the TOnes and Break Indices (ToBI). In the proposed annotation model, SAMPA is exclusively employed for segmental transcription and ToBI for prosodic transcription. The annotation of non-native speech is used to assess speaking ability for English as Foreign Language (EFL) learners.

  • PDF

한.영 기계번역을 위한 중심어 기반 구 구조 변환 사전 (Head-based Pharse Structure Transfer Dictionary for Korean_English Machine Translation)

  • 이상조;박상규;김영택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.157-162
    • /
    • 1994
  • 한국어로부터 자연스러운 영어 역어문장을 생성하기 위한 정보를 사전에 일관성있게 수록하는 방법을 제시하였다. 기계번역의 각 과정에서 필요한 정보는 가장 적당한 형태로 사전으로부터 제공되어야 하는 것이 일반적인 방법이다. 그러나 한국어는 어순의 부분적 자유성, 어미의 복잡한 활용규칙, 조사의 다양한 쓰임새로 인해 이러한 규칙들의 정보를 일관되게 사전에 수록하기가 어려운 실정이다. 본 논문에서는 한국어 문장과 역어 문장을 단어나 구 혹은 절등의 구성요소들의 다대다 매핑규칙을 찾고 이들 규칙을 적당한 형태로 사전에 수록하여야하는 어려움에서 벗어나 문장대 문장구조를 직접대응시켜 구구조단위로 분석된 형태의 부분 파서트리 형태의 트리구조를 역어와 함께 사전에 수록하므로써 사전정보를 손쉽게 구축, 유지하고자 하였다. 또 이들 정보를 추출해내는 알고리즘을 사용함으로써 주어진 한국어 문장에 대해 사전에 수록된 가장 자연스러운 형태의 역어문장을 생성할 수 있도록 하였다.

  • PDF

적절한 동사 대역어 선택을 위한 한영 변환 사전 구성 (The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation)

  • 송정근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

Mutational Data Loading Routines for Human Genome Databases: the BRCA1 Case

  • Van Der Kroon, Matthijs;Ramirez, Ignacio Lereu;Levin, Ana M.;Pastor, Oscar;Brinkkemper, Sjaak
    • Journal of Computing Science and Engineering
    • /
    • 제4권4호
    • /
    • pp.291-312
    • /
    • 2010
  • The last decades a large amount of research has been done in the genomics domain which has and is generating terabytes, if not exabytes, of information stored globally in a very fragmented way. Different databases use different ways of storing the same data, resulting in undesired redundancy and restrained information transfer. Adding to this, keeping the existing databases consistent and data integrity maintained is mainly left to human intervention which in turn is very costly, both in time and money as well as error prone. Identifying a fixed conceptual dictionary in the form of a conceptual model thus seems crucial. This paper presents an effort to integrate the mutational data from the established genomic data source HGMD into a conceptual model driven database HGDB, thereby providing useful lessons to improve the already existing conceptual model of the human genome.

Resolving Multi-Translatable Verbs Japanese-TO-Korean Machine Translation

  • Kim Jung-In;Lee Kang-Hyuk
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.790-797
    • /
    • 2005
  • It is well-known that there are many similarities between Japanese and Korean language. For example, the order of words and the nature of the grammatical conjugation of both languages are almost the same. Another similarity is the frequent omission of the subject from a sentence. Moreover, both languages have honorific expressions and the identical concept for expressing nouns in terms of Chinese characters. Using these similarities, we have developed a word-to-word translation system which does away with any deep level analysis of syntactic and semantic structures of the two languages. If we use these similarities, the direct translation method is superior to the internal language translation method or transfer-based translation method. Although the MT system based on the direct translation method is more easily developed than the ones based on other methods, it may have a lot of difficulties when it tries to select the appropriate target word from ambiguous source verbs. In this paper, we propose a new algorithm to extract the meaning of substantives and to make use of the order of the extracted meaning. We could select $86.5\%$ appropriate verbs in the sample sentences from IPAL-verb-dictionary. $13.5\%$ indicates the cases in which we could not distinguish the meaning of substantives. We are convinced, however, that the succeeding rate can be increased by getting rid of the meaning of verbs thatare not used so often.

  • PDF

한국어 낱말 묶기와 그 응용 (Chunking Korean and an Application)

  • 은광희;홍정하;유석훈;이기용;최재웅
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권2호
    • /
    • pp.49-68
    • /
    • 2005
  • Application of chunking to English and some other European languages has shown that it is a viable parsing mechanism for natural languages. Although a small number of attempts have been made to apply chunking to the analysis of the Korean language, it still is not clear enough what criteria there are to identify appropriate units of chunking, and how efficient and valid the chunking algorithms would be when applied to some authentic Korean texts. The purpose of this research is to provide an alternative set of algorithms for chunking Korean, and to implement them, and to test them against some English-Korean parallel corpora, which is English and Korean bibles matched sentence by sentence. It is shown in the paper that aligning related texts and identifying matched phrases between the two languages can be achieved through appropriate chunking and matching algorithms defined on the morphologically-tagged parallel corpus. Chunking and matching processes are based on the content words rather than the function words, and the matching itself is done in terms of the transfer dictionary. The implementation is done in C and XML, and can be accessed through the Internet.

  • PDF

경운기 사고에 의해 발생한 복부 및 회음부 장기 손상 (Abdomino-perineal Organ Injuries Caused by Cultivators)

  • 여광희;박찬용;김호현;박순창;염석란
    • Journal of Trauma and Injury
    • /
    • 제28권2호
    • /
    • pp.60-66
    • /
    • 2015
  • Purpose: Cultivator accidents are frequent and often lead to abdomino-perineal organ injury and, if severe, to death. This study presents the clinical characteristics, outcomes, and factors associated with mortality in patients who sustained an abdomino-perineal organ injury in cultivator accidents. Methods: We retrospectively analyzed the records of 53 patients who visited the emergency department of a tertiary hospital with abdomino-perineal organ injuries caused in cultivator accidents from April 2005 to March 2010. Results: All 53 patients had visited other medical institutions before visiting our hospital. Their mean age was $64.0{\pm}11.1$ (range, 20-80) years and 32 (60.4%) patients were 65 or older. The male-to-female ratio was 46:7. The chief complaint was abdominal pain (38 cases, 71.7%). The 53 patients included 41 cultivator operators (77.4%), 11 passengers (20.8%), and 1 passerby (1.9%). The causes of the injuries included a direct impact of the handlebar in 20 cases (37.7%), a rollover in 21 cases (39.6%), a fall in 10 cases (18.9%), and a wheel in two cases (3.8%). Several of the 53 patients had injuries to multiple abdomino-perineal organs, and the injured organs included the liver (23 cases, 26.4%), spleen (16 cases, 18.4%), pancreas (7 cases, 8.0%), small bowel (7 cases, 8.0%), mesentery (6 cases, 6.9%), adrenal gland (5 cases, 5.8%), and other organs. According to the abbreviated injury scale (AIS) dictionary, a thoracic injury was the most frequent co-injury (33 of 53 cases, 62.3%). Abdomino-perineal surgery was performed in 31 cases (58.8%) and angio-embolization was performed for six liver and two kidney injuries. Thirteen patients died (24.5%); all were males. The Injury Severity Scale (ISS) was lower in the survivors ($17.8{\pm}8.5$ vs. $27.0{\pm}16.0$; p=0.010). Conclusion: With the aging of agricultural workers, safety education programs should be implemented. Furthermore, the patient transfer system in agricultural areas must be improved.

  • PDF

정읍 무성서원과 선비문화 원류 최치원 (Choi Chi-won, the Originator of Jeongeup Museongseowon and Scholar Culture)

  • 안영훈
    • 대순사상논총
    • /
    • 제40집
    • /
    • pp.243-272
    • /
    • 2022
  • 전라북도 정읍은 한국 사상사에서 주목을 요하는 지역이다. 또한 정읍은 문학사에서 '최초'를 기록한 작품이 많은 지역이다. 백제 노래 <정읍사>가 그렇고 조선시대 사대부 가사 <상춘곡>이 그렇다. 그리고 이 지역 태수를 지낸 최치원(857~?)의 선정과 풍류의 전통이 전해오는 고장이기도 하다. 이 논문에서는 정읍의 무성서원의 성립과정과 선비문화에 있어서 최치원의 연관성을 살펴보았다. 최치원이 임기를 마치고 떠날 때 고을 사람들이 선정에 보답하는 의미로 태산사라는 생사당을 건립하였고 그것이 근원이 되어 후대에 무성서원으로까지 이어졌다. 최치원은 자신의 포부와 역량을 정읍에서 실현하였다. 특히 조선중기 무성서원의 건립과 사액 과정에 최치원의 역할은 결정적이었기에 최치원은 이 지역의 상징적 인물로 되살아날 수가 있었다. 그리고 무성서원을 중심으로 영정의 이안(移安) 작업을 통해서 최치원의 형상도 보다 유학자, 유학적 선비의 모습으로 좌정해나가는 것도 볼 수가 있다. 최치원이 남긴 시문을 통해서도 유학적 선비(지식인)로서 자각을 읽을 수 있다. 그의 시세계가 다양하지만 특히 유학자 지식인으로서 현실에서 오는 시름과 고뇌, 비판적인 내면의식 등을 표출한 작품이 많은 수를 차지하고 있음을 볼 수 있다. 최치원은 남다른 포부와 각고의 노력으로 당대의 우뚝한 문사로서의 자질을 유감없이 발휘하기는 하였으나, 그 자신 주변국의 한 시인으로서의 지역적, 정신적 소외감을 극복하지 못했다. 따라서 세계인식 면에서의 치열성은 자연히 내면화될 수밖에 없었다. 그러나 그것이 오히려 그의 작품으로 하여금 강한 서정성을 가지게 한 요인이 되었던 것으로 보인다. 그리고 최치원의 문집에는 당대의 말기적 현상에서 초래된 다양한 형태의 병리적 현상을 강한 어조로 비판한 작품들이 다수 포함되어 있다. 그는 가난하고 곤고한 삶을 살아가는 민중들의 모습을 사실적으로 그려내는가 하면, 왜곡된 생산관계 속에서 결국 희생되고 마는 가련한 백성들의 삶의 실상을 형상화함으로써 당대의 잘못된 사회의 단면을 부각시키기도 했다. 이러한 것은 지식인으로서의 고뇌로 읽을 수 있다. 선비의 사전적 정의가 '학식과 인품을 갖춘 사람에 대한 호칭으로, 특히 유교이념을 구현하는 인격체 또는 신분계층을 가리키는 유교용어'이고, 오늘날 의미로는 '신분적 존재가 아니라 인격의 모범이요, 시대사회의 양심으로서 인간의 도덕성을 개인 내면에서나 사회질서 속에서 확립하는 원천으로 이해될 수 있다.'고 할 때, 최치원의 문학에서 고뇌하는 모습은 곧 선비(지식인)의 고뇌이고 '선비(士)'로서의 책무를 자각하였기에 나오는 반응이라고 할 수 있다. 그러한 점에서 최치원은 가장 이른 시기의 선비(지식인)의 원류라고 보아도 크게 잘못이 없을 것이다.