• 제목/요약/키워드: corpus size

검색결과 117건 처리시간 0.023초

말뭉치 자원 희소성에 따른 통계적 수지 신호 번역 문제의 해결 (Addressing Low-Resource Problems in Statistical Machine Translation of Manual Signals in Sign Language)

  • 박한철;김정호;박종철
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.163-170
    • /
    • 2017
  • 통계적 기계 번역을 이용한 구어-수화 번역 연구가 활발해짐에도 불구하고 수화 말뭉치의 자원 희소성 문제는 해결되지 않고 있다. 본 연구는 수화 번역의 첫 번째 단계로써 통계적 기계 번역을 이용한 구어-수지 신호 번역에서 말뭉치 자원 희소성으로부터 기인하는 문제점들을 해결할 수 있는 세 가지 전처리 방법을 제안한다. 본 연구에서 제안하는 방법은 1) 구어 문장의 패러프레이징을 통한 말뭉치 확장 방법, 2) 구어 단어의 표제어화를 통한 개별 어휘 출현 빈도 증가 및 구어 표현의 번역 가능성을 향상시키는 방법, 그리고 3) 수지 표현으로 전사되지 않는 구어의 기능어 제거를 통한 구어-수지 표현 간 문장 성분을 일치시키는 방법이다. 서로 다른 특징을 지닌 영어-미국 수화 병렬 말뭉치들을 이용한 실험에서 각 방법론들이 단독으로 쓰일 때와 조합되어 함께 사용되었을 때 모두 말뭉치의 종류와 관계없이 번역 성능을 개선시킬 수 있다는 것을 확인할 수 있었다.

Zearalenone Altered the Serum Hormones, Morphologic and Apoptotic Measurements of Genital Organs in Post-weaning Gilts

  • Chen, X.X.;Yang, C.W.;Huang, L.B.;Niu, Q.S.;Jiang, Shuzhen;Chi, F.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제28권2호
    • /
    • pp.171-179
    • /
    • 2015
  • The present study was aimed at investigating the adverse effects of dietary zearalenone (ZEA) (1.1 to 3.2 mg/kg diet) on serum hormones, morphologic and apoptotic measurements of genital organs in post-weaning gilts. A total of twenty gilts ($Landrace{\times}Yorkshire{\times}Duroc$) weaned at 21 d with an average body weight of $10.36{\pm}1.21kg$ were used in the study. Gilts were fed a basal diet with an addition of 0, 1.1, 2.0, or 3.2 mg/kg purified ZEA for 18 d ad libitum. Results showed that 3.2 mg/kg ZEA challenged gilts decreased (p<0.05) the serum levels of luteinizing hormone, however, serum levels of prolactin in gilts fed the diet containing 2.0 mg/kg ZEA or more were increased (p<0.05) compared to those in the control. Linear effects on all tested serum hormones except progesterone were observed as dietary ZEA levels increased (p<0.05). Gilts fed ZEA-contaminated diet showed increase (p<0.05) in genital organs size, hyperplasia of submucosal smooth muscles in the corpus uteri in a dose-dependent manner. However, the decreased numbers of follicles in the cortex and apoptotic cells in the ovarian were observed in gilts treated with ZEA in a dose-dependent manner. Degeneration and structural abnormalities of genital organs tissues were also observed in the gilts fed diet containing 1.1 mg/kg ZEA or more. Results suggested that dietary ZEA at 1.1 to 3.2 mg/kg can induce endocrine disturbance and damage genital organs in post-weaning gilts.

Simvastatin Reduces Lipopolysaccharides-Accelerated Cerebral Ischemic Injury via Inhibition of Nuclear Factor-kappa B Activity

  • Jalin, Angela M.A. Anthony;Lee, Jae-Chul;Cho, Geum-Sil;Kim, Chunsook;Ju, Chung;Pahk, Kisoo;Song, Hwa Young;Kim, Won-Ki
    • Biomolecules & Therapeutics
    • /
    • 제23권6호
    • /
    • pp.531-538
    • /
    • 2015
  • Preceding infection or inflammation such as bacterial meningitis has been associated with poor outcomes after stroke. Previously, we reported that intracorpus callosum microinjection of lipopolysaccharides (LPS) strongly accelerated the ischemia/reperfusionevoked brain tissue damage via recruiting inflammatory cells into the ischemic lesion. Simvastatin, 3-hydroxy-3-methylgultaryl (HMG)-CoA reductase inhibitor, has been shown to reduce inflammatory responses in vascular diseases. Thus, we investigated whether simvastatin could reduce the LPS-accelerated ischemic injury. Simvastatin (20 mg/kg) was orally administered to rats prior to cerebral ischemic insults (4 times at 72, 48, 25, and 1-h pre-ischemia). LPS was microinjected into rat corpus callosum 1 day before the ischemic injury. Treatment of simvastatin reduced the LPS-accelerated infarct size by 73%, and decreased the ischemia/reperfusion-induced expressions of pro-inflammatory mediators such as iNOS, COX-2 and IL-$1{\beta}$ in LPS-injected rat brains. However, simvastatin did not reduce the infiltration of microglial/macrophageal cells into the LPS-pretreated brain lesion. In vitro migration assay also showed that simvastatin did not inhibit the monocyte chemoattractant protein-1-evoked migration of microglial/macrophageal cells. Instead, simvastatin inhibited the nuclear translocation of NF-${\kappa}B$, a key signaling event in expressions of various proinflammatory mediators, by decreasing the degradation of $I{\kappa}B$. The present results indicate that simvastatin may be beneficial particularly to the accelerated cerebral ischemic injury under inflammatory or infectious conditions.

벡터 공간 모델과 HAL에 기초한 단어 의미 유사성 군집 (Word Sense Similarity Clustering Based on Vector Space Model and HAL)

  • 김동성
    • 인지과학
    • /
    • 제23권3호
    • /
    • pp.295-322
    • /
    • 2012
  • 본 연구에서는 벡터 공간 모델과 HAL (Hyperspace Analog to Language)을 적용해서 단어 의미 유사성을 군집한다. 일정한 크기의 문맥을 통해서 단어 간의 상관성을 측정하는 HAL을 도입하고(Lund and Burgess 1996), 상관성 측정에서 고빈도와 저빈도에 다르게 측정되는 왜곡을 줄이기 위해서 벡터 공간 모델을 적용해서 단어 쌍의 코사인 유사도를 측정하였다(Salton et al. 1975, Widdows 2004). HAL과 벡터 공간 모델로 만들어지는 공간은 다차원이므로, 차원을 축소하기 위해서 PCA (Principal Component Analysis)와 SVD (Singular Value Decomposition)를 적용하였다. 유사성 군집을 위해서 비감독 방식과 감독 방식을 적용하였는데, 비감독 방식에는 클러스터링을 감독 방식에는 SVM (Support Vector Machine), 나이브 베이즈 구분자(Naive Bayes Classifier), 최대 엔트로피(Maximum Entropy) 방식을 적용하였다. 이 연구는 언어학적 측면에서 Harris (1954), Firth (1957)의 분포 가설(Distributional Hypothesis)을 활용한 의미 유사도를 측정하였으며, 심리언어학적 측면에서 의미 기억을 설명하기 위한 모델로 벡터 공간 모델과 HAL을 결합하였으며, 전산적 언어 처리 관점에서 기계학습 방식 중 감독 기반과 비감독 기반을 적용하였다.

  • PDF

First report of a bacteriovorus nematode, Diploscapter coronatus (Cobb, 1893) Cobb, 1913 (Rhabditida: Diploscapteridae), in Korea

  • Kang, Heonil;Eun, Geun;Ha, Jihye;Park, Namsook;Choi, Insoo;Kim, Donggeun
    • Journal of Species Research
    • /
    • 제6권2호
    • /
    • pp.177-180
    • /
    • 2017
  • Diploscapter coronatus (Cobb, 1893) Cobb, 1913 was first reported on oriental melon (Cucumis melo vars. makuwa Makino) roots from plastic film houses, Gyeongsangbuk-do, Andong, Korea (latitude $N36^{\circ}33^{\prime}$. longitude $E128^{\circ}29^{\prime}$). Diploscapter coronatus is most similar to D. pachys. Species in the genus Diploscapter have a visibly annulated cuticle. The stoma of D. coronatus is 1.5 times longer than the lip region width. The pharyngeal corpus is clearly separated from the isthmus and the vulva is situated around the mid-body. However, it differed by higher ratio of "a", filiform tail and had relatively blunt labial hooks. The Korean population is well matched and within the range of D. coronatus as described from Iran and Ethiopia in de Man's of L, b, c, c', and V. Female length, however, varied between populations: the Ethiopia population female length is longer than in the Korea population (396.4 vs 427.0) while females in the Iran population are smaller than in the Korea population (396.4 vs 350.0). Nematode size may vary due to environmental conditions such as food sources. The position of excretory pores in the Korean population were shorter 53.9-72.5 than in other populations (67-82 and 70-89). Males were uncommon. Males in the Korean population are smaller than females but larger(356.0) than males in the Indian population (306.0).

뇌신경교세포(腦神經膠細胞) 집단(集團)의 발생(發生)과 이동(移動)에 대한 방사선(放射線) 자기법적(自記法的) 관찰 I, 설치류 뇌(腦)에 외배엽성(外胚葉性) 신경교세포(神經膠細胞) 집단(集團)의 출현(出現)에 대하여 (Radioautographical observations of development and appearance of glia cells in brain I. Apperarace of ectodermal glial cell aggregates in rodent brain)

  • 곽수동
    • 대한수의학회지
    • /
    • 제32권4호
    • /
    • pp.481-487
    • /
    • 1992
  • The present study was designed to investigate the appearance of the congenital aggregates of the ectodermal glial cells in the brain of the normal rodents. The brain samples were taken from mice fetus, juvenile mice, rats and rabbits. The appearance regions of the glial cell aggregates (GCA) were investigated and the cells in the GCA were identified with electron microscope. 1. GCA in the mouse fetus tended to be higher in cell density, larger in size and lower frequency in appearance than juvenile mouse. The regions of higher appearance frequency of GCA in the juveniles of mice, rats and rabbits were ordered as subependymal layer in the collateral trigone of lateral ventricles, molecular layer of the neocortex, inner layer except the molecular layer in the neocortex, cerebral medulla, corpus callosum and hippocampus. Appearance frequency of GCA in the neonatal mice tended to be higher until 5 day after birth, and were markedly decreased on 10 and 15 day after birth. 2. GCA tended to be closed on one side of the blood vessels or neurons but not perivascular or perineuronal appearance. 3. In electron microscophy, GCA were composed of immature oligodendrocytes and astrocytes in the subependymal, and tended to be more mature and loose in the neocortex and to be appended some microglia cells with age. The cells in the GCA of older mice tended to be more mature than in young mice.

  • PDF

등줄쥐(Apodemus agrarius coreae)의 정자유입에 따른 정소상체 상피세포의 형태적 변화 (Morphological Changes of Epithelial Cells of the Epididymides by Sperm Entrance in the Korean Striped Field Mouse, Apodemus agrarius coreae)

  • 이정훈
    • Applied Microscopy
    • /
    • 제28권1호
    • /
    • pp.49-62
    • /
    • 1998
  • To investigate the morphological changes of epithelial cells of ductus epididymides by sperm entrance, the Korean striped field mouse, Apodemus agrarius coreae was studied with light and transmission electron microscopy. 1. The diameters of the caput epididymis (Cp) and its lumen were $135\sim145{\mu}(140{\pm}0.5{\mu})$ and $115\sim120{\mu}m(117{\pm}0.1{\mu}m)$. The length and width of the epithelium were $27.0\sim28.5{\mu}m(28.0{\pm}0.1{\mu}m)$ and $4.8\sim5.4{\mu}m(5.1{\pm}0.2{\mu}m)$. 2. The diameters of the corpus epididymis (Cr) and its lumen were $160\sim170{\mu}m(166{\pm}0.2{\mu}m)$ and $140\sim150{\mu}m(145{\pm}0.3{\mu}m)$. The length and width of the epithelium were $17.4\sim18.0{\mu}m(17.6{\pm}0.5{\mu}m)$ and $8.8\sim10.4{\mu}m(9.5{\pm}0.2{\mu}m)$. 3. The diameters of the cauda epididymis (Cu) and its lumen were $270\sim280{\mu}m(275{\pm}0.2{\mu}m)$ and $265\sim275{\mu}m(268{\pm}0.3{\mu}m)$. The length and width of the epithelium were $11.2\sim13.4{\mu}m(12.3{\pm}0.3{\mu}m)$ and $9.2\sim11.2{\mu}m(10.0{\pm}0.2{\mu}m)$. Therefore, the size of diameter and lumen of the ductus epididymides and the width of the epithelium increased from Cp and Cr to Cu, but the length of epithelial cells decreased from Ca and Cr to Cu. These data suggest that the morphological changes of epithelial cells of the ductus epididymides may be the results of the sperm entrance.

  • PDF

양측 천외음부동맥 천공지 피판을 이용한 음경둘레 연조직 결손의 재건 (Reconstruction of a Circumferential Penile Shaft Defect Using Bilateral Superficial External Pudendal Artery Perforator Flaps)

  • 박종옥;신동혁;최현곤;김지남;이명철
    • Archives of Hand and Microsurgery
    • /
    • 제23권4호
    • /
    • pp.296-300
    • /
    • 2018
  • 음경 둘레 연조직 결손은 다양한 공여부를 이용하여 재건할 수 있으며, 유리피판술 및 국소피판술을 응용할 수 있다. 유리피판술의 경우 성공적인 결과를 위해 수술 과정 및 술 후 관리에 기술적인 어려움이 있으며, 기존 국소피판술은 결손 부위의 크기나 모양에 제약이 따르게 된다. 이에 양측 천외음부동맥 천공지피판을 이용한 음경둘레 연조직 결손 재건의 성공적인 사례를 발표하고자 한다. 음경 둘레 연조직 결손은 음낭근막까지 관찰되었으며, 변연절제술 시행 이후 심부근막과 해면체는 보존하였다. 이후 양측 천외음부동맥 천공지 피판을 이용하여 음경 전체 둘레연조직 결손 부위를 재건하였다. 27개월의 추적 관찰 기간 동안 음경의 형태와 기능은 보존되었으며, 창상치유와 연관된 문제는 관찰되지 않았다.

불균형 텍스트 데이터의 변수 선택에 있어서의 카이제곱통계량과 정보이득의 특징 (Properties of chi-square statistic and information gain for feature selection of imbalanced text data)

  • 문혜인;손원
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.469-484
    • /
    • 2022
  • 텍스트 데이터는 일반적으로 많은 단어로 이루어져 있으므로 변수의 수가 매우 많은 고차원 데이터에 해당된다. 이러한 고차원 데이터에서는 계산 효율성과 통계분석의 정확성을 높이기 위해 많은 변수 중 중요한 변수를 선택하기 위한 절차를 거치는 경우가 많다. 텍스트 데이터에서도 많은 단어 중 중요한 단어를 선택하기 위해 여러가지 방법들이 사용되고 있다. 이 연구에서는 단어 선택을 위한 대표적인 필터링 방법인 카이제곱통계량과 정보이득의 공통점과 차이점을 살펴보고 실제 텍스트 데이터에서 이 단어선택 방법들의 성질을 확인해보았다. 카이제곱통계량과 정보이득은 비음성, 볼록성 등의 성질을 공유하지만 불균형 텍스트 데이터에서 카이제곱통계량이 양변수 위주로 단어를 선택하는 반면, 정보이득은 음변수도 상대적으로 많이 선택하는 경향이 있음을 확인하였다.

트랜스포머 기반 효율적인 자연어 처리 방안 연구 (A Study on Efficient Natural Language Processing Method based on Transformer)

  • 임승철;윤성구
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.115-119
    • /
    • 2023
  • 현재의 인공지능에서 사용되는 자연어 처리 모델은 거대하여 실시간으로 데이터를 처리하고 분석하는 것은 여러가지 어려움들을 야기하고 있다. 이런 어려움을 해결하기 위한 방법으로 메모리를 적게 사용해 처리의 효율성을 개선하는 방법을 제안하고 제안된 모델의 성능을 확인하였다. 본 논문에서 제안한 모델의 성능평가를 위해 적용한 기법은 BERT[1] 모델의 어텐션 헤드 개수와 임베딩 크기를 작게 조절해 큰 말뭉치를 나눠서 분할 처리 후 출력값의 평균을 통해 결과를 산출하였다. 이 과정에서 입력 데이터의 다양성을 주기위해 매 에폭마다 임의의 오프셋을 문장에 부여하였다. 그리고 모델을 분류가 가능하도록 미세 조정하였다. 말뭉치를 분할 처리한 모델은 그렇지 않은 모델 대비 정확도가 12% 정도 낮았으나, 모델의 파라미터 개수는 56% 정도 절감되는 것을 확인하였다.