• 제목/요약/키워드: Korean morphological analyzer

검색결과 116건 처리시간 0.029초

확률 기반 미등록 단어 분리 및 태깅 (Probabilistic Segmentation and Tagging of Unknown Words)

  • 김보겸;이재성
    • 정보과학회 논문지
    • /
    • 제43권4호
    • /
    • pp.430-436
    • /
    • 2016
  • 형태소 분석시 나타나는 고유명사나 신조어 등의 미등록어에 대한 처리는 다양한 도메인의 문서 처리에 필수적이다. 이 논문에서는 3단계 확률 기반 형태소 분석에서 미등록어를 분리하고 태깅하기 위한 방법을 제시한다. 이 방법은 고유명사나 일반명사와 같은 개방어 뒤에 붙는 다양한 접미사를 분석하여 미등록 개방어를 추정할 수 있도록 했다. 이를 위해 형태소 품사 부착 말뭉치에서 자동으로 접미사 패턴을 학습하고, 확률 기반 형태소 분석에 맞도록 미등록 개방어의 분리 및 태깅 확률을 계산하는 방법을 제시하였다. 실험 결과, 제안한 방법은 새로운 미등록 용어가 많이 나오는 문서에서 미등록어 처리 성능을 크게 향상시켰다.

크롤러와 형태소 분석기를 활용한 웹상 개인정보 유출 판별 시스템 (Crawlers and Morphological Analyzers Utilize to Identify Personal Information Leaks on the Web System)

  • 이형선;박재희;나철훈;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.559-560
    • /
    • 2017
  • 최근 개인정보 유출 문제가 대두됨에 따라 데이터 수집과 웹 문서 분류에 관한 연구들이 이루어지고 있다. 기존 시스템은 개인정보의 유무 여부만 판단하고 동명이인이나 사용자가 게시한 문서에 대한 분류는 이루어지지 않기 때문에 불필요한 데이터가 필터링 되지 않는 문제점이 있다. 본 논문에서는 이를 해결하기 위해 크롤러와 형태소 분석기를 활용하여 유출된 데이터의 유형이나 동음이의어를 식별할 수 있는 시스템을 제안한다. 사용자는 크롤러를 통해 웹상의 개인정보를 수집한다. 수집된 데이터는 형태소 분석기를 통해 분류한 후 유출된 데이터를 확인할 수 있다. 또한 시스템을 재사용 할 경우 정확도가 더 높은 결과를 얻을 수 있다. 이를 통해 사용자는 맞춤형 데이터를 제공 받을 수 있을 것으로 사료된다.

  • PDF

분무 유동의 입경 계측 기법에 관한 연구 (Measurement Technique of Particle Sizing in Spay Flow)

  • 양창조;김정환;오종환;김만응;이영호
    • 한국마린엔지니어링학회:학술대회논문집
    • /
    • 한국마린엔지니어링학회 2005년도 전기학술대회논문집
    • /
    • pp.534-539
    • /
    • 2005
  • Particle image analyzer for measuring droplet size has been developed. Image processing technique was used with relaxation method. The morphological method based on partial curvature information of pre-processed images was adopted for recognition and separation of overlapped particles. The measurement results show that the present method may be reliable for the analysis of the size and distribution of droplets produced by water mist spay flow.

  • PDF

낱말.패러다임 형태이론에 입각한 영어동사 굴절 해석 프로그램의 구현 (Implementing an Inflection Analyzer Program for English Verbs in a Word-and-Paradigm Morphology.)

  • 노용균
    • 한국언어정보학회지:언어와정보
    • /
    • 제2권2호
    • /
    • pp.121-154
    • /
    • 1998
  • The morphological analyzer is expected to tell attested word forms from imaginable yet unattested ones. An account of the inflectional morphology of English verbs is given in the framework of Word-and-Paradigm morphology, developed mainly by Matthews (1972, 1974, 1991) and further by Aronoff (1994) and Zwicky (1985, 1988), which is free of overrecognition. Thirteen inflectional classes are identified according to the patterns each of them exhibits in filling the slots in the paradigm. Peculiarity in orthography is also considered in assigning each verb lexeme to a class. Modules of a C program which gives associated morphosyntactic properties to all and only attested verb forms are written so that details of this framework can be evaluated explicitly. This program is shown to be superior to existing programs in economy and in the generality it achieves.

  • PDF

국어의 교착성과 형태소 분석기의 구현 (The Agglutination of the Korean Language and the Implementation of Korean Morphological Analyzer)

  • 이민행;김성묵
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.105-117
    • /
    • 1992
  • 교착어(agglutinating language)에서는 다양한 통사정보가 독자적인 형태소에 내재되어 있다. 국어의 경우 형태소의 분석이 통사구조 분석에 선행되어 이루어져야 하는 이유가 바로 국어의 교착어적인 속성에 기인한다. 이 논문의 전반부에서 국어의 교착성을 명확히 보여주는 등위 접속구문을 핵심어 주도 구구조문법(HPSG)에 의하여 분석한다. 후반부에서는 PROLOG로 구현된 국어의 형태소 분석기와 통사구조 분석기(PARSER)를 소개한다.

  • PDF

어절 분석 기반 형태소 분석 시스템 개발에 관한 연구 (A Study on the Development of a Practical Morphological Analysis System Based on Word Analysis)

  • 조현양;최성필;최재황
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.105-124
    • /
    • 2001
  • 본 연구에서는 정보검색시스템의 성능향상을 위하여 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절 분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화 그리고 형태소의 정확한 분석을 위한 한국어 어절 분석 시스템을 개발하였다. 본 연구에서 개발된 시스템은 어절 분석 속도를 높일 수 있는 최적의 알고리즘을 구현하였으며, 모듈화된 하부 시스템의 유기적이고 효율적인 결합에 중점을 두로 각 모듈별 성능 및 속도 검증이 가능하도록 하였다. 또한, 재귀적 복협명사 분석을 탈피하여 시스템 부하를 줄이고 다층적 수사 패턴 인식에 기반한 수사 형태소 분석 시스템을 개발하였다. 개발된 어절 분석 시스템을 이용하여 색인 시스템을 구성하고 이를 기반으로 실험을 하였다.

  • PDF

북한 문화어 형태소 분석기(NKMA)의 어절 구조 (The Word Structure of the North Korean Morphological Analyzer)

  • 최운호;정회선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.49-55
    • /
    • 1998
  • 분단 이후 북한은 우리와는 다른 언어정책을 추진해 왔고, 그 결과로 지금은 남북한 언어 정책에서 많은 차이를 드러내게 되었다. 본 논문은 북한 문화어 형태소 분석 시스템(NKMA)의 구축을 위한 어절 구조를 제시한다. 북한 문화어의 형태소 분절 및 분석을 위해 사용된 어절 구조는 대체로 말토막 단위와 일치하므로, 음성언어의 인식을 위한 분절 방법에 응용될 수도 있으리라 기대한다.

  • PDF

Diamine의 구조적 이성질체에 따른 내열성 폴리이미드 박막의 잔류응력거동 (Residual Stress Behavior of High Temperature Polyimide Thin Films depending on the Structural Isomers of Diamine)

  • 임창호;정현수;한학수
    • 마이크로전자및패키징학회지
    • /
    • 제6권2호
    • /
    • pp.23-30
    • /
    • 1999
  • 이성질체에 따른 폴리이미드 박막의 잔류응력 영향과 모폴로지와의 상관관계가 조사되었다. 이를 위해, Poly(phenylene biphenyltetracarboximide) (BPDA-PDA)와 poly (oxydiphenylene biphenyltetracar-boximide) (BPDA-ODA)를 여러 다른 diamine인 1, 3-phenylene diamine (1, 3-PDA), 1.4-phenylene diamine (1,4-PDA)과 3.4'-oxydiphenylene diamine (3,4'-ODA) , 4,4'-oxydiphenylene diamine (4.4'-ODA)으로부터 제조하였다. 이들 박막에 대하여, Thin Film Stress Analyzer (TFSA)를 이용하여 공정온도 (25~$400^{\circ}C$)하에서 전구체의 열적 이미드화에 따라 실시간으로 폴리이미드 박막의 잔류응력 거동을 측정하였다. 폴리이미드 박막의 잔류응력은 면 방향 배향성과 사슬 질서도가 우수한 BPDA-1,4-PDA가 7MPa로 가장 낮게 나타났으며 BPDA-1,3-PDA, BPDA-3,4'-ODA, BPDA-4,4'-ODA의 경우 40~50Mpa 범위에 있었다. 이성질체에 따른 폴리이미드 박막의 잔류응력은 모폴로지 (사슬 강직도, 질서도, 배향성) 변화 및 유리전이 거동과 관련된 사슬 운동성을 이용하여 분석되었다.

  • PDF

동적 프로그래밍기법에 근거한 예측중심의 한국어 형태소 분석 (Predictive Morphological Analysis of Korean with Dynamic Programming)

  • 김덕봉;최기선
    • 인지과학
    • /
    • 제4권2호
    • /
    • pp.145-180
    • /
    • 1994
  • 본 논문은 단어를 구성하는 모든 가능한 형태소열 생성하는 효율적인 한국어 형태소분석 모델을 제시한다.본 논문의 형태소분석 모델은 결정적인(deterministic) 철자규칙의 적용을 보장하며,복합어나 중의성을 지니는 단어의 경우에도 불필요한 계산을 방지한다.이러한 효율성의 획득은 (1)철자규칙을 해석하는 새로운 방법. (2)입력단어에 적합한 철자규칙만을 적용하는 예측중심의 규칙적용방법.(3)중의성이 있는 단어의 경우 이미 분석된 형태부분의 반복계산을 방지하는 동적 프로그래밍 기법의 사용에 의한 새로운 분석기술에 의하여 이루어진다.본 논문에서는 제시된 형태소 분석 모델은 국민학교 국어교과서에서 무작위로 추출된 413,975개의 단어 를 대상으로 실험되었으며, 실험 결과는 본 모델이 효율적이면서도 견고한 형태소 분석을 보장하는것으로 나타났다.

Chemical Constitution, Morphological Characteristics, and Biological Properties of ProRoot Mineral Trioxide Aggregate and Ortho Mineral Trioxide Aggregate

  • Kum, Kee Yeon;Yoo, Yeon Jee;Chang, Seok Woo
    • Journal of Korean Dental Science
    • /
    • 제6권2호
    • /
    • pp.41-49
    • /
    • 2013
  • Purpose: This study sought to compare the elemental constitution, morphological characteristics, particle size distribution, biocompatibility, and mineralization potential of Ortho MTA (OMTA) and ProRoot MTA (PMTA). Materials and Methods: OMTA and PMTA were compared using energy-dispersive spectrometry, particle size analysis, and scanning electron microscopy. The biocompatibility and mineralization-related gene expression (osteonectin and osteopontin) of both MTAs were also compared using methylthiazol tetrazolium assay and reverse transcription-polymerization chain reaction analysis, respectively. The results were analyzed by Kruskal-Wallis test with Bonferroni correction. P-value of <0.05 was considered significant. Result: The morphology of OMTA powders was similar to that of PMTA. The constituent elements of both MTAs were calcium, silicon, and aluminum. The mean particle sizes of OMTA and PMTA were 4.60 and 3.34 mm, respectively. Both MTAs had equally favorable in vitro biocompatibility and affected the messenger RNA expression of osteonectin and osteopontin. Conclusion: Within the limitations of this study, OMTA could be a promising biomaterial in clinical endodontics.