• Title/Summary/Keyword: 생략 처리

Search Result 262, Processing Time 0.028 seconds

A Study on Word Semantic Categories for Natural Language Question Type Classification and Answer Extraction (자연어 질의 유형판별과 응답 추출을 위한 어휘 의미체계에 관한 연구)

  • Yoon Sung-Hee
    • Proceedings of the KAIS Fall Conference
    • /
    • 2004.11a
    • /
    • pp.141-144
    • /
    • 2004
  • 질의응답 시스템이 정보검색 시스템과 다른 중요한 점은 질의 처리 과정이며, 자연어 질의 문장에서 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 것이다. 본 논문에서는 질의 주-형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의 문장에서 의문사에 해당하는 어휘들을 추출하고 주변에 나타나는 명사들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법을 제안한다. 의문사가 생략된 경우의 처리 방법과 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

A time reduction method For the Face Recognition CCTV (CCTV에서 얼굴 탐색 시간 단축 기법)

  • Pak, Seon-Woo;Hong, Ji-Houn;Won, Ill-Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1534-1536
    • /
    • 2015
  • 동영상에서 학습을 통한 특정인의 탐지는 한 개의 프레임 당 많은 시간이 소모된다. 따라서 특정인의 위치를 파악하면서도 탐색할 프레임의 수를 줄이는 것이 필요하다. 우리는 관찰되는 장소의 특징을 이용하여 일정 범위를 생략하는 탐색 기법을 제안하고 성능을 측정하였다. 실험결과 제안한 방법에서 어느 정도 유의미한 결과를 얻을 수 있었다.

플라즈마 연질화 처리된 마이크로 구동 요소부품의 표면미세구조 변화

  • Lee, Sang-Min;An, Gyeong-Jun
    • Proceedings of the Korean Institute of Surface Engineering Conference
    • /
    • 2013.05a
    • /
    • pp.125-125
    • /
    • 2013
  • 기계부품 및 자동차부품 등의 내마모나 내피로성의 향상을 위한 표면처리로서 고주파처리, 침탄처리, 질화처리 등이 사용되고 있다. 최근에는 변형을 최소화 함으로써 후가공을 생략할 수 있는 질화처리가 주목받고 있다. 질화처리종류로는 염욕질화나 가스질화법이 사용되고 있으나, 이들에 비해 환경오염 및 공해가 적고 인체에 무해한 플라즈마 연질화법이 사용되고 있다. 플라즈마 연질화 기술은 IT기기의 제품에 적용되는 표면경화의 공정개발은 미비한 실정이다. 마이크로 구동 요소 부품중의 하나인 Leadscrew는 이송장치를 구성하는 핵심 부품으로 IT기기의 정밀 이송 및 구동제어에 사용되는 핵심 부품으로 사용되고 있으며, 리드스크류의 소재인 SWCH1018A(냉간압조용강선)은 표면 경도가 낮고 변형이 쉽기 때문에 표면 경화를 위한 플라즈마 연질화 기술을 이용하고자 했다. 본 연구는 플라즈마 연질화 공정을 적용한 시편의 표면경도를 높혀주고 변형을 최소화 할 수 있는 공정을 확인하는 것이다. 공정변수를 변화 시키면서 얻어진 시편의 표면미세 구조를 미소경도측정, XRD, SEM분석을 통하여 확인하였으며, 이를 통해 시편 표면경도를 높여주는 공정 조건을 도출하였다.

  • PDF

Advanced detection of sentence boundaries based on hybrid method (하이브리드 방법을 이용한 개선된 문장경계인식)

  • Lee, Chung-Hee;Jang, Myung-Gil;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.61-66
    • /
    • 2009
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반 하여 개선된 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 음절을 대상으로 학습하여 문장경계 인식을 수행하였고, 문장경계인식 성능을 최대화 하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 다양한 기계학습 기반 분류 모델을 비교하여 최적의 분류모델을 선택하였으며, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 형태의 문서별 성능 측정을 위해서 문어체와 구어체가 복합적으로 사용된 신문기사와 블로그 문서(평가셋1), 문어체 위주로 구성된 세종말뭉치와 백과사전 본문(평가셋2), 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 사이트의 게시판 글(평가셋3)을 대상으로 성능 측정을 하였다. 성능척도로는 F-measure를 사용하였으며, 구두점만을 대상으로 문장경계 인식 성능을 평가한 결과, 평가셋1에서는 96.5%, 평가셋2에서는 99.4%를 보였는데, 구어체의 문장경계인식이 더 어려움을 알 수 있었다. 평가셋1의 경우에도 규칙으로 후처리한 경우 정확률이 92.1%에서 99.4%로 올라갔으며, 이를 통해 후처리 규칙의 필요성을 알 수 있었다. 최종 성능평가로는 구두점만을 대상으로 학습된 기본 엔진과 모든 문장경계후보를 인식하도록 개선된 엔진을 평가셋3을 사용하여 비교 평가하였고, 기본 엔진(61.1%)에 비해서 개선된 엔진이 32.0% 성능 향상이 있음을 확인함으로써 제안한 방법이 웹 문서에 효과적임을 입증하였다.

  • PDF

토양생물을 이용한 환경보전형 하수슬러지 처리 기술 개발 및 활용

  • 윤지훈;김부생;권형준;김종인;권영택
    • Proceedings of the Korean Environmental Sciences Society Conference
    • /
    • 2003.05a
    • /
    • pp.113-116
    • /
    • 2003
  • 1) 지렁이를 이용한 하수슬러지의 분변토화 공정에서 실험실 규모의 처리에서는 장기간의 부숙 기간이 필요하였으나 개방된 대형 비닐하우스 시설을 사용한 처리 시스템에서는 전처리 공정의 생략이 가능하였다. 2) 하수슬러지의 이화학적 특성을 분석한 결과 지렁이 생육 조건은 만족하였으나 중금속 함량은 부숙토 원료기준을 초과하는 경우가 있었다. 3) 인위적으로 사육상 온도 조절이 없는 비닐하우스내 사육상의 온도는 기상 조건의 영향을 직접 받고 있으므로 계절별로 슬러지 처리기간 및 지렁이 성장밀도에 차이를 나타내었다. 4) 지렁이를 이용하여 하수슬러지를 처리하고자 할 때 유해성분에 의한 지렁이의 생육에는 문제가 없었다. 그러나 슬러지와 분변토의 중금속 함량을 부숙토의 원료기준 및 제품기준과 비교하였을 때 기준을 초과하는 경우가 있었다. 따라서 지렁이를 이용하여 하수슬러지를 처리하고자 할 때 원료 및 분변토의 특성개량과 재활용성을 높이기 위하여 부원료의 개발과 활용이 필요하였다.

  • PDF

Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM (Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원)

  • Hwang, Min-Kook;Kim, Youngtae;Ra, Dongyul;Lim, Soojong;Kim, Hyunki
    • Journal of Intelligence and Information Systems
    • /
    • v.21 no.2
    • /
    • pp.131-150
    • /
    • 2015
  • Omission of noun phrases for obligatory cases is a common phenomenon in sentences of Korean and Japanese, which is not observed in English. When an argument of a predicate can be filled with a noun phrase co-referential with the title, the argument is more easily omitted in Encyclopedia texts. The omitted noun phrase is called a zero anaphor or zero pronoun. Encyclopedias like Wikipedia are major source for information extraction by intelligent application systems such as information retrieval and question answering systems. However, omission of noun phrases makes the quality of information extraction poor. This paper deals with the problem of developing a system that can restore omitted noun phrases in encyclopedia documents. The problem that our system deals with is almost similar to zero anaphora resolution which is one of the important problems in natural language processing. A noun phrase existing in the text that can be used for restoration is called an antecedent. An antecedent must be co-referential with the zero anaphor. While the candidates for the antecedent are only noun phrases in the same text in case of zero anaphora resolution, the title is also a candidate in our problem. In our system, the first stage is in charge of detecting the zero anaphor. In the second stage, antecedent search is carried out by considering the candidates. If antecedent search fails, an attempt made, in the third stage, to use the title as the antecedent. The main characteristic of our system is to make use of a structural SVM for finding the antecedent. The noun phrases in the text that appear before the position of zero anaphor comprise the search space. The main technique used in the methods proposed in previous research works is to perform binary classification for all the noun phrases in the search space. The noun phrase classified to be an antecedent with highest confidence is selected as the antecedent. However, we propose in this paper that antecedent search is viewed as the problem of assigning the antecedent indicator labels to a sequence of noun phrases. In other words, sequence labeling is employed in antecedent search in the text. We are the first to suggest this idea. To perform sequence labeling, we suggest to use a structural SVM which receives a sequence of noun phrases as input and returns the sequence of labels as output. An output label takes one of two values: one indicating that the corresponding noun phrase is the antecedent and the other indicating that it is not. The structural SVM we used is based on the modified Pegasos algorithm which exploits a subgradient descent methodology used for optimization problems. To train and test our system we selected a set of Wikipedia texts and constructed the annotated corpus in which gold-standard answers are provided such as zero anaphors and their possible antecedents. Training examples are prepared using the annotated corpus and used to train the SVMs and test the system. For zero anaphor detection, sentences are parsed by a syntactic analyzer and subject or object cases omitted are identified. Thus performance of our system is dependent on that of the syntactic analyzer, which is a limitation of our system. When an antecedent is not found in the text, our system tries to use the title to restore the zero anaphor. This is based on binary classification using the regular SVM. The experiment showed that our system's performance is F1 = 68.58%. This means that state-of-the-art system can be developed with our technique. It is expected that future work that enables the system to utilize semantic information can lead to a significant performance improvement.

Korean Noun Extraction Using Exclusive Segmental ion Information and Post-noun morpheme sequences (분석 배제 정보와 후절어를 이용한 한국어 명사추출)

  • Lee, Do-Gil;Ryu, Won-Ho;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.19-25
    • /
    • 2000
  • 명사 추출기는 정보검색, 문서분류, 문서요약, 정보추출 등의 분야에서 사용되고 있으며, 정확한 명사 추출과 빠른 색인 속도는 이들 시스템 성능과 밀접한 관계가 있다. 한국어에서 명사를 추출하기 위해서는 형태소 분석이 필요한데, 본 논문에서는 대량의 품사부착된 말뭉치로부터 추출한 분석배제 정보와 후절어를 이용함으로써 형태소 분석을 생략하거나 보다 단순한 처리에 의해 명사를 추출하는 방법을 제안한다. 또한 형태소 분석시 복잡한 음운 현상을 처리하기 위해 많은 음운 규칙을 적용하는 대신 음운 복원 정보를 사용하여 음운 현상을 처리하는 방법을 제안한다. 실험결과에 의하면, 제안된 방법에 의한 명사추출기는 비교적 높은 정확률과 재현율을 나타내며, 빠른 속도를 보였다.

  • PDF

Design of Q/A System By Natural Language Processing (자연언어에 의한 질의응답 시스템의 설계)

  • Kim, Y.K.;Kang, S.H.;Woo, Y.S.;Kim, H.W.;Choi, B.U.
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.469-477
    • /
    • 1992
  • 본 논문에서는 자연언어 처리를 기반으로 한 질의응답 시스템을 설계하며 그 대상을 호텔 예약 시스템으로 한다. 시스템은 크게 언어 해석부, 문맥 처리부, 화제 처리부 및 한국어 생성부로 구성한다. 언어 처리부에서는 단일화 문법을 적용하여 사용자가 입력한 질의문을 해석하며 그 해석결과로부터 이 후 질의응답에 사용되는 정보들인 술어, 각 명사구들의 의존 관계치 및 의미 제약치를 얻어 낸다. 문맥처리를 수행하여 생략문 등에 의해 결핍된 정보들을 추출함으로서 정보의 손실을 보완한다. 이 정보들을 이용하여 사용자와 시스템간의 자연스러운 대화를 진행하기 위한 화제처리를 수행하며, 최종적으로 화제 처리부에서 파악한 화자의 의도를 기초로 사용자가 요구한 정보를 제공하고 계속된 대화진행을 위해 적절한 한국어를 생성해 주는 한국어 생성부를 거치게 된다. 본 논문에서는 호텔 예약이라는 정해진 영역하에서 자연언어처리에 의해 추출한 술어, 각 명사구들의 의존관계치 및 의미제약치 정보들을 이용하여 문맥처리와 화제처리를 수행함으로서 더욱 효율적인 질의응답 시스템을 구현할 수 있음을 보인다.

  • PDF

Membrane technology for wastewater reuse (분리막을 이용한 산업폐수 재이용 기술)

  • Lee, C.;Kim, S.U.;Chun, H.D.;Kang, S.G.
    • Proceedings of the Membrane Society of Korea Conference
    • /
    • 1997.10a
    • /
    • pp.105-106
    • /
    • 1997
  • 1. 서론 : 급속한 산업화에 따른 수자원 고갈과 계속되는 가뭄으로 인해 일부지역에서는 물부족 사태가 갈수록 심화되고 있다. 또한 정부에서는 폐수배출 허용 기준의 단계적 강화는 물론 수질총량규제를 실시하여 폐수방류량을 근본적으로 해결할 수 있는 기술이 요구되고 있는데 그 방안이 폐수를 처리하여 공업용수로 재이용함으로서 대체용수를 확보함과 동시에 폐수방류량을 줄여 공공수역의 오염부하량을 저감하는 것이다. (생략)

  • PDF

Korean Noun Extraction Using Exclusive Segmentation Information and Post-noun morpheme sequences (분석 배제 정보와 후절어를 이용한 한국어 명사추출)

  • 이도길;류원호;임해창
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.19-25
    • /
    • 2000
  • 명사 추출기는 정보검색, 문서분류, 문서요약, 정보추출 등의 분야에서 사용되고 있으며, 정확한 명사 추출과 빠른 색인 속도는 이들 시스템 성능과 밀접한 관계가 있다. 한국어에서 명사를 추출하기 위해서는 형태소 분석이 필요한데, 본 논문에서는 대량의 품사부착된 말뭉치로부터 추출한 분석배제 정보와 후절어를 이용함으로써 형태소 분석을 생략하거나 보다 단순한 처리에 의해 명사를 추출하는 방법을 제안한다. 실험결과에 의하면, 제안된 방법에 의한 명사추출기는 비교적 높은 정확률과 재현율을 나타내며, 빠른 속도를 보였다.

  • PDF