• 제목/요약/키워드: sentence processing

검색결과 323건 처리시간 0.022초

항해안전을 위한 AIS와 ECDIS 기반의 문자통신시스템 개발에 관한 연구 (A Study on the Development of Text Communication System based on AIS and ECDIS for Safe Navigation)

  • 안영중;강석용;이윤석
    • 해양환경안전학회지
    • /
    • 제21권4호
    • /
    • pp.403-408
    • /
    • 2015
  • 해상에서 발생하는 선박 간 음성통신의 문제점을 보완하기 위한 방법으로, 언어적 오류와 VHF 사용제한 및 잡음 등에 영향을 받지 않는 텍스트 기반의 통신시스템을 AIS의 통신기능과 ECDIS의 화면전시 및 입력기능을 연계하는 방법에 착안하여 설계하였다. 개발된 문자통신시스템은 메시지를 이용해 정확한 의사전달이 가능하며, 사용자 편의성 향상을 위한 다양한 UI들을 소프트웨어를 통해 구현하였다. 하드웨어의 추가적인 설치와 개조 없이 구현되고, Message Banner Interface를 이용해 통신문장을 키보드 입력 없이 선택만으로 송신할 수 있으며, 자체 메시지 코딩과 디코딩을 통해 처리속도를 향상시키는 장점을 가진다. 문자통신시스템의 실선적용은 사용자의 언어적 한계와 인식오류를 감소시킬 수 있고, 다양한 VHF 음성통신의 문제를 해결할 수 있는 가장 실용적인 대안으로 판단된다. 또한 해상교통량이 많은 수역에서의 VHF 통신량 감소와 텍스트 기반의 정확한 의사전달과 협력동작 요청으로 선박 간 충돌사고 예방에 도움이 될 것이다.

명사 어휘의미망을 활용한 문법 검사기의 문맥 오류 결정 규칙 일반화 (Generalization of error decision rules in a grammar checker using Korean WordNet, KorLex)

  • 소길자;이승희;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.405-414
    • /
    • 2011
  • 국내에서 가장 일반적으로 사용되고 있는 규칙 기반 오류 검출 방법은 언어 전문가가 한국어 문서에서 자주 발생하는 오류에 대한 검출 규칙을 경험적으로 구축하고 있다. 그러나 이렇게 경험적으로 규칙을 만들면 새로운 패턴의 문장이 나타날 때마다 규칙이 수정되어야 하므로 일관성 있는 오류 검사 및 교정을 기대할 수 없다. 본 논문에서는 이를 해결하려고 최근 개발되고 있는 어휘의미망 중에서 KorLex와 같은 정규화된 언어 자원을 활용하여 단어들의 범주 정보를 추출하고 이를 이용하여 오류 결정 규칙을 일반화한다. 그러나 현재 구축된 KorLex에는 명사의 계층관계 정보는 구축되어 있지만, 문장 요소와의 관계 정보, 즉, 격틀 정보가 부족하다. 본 논문에서는 용언 의미 오류 결정 규칙으로 사용할 선택제약 명사 클래스를 정보이론에 기초한 MDL과 Tree Cut Model을 활용하여 추출하고 이러한 선택제약 명사 클래스를 사용하여 문법 검사기 규칙을 일반화하는 방안을 제안한다. 실험 결과, 혼동하기 쉬운 네 개의 용언에 대해 목적어로 사용된 명사를 선택제약 명사 클래스로 일반화하여 문법 검사기 오류 결정 규칙 수를 평균 64.8%로 줄였고 기존 명사를 사용한 문법 검사기보다 정확도 측면에서 평균 약 6.2%정도 향상된 결과를 얻을 수 있었다.

숙성조건에 따른 양파장아찌의 품질특성 (Quality Characteristics of Onion Jangaji during Aging)

  • 강난숙;김준한;김종국
    • 한국식품저장유통학회지
    • /
    • 제15권6호
    • /
    • pp.796-803
    • /
    • 2008
  • 일시에 대량 수확되는 양파의 소비를 촉진시키고자 숙성온도를 달리하여 양파장아찌를 제조하고 이화학적 품질특성 변화를 조사하였다. 담금액의 당도는 숙성 37일에 $16.0%{\sim}16.7%$로, 양파장아찌육의 당도는 대략 15.0%정도 이었다. 담금액의 염도는 숙성 37일에는 $3.30%{\sim}3.37%$이였다. 담금액의 pH는 숙성 37일까지 $3.84{\sim}4.05$로, 양파장아찌육의 pH는 숙성 37일까지 $3.93{\sim}4.31$이었다. 담금액의 색도는 적색도의 경우 숙성 37일에 $1.73{\sim}2.20$으로 감소하였다. 황색도의 경우 숙성 최종일에 $0.03{\sim}0.54$이였다. 양파장아찌육의 표면색도 값은 백색도의 경우 숙성 최종일까지 $22.13{\sim}43.75$이였다. 적색도의 경우 실험군 중 $10^{\circ}C$의 경우 숙성기간 최종일에 5.478로 가장 낮은 값을, 황색도의 경우 $0^{\circ}C$의 경우숙성기간 11일째에 6.31이였다. 담금액의 산도는 숙성 최종일까지 $0.014%{\sim}0.023%$로, 양파장아찌육의 산도는 숙성 최종일까지 $0.045%{\sim}0.023%$이였다. 담금액의 탁도(%T)는 숙성 최종일까지 $0.47{\sim}0.86$으로, 양파장아찌육의 %T는 숙성 최종일까지 $2.19{\sim}2.41$이였다. 조직감의 경우는 견고성은 실험군 중 $20^{\circ}C$의 경우 984.50이였다. 부숴짐성은 숙성기간 14일째에 $20^{\circ}C$에서 929.94로 가장 높은 값을, 접착성은 실험군은 숙성기간 9일째에 $10^{\circ}C$에서 675.64로 가장 높은 값을, 탄력성은 숙성기간 9일째부터 숙성기간 16일째까지는 대조군과 실험군에서 감소하였다. 씹힘성은 대조군은 숙성최종일에는 -1518.21이였다. 관능검사 결과는 양파장아찌의 외관적인 색의 경우 $10^{\circ}C$ 실험군이 2.83으로, 향은 $20^{\circ}C$ 실험군이 2.83으로, 맛은 $0^{\circ}C$ 실험군 3.07로 가장 높은 점수를, 아삭거리는 정도는 $10^{\circ}C$ 실험군이 3.57로 높은 점수를, 전체적인 기호도는 대체적으로 3.7정도의 관능적 점수를 얻었다.

광합성 실험에서 나타난 초등 예비교사들의 반성적 사고와 실험 수행 능력 분석 (The Analysis of Elementary Pre-service Teachers' Reflective Thinking and Experiment Performance Ability on Photosynthesis Experiment)

  • 김동렬
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제34권4호
    • /
    • pp.502-518
    • /
    • 2015
  • 본 연구는 초등학교 과학교과서에 수록된 광합성 실험을 초등 예비교사들이 직접 수행하고 그 실험결과와 자신의 반성을 담은 탐구과정상의 어려움과 해결책을 탐구보고서에 작성하도록 하였다. 10개조의 탐구보고서와 발표자료를 바탕으로 초등 예비교사들의 반성적 사고와 실험 수행 능력을 분석하였다. 반성적 사고에 대해서는 10편의 탐구보고서에서 '지식', '과정', '지향', '태도' 4가지 유형과 관련된 총 108개의 진술 문장을 추출하였다. 분석 결과 광합성 실험을 통해 획득한 '지식'에 대한 반성적인 사고에 대한 내용이 가장 많았다. 지식유형에서도 실험을 통해 새롭게 알게 된 것이나 기존의 개념이해가 변화한 내용에 대한 반성이 가장 높은 빈도를 보였다. 실험 수행 능력은 10개조 중 반성적 사고 4가지 유형을 합산하여 가장 높은 빈도를 보인 한 개 조와 가장 낮은 빈도를 보인 한 개 조의 탐구보고서를 '실험준비 및 안전사고 예방', '실험 수행', '실험결과 정리 및 일반화', '실험결과 보완 및 피드백' 4단계에 따라 분석하여 56개의 문장을 추출하였다. 분석 결과 '실험결과 보완 및 피드백' 단계에서 두 조 간에 가장 큰 차이를 보였다. 최하위 조의 경우 '실험결과 정리 및 일반화' 단계의 '컴퓨터를 이용한 정보 처리', '대체 시약 및 재료 탐색', '대체 실험법 고안' 능력과 관련된 내용은 탐구보고서에서 찾을 수가 없었다.

웹기반 언어 학습시스템을 위한 한국어 철자/문법 검사기의 성능 향상 (Improving a Korean Spell/Grammar Checker for the Web-Based Language Learning System)

  • 남현숙;김광영;권혁철
    • 인지과학
    • /
    • 제12권3호
    • /
    • pp.1-18
    • /
    • 2001
  • 이 논문의 목적은 한국어 철자/문법 검사기를 교육적으로 활용한 웹 기반 국어 작문 학습 시스템의 구현이다. 웹 기반 학습시스템 \\`우리말 배움터\\`의 학습효과를 최대화하려면 한국어 철자/문법 검사기의 성능을 꾸준히 향상해야 한다 오늘날 자연어처리 시스템의 성능은 의미처리를 얼마나 정확하게 수행하는가에 달려있다 한국어 철자/문법 검사기에서 의미처리와 관련이 있는 부분은 철자 검사기에서 접사나 꼬리말과 파생하는 단어와 복합명사를 교정하는 처리기와 의미·문체 오류를 교정하는 문법 검사기이다. 본 시스템에서는 의미처리를 위하여 의존문법에 기반하여 부분문장분석과 연어관계정보를 이용한다. 여기에 더 세부적인 규칙을 추가하기 위해 단어를 개념적으로 분류하고 문장의 핵심요소인 동사를 하위범주화한 결과를 적용한다. 의미처리 기능을 강화한 철자/문법 검사기를 온라인으로 운영함으로써 웹에 기반한 한국어 학습시tm템과 통합된 환경에서 능동적이고 지능적인 학습 모형을 구현한다. 이 논문에서 다루는 의미처리의 대상은 주로 구문 단위이기 때문에 여러 개의 절이 모여 하나의 문장이 된 복문이나 중문은 다루지 못하고 있다. 또한 일률적인 체계 속에서 단어를 의미적으로 분류하는 데에도 많은 한계가 있다. 한편 이러한 자연어처리시스템을 웹 기반 학습시스템에 연결하여 효율적인 학습효과를 거두려면 학습내용 구성이나 인터페이스 설계 면에서도 고려해야 할 중요한 문제가 많다. 결론에서는 아직 완전하게 해결하지 못한 문제에 대해 고찰한다.

  • PDF

이중 언어 기반 패러프레이즈 추출을 위한 피봇 차별화 방법 (Pivot Discrimination Approach for Paraphrase Extraction from Bilingual Corpus)

  • 박에스더;이형규;김민정;임해창
    • 인지과학
    • /
    • 제22권1호
    • /
    • pp.57-78
    • /
    • 2011
  • 패러프레이즈는 같은 의미를 다른 단어를 사용하여 표현한 것을 말한다. 패러프레이즈는 일상적인 언어생활에서도 흔히 관측되며 자연어처리 분야에서 다양하게 활용할 수 있다. 특히 최근에는 통계적 기계 번역 분야에서 데이터 부족 문제를 보완하여 번역 성능을 향상시키기 위해 패러프레이즈를 활용한 연구가 많다. 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇으로 사용하기 때문에 단어 정렬 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류가 패러프레이즈로 전파될 수 있다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우에는 단어 정렬 오류가 더 심각하기 때문에 피봇 프레이즈부터 잘못 추출되는 경우가 많아진다. 이러한 문제를 보완하기 위해 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서 어휘, 품사 정보를 이용해 올바른 피봇 프레이즈에 더 높은 가중치를 부여하는 방법을 제안한다. 실험 결과, 제안하는 피봇 가중치 부여 방법을 기존의 패러프레이즈 추출 방법에 추가했을 때 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다. 또한, 제안하는 방법을 통해 추출한 패러프레이즈를 한영 기계 번역 시스템에서 활용하였을 때 번역률이 향상됨을 확인할 수 있었다.

  • PDF

외국어로서의 영어 구문 중의성 해결 과정 (Processing of the Syntactic Ambiguity Resolution in English as a Foreign Language)

  • 정유진;이윤형;황유미;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.261-266
    • /
    • 2000
  • 글을 이해하기 위해서는 어휘와 어휘간의 연결 및 전체 구조를 아는 것이 필요하다. 이는 비단 한국어뿐만 아니라 영어나 기타 다른 외국어에서도 마찬가지일 것이다. 본고는 두 가지를 고찰하기 위해 진행되었는데 우선 외국어로서 영어를 처리하는데 발생하는 구문적 중의성을 해결하는데 Garden Path Sentence(GPS), Late Closure(LC), PP의 세 문형에 따라 어떻게 해결하는지 알아보기 위한 것이다. 그리고 각 문형의 중의적 어절에서의 반응과 애매성 해소 어절에서의 반응에 따라 sysntactic module이 작용하는 것인지 알아보고자 한다. 예를 들어 "The boat floated down the streams sank"란 Garden Path 문장이 제시된 경우에 독자는 "sank"란 어휘가 제시되기 전까지 "floated"를 동사로 생각하게 되나 다음에 본동사인 "sank"가 제시될 경우 문장의 해석에 혼란을 갖게 될 것이다. 예문에서 "floated"가 문장에서 어떤 역할을 하는지 결정하는 것은 "sank"를 보고서야 가능하다. 이런 구문적 중의성을 해결하는 방식을 알아보기 위해 어절 단위로 제시된 자극을 읽는 자기 조절 읽기 과제(self-paced reading task)를 사용하였다. 각 어절을 읽는데 걸리는 시간을 측정한 실험 결과 GPS, PP, LC 모두 중의성을 지닌 영역이 중의성을 해소한 후와 각각 유형적으로 큰 차이가 없는 것으로 나타났다. 다만 GPS, CGPS, PP와 CPP는 어절 후반으로 갈수록 반응시간이 짧아졌다. 이는 우리나라 사람의 경우 외국어인 영어의 구문 중의성 해소는 구문 분석 단원(syntactic module)에 의한 자동적 처리라기보다 의미를 고려해 가면서 문법지식을 이용해 추론을 통한 구문 분석이라 할 수 있다.에 의한 자동적 처리라기보다 의미를 고려해 가면서 문법지식을 이용해 추론을 통한 구문 분석이라 할 수 있다.많았다(P<0.05).조군인 Group 1에서보다 높은 수준으로 발현되었다. 하지만 $12.5{\;}\mu\textrm{g}/ml$의 T. denticola sonicated 추출물로 전처리한 Group 3에서는 IL-2와 IL-4의 수준이 유의성있게 억제되어 발현되었다 (p < 0.05). 이러한 결과를 통하여 T. denticola에서 추출된 면역억제 단백질이 Th1과 Th2의 cytokine 분비 기능을 억제하는 것으로 확인 되었으며 이 기전이 감염 근관에서 발견되는 T. denticola의 치수 및 치근단 질환에 대한 병인기전과 관련이 있는 것으로 사료된다.을 보였다. 본 실험 결과, $Depulpin^{\circledR}은{\;}Tempcanal^{\circledR}와{\;}Vitapex^{\circledR}$에 비해 높은 세포 독성을 보여주공 있으나, 좀 더 많은 임상적 검증이 필요할 것으로 사료된다.중요한 역할을 하는 것으로 추론할 수 있다.근관벽을 처리하는 것이 필요하다고 사료된다.크기에 의존하며, 또한 이러한 영향은 $(Ti_{1-x}AI_{x})N$ 피막에 존재하는 AI의 함량이 높고, 초기에 증착된 막의 업자 크기가 작을 수록 클 것으로 여겨진다. 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로 나타났다.corner$적 의도에 의한 경관구성의 일면을 확인할수 있지만 엄밀히 생각하여 보면 이러한 예의 경우도 최락의 총체적인 외형은 마찬가지로 $\ulcorner$순응$\lrcorner$의 범위를 벗어나지 않는다. 그렇기 때문에도 $\ulcorner$순응$\lrcorner$$\ulcorner$표현$\lrcorner$의 성격과 형태를 외형상으로 더욱이 공간상에서는 뚜렷하게 경계

  • PDF

동형이의어 분별에 의한 한국어 의존관계 분석 (An Analysis of Korean Dependency Relation by Homograph Disambiguation)

  • 김홍순;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.219-230
    • /
    • 2014
  • 의존관계 분석은 문장의 어절 간에 의존소-지배소를 결정하는 작업이다. 용언은 문형 및 하위범주화 정보의 선택제약에 의해 다른 어절과의 의존관계를 형성한다. 본 논문은 형태소 분석 단계에서 동형이의어 분별된 용언의 문형을 이용하여 용언의 의존관계를 분석하는 방법을 제안한다. 특히, 형태소분석 단계에서 품사 및 동형이의어 태깅을 위해 사용하는 단계별 전이모델의 학습사전을 재활용하여 {명사+격조사, 용언} 간의 의존관계를 확정하는 방안을 제안하고 그의 정확률 및 영향을 분석한다. 동형이의어가 부착되고 의존관계로 변경된 21개의 세종구문분석말뭉치를 이용하여 실험한 결과, 동형이의어 분별된 의존관계 분석 정확률이 80.38%로, 동형이의어가 분별되지 않은 의존관계분석에 비해 0.42%의 정확률 향상이 있었으며, 유의수준 1%의 검정통계량 Z는 ${\mid}Z{\mid}=4.63{\geq}z_{0.01}=2.33$으로 동형이의어 분별이 의존관계 분석에 영향이 있음을 보였다. 또한, 단계별 전이모델이 의존관계 분석 정확률에 약 7.14% 영향을 미치는 것을 알 수 있었다.

이미지 캡션 생성을 위한 심층 신경망 모델의 설계 (Design of a Deep Neural Network Model for Image Caption Generation)

  • 김동하;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권4호
    • /
    • pp.203-210
    • /
    • 2017
  • 본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하며, 캡션 문장 생성을 위한 매 순환 단계마다 이미지의 시각 정보를 이용할 수 있도록 컨볼루션 신경망 층의 출력을 순환 신경망 층의 초기 상태뿐만 아니라 멀티 모달 층의 입력에도 연결하는 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험들을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 높은 성능을 확인할 수 있었다.

대사경로 재구축을 위한 텍스트 마이닝 기법 (Text-mining Techniques for Metabolic Pathway Reconstruction)

  • 권혁렬;나종화;유재수;조완섭
    • 한국산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.138-147
    • /
    • 2007
  • 대사 공학의 발전과 함께 생물체에 유전자 재조합기술과 관련 분자생물학 및 화학공학적 기술을 이용하여 새로운 대사회로를 도입하거나 기존의 대사회로를 제거 증폭 변경시켜 세포나 균주의 대사 특성을 조절하는(directed modification) 일련의 기술들이 가능해지고 있다. 하지만 이러한 대사회로를 조절하기 위해서는 많은 선행 연구에 대한 고찰이 필요하며, 일선 연구자들은 방대한 선행 자료를 검색하고 일일이 읽으면서 자신에게 필요한 정보를 수집하고 있다. 따라서 효율적으로 대사 모델을 구축하고, 방대한 대사관련 연구논문으로부터 대사흐름 관련 정보를 자동으로 추출하는 기술의 개발이 중요한 이슈로 부각되고 있다. 본 논문에서는 대사경로 재구축을 위한 서열과 패턴 기반의 텍스트 마이닝 기법을 제안한다. 제안된 기법은 웹 로봇을 이용하여 최신의 논문을 반자동적으로 수집하고 이를 이용하여 최신의 논문을 로컬 데이터베이스로 구축한다. 또한 생물학 개체명의 인식율을 높이기 위해 유전자 온토로지를 이용하며, NCBI에서 제공하는 Tokenizer 라이브러리를 이용하여 개체명의 파괴 없이 인식할 수 있게 하였다. 본 연구에서 제안한 텍스트 마이닝 기법에서는 패턴을 이용하여 논문으로부터 대사경로 지식을 추출하게 되므로 올바른 패턴을 확보하는 것이 중요한 문제이다. 논문에서는 패턴의 수집을 위하여 대표적인 대사 경로 전문 사이트인 일본의 KEGG 경로 데이터베이스에서 추출한 Glycosphingolip건 종에 대한 20,000 여건의 논문에서 66개의 패턴을 추출하였다. 제안된 기법의 유효성을 입증하기 위하여 Glycosphingolipid종의 GLS 대사경로 19개 개체명을 이용하여 시스템을 평가하였다. 그 결과 논문 125,907건에 대하여 정확도 96.3%, 재현을 95.1%, 처리시간 15초의 성능을 보였다. 본 논문에서 제안된 시스템은 대사 경로 재구축에 유용하게 활용될 수 있을 것으로 기대된다.

  • PDF