• 제목/요약/키워드: 구문 분석기

검색결과 173건 처리시간 0.027초

통계와 규칙을 이용한 강인한 품사 태거 (Robust Part-of-Speech Tagger using Statistical and Rule-based Approach)

  • 심준혁;김준석;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.60-75
    • /
    • 1999
  • 품사 태깅은 자연 언어 처리의 가장 기본이 되는 부분으로 상위 자연 언어 처리 부분인 구문 분석, 의미 분석의 전처리로 사용되고, 독립된 응용으로 언어의 정보를 추출하거나 정보 검색 등의 응용에 사용되어 진다. 품사 태깅은 크게 통계에 기반한 방법, 규칙에 기반한 방법, 이 둘을 모두 이용하는 혼합형 방법 등으로 나누어 연구되고 있다. 포항공대 자연언어처리 연구실의 자연 언어 처리 엔진(SKOPE)의 품사 태깅 시스템 POSTAG는 미등록어 추정이 강화된 혼합형 품사 태깅 시스템이다 본 시스템은 형태소 분석기, 통계적 품사 태거, 에러 수정 규칙 후처리기로 구성되어 있다. 이들은 각각 단순히 직렬 연결되어 있는 것이 아니라 형태소 접속 테이블을 기준으로 분석 과정에서 형태소 접속 그래프를 생성하고 처리하면서 상호 밀접한 연관을 가진다. 그리고, 미등록어용 패턴사전에 의해 등록어와 동일한 방법으로 미등록어를 처리함으로써 효율적이고 강건한 품사 태깅을 한다. 한편, POSTAG에서 사용되는 태그세트와 한국전자통신연구원(ETRI)의 표준 태그세트 간에 양방향으로 태그세트 매핑을 함으로써, 표준 태그세트로 태깅된 코퍼스로부터 POSTAC를 위한 대용량 학습자료를 얻고 POSTAG에서 두 가지 태그세트로 품사 태깅 결과 출력이 가능하다. 본 시스템은 MATEC '99'에서 제공된 30000어절에 대하여 표준 태그세트로 출력한 결과 95%의 형태소단위 정확률을 보였으며, 태그세트 매핑을 제외한 POSTAG의 품사 태깅 결과 97%의 정확률을 보였다.

  • PDF

어셈블리어 코드 기반의 메모리 오류 가능성 검출 (Detection of Potential Memory Access Errors based on Assembly Codes)

  • 김현수;김병만;배현섭;정인상
    • 정보처리학회논문지D
    • /
    • 제18D권1호
    • /
    • pp.35-44
    • /
    • 2011
  • 메모리 사용에 관련한 오류는 해당 프로그램뿐 아니라 시스템의 오작동을 유발할 수 있다. 특히 발생 빈도가 매우 낮은 일부 메모리 오류의 경우 제대로 된 동작 테스트를 할 수 없어, 오류에 대한 파악 및 수정이 힘들다. 이에 본 논문에서는 실행 프로그램을 역어셈블(Dis-Assemble)하여 만들어진 어셈블리어 코드를 구문 분석하여 명령어 전이도를 도출하고 이에 기반을 두어 메모리 사용 오류 가능성을 검출하는 방법을 제안하였다. 몇 가지 프로그램을 검사대상으로 선정하여 Local Memory Return Error, Null Pointer Access Error, Uninitialized Pointer Access Error를 검출하였으며 그 중 오픈 소스 프로젝트(Open Source Project)인 아파치 웹 서버와 PHP 스크립트 해석기에서도 메모리 사용 오류의 가능성이 있는 코드가 검출되었다.

e-로지스틱스에서 효율적인 차량관제를 위한 질의 처리기 구현 (Implementation of Query Processor for Efficient Vehicle Monitoring and Control in e-Logistics)

  • 김동호;김진석;류근호
    • 한국지리정보학회지
    • /
    • 제7권3호
    • /
    • pp.35-47
    • /
    • 2004
  • 최근 부각되고 있는 텔레매틱스와 위치기반서비스의 효율적인 구축을 위해서는 실시간으로 수집되는 방대한 분량의 위치 데이터의 저장, 질의, 프리젠테이션 동을 포함하는 이동체 기술이 필요하다. 특히 물류분야에서 이동중인 차량의 데이터에 대한 효과적인 검색과 분석을 위해서는 응용별 특화된 형태의 데이터를 획득할 수 있는 질의구문이 요구되며, 전통적인 데이터베이스 질의어와 비교할 때 그 구조는 복잡한 양상을 보인다. 이에 대한 효과적인 대안으로는 SQL과 같은 표준화 데이터베이스 언어를 통한 접근을 고려할 수 있다. 따라서 이 논문에서는 e-로지스틱스 기반의 차량관제에서 요구하는 질의에 대하여 SQL를 확장한 이동체 질의어 (MOOU)를 제안하고, 이를 효과적으로 처리하기 위한 질의처리기를 설계 및 구현한다.

  • PDF

잔차 연결의 조건부 생성적 적대 신경망을 사용한 시맨틱 객체 분할 (Semantic Object Segmentation Using Conditional Generative Adversarial Network with Residual Connections)

  • ;;;강현수;서재원
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1919-1925
    • /
    • 2022
  • 본 논문에서는 시맨틱 분할을 위한 조건부 생성적 적대 신경망 기반의 이미지 대 이미지 변환 접근법을 제안한다. 시맨틱 분할은 동일한 개체 클래스에 속하는 이미지 부분을 함께 클러스터링하는 작업이다. 기존의 픽셀별 분류 방식과 달리 제안하는 방식은 픽셀 회귀 방식을 사용하여 입력 RGB 이미지를 해당 시맨틱 분할 마스크로 구문 분석한다. 제안하는 방법은 Pix2Pix 이미지 합성 방식을 기반으로 하였다. 잔차 연결이 훈련 프로세스를 가속화하고 더 정확한 결과를 생성하므로 생성기 및 판별기 아키텍처 모두에 대해 잔여 연결 기반 컨볼루션 신경망 아키텍처를 사용하였다. 제안하는 방법은 NYU-depthV2 데이터셋를 이용하여 학습 및 테스트 되었으며 우수한 mIOU 값(49.5%)을 달성할 수 있었다. 또한 시맨틱 객체분할 실험에서 제안한 방법과 현재 방법을 비교하여 제안한 방법이 기존의 대부분의 방법들보다 성능이 우수함을 보였다.

소프트웨어 제품 계열 공학의 온톨로지 기반 휘처 공동성 및 가변성 분석 기법 (Ontology-based Approach to Analyzing Commonality and Variability of Features in the Software Product Line Engineering)

  • 이순복;김진우;송치양;김영갑;권주흠;이태웅;김현석;백두권
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.196-211
    • /
    • 2007
  • 제품 계열 공학에서 제품의 공통성 및 가변성 분석을 결정짓게 하는 기준인 휘처 (feature) 분석에 대한 기존 연구는 개발자의 직관이나 도메인 전문가의 경험에 근간으로 분석 기준이 객관적이지 못하며, 비정형적인 휘처 분석으로 인한 이해 당사자 (stakeholder)의 공통된 휘처의 이해 부족 및 불명확한 휘처를 추출하는 문제점이 있었고, 기 개발된 소프트웨어에서 사용된 휘처의 재사용 개념이 부족했었다. 본 논문에서는 특정 도메인의 휘처 모델을 온톨로지로 변환하여 의미 기반 유사성 분석 기준에 의해 휘처의 공통성과 가변성을 추출하는 기법을 제시한다. 이를 위해, 먼저 공통된 휘처 중심의 메타 휘처 모델 기반으로 휘처의 속성을 정립하고, 메타 모텔에 준거하여 휘처 모델을 생성하여 온톨로지로 변환 후, 휘처 온톨로지 리포지토리 (Repository)에 저장한다. 이후, 동일 제품 계열 도메인의 휘처 모델 구축 시, 기 존 생성 모델과 온톨로지의 의미 기반 유사성 비교 분석 기법을 통해 휘처의 공통성과 가변성을 추출하는 것이다 또한 유사성 비교 알고리즘을 툴로 구현하였으며, 전자 결재 시스템 도메인의 실험 및 평가를 통 해 효과성을 보인다. 본 기법을 통해 메타 휘처 모델의 구문적 정립으로 이해성과 정확성을 제고시켜 고품질의 휘처 모델을 구축할 수 있으며, 온톨로지의 의미 기반 매핑으로 휘처의 공통성 및 가변성 추출을 정형화할 수 있고, 재사용성을 향상시킬 수 있다.

SVM 기계학습을 이용한 웹문서의 자동 의미 태깅 (Automatic semantic annotation of web documents by SVM machine learning)

  • 황운호;강신재
    • 한국산업정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.49-59
    • /
    • 2007
  • 본 논문은 시맨틱 웹의 실현을 위해서는 필수적인 작업인 웹문서의 의미를 자동으로 태깅할 수 있는 시스템에 관한 것이다. 웹상의 방대한 자원을 일일이 사람이 수작업으로 의미를 태깅한다는 것은 사실상 불가능하기 때문에 한국어 웹문서를 대상으로 대량의 학습 데이터를 수집하고 자연어처리 기법과 시소러스를 이용하여 특징을 추출한 후 SVM 기계학습을 통하여 개념분류기를 구축하였다. 한국어의 특징을 파악하여 의미 태깅에 필요한 특징 정보를 추출하기 위해서 형태소 분석과 구문 분석을 하였다. 추출된 특징정보는 가도카와 시소러스의 의미코드를 이용하여 학습벡터로 구성되는데, 이는 유사한 단어나 구를 하나의 개념코드로 매핑하여 시스템의 재현율을 높이는 역할을 하게 된다. 실험결과 자동 의미 태깅 분야에서 본 접근방법의 가능성을 확인할 수 있었다.

  • PDF

지역분석을 위한 웹 기반 통계GIS 연구 (A Study on the Statistical GIS for Regional Analysis)

  • 박기호;이양원
    • Spatial Information Research
    • /
    • 제9권2호
    • /
    • pp.239-261
    • /
    • 2001
  • 우리 나라 국가지정통계자료는 대부분 행정구역을 기초단위로 하는 지리/지역정보로서 계량적 지역분석기법을 통해서 그 가치가 더해진다. 본 연구는 지역분석을 위한 통계정보 및 통계지도 서비스 시스템의 한 선도적 모델을 제시하는데 그 목적을 둔다. 본 연구에서는 서울시를 사례로 하여 인구주택 총조사 및 사업체기초통계 원시자료 등을 재 집계하여 지역통계 데이터베이스를 구축하였다. 통계GIS의 핵심 지역분석모듈은 사회경제 자료분석에서 활용의 빈도가 높은 지역구조 및 격차 분석, 공간 분산분석, 상관분석, 회귀 및 잔차분석, 공간적 자기상관분석 등으로 구성되었다. 시스템 설계는 지역통계 데이터베이스와 지역분석기법 모듈, 그리고 통계지고를 웹 환경에서 통합하기 위해 어플리케이션 서버를 포함한 다양한 정보기반기술을 채택하여 이루어졌다. 지역분석을 위한 입출력 과정에서 대화형 통계지도가 사용된다. 본 연구를 통해 제안된 통계 GIS의 특징은 미리 저장된 데이터와 분석기능이 사용자와의 양방향 웹 인터페이스를 통해 제한 없이 확장될 수 있다는 점이다. 사용자의 요구에 따라 분석변수의 자유로운 변형과 합성이 연산자 구문해석기를 통해 가능하고, 이를 바탕으로 새로운 지역분석 알고리즘의 구현이 실시간으로 가능하다. 또한 데이터 측면에서는 사용자가 업로드한 자료를 잠정적으로 시스템에 통합하여 확장된 가상 데이터베이스를 만들고 이에 대해 여러 분석을 수행할 수 있다. 웹 기반 통계GIS 모델의 초기평가를 통해 각종 지역통해자료로부터 주문형 통계지도의 작성과 유통이 동시에 가능함이 확인되었다.

  • PDF

기분과 성격특성이 정신생리적 반응에 미치는 영향 (Effect of Mood and Personality Characteristics on Psychophysiological Responses)

  • 구문선;유범희
    • 수면정신생리
    • /
    • 제8권1호
    • /
    • pp.59-66
    • /
    • 2001
  • 목 적 : 본 연구는 정상인에서 바이오피드백 시스템으로 측정된 정신생리적 변인들과 기분 및 성격 특성에 미치는 영향을 알아보고자 하였다. 방 법 : 광고를 통해 모집한 내과적, 정신과적 질환의 병력이 없는 건강한 성인남녀 50명을 대상으로 스필버거 특성불안척도, 베크 우울척도, 성인용 아이젱크 성격검사를 측정하였다. 정신생리학적 변인은 J & J 바이오피드백 시스템을 이용하여 말초피부 온도, 피부전도 반응, 전완 근전도, 전두근 근전도의 수준을 기저기, 스트레스기, 회복기의 3시기로 나누어서 측정하였다. 또한 각 심리척도의 상위 10명, 하위 10명을 고집단(고불안, 고우울, 외향성, 고신경증)과 저집단(저불안, 저우울, 내향성, 저신경증)으로 분류하여 고/저 집단간의 정신생리적 반응의 차이를 t-test, repeated measures ANOVA, Pearson 상관분석을 통해 살펴보았다. 결 과 : 특성불안과 정신생리적 반응과의 관계를 살펴보았을 때, 전완 근전도의 스트레스 반응만이 특성불안과 유의한 상관관계를 나타냈을 뿐(r=0.282, p<0.05), 다른 정신생리적 반응과 연관성은 관찰되지 않았다. 우울감은 기저기와 회복기의 전완 근전도에서 각각 부적 상관관계를 나타냈다(r=-0.299, p<0.05;r=-0.314, p<0.05). 고우울 집단과 저우울 집단을 비교한 결과 전두근 근전도가 스트레스와 회복반응에서 유의한 상호작용 효과를 나타냈다 (F=4.26, p<.05). 외향적인 집단은 내향적인 집단에 비해 스트레스기에 측정된 전완 근전도가 높은 것으로 나타났다. 결 론:본 연구를 통해 정상인에게서 기분과 성격 특성은 바이오피드백 시스템으로 측정한 정신생리적 반응과 연관이 있음을 확인했다. 이는 각종 정신과적 장애에서 동반되는 정신생리적 변인의 이상소견을 해석하는데 있어 반드시 고려해야 할 점으로 생각된다.

  • PDF

신경망을 이용한 한국어 운율 발생에 관한 연구 (A Study on the Prosody Generation of Korean Sentences using Neural Networks)

  • 이일구;민경중;강찬구;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.65-69
    • /
    • 1999
  • 합성단위, 합성기, 합성방식 등에 따라 여러 가지 다양한 음성합성시스템이 있으나 순수한 법칙합성 시스템이 아니고 기본 합성단위를 연결하여 합성음을 발생시키는 연결합성 시스템은 연결단위사이의 매끄러운 합성계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연음에 존재하는 운율법칙을 정확히 구현하면 합성음의 자연감을 높일 수 있으나 존재하는 모든 운율법칙을 추출하기 위해서는 방대한 분량의 언어자료 구축이 필요하다. 일반 의미 문장으로부터 운율법칙을 추출하는 것이 바람직하겠으나, 모든 운율 현상이 포함된 언어자료는 그 문장 수가 극히 방대하여 처리하기 힘들기 때문에 가능하면 문장 수를 줄이면서 다양한 운율 현상을 포함하는 문장 군을 구축하는 것이 중요하다. 본 논문에서는 음성학적으로 균형 잡힌 고립단어 412 단어를 기반으로 의미문장들을 만들었다. 이들 단어를 각 그룹으로 구분하여 각 그룹에서 추출한 단어들을 조합시켜 의미 문장을 만들도록 하였다. 의미 문장을 만들기 위해 단어 목록에 없는 단어를 첨가하였다. 단어의 문장 내에서의 상대위치에 따른 운율 변화를 살펴보기위해 각 문장의 변형을 만들어 언어자료에 포함시켰다. 자연감을 높이기 위해 구축된 언어자료를 바탕으로 음성데이타베이스를 작성하여 운율분석을 통해 신경망을 훈련시키기 위한 목표패턴을 작성하였다 문장의 음소열을 입력으로 하고 특정음소의 운율정보를 발생시키는 신경망을 구성하여 언어자료를 기반으로 작성한 목표패턴을 이용해 신경망을 훈련시켰다. 신경망의 입력패턴은 문장의 음소열 중 11개 음소열로 구성된다. 이 중 가운데 음소의 운율정보가 출력으로 나타난다. 분절요인에 의한 영향을 고려해주기 위해 전후 5음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다. 특정화자로 하여금 언어자료를 발성하게 한 음성시료의 운율정보를 추출하여 신경망을 훈련시킨 결과 자연음의 운율과 유사한 합성음의 운율을 발생시켰다.

  • PDF

웹 기반 지도대수 처리기에 관한 연구 (A Study on the Web-based Map Algebraic Processor)

  • 박기호
    • Spatial Information Research
    • /
    • 제5권2호
    • /
    • pp.147-160
    • /
    • 1997
  • 지리정보시스템의 이론적 틀로 인식되고 있는 지도대수(Map Algebra)는 공간자료의 처리단위인 지도레이어를 피연산자로, 여러 처리소프트웨어를 연산자로 모델링하는 대수체계이다. 본 논문에서는 지도대수와 관련된 대표적 선행연구를 검토하여 그 제한점을 밝혀내어 보완하였다. 첫째 지도 레이어를 함수로 모형화하여 함수 프로그래밍의 메타 함수기능의 적용을 가능하도록 하였다. 이것은 지도대수언어에 메타연산자를 포함시켜 지리정보시스템의 사용자언어에 필요한 프로그래밍 기능을 제공하게된다 . 둘째 기존 지도대수언의 어의적.문법적 한계를 분석하고 이를 확장하여 지도 데이터 모델과 지도대수언어를 정형화한 후 지도대수 처리기으 원형을 설계하고 구현하였다. 지도대수언어 구문해석기는 기존의 지리정보시스템이 갖고 있는 이질적인 고유 명령어를 공통언어로 재구성하는 역할을 수행한다. 본 연구를 통해 구현된 맵시(MspSee)는 웹에 기반한 지도대수 처리기로써 본 논문에서 제시된 다양한 지도대수의 개념을 검증할 수 있었다. 지도대수언어를 통한 지리정보시스템의 사용자 인터페이스는 제트워크상에 분산되어 있는 지리정보와 그 처리모듈을 웹 클라이언트라는 간단하지만 강력한 인터페이스로 접근을 가?케 함으로써 인터넷 지리정보시스템의 중요 하부구조로 자리잡을 것으로 전망된다.

  • PDF