• 제목/요약/키워드: 언어 종류

검색결과 364건 처리시간 0.025초

4세대 언어에서의 역공학 환경 구성 (A Study on Construction of Reverse Engineering Environment in Forth Generation Language)

  • 진영배;왕창종
    • 한국정보처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.509-523
    • /
    • 1995
  • 소프트웨어의 종류가 다양하고, 크기가 커짐에 따라서 유지 보수 문제는 더욱 복 잡하고 어렵게 되었다. 따라서 소프트웨어의 유지 보수가 소프트웨어 생명 주기에서 가장 비용을 많이 차지하는 부분이 되었다. 또한 범용 소프트웨어를 개발하거나, 사용 하기 위해 단말기 사용자에게도 쉽게 느껴지는 4세대 언어가 앞으로 많이 적용되는 개 발 환경으로 될 것이다. 이에 따라서 프로그램의 유지 보수 측면에서 많은 연구가 이 루어진 COBOL, C, FORTRAN, RASCAL등과 같은 언어처럼 4세대 언어로 작성된 원시크드 에 대해서도 프로그램의 이해를 위한 분석 및 재사용 방법의 연구가 이루어져야 한다. 본 연구에서는 4세대 언어로 작성된 원시 코드로부터 메타 언어 형태로 변환하고 프로 그램 이해를 위한 문서 생성기(Document Generator), 보고서 생성기(Report Generator) , 모듈 분석기(Mldule Analyzer), 코드번역기(Code Translator)를 설계하고 구현함으 로서 4세대는 언어에서의 역공학 도구를 제안하여, 프로그램의 이해 및 관리를 효율적 으로 하는데 목적이 있다.

  • PDF

퍼지추론을 이용한 회전기계의 정밀진단법 (Vibration Diagnosis of Rotating Machinery Using Fuzzy Inference)

  • 전순기;양보석
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 1995년도 추계학술대회논문집; 한국종합전시장, 24 Nov. 1995
    • /
    • pp.284-288
    • /
    • 1995
  • 최근 애매성이 수반되는 정보를 Zadeh는 멤버쉽함수(membership function)를 이용하여 새로운 정보처리 방식으로서 퍼지이론을 제안하였고, 그후 의료계에서도 퍼지이론을 도입한 진단법들이 제안되었다. 회전기계의 이상진단법으로는 주파수득점법(Point counting method), 퍼지역연산법(Inverse method of fuzzy theory)등이 보고되고 있으며, 저자들도 퍼지이론을 이용하여 구름베어링의 결함진단, 회전기계의 간이 이상진단법등을 보고하였다. 이들은 주로 진동주파수의 스펙트럼 데이터 만을 이용하고 있고, 다른 많은 데이터를 복합적으로 이용할 수 없다. 이 때문에 주로 소규모 문제의 간이진단에서는 효과적이나 진단대상이 복잡하고 대규모로 되면 보다 정확한 원인 추정이 곤란하게 된다. 또한 수치데이터만을 취급할 수 있으므로 진동전문가가 진단에 이용하는 각종의 수치화 될 수 없는 데이터(언어적인 정보)가 취급될 수 없다. 따라서 이들의 진단법은 개략적인 진단은 가능하나 상세한 원인까지는 진단할 수 없는 단점이 있다. 회전기계의 이상판단시 참고가 되는 각종 정보로는 주로 진동진폭의 크기, 진폭과 위상의 변화, 진폭의 변화, 진동파형, 진동벡터의 시간변화 등이 있고, 이들은 수치적으로 표현할 수 있는 계량데이터와 판단의 경계가 불명확한 언어정보(범위데이터)로 나눌 수 있다. 후자는 애매성(fuzziness)을 많이 포함하고 있으며, 엄밀히 측정되는 수치데이터에서도 퍼지성을 가지고 있다. 이러한 언어적인 정보의 애매성을 퍼지추론에서는 [수치적 진리치](numeric truth)와 [언어적 진리치](linguistic truth)의 개념으로 표현하게 되었다. 수치적 진리치는 확실함의 척도를 [0,1] 사이의 수치를 이용하여 표현하고 있으며, 이 수치는 소견의 확실도로서 가능성을 표현한 것이다. 예를 들면, 진동진폭 스펙트럼상에 2X 성분이 상당히 크게 나타나 정렬불량의 가능성이 0.7 정도라고 판정하는 것 등은 이러한 수치적진리치를 이용하는 방법이다. 그러나 상기의 수치적 표현만으로는 확실도를 한개의 수치로서 대표하게 하는 것은 진단의 정밀도에 문제가 있을 것으로 생각된다. 따라서 언어적진리치가 도입되어 [상당히 확실], [확실], [약간 확실] 등의 언어적인 표현을 이용하여 애매성을 표현하게 되었다. 본 논문에서는 간이진단 결과로부터 추출된 애매한 진단결과중에서 가장 가능성이 높은 이상원인을 복수로 선정하고, 여러 종류의 수치화할 수 없는 언어적(linguistic)인 정보ㄷㄹ을 if-then 형식의 퍼지추론으로 종합하는 회전기계의 이상진단을 위한 정밀진단 알고리즘을 제안하고 그 유용성을 검토한다.

  • PDF

언어 학습 능력 향상을 위한 청각 및 시각 자극에 대한 반응속도 측정 플랫폼과 응용 (Reaction Test Platform and Application by Auditory and Visual Stimulus for Language Learning Ability Improvement)

  • 이혜란;백승현
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.77-84
    • /
    • 2010
  • 모국어나 외국어를 습득할 때 언어 처리의 '속도' 및 '정확도'가 적절하지 않으면 언어발달이 지연되거나 외국어 학습에 어려움을 보이게 되며, 실제 이를 통한 의사소통 상황에서 어려움을 겪게 된다. 따라서, 언어 학습 능력을 평가할 때 단순히 언어 처리의 정확도만이 아닌 '속도'와 '정확도'를 동시에 측정하는 것이 중요하며, 학습에 있어서도 이러한 처리의 효율성을 향상 시키는 것이 필요하다. 우리는 음성 및 시각 자극에 대한 '반응속도 측정기 플랫폼'을 개발함으로써 효율적인 언어 수행 능력을 평가하고 학습 향상에 적용하고자 하였다. 이 글에서는 먼저 이 플랫폼의 구성 및 내용 그리고 온라인 컨텐츠 구성 등의 개발 과정에 대하여 제시하였다. 또한, 이 플랫폼의 실제 적용 가능성을 검토하기 위하여 10명의 성인에게 '청각', '시각' 그리고 '시청각'의 3 가지 자극 조건을 제시하고, 각 조건에서 5회 이상 자극에 반응을 보이도록 하였다. 그리고 1회와 5회 반응의 반응 속도 및 정확도를 측정하여 비교하여 보았다. 이러한 결과 이 플랫폼이 정도의 차이는 있으나 자극의 종류에 상관없이 보다 빠르고 정확하게 언어를 처리할 수 있도록 능력을 향상시키는데 도움을 주고 있음을 알 수 있었다.

문장의 화행을 반영한 한-영 대화체 기계번역 (A Korean to English Dialogue Machine Translation System Using Speech Acts)

  • 이현정;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.271-276
    • /
    • 1997
  • 대화체는 문어체와는 달리 화자와 청자 사이의 질의/응답으로 이루어진 형태의 문장들을 가지며, 생략과 대용어가 빈번히 발생하는 특징을 갖는다. 이러한 대화 형태에서 어떠한 한 문장에는 화자가 전달하고자 하는 의도를 포함하고 있다. 이러한 대화체 문장들을 번역하는 것은 단순한 언어적 분석에 의한 번역으로서는 많은 번역상의 오류가 발생하게 된다. 따라서 대화체 문장들의 올바른 번역을 위해서는 대화의 상황을 반영하는 문맥 정보가 부가적으로 요구된다. 본 연구에서는 이러한 문맥 정보로서 화행을 사용하여 대화체 기계번역을 수행하고자 한다. 화행(Speech Act)이란 화자에 의해 의도되어 발화 속에 포함된 언어적 행위를 나타내며, 이러한 화행을 분석함으로써 화자의 의도를 파악하고 이를 통해 올바른 번역을 수행할 수 있게 된다. 본 기계번역 시스템에 포함된 화행 분석 과정에서는 대화를 화행으로 모델링한 담화 문법과 유사한 형태의 재귀적 대화 전이망(Recursive Dialog Transition Network)을 사용하게 된다. 본 논문에서는 호텔 예약 영역에서의 기계번역 시스템에 대한 간단한 소개와 화행의 종류 및 분석 방법과 이를 통한 기계번역 방식에 대해 살펴보도록 하겠다.

  • PDF

다중 언어에서 다중 활자체 및 다중 크기의 문자 인식을 위한 2계층 분류기 (A Two-Layer Classifier for Recognition of Multi-font and Multi-size Characters in Multi-lingual Documents)

  • 지수영;문경애;오원근;김태윤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.93-97
    • /
    • 1996
  • 본 논문에서는 2 계층 분류기를 이용하여 일반적인 문서(보고서, 책, 잡지, 워드프로세서에서 출력 된 양식) 내의 다중 크기 및 다중 활자체의 인식을 위한 효과적인 방법을 제안하고 구현하였다. 다중언어 문자를 효과적으로 인식하기 위한 2 계층 분류기를 제안하였는데 이는 폰트 독립적 분류기와 폰트 의존적 분류기로 구성되어 있다. 제안된 방법의 성능 평가를 위하여 사무실에서 많이 사용하는 59 종류의 폰트와 각 폰트 당 3가지 크기의 글꼴과, 스캐너에서 지원되는 3가지 농도의 총 489개의 서로 다른 부류를 갖는 3,593,172 자를 대상으로 학습시킨 뒤에 일반 문서를 가지고 펜티엄 PC 상에서 인식 실험을 수행하였다. 실험 결과, 2계층 분류기를 갖는 시스템에서 96-98%의 인식률과 초당40자 이상의 인식 속도를 보여줌으로써 일반적인 문서에서 다중 크기 및 다중 활자체의 문자 인식에 매우 실용적인 가치가 있음을 확인했다.

  • PDF

대화형 상품 검색 시스템에서 의미 구조 생성에 관한 연구 (Generation of a Semantic Structure on a Conventional Goods Search System)

  • 정혜경;배우정;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.197-204
    • /
    • 2006
  • 인터넷 쇼핑몰 분야에서 한국어 인터페이스에 대한 필요성이 대두되면서 이와 관련한 연구가 진행되어 왔다. 이러한 기존 연구들의 문제점은 다른 응용 분야에 대한 확장성이 떨어지고, 대화식 질의 문장을 처리하기 위해 필요한 상황 지식을 사용할 수 없다는 것이다. 확장성을 위해 한국어 인터페이스는 내부 구현의 변경 없이 도메인 지식의 교체만으로 다른 분야에 대한 적용이 쉬워야 한다. 아울러, 한국어 질의 문장을 SQL이나 ACL과 같은 여러 응용 분야의 인공 언어에 쉽게 변환할 수 있으려면 모호성이 전혀 없는 의미 구조로 표현되어야 한다. 이렇게 표현된 의미 구조는 상황 지식의 표현과 적용을 용이하게 한다. 본 논문은을 Sowa의 개념 구조를 이용하여 의사 의미 구조를 유형 정의, 관계형 정의, 액터와 같은 도메인 지식베이스를 이용하여 표준 의미 구조로 변환하는 시스템을 제안한다. 본 논문은 먼저 필요한 도메인 지식베이스의 종류와 역할 등을 설명하고, 상황 지식을 이용하여 불완전한 의미 구조를 완전한 의미 구조로 변환하는 방법을 보인다. 아울러, 같은 의미를 갖는 여러 형태의 의사 의미 구조가 하나의 표준 의미 구조로 변환됨으로서 시스템의 일관성을 유지하는데 용이함을 보일 것이다. 본 시스템에서 생성한 의미구조는 중간 언어의 역할을 하므로, 제안하는 한국어 인터페이스 시스템은 데이터베이스 분야뿐만 아니라 에이전트 분야, 시맨틱 웹 분야 등에서도 손쉽게 적용할 수 있다는 장점을 가진다.

  • PDF

과학텍스트의 읽기 및 이해에 대한 결속장치의 선택적 영향 (The Selective Effect of Cohesive Devices on Scientific Text Reading and Comprehension)

  • 김세영;한광희;조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.226-232
    • /
    • 2001
  • 본 연구는 결속장치(cohesive devices)가 과학텍스트의 읽기 속도와 내용 이해에 끼치는 영향에 대해 연구하였다. 연구의 목적을 위한 실험을 통해서 먼저, 텍스트의 문단별 읽기 시간을 측정하여 온라인 처리 과정을 검토하였고, 둘째, 회상과 재인 검사를 실시하여 오프라인 상태에서의 이해도를 조사하였다. 이 연구의 재료로 사용된 텍스트는 번개 생성과정에 대한 과학텍스트로서, 반복, 지시사, 정박(anchoring), 인과적 접속사 등의 결속장치를 이용하여 응집성(coherence)의 강도를 높고, 낮게 조작하였다. 실험 결과, 결속장치가 길속장치의 종류와 지엽적 응집성의 강도에 따라 과학텍스트 읽기와 이해에 선택적으로 영향을 끼친다는 것을 발견하였다. 첫째, 인과적 접속사는 읽기 시간에는 영향을 주지 않는 반면, 이해를 촉진했는데, 이 긍정적 효과는 과제의 종류에 따라 다르게 나타났다. 즉, 회상 검사 결과에서는 인과적 접속사가 쓰인 모든 문단에서 유의한 차이가 나타났으나, 재인 검사에서는 유의한 차이가 부분적으로만 나타났다. 둘째, 반복 결속장치는 다른 결속장치와 같이 발생할 경우에만 읽기 시간과 이해를 부분적으로 촉진하는 것으로 나타났다. 셋째. 정박 결속장치의 영향은 읽기와 이해 두 처리 과정에 모두 선택적으로 영향을 준 것으로 나타났다. 인과적 접속사와 함께 쓰인 문단의 경우에는 회상 검사에서만, 반복 결속장치가 함께 쓰인 문단에서는 회상, 재인 검사에서 모두 긍정적 영향을 준 것으로 관찰되었다.

  • PDF

논문 모집 공고에서의 정보 추출을 위한 2단계 은닉 마코프 모델 (Two-Phase Hidden Markov Models for Call-for-Paper Information Extraction)

  • 김정현;박성배;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 2005
  • 본 논문은 은닉 마코프 모델(hidden Markov Model: HMM)을 2 단계로 적용하여 논문 모집공고(Call-for-Paper: CFP)에서 필요한 정보를 추출하는 방법을 제안한다. HMM은 순차적인 흐름의 정보를 담고 있는 데이터를 잘 설명할 수 있으며 CFP가 담고 있는 정보에는 순서가 있기 때문에, CFP를 HMM으로 설명할 수 있다. 하지만, 문서를 전체적으로(global) 파악하는 HMM만으로는 정보의 정확한 경계를 파악할 수 없다. 따라서 첫 번째 단계로 CFP문서에서 구(phrase) 단위를 구성하는 단어의 열에 대한 HMMs을 통해 국부적으로(local) 정보의 경계와 대강의 종류를 파악한다. 그리고 두 번째 단계에서 전체적인 문서의 내용 흐름에 근거하여 구축된 HMM을 이용하여 그 정보가 세부적으로 어떤 종류의 정보인지 정한다. PASCAL challenge에서 제공받은 Cff 말뭉치에 대한 첫 번째 단계의 실험 결과, 0.60의 재현률과 0.61의 정확률을 보였으며, 정확률과 재현률을 바탕으로 F-measure를 측정한 결과 0.60이었다.

  • PDF

인쇄 문서 영상의 단어 단위 속성 인식 (Recognition of Word-level Attributed in Machine-printed Document Images)

  • 곽희규;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.412-421
    • /
    • 2001
  • 본 논문은 문서 영상에 존재하는 개별 단어들에 대한 속성정보 추출 방법을 제안한다. 단어 단위의 속성 인식은 단어 영상 매칭의 정확도 및 속도 개선, OCR 시스템에서 인식률 향상, 문서의 재생산 등 다양한 응용 가치를 찾을 수 있으며, 메타정보(meta-information) 추출을 통해 영상 검색(image retrieval)이나 요약(summary) 생성 등에 활용할 수 있다. 제안하는 시스템에서 고려하는 단어 영상의 속성은 언어의 종류(한글, 영문), 스타일(볼드, 이탤릭, 보통, 밑줄), 문자 크기(10, 12, 14 포인트), 문자 개수 (한글: 2, 3, 4, 5, 영문: 4, 5, 6, 7, 8, 9, 10), 서체(명조, 고딕)의 다섯 가지 정보이다. 속성 인식을 위한 특징은, 언어 종류 인식에 2개, 스타일 인식에 3개, 문자 크기와 개수는 각각 1개, 한글 서체 인식은 1개, 영문 서체 인식은 2개를 사용한다. 분류기는 신경망, 2차형 판별함수(QDF), 선형 판별함수(LDF)를 계층적으로 구성한다. 다섯 가지 속성이 조합된 26,400개의 단어 영상을 사용한 실험을 통해, 제안된 방법이 소수의 특징만으로도 우수한 속성 인식 성능을 보임을 입증하였다.

  • PDF

발화 의도 예측 및 슬롯 채우기 복합 처리를 위한 한국어 데이터셋 개발 (Development of Korean dataset for joint intent classification and slot filling)

  • 한승규;임희석
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.57-63
    • /
    • 2021
  • 사람의 발화 내용을 이해하도록 하는 언어 인식 시스템은 주로 영어로 연구되어 왔다. 본 논문에서는 시스템과 사용자의 대화 내용을 수집한 말뭉치를 바탕으로 언어 인식 시스템을 훈련시키고 평가할 때 사용할 수 있는 한국어 데이터셋을 개발하고, 관련 통계를 제시한다. 본 데이터셋은 식당 예약이라는 고정된 주제 안에서 사용자의 발화 의도와 슬롯 채우기를 해야 하는 데이터셋이다. 본 데이터셋은 6857개의 한국어 문장으로 이루어져 있으며, 표기된 단어 슬롯의 종류는 총 7개이다. 본 데이터셋에서 표기된 발화의 종류는 총 5개이며, 문장의 발화 내용에 따라 최대 2개까지 동시에 기입되어 있다. 영어권에서 연구된 모델을 본 데이터셋에 적용시켜 본 결과, 발화 의도 추측 정확도는 조금 하락하였고, 슬롯 채우기 F1 점수는 크게 차이나는 모습을 보였다.