• 제목/요약/키워드: Syntactic Features

검색결과 93건 처리시간 0.028초

An intelligent eddy current signal evaluation system to automate the non-destructive testing of steam generator tubes in nuclear power plant

  • Kang, Soon-Ju;Ryu, Chan-Ho;Choi, In-Seon;Kim, Young-Ill;Kim, kill-Yoo;Hur, Young-Hwan;Choi, Seong-Soo;Choi, Baeng-Jae;Woo, Hee-Gon
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1992년도 한국자동제어학술회의논문집(국제학술편); KOEX, Seoul; 19-21 Oct. 1992
    • /
    • pp.74-78
    • /
    • 1992
  • This paper describes an intelligent system to automatic evaluation of eddy current(EC) signal for Inspection of steam generator(SG) tubes in nuclear power plant. Some features of the intelligent system design in the proposed system are : (1) separation of representation scheme ,or event capturing knowledge in EC signal and for structural inspection knowledge in SG tubes inspection; (2) each representation scheme is implemented in different methods, one is syntactic pattern grammar and the other is rule based production. This intelligent system also includes an data base system and an user interface system to support integration of the hybrid knowledge processing methods. The intelligent system based on the proposed concept is useful in simplifying the knowledge elicitation process of the rule based production system, and in increasing the performance in real time signal inspection application.

  • PDF

The Interlanguage Speech Intelligibility Benefit (ISIB) of English Prosody: The Case of Focal Prominence for Korean Learners of English and Natives

  • Lee, Joo-Kyeong;Han, Jeong-Im;Choi, Tae-Hwan;Lim, Injae
    • 말소리와 음성과학
    • /
    • 제4권4호
    • /
    • pp.53-68
    • /
    • 2012
  • This study investigated the speech intelligibility of Korean-accented and native English focus speech for Korean and native English listeners. Three different types of focus in English, broad, narrow and contrastive, were naturally induced in semantically optimal dialogues. Seven high and seven low proficiency Korean speakers and seven native speakers participated in recording the stimuli with another native speaker. Fifteen listeners from each of Korean high & low proficiency and native groups judged audio signals of focus sentences. Results showed that Korean listeners were more accurate at identifying the focal prominence for Korean speakers' narrow focus speech than that of native speakers, and this suggests that the interlanguage speech intelligibility benefit-talker (ISIB-T) held true for narrow focus regardless of Korean speakers' and listeners' proficiency. However, Korean listeners did not outperform native listeners for Korean speakers' production of narrow focus, which did not support for the ISIB-listener (L). Broad and contrastive focus speech did not provide evidence for either the ISIB-T or ISIB-L. These findings are explained by the interlanguage shared by Korean speakers and listeners where they have established more L1-like common phonetic features and phonological representations. Once semantically and syntactically interpreted in a higher level processing in Korean narrow focus speech, the narrow focus was phonetically realized in a more intelligible way to Korean listeners due to the interlanguage. This may elicit ISIB. However, Korean speakers did not appear to make complete semantic/syntactic access to either broad or contrastive focus, which might lead to detrimental effects on lower level phonetic outputs in top-down processing. This is, therefore, attributed to the fact that Korean listeners did not take advantage over native listeners for Korean talkers and vice versa.

효율적인 한국어 파싱을 위한 최장일치 기반의 형태소 분석기 기능 확장 (Functional Expansion of Morphological Analyzer Based on Longest Phrase Matching For Efficient Korean Parsing)

  • 이현영;이종석;강병도;양승원
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.203-210
    • /
    • 2016
  • 한국어는 문장 구성소의 생략과 수식 범위가 자유롭기 때문에 파싱보다는 형태소 분석 단계에서 처리하면 좋은 경우가 있다. 본 논문에서는 파싱의 부담을 덜어 줄 수 있는 형태소 분석기의 기능 확장 방안을 제안한다. 이 방법은 미지어의 추정, 복합 명사 및 복합동사의 처리, 숫자 및 심볼의 처리에 의해 여러 형태소 열이 하나의 구문 범주를 가질 때 이것을 최장일치 방법으로 결합하고 의미 자질을 부여하여 하나의 구문 단위로 처리하는 것이다. 제안한 형태소 분석 방법은 불필요한 형태론적 모호성이 제거되고 형태소 분석 결과가 줄어들어 태거 및 파서의 정확률이 향상되었다. 또한, 실험을 통해 파싱트리는 평균 73.4%, 파싱 시간은 평균 52.9%로 줄었음을 보인다.

키워드 질의를 이용한 순위화된 웹 서비스 검색 기법 (Ranked Web Service Retrieval by Keyword Search)

  • 이경하;이규철;김경옥
    • 한국전자거래학회지
    • /
    • 제13권2호
    • /
    • pp.213-223
    • /
    • 2008
  • 오늘날 XML 웹 서비스의 보급에 따라 많은 양의 서비스로부터 적합한 서비스들을 발견해 내는 문제는 중요한 문제로 부각되고 있다[7, 24]. 본 논문에서는 의미론적인 서비스 발견을 행하는 기존 연구와 다르게 구문적인 방법으로 서비스 발견 문제에 접근한다. 우리는 웹서비스 발견의 문제를 레지스트리에 저장된 웹 서비스 설명 정보들에 대한 정보 검색의 문제로 인식하고, 웹 서비스와 질의의 모델링과 유사도 측정을 통한 검색 기법을 고안하였다. 이 서비스 설명정보는 특정 구조를 가지는 XML 문서이며, 본 논문에서는 이를 대상으로 한 키워드 질의를 통해 서비스 발견을 수행한다. 본 논문의 특징은 다음과 같다. 사용자는 키워드 질의를 통해 순위화된 서비스 검색 결과를 제공받을 수 있다. 서비스 검색에 있어 기존 기법들과 달리 UDDI 레지스트리에 저장된 서비스 설명 정보와 WSDL 서비스 정의 모두를 활용한다. 또한 시스템은 기존 관계형 DBMS의 기능을 이용하여 구현됨으로써 의미적인 서비스 발견에 비해 구현이 용이하고, DBMS의 여러 장점을 취할 수 있다.

  • PDF

XL-BPMN 모델 기반 비즈니스 서비스 식별 기법 (A Business Service Identification Techniques Based on XL-BPMN Model)

  • 송치양;조은숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.125-138
    • /
    • 2016
  • 서비스 지향 개발에서 서비스 식별은 워크플로우, 목표와 시나리오, 유스케이스, 컴포넌트, 휘처, 패턴 등에 기반해서 이루어져 왔다. 그러나, 비즈니스 가치 관점에서 의미적 접근에 의한 서비스의 식별은 아직 구체화되어 있지 않다. 본 논문은 비즈니스 서비스 식별의 정확성을 향상시키기 위하여, XL-BPMN 모델 대상의 구조적 및 의미적 분석에 의한 비즈니스 서비스를 식별하는 방법을 제시한다. 비즈니스 시나리오에 기반해서 비즈니스 프로세스들을 식별하고, 이 프로세스는 XL-BPMN 비즈니스 프로세스 모델로 디자인한다. 이 비즈니스 프로세스 모델에서, 액티비티들간 구조적 패턴과 속성 기반 의미적 유사성의 통합된 분석 결과에 의해 밀접한 액티비티를 바인딩해서 단위 비즈니스 서비스를 식별한다. 이를 통해, 상위 비즈니스 가치 관점의 XL-BPMN 모델을 통한 정확성과 모듈성이 높은 단위 비즈니스 서비스 식별을 할 수 있다. 식별된 서비스의 재사용을 통해서 서비스 지향 개발을 더욱 가속화를 도모할 수 있을 것이다.

DUML 패킷 분석을 통한 드론 비행기록 포렌식 시스템 (Drone Flight Record Forensic System through DUML Packet Analysis)

  • 윤여훈;윤주범
    • 정보보호학회논문지
    • /
    • 제34권1호
    • /
    • pp.103-114
    • /
    • 2024
  • 드론 범죄가 지속적으로 증가하고 있는 상황에서 드론에 대한 사고 예방 및 대응을 위한 드론 포렌식 연구가 매우 중요해지고 있다. 불법적인 범죄 행위를 수사하기 위해서는 드론 내부 저장소에 생성되는 비행기록 파일에 대한 포렌식 분석이 필수적이다. 하지만 독점 DUML 프로토콜로 생성되는 비행기록 파일을 분석하기 위해서는 프로토콜의 구조와 특징에 대한 개념이 반드시 필요하며 암호화되는 Payload에 대응하고 다양한 드론 모델에 대한 분석이 가능한 포렌식 분석 도구가 필요하다. 따라서 본 연구를 통해 먼저 드론에서 생성되는 비행기록 파일의 획득 방법과 특징을 제시하고 비행기록 파일을 이루고 있는 구조와 DUML 패킷의 특징을 설명한다. 최종적으로 제시한 DUML 패킷의 구조에 따른 포렌식 분석을 수행하고 기존 도구보다 범용적으로 동작하며 확장된 구문 분석을 수행하는 확장 포렌식 분석 시스템을 제안한다.

창의적 이야기 작문용 세 그림의 동형 조사: 'Dog Owners,' 'Lost Dog,' 'Overslept' (An Investigation into the Equivalence of Three Pictures for Creative Story Writing: 'Dog Owners', 'Lost Dog', and 'Overslept')

  • 서희정;배정옥
    • 영재교육연구
    • /
    • 제26권4호
    • /
    • pp.699-719
    • /
    • 2016
  • 창의적 사고와 언어기술을 평가하는데 동형검사로 판명된 대체 그림들이 절실히 요구되고 있다. 본 연구는 창의적 쓰기 과제용으로 최근 개발된 세 그림(이름: 'Dog Owners,' 'Lost Dog,' 'Overslept')이 동형 검사지가 되는지 조사하였다. 183명의 중학생들이 무작위로 배분된 세 그림 중 하나에 의거하여 영어로 이야기를 작성하였다. 작문은 네 가지 쓰기요소(유창성, 어휘 다양성, 구조 복잡성, 그리고 시간성)에 대해 Coh-Metrix와 MANCOVA로 분석되었다. 이 세 그림은 변별력에 있어 대체로 위 모든 요소에 대해 비슷하였다. 그러나 이들의 난이도는 요소별로 볼 때 반드시 같지는 않았다. Dog Owners와 Lost Dog 그림은 변별력과 난이도에 있어 동형으로 판명되었다. 그러므로 이 두 그림은 반복 측정에서 타당한 동형 검사지로 추천된다. Overslept 그림은 다양한 어휘와 시간 연결사들을 유발시키는 데에 다른 두 그림 보다 용이하였다. 그림의 난이도가 다를 수 있다는 결과는 반복시험에서 대체 그림을 사용할 시 이들 그림이 동형 검정을 거치지 않고서는 그 타당성이 의심스러울 수 있음을 환기시켜 준다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

시간부사 '증경(曾經)', '이경(已經)' 시상(時相) 자질 중한 대조분석 (Time Adverb 'Cengjing (曾經)' and 'Yijing (已經) Tense and Aspect of the Comparative Analysis of the Characteristics of China and South Korea)

  • 한경숙
    • 비교문화연구
    • /
    • 제42권
    • /
    • pp.451-474
    • /
    • 2016
  • 본고는 현대중국어 시간부사 '증경(曾經)'과 '이경(已經)'의 관련 통사구조와 이에 상응하는 한국어 통사구조에 대한 고찰을 통하여 관련 구조 의미소 '시상(時相)(tense and aspect)' 특징을 분석하였고 두 부사의 차이점을 찾아보았다. 아울러 중한 두 언어에서 이들이 나타내는 자질의 같은 점과 다른 점을 찾아냈고 이를 통하여 분석의 타당성(Descriptive adequacy)을 확보하고 나아가 설명적 타당성(Explanatory adequacy)으로 이끌어 내고자 하였다. '증경(曾經)'은 상 범주의 하위 범주인 '과거경험상', '성사상', '과거지속상' 등 자질을 갖고 있고 시제 범주의 하위 범주인 '과저시제' '과거경험상' 등 자질을 겸하고 있기도 하다. 한국어의 '_었(았)_', '_었었_', '_적이 있_'과 대응관계를 이루고 있다. '증경(曾經)'은 하나의 통사구조에서 상과 시제 두 가지 자질을 갖고 있다. '이경(已經)'은 '완료상'과 완료상의 하위 범주인 '과거경험상', 그리고 미완료상의 하위범주인 '과거지속상' 등 자질을 갖고 있고 시제 범주의 하위 범주인 '과거시제', '현재시제', '미래시제' 등 시제 자질도 갖고 있으며 '상태의 변화' 자질도 갖고 있다. 한국어의 '_었(았)_', '_고_', '_었었_', '곧' 등과 대응관계를 이루고 있다. '증경(曾經)'과 동태조사 '과(過)'를 비교하자면 '증경(曾經)'은 상 범주와 시제 범주를 겸하고 있다지만 '과(過)'는 그 수식 범위가 술어밖에 없기에 상적 특징만 갖고 있다. 그리고 심층구조에서 '증경(曾經)'은 술어의 앞에서 술어를 포함한 술어 뒤에 출현한 조사, 목적어, 보어 모두와 통어 관계를 갖고 있지만, '과(過)'는 그 앞의 술어만 수식한다. '이경(已經)'이 '진행상' 자질을 가진 부사 '재(在)'를 수식할 수 있지만, '증경(曾經)'은 불가능하다. 중국어와 한국어 두 언어는 이렇게 시간 표현에서 많은 차이를 보이고 있다. 중국어의 '과거경험상', '성사상', '과거지속상' 등 상 자질과 '과거시제' 자질을 갖고 있는 시간부사 '증경(曾經)', 그리고 '과거경험상', '과거지속상' 등 상 자질 그리고 '과거시제', '현재시제', '미래시제' 등 시제 자질을 갖고 있는 시간부사 '이경(已經)' 등이 한국어에서는 '완료상', '지속상' 자질과 '과거시제' 자질로 대응된다는 것을 알 수 있다. 그만큼 중국어와 한국어 두 언어의 시간 체계는 서로 많은 차이를 보이고 있다. 이는 한중 두 나라 사람들의 사유 방식의 차이와 문화적인 차이에서 비롯됐을 것으로 사료된다.

한국어 특성을 고려한 감성 분류 (Sentiment Classification considering Korean Features)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권3호
    • /
    • pp.449-458
    • /
    • 2010
  • 다양한 분야에서 인터넷 상의 방대한 양의 문서 혹은 리뷰로부터 유용한 정보를 얻고자 하는 노력이 높아짐에 따라 문서 혹은 리뷰 상의 생각 및 의견에 대한 자동 분류 연구의 필요성이 대두되었다. 이러한 자동분류를 감성 분류라 하며, 감성 분류 연구는 크게 세 가지 단계를 가지는데, 첫 번째로 주관적인 생각이나 느낌을 표현하는 문장을 추출하기 위한 주관성 분류 연구, 두 번째로 문서 또는 문장을 긍정, 부정으로 나누는 극성 분류 연구, 그리고 세 번째로 문서 또는 문장이 어느 정도의 주관성 및 극성을 갖는지 그 강도를 구하는 강도 분류 연구이다. 최근 의견 분류에 대한 연구들을 살펴보면, 분류를 위해 자질(Feature)로서 단일어(Single word)가 아닌 2개 이상의 N-gram 단어, 어휘 구문 패턴 및 통사 구문 패턴 등을 사용하는 것을 확인할 수 있다. 특히, 패턴은 단일어나 N-gram 단어에 비해 유연하고, 언어학적으로 풍부한 정보를 표현할 수 있기 때문에 이를 이용한 많은 연구가 이루어져 왔다. 그럼에도 불구하고, 이러한 연구들은 주로 영어에 대한 연구들이었으며, 한국어에 패턴을 적용하여 주관성을 갖는 문장을 분류하거나, 극성을 분류하는 연구들은 아직 미비하다. 한편, 한국어는 용언의 활용이 발달되어 있어, 어미의 변화가 다양하며, 그 변화에 따라 의미가 미묘하게 변화한다. 그러나 기존 한국어에 대한 의견 분류 연구들은 단어의 핵심 의미만을 파악하기 위해 어미부분을 제거하고 어간만을 취해서 처리하여 어미에 대한 의미변화를 고려하지 못하였다. 그래서 본 연구는 영어에 적용된 패턴을 이용한 기존 방법들을 정리하고, 그 방법들 중에서 극성을 지닌 문장성분 패턴을 한국어에 적용하였다. 그리고 어미의 변화에 대한 패턴을 추출하여 이 변화가 의견 분류의 성능에 미치는 영향을 분석하였다.

  • PDF