• 제목/요약/키워드: 어휘복잡성

검색결과 44건 처리시간 0.023초

클래스 특성 기계학습에 기반한 클래스 이름의 접미사 검증 기법 (Validation Technique for Class Name Postfixes Based on the Machine Learning of Class Properties)

  • 이홍석;이준하;이일로;박수진;박수용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권6호
    • /
    • pp.247-252
    • /
    • 2015
  • 소프트웨어의 규모가 커지고 복잡성이 증가함에 따라 소프트웨어의 유지보수가 보다 중요해지고 있으며 유지보수성에 많은 영향을 미치는 요인 중 하나는 소스코드 가독성이다. 가독성의 90% 이상 영향을 끼치는 요인은 소스코드에서 사용되는 식별자들의 이름이며 이를 위한 기존 연구들에서는 클래스의 식별자로 사용된 어휘를 이용하여 식별자의 이름을 검증한다. 하지만 대부분의 관련 연구는 그 특성상 개체의 도메인 관련 특성만을 고려하게 되며 클래스 내의 어휘가 적절하지 못한 경우 적용할 수 있는 범위가 한정적이라는 한계점이 있다. 본 논문에서는 클래스의 특성을 추출하여 의사결정트리 기법을 통해 기계학습을 시킨 후 클래스 역할 모델을 생성하며 이를 이용하여 이름을 검증할 대상 클래스의 역할에 해당하는 접미사를 추천하게 되어 클래스 이름 검증 보고서를 생성한다. 본 연구 기법의 효용성을 검증하기 위해 4개의 오픈소스 프로젝트에 대하여 본 연구 기법을 적용하였고 클래스 역할 정보를 담고 있는 5개의 접미사에 대해 정확도와 재현율, ROC 곡선과 같은 지표를 제시하였다.

음소 모델링 방식들의 성능 비교 (Performance Comparison of Acoustic Modeling Technique)

  • 송명규
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.377-380
    • /
    • 1998
  • HMM 기반의 음성 인식기를 구현하는데 있어서 모델의 복잡도와 제한된 훈련 데이터 사이의 균형을 유지하는 것은 중요한 문제이다. 중간규모 또는 대용량 어휘 인식 시스템은 정교한 모델을 얻기 위해서 문맥종속 음소 모델링이 필수적이다. 그러나, 제한된 훈련 데이터로는 발생 가능한 모든 context를 포함하기가 어렵고, 더구나 훈련 데이터에서 관찰된 context중에서도 그 관찰빈도가 낮은 것이 많아서 신뢰성 있는 문맥종속 모델들을 얻기에는 여전히 어려움이 따른다. 또한 경우에 따라서는 계산량의 감축을 위하여 모델 규모를 축소시킬 필요도 생긴다. 이러한 문제를 해결하기 위해 본 논문에서는 unit reduction 방법들과 state tying을 이용한 방법들의 성능을 실험을 통해 비교한다. 고립단어 인식 실험결과 state tying을 이용한 방법이 unit reduction에 비하여 우수함을 확인 할 수 있었다.

  • PDF

'공평한' 언어를 위하여 -독일어 개혁의 페미니즘적 노력- ($F\"{u}r$ eine 'gerechte' Sprache -Zu den feministischen $Bem\"{u}chungen$ um eine Reform des Deutschen)

  • 페터 슈미터
    • 한국독어학회지:독어학
    • /
    • 제3집
    • /
    • pp.5-34
    • /
    • 2001
  • 최근 구직광고, 시청, 정치 정당, 행정부처나 특정 일간지와 시사잡지의 최근 정보 팜플렛을 1981년 이전에 나온 관련 출판물들과 비교해보면 지난 20년 동안 현대 독일어 체계에서 주목할 만한 변화가 일어났으며 어느 정도 성과가 있었음을 어렵지 않게 알 수 있을 것이다. 언어의 실천 분야에서 1981년에 처음 나타난 이런 변화(vgl. Guentherodt, Ingrid / Hellinger, Marlis/Pusch, Luise F./Tromel-Plotz, Senta: Richtliruen 2ur Vermeidung sexistischen Sprachgebrauchs. In: Linguistische Berichte H. 71, 1981, 1-7)는 특히 어휘와 대명사 체계뿐 아니라 관사체계와 명사곡용과 관련된 변화에 대해서도 관심을 보이고 있다. 이런 언어변화는 계몽적 논문 그리고 '신 여성운동'과 그 결과로 나타난 '페미니즘 언어학'의 부단한 요구가 결정적이었다. 여기서 말하는 요구란 전통적인 언어체계에 머물러 있던 '성차별'을 없애고 독일어를 개혁함으로써 어휘와 문법에서 여성의 대표성을 감지할 수 있을 정도로 남성적-가부장적 관점의 지배적인 면을 없애고 '공평한 언어'를 만들어내는 것이었다. 궁극적으로 사람들은 이런 언어개혁을 통하여 여성의 사회적인 권리평등의 길을 마련하고 싶었다. 이 논문의 목적은 이런 복잡한 문제를 좀 더 알기 쉽게 밝혀보려는 것이다. 이를 위하여 첫 번째로 사회 정치적인 맥락에서 언어 개혁을 위한 노력을 살피고 언어 이론적인 토대를 질문하였다. 두 번째로 독일 페미니즘 언어학의 구체적인 역사적 기원을 간단히 살펴보았다. 세 번째로 개혁안을 자세히 논의하면서 체계적으로 정리하였다. 마지막으로 네 번째로는 개혁안과 그의 언어학적 기초에 대한 비판의 핵심 쟁점을 살피고, 찬반주장이 또 다른 분야로, 즉 한편으로 언어정책(찬성 주장) 분야로 다른 한편으로 체계언어학(반대 주장) 분야로 확대되기 때문에 언어개혁에 대한 페미니즘적 노력의 지지자와 반대자간의 논쟁에서 해결할 수 없는 것으로 보이는 문제를 테제로 제시하였다.

  • PDF

해외인턴쉽의 영어능력 발전에 미치는 영향 (The Effects of Overseas Internships on Development of English Competence)

  • 차미양
    • 융합정보논문지
    • /
    • 제9권1호
    • /
    • pp.99-104
    • /
    • 2019
  • 본 연구는 해외인턴쉽의 외국어능력 발전에 미치는 영향을 고찰하기 위해 15주간 해외인턴쉽 프로그램에 참여한 10명의 한국대학생들이 작성한 영작문의 변화를 조사하였다. 자료수집을 위해 참여학생들은 인턴쉽 전후로 영작문 하나씩을 작성하였다. 수집된 자료를 이용해 두 영작문의 구성요소 및 어휘 사용면의 변화들을 분석하였고, 이어 통계분석도 실시하였다. 본 논문의 결과에 의하면, 참가자들이 인턴쉽 이후에 더 많은 수의 문장들을 사용하였고, 문장들이 더 길어졌으며, 아울러 더 복잡한 구조의 문장을 생성한 것을 알 수 있다. 또한 어휘의 유창성과 사용능력이 증가하였고 문장 내에 다음절의 다양한 유형의 단어들이 사용되었다는 것을 알 수 있다. 본 연구는 해외인턴쉽이 외국어능력 향상에 유용하다는 것을 나타낸다. 따라서 글로벌 경쟁력 제고를 꾀하는 중소기업들은 생산성, 품질 등 산업적 능력 제고뿐만 아니라 해외인턴쉽과 같은 훈련프로그램을 통해 인적자원의 글로벌 역량도 강화할 필요가 있겠다.

정보거래 자동 중개 시스템을 위한 한국어 문형 표준안 (Controlled Korean Phrase-Structure Standard Spec. for the Automatic Information Trading Mediator System)

  • 정의석;김기태;임수종;차건회;박재득;윤보현;강현규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.138-145
    • /
    • 2000
  • 본 논문은 정보거래 자동 중개 시스템을 위한 한국어 문형 표준안에 대하여 기술한다. 정보거래 자동 중개 시스템은 인터넷상에서 지식정보자산의 공급자와 수요자를 자동으로 연결해주는 시스템으로서 텍스트로 기술되는 수요자의 의도와 공급자의 지식정보 내용을 정확히 연결할 수 있는 신뢰성을 보장한 고품질의 정보검색 기술이 필수적이다. 그러나 자연어의 복잡성과 불규칙성은 정확한 언어처리 기술이 필수적인 고품질의 정보검색을 보장할 수 없다. 따라서 본 논문은 한국어 문장 표현 방식을 표준화하여 언어처리 기술 적용의 한계를 극복해보자는 데 그 목적이 있다. 또한 일반 사용자의 언어 표현을 문형 표준안으로 유도하는 방법에 대하여 기술한다. 문형 표준안의 구성은 표준 문형 표준 문형 유도 방법, 어휘부로 구성되어 있다.

  • PDF

이용자 태그를 활용한 비디오 스피치 요약의 자동 생성 연구 (Investigating an Automatic Method in Summarizing a Video Speech Using User-Assigned Tags)

  • 김현희
    • 한국문헌정보학회지
    • /
    • 제46권1호
    • /
    • pp.163-181
    • /
    • 2012
  • 본 연구는 스피치 요약의 알고리즘을 구성하기 위해서 방대한 스피치 본문의 복잡한 분석 없이 적용될 수 있는 이용자 태그 기법, 문장 위치 및 문장 중복도 제거 기법의 효율성을 분석해 보았다. 그런 다음, 이러한 분석 결과를 기초로 하여 스피치 요약 방법을 구성, 평가하여 효율적인 스피치 요약 방안을 제안하는 것을 연구 목적으로 하고 있다. 제안된 스피치 요약 방법은 태그 및 표제 키워드 정보를 활용하고 중복도를 최소화하면서 문장 위치에 대한 가중치를 적용할 수 있는 수정된 Maximum Marginal Relevance 모형을 사용하여 구성하였다. 제안된 요약 방법의 성능은 스피치 본문의 단어 빈도 및 단어 위치 정보를 적용하여 상대적으로 복잡한 어휘 처리를 한 Extractor 시스템의 성능과 비교되었다. 비교 결과, 제안된 요약 방법을 사용한 경우가 Extractor 시스템의 경우 보다 평균 정확률은 통계적으로 유의미한 차이를 보이며 더 높았고, 평균 재현율은 더 높았지만 통계적으로 유의미한 차이를 보이지는 못했다.

Maximum Entropy 모델을 이용한 나열 및 병렬형 인식 (Syntax Analysis of Enumeration type and Parallel Type Using Maximum Entropy Model)

  • 임수종;이창기;허정;장명길
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1240-1245
    • /
    • 2006
  • 한국어 문장을 구조 분석할 때에 모호성을 발생시키는 유형 중의 하나가 나열 및 병렬형이다. 문장 구조 복잡도를 증가시키는 나열 및 병렬형을 구조 분석 전에 미리 하나의 단위로 묶어서 처리하는 것이 문장 구조 분석의 정확도를 높이는데 중요하다. 본 연구에서는 형태소 태그를 이용한 기본 규칙으로 문장을 청크 단위로 분할하고 분할된 청크 중에서 나열형을 인식하여 해당되는 청크들을 하나의 나열 청크로 통합하여 청크의 개수를 줄인다. 병렬형에 대해서는 반복되는 병렬 청크의 범위와 생략된 용언을 복원한다. 이러한 인식은 첫 단계로 기호(symbol)를 중심으로 구축된 간단한 규칙으로 인식을 하고 이러한 규칙에 해당되지 않는 형태의 나열 및 병렬형은 Maximum Entropy 모델을 이용하여 적용한다. ME모델은 어휘자질, 형태소 품사 자질, 거리 자질, 의미자질, 구 단위 태그 자질(NP:명사구, VP:동사구, AP:형용사구), BIO 태그(Begin, Inside, Outside) 자질에 대한 ME(Maximum Entropy) 모델을 이용하여 구축되었다.

  • PDF

OWL을 이용한 온톨로지 기반의 목록시스템 설계 연구 (A Study of Ontology-based Cataloguing System Using OWL)

  • 이현실;한성국
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.249-267
    • /
    • 2004
  • MARC는 목록 데이터를 상세하게 정의할 수 있는 장점이 있지만, 개념요소가 구조화 되어 있지 않고 표현체계가 복잡하기 때문에 단순 계층구조의 의미 어휘 체계를 지원하는 XML DTD나 RDF/S로는 그 구조를 모델화하기가 어렵다. 본 연구에서는 MARC의 데이터 요소를 추상화하여 목록 데이터의 개념 구조를 표현하는 서지 온톨로지를 구축하였으며, 개념간의 논리 관계와 프로퍼터의 카디널리티 및 프로퍼티 값에 대한 논리적 제한을 부가할 수 있는 OWL을 이용하여 MRAC 필드의 복합 구조를 모델링하여 구축한 목록 온톨로지를 구현하였다. 온톨로지 언어를 이용한 MARC 데이터를 기술 방법은 목록 데이터에 대한 메타데이터 구성과 목록의 호환성 문제를 해결할 수 있는 기초적 방안이 되며, 시맨틱 웹 서비스를 기반으로 하는 차세대 문헌 정보서비스 시스템 구현의 토대가 될 것이다.

창의적 이야기 작문용 세 그림의 동형 조사: 'Dog Owners,' 'Lost Dog,' 'Overslept' (An Investigation into the Equivalence of Three Pictures for Creative Story Writing: 'Dog Owners', 'Lost Dog', and 'Overslept')

  • 서희정;배정옥
    • 영재교육연구
    • /
    • 제26권4호
    • /
    • pp.699-719
    • /
    • 2016
  • 창의적 사고와 언어기술을 평가하는데 동형검사로 판명된 대체 그림들이 절실히 요구되고 있다. 본 연구는 창의적 쓰기 과제용으로 최근 개발된 세 그림(이름: 'Dog Owners,' 'Lost Dog,' 'Overslept')이 동형 검사지가 되는지 조사하였다. 183명의 중학생들이 무작위로 배분된 세 그림 중 하나에 의거하여 영어로 이야기를 작성하였다. 작문은 네 가지 쓰기요소(유창성, 어휘 다양성, 구조 복잡성, 그리고 시간성)에 대해 Coh-Metrix와 MANCOVA로 분석되었다. 이 세 그림은 변별력에 있어 대체로 위 모든 요소에 대해 비슷하였다. 그러나 이들의 난이도는 요소별로 볼 때 반드시 같지는 않았다. Dog Owners와 Lost Dog 그림은 변별력과 난이도에 있어 동형으로 판명되었다. 그러므로 이 두 그림은 반복 측정에서 타당한 동형 검사지로 추천된다. Overslept 그림은 다양한 어휘와 시간 연결사들을 유발시키는 데에 다른 두 그림 보다 용이하였다. 그림의 난이도가 다를 수 있다는 결과는 반복시험에서 대체 그림을 사용할 시 이들 그림이 동형 검정을 거치지 않고서는 그 타당성이 의심스러울 수 있음을 환기시켜 준다.

가족관련변인과 영유아발달의 관계 : 종일제 보육과 어머니 단독양육의 비교 (The Relations between Familial Predictors and Infant-Toddler Development: Comparison between Full-Time Child Care vs. Exclusive Mother Care)

  • 장영은
    • 한국보육지원학회지
    • /
    • 제10권4호
    • /
    • pp.159-176
    • /
    • 2014
  • 본 연구는 영유아기 종일제 어린이집 이용 여부에 따라 가족관련 변인이 영유아발달에 가지는 관계성의 강도가 다를 수 있다는 가설을 검증하는 데에 목적이 있다. 한국아동패널연구의 3차년도 및 4차년도 조사자료를 분석하여 종일제 어린이집을 이용(주당 30시간 이상의 어린이집 이용)집단과 어린이집이나 대리양육자를 이용하지 않는 어머니 단독양육 집단을 추출하여, 일련의 가족관련 변인과 영유아의 발달적 결과 간의 관계성의 양상과 그 강도를 비교하였다. 분석방법으로 이변량 상관관계분석을 실시하였으며 두 집단의 상관계수 간의 유의한 차이를 검증하였다. 연구결과, 만2세의 경우 어머니의 사회적 양육유형이 영아의 의사소통을 정적으로 예측하는데 있어 종일제 어린이집을 사용하는 가족에서 그 크기가 유의하게 큰 것으로 나타났다. 만 3세 때에는 가정환경검사 중 다수의 하위변인에서 어린이집을 이용하지 않는 가족의 경우, 종일제 어린이집을 이용하는 경우에 비해 유의하게 강한 상관관계로 표현어휘 및 수용어휘 발달을 예측하였다. 즉, 어린이집에서 시간을 보내는 경우, 가정환경 외에 다른 요인이 발달을 예측할 수 있음을 시사한다. 하지만 이들 변인 외에 분석에 사용된 다양한 변인과 영유아 발달 간의 상관관계에 집단차는 발견되지 않아 발달에 기여하는 가족과정이 종일제 어린이집과 어머니 단독양육 집단 간에 유사 또는 차별적이라고 단순히 결론 내릴 수 없고, 발달연령, 가족과정 내의 예측요인, 그리고 발달적 결과에 따라 다소 복잡한 유형으로 차이를 보임을 알 수 있다.