• 제목/요약/키워드: measure phrases

검색결과 23건 처리시간 0.024초

Korean deadjectival inchoatives and measure phrases: a compositional study

  • Lim, Dongsik
    • 한국언어정보학회지:언어와정보
    • /
    • 제20권1호
    • /
    • pp.73-91
    • /
    • 2016
  • Korean adjectives in general cannot combine with measure phrases (MP), but MPs are compatible with adjectives when they appear with the inchoative morpheme -(e)ci. In this case, MPs can only denote the difference between two states along the dimension denoted by the root adjective. To account for this, this paper proposes that i) -(e)ci is a spell-out of V in the directed motion construction which takes an abstract path argument, like become, and ii) this path argument contains a comparative morpheme. By assuming this we can explain why MPs appear with -(e)ci, as well as other interesting phenomena such as variable telicity in deadjectival verbs with -(e)ci.

  • PDF

공통 Phrase의 관계 그래프와 Suffix Tree 문서 모델을 이용한 문서 군집화 기법 (Document Clustering with Relational Graph Of Common Phrase and Suffix Tree Document Model)

  • 조윤호;이상근
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.142-151
    • /
    • 2009
  • 기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.

확장청크와 세분화된 문장부호에 기반한 중국어 최장명사구 식별 (Identification of Maximal-Length Noun Phrases Based on Expanded Chunks and Classified Punctuations in Chinese)

  • 백설매;이금희;김동일;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.320-328
    • /
    • 2009
  • 일반적으로 명사구는 기본명사구와 최장명사구로 분류되는데 최장명사구에 대한 정확한 식별은 문장의 전체적인 구문구조를 파악하고 정확한 지배용언을 찾아내는데 중요한 역할을 하게 된다. 본 논문에서는 확장된 청크(chunk) 개념과 다섯 개의 클래스로 세분화된 문장부호 정보를 자질로 사용한 두 단계 최장명사구 식별 기법을 제안한다. 제안한 기법은 기본모델보다 2.65% 향상된 평균 89.66%($F_1$-measure)의 우수한 성능을 보인다.

정보이론에 기반한 연관 규칙들의 새로운 중요도 측정 방법 (A New Importance Measure of Association Rules Using Information Theory)

  • 이창환;배주현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권1호
    • /
    • pp.37-42
    • /
    • 2014
  • 연관 규칙들을 이용한 분류학습은 최근 활발히 연구되는 분야의 하나이다. 이러한 연관 규칙을 이용한 분류에는 연관 규칙들에 대한 수치적 중요도를 계산하는 것이 중요하다. 본 논문에서는 정보 이론을 사용한 H measure 라는 새로운 규칙 중요도 기법을 제안한다. 구체적으로 Hellinger 변량을 이용하여 연관규칙의 중요도를 계산한다. 제안된 H measure 의 다양한 특성들을 분석하였으며 또한 이러한 H measure를 이용한 분류학습의 성능을 다른 규칙 measure를 이용한 분류학습의 성능과 비교하였다.

퍼지를 이용한 교량 안전도평가의 보정계수 산정 (Calculation Correctio Factor of Bridge Capacity using Fuzzy Sets Theory)

  • 조원신;박기태;김상효;황학주
    • 한국콘크리트학회:학술대회논문집
    • /
    • 한국콘크리트학회 1992년도 가을 학술발표회 논문집
    • /
    • pp.240-244
    • /
    • 1992
  • The values of a linguistic variable are words, phrases, or sentences in a given language. For example, structural damage can be considered as linguistic variable with values such a 'severely damaged', 'moderately damaged', which are meaningful classifications but not clearly defined, This paper is to evaluate reasonably the correction factor of bridge capacity with the aid of fuzzy sets theory. By using the above mentioned fuzzy measure, the concept of fuzzy integral and linear membership function can be defined. It is concluded that the fuzzy sets theory cam be applied to determine reasonably the correction factor of bridge capacity.

  • PDF

한국 설화문에서의 화제표현의 연속성 (Topic Continuity in Korea Narrative)

  • 정희자
    • 인지과학
    • /
    • 제2권2호
    • /
    • pp.405-428
    • /
    • 1990
  • 언어는 정보교환이라는 사회적 기능을 가지고 있다. 60년대 이래로 언어학자들의 관심이 언어의 정보전달 기능, 즉 어떠한 의미가 어떤 형식을 통하여 어떻게 전달되는가 하는, 의미, 형식, 기능의 관계에 점차 집중되게 되었다. 이러한 관계는 문장분석보다는 담화분석을 통하여 더욱 명백하게 파악된다. 본 연구는 한국 설화문에서 사용되는 화제표현의 방법과 표현된 화제의 연속성을 측정함으로 효율적인 정보교환의 방법을 살펴보았다. 분석된 문법구조들은 영대용, 인칭대명사, 지시대명사, 고유대명사, 지시사 뒤에 오는 명사, 소유격을 따르는 명사, 한정적 명사 그리고 비한정적 명사, 모두 8가지이다. 본 연구의 결과를 다음과 같이 요약할수 있다. 첫째, 한국 설화문에서 '인간임'(humanness)이 가장 강한 화제의 연속성을 나타낸다. 인간지시 논항들은 주로 행위자 또는 경엄자를 나타내기 때문에 절이난 담화의 화제역학을 한다. 둘째, 이들 문법구조들은 각기 다른 화제표현의 연속성 정도를 나타낸다. 연속성 정도가 높은 구조일수록 표현이 간단하며, 연속성의 정도가 낮을수록 표현이 복잡하다. 셋째, 화제표현의 연속성은 구조들의 통사적 특성 이외에 사회적문화적 요인들과 작가의 화용상의 목적 등에 좌우되기도 한다. 마지막으로, 실질적인 정보교환의 방법을 파악하기 위하여, 구어체와 문어체 담화문을 비교분석하여 화제표현의 효율적 방법을 고찰할 것을 제의한다.

한영 혼용문에서 괄호 안 대역어구의 자동 인식 (Automatic Recognition of Translation Phrases Enclosed with Parenthesis in Korean-English Mixed Documents)

  • 이재성;서영훈
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.445-452
    • /
    • 2002
  • 한영 혼용문에서 번역된 전문용어 등을 사용할 때, 이해를 돕기 위해 그 뒤의 괄호 안에 원어 풀이를 함께 쓰는 경우가 많다. 본 논문에서는 괄호가 사용된 구가 대역어구 관계인지를 판단하고, 어느 범위까지 대역어구인지를 기본사전을 이용하여 확률적으로 계산하고 인식하는 방법을 제시한다. 특히, 사전에 표제어로서 혹은 대역어로서 존재하지 않는 단어들을 처리하기 위해 음운유사도 일치, 대역어 부분일치의 방법과 복합어 처리를 위해 부분일치 방법을 새로 제안하였다. 각 방법들을 단계별로 실험하여 0.4F값$(\alpha$를 0.4로 설정한 F값)으로 측정한 결과, 기본 실험 방법인 사전 대역어 완전일치방법의 경우 23.8%인데 비해, 대역어 부분일치와 음운유사도 일치를 흔합한 방법이 75.9%, 복합어 처리를 추가한 방법이 77.3%의 값을 보여 성능이 최고 3.25배 향상되었다.

UCP 600 해상운송서류(海上運送書類) 규정(規定)의 주요(主要) 개정사항(改正事項)에 관한 연구(硏究) (A Study on The Revision of UCP600 concerning the Sea Transport Documents)

  • 박세운
    • 무역상무연구
    • /
    • 제35권
    • /
    • pp.71-98
    • /
    • 2007
  • UCP 600 approved at the Banking Commission Meeting of ICC at the end of October, 2006 comes into effect from July 1, 2007. The main revision of the UCP 600 concerning the sea transport document are as follows. First, if the bill of lading contains an on-board-notation, with the date of shipment, the date stated in the on-board-notation will be deemed the date of shipment. Secondly, phrases "on its face" and "otherwise authenticated" should be eliminated. Thirdly, when an agent signs for or signs on behalf of the master, there is no longer a need for the name of master to be quoted. Fourthly, the terminology "loading on-board or shipped on a named vessel" is changed to "shipped on-board a named vessel." Fifthly, phrases "the rejection of the documents transported only by sail" is removed. Finally, new rule in UCP is the signing of a charter party bill of lading by the charterer or a named agent on behalf of the charterer. My assessment of the revision in UCP 600 is as follows: Because a freight forwarder transport document is a weaker form than a liner bill of lading as collateral, banks may need a secure measure as to protect themselves from such a weak collateral effect. we recognize that Such a weak collateral effect stemmed from the elimination of rules in UCP 500 article 30, and the admission of transport documents issued by the freight forwarder as long as any one besides carrier, shipper, and charterer satisfies the requirements of transport document clauses in UCP 600. Finally, I hope the Commentary on UCP 600 will serve to explain the ambiguities remaining in the new rules.

  • PDF

The f0 distribution of Korean speakers in a spontaneous speech corpus

  • Yang, Byunggon
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.31-37
    • /
    • 2021
  • The fundamental frequency, or f0, is an important acoustic measure in the prosody of human speech. The current study examined the f0 distribution of a corpus of spontaneous speech in order to provide normative data for Korean speakers. The corpus consists of 40 speakers talking freely about their daily activities and their personal views. Praat scripts were created to collect f0 values, and a majority of obvious errors were corrected manually by watching and listening to the f0 contour on a narrow-band spectrogram. Statistical analyses of the f0 distribution were conducted using R. The results showed that the f0 values of all the Korean speakers were right-skewed, with a pointy distribution. The speakers produced spontaneous speech within a frequency range of 274 Hz (from 65 Hz to 339 Hz), excluding statistical outliers. The mode of the total f0 data was 102 Hz. The female f0 range, with a bimodal distribution, appeared wider than that of the male group. Regression analyses based on age and f0 values yielded negligible R-squared values. As the mode of an individual speaker could be predicted from the median, either the median or mode could serve as a good reference for the individual f0 range. Finally, an analysis of the continuous f0 points of intonational phrases revealed that the initial and final segments of the phrases yielded several f0 measurement errors. From these results, we conclude that an examination of a spontaneous speech corpus can provide linguists with useful measures to generalize acoustic properties of f0 variability in a language by an individual or groups. Further studies would be desirable of the use of statistical measures to secure reliable f0 values of individual speakers.

Using Corpora for Studying English Grammar

  • Kwon, Heok-Seung
    • 한국영어학회지:영어학
    • /
    • 제4권1호
    • /
    • pp.61-81
    • /
    • 2004
  • This paper will look at some grammatical phenomena which will illustrate some of the questions that can be addressed with a corpus-based approach. We will use this approach to investigate the following subjects in English grammar: number ambiguity, subject-verb concord, concord with measure expressions, and (reflexive) pronoun choice in coordinated noun phrases. We will emphasize the distinctive features of the corpus-based approach, particularly its strengths in investigating language use, as opposed to traditional descriptions or prescriptions of structure in English grammar. This paper will show that a corpus-based approach has made it possible to conduct new kinds of investigations into grammar in use and to expand the scope of earlier investigations. Native speakers rarely have accurate information about frequency of use. A large representative corpus (i.e., The British National Corpus) is one of the most reliable sources of frequency information. It is important to base an analysis of language on real data rather than intuition. Any description of grammar is more complete and accurate if it is based on a body of real data.

  • PDF