• 제목/요약/키워드: word-form

검색결과 381건 처리시간 0.022초

어말 위치 /ㅗ/의 /ㅜ/ 대체 현상에 대한 문법 항목별 출현빈도 연구 (Frequency of grammar items for Korean substitution of /u/ for /o/ in the word-final position)

  • 윤은경
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.33-42
    • /
    • 2020
  • 본 논문은 구어 말뭉치를 기반으로 한국어 /ㅗ/가 /ㅜ/로 고모음화되는 현상(예, '별로' [별루])에 대해 문법 항목별로 차이를 살펴보는 데 연구 목적이 있다. 한국어의 /ㅗ/와 /ㅜ/는 [+원순성] 자질을 공유하지만, 혀 높이 차이로 변별된다. 그러나 최근 /ㅗ/와 /ㅜ/의 두 모음의 음성적 구분이 모호해지는 병합 현상이 진행 중이라고 여러 논문에서 보고되었다. 본 연구에서는 어말 위치의 /ㅗ/가 한국어 자연언어 구어 말뭉치(The Korean Corpus of Spontaneous Speech)에서 음성적으로 [o] 또는 [u]로 실현되는 현상을 연결어미, 조사, 부사, 체언의 문법 항목별로 출현빈도 및 출현비율에 대해 살펴보았다. 실험 결과 연결어미, 조사, 부사에서 /ㅗ/는 약 50%의 비율로 /ㅜ/로 대체되는 것을 확인했고, 체언에서만 상당히 낮은 비율인 5% 미만으로 대체가 되는 것을 알 수 있었다. 고빈도 형태소 중에서 가장 높은 /ㅜ/ 대체율을 보인 형태소는 '-도 [두]' (59.6%)였고, 연결어미에서는 '-고 [구]' (43.5%)로 나타났다. 구어 말뭉치를 통하여 실제 발음형과 표준발음의 차이를 살펴보았다는 데 연구 의의가 있다.

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

한글 편집거리 알고리즘을 이용한 한국어 철자오류 교정방법 (A Method for Spelling Error Correction in Korean Using a Hangul Edit Distance Algorithm)

  • 박승현;이은지;김판구
    • 스마트미디어저널
    • /
    • 제6권1호
    • /
    • pp.16-21
    • /
    • 2017
  • 컴퓨터가 상용화되면서 일반인들은 문서를 작성하기 위해 컴퓨터를 이용하는 방법을 자주 사용하게 되었다. 컴퓨터를 이용하여 문서를 작성하는 방법은 작성 속도가 빠르고 손의 피로가 적지만 철자오류가 발생할 확률이 매우 높다. 보통 철자오류는 발견하기 쉽기 때문에 곧바로 수정이 가능하지만, 사용자의 지식 부족 혹은 눈에 잘 띄지 않는 철자오류도 존재하기 때문에 철자오류가 존재하지 않는 문서를 작성하기 어렵다. 온라인상에서는 문서 작성에 대한 규칙 및 예절이 미비하기 때문에 철자오류에 의한 문제가 적지만 중요문서에서 발생하는 철자오류는 신뢰도 하락과 같은 큰 문제를 일으킨다. 철자오류 교정은 전문가 또한 완벽하게 수행하기 힘들기 때문에 비전문가인 일반인들을 위한 교정방법연구가 필요하다. 본 논문에서는 한글 편집거리 알고리즘을 이용해 철자오류를 교정하는 연구를 진행한다. 이전 연구를 통해 검출한 철자오류를 수집한 말뭉치 사전에서 등장하는 단어 중 철자오류 단어와 가장 유사한 단어를 발견하여 주위 단어와의 동시등장빈도를 계산하는 것으로 철자오류 교정을 수행하게 된다.

텍스트 마이닝 기법을 활용한 ECDIS 사고보고서 분석 (Text Mining Analysis Technique on ECDIS Accident Report)

  • 이정석;이보경;조익순
    • 해양환경안전학회지
    • /
    • 제25권4호
    • /
    • pp.405-412
    • /
    • 2019
  • SOLAS에서는 국제 항해에 종사하는 총톤수 500톤 이상의 선박에 대하여 2018년 7월 1일 이후 도래하는 최초 검사까지 ECDIS를 설치해야 한다고 규정하고 있다. 새로운 주요 항해 장비로 ECDIS가 탑재되면서 ECDIS 사용에 관련한 다양한 사고가 발생하고 있다. MAIB, BSU, BEAmer, DMAIB, DSB에서 발행한 12가지의 사고보고서에는 항해사의 운용 미숙과 ECDS 시스템의 사고 원인으로 분석하였고, 사고 원인과 관련된 단어들을 정량적으로 분석하기 위해 R-프로그램을 사용하여 텍스트를 분석하였다. 도출 빈도에 따른 단어의 중요도를 나타내기 위해 텍스트 마이닝 기법인 단어 구름, 단어 연관성, 단어 가중치의 방법을 사용하였다. 단어 구름은 사용된 단어들의 빈도수를 구름 형태로 나타내는 방법으로써 N-gram 모델을 적용하였다. N-gram 모델 중 Uni-gram 분석 결과 ECDIS 단어, Bi-gram 분석 결과는 Safety Contour 단어의 사용 빈도가 가장 많았다. Bi-gram 분석을 기반으로 사고 원인 단어를 항해사와 ECDIS 시스템으로 구분하고, 연관된 단어들을 단어 연관성으로 나타내었다. 마지막으로 항해사와 ECDIS 시스템에 연관된 단어들을 단어 말뭉치로 구성한 후 단어 가중치를 적용하여 연도별 말뭉치 빈도 변화를 분석하였다. 추세선 그래프로 말뭉치 변화 경향을 분석한 결과, 항해사 말뭉치는 최근으로 올수록 감소하였으며 반대로 ECDIS 시스템 말뭉치는 점점 증가함을 나타내었다.

『황제내경영추(黃帝內經靈樞)』에서 사용된 '심(心)'자(字)의 용례 분석 (The Analysis of Usage of the '心' letter in 『HwangJeNaeGyeogYoungChu』)

  • 박재용
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.774-787
    • /
    • 2021
  • 본 연구는 『황제내경소문(黃帝內經素問)』(이하『소문(素問)』)에서 사용된 '심(心)'자(字)의 후속 연구이다. 『황제내경영추(黃帝內經靈樞)』(이하 『영추(靈樞)』)는 동양의학 뿐만 아니라 명상, 기공 수련, 요가, 수행과 관련된 기초 이론을 담고 있는 책으로 문헌 연구를 중심으로 『영추(靈樞)』에서 사용된 '심(心)'자(字)의 용례를 분석하였다. '심(心)'자(字)는 내면의 세계를 탐구하는 명상(冥想), 기공(氣功), 수행(修行)과 관련해서 핵심이 되는 어휘이다. '심(心)'자(字)는 동일한 형태로 유형의 심장과 무형의 마음을 의미하기 때문에 문맥을 통해서만 그 의미의 구별이 가능한 단어이다. 따라서, 『영추(靈樞)』의 내용을 이해하기 위해서는 '심(心)'자(字)의 의미 파악이 선행돼야 할 것이다. 본 연구는 사부총간본(四部叢刊本)의 『영추(靈樞)』를 저본으로 사용하였으며, 분석 결과에 의하면 '심(心)'자(字)는 9가지 의미로 분류된다. 첫째, '심(心)'자(字)는 인간의 장부인 심장을 의미한다. 둘째, '심(心)'자(字)는 신체의 흉부를 한다. 셋째, '심(心)'자(字)는 감정을 의미한다. 넷째, '심(心)'자(字)는 '심포(心包)'를 의미한다. 다섯째, '심(心)'자(字)는 중심을 의미한다. 여섯째, '심(心)'자(字)는 이성적 사고를 의미한다. 일곱째, '심(心)'자(字)는 깨달음과 같은 초월적 개념을 의미한다. 여덟째, '심(心)'자(字)는 별자리를 의미한다. 아홉째, '심(心)'자(字)는 내부를 의미한다. 본 연구는 결과는 다양한 분야의 내용을 담고 있는 『영추(靈樞)』의 내용을 파악하는데 기초 자료로 활용될 수 있으나, 연구자의 관점에 따라 '심(心)'자(字)의 용례 분석이 달라지는 한계성을 지니고 있다.

한·중 인물지칭 신어 조어방식에 관한 고찰 - 2017년과 2018년을 중심으로 - (A review on the method of coined words by Korean and Chinese characters)

  • 왕연
    • 융합정보논문지
    • /
    • 제12권3호
    • /
    • pp.178-185
    • /
    • 2022
  • 본 연구는 2017년과 2018년 한·중 인물지칭 신어 197개를 조어방식에 따라 단일어, 합성어, 파생어, 축약어, 혼성어로 나누어 신어의 특성을 비교·분석했다. 인물지칭 신어 중 단일어의 경우 한국어는 영어와 중국어에서 차용된 단어들이었으며, 중국어에서는 단일어가 나타나지 않았다. 다음으로 합성어의 경우 중국어 합성법의 형식이 훨씬 다양하고 생성력이 한국보다 더 강하다는 특징이 있었다. 파생어의 경우 양국 접두파생어는 모두 많지 않다는 특징을 보였다. 한국어 접미파생어 중에서는 외래어나 고유어 접미사에 비해 한자어 접미사의 생산력이 강했다. 외래어 접미사는 한국어에서 중국어에 비해 보다 빈번하게 나타났다. 다음으로 축약어의 경우 한국어에 나타난 축약어 신어는 어두 음절의 생산력이 더 강한 반면 중국어의 축약어 신어에서는 비어두 음절어의 생산력이 더 강하다는 것을 알 수 있었다. 끝으로 혼성어의 경우 한국어의 혼성 형식이 중국어보다 훨씬 다양하게 나타났다. 본 연구는 중국인 한국어 학습자가 한국어 신어의 형성과정을 이해하는 데에 도움을 줄 수 있으며, 나아가 그들이 한국어 학습 과정에서 한국어 단어의 의미를 추측하는 능력을 함양하는 데에 이론적 단서를 제공한다는 점에서 의미가 있다.

해조류 양식업 규모의 효율성 추정에 관한 연구 - 부산 기장지역 미역양식을 중심으로 - (A Study on Efficiency Estimation of Aquaculture : the Case of the Korean Seaweed Farms)

  • 서주남;송정헌
    • 수산경영론집
    • /
    • 제40권1호
    • /
    • pp.1-26
    • /
    • 2009
  • The aquaculture management considers the maintenance of households lifehood more than profit maximization. As aquaculture industry has developed enterprise farms appeared, and the small and the large scale farms coexist. The features of coexistence could be summarized as followings. First of all, the large scale farms show the higher net profit while the small scale farms show the higher profit per 1ha and the earning rate. Secondly, in the case of over 2ha, the earning rate is stable in spite of the scale expansion. Moreover, in processing method, dried seaweed occupy the biggest proportion in the small scale farms while the raw seaweed occupy the biggest proportion in the large scale farms. Lastly, the scale of farms becomes larger, the participation rate of household labor rises. This thesis analyses the efficiency of Korean seaweed farms in the way of DEA model and suggests the improvements for the efficiency management. The mean technical, pure technical and scale efficiencies were measured to be 0.88, 0.96 and 0.91, respectively. Among the 20 farms included in the analysis, 10 were technically efficient and 12 were scale efficient. In conclusion, it is shown that the aquaculture farms has been becoming the form of coexistence. This appearance results in the effort for reducing the cost in the small scale farms and in profit maximization in the large scale farms. On the other hand, middle scale farms is inefficient compared with the small or large scale farms. Therefore, in order to achieve the efficiency, it is necessary to accomplish economy of scale by extending farm size or to cut expenses by reducing farm area. In other word, the efforts for achieving the efficiency is required in a different direction in spite of the same scale.

  • PDF

웹문서를 이용한 단계별 한국어 미등록어 인식 모델 (Phase-based Model Using Web Documents for Korean Unknown Word Recognition)

  • 박소영
    • 한국정보통신학회논문지
    • /
    • 제13권9호
    • /
    • pp.1898-1904
    • /
    • 2009
  • 신문이나 블로그와 같은 실제 문서에서는 위키백과(Wikipedia)와 같은 기존에 없던 새로운 단어를 포함하고 있다. 그러나, 대부분의 정보 처리 기술은 시스템 개발 당시 확보한 자료를 바탕으로 사전을 구축하므로, 이러한 새로운 단어에 대해 신속하게 대처할 수 없다는 한계가 있다. 따라서 본 논문에서는 사전에 등록되어 있지 않은 한국어 미등록어를 자동으로 인식하는 모델을 제안한다. 제안하는 모델은 전문분석 기반 미등록명사 인식 단계, 웹 출현빈도 기반 미등록용언 인식 단계, 웹 출현빈도 기반 미등록명사 인식 단계로 구성된다. 제안하는 모델은 문서에서 여러 번 나타난 미등록어에 대해 전문분석을 통해 정확하게 인식할 수 있다. 그리고, 제안하는 모델은 문서에 한번 나타난 미등록어에 대해서도 웹문서를 바탕으로 광범위하게 인식할 수 있다. 또한, 제안하는 모델은 기본형이 어절에 그대로 나타나는 미등록명사뿐만 아니라 기본형이 변형하여 나타날 수 있는 미등록용언도 인식할 수 있다. 실험 결과 기존 미등록어 인식방법에 비해 제안하는 접근방법은 정확률 1.01%와 재현을 8.50%를 개선하였다.

어휘를 통한 패션 디자인 발상 전개 과정의 특성 연구 (Study on Characteristics of the Development Process of Fashion Design Thinking through the Lexicon)

  • 김윤경
    • 복식
    • /
    • 제64권2호
    • /
    • pp.113-125
    • /
    • 2014
  • Creative thinking requires an ability to draw ideas on the given topic in a given time period with concentration. For this, the development process of design concept on the topic was collected through experiments and interviews targeting 10 fashion education experts and 10 clothing majors. After the analysis, the results are as follows: First of all, divergent thinking was done to find as many ideas and possibilities as possible at the step of expanding the topic by analogy. This showed characteristics of spreading thoughts through the spread of lexicon to professional field knowledge of learned, individual's cultural background, other art fields. Second, abstracted and designed words that are expanded and listed by the topic analogy were specified the topic gradually through the free combination method between lexicons. The sentences made by the combination of lexicons were interpreted through the serial listing method, in which the connection between sentences had the meaning of orderly cause and effect form, and the parallel listing method that treated information at once. Third, the few characteristics of the procedure that visualizing into the specific design are as follows. Firstly, the method to transform image that lexicon has into the one appropriate to the topic, the case that reflects external characteristics of selected designed word, and the case which reflects as the extrinsic expression of personal immanent and tactic desires. This study has its means to propose methods and directions to help create more creative and systematic ideas by analyzing the characteristics that appeared during the process of thinking language-oriented design.

Stress and language recovery in individuals with aphasia: constraint induced aphasia therapy

  • Sharp, Brian;Shaughnessy, Paige;Berk, Lee;Daher, Noha
    • Physical Therapy Rehabilitation Science
    • /
    • 제2권2호
    • /
    • pp.92-98
    • /
    • 2013
  • Objective: Constraint induced aphasia therapy (CIAT) is a more intensive form of language treatment for aphasia as compared to traditional treatments. This study examined whether there are differences in cortisol stress levels between the two methods of aphasia treatment as well as effects on language skills. Design: Randomized controlled trial. Methods: A total of 20 participants with expressive aphasia were randomly placed into one of the two treatment groups. The CIAT group received 10 days of intensive treatment over two weeks. The traditional therapy group received 6 days of treatment over 2 weeks. All participants in each group provided salivary cortisol samples before treatment, at the mid-point of treatment, and at the conclusion of treatment. Language skills were assessed before treatment and at the conclusion of treatment. Results: A significantly higher proportion of individuals in the CIAT treatment group had increased salivary cortisol stress levels when compared to the traditional treatment group at the mid-point of the program (80% versus 30% respectively, p<0.05). There was no significant difference in the proportion of individuals with increased cortisol stress by the end of the treatment. Language scores for word repetition and overall aphasia quotient significantly improved for the CIAT group when compared to the traditional group (p<0.05). Conclusions: The CIAT treatment appears to initially create increased psychophysiological stress as compared to the traditional treatment. In spite of the initial increases in psychophysiological stress, participants appear to become conditioned to the challenge and ultimately have enhanced benefit from CIAT treatment.