• 제목/요약/키워드: 어휘정보

검색결과 1,062건 처리시간 0.021초

언간에 나타나는 어기활용형에 대한 고찰 (On the base inflectional forms of Korean old vernacular letters)

  • 이현주
    • 동양고전연구
    • /
    • 제56호
    • /
    • pp.297-329
    • /
    • 2014
  • 언간자료에는 '--'를 접사로 취하는 단어들 중에 어간의 일부가 된 '--'와 그에 뒤따르는 어미들이 생략되어 나타나는 경우가 빈번하게 나타난다. 이를 어기활용형이라 칭하고 언간에 나타나는 어기활용형의 기능 및 형대론적, 통사론적 제약을 살펴보았다. 제한된 시간 속에서 운필의 노력과 시간을 절약하기 위해 언간에서 독특하게 발달한 형식이 어기활용형이다. '-'구성에서 필수적인 내용은 'X'가 모두 가지고 있고 '--'와 뒤따르는 어미는 형식적인 기능만을 담당하기 때문에 어기 'X'만 남기고 후행성분은 과감히 생략하게 된 것이다. 어기활용형이 언어수행 상 나타나는 수의적인 언어현상이긴 하지만, 모든 조건에서 일어날 수 있는 것은 아니다. 가장 기본적인 문법적 기능만을 가지는 '-, -, -, -, -'가 쉽게 생략될 수 있음을 알 수 있었다. 그리고 언간자료에서 어기활용형을 구성하는 어기는 [+동작성]이든 [-동작성]이든 모두 서술성을 갖는다는 공통점이 있다. 이 시기의 파생접사 '--'는 어휘적 의미는 전혀 갖지 못하고 형식적 기능만을 갖고 있다. 이러한 이유로 '서술성어기+--'구성은 언어수행 면에서 어떤 조건만 주어지면 파생접사 '--'가 쉽게 생략될 수 있었다.

초등학교 교사의 그림책 접근점 요구에 관한 연구 (A Study on Elementary School Teachers' Needs for Access Points for Picture Books)

  • 김혜미;김수정
    • 한국비블리아학회지
    • /
    • 제33권1호
    • /
    • pp.233-258
    • /
    • 2022
  • 본 연구의 목적은 교수매체로써 그림책을 탐색하고자 하는 초등학교 교사들의 접근점에 대한 요구를 파악하고 학교도서관 DLS(Digital Library System)의 접근점 개선방안을 제안하는 것이다. 이를 위해 먼저 국내외 7개 도서관 온라인목록시스템에서 제공하는 접근점을 조사하였다. 그리고 초등학교 교사들을 대상으로 온라인 설문조사를 실시하여 최종적으로 220개의 응답을 분석하였다. 분석 결과, 교사들이 가장 필요로 하는 그림책의 접근점은 주제, 학년/연령, 내용, 교과/단원, 범교과학습주제 등으로 나타났다. 이러한 결과를 바탕으로 본 연구는 필요성이 높게 나타난 접근점을 DLS의 목록레코드에서 제공하고, 통제어휘집을 개발하고, 시스템의 기능이나 인터페이스를 개선하여 그림책에 대한 접근성을 향상시키는 방안을 제안하였다.

반복적 기법을 사용한 그래프 기반 단어 모호성 해소 (Graph-Based Word Sense Disambiguation Using Iterative Approach)

  • 강상우
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권2호
    • /
    • pp.102-110
    • /
    • 2017
  • 최근 자연어 처리 분야에서 단어의 모호성을 해소하기 위해서 다양한 기계 학습 방법이 적용되고 있다. 지도 학습에 사용되는 데이터는 정답을 부착하기 위해 많은 비용과 시간이 필요하므로 최근 연구들은 비지도 학습의 성능을 높이기 위한 노력을 지속적으로 시도하고 있다. 단어 모호성 해소(word sense disambiguation)를 위한 비지도 학습연구는 지식 기반(knowledge base)를 이용한 방법들이 주목받고 있다. 이 방법은 학습 데이터 없이 지식 기반의 정보을 이용하여 문장 내에서 모호성을 가지는 단어의 의미를 결정한다. 지식 기반을 이용한 방법에는 그래프 기반방식과 유사도 기반 방법이 대표적이다. 그래프 기반 방법은 모호성을 가지는 단어와 그 단어가 가지는 다양한 의미들의 집합 간의 모든 경로에 대한 의미 그래프를 구축한다는 장점이 있지만 불필요한 의미 경로가 추가되어 오류를 증가시킨다는 단점이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 그래프 구축을 위해 불필요한 간선들을 배제하면서 반복적으로 그래프를 재구축하는 모델을 제안한다. 또한, 구축된 의미 그래프에서 더욱 정확한 의미를 예측하기 위해 하이브리드 유사도 예측 모델을 적용한다. 또한 제안된 모델은 다국어 어휘 의미망 사전인 BabelNet을 사용하기 때문에 특정 언어뿐만 아니라 다양한 언어에도 적용 가능하다.

2024 DLS 목록입력규칙을 위한 지침 개발 시 고려사항에 관한 연구 (A Study on the Considerations for Developing the Guidelines for 2024 DLS Cataloging Rules)

  • 김예지;김지은;이미화
    • 한국비블리아학회지
    • /
    • 제35권1호
    • /
    • pp.5-26
    • /
    • 2024
  • 학교도서관업무지원시스템이 2024년 독서로 DLS로 새로 개발되었으나 DLS를 위한 목록규칙은 초창기 개발된 이후 크게 변경되지 않았으며, 현재 개발된 지침도 2020년에 작성된 것으로 새로운 개정이 필요한 상황이다. 이에 본 연구에서는 DLS의 목록입력규칙 적용을 위한 지침 개발 시 고려사항을 KCR4에 준하여 제안하고자 기존 DLS(Ver. 2.0) 목록입력규칙 및 2024 DLS 목록입력규칙, 2020년 서지등록가이드(Ver. 2.2)를 상호비교하였다. 이를 바탕으로 데이터요소 변경 및 확대, 내용규칙의 수정, 접근점 기록 방안, 통제어휘집 개발의 측면에서 고려사항을 제안하였다. 본 연구를 통해 앞으로 DLS 목록입력규칙의 개정, 지침의 개발, 시스템 개선 등에 활용할 수 있을 것이다.

대화문 재구조화를 통한 한국어 대화문 요약 (Summarization of Korean Dialogues through Dialogue Restructuring)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.77-85
    • /
    • 2023
  • COVID-19 이후 온라인을 통한 소통이 증가하여 다양한 플랫폼을 기반으로 소통을 위한 대화 텍스트 데이터가 대량으로 축적되고 있다. 텍스트 데이터로부터 유의미한 정보를 추출하기 위한 텍스트 요약에 대한 중요성이 더욱 증가함에 따라 딥러닝을 활용한 추상 요약 연구가 활발하게 이루어지고 있다. 그러나 대화 데이터는 뉴스 기사와 같은 정형화된 텍스트에 비해 누락 및 변형이 많아 대화 상황을 다양한 관점에서 고려해야 하는 특이성이 있다. 특히 어휘 생략과 동시에 내용과 관련 없는 표현 요소들이 대화의 내용을 요약하는 데 방해가 된다. 그러므로 본 연구에서는 한국어 대화 데이터의 특성을 고려하여 발화문을 재구조화하고 KoBART 기반의 사전학습된 텍스트 요약 모델을 파인 튜닝후, 요약문에서 중복 요소를 제거하는 정제 작업을 통해 대화 데이터 요약 성능을 향상시키고자 한다. 발화문을 재구조화하는 방법으로는 발화 순서에 따라 재구조화는 방법과 중심 발화자를 기준으로 재구조화하는 방법을 결합하였다. 대화문 재구조화 방법을 적용한 결과, Rouge-1 점수가 4 정도 향상되었다. 본 연구의 대화 특성을 고려한 재구조화 방법이 한국어 대화 요약 성능 향상에 유의미함을 입증하였다.

클래스 종속 반연속 HMM을 이용한 립싱크 시스템 최적화 (Lip-Synch System Optimization Using Class Dependent SCHMM)

  • 이성희;박준호;고한석
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.312-318
    • /
    • 2006
  • 기존의 립싱크 시스템은 음소 분할 후, 각각의 음소를 인식하는 2단계의 과정을 거쳤다. 하지만, 정확한 음소 분할의 부재와 음성이 끊긴 분할 된 음소로 이루어진 훈련 데이터들은 시스템의 전체 성능을 크게 떨어뜨렸다. 이런 문제를 해결하기 위해 Head-Body-Tail (HBT) 모델을 이용한 단모음 연속어 인식 기술을 제안한다. 주로 소규모 어휘를 다루는데 적합한 HBT 모델은 Head 와 Tail 부분에 문맥 종속 정보를 포함하여 앞 뒤 문맥에 따른 조음효과를 최대한 반영한다. 또한, 7개의 단모음을 입모양이 비슷한 세 개의 클래스로 분류하여, 클래스에 종속적인 코드북 3개를 가진 반연속HMM (Hidden Markov Model)을 적용하여 시스템을 최적화하고, 변이 부분이 큰 단어의 처음과 끝은 연속HMM의 8 믹스쳐 가우시안 구조를 사용하여 모델링하였다. 제안한 방법은 HBT구조의 연속HW과 대등한 성능을 보이지만, 파라미터 수는 33.92% 감소하였다. 파라미터 감소는 계산 양을 줄여주므로, 시스템이 실시간으로 동작 가능하게 한다.

고내후성 활엽수종의 추출성분을 이용한 신기능성 물질의 분리 및 생리활성 (Bioactivities and Isolation of Functional Compounds from Decay-Resistant Hardwood Species)

  • 배영수;이상용;오덕환;최돈하;김영균
    • 임산에너지
    • /
    • 제19권2호
    • /
    • pp.93-101
    • /
    • 2000
  • 아까시나무의 목질부와 현사시나무, 물푸레나무 및 느릅나무의 수피를 채취하여 아세톤-물 혼합용액(7:3, v/v) 으로 추출한 후 hexane, chloroform, ethylacetate 및 수용성으로 분획하고 동결건조하여 분말로 조제한 후 메탄올-물 등의 용리용매로 Sephadex LH-20 칼럼에서 크로마토그래피를 수행하였다. 물푸레나무에서는 aesculitin 및 그 파생물인 fraxetin 등 다량의 쿠마린 화합물과 에스테르화합물을 단리하였으며, 느릅나무로부터 C-7에 xylopyranose와 apiofuranose와 같은 5탄당이 결합된(+)-catechin 배당체 화합물과 procyanidn B-3를 단리하였다. 아까시나무에서는 leucorobinetinidin의 C-4에 ethoxyl 기가 결합된 flavan 유도체 화합물과 robinetin 등의 flavanonol 화합물을 단리하였다. 현사시나무에서는 taxifolin 등의 후라보노이드 화합물과 배당체인 sakuranetin-5-O-glucopyranoside를 단리하였으며 살리신 유도체인 salireposide 등을 단리하였다. 내후성 시험에서는 목재블록에 부후균을 접종하여 배양한 후 중량감소를 측정하는 방법과 목분-agar 배지에 부후균을 접종한 후 균사의 생장 직경을 측정하는 방법을 적용하였다. 아까시나무가 다른 시룓르보다 우수한 활성을 나타내었으며 특히 메탄올 추출머리를 하지 않은 시료가 처리한 시료보다 좋은 균사생장 저해효과를 나타냈다. 항산화 활성 시험에서는 물푸레나무의 에틸아세테이트 분획이 가장 높은 활성을 보였으며, 아까시나무의 에틸아세테이트 분획도 비교적 높은 효과를 나타내었고, 이 두 분획으로부터 단리된 주요 단리화합물에 대해서는 물푸레나무의 aesculetin이 가장 높았으며 아까시나무의 robinetinidin도 비교적 좋은 효과를 나타냈다.)나 틈새시장(niche market) 마케팅 등에 적용 가능하리라 여겨진다.된다.다.산물로 판단되었다.징하며 WLWQ에 적용되는 몇 가지 제약을 관찰하고 이를 일반적인 언어원리로 설명한다. 첫째, XP는 주어로만 해석되는데 그 이유는 XP가 목적어 혹은 부가어 등 다른 기능을 할 경우 생략 부위가 생략의 복원 가능선 원리 (the deletion-up-to recoverability principle)를 위배하기 때문이다. 둘째, WLWQ가 내용 의문문으로만 해석되는데 그 이유는 양의 공리(the maxim of quantity: Grice 1975) 때문이다. 평서문으로 해석될 경우 WP에 들어갈 부분이 XP의 자질의 부분집합에 불과하므로 명제가 아무런 정보제공을 하지 못한다. 반면 의문문 자체는 정보제공을 추구하지 않으므로 앞에서 언급한 양의 공리로부터 자유롭다. 셋째, WLWQ의 XP는 주제어 표지 ‘는/-은’을 취하나 주어표지 ‘가/-이’는 취하지 못한다(XP-는/-은 vs. XP-가/-이). 이는 IP내부 에 비공범주의 존재 여부에 따라 C의 음운형태(PF)가 시성이 정해진다는 가설로 설명하고자 했다. WLWQ에 대한 우리의 논의가 옳다면, 본 논문은 다음과 같은 이론적 함의를 기닌다. 첫째, WLWQ의 존재는 생략에 대한 두 이론 즉 LF 복사 이론과 PF 삭제 이론 중 전자의 입장을 지지한다. 둘째, WP를 XP로부터 복원할 때 부분 자질만 복사된다. 이는 어휘가 통사층위로 들어온 이후에도 어휘 자질들이 완전히 동결되는 것이 아니라 계속 지시될 수 있다는 가설을 지지한다.ance and stress, and high threshold voltage. Besides, sheet resistance and stress value, rms(root mean square) by AFM were observed. On the electrical

  • PDF

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

논문 원문을 이용한 동명 저자 자동 군집화 (Automatic Clustering of Same-Name Authors Using Full-text of Articles)

  • 강인수;정한민;이승우;김평;구희관;이미경;구남앙;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.652-656
    • /
    • 2006
  • 대용량 과학 기술 문헌의 탐색 및 검색에 있어서 저자, 저자 소속 기관, 게재지 등에 대해 고유 식별자에 기반한 표현의 필요성이 증가하고 있다. 특히, 과학 기술 문헌의 저자가 단순히 이름으로 표현될 경우, 동일명을 가진 서로 다른 저자들에 대한 구분은 사용자의 검색 부담을 가중시키게 된다. 이러한 동명이인의 문제를 해결하기 위한 기존의 접근법들은 공저자 정보, 논문 제목 등의 서지 정보에 의존하는 공통점을 지닌다. 그러나, 기존의 방법들은 공저자가 없거나 논문 제목 간의 공통 어휘가 발견되지 않을 경우 어려움을 겪게 된다. 본 연구에서는, 동명저자 문제 해소를 위한 기존의 접근법을 보완하기 위해, 동명저자들의 논문 원문의 내용에 기반한 문서 군집화 방법을 사용한다. 국내 학술대회 발표 논문집을 대상으로 한 실험에서 제안한 방법이 기존의 서지정보에 기반한 해법의 단점을 보완할 수 있다는 가능성을 보였다.

  • PDF

한글 전용과 국한 혼용의 언어 심리학적 고찰(I): 읽기 시간, 이해, 기억에서의 차이 (Differences of Reading the Pure Hangul Text and the Hangul Plus Hanja Text in Reading Speed, Comprehension, and Memory)

  • 남기춘;김태훈;이경인;박영찬;서광준;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.469-476
    • /
    • 1997
  • 본 연구는 한글 전용과 한자 혼용이 글의 이해 속도, 이해 정도, 내용의 기억에 어떤 영향을 미치는 가를 조사하기 위해 실시되었다. 한글 전용론과 한자 혼용론은 각각 나름대로의 논리를 가지고 서로 논쟁을 펼쳐왔다. 먼저 한글전용론의 주장을 살펴보면, 한자는 배우기 어렵고 쓰기도 불편해 쉽게 익힐 수 있는 한글을 사용해야 하며, 한자를 사용함으로 인해서 순 우리말의 발전이 방해를 받고, 글자 생활의 기계화와 출판 문화의 발달에 있어 한자는 이것을 어렵게 한다는 것이다. 반면에, 한자혼용론의 주장에 따르면, 한자말은 한자로 적을 때 그 의미의 파악이 빠르고 정확하고, 우리말 어휘의 절반 이상을 한자어가 차지하고 있으므로 한자를 가르치는 것이 국어교육의 지름길이고, 우리말에는 동음이의어가 많아서 한글로만 적을 경우 그 뜻을 식별하기 어렵고, 한자는 각 글자가 모두 뜻을 가지고 있으므로, 각각을 조합하여 새로운 의미의 단어를 쉽게 만들 수 있음은 물론이고 한글로 쓸 경우 길게 쓰여져야만 하는 것을 짧게 쓸 수 있다는 장점을 가지고 있으며, 한자를 쓰지 않으면 우리의 전통 문화를 이어 받을 수 없으며 한자를 공통으로 쓰고 있는 동양문화권에서도 고립을 초래할 수 있다는 것이다. 이렇게 한글전용과 한자혼용에 대한 의견이 다양한 만큼 우리나라의 한자에 대한 정책도 그 갈피를 잡지 못하고 계속 바뀌어 왔다. 독립이후 정부에서는 법령과 훈령 등으로 모든 공문서에서의 한자사용을 금지하고 일반 사회의 문자 생활에도 한글을 전용할 것을 권고하지만 이 지침은 결국 공문서에만 한정되어 왔고 후에는 이것조차도 유명무실해졌다. 또한 중고등학교의 한자교육 정책도 수차례 변화되어 한글만을 배운 세대가 사회에 나와 여전히 한자가 사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.

  • PDF