• 제목/요약/키워드: 어휘유형

검색결과 170건 처리시간 0.048초

구문분석 말뭉치를 이용한 문법 관계의 선호 체언 어휘와 의미 유형 연구 (A Treebank-Based Approach to Preferred Nominal Words in Grammatical Relations and their Semantic Types)

  • 홍정하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-41
    • /
    • 2008
  • 이 논문은 각 문법 관계(grammatical relation)에서 선호되는 체언 어휘를 파악하고, 이 어휘들의 의미적 유형 및 그 위계를 파악하는 것이 목적이다. 이를 위해 80만 어절의 21세기 세종계획 구문분석 말뭉치에서 그 분포를 추출하고, 통계적 검증을 통해 각 문법 관계에서 선호되는 체언 어휘를 선별한다. 이 연구에서 관찰하는 문법 관계는 주어, 목적어, 용언수식어로 하며, 이들 문법 관계에서 선호되는 어휘 추출 대상 품사는 대명사, 고유명사, 일반명사로 한다. 한정성의 강도에 따라 주어 분포 경향이 나타나며, 이에 따라 대명사 > 고유명사 > 일반명사 순으로 주어 분포 경향이 나타난다. 그러나 일반적 예측과 다르게 한정성의 강도가 더 강한 것으로 알려진 대명사가 고유명사보다 목적어와 용언수식어에서 분포 경향이 더 강하여, 일반명사 > 대명사 > 고유명사의 순으로 분포 경향이 나타난다. 대명사, 고유명사, 일반명사는 공통적으로 주어에서는 사람 지시어, 목적어에서는 사물과 장소 지시어, 그리고 용언수식어에서는 시공간 표현이 선호되어 분포한다. 특히 대명사는 각 문법기능에서 인칭대명사의 경우 인칭에 따라, 그리고 지시대명사의 경우 원근칭에 따라 선호도의 차이를 보인다. 이러한 체언 어휘의 의미적 분포 특성은 문법 관계에 통사적 기능 외에도 의미적 경향이 반영된 것으로 고려될 수 있다.

  • PDF

교과서 분석 기반 수학교육용 어휘 선정 연구: 초등학교 1~2학년을 중심으로 (Textbooks Analysis to Select Vocabulary for Mathematics Education: Focusing on 1st and 2nd Graders in the Elementary School)

  • 권미선
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권4호
    • /
    • pp.675-695
    • /
    • 2023
  • 어휘에 대한 이해는 효과적인 수학 학습을 위한 필수적인 요소이다. 이에 수학을 학습할 때 자주 사용되는 어휘를 수학교육용 어휘로 선정하고자 2009 개정 1~2학년 수학 교과서와 2015 개정 1~2학년 수학 교과서에서 공통적으로 사용된 고빈도 어휘를 추출하고 어휘 난이도와 유형에 따라 분류하였다. 이때 학교 현장에서 효과적으로 사용하기 위하여 학년 공통 어휘와 학기별 집중 어휘로 구분하여 제시하였다. 분석 결과, 1학년 공통 어휘는 수, 몇, 알아보다, 읽다, 모양, 쓰다, 만들다, 말하다, 나타내다, 덧셈, 뺄셈 등이 있으며, 2학년 공통 어휘는 수, 알아보다, 몇, 모형, 나타내다, 길이, 방법, 만들다, 모양, 모두 등이 있다. 2009 개정 수학 교과서와 2015 개정 수학 교과서의 고빈도 어휘는 유사한 경향을 보였으며, 이를 통해 수학교육용 어휘 선정에 실효성을 엿볼 수 있었다. 선정된 어휘는 1~5등급까지 난이도가 다양하였으며, 어휘 유형 중 사고도구어의 비중은 점차 증가하였으나 수학 전문어의 비중은 2학년 1학기 때 가장 높은 것으로 나타났다. 어휘에 대한 이해는 수학 학습에 많은 영향을 미치나 지금까지 수학교육용 어휘 목록은 제시된 바가 없다. 이 연구에서 제시된 수학교육용 어휘를 바탕으로 수학교육을 위한 다양한 어휘 자료가 개발 될 수 있을 것이다.

수능 영어 문항 유형간 응집력과 어휘정보 분석 (An Analysis of Cohesion and Word Information among English CSAT Question Types)

  • 최민주;김정렬
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.378-385
    • /
    • 2017
  • 본 연구는 대학수학능력시험 영어영역 읽기지문의 문항 유형별 응집력과 어휘정보를 파악하기 위해 코퍼스 기반 분석을 실시하였다. 본 연구에서는 한국교육과정평가원에서 제시하는 여섯 가지의 문항유형을 세가지의 범주, 즉 맥락읽기, 세부읽기, 간접쓰기로 나누어 분석하였다. 이를 위해 처음 수능이 실시된 1994학년도부터 2017학년도까지의 수능 영어영역의 읽기지문의 코퍼스를 구축한 후, 코메트릭스 3.0을 활용하여 해당 코퍼스를 분석하여 각 문항들의 응집력과 어휘정보의 차이를 살펴보았다. 연구 결과 표층응집성 지표에서는 명사중복 측정치와 어간중복 측정치에서 통계적으로 유의미한 차이를 보였다. 연결사 지표에서는 역접의 연결사와 추가의 연결사에서 통계적으로 유의미한 차이를 보였다. 어휘정보 지표의 결과에서는 대명사의 발생정도, 습득나이 측정치, 내용어의 구체성 측정치, 심상성 측정치, 유의미성 측정치에서 통계적으로 유의미한 차이를 보였다. 이러한 문항유형간 응집력과 어휘정보 분석에 대한 정보는 교과서 집필 및 수능시험 출제에 활용될 수 있을 것이며, 학생들이 직접적으로 활용할 수 있는 읽기전략으로 활용 될 것으로 기대된다.

의미 정보를 이용한 한국어 복합명사 분석 (Analysis of Korean Compound Noun using Semantic Information)

  • 김수남;원상현;권혁철;주종철;이상기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.195-197
    • /
    • 1998
  • 복합명사 분석은 조합이 자유롭고 제한이 없으므로 여러 가지 모호성을 발생시킨다. 이러한 모호성을 해결하는 기존 방법으로 사전을 이용하는 방법[2]과 통계적 정보를 이용하는 방법[3,4]이 있다. 본 논문에서는 하위 범주화된 어휘 정보를 가진 전자사전을 이용하여 복합명사를 분석한다. 그리고 어휘 정보만으로 처리했을 때 의미상으로 잘못된 분석이 발생할 수 있으므로 본 논문은 복합명사를 구성하는 어휘의 정보와 특정단어의 의미에 따른 복합명사 제약조건을 규칙베이스로 구축하여 분석에 이용한다. 또한 분석에 실패한 복합명사의 유형을 분석하여 각 유형에 따른 교정 방법도 제시한다. 실험 데이터는 부산일보, 교과서, 그리고 각종 문서에서 무작위로 추출한 27,945개의 복합명사를 사용하였다. 본 논문에서 제시한 의미적 제약조건을 이용하여 분석했을 때 복합명사로 잘못 쓴 어절의 검사율이 21% 향상되었다.

  • PDF

구문 분석 결과를 이용한 한국어 무제한 정보추출 (A Syntax-Based Hybrid System for Korean Open Information Extraction)

  • 김병수;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-45
    • /
    • 2015
  • 무제한 정보추출은 주로 영어를 대상으로 연구가 진행 되었지만, 최근에는 영어가 아닌 다른 언어에 대한 적용이 시도되고 있다. 본 논문에서는 관계 어휘의 유형을 동사형과 명사형 2가지로 정의하고, 각 유형별로 구문 분석 결과 기반의 서로 다른 방법론을 적용하는 한국어 대상 무제한 정보추출 시스템을 소개한다. 동사형 관계 어휘에 대해서는 의존 관계 기반의 추출 규칙을 적용하고, 명사형 관계 어휘에 대해서는 대량의 말뭉치로부터 자동으로 학습한 의존 관계 구조 기반의 추출 패턴을 적용한다. 임의의 100개 문장에 대해서 수행한 결과는 산출된 전체 트리플에 대해 0.8이상의 정밀도를 보임으로써 본 논문에서 제안하는 방법의 효용성을 증명하였다.

  • PDF

감정동사 및 감정형용사 분류에 관한 연구 (Classification System for Emotional Verbs and Adjectives)

  • 장효진
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.29-34
    • /
    • 2001
  • 영상자료 및 소리자료의 색인과 검색을 위해서는 감정동사 및 감정형용사 등의 감정 어휘를 필요로 한다. 그러나 감정어휘는 그 뉘앙스가 미묘하여 분명한 분류체계가 없이는 체계적인 정리가 불가능하다. 이에 따라 본 연구에서는 국어학과 분류사전의 분류체계를 고찰하고 새로운 감정어휘의 분류방안을 연구하였으며, 감정에 따른 기쁨, 슬픔, 놀람, 공포, 혐오, 분노의 6가지 기본유형을 제시하였다.

  • PDF

제품 유형별 표출되는 감성어휘 비교 (Comparison of Emotional Words by Products)

  • 정상훈
    • 감성과학
    • /
    • 제12권2호
    • /
    • pp.215-224
    • /
    • 2009
  • 본 연구에서는 사용하는 제품의 유형에 따라 표출되는 감성어휘에 차이가 있는지 알아보기 위하여 휴대폰 및 웹을 사용하는 도중에 표출되는 사용자의 감성을 측정하기에 적합한 감성어휘들을 추출하여 비교해 보았다. 본 연구의 결과를 종합해 보면, 휴대폰과 같이 하드웨어적인 특성이 강하고 사용자가 어떤 특정한 목적을 가지고 사용하는 상황이 많은 제품에 대해서는 사용상황 및 태스크 수행에 직접적으로 관련된 '사용적 만족성'과 '유쾌성' 등에 관련된 감성어휘가 많이 추출되었고, 제품의 외관이나 다양한 시각정보에 의해 표출된 '심미성'과 참신하고 새로운 것에 의해 표출된 '신규성'에 관련된 감성어휘는 다수가 제외되었음을 발견할 수 있었다. 반면에 웹과 같이 소프트웨어적인 특성이 강하고 사용자들이 특정한 목적의 태스크를 수행해야 하는 상황보다는 뭔가 새로운 정보를 찾거나 보다 우수한 것을 찾기 위하여 사용하는 제품의 경우에는 '신규성'과 같이 직접적인 사용에 관련된 것보다는 시각적이고 새로운 정보에 관련된 감성어휘가 많이 추출됨을 알 수 있었다. 따라서 본 연구의 결과는 해당 제품의 특성과 사용목적에 적합한 감성어휘를 중심으로 제품의 유형에 따라 구분하여 각각의 제품에 적합한 주관적 평가스케일을 도출하는 것이 바람직하다는 것을 반증해 준다고 할 수 있다.

  • PDF

한국어·중국어 이중 언어 사용 아동의 어휘 다양성 (A Study on the Lexical Diversity of Korean-Chinese Bilingual Children)

  • 최지영
    • 한국어교육
    • /
    • 제28권4호
    • /
    • pp.245-271
    • /
    • 2017
  • This study aimed at investigating the lexical diversity in the "Frog Story" narratives of Korean-Chinese bilingual children. Six bilingual speakers of Korean children- four boys and two girls- were audio recorded as they produced narratives based on pictures from the Mercer Mayer book "Frog, where are you?" The order of narration was counterbalanced. The vocabularies from narratives were analyzed by type, token, TTR (type-token Ratio) and D value using the CLAN (Computerized Language Analysis) program. The findings showed that the pattern of lexical diversity in Korean is similar with the Chinese, but the TTR and D value of Chinese still remain low in comparison with those of Korean. In addition, Korean language seems to have significant influence on Chinese in the language usage pattern and vice versa.

외국어교육 상황에서 텍스트 유형별 읽기에 따른 어휘력향상 연구 (Vocabulary Improvement in EFL Writing through Narrative and Expository Texts)

  • 신규철
    • 한국융합학회논문지
    • /
    • 제11권1호
    • /
    • pp.201-209
    • /
    • 2020
  • 이 논문의 목적은 외국어 학습자가 대화체와 설명체 텍스트를 읽기를 하는 동안, 텍스트 유형이 쓰기에 있어서 어휘향상에 어떻게 영향을 주는 지를 밝히는데 있다. 실험집단은 3개의 그룹으로 나뉘어졌다. 첫번째 그룹은 대화체 텍스트를 읽었고, 두번째 그룹은 설명체 텍스트를 읽었다. 한편, 세번째 그룹은 대화체와 설명체 글을 번갈아 가며 읽었다. 학습과정이 끝난 후, 어휘 테스트를 통해 집단 간의 비교를 하였고, ETS 에세이 평가에 나타난 평가 결과를 토대로 어휘에 나타난 특징을 분석하여 비교 하였다. 실험 결과는, 학습자의 모르는 어휘에 대한 이해에 있어서, 설명체 텍스트가 대화체 텍스트보다 우수하다는 것을 증명하였다. 더욱이, 대화체와 설명체를 동시에 읽은 집단이 대화체만 읽은 집단이나 설명체만 읽은 집단보다 어휘 향상에 이어서 더 우수함을 보여 주었다. 한편, ETS 에세이 쓰기에 나타난 결과는 상대적으로 설명체 글의 학습자가 틀린 오류가 가장 많았다.

사회적 이슈 리스크 유형 분류를 위한 어휘 자질 선별 (Linguistic Features Discrimination for Social Issue Risk Classification)

  • 오효정;윤보현;김찬영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.541-548
    • /
    • 2016
  • 사용자의 다양한 의견을 수렴하고 모니터링하기 위한 정보원으로써 소셜미디어의 활용은 이미 필수가 되었다. 본 논문은 소셜미디어에 나타난 다양한 이슈 중 여론 형성에 악영향을 끼치는 부정적 사건을 이슈 '리스크'로 정의, 그 세부 유형을 자동으로 분류하는 모델을 개발하고자 한다. 이를 위해 소셜미디어에 나타난 다양한 어휘 자질을 선별, 그 효과를 규명하였다. 특히 리스크 문장의 어휘 구문 특징을 표현하기 위한 자질로 워드 임베딩 학습 결과를 활용한다. 개별 어휘 자질의 특징을 분석하기 위해 언어분석 오류를 보정한 환경에서 수행한 실험 결과, 가장 효과가 큰 자질은 개체명 자질로 분석되었으며, 기본 어휘 자질을 기반으로 주요 술부의 워드 임베딩 결과와 워드 클러스터 결과를 모두 조합한 경우가 최고 성능을 보이는 것으로 파악되었다. 실제 소셜빅데이터에 적용하는 환경과 유사하도록 자동 언어분석 결과의 오류를 포함한 조건에서 실험한 결과, 고빈도 평가셋에서는 92.08%의 성능을, 전체 58개 범주 평가셋에서는 85.84%의 성능을 얻었다.