• 제목/요약/키워드: 어휘 중의성

검색결과 98건 처리시간 0.024초

초등학교 예비교사들의 수학적 '문제 만들기'에 나타나는 문장의 오류 유형 분석 (Analysis on Sentence Error Types of Mathematical Problem Posing of Pre-Service Elementary Teachers)

  • 허난;신호철
    • 한국학교수학회논문집
    • /
    • 제16권4호
    • /
    • pp.797-820
    • /
    • 2013
  • 본 논문은 초등학교 예비교사 100명을 대상으로 수학적 '문제 만들기'의 문장에 나타나는 오류를 분석하고 그에 대한 간단한 예방책을 기술한 논의이다. '문제 만들기' 문장에는 '음운 오류, 단어 오류, 문장 오류, 의미 오류, 표기 오류' 등 5가지 오류 유형이 나타났다. 이를 다시 14개의 세부 유형으로 구분하여 세부적으로 논의하였다. 곧 음운 오류의 유형은 'ㄹ'첨가 오류와 조사끼리의 준말 사용 오류가 있다. 단어 오류는 크게 '부적절한 사용 오류'와 '부당한 생략 오류'로 구분하고 이를 다시 조사, 어미, 어휘의 사용 오류와 조사와 어휘의 부당한 생략 오류로 유형화하였다. 문장 오류는 '지시 대상의 오류, 문장 성분의 생략 오류, 어순 오류, 자체 비문'의 네 가지로 유형화하였다. 의미 오류는 논리적 모순 관계 오류와 중의성을 띄는 의미 오류에 대해서만 논의하였고, 표기 오류는 띄어쓰기와 문장 부호, 철자에 관한 한글 맞춤법 오류와 외래어 표기법 오류 등에 대하여 논의하였다. 또한 14개의 문법적 세부 오류 유형을 방지하기 위한 예방책을 제시하였다. 먼저 구어와 문어의 차이를 인식하고, 둘째 글을 쓰는 문어 상황에 맞도록 구어적 표현을 지양하도록 하는 것, 셋째 국어 기본 문형 학습에 대한 강조, 넷째 단어 의미의 명확한 이해를 바탕으로 한 의미의 논리적 전개 인식을 제안하였으며, 끝으로 국어 어문 규정에 대한 학습을 제안하였다. 그리고 대학생 글쓰기 교육에 대한 필요성에 대한 재인식을 결론으로 갈음하였다.

  • PDF

문자출력 무선호출기를 위한 음성인식 시스템 (Speech Recognition in the Pager System displaying Defined Sentences)

  • 박규붕;박전규;서상원;황두성;김현빈;한문성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.158-162
    • /
    • 1996
  • 본 논문에서는 문자출력이 가능한 무선호출기에 음성인식 기술을 접목한, 특성화된 한 음성인식 시스템에 대하여 설명하고자 한다. 시스템 동작 과정은, 일단 호출자가 음성인식 서버와 접속하게 되면 서버는 호출자의 자연스런 입력음성을 인식, 그 결과를 문장 형태로 피호출자의 호출기 단말기에 출력시키는 방식으로 되어 있다. 본 시스템에서는 통계적 음성인식 기법을 도입하여, 각 단어를 연속 HMM으로 모델링하였다. 가우시안 혼합 확률밀도함수를 사용하는 각 모델은 전통적인 HMM 학습법들 중의 하나인 Baum-Welch 알고리듬에 의해 학습되고 인식시에는 이들에 비터비 빔 탐색을 적용하여 최선의 결과를 얻도록 한다. MFCC와 파워를 혼용한 26 차원 특징벡터를 각 프레임으로부터 추출하여, 최종적으로, 83 개의 도메인 어휘들 및 무음과 같은 특수어휘들에 대한 모델링을 완성하게 된다. 여기에 구문론적 기능과 의미론적 기능을 함께 수행하는 FSN을 결합시켜 자연발화음성에 대한 연속음성인식 시스템을 구성한다. 본문에서는 이상의 사항들 외에도 음성 데이터베이스, 레이블링 등과 갈이 시스템 성능과 직결되는 시스템의 외적 요소들에 대해 고찰하고, 시스템에 구현되어 있는 다양한 특성들에 대해 밝히며, 실험 결과 및 앞으로의 개선 방향 등에 대해 논의하기로 한다.

  • PDF

정제된 의미정보와 시소러스를 이용한 동형이의어 분별 시스템 (A Korean Homonym Disambiguation System Using Refined Semantic Information and Thesaurus)

  • 김준수;옥철영
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.829-840
    • /
    • 2005
  • 단어 의미 중의성 해소는 자연언어처리 분야에 매우 중요한 부분이다. 본 논문에서는 사전 뜻풀이 특성을 이용해 기존의 의미정보를 정제하고 유용한 정보인 확률정보, 거리정보 및 격정보 등을 추가한 WSD 모델을 제안하였으며, 사전을 기반으로 구축된 "울산대학교 어휘 지능망(UOU-Word Intelligent Network: U-WIN)" 상의 단어 계층적 구조(시소러스)를 이용하여 의미정보의 자료 부족 문제를 해소하는 모델을 제시하였"다. "21세기 세종 계획"에서 제공하는 150만 어절 규모의 의미 태그 말뭉치를 대상으로 한 실험에서 최다 빈도 의미 결정(Maximum Frequence Class, MFC, 정확률 베이스라인)에 비해 $18.97\%$(명사 $21.73\%$, 동사 $17.11\%$) 정확률 향상을 보였으며, 기존의 확률 가중치와 어절 거리 가중치를 이용한 모델에 비해서는 $10.49\%$(명사 $8.84\%$, 동사 $11.51\%$)의 정확률 향상되었다. 또한 시소러스를 사용하지 않고 확률정보, 거리정보, 격정보 만을 이용한 모델에 비해 $6.12\%$(명사 $5.29\%$, 동사 $6.64\%$) 높은 정확률을 보였다.

Maximum Entropy 모델을 이용한 나열 및 병렬형 인식 (Syntax Analysis of Enumeration type and Parallel Type Using Maximum Entropy Model)

  • 임수종;이창기;허정;장명길
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1240-1245
    • /
    • 2006
  • 한국어 문장을 구조 분석할 때에 모호성을 발생시키는 유형 중의 하나가 나열 및 병렬형이다. 문장 구조 복잡도를 증가시키는 나열 및 병렬형을 구조 분석 전에 미리 하나의 단위로 묶어서 처리하는 것이 문장 구조 분석의 정확도를 높이는데 중요하다. 본 연구에서는 형태소 태그를 이용한 기본 규칙으로 문장을 청크 단위로 분할하고 분할된 청크 중에서 나열형을 인식하여 해당되는 청크들을 하나의 나열 청크로 통합하여 청크의 개수를 줄인다. 병렬형에 대해서는 반복되는 병렬 청크의 범위와 생략된 용언을 복원한다. 이러한 인식은 첫 단계로 기호(symbol)를 중심으로 구축된 간단한 규칙으로 인식을 하고 이러한 규칙에 해당되지 않는 형태의 나열 및 병렬형은 Maximum Entropy 모델을 이용하여 적용한다. ME모델은 어휘자질, 형태소 품사 자질, 거리 자질, 의미자질, 구 단위 태그 자질(NP:명사구, VP:동사구, AP:형용사구), BIO 태그(Begin, Inside, Outside) 자질에 대한 ME(Maximum Entropy) 모델을 이용하여 구축되었다.

  • PDF

한글 문서에서 형태적 중의 오류의 교정 (A method for morphological correction of ambiguous error)

  • 김민주;정준호;이현주;최재혁;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF

왜 수동구문이 학술적 전문어에서 특히 선호되고 있는가? (Warum werden die Passivkonstruktionen in den wissenschaftlichen Fachsprachen besonders bevorzugt?)

  • 강국진
    • 한국독어학회지:독어학
    • /
    • 제1집
    • /
    • pp.119-139
    • /
    • 1999
  • 일상어는 한 사회의 모든 구성원이 쉽게 이해할 수 있고 사회생활에서 아무런 어려움이 없이 상호간에 의사소통을 할 수 있는 언어의 표현 수단이다. 이에 반하여 학술어는 각각의 전문분야에서 사용되고 있는 언어의 한 형태이다. 학술적 텍스트에서 나타나는 일반적인 특징은 글이 객관적이면서도 명확하게 기술된다는 점이다. 일반독자는 자주 사용되는 전문어휘를 통하여 학술적 텍스트를 가장 쉽게 인식할 수 있으며, 또한 텍스트의 구성에 있어서도 학술적 텍스트가 일반 텍스트와 다르다는 사실을 알 수 있다. 이 외에도 독일어에서는 일정한 문법적 현상들이 학술적 전문어의 요소로서 사용되고 있다. 예를 들면 삼인칭 단수, 부사구, 명사화 경향, 기능동사구의 선호, 수동구문 등등이 있다. 일반적으로 학술적 전문어에 자주 사용되고 있는 문법적 요소 중의 하나가 수동구문이다. 학술어의 요소로서 수동구문이 갖는 언어적 기능은 다음과 같다: 1. 수동구문에서는 일반적으로 행위자가 언급되지 않음으로써 사실이 객관적으로 표현되며, 동시에 행위자의 억제는 언어의 경제성에 기여한다. 2. 경우에 따라서 행위자가 표현될 때, 직접적인 행위의 주체를 나타내는 von-전치사구 혹은 매개체나 원인을 표현하는 durch-전치사구를 통하여 사건을 정확하게 기술할 수 있다. 3. 테마-레마 구조와 관련하여 살펴보면 문장구성 혹은 문장연결을 위한 표현수단으로도 수동구문은 활용된다. 4. 수동구문을 사용함으로써 문체상의 단조롭고 획일적인 점을 회피할 수도 있다. 본 논문은 이와 같이 수동구문이 지니고 있는 언어적 기능을 살펴봄으로써 학술적 전문어의 특징과 전문어를 이해하는데 기여한다.

  • PDF

주가지수 방향성 예측을 위한 주제지향 감성사전 구축 방안 (Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary)

  • 유은지;김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.95-110
    • /
    • 2013
  • 최근 다양한 소셜미디어를 통해 생성되는 비정형 데이터의 양은 빠른 속도로 증가하고 있으며, 이를 저장, 가공, 분석하기 위한 도구의 개발도 이에 맞추어 활발하게 이루어지고 있다. 이러한 환경에서 다양한 분석도구를 통해 텍스트 데이터를 분석함으로써, 기존의 정형 데이터 분석을 통해 해결하지 못했던 이슈들을 해결하기 위한 많은 시도가 이루어지고 있다. 특히 트위터나 페이스북을 통해 실시간에 근접하게 생산되는 글들과 수많은 인터넷 사이트에 게시되는 다양한 주제의 글들은, 방대한 양의 텍스트 분석을 통해 많은 사람들의 의견을 추출하고 이를 통해 향후 수익 창출에 기여할 수 있는 새로운 통찰을 발굴하기 위한 움직임에 동기를 부여하고 있다. 뉴스 데이터에 대한 오피니언 마이닝을 통해 주가지수 등락 예측 모델을 제안한 최근의 연구는 이러한 시도의 대표적 예라고 할 수 있다. 우리가 여러 매체를 통해 매일 접하는 뉴스 역시 대표적인 비정형 데이터 중의 하나이다. 이러한 비정형 텍스트 데이터를 분석하는 오피니언 마이닝 또는 감성 분석은 제품, 서비스, 조직, 이슈, 그리고 이들의 여러 속성에 대한 사람들의 의견, 감성, 평가, 태도, 감정 등을 분석하는 일련의 과정을 의미한다. 이러한 오피니언 마이닝을 다루는 많은 연구는, 각 어휘별로 긍정/부정의 극성을 규정해 놓은 감성사전을 사용하며, 한 문장 또는 문서에 나타난 어휘들의 극성 분포에 따라 해당 문장 또는 문서의 극성을 산출하는 방식을 채택한다. 하지만 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다. 본 연구는 특정 어휘의 극성은 한 가지로 고유하게 정해져 있지 않으며, 분석의 목적에 따라 그 극성이 상이하게 나타날 수도 있다는 인식에서 출발한다. 동일한 어휘의 극성이 해석하는 사람의 입장에 따라 또는 분석 목적에 따라 서로 상이하게 해석되는 현상은 지금까지 다루어지지 않은 어려운 이슈로 알려져 있다. 구체적으로는 주가지수의 상승이라는 한정된 주제에 대해 각 관련 어휘가 갖는 극성을 판별하여 주가지수 상승 예측을 위한 감성사전을 구축하고, 이를 기반으로 한 뉴스 분석을 통해 주가지수의 상승을 예측한 결과를 보이고자 한다.

통사문법적 지식이 '독서기계'의 음성출력에 미치는 영향과 중요성 (The Influence and Impact of syntactic-grammatical knowledge on the Phonetic Outputs of a 'Reading Machine')

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.225-230
    • /
    • 2020
  • 인공지능, 딥러닝, 머신러닝 등이 괄목할만한 발전을 이루면서 2016년경부터 100여개의 언어를 비롯하여 가장 보편적으로 사용되어 온 Google Translate (구글기계번역기)는 자연언어처리(NLP) 분야와 외국어 학습 등 언어활용 분야에 독보적인 역할을 하고 있다. 본 논문은 구글기계번역기, Google Translate에 있어서, 영어모국어화자가 가진 통사문법적-범주적 지식의 중요성과 그 영향력에 대해 살펴보고자 한다. Jackendoff (1999)는 맹인을 위한 독서기계(Reading Machine)등을 구축하려면 통사구조적 지식과 문법적 분해력(parsing)이 매우 중요하고, 적어도 현재의 컴퓨터는 엄청난 발전을 이루기는 하였으나, 인간의 두뇌를 따라갈 수 없다는 결론을 내렸다. Jackendoff가 논의했던 몇 가지 어휘항목과 통사구조적 중의성을 활용하여, Google Translate 기계발음번역기를 통해 그의 주장을 확인하는 실험을 실시하고, 그 결과를 분석하는 것이 이 논문의 목표이다. 이 연구는 Jackendoff의 주장처럼 L1 화자가 내재화한 통사문법적, 범주-구조적 지식은 NLP, 혹은 "독서기계"등의 구축에서 중요하며, 이는 Chomsky (1986, 2005)등에서 논의된 내재적언어 (I-language)의 핵심이라는 점을 시사한다.