• 제목/요약/키워드: 오류 어휘

검색결과 109건 처리시간 0.027초

효율적인 상품평 분석을 위한 어휘 통계 정보 기반 평가 항목 추출 시스템 (Automatic Product Feature Extraction for Efficient Analysis of Product Reviews Using Term Statistics)

  • 이우철;이현아;이공주
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.497-502
    • /
    • 2009
  • 본 논문에서는 상품평의 효율적인 분석을 위한 평가 항목 추출 시스템을 제안한다. 시스템은 크게 상품평 수집-보정과 평가 항목 추출의 두 단계로 구성된다. 상품평 수집-보정에서는 인터넷 쇼핑몰에서 상품평을 수집하고 상품평 특유의 구어체 표현과 맞춤법 오류 등을 처리한다. 평가 항목 추출에서는 스커트 상품 카테고리의 경우 ‘사이즈', ‘스타일'과 같이 상품을 평가하는 기준이 되는 항목을 상품평과 인터넷 상의 웹 문서를 활용하여 자동으로 추출한다. 상품평에 나타나는 명사들을 평가 항목 후보로 설정하고, 각 후보 명사의 상품평에서의 어휘 통계인 내부연관도와, 후보 명사와 상품 카테고리명의 웹 문서에서의 공기 빈도에 기반하여 계산된 외부연관도를 결합하여 상품과 평가 항목 후보의 연관도를 계산한다. 본 논문의 평가 항목 추출 방식은 평균 재현율 90%를 보여 기존 연구보다 우수한 결과를 보였다.

가변어휘 단어 인식에서의 미등록어 거절 알고리즘 성능 비교 (Performance Comparison of Out-Of-Vocabulary Word Rejection Algorithms in Variable Vocabulary Word Recognition)

  • 김기태;문광식;김회린;이영직;정재호
    • 한국음향학회지
    • /
    • 제20권2호
    • /
    • pp.27-34
    • /
    • 2001
  • 발화 검증이란 등록된 단어 목록 이외의 단어가 입력되었을 때, 미등록된 단어는 인식할 수 없는 단어임을 알려주는 기능으로써 사용자에게 친숙한 음성 인식 시스템을 설계하는데 중요한 기술이다. 본 논문에서는 가변어휘 단어 인식기에서 최소 검증 오류를 나타낼 수 있는 발화 검증 시스템의 알고리즘을 제안한다. 우선, 한국전자통신연구원의 PBW(Phonetically Balanced Words) 445DB를 이용하여 가변어휘 단어 인식에서의 미등록어 거절 성능을 향상시키는 효과적인 발화 검증 방법을 제안하였다. 구체적으로 특별한 훈련 과정이 없이도 유사 음소 집합을 많이 포함시킨 반음소 모델을 제안하여 최소 검증 오류를 지니도록 하였다. 또한, 음소 단위의 null hypothesis와 alternate hypothesis의 비를 이용한 음소 단위의 신뢰도는 null hypothesis로 정규화해서 강인한 발화 검증 성능을 보여 주었으며, 음소 단위의 신뢰도를 이용한 단어 단위의 신뢰도는 등록어와 미등록어 사이의 분별력을 잘 표현해 주었다. 이와 같이 새로이 제안된 반음소 모델과 발화 검증 방법을 사용했을 때, CA (Correctly Accept for Keyword: 등록어를 제대로 인정한 경우)는 약 89%, CR (Correctly Reject for OOV (Out-of-Vocabulary): 미등록어에 대해 거절한 경우)은 약 90%로써, 기존 필터 모델을 이용한 방법보다 미등록어 거절 성능이 ERR (Error Reduction Rate) 측면에서 약 15-21% 향상됨을 알 수 있었다.

  • PDF

온톨로지 기반의 소프트웨어 설계에러검출방법 (A Method based on Ontology for detecting errors in the Software Design)

  • 서진원;김영태;공헌택;임재현;김치수
    • 한국산학기술학회논문지
    • /
    • 제10권10호
    • /
    • pp.2676-2683
    • /
    • 2009
  • 본 논문은 소프트웨어 설계 시 향상된 오류 검출방법을 통해서 소프트웨어 설계의 질을 향상시켜 그에 따른 소프트웨어 제품의 질을 향상시키는데 목적을 두고 있다. 본 논문에서 오류검출의 범위는 일관성결여 오류로 제한하여 일관성 오류에 관한 명세에 초점을 맞춘다. UML 표현의 문제점인 의미 일관성 표현의 한계를 극복하기 위해 ODES 모델을 제안하였으며 검증방법으로 일관성 검사 방법을 제안한다. UML 설계에서 확인된 의미적으로 중요한 특징이 ODES 모델로 구현되며, UML 모델을 ODES 모델로 변환과정에서의 일관성검사방법을 제시한다. ODES 모델로의 변환과정은 ODES 모델의 인스턴스를 생성하기 위한 알고리즘에서 복수의 사상테이블을 이용하는 소프트웨어 설계의 어휘분석과 의미분석을 포함한다.

단순 손동작 반복이 말소리장애 아동과 일반 아동의 말소리산출의 정확성과 유창성에 미치는 영향 (What Effect can Simple Hand Tapping Have on the Accuracy and Fluency of Speech Production in Children With and Without Speech Sound Disorders?)

  • 신유나;하지완
    • 재활치료과학
    • /
    • 제8권2호
    • /
    • pp.67-78
    • /
    • 2019
  • 목적 : 본 연구에서는 말소리장애 아동과 일반 아동을 대상으로 어휘인출 시 단순 손동작(hand tapping)을 반복하게 하는 것이 조음정확도와 유창성에 어떠한 영향을 미치는지에 대해 알아보았다. 손동작을 반복하면서 어휘를 산출하는 것은 주의를 분산시키는 이중과제에 해당하기 때문에, 주의력 저하가 보고된 말소리장애 아동의 경우 일반 아동과 다른 행동 양상을 보이는지를 파악하고자 하였다. 연구방법 : 4, 5, 6세의 말소리장애 아동 15명과 일반 아동 15명이 본 연구에 참여하였다. 조음복잡성이 높은 어휘와 낮은 어휘를 각각 15개씩, 총 30개를 선정하여, 이에 대한 대면이름대기 과제를 실시하였다. 첫 번째 실험조건에서는 단순 손동작을 반복하지 않고, 두 번째 실험조건에서는 손바닥으로 책상을 두드리면서 그림 이름을 말하도록 하였다. 대상자의 반응에 대해 자음정확도, 비유창성 정도, 정확성 변화와 유창성 변화의 상관관계를 측정하여, 두 실험조건에 따른 두 집단 간 수행력을 비교하였다. 결과 : 첫째, 말소리장애 집단과 일반 집단 모두 손동작 반복 과제와 손동작 비반복 과제 간 자음정확도에는 유의한 차이가 없었다. 둘째, 일반 집단은 손동작 반복 과제에서 비유창성이 유의하게 증가하였으나, 말소리장애 집단은 차이가 없었다. 셋째 손동작 반복에 따른 자음정확도 변화와 비유창성 변화는 일반집단의 경우 유의한 양의 상관관계가 있었으나 말소리장애 집단은 아무런 상관을 보이지 않았다. 결론 : 본 연구에서 주의력 분산을 위해 사용한 단순 손동작 반복은 결과적으로 집단에 따라 대상자의 목표행동에 방해가 될 수도, 혹은 그 반대로 도움이 될 수도 있었다. 어휘인출에 대한 손동작 반복의 영향이 두 집단 간 다른 양상으로 나타난 만큼 이에 대한 심층적 논의가 필요할 것이다.

『한한대사전(漢韓大辭典)』에 수록된 『사기(史記)·열전(列傳)』 관련어휘 오류연구(誤謬硏究) (A Study on Error Analysis of Words Used in Shiji Liezhuan Presented in the Great Chinese-Korean Dictionary)

  • 최태훈
    • 비교문화연구
    • /
    • 제40권
    • /
    • pp.213-238
    • /
    • 2015
  • 본 논문은 "한한대사전"에 기재된 "사기 열전" 관련 어휘 가운데 드러나 보이는 5가지의 문제를 규정(옳게 바꿈)한 것이다. 필자는 크게 의미해석 오류수정, 의미해석 보충수정으로 나누어 설명하였다. 그 대강의 내용은 아래와 같다. 첫째, 의미해석 오류수정에서는 "가여", "교칙", "관채"의 풀이가 "한한대사전"에서 잘못 기재되어있음을 밝혔다. 독자로 하여금 혼돈을 일으키기 쉬운 그럴듯한 해석으로 본의를 상실한 한 경우가 대부분이었다. 각각은 "빌려 줌${\rightarrow}$주다", "정리함${\rightarrow}$옛 것을 제거하고 새롭게 꾸밈, 수식, 교정윤식(색)", "관찰하여 채택함. 살펴서 취함${\rightarrow}$(주의 깊게) 찾아보다, 물색하다"로 의미해석을 수정해 주어야 한다. 둘째, 의미해석 보충수정에서는 "효실", "심념"의 의미항목이 부족함을 언급하였다. 각각에 대하여 "실력을 드러내다", "깊은 시름에 잠기다"의 풀이를 보충해 주었다. 또한 국내외 학자들의 번역본을 비교해보면 다음과 같은 결론을 얻을 수 있다. "가여" 항목은 정범진의 풀이가 가장 정확했다. "교칙" 항목은 박일봉, 왕리기, 양종현 학지달의 풀이가 비교적 타당했다. "관채"항목은 박일봉과 왕리기의 번역이 적합했다. "효실" 항목에서는 김원중이 올바른 해석을 했으며, "심념" 항목은 왕중의 번역이 가장 이상적이라고 사료된다.

모바일 단말기를 위한 추천 소프트 키보드 (Preliminary Study on Soft Keyboard with Recommendation for Mobile Device)

  • 황기태;이재문
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.137-145
    • /
    • 2013
  • 최근 대부분의 모바일 단말기는 LCD 터치 화면에 소프트 키보드를 장착한다. 그러나 소프트 키보드의 터치화면의 크기가 작기 때문에, 인접키가 실수로 눌러지고, 한 키를 여러 키 입력에 중복 사용함에 따라 사용자의 키 입력 오류가 많이 발생한다. 본 논문에서는 사용자가 텍스트를 입력하는 동안 적절한 어휘를 추천하여 키 입력 오류를 쉽게 수정하도록 돕는 알고리즘을 제안하고 MissLess 소프트 키보드를 구현한 내용에 대해 기술한다. 3개의 간단한 테스트 셋을 작성하여 MissLess 키보드의 추천 성능을 평가한 결과 다소 차이가 있지만 90%에 달하는 추천 성능을 얻었다. 그러나 추천 워드가 4개인 것을 고려하면 추천 성능을 해석할 필요가 있다.

한국어 문법검사기에서 의미정보를 이용한 복합명사의 분석제약 (To Constrain Korean Compound Nouns using Semantic Information for Korean Grammar Checker)

  • 원상연;김수남;김광영;남현숙;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.288-293
    • /
    • 1999
  • 일반적으로 두 개의 명사가 결합하여 하나의 명사 기능을 하는 어구를 복합명사라고 한다. 한국어는 복합명사 내의 명사를 붙여볼 수도 있고 띄어쓸 수도 있으므로 복합명사의 형태적 분석에 많은 어려움이 있다. 이 연구에서는 각 명사의 복합명사 결합을 최대한 제약하여 문법검사기에서 복합명사와 관련된 오류의 발생을 최소화할 수 있는 방범을 개발했다. 이 논문에서 복합명사 분석 기능을 제약하는 방법으로 형태적 제약 방법과 의미정보에 따라 복합명사의 결합관계를 제약하는 방법을 이용했다. 어휘 정보만으로 복합명사를 분석하면 의미관계에 의한 오류는 찾기 어려우므로 복합명사의 구조적 결합관계와 의미 결합관계를 밝혀 복합명사를 잘못 분석하는 문제점을 극복한다. 복합명사의 결합제약은 명사의 왼쪽과 오른쪽에 올 수 있거나 올 수 없는 명사를 의미, 형태적 특성과 명사가 나타나는 분포(distribution)에 따라 분류하여 규칙베이스화하였다. 의미정보를 이용한 복합명사 결합제약 알고리즘도 구현하였다.

  • PDF

한국어 불규칙 용언의 형태 정보 : 실어증 환자를 중심으로 (The Processing of Irregular Verbals in Korean : Shown in Aphasics)

  • 김윤정;김수정;김희정;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.303-308
    • /
    • 2000
  • 용언은 그 어간이 여러 문법소와 결합하면서 자동적 음운 변동을 제외한 형태 변동이 있는가, 없는가에 의해 규칙 용언/불규칙 용언으로 구분할 수 있다. 이러한 불규칙 용언은 심성 어휘집에 어떤 형태로 저장되어 있으며, 규칙 용언과는 어떠한 관계가 있는지, 나아가 실어증 환자의 경우에는 정상인에 비해 어떤 행동장애를 보이며, 장애가 있다면 어느 경로의 손상으로 인한 장애인지를 알아보는 것이 본 연구의 목적이다. 이를 위해 이해성 실어증 환자 한 명과 음어적 실행증 현상을 동반한 경미한 정도의 실어증 환자를 피험자로 하였다. 실험 과제는 단어 채워 넣기 과제(word completion task)를 사용하였다. 즉 주어진 기본형 용언을 검사 문장의 문맥에 맞게 활용하여 채워 넣는 것이다. 실험 결과에 의하면 환자들은 규칙용언의 활용(예. 먹다/먹는)과 불규칙 용언 중 형태를 유지한 채로 활용하는 경우(예. 줍다/줍고)에는 거의 오류가 없었으나, 불규칙 용언이 형태 변화를 겪어야 할 경우(예. 줍다/주워)에는 대부분 오류를 보였다. 또 이때는 기본형(basic form)을 그대로 유지하는 오류 방향성을 관찰할 수 있었다. 이는 그간 문법으로 구분되어 오던 규칙 용언/불규칙 용언의 정보 처리보다는 형태 유지/형태 변화 정보 처리의 영향이 크다는 것을 알 수 있다. 특히 이해성 실어증 환자는 전체적인 오류율이 매우 높았는데, 규칙 용언의 경우에도 오류를 보였다. 이때, 용언의 어간에 해당하는 부분에는 오류가 없고, 뒤에 따르는 내용과의 관계를 파악해야 하는 문법 기능소, 즉 연결 어미에서 오류를 보여 정보의 유지, 통합에 문제가 있다는 기존의 연구와도 일치하는 결과를 나타냈다.환자는 시제 선어말 어미를 선택하는데도 어려움을 보임이 확인되었다. 실험 3 역시 실험 1과 실험2에서와 동일하게 처리의 어려움을 보였다. 이러한 실험 결과들은 국어의 존칭과 시제 선어말 어미가 통사부에서 구(XP)와 결합하여 새로운 구를 형성하는 통사적 접사로 해석할 수 있으며 Grodzinsky의 가설을 지지하는 결과를 보여 줌으로서 국어에서도 AgrP, TP, CP 사이의 통사적 위계가 있음을 뒷받침하는 증거가 된다.전처리한 Group 3에서는 IL-2와 IL-4의 수준이 유의성있게 억제되어 발현되었다 (p < 0.05). 이러한 결과를 통하여 T. denticola에서 추출된 면역억제 단백질이 Th1과 Th2의 cytokine 분비 기능을 억제하는 것으로 확인 되었으며 이 기전이 감염 근관에서 발견되는 T. denticola의 치수 및 치근단 질환에 대한 병인기전과 관련이 있는 것으로 사료된다.을 보였다. 본 실험 결과, $Depulpin^{\circledR}은{\;}Tempcanal^{\circledR}와{\;}Vitapex^{\circledR}$에 비해 높은 세포 독성을 보여주공 있으나, 좀 더 많은 임상적 검증이 필요할 것으로 사료된다.중요한 역할을 하는 것으로 추론할 수 있다.근관벽을 처리하는 것이 필요하다고 사료된다.크기에 의존하며, 또한 이러한 영향은 $(Ti_{1-x}AI_{x})N$ 피막에 존재하는 AI의 함량이 높고, 초기에 증착된 막의 업자 크기가 작을 수록 클 것으로 여겨진다. 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로 나타났다.corner$적 의도에 의한 경관구성의 일면을 확인

  • PDF

한국어 생의학 개체명 인식 성능 비교와 오류 분석 (Performance Comparison and Error Analysis of Korean Bio-medical Named Entity Recognition)

  • 이재홍
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.701-708
    • /
    • 2024
  • 딥러닝 분야에서 트랜스포머 아키텍쳐의 출현은 자연어 처리 연구가 획기적인 발전을 가져왔다. 개체명 인식은 자연어 처리의 한 분야로 정보 검색과 같은 태스크에 중요한 연구 분야이다. 생의학 분야에서도 그 중요성이 강조되나 학습용 한국어 생의학 말뭉치의 부족으로 AI를 활용한 한국어 임상 연구 발전에 제약이 되고 있다. 본 연구에서는 한국어 생의학 개체명 인식을 위해 새로운 생의학 말뭉치를 구축하고 대용량 한국어 말뭉치로 사전 학습된 언어 모델들을 선정하여 전이 학습시켰다. F1-score로 선정된 언어 모델의 개체명 인식 성능과 태그별 인식률을 비교하고 오류 분석을 하였다. 인식 성능에서는 KlueRoBERTa가 상대적인 좋은 성능을 보였다. 태깅 과정의 오류 분석 결과 Disease의 인식 성능은 우수하나 상대적으로 Body와 Treatment는 낮았다. 이는 문맥에 기반하여 제대로 개체명을 분류하지 못하는 과분할과 미분할로 인한 것으로, 잘못된 태깅들을 보완하기 위해서는 보다 정밀한 형태소 분석기와 풍부한 어휘사전 구축이 선행되어야 할 것이다.

명명 과제에서 음절 토큰 및 타입 빈도 효과 (The Syllable Type and Token Frequency Effect in Naming Task)

  • 권유안
    • 인지과학
    • /
    • 제25권2호
    • /
    • pp.91-107
    • /
    • 2014
  • 음절 빈도 효과란 고빈도 음절로 시작되는 단어가 저빈도 음절로 시작되는 단어에 비해 어휘 판단 속도가 느리며 어휘 판단 오류율도 증가하는 효과를 의미한다. 이 효과를 유발하는 원인은 전체 단어 수준에서 활성화된 음절 이웃 단어의 방해로 알려져 있으며 이 방해의 크기는 표적 단어가 얼마나 많은 음절 이웃 단어를 또는 얼마나 강력한 음절 이웃 단어를 가지고 있는지에 의해 결정된다. 그러나 음절 빈도의 정의가 음절 타입 빈도와 토큰 빈도로 구분됨에도 불구하고 이를 구분하지 않고 많은 연구들이 수행되어 왔다. 최근 Conrad, Carreiras, & Jacobs(2008)에 따르면 음절 토큰 빈도는 전체 단어 처리 수준을 반영하는 변인이며 음절 타입 빈도는 하위 어휘 처리 수준의 음절 처리 수준을 반영하는 변인일 수 있다고 주장하였다. 이에 본 연구는 이들의 주장이 맞다면 음절 타입 빈도는 단어 명명 속도를 촉진 시킬 것이며 반대로 음절 토큰 빈도는 명명 시간과 관련 없을 것이라고 예측하였다. 왜냐하면 표기 심도가 얕고 음절의 경계가 명확한 언어에서 명명 과제는 전체 단어수준을 덜 참고하기 때문이었다. 실험 1결과에서 음절 토큰 빈도를 통제한 상태에서 고빈도 타입음절의 단어 명명 시간은 유의미하게 짧았다. 실험 2에서 음절 타입 빈도를 통제한 상태에서 음절토큰 빈도의 증가는 명명 시간을 역시 단축시켰다. 이에 본 연구는 음절 토큰 빈도가 하위 어휘 처리와 무관하다는 Conrad, Carreiras, & Jacobs(2008)의 주장을 반박하였다.