• 제목/요약/키워드: 언어적 오류

검색결과 380건 처리시간 0.025초

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소 (A Non-morphological Approach for DBpedia URI Spotting within Korean Text)

  • 김영식;함영균;김지성;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

자동 평가 방법을 이용한 번역 지식 튜닝 시스템 (Translation Dictionary Tuning System By using of Auto-Evaluation Method)

  • 박은진;김운;권오욱;오영순;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.147-150
    • /
    • 2011
  • 본 논문에서는 병렬 말뭉치에서 오류가 있을 것으로 추정되는 문장을 자동 추출하여, 다수의 번역 사전 구축 작업자가 자동 번역시스템을 직접 사용하면서 번역 사전을 튜닝하는 방법에 대하여 제안하고자 한다. 작업자는 병렬 말뭉치의 대역문을 이용하여 자동 번역 결과의 BLEU를 측정하고, 사전 수정 전과 후의 BLEU 차이를 정량적으로 제시해 줌으로써 양질의 번역 사전을 구축하도록 하였다. 대량의 번역 사전이 이미 구축된 자동 번역시스템에서 추가적인 성능향상을 위해 대량의 말뭉치에서 미등록어, 번역패턴 등을 추출하여, 대량으로 구축하는 기존 방법에 비해 사전 구축 부작용이 적으며, 자동번역 성능향상에 더 기여하는 것을 실험을 통해 증명하였다. 이를 위해 본 논문에서는 중한 자동 번역시스템을 대상으로, 중국어 문장 2,193문장에 대해, 사전 구축 작업자 2명이 2주간 튜닝한 결과와 15만 말뭉치에서 추출한 미등록어 후보 2만 엔트리를 3명의 사전 구축 작업자가 미등록어 선별, 품사 및 대역어 부착한 결과 7,200 엔트리를 대상으로 자동평가를 실시하였다. 실험결과 미등록어 추가에 의한 BLEU 성능향상은 +3인데 반해, 약 2,000문장 튜닝 후 BLEU를 +12 향상시켰다.

  • PDF

STATECHART 로 설계한 Digital Plant Protection System 의 정형 검증 (Formal Verification of Digital Power Plant System Designed by STATECHART)

  • 김일곤;김진현;남원홍;이나영;곽희환;최진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.185-188
    • /
    • 2001
  • 원자력 발전소 내장형 시스템과 같이 시스템 오작동으로 인하여 엄청난 재난을 불러올 수 있는 시스템은 시스템을 구축하기 이전에 완전한 설계 및 검증이 절대적으로 필요하다. 이에 따라 원자력 발전소의 비상 차단 시스템과 같이 고도의 안정성을 요하는 부분에 대해 정형 명세 언어인 STATECHART 를 이용하여 명세하고 테스팅하는 연구가 있어 왔다. 하지만 테스팅 기법만으로는 시스템에서 생길 수 있는 예기치 못한 오류들을 정확히 검출해 낼 수 없다. 그래서 본 논문에서는 시스템의 보다 높은 안전성과 신뢰성을 제공하기 위해 원자력 발전소 비상 차단 시스템인 DPPS(Digital Plant Protection System)를 분석하여 이를 시각적 기반의 설계 명세 언어인 STATECAHRT를 이용하여 명세함으로써 설계자와 구현자간의 의사 소통을 원활하게 전달함은 물론 모델 체킹 검증 도구인 SMV 로 검증함으로써 실제 원자력 발전소 비상 차단 시스템의 신뢰성과 안전성을 높이고자 한다.

  • PDF

자기 학습 방법을 이용한 음성 대화 시스템의 슬롯 교정 (Self-learning Method Based Slot Correction for Spoken Dialog System)

  • 최태균;김민경;이인재;이지은;박규연;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-360
    • /
    • 2021
  • 음성 대화 시스템에서는 사용자가 잘못된 슬롯명을 말하거나 음성인식 오류가 발생해 사용자의 의도에 맞지 않는 응답을 하는 경우가 있다. 이러한 문제를 해결하고자 말뭉치나 사전 데이터를 활용한 질의 교정 방법들이 제안되지만, 이는 지속적으로 사람이 개입하여 데이터를 주입해야하는 한계가 있다. 본 논문에서는 축적된 로그 데이터를 활용하여 사람의 개입 없이 음악 재생에 필요한 슬롯을 교정하는 자기 학습(Self-learning) 기반의 모델을 제안한다. 이 모델은 사용자가 특정 음악을 재생하고자 유사한 질의를 반복하는 상황을 이용하여 비지도 학습 기반으로 학습하고 음악 재생에 실패한 슬롯을 교정한다. 그리고, 학습한 모델 결과의 정확도에 대한 불확실성을 해소하기 위해 질의 슬롯 관계 유사도 모델을 이용하여 교정 결과에 대한 검증을 하고 슬롯 교정 결과에 대한 안정성을 보장한다. 모델 학습을 위한 데이터셋은 사용자가 연속으로 질의한 세션 데이터로부터 추출하며, 음악 재생 슬롯 세션 데이터와 질의 슬롯 관계 유사도 데이터를 각각 구축하여 슬롯 교정 모델과 질의 슬롯 관계 유사도 모델을 학습한다. 교정된 슬롯을 분석한 결과 발음 정보가 유사한 슬롯 뿐만 아니라 의미적인 관계가 있는 슬롯으로도 교정하여 사전 기반 방식보다 다양한 유형의 교정이 가능한 것을 보였다. 3 개월 간 수집된 로그 데이터로 학습한 음악 재생 슬롯 교정 모델은 일주일 동안 반복한 고유 질의 기준, 음악 재생 실패의 12%를 개선하는 성능을 보였다.

  • PDF

사회적 이슈 리스크 유형 분류를 위한 어휘 자질 선별 (Linguistic Features Discrimination for Social Issue Risk Classification)

  • 오효정;윤보현;김찬영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.541-548
    • /
    • 2016
  • 사용자의 다양한 의견을 수렴하고 모니터링하기 위한 정보원으로써 소셜미디어의 활용은 이미 필수가 되었다. 본 논문은 소셜미디어에 나타난 다양한 이슈 중 여론 형성에 악영향을 끼치는 부정적 사건을 이슈 '리스크'로 정의, 그 세부 유형을 자동으로 분류하는 모델을 개발하고자 한다. 이를 위해 소셜미디어에 나타난 다양한 어휘 자질을 선별, 그 효과를 규명하였다. 특히 리스크 문장의 어휘 구문 특징을 표현하기 위한 자질로 워드 임베딩 학습 결과를 활용한다. 개별 어휘 자질의 특징을 분석하기 위해 언어분석 오류를 보정한 환경에서 수행한 실험 결과, 가장 효과가 큰 자질은 개체명 자질로 분석되었으며, 기본 어휘 자질을 기반으로 주요 술부의 워드 임베딩 결과와 워드 클러스터 결과를 모두 조합한 경우가 최고 성능을 보이는 것으로 파악되었다. 실제 소셜빅데이터에 적용하는 환경과 유사하도록 자동 언어분석 결과의 오류를 포함한 조건에서 실험한 결과, 고빈도 평가셋에서는 92.08%의 성능을, 전체 58개 범주 평가셋에서는 85.84%의 성능을 얻었다.

Python 기반 AI 프로젝트에서 예외 제안을 위한 자동화 접근 방식 (An Automated Approach for Exception Suggestion in Python-based AI Projects)

  • 강민구;김순태;류덕산
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.73-79
    • /
    • 2022
  • Artificial intelligence (AI) 프로젝트에 널리 사용되는 Python 언어는 Interpreter 언어로 Runtime 시에 오류가 발생한다. 오류로 인한 프로젝트의 실패를 방지하기 위해서는 사전에 예외적인 상황이 발생할 수 있는 코드에 대한 예외 처리가 필요하다. 특히, 많은 리소스를 필요로 하는 AI 프로젝트에서, 오랜 실행 후 발생하는 예외는 큰 리소스 낭비를 초래한다. 하지만, 예외 처리는 개발자의 경험에 의존하기 때문에 개발자들은 잡아야 할 적절한 예외를 결정하는데 어려움을 가진다. 이러한 필요성을 해결하기 위해 기존 예외 처리문을 학습하여 개발 중에 개발자에게 잡아야 할 예외를 제안해주는 접근 방법을 제안한다. 제안 방법은 try 블록의 소스 코드를 입력으로 받아 except 블록에서 처리되어야 할 예외들을 제안해준다. 우리는 2개의 프레임워크로 구성된 대규모 프로젝트에 대해 접근 방법을 평가한다. 우리의 평가 결과에 따르면, 예외 제안을 수행할 때 평균 AUPRC는 0.92 이상을 나타낸다. 연구 결과는 제안된 방법이 비교 모델들을 능가하는 예외 제안 성능으로 개발자의 예외 처리를 지원할 수 있음을 보여준다.

정형기법을 적용한 위기대응 실무매뉴얼 명세 및 검증 (Specification and Verification of Crisis Response Manual using Formal Methods)

  • 정금택;이진호;서석;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.116-119
    • /
    • 2010
  • 안보, 재난, 국가핵심기반 분야에 위기발생시 즉각적인 조치를 위한 '위기대응 실무매뉴얼'이 정부기관별로 작성되어 있지만 조치사항에 대한 정량적 검증이 부족하다. 오류가 내포된 조치절차는 피해를 확대 시킬 수 있으므로 위기대응절차에 대한 검증이 요구되며 이를 위해 본 논문에서는 Statemate의 구조적, 기능적, 행위적 관점의 언어를 활용해서 정형기법(formal methods)을 수행함으로써 위기 대응 실무매뉴얼의 모델링 방법을 제안하고 매뉴얼에 기술되어 있는 조치절차의 검증결과를 제시하였다.

  • PDF

주의산만과 과잉운동을 주소로 하는 정신과 내원 아동들의 임상 평가 (CLINICAL EVALUATION OF CHILDREN WITH INATTENTION AND HYPERACTIVITY IN A PSYCHIATRIC CLINIC)

  • 권용실
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제13권1호
    • /
    • pp.93-103
    • /
    • 2002
  • 저자는 소아정신과 영역에서 흔하게 관찰되는 주의산만과 과잉운동을 주소로 하는 아동들의 진단특성과 이와 관련된 임상변인들을 알아보기 위하여 본 연구를 시행하였다. 대학병원 소아정신과에 내원한 아동들에서 주의력과 과잉운동 문제를 보이는 5세에서 14세 사이 총 71명(남자 63 명, 여자 8명)을 대상으로 하여, KEDI-WISC, KPI-C, ADS를 시행하였고 진단 분류에 따라 1) ADHD만 있는 군 2) 공존 질환이 있는 ADHD군 3) ADHD 이외의 진단군으로 나누어 비교한 결과 아래와 같은 결과를 얻었다. 1) ADHD 단독 진단군이 17명(23.9%), 공존질환이 ADHD는 26명(38.0%)이었으며 공존질환은 틱장애가 가장 많고 발달성 언어장애, 경계성 지능, 적대적 반항/품행장애, 경계성 지적능력, 학습장애의 순서를 보였으며, ADHD 이외의 진단군 27명(38.0%)은 틱장애, 경계성 지능, 우울/불안장애, 적대적 반항/품행장애의 진단 분포를 나타냈다. 2) 지능검사에서 전체지능, 언어성 지능, 동작성 지능 모두 군별 차이를 보였고 ADHD만 있는 군에서 공존질환 ADHD군보다 전체지능과 언어지능이 유의하게 높은 수치를 나타냈다. KPI-C 임상 척도는 군별 차이를 보이지 않았다. ADS 시각자극 검사에서 누락오류(omission)와 민감도(d')가 세 군 사이에 의미있는 차이를 보였고, 공존질환이 있는 ADHD 군이 ADHD이외의 진단군에 비해 유의하게 누락오류가 많고 민감도는 낮았다. 본 연구 결과를 볼때 아동의 주의산만과 과잉운동 증상은 주 진단인 ADHD 이외에도 다양한 정신과 질환으로 진단될 수 있으므로 이에 대한 감별이 필요하며, 또한 공존질환이 있는 ADHD군이 ADHD만 있는 군이나 기타 질환군보다 주의력에 문제가 많고 지능 수치가 상대적으로 낮아 학습 및 학교 생활 적응에 어려움이 더 많을 것이므로 적극적인 치료개입이 필요할 것으로 생각되었다.

  • PDF

시각 주의력과 청각 주의력의 차이를 보이는 주의력 결핍.과잉활동장애 아동의 인지기능과 정서 및 행동 문제 (The Cognitive Performance, Emotional and Behavioral Problems of the Children with ADHD Showing the Difference between Visual and Auditory Attention)

  • 손정우
    • 생물정신의학
    • /
    • 제13권2호
    • /
    • pp.70-81
    • /
    • 2006
  • 목 적: 시각 주의력과 청각 주의력에서 차이를 보이는 주의력결핍 과잉활동장애(ADHD) 아동의 인지 기능 및 정서, 행동 문제에 대해 연구하고자 한다. 방 법: 동반 질환이 없는 ADHD 아동 98명을 대상으로 '주의력장애 진단시스템(ADS)' 을 실시하여 시각 주의력과 청각 주의력을 측정한 뒤, ADS의 누락 오류와 오경보 오류를 이용하여 이들을 1) 청각 누락 오류 및 오경보 오류가 시각 누락 오류 및 오경보 오류보다 높은 군(AA군) 2) 시각 누락 오류 및 오경보 오류가 청각 누락 오류 및 오경보 오류보다 높은 군(VV군) 3) 1), 2)에 해당하지 않는 군(M군)의 3개 군으로 분류하였다. 세 군 간에 '한국판 웩슬러 아동용 지능 검사(KEDI-WISC)' 의 소검사 결과와 '한국판 아동-청소년 행동평가척도(K-CBCL)' 의 여러 하위 소척도의 점수를 비교하였다. 또한, 전체 아동을 대상으로 시각 누락 오류, 청각 누락 오류, 시각 오경보 오류, 청각 오경보 오류와 KEDI-WISC의 소검사 점수, K-CBCL의 하위 영역 점수 간의 상관관계를 조사하였다. 결 과: 다음의 결과를 얻었다. 1) AA군은 10명, M군은 32명, VV군은 56명이었다. 2) KEDI-WISC의 소검사 점수 비교에서는 VV군의 점수가 나머지 두 군보다 높았다. 특히 언어성 지능(p=.039)에서는 VV군이 AA군보다 유의하게 높았고 토막짜기(p=.015), Kaufman의 요인 2(p=.045), 동작성 지능(p=.004)에서는 VV군이 M군보다 유의하게 높았으며 전체 지능(p=.004)에서는 VV군이 M군 및 AA군보다 유의하게 높았다. 3) K-CBCL의 하위 소척도 점수 비교에서는 신체증상 소척도 점수를 제외한 전 영역에서 VV군의 점수가 나머지 두 군보다 높았다. 특히 사회성 소척도(p=.041)에서는 VV군이 AA군보다 유의하게 높았으며 위축 소척도(p=.021)에서는 VV군이 AA군보다 유의하게 낮았다. 4) 시각 누락 오류, 시각 오경보 오류와 KEDI-WISC의 소검사 점수 간에는 유의한 상관관계가 존재하지 않았다. 한편 청각 누락 오류, 청각 오경보 오류와 KEDI-WISC의 소검사 점수 간에는 유의한 상관관계를 보이는 영역이 매우 많았다. 5) 시각 누락 오류, 시각 오경보 오류와 K-CBCL의 소검사 점수 간에는 시각 누락 오류와 사고의 문제 소척도(r=.205, p=.043) 간에만 유의한 상관관계가 존재하였다. 청각 누락 오류와는 사회성 소척도(r=-.319, p=.001), 사회적 미성숙 소척도(r=.206, p=.042), 사고의 문제 소척도(r=.235, p=.021) 간에 유의한 상관관계가 있었다. 청각 오경보 오류와는 사회성 소척도(r=-.241, p=.017) 및 주의집중문제 소척도(r=.235, p=.020) 간에 유의한 상관관계가 있었다. 결 론: 청각 주의력이 상대적으로 더 나은 ADHD 아동이 다른 아동에 비해 인지 기능이 더 좋고 정서 및 행동 문제가 적었다. 향후 시각 주의력과 청각 주의력에 차이를 보이는 ADHD 아동에 대해 보다 체계적인 연구가 필요할 것이다.

  • PDF

항공사진 입체시를 활용한 영상분석 시스템 개발에 관한 연구 (A Study on Image Analysis System construction Using Aerial photos)

  • 김감래;정해진;황보상원;조원우
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2006년도 춘계학술발표회 논문집
    • /
    • pp.171-176
    • /
    • 2006
  • 항공사진은 종중복도 60%이상, 횡중복도 30%이상 촬영되어지는 특성과 도화에 사용되는 입체시 원리를 이용하여 사진 자체를 화면상에 입체적으로 구현할 수 있다. 이러한 입체적 사용은 건물의 높이 및 정확한 현황을 파악하는 주된 분석방법론을 제시하고 있어 이러한 방법을 이용하여 시스템적으로 입체시하고 사람의 육안으로 쉽게 판독을 지원할 수 있는 시스템을 구축함으로서 대상지역에 대한 변화탐지, 시대별 및 지역별 변천과정, 무허가 건축물 판독 등 다양한 용도로 활용할 수 있다. 본 연구에서는 시스템 구현을 위해서 개발 언어로 Visual C++을 사용하였으며, 사용자가 직접 입체판독 및 분석을 수행할 수 있는 플랫폼을 구비함으로서 오류를 최소화 할 수 있도록 편광 모니터(Z-Screen)을 사용하여 시스템 개발을 수행하였다. 또한 개발환경은 Microsoft Window OS 환경 상에서 구동될 수 있도록 개발함으로서 시스템의 범용적 사용을 위한 기초 환경을 제공하도록 개발하였다.

  • PDF