• 제목/요약/키워드: Korean Language Model

검색결과 1,570건 처리시간 0.029초

가전 기기를 위한 HIML(Human Interaction Markup Language)에 기반한 사용자 인터페이스 변환 모델에 관한 연구 (A study on user interface converter model base on HIML(Human Interaction Markup Language) for household appliances)

  • 박병철;김건희;손민우;신동규;신동일;김강
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.535-537
    • /
    • 2004
  • 오늘날 유비쿼터스 컴퓨팅 기술, 홈 네트워크, 스마트 홈 등의 연구 개발로 여러 기기들과 컴퓨터가 연동한다. 이에 따라, 다양한 기기에 맞춰 여러 가지 사용자 인터페이스가 필요하며 이를 위해 사용자 인터페이스를 여러 번 개발해야 하는 비효율적인 일이 빈번하다. 또한, 개발자에게 있어서 여러 기기에 사용되는 서로 다른 언어를 모두 익히고 개발하는 것 역시 많은 부담을 준다. 이러한 문제를 해결하기 위해 UIML(User Interlace Markup Language)이란 마크업 언어가 제시되었다. 그러나 UIML도 여러 언어로의 변환을 위해 각각의 다른 변환 모듈을 이용해야 하는 번거로움이 있다. 본 연구에서는 다중 기기로의 사용자 인터페이스 변환과 상황인식이 가능한 마크업 언어인 HIML(Human Interaction Markup Language)을 제안하고 통합된 사용자 인터페이스 변환의 모델을 스마트 홈 환경에 적용해 보았다.

  • PDF

한국어 뉴스 헤드라인의 토픽 분류에 대한 실증적 연구 (An Empirical Study of Topic Classification for Korean Newspaper Headlines)

  • 박제윤;김민규;오예림;이상원;민지웅;오영대
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.287-292
    • /
    • 2021
  • 좋은 자연어 이해 시스템은 인간과 같이 텍스트에서 단순히 단어나 문장의 형태를 인식하는 것 뿐만 아니라 실제로 그 글이 의미하는 바를 정확하게 추론할 수 있어야 한다. 이 논문에서 우리는 뉴스 헤드라인으로 뉴스의 토픽을 분류하는 open benchmark인 KLUE(Korean Language Understanding Evaluation)에 대하여 기존에 비교 실험이 진행되지 않은 시중에 공개된 다양한 한국어 라지스케일 모델들의 성능을 비교하고 결과에 대한 원인을 실증적으로 분석하려고 한다. KoBERT, KoBART, KoELECTRA, 그리고 KcELECTRA 총 네가지 베이스라인 모델들을 주어진 뉴스 헤드라인을 일곱가지 클래스로 분류하는 KLUE-TC benchmark에 대해 실험한 결과 KoBERT가 86.7 accuracy로 가장 좋은 성능을 보여주었다.

  • PDF

학습장애의 신경생물학적 기전 : 읽기장애를 중심으로 (Neurobiological basis for learning disorders with a special emphasis on reading disorders)

  • 정희정
    • Clinical and Experimental Pediatrics
    • /
    • 제49권4호
    • /
    • pp.341-353
    • /
    • 2006
  • Learning disorders are diagnosed when the individual's achievement on standardized tests in reading, mathematics, or written expression is substantially below that expected for age, schooling, and level of intelligence. Subtypes of learning disorders may be classified into two groups, language-based type learning disorders including reading and writing disorder, and nonverbal type learning disorder (NLD) such as those relating to mathematics & visuospatial skills, and those in the autism spectrum. Converging evidence indicates that reading disorder represents a disorder within the language system and more specifically within a particular subcomponent of that system, phonological processing. Recent advances in neuroimaging technology, particularly the development of fMRI, provide evidences of a neurobiological basis for reading disorder, specifically a disruption of two left hemisphere posterior brain systems, one parieto-temporal, the other occipito-temporal. The former is the reading system for beginner reading, the latter for skilled reading. Compensatory engagement of anterior systems around the inferior frontal gyrus(Broca's area) and a posterior(right occipito-temporal) system is noted in persistent poor readers in long-term follow up study. The theoretical model proposed to explain NLD's source is not right hemisphere damage, but rather the white matter model. The working hypothesis of the white matter model is that the underdevelopment of, damage to, or dysfunction of cerebral white matter(long myelinated fibers) is the source of this disorder. The role of an evidence-based effective intervention in the remediation of children with learning disorder is discussed.

통계 언어모델 기반 객관식 빈칸 채우기 문제 생성 (Automatic Generation of Multiple-Choice Questions Based on Statistical Language Model)

  • 박영기
    • 정보교육학회논문지
    • /
    • 제20권2호
    • /
    • pp.197-206
    • /
    • 2016
  • 빈칸 채우기 문제는 학생들이 학습 내용을 제대로 이해했는지 확인하기 위해 널리 사용되어 왔다. 이런 유형의 문제를 컴퓨터 알고리즘에 의해 자동으로 생성하는 많은 방법들이 제안되어 왔지만, 대부분 어떤 부분을 빈칸으로 만들면 좋을지에 대해 집중했기 때문에 적절한 보기를 자동으로 생성하는 연구는 미흡했다. 본 논문에서는 빈칸이 주어졌다고 가정하고, 이에 어울리는 보기를 자동 생성하는 알고리즘을 제안한다. 본 알고리즘은 통계 언어 모델에 기반하여 보기를 생성하기 때문에, 사람이 생성하는 경우보다 출제자에 편향되지 않은 보기를 제공할 수 있다. 또, 확률값에 기반하여 난이도를 자동으로 조절하는 것이 가능하기 때문에, 직접 사람이 문제를 만드는 것에 비해 상당한 비용 절감 효과가 있다. TEPS 문법, 어휘 시험에 대해 적용하여 실험한 결과, 사람과 유사한 결과를 생성함을 확인하였다. 향후 스마트 교육 분야에서 높은 활용도를 보일 것으로 기대한다.

회귀 분석 모델을 이용한 고리 1호기 해체 비용 추정 (Decommissioning Cost Estimation of Kori Unit 1 Using a Multi-Regression Analysis Model)

  • 주한영;김재욱;정소윤;문주현
    • 방사성폐기물학회지
    • /
    • 제18권2_spc호
    • /
    • pp.247-260
    • /
    • 2020
  • 본 논문에서는 고리 1호기 해체 비용 추정을 위해 외국 원자력발전소 해체 비용 데이터를 현가화한 후 원자력발전소 해체 비용 추정 회귀 분석모델을 개발하였다. 이 모델 개발에 사용된 데이터는 해체 또는 진행 중인 BWR 13기, PWR 16기의 해체 비용 데이터이다. 회귀 분석모델 도출을 위해, 해체 비용을 종속변수로 정하고, 해체 원전의 운전 특성을 반영할 수 있게 고안된 Contamination factor와 해체 기간을 독립변수로 선정하였다. 빅데이터 분석 도구인 R language의 통계패키지를 이용하여 회귀 분석모델을 도출하였다. 이 회귀 분석 모델을 적용하여 고리 1호기 해체 비용을 예측한 결과, 미화 663.40~928.32백만 달러, 한화 약 7,828.12억~1조 954.18억 원이 소요될 것으로 예측되었다.

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition using the Transformed Successive State Splitting and Demi-syllable pair)

  • 김동옥;박노진
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1625-1631
    • /
    • 2005
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, FSN 노드를 두음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 연한 오 인식을 줄이기 위해 인식단위를 반음절쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징레벨에서 K-means 알고리즘(4)으로 클러스터링 하여 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문백종속 음소모델에서 $10.5\%$, 음향모델에서 인식단위를 반음절쌍으로 하였을 경우 문백종속 음소모델에 비해 $12.5\%$, 변형된 연쇄 상태분할을 하였을 경우 $1.5\%$의 인식률을 향상시킬 수 있었다.

병렬 객체지향 시스템의 검증 (Model Checking of Concurrent Object-Oriented Systems)

  • 조승모;김영곤;배두환;변성원;김상택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.1-12
    • /
    • 2000
  • 모델체킹은 검증하려는 대상 시스템의 동작 모델이, 그 시스템이 만족해야 할 성질을 만족시키는지를, 시스템의 상태공간을 검사해 봄으로써 알아보는 정형 검증 기법의 하나이다. 이러한 모델체킹 기법을 병렬 객체지향 시스템에 적용하기 위해 기존의 모델체커인 SPIN에서 지원하는 모델링 언어인 Promela를 병렬객체지향 개념을 추가하여 확장한 언어인 APromela를 제안하였다. 이는 Promela가 프로세스를 단위로 하는 병렬성만을 지원하는데 반해, 액터 모델에 기반한 객체지향 병렬성을 지원한다. 또한 우리는 이 언어로 작성된 모델을 자동으로 Promela로 변환하는 규칙을 제안하였다. 이를 통해, 기존의 모델체커를 이용해 병렬 객체지향 시스템의 검증을 수행할 수 있다. 이 언어의 응용으로 UML 로 기술된 명세의 검증을 수행하는 과정을 제시하였다.

  • PDF

종합병원 간호사의 문화적 역량수준과 영향요인 (A Study on Factors Affecting Cultural Competency of General Hospital Nurses)

  • 채덕희;박윤희;강경화;이태화
    • 간호행정학회지
    • /
    • 제18권1호
    • /
    • pp.76-86
    • /
    • 2012
  • Purpose: As Korea has been rapidly transformed to be a multicultural society, it becomes essential for nurses to develop cultural competency. The purpose of this descriptive study was to assess the cultural competency level of general hospital nurses and to examine its contributing factors adopting ecological model. Method: A convenience sample of 327 nurses from six general hospitals in Seoul metropolitan area was recruited between November 14 to 28, 2011. Cultural competency was measured using the Korean version of the Caffrey Cultural Competence in Healthcare Scale (CCCHS) and Cultural Competence Assessment(CCA). Hierarchical multiple regression analysis was performed to assess the influence of intrapersonal, cultural-experience, and organizational factors on cultural competency. Results: Mean cultural competency in this study was 2.57(${\pm}0.43$). Cultural competency was associated with job position (p=.044) at the intrapersonal level. At the cultural experience level, foreign language classes experience (p=.005), fluency in a foreign language (p=.000), experience of working with foreign health care professionals (p=.000) were associated cultural competency. At the organizational level, training program (p=.000), job description (p=.002), health education materials (p=.016), insufficient job control (p=.000), and interpersonal conflicts (p=.011) showed significant difference. Foreign language class experience, foreign language fluency, experience of working with foreign health care professionals, and job control were the most consistent predictors of cultural competence and explained 20.4% of the total variance in the proposed ecological model. Conclusions: The findings suggest that to enhance cultural competency in general hospital nurses, cultural experience and organizational factors need to be more fully considered than intrapersonal factors.

Korean Broadcast News Transcription Using Morpheme-based Recognition Units

  • Kwon, Oh-Wook;Alex Waibel
    • The Journal of the Acoustical Society of Korea
    • /
    • 제21권1E호
    • /
    • pp.3-11
    • /
    • 2002
  • Broadcast news transcription is one of the hardest tasks in speech recognition because broadcast speech signals have much variability in speech quality, channel and background conditions. We developed a Korean broadcast news speech recognizer. We used a morpheme-based dictionary and a language model to reduce the out-of·vocabulary (OOV) rate. We concatenated the original morpheme pairs of short length or high frequency in order to reduce insertion and deletion errors due to short morphemes. We used a lexicon with multiple pronunciations to reflect inter-morpheme pronunciation variations without severe modification of the search tree. By using the merged morpheme as recognition units, we achieved the OOV rate of 1.7% comparable to European languages with 64k vocabulary. We implemented a hidden Markov model-based recognizer with vocal tract length normalization and online speaker adaptation by maximum likelihood linear regression. Experimental results showed that the recognizer yielded 21.8% morpheme error rate for anchor speech and 31.6% for mostly noisy reporter speech.

탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰 (The Pragmatics of Automatic Query Expansion Based on Search Results of Natural Language Queries)

  • 노정순
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.49-80
    • /
    • 1999
  • 본 연구는 자연어 비불리언 탐색에서 탐색결과에 근거하여 질의를 수정, 확장, 결합하여 검색효과를 향상시키는 시스템들을 개념모델별로 성능을 고찰하고, 성능에 영향을 끼치는 요소들을 분석하여, 이론적인 개념의 틀을 제시하였다. 용어의 가중치기법, 문헌의 순위화방법, 용어선정알고리즘, 질의확장에 사용된 문헌수와 용어수, 적합성판정정보의 출처 및 척도, 배움표본의 크기, 부적합문헌정보의 사용여부, 용어확장방법, 질의의 크기, DB의 종류와 크기 등에 의해 영향을 받는 것으로 분석되었다.

  • PDF