• 제목/요약/키워드: Language Resources

검색결과 427건 처리시간 0.024초

중등 1급 정교사(영어) 자격연수 프로그램 분석: 대전, 서울, 인천, 강원, 경기, 충남, 충북을 중심으로 (The analysis of the in-service training program for the 1st grade English teacher in a secondary school)

  • 김용오;강용구;강문구
    • 영어어문교육
    • /
    • 제13권3호
    • /
    • pp.203-226
    • /
    • 2007
  • This paper analyzes the in-service training program for the 1st grade English teacher in the following 7 regions: Taejeon, Seoul, Incheon, Kangwon, Kyeonggi, Chungnam and Chungbuk. It also investigates the actual conditions of the program. The analyses are performed on three categories of subjects: Teaching Profession, Refinement and English Education. The English Education category can be divided into the three aspects: language skills, communicative skills and language learning/teaching skills. Among the 7 regions, subjects under Teaching Profession, Refinement and English Education have a significant (2-3 times +/-) variance in terms of the number and credit hours of the courses. While the Refinement Program is above the standard set by Ministry of Education & Human Resources Development(MEHRD) in some regions, the Teaching Profession Program and the English Education Program is below the standard set by MEHRD in other regions. To overcome the weaknesses of the program, this paper suggests the following: 1) prescriptions for the proportion ratio of each category should be suitably modified. 2) MEHRD should observe and supervise the program of each region. 3) being organized, the program must have two parts as follows: the same mandatory subjects for all regions and optional subjects suited to each region.

  • PDF

최대 엔트로피 부스팅 모델을 이용한 영어 전치사구 접속과 품사 결정 모호성 해소 ((Resolving Prepositional Phrase Attachment and POS Tagging Ambiguities using a Maximum Entropy Boosting Model))

  • 박성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권5_6호
    • /
    • pp.570-578
    • /
    • 2003
  • 최대 엔트로피 모델은 자연언어를 모델링하기 위한 좋은 방법이다. 하지만, 최대 엔트로피 모델을 전치사구 접속과 같은 실제 언어 문제에 적용할 때, 자질 선택과 계산 복잡도의 두 가지 문제가 발생한다. 본 논문에서는, 이런 문제와 자연언어 자원에 존재하는 불균형 데이터 문제를 해결하기 위한 최대 엔트로피 부스팅 모델(maximum entropy boosting model)을 제시하고, 이를 영어의 전치사구 접속과 품사 결정 모호성 해소에 적용한다. Wall Street Journal 말뭉치에 대한 실험 결과, 문제의 모델링에 아주 작은 노력을 들였음에도 불구하고, 전치사구 접속 문제에 대해 84.3%의 정확도와 품사 결정 문제에 대해 96.78%의 정확도를 보여 지금까지 알려진 최고의 성능과 비슷한 결과를 보였다.

단어 의미 정보를 활용하는 이용자 자연어 질의 유형의 효율적 분류 (Efficient Classification of User's Natural Language Question Types using Word Semantic Information)

  • 윤성희;백선욱
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.251-263
    • /
    • 2004
  • 질의응답 시스템에서의 질의 분석 과정은 이용자의 자연어 질의 문장에서 질의 의도를 파악하여 그 유형을 분류하고 정답 추출을 위한 정보를 구하는 것이다. 본 연구에서는 복잡한 분류 규칙 집합이나 대용량의 언어 지식 자원 대신 이용자 질의 문장에서 질의 초점 어휘를 추출하고 구문 구조적으로 관련된 단어들의 의미 정보에 기반하여 효율적으로 질의 유형을 분류하는 방법을 제안한다. 질의 초점 어휘가 생략된 경우의 처리와 동의어와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법도 제안한다.

유로워드넷 방식에 기반한 한국어와 영어의 명사 상하위어 정렬 (Alignment of Hypernym-Hyponym Noun Pairs between Korean and English, Based on the EuroWordNet Approach)

  • 김동성
    • 한국언어정보학회지:언어와정보
    • /
    • 제12권1호
    • /
    • pp.27-65
    • /
    • 2008
  • This paper presents a set of methodologies for aligning hypernym-hyponym noun pairs between Korean and English, based on the EuroWordNet approach. Following the methods conducted in EuroWordNet, our approach makes extensive use of WordNet in four steps of the building process: 1) Monolingual dictionaries have been used to extract proper hypernym-hyponym noun pairs, 2) bilingual dictionary has converted the extracted pairs, 3) Word Net has been used as a backbone of alignment criteria, and 4) WordNet has been used to select the most similar pair among the candidates. The importance of this study lies not only on enriching semantic links between two languages, but also on integrating lexical resources based on a language specific and dependent structure. Our approaches are aimed at building an accurate and detailed lexical resource with proper measures rather than at fast development of generic one using NLP technique.

  • PDF

An Ontology-based Knowledge Management System - Integrated System of Web Information Extraction and Structuring Knowledge -

  • Mima, Hideki;Matsushima, Katsumori
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2005년도 e-Biz World Conference 2005
    • /
    • pp.55-61
    • /
    • 2005
  • We will introduce a new web-based knowledge management system in progress, in which XML-based web information extraction and our structuring knowledge technologies are combined using ontology-based natural language processing. Our aim is to provide efficient access to heterogeneous information on the web, enabling users to use a wide range of textual and non textual resources, such as newspapers and databases, effortlessly to accelerate knowledge acquisition from such knowledge sources. In order to achieve the efficient knowledge management, we propose at first an XML-based Web information extraction which contains a sophisticated control language to extract data from Web pages. With using standard XML Technologies in the system, our approach can make extracting information easy because of a) detaching rules from processing, b) restricting target for processing, c) Interactive operations for developing extracting rules. Then we propose a structuring knowledge system which includes, 1) automatic term recognition, 2) domain oriented automatic term clustering, 3) similarity-based document retrieval, 4) real-time document clustering, and 5) visualization. The system supports integrating different types of databases (textual and non textual) and retrieving different types of information simultaneously. Through further explanation to the specification and the implementation technique of the system, we will demonstrate how the system can accelerate knowledge acquisition on the Web even for novice users of the field.

  • PDF

이질적인 언어 자원의 순차적 매칭을 이용한 문장 유사도 계산 기반의 위키피디아 한국어-영어 병렬 문장 추출 방법 (Extracting Korean-English Parallel Sentences based on Measure of Sentences Similarity Using Sequential Matching of Heterogeneous Language Resources)

  • 천주룡;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.127-132
    • /
    • 2014
  • 본 논문은 위키피디아로부터 한국어-영어 간 병렬 문장을 추출하기 위해 이질적 언어 자원의 순차적 매칭을 적용한 유사도 계산 방법을 제안한다. 선행 연구에서는 병렬 문장 추출을 위해 언어 자원별로 유사도를 계산하여 선형 결합하였고, 토픽모델을 이용해 추정한 단어의 토픽 분포를 유사도 계산에 추가로 이용함으로써 병렬 문장 추출 성능을 향상시켰다. 하지만, 이는 언어 자원들이 독립적으로 사용되어 각 언어자원이 가지는 오류가 문장 간 유사도 계산에 반영되는 문제와 관련이 적은 단어 간의 분포가 유사도 계산에 반영되는 문제가 있다. 본 논문에서는 이질적인 언어 자원들을 이용해 순차적으로 단어를 매칭함으로써 언어 자원들의 독립적인 사용으로 각 자원의 오류가 유사도에 반영되는 문제를 해결하였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용함으로써 관련이 적은 단어의 분포가 반영되는 문제를 해결하였다. 실험을 통해, 언어 자원들을 이용해 순차적으로 매칭한 유사도 계산 방법은 선행 연구에 비해 F1-score 48.4%에서 51.3%로 향상된 성능을 보였고, 관련이 높은 단어의 분포만을 유사도 계산에 이용한 방법은 약 10%에서 34.1%로 향상된 성능을 얻었다. 마지막으로, 제안한 유사도 방법들을 결합함으로써 선행연구의 51.6%에서 2.7%가 향상된 54.3%의 성능을 얻었다.

  • PDF

웹 온톨로지 구축을 위한 OWL 저작 시스템 (OWL Authoring System for building Web Ontology)

  • 이무훈;조현규;조현성;조성훈;장창복;최의인
    • 한국전자거래학회지
    • /
    • 제10권3호
    • /
    • pp.21-36
    • /
    • 2005
  • 현재의 웹 검색은 단순히 키워드매칭만을 통해 필요한 정보들을 검색하기 때문에 그 결과가 사용자가 원하는 정보와는 의미적으로 상이한 결과들을 많이 포함하고 있다. 사용자가 원하는 정보와 의미적으로 정확히 일치하는 정보들을 추출하기 위해서는 웹 자원에 대한 정확한 의미 부여와 웹 자원들 사이의 의미적 연관성을 기술할 수 있는 지식 표현 수단인 온톨로지가 필요하다. 웹 기술표준화 단체인 W3C에서는 이와 같은 웹 자원에 대한 의미 표현 기술로 OWL(Web Ontology Language)이라는 웹 온톨로지 언어를 발표하였으나 아직 이를 효과적으로 저작, 편집할 수 있는 전용 도구의 개발은 아직 미비한 실정이다. 따라서 본 논문은 OWL의 생성 및 편집을 효과적으로 제공할 수 있는 저작 시스템을 설계하고 구현하였다.

  • PDF

외국인 유학생의 조 발표 평가를 위한 구인 개발 연구 -내용 초점의 발표를 중심으로- (A Research of the Construct Development for Evaluating Team Presentations Performed by Undergraduate International Students in Korea: Focused on the Presentation of Contents)

  • 김지애;심지연
    • 한국어교육
    • /
    • 제29권4호
    • /
    • pp.1-29
    • /
    • 2018
  • This study aims to develop the constructs for evaluating team presentations performed by undergraduate international students in Korea. To achieve the goal, this study reviews related research and sets the criteria to analyze the problems of team presentations performed in Korean by undergraduate international students. Through this analysis we got to know which problems they were making. They were failing to reorganize the resources they had referenced and to organize the contents into one. And errors or mistakes of grammar and spelling were found often in their PPT files, and the editing styles of the PPTs were not consistent. Moreover, their performances were not unlike their PPT files. One made a good presentation but the other students just recited the script without interaction with the audience. Moreover, they could not operate the Q&A part and lead the discussion well, and components for wrapping up the presentation also were omitted frequently. After the analysis, this study conducted a survey with 23 Korean language educators asking about the validity of the construct and description of the survey. Based on the collected feedback, the construct list has been modified primarily, and carried out a second survey with an expert group. Based on their opinion, the final construct list was fine-tuned.

EPS-TOPIK 시행 현황 및 관계자 요구 분석 (Enforcement Status of EPS-TOPIK and Needs Analysis of EPS Centers)

  • 정호진
    • 비교문화연구
    • /
    • 제31권
    • /
    • pp.395-414
    • /
    • 2013
  • EPS-TOPIK is a test of Korean proficiency which is enforced at the level of Korean government for the selection of competent foreign workers. Therefore, it must ensure validity and reliability, and practicability as a language assessment tool. For seeking a way of developing EPS-TOPIK, in this paper, the current state of EPS-TOPIK was investigated based upon the materials published by the Korean government, and the questions of EPS-TOPIK were analysed. Together with this, newspaper articles both in Korea and in foreign countries were also analyzed, and the directors of the EPS center abroad were interviewed. According to the survey results, as expected, the local environment of Korean education is poor in a number of ways to improve the Korean communication skills of foreign workers, as well as to prepare the EPS-TOPIK. To improve the efficiency of the EPS-TOPIK and to enhance the Korean communication skills of foreign workers, the Korean language institutions including the King Sejong Institute, which are in charge of the Korean language education should closely cooperate with the Human Resources Development Service of Korea, which is responsible for all of the influx of foreign workers.

Sentiment Analysis of COVID-19 Tweets: Impact of Pre-processing Step

  • Ayadi, Rami;Shahin, Osama R.;Ghorbel, Osama;Alanazi, Rayan;Saidi, Anouar
    • International Journal of Computer Science & Network Security
    • /
    • 제21권3호
    • /
    • pp.206-211
    • /
    • 2021
  • Internet users are increasingly invited to express their opinions on various subjects in social networks, e-commerce sites, news sites, forums, etc. Much of this information, which describes feelings, becomes the subject of study in several areas of research such as: "Sensing opinions and analyzing feelings". It is the process of identifying the polarity of the feelings held in the opinions found in the interactions of Internet users on the web and classifying them as positive, negative, or neutral. In this article, we suggest the implementation of a sentiment analysis tool that has the role of detecting the polarity of opinions from people about COVID-19 extracted from social media (tweeter) in the Arabic language and to know the impact of the pre-processing phase on the opinions classification. The results show gaps in this area of research, first of all, the lack of resources when collecting data. Second, Arabic language is more complexes in pre-processing step, especially the dialects in the pre-treatment phase. But ultimately the results obtained are promising.