• Title/Summary/Keyword: 정답 선택

Search Result 88, Processing Time 0.022 seconds

MCBMs in Northeast Asia: Can Effective and Functional Solutions be Found? (동북아 해양신뢰구축방안: 효과적 기능적 방안은 무엇인가?)

  • Yoon, Suk-Joon
    • Strategy21
    • /
    • s.32
    • /
    • pp.271-297
    • /
    • 2013
  • 2010년 초반 이래 지역 해양안보는 보다 개선된 신뢰증진을 위한 안보구도와 메커니즘을 요구하고 있다. 특히 2011년 이래 전문가들은 지역 내 어려운 해양안보 문제들을 주요 현안으로 식별하고 있으며, 아울러 다양한 다루기 힘든 개념 위주의 지역 해양신뢰구축방안들을 제시하고 있었다. 최근 동북아는 다양한 해양분쟁과 갈등으로 점철되고 있으며, 대부분 국가들은 더욱 위험한 상황을 선택하기에 주저하지 않는 위험한 현상을 보이고 있다. 이러한 문제들은 첫째, 기본적으로 기존의 개념적 목적의 해양신뢰구축방안 이행에 대한 실패, 둘째, 개념적 해양신뢰구축방안을 넘어선 기능적이며 실질적 해양신뢰구축으로 변화에 어려움 그리고 셋째, 이를 동북아에서 어떻게 적용30)해야 하는가" 하는 문제로 귀결되고 있다. 대체적으로 전문가들은 개념적 방안 보다 효과적이며 기능적 해양신뢰구축방안을 적용하고 이해하는 것이 바른 "정답"이라고 보고 있다. 따라서 본 논문에서는 기존의 개념적 논쟁에 빠졌던 개념적 해양신뢰구축방안에 대한 과거 미련을 버리고 점차 진화된 복합적 문제로 대두되는 동북아 해양에서의 해양분쟁과 갈등을 기능적이며 실질적 해양 신뢰구축방안에 의해 해결하는 방법을 식별하여 제시하고자 한다. 이에 본 논문에서 제시하는 기술적이며 제도적 해양신뢰구축방안이 인정되면, 지금까지의 작용-반작용의 악순환적 주기를 넘어설 수 있는효과적 해양신뢰 각론, 레짐 또는 거버런스가 될 수 있을 것이다. 궁극적으로 본 논문의 목적은 고질적이고 새로운 해양갈등을 해소할 수 있는 신뢰 구축 전략을 제시하여 지역 해양안전과 평화를 유지하는 것이다.

  • PDF

KFREB: Korean Fictional Retrieval-based Evaluation Benchmark for Generative Large Language Models (KFREB: 생성형 한국어 대규모 언어 모델의 검색 기반 생성 평가 데이터셋)

  • Jungseob Lee;Junyoung Son;Taemin Lee;Chanjun Park;Myunghoon Kang;Jeongbae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.9-13
    • /
    • 2023
  • 본 논문에서는 대규모 언어모델의 검색 기반 답변 생성능력을 평가하는 새로운 한국어 벤치마크, KFREB(Korean Fictional Retrieval Evaluation Benchmark)를 제안한다. KFREB는 모델이 사전학습 되지 않은 허구의 정보를 바탕으로 검색 기반 답변 생성 능력을 평가함으로써, 기존의 대규모 언어모델이 사전학습에서 보았던 사실을 반영하여 생성하는 답변이 실제 검색 기반 답변 시스템에서의 능력을 제대로 평가할 수 없다는 문제를 해결하고자 한다. 제안된 KFREB는 검색기반 대규모 언어모델의 실제 서비스 케이스를 고려하여 장문 문서, 두 개의 정답을 포함한 골드 문서, 한 개의 골드 문서와 유사 방해 문서 키워드 유무, 그리고 문서 간 상호 참조를 요구하는 상호참조 멀티홉 리즈닝 경우 등에 대한 평가 케이스를 제공하며, 이를 통해 대규모 언어모델의 적절한 선택과 실제 서비스 활용에 대한 인사이트를 제공할 수 있을 것이다.

  • PDF

A Web-based Evaluation System with Query Analysis. (문제분석을 이용한 웹 기반 평가시스템)

  • Heo, Eun-Ju;Han, Hyungoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.609-612
    • /
    • 2007
  • 정보사회와 컴퓨딩환경의 발전으로 언어, 학력, 인지도 등의 평가도구로서 컴퓨터기반의 평가환경이 보편화되었다. 특히 컴퓨터기반의 학력평가 환경을 위해서는 문항의 난이도와 변별도 등 문항의 특성을 정확히 분석하는 것이 필수적이다. 문항분석은 컴퓨터기반의 평가를 위한 양질의 문제은행 구성 및 문항과 수험자 능력의 정확한 추정과 체계적이고 과학적인 평가를 위한 전제조건이라 할 수 있다. 본 논문에서는 고전평가이론의 문제분석을 적용한 문제은행 시스템을 구현하였으며 수험결과를 분석하여 각 문제의 곤란도나 변별도, 문항분포도를 통하여 문제를 분석할 수 있도록 하였다. 또한 수험자가 각 문제를 푸는데 걸린 시간을 기록하여, 수험자의 문제에 이해도를 정확히 분석하고 수험자의 추측, 랜덤 선택 등으로 인한 정답을 맞힐 가능성과 한 문제를 읽고 이해하는 시간이 너무 오래걸린 이유에 대해서도 추정하였다. 문제분석 및 수험결과의 평가 및 분석으로 교사들은 문항의 양호도를 높일 수 있고 문제은행에 저장되어 있는 문항들을 수정하고 보완하여 양질의 문항을 출제할 수 있도록 하였다.

A Study on the Chinese National University Entrance Examination in Mathematics (중국의 대학입학 수학 시험 분석 연구)

  • Nam, Jin-Young;Joung, Youn-Joon
    • School Mathematics
    • /
    • v.13 no.1
    • /
    • pp.1-17
    • /
    • 2011
  • This study investigated the Chinese national university entrance examination (Gaokao) in mathematics administered in 2009 and 2010 to draw out some implications on the College Scholastic Ability Test (CSAT) in mathematics of Korea. To evaluate the attainments of basic mathematical skills and multilateral abilities required for further studies in university, the Gaokao mathematics is set in two forms(Art/Science), based on the Chinese national mathematics curriculum. The types of items in the Gaokao mathematics are multiple-choice, single-answer, and write-out-answer. The mathematical abilities that the Gaokao mathematics evaluates are mathematical reasoning, operation, geometrical imagination, application, and creativity. As a result, some implications on the Korean CSAT are drawn out in terms of the level of difficulty, the types of items, the arrangements, and the scores of items.

  • PDF

Daily Stock Price Prediction Using Fuzzy Model (퍼지 모델을 이용한 일별 주가 예측)

  • Hwang, Hee-Soo
    • The KIPS Transactions:PartB
    • /
    • v.15B no.6
    • /
    • pp.603-608
    • /
    • 2008
  • In this paper an approach to building fuzzy model to predict daily open, close, high, and low stock prices is presented. One of prior problems in building a stock prediction model is to select most effective indicators for the stock prediction. The problem is overcome by the selection of information used in the analysis of stick-chart as the input variables of our fuzzy model. The fuzzy rules have the premise and the consequent, in which they are composed of trapezoidal membership functions, and nonlinear equations, respectively. DE(Differential Evolution) searches optimal fuzzy rules through an evolutionary process. To evaluate the effectiveness of the proposed approach numerical example is considered. The fuzzy models to predict open, high, low, and close prices of KOSPI(KOrea composite Stock Price Index) on a daily basis are built, and their performances are demonstrated and compared with those of neural network.

Improvement of Knowledge Retriever Performance of Open-domain Knowledge-Grounded Korean Dialogue through BM25-based Hard Negative Knowledge Retrieval (BM25 기반 고난도 부정 지식 검색을 통한 오픈 도메인 지식 기반 한국어 대화의 지식 검색 모듈 성능 향상)

  • Seona Moon;San Kim;Saim Shin
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.125-130
    • /
    • 2022
  • 최근 자연어처리 연구로 지식 기반 대화에서 대화 내용에 자유로운 주제와 다양한 지식을 포함하는 연구가 활발히 이루어지고 있다. 지식 기반 대화는 대화 내용이 주어질 때 특정 지식 정보를 포함하여 이어질 응답을 생성한다. 이때 대화에 필요한 지식이 검색 가능하여 선택에 제약이 없는 오픈 도메인(Open-domain) 지식 기반 대화가 가능하도록 한다. 오픈 도메인 지식 기반 대화의 성능 향상을 위해서는 대화에 이어지는 자연스러운 답변을 연속적으로 생성하는 응답 생성 모델의 성능 뿐만 아니라, 내용에 어울리는 응답이 생성될 수 있도록 적합한 지식을 선택하는 지식 검색 모델의 성능 향상도 매우 중요하다. 본 논문에서는 오픈 도메인 지식 기반 한국어 대화에서 지식 검색 성능을 높이기 위해 밀집 벡터 기반 검색 방식과 주제어(Keyword) 기반의 검색 방식을 함께 사용하는 것을 제안하였다. 먼저 밀집 벡터 기반의 검색 모델을 학습하고 학습된 모델로부터 고난도 부정(Hard negative) 지식 후보를 생성하고 주제어 기반 검색 방식으로 고난도 부정 지식 후보를 생성하여 각각 밀집 벡터 기반의 검색 모델을 학습하였다. 성능을 측정하기 위해 전체 지식 중에서 하나의 지식을 검색했을 때 정답 지식인 경우를 계산하였고 고난도 부정 지식 후보로 학습한 주제어 기반 검색 모델의 성능이 6.175%로 가장 높은 것을 확인하였다.

  • PDF

The Compositions and the Characteristics of the Chinese National Test for University Admissions, and the Analysis on Items Concerning Chemistry (중국 대학입학시험의 구성 및 특징과 화학 문항 분석)

  • Kim, Hyun-Kyung
    • Journal of The Korean Association For Science Education
    • /
    • v.31 no.8
    • /
    • pp.1158-1174
    • /
    • 2011
  • In this study, we examined the compositions, basic principles, and the area of the National Higher Education Entrance Examination (GaoKao) in 2009, we also analyzed the categories and characteristics of items. Also, the GaoKao was analyzed in terms of test specifications, the number of items, item patterns, difficulty levels, and implications of the College Scholastic Ability Test(CSAT) were explored. Results show Natural Science section of the National Test 1, 2 are 300 points per 150 min, and Natural Science, and Chemistry of Shanghai is 150 points each per 120 min. Also, the GaoKao contained multiple choice and fill in the blanks questions, and the description items are composed of experiments of various types. The GaoKao Natural Science section is composed of physics, chemistry, biology but not earth science, which is different from the CSAT. GaoKao requires basic understanding or the observation ability to reasoning, the complex thinking ability, especially emphasized on the experiment ability. The range of possible questions is in the examination outline, not the curriculum, and the ratio of questions from the University level is high. In the analysis of the behavioral domain, the ratios of the understanding and application items is higher than the CSAT, and inquiry items is lower, but the inquiry items are deeper. In case of the ratio of the expected correct answer, National Test 1 and National Test 2 is similar, but the difficult items or about 20~39% of the test is 4~5 times to that of the CSAT, making the GaoKao very difficult. The peculiar characteristics of GaoKao is the emphasis on the experiment, and even though the practical items is of lower ratio, they are very useful in life.

An Analysis of Paper and Pencil Test Items of Life Science I in High School (고등학교 생명 과학 I의 지필평가 문항 분석)

  • Lee, Donghoon;Jeong, Eunyoung
    • Journal of Science Education
    • /
    • v.38 no.3
    • /
    • pp.670-690
    • /
    • 2014
  • The purpose of this study was to analyze paper and pencil test items of life science I in high school to diagnose problems of the test items developed by teachers, and to provide some implication for better assessment. 690 selection-type items and 162 supply-type items in life science I were collected from 10 general high schools. In the analysis of test items, the ratio of the selection-type item and the supply-type item was 81:19 in the number of items based on item type, while the ratio was 74.4:25.6 in the distribution of marks, indicating that the distribution of marks compared to the number of items was higher in the supply-type items. In the analysis by the Bloom's revised taxonomy of educational objectives, the items of 'conceptual knowledge' in the knowledge and those of 'understanding' in the cognition process were shown most in both the selection-type item and the supply-type item. In the analysis by the science assessment frameworks of NAEA, the items of 'knowledge' were shown 9 times more than those of 'inquiry'. When compared to the level of difficulty presented in the two-way specification table and the percentage of correct answers in the selection-type item, the concurrence was 41.5%. When compared to the ratio of number of items based on the item type of the supply-type items, the short-answer items were 34.0%, the descriptive items were 61.1%, and the drawing items were 4.9%. The drawing items were mainly developed in the unit of 'Cells and Continuity of Life'. When the descriptive items were classified by the acceptance of response, all the items were 'response restricted' type, and the items of 'restricted in content range' type among them were highest. When the items were classified by presentation of data, the items of 'presentation of data' type were highest(65.4%), and when classified by type of question, the items of 'knowledge description' type were highest(80.4%). In conclusion, it is needed to develop items belonging to 'inquiry' area more in the school, and to increase the ratio of the descriptive items, presenting various types of items.

  • PDF

A perceptual study of the wh-island constraint in Seoul Korean (서울말의 wh-섬 제약 지각 연구)

  • Yun, Weonhee
    • Phonetics and Speech Sciences
    • /
    • v.13 no.2
    • /
    • pp.27-35
    • /
    • 2021
  • This study investigated the status of the wh-island constraint in Seoul Korean. The syntactic movement of a wh-phrase out of an embedded sentence so as to have wide scope at LF is known to be invalid as it violates the wh-island constraint, but there have been studies in which such a movement was possible when the sentence is read with a wh-intonation. We conducted perceptual tests in which subjects were asked to select an answer after listening to each of the four types of interrogative sentences. Three of them were with 'Nugu-leul', which is an accusative form of the wh-phrase 'who' as well as an indefinite form. The fourth sentence contained the name of a person. 'Nugu-leul' and the noun were positioned in the same embedded sentence to see whether the subjects accepted a matrix scope interpretation of the wh-phrases. Response time was transformed to normalized log response time and checked to find any differences in the time taken to select the answers depending on different types of interrogative sentences. The results showed the subjects had a definite preference for the matrix scope interpretation for the sentences with a wh-intonation. The response time required to select the matrix scope interpretation was longer than for any other type of interrogative sentence. We concluded that the wh-island constraint in Seoul Korean is weak.

A Computerized Testing system that Reduces Backward Reasoning in Multiple-choice Items (선다형 문항에서 역행추리를 줄이는 컴퓨터화 검사 방식)

  • Park, Joo-Yong
    • Korean Journal of Cognitive Science
    • /
    • v.20 no.3
    • /
    • pp.275-289
    • /
    • 2009
  • A new computerized testing system, called the Computerized Multiple-choice Testing (CMMT) system, was introduced. In this system, questions of multiple choice (MC) items are presented first without options, so that students must generate answers for themselves. They can click for the options when they are ready, and can respond within a brief, specified time period. The present study was performed to examine whether this system is effective in reducing backward reasoning, I. e., using the options of MC items as cues to find the correct answer. One hundred and seventy-seven 6th grade students (12 year olds) were divided into two groups so that mean scores from a prior test were equal: The experimental group took an intervening computerized test in the new format, and the control group in the MC format. Five days after the computerized intervening test, a short answer paper-and-pencil final test was given. Testing effect was greater in the new system than in the MC system. Analysis of the final test response in relation to the intervening test response showed that i) the students retained the correct answer in the new system more than in the MC testing system, and that ii) students corrected their previous failures in the intervening CMMT format more than those in the MC format. These results suggest that the new system is effective in reducing backward reasoning.

  • PDF