• 제목/요약/키워드: Learning information

검색결과 13,827건 처리시간 0.05초

분류 및 회귀문제에서의 분류 성능과 정확도를 동시에 향상시키기 위한 새로운 바이어스 스케줄링 방법 (A New Bias Scheduling Method for Improving Both Classification Performance and Precision on the Classification and Regression Problems)

  • 김은미;박성미;김광희;이배호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1021-1028
    • /
    • 2005
  • 분류 및 회계문제에서의 일반적인 해법은, 현실 세계에서 얻은 정보를 행렬로 사상하거나, 이진정보로 변형하는 등 주어진 데이타의 가공과 이를 이용한 학습에서 찾을 수 있다. 본 논문은 현실세계에 존재하는 순수한 데이타를 근원공간이라 칭하며, 근원 데이타가 커널에 의해 사상된 행렬을 이원공간이라 한다. 근원공간 혹은 이원공간에서의 분류문제는 그 역이 존재하는 문제 즉, 완전해가 존재하는 문제와, 그 역이 존재하지 않거나, 역의 원소 값들이 무한히 커지는 불량조건 흑은 특이조건인 두 가지 형태로 존재한다. 특히, 실제 문제에 있어서 완전 해를 가진 문제이기 보다는 후자에 가까운 형태로 나타나게 된다. 결론적으로 근원데이타나 이원데이타를 이용한 문제를 해결하기 위해서는 많은 경우에 완전 해를 갖는 문제로 변형시키는 정규화과정이 필요하다. 본 논문에서는 이러한 정규화 인수를 찾는 문제를 기존의 GCV, L-Curve, 그리고 이원공간에서의 데이타를 RBF 신경회로망에 적용시킨 커널 학습법에 대한 각각의 성능을 비교실험을 통해 고찰한다. GCV와 L-Curve는 정규화 인수를 찾는 대표적인 방법으로 두 방법 모두 성능면에서 동등하며 문제의 조건에 따라 다소 차이를 보인다. 그러나 이러한 두 방법은 문제해를 구하기 위해서는 정규화 인수를 구한후 문제를 재정의하는 이원적인 문제해결이라는 취약점을 갖는다. 반면, RBF 신경회로망을 이용한 방법은 정규화 인수와 해를 동시에 학습하는 단일화된 방법이 된다. 이때 커널을 이용한 학습법의 성능을 향상하기 위해, 전체학습과 성능의 제한적 비례관계라는 설정아래, 각각의 학습에 따라 능동적으로 변화하는 동적모멘텀의 도입을 제안한다. 동적모멘트는 바이어스 학습을 포함한 방법과 포함하지 않은 방법에 각각 적용분석하였다. 끝으로 제안된 동적모멘텀이 분류문제의 표준인 Iris 데이터, Singular 시스템의 대표적 모델인 가우시안 데이타, 그리고 마지막으로 1차원 이미지 복구문제인 Shaw데이타를 이용한 각각의 실험에서 분류문제와 회계문제 양쪽 모두에 있어 기존의 GCV, L-Curve와 동등하거나 우수한 성능이 있음을 보인다.

KoFlux 역정: 배경, 현황 및 향방 (KoFlux's Progress: Background, Status and Direction)

  • 권효정;김준
    • 한국농림기상학회지
    • /
    • 제12권4호
    • /
    • pp.241-263
    • /
    • 2010
  • KoFlux는 한국의 주요 육상생태계와 대기간의 에너지, 물, 이산화탄소의 순환을 감시하기 위해 구축한 에디 공분산 기술을 기반으로 하는 미기상학 플럭스 타워 관측지의 국내 관측망이다. KoFlux의 사명은 AsiaFlux와 동일하게 지구상의 생명의 질과 지속가능성을 보장하기 위해 아시아의 주요 생태계를 감시하고 돌보는 것이다. 구체적인 KoFlux의 목적은 (1) 생태계를 감시하고, 자료를 수집, 저장하고 배포를 가능하게 하는 하부구조와 (2) 이에 관련된 지식과 자료를 효과적으로 적용하고 배포하기 위해 정기적으로 포럼과 단기 훈련과정을 과학공동체에 제공하는 것이다. KoFlux는 아시아의 주요 육상생태계의 탄소/물/에너지 교환에 관한 생태계과학 정보와 지식을 창출하고, 과학적 연구와 적용에 있어서 다학문간 협력과 융합을 촉진하고, 지속적인 생태계 서비스를 지역사회에 제공함으로써 AsiaFlux의 비전인 "사고하는 공동체, 배움의 프런티어"를 추구하며 실천해 나간다. 현재 KoFlux 네트워크는 총 일곱 개의 관측지로 구성되어 있는데 국내의 경우 활엽수림, 침엽수림, 혼효림, 논과 비균질 농경지를 포함하며, 국외의 경우 남극과 북극의 툰드라 생태계에 위치해 있다. 등재된 관측지는 모두 표준화된 프로토콜을 사용하여 자료를 체계적으로 처리하고 있으며 자유롭게 자료 활용이 가능하도록 품질 검증된 플럭스 자료의 데이터베이스를 지속적으로 구축해 가고 있다. KoFlux는 정기적인 학술 논문 출판, 포럼 및 훈련과정을 통해, 네트워크를 성장시키고, 플럭스 관측 및 모델링 전문가간의 연결 및 정보교환을 위한 아고라를 제공하며, 관측 및 자료 분석을 위한 전문인력 양성을 위한 교육에 힘쓰고 있다. 그러나 이러한 지속적인 노력에도 불구하고 KoFlux에 등재된 산학연기관을 제외하고는 아직까지 네트워크의 성장이 제한되어 있는 실정이다. 이러한 학문간의 벽을 허물고, 네트워크에 대한 동반자 및 주인 의식을 고취시키기 위해 KoFlux는 2011년부터 서울대학교에 설립된 국가농림기상센터를 중심으로 NCAM의 주요 서비스를 담당하게 될 것이다. 이러한 일치된 협력은 현재의 감시 네트워크를 더욱 보강시키고, 차세대 과학자들을 길러내며, 우리 사회에 지속가능한 생태계 서비스의 제공을 보장할 수 있도록 이끌어 줄 것이다.

한국적 도서관학교육과정 연구 (Occupational Demands and Educational Needs in Korean Librarianship)

  • 최성진;윤병태;구본영
    • 한국문헌정보학회지
    • /
    • 제12권
    • /
    • pp.269-327
    • /
    • 1985
  • This study was undertaken to meet more fully the demands for improved training of library personnel, occasioned by the rapidly changing roles and functions of libraries as they try to adapt to the vast social, economic and technological changes currently in progress in the Korean society. The specific purpose of this research is to develop a standard curriculum at the batchelor's level that will properly equip the professional personnel in Korean libraries for the changes confronting them. This study started with the premise that to establish a sound base for curriculum development, it was necessary first to determine what concepts, knowledge, and techniques are required for professional library personnel to perform it at an optimal level of efficiency. Explicitly, it was felt that for the development of useful curricula and courses at the batchelor's level, a prime source of knowledge should be functional behaviours that are necessary in the job situation. To determine specifically what these terminal performance behaviours should be so that learning experience provided could be rooted in reality, the decision was reached to use a systems approach to curriculum development, which is an attempt to break the mold of traditional concepts and to approach interaction from an open, innovative, and product-oriented perspective. This study was designed to: (1) identify what knowledge and techniques are required for professional library personnel to perform the job activities in which they are actually engaged, (2) to evaluate the educational needs of the knowledge and techniques that the professional librarian respondents indicate, and (3) to categorise the knowledge and techniques into teaching subjects to present the teaching subjects by their educational importance. The main data-gathering instrument for the study, a questionnaire containing 254 items, was sent to a randomly selected sample of library school graduates working in libraries and related institutions in Korea. Eighty-three librarians completed and returned the questionnaire. After analysing the returned questionnaire, the following conclusions have been reached: (A) To develop a rational curriculum rooted in the real situation of the Korean libraries, compulsory subjects should be properly chosen from those which were ranked highest in importance by the respondents. Characters and educational policies of, and other teaching subjects offered by, the individual educational institution to which a given library school belongs should also be taken into account in determining compulsory subjects. (B) It is traditionally assumed that education in librarianship should be more concerned with theoretical foundations on which any solution can be developed than with professional needs with particulars and techniques as they are used in existing library environments. However, the respondents gave the former a surprisingly lower rating. The traditional assumption must be reviewed. (C) It is universally accepted in developing library school curricula that compulsory subjects are concerned with the area of knowledge students generally need to learn and optional subjects are concerned with the area to be needed to only those who need it. Now that there is no such clear demarcation line provided in librarianship, it may be a realistic approach to designate subjects in the area rated high by the respondents as compulsory and to designate those in the area rated low as optional. (D) Optional subjects that were ranked considerably higher in importance by the respondents should be given more credits than others, and those ranked lower might be given less credits or offered infrequently or combined. (E) A standard list of compulsory and optional subjects with weekly teaching hours for a Korean library school is presented in the fourth chapter of this report.

  • PDF

청소년 흡연예방을 위한 멀티미디어 CAI 개발 (A Study on the Development of Multimedia CAI in Smoking Prevention for Adolescents)

  • 이숙자;박태진;정영일;조현
    • 보건교육건강증진학회지
    • /
    • 제20권2호
    • /
    • pp.35-61
    • /
    • 2003
  • Background: The purpose of this study was to develop a structured and individualized smoking prevention program for adolescents by utilizing a multimedia computer-assisted instruction model and to empirically assess its effect. Method: For the purpose of this study, a guide book of smoking prevention program for middle and high school students was developed as the first step. The contents of this book were summarized and developed into an actual multimedia CAI smoking prevention program according to the Gane & Briggs instructional design and Keller's ARCS motivation design models as the second step. At the final step, the short-tenn effects of this program were examined by an experiment. This experiment were made for middle school and high school students and the quasi experimental design was the pretest - intervention - posttest. The measured data was attitude, belief, and knowledge about smoking, interest in the program, and learning motivation. Result: The results of this study were as follows: First, the guide book of a smoking prevention program was developed and the existing literature on adolescent smoking was analyzed to develop the content of the guide book. Then the curriculum was divided into three main domains on tobacco and smoking history, smoking and health, adolescent smoking and each main domain was divided into sub-domains. Second, the contents of the guide book were translated into a multimedia CAI program of smoking prevention througn Powerpoint software according to the instructional design theory. The characteristics of this program were interactive, learner controllable, and structured The program contents consisted of entrance(5.6%), history of tobacco(30%), smoking and health(38.9%), adolescent smoking(22.2%), video(4.7%), and exit(1.6%). Multimedia materials consisted of text(121), sound and music, image(still 84, dynamic 32), and videogram(6). The program took about 40 minutes to complete. Third, the results on analysis of the program effects were as follows: 1) There was significant knowledge increase between the pre-test and post-test with total mean difference 3.44, and the highest increase was in the 1st grade students of high school(p<0.001). 2) There was significant decrease in general belief on smoking between the pre-test and post-test with total mean difference 0.28. In subgroup analysis, the difference was significantly higher in the 1st grade of high school (p<0.001), low income class (p<0.001), and daily smokers (p<0.01). 3) There was no significant difference in attitudes on his personal smoking between the pre-test and post-test. 4) The interest in the program seemed to lower as students got older. The score of motivation toward this prevention program was the highest in the middle school 3rd grade. Among sub-domains of motivation, the confidence score was the highest. Conclusion: To be most effective, the smoking prevention program for adolescents should utilize the most up-to-date and accurate information on smoking, and then instructional material should be developed so that the learners can approach the program with enjoyment. Through this study, a guide book with the most up-to-date information was developed and the multimedia CAI smoking prevention program was also developed based on the guide book. The program showed positive effect on the students' knowledge and belief in smoking.

초등학교 영양교육에 대한 학생과 학부모의 인식도 조사 (Students' and Parents' Perceptions of Nutrition Education in Elementary Schools)

  • 김현희;박유화;신은경;신경희;배인숙;이연경
    • 한국식품영양과학회지
    • /
    • 제35권8호
    • /
    • pp.1016-1024
    • /
    • 2006
  • 본 연구에서는 전국 16개 지역 초등학교 학생 7,577명과 학부모 6,003명을 대상으로 학부모의 가정에서의 영양교육실태, 학부모와 학생이 인식하는 학교 영양교육의 필요성 및 교육방향, 학생들의 영양교육에 대한 관심도와 학부모대상 식생활교실 관심도 등을 학교급식 유형별로 비교하였다. 학부모의 81.4%가 가정에서의 영양교육이 충분하지 못한 것으로 인식하였고, 63.2%가 가정에서의 영양교육 실시에 어려움을 느꼈으며, 그 이유로는 자녀의 영양상태 파악부족이 41.9%로 가장 많았고, 가정에서 실시하고 있는 영양교육은 편식교정이 73.1%로 가장 높았다. 영양교육의 필요성에 대해서 학부모의 96.6%, 학생의 62.8%가 필요한 것으로 인식하였고, 영양교육 적임자로는 학부모의 53.8%와 학생의 46.2%가 영양교사로 인식하였으며, 교육시기로는 학부모의 88.4%가 유치원 및 초등학교 저학년부터 실시하는 것이 바람직한 것으로 인식하였다. 영양교육 유형으로는 학부모의 55.8%가 실습을 병행한 교육이 적당하다고 답하였고, 도시형 급식학교 학부모의 경우 특별활동반을 활용한 교육을, 농어촌형 급식학교 학부모의 경우는 재량활동시간을 활용하는 것을 더 원하는 것으로 나타났다. 학생들은 적절한 영양교육 시간을 일주일에 1시간으로 응답한 경우가 가장 많았고, 영양교육 유형으로는 특별활동반 및 우리농산물 체험교육에 대해서 78.5%가 관심을 나타내었으며, 참여해보고 싶은 특별활동반으로는 조리실습반 73.0%, 편식교정반 12.8%, 비만관리반 10.1% 순이었다. 방학을 이용한 건강 식생활 캠프는 조리실습 캠프 68.3%, 전통음식 탐방 캠프 41.3%, 편식 캠프 19.5% 순으로 조사되었다. 학부모 대상 식생활 교실을 운영할 경우 74%의 학부모가 참여의사가 있는 것으로 나타났으며, 식생활 교실운영 시 관심분야는 조리실습 47.4%, 식사요법 45.7%, 식품정보 44.5% 순으로 나타났으며, 식품정보에 대한 관심도는 도시형 급식학교의 학부모가 농어촌형 급식학교의 학부모보다 높은 것으로 조사되었다. 이상의 결과 초등학생 및 학부모들은 영양교육의 필요성을 절실히 인식하고 있었으며, 학생들은 특별활동반을 활용하여 일주일에 1시간씩 영양교육을 받기를 원하는 것으로 나타났고, 학부모 또한 자녀들이 실습을 병행한 교육을 받기를 원하는 것으로 나타났으므로 향후 특별활동반 운영을 위한 체계적인 영양교육프로그램이나 지침서의 개발이 절실히 필요하다고 하겠다.

네트노그라피를 이용한 공개 소프트웨어의 개발 및 확산 패턴 분석에 관한 연구 - 자바스크립트 프레임워크 사례를 중심으로 - (Tracing the Development and Spread Patterns of OSS using the Method of Netnography - The Case of JavaScript Frameworks -)

  • 강희숙;윤인환;이희상
    • 경영과정보연구
    • /
    • 제36권3호
    • /
    • pp.131-150
    • /
    • 2017
  • 본 연구의 목적은 공개 소프트웨어(Open Source Software, 이하 OSS)가 운영 기간 내 주변의 행위자들과 관계를 수립하는 동안 OSS의 개발 및 확산 패턴을 확인하는 것으로, OSS 참여자들의 변화 패턴을 조사하기 위해 OSS 통과시간을 기반으로 그 변화 양상을 추적할 수 있는 온라인 데이터와 네트노그라피 방법을 이용하였다. 이를 위해 대표적인 OSS 자바스크립트 프레임워크인 jQuery, MooTools, YUI 등 이상 세 가지 사례에 대하여 블로그, 웹 서치와 함께 GitHub 공개 API(Application Programming Interface)로 수집된 데이터를 활용하였다. 본 연구에서는 OSS 변형 과정의 변화 패턴을 분류하기 위하여 행위자-네트워크 이론의 전환(translation) 과정을 적용하였으며, 관찰된 OSS 변형 과정을 살펴보면 다음과 같다. 먼저, '프로젝트 개시' 단계에서 소스 코드, 프로젝트 책임자 및 관계자, 내부 참여자 등과 같은 세 가지 유형의 OSS 관련 행위자들을 확인하였고, 그들 사이의 관계성을 개념화 하였다. 이후 프로젝트 책임자가 최초로 프로젝트를 착수하는 '프로젝트 성장' 단계는 관계자들에 의해 소스 코드가 유지 보수되는 과정을 통해 개선된다. 마지막으로 OSS는 홍보 활동을 통해 참여자들의 관찰기를 갖고, 소스 코드 사용을 통해 학습기를 거친 사용자가 본격적으로 등장함으로써 '참여자의 도약' 단계로 진입한다. 이 시기에는 기업과 외부 관계자들도 출현하는 모습도 살펴볼 수 있다. 본 연구결과는 OSS 참여자들이 OSS를 선택하는데 있어 홍보 과정의 중요성을 강조하고, OSS의 급속한 개발속도가 오히려 참여자의 출현을 지연시키는 구축 효과(crowding-out effec)가 발생하는 것을 확인하였다. 본 연구는 행위자-네트워크 이론을 토대로 주요 OSS 사례를 네트노그라피를 활용하여 종단적인 관점에서 분석함으로써 OSS의 발전 과정을 일반화시키기 위한 노력을 시도했다는 점에서 학술적인 의의가 있으며, OSS가 지배적인 위치에 오르기 위한 단계별 영향 요인, 세부적인 변화 양상 등을 확인함으로써 OSS 개발자와 관리자들에게 다양한 시사점을 제공할 것으로 기대된다.

  • PDF

개인화 전시 서비스 구현을 위한 지능형 관객 감정 판단 모형 (The Intelligent Determination Model of Audience Emotion for Implementing Personalized Exhibition)

  • 정민규;김재경
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.39-57
    • /
    • 2012
  • 최근 기존 전시 공간 내에 유비쿼터스 환경이 구축되면서, 관객과의 상호작용을 통해 전시 효과를 배가할 수 있는 인터랙티브 전시에 많은 사람들의 관심이 집중되고 있다. 이러한 인터랙티브 전시가 보다 고도화되기 위해서는 전시물에 대한 다양한 관객 반응을 측정하고, 이를 통해 대상 관객이 어떤 감정을 느끼는지 예측할 수 있는 적절한 의사결정지원 모형이 요구된다. 이러한 배경에서 본 연구는 인터랙티브 전시 공간 내에서 수집 가능한 다양한 관객 반응 중 얼굴표정의 변화를 이용하여, 관객의 감정을 추론, 판단하는 지능형 모형을 제시한다. 본 연구에서 제시하는 모형은 무자극 상태의 관객의 표정과 자극이 주어졌을 때 관객의 표정이 어떻게 변화하는지 변화량을 측정하여, 이를 기반으로 인공신경망 기법을 이용해 해당 관객의 감정을 판단하는 모형이다. 이 때, 제안모형의 감정 분류체계로는 간결하면서도 실무에 적용이 용이하여 그간 기존 문헌에서 널리 활용되어 온 매력-각성(Valence-Arousal) 모형을 사용한다. 제안모형의 유용성을 검증하기 위해, 본 연구에서는 2011 서울 DMC 컬쳐 오픈 행사에 참여하여, 일반인을 대상으로 얼굴 표정 변화 데이터를 수집하고, 이들이 느끼는 감정 상태를 설문조사하였다. 그리고 나서, 이 자료들을 대상으로 본 연구에서 제안하는 모형을 적용해 보고, 제안모형이 비교모형으로 설정된 통계기반 예측모형에 비해 더 우수한 성과를 보이는지 확인해 보았다. 실험 결과, 본 연구에서 제시하는 모형이 비교 모형인 중회귀분석 모형보다 더 우수한 결과를 제공함을 확인할 수 있었다. 본 연구를 통하여 구축된 관객 감정 판단 모형을 실제 전시장에서 활용한다면 전시물을 관람하는 관객의 반응에 따라 시의적절하면서도 효과적인 대응이 가능하기 때문에, 관객의 몰입과 만족을 보다 증대시킬 수 있을 것으로 기대된다.

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

손자병법의 전략과 그 현대적 응용에 관한 연구 (A Study on The Art of War's strategy and its modern application)

  • 송용호;전명용
    • 동양고전연구
    • /
    • 제73호
    • /
    • pp.249-279
    • /
    • 2018
  • 본 논문은 손자병법의 '전략'을 분석하고, 이를 현대사회, 특히 기업경영에 접목하는 시도를 통해 손자병법의 현대적 응용가치를 검증하기 위한 것이다. 군대는 전쟁에서 피해와 희생을 최소화하고 빠른 시간 내에 승리를 얻기 위해 '전쟁전략'을, 기업은 최소비용으로 최대이윤을 내기 위해 '경영전략'을 사용한다. 손자병법의 '세(勢)', '응변력(應變力)', '궤도(詭道)'로 구성되는 전략의 3요소는 현대 기업경영에서의 '내부자원 분석', '외부환경 분석', '정보관리'와 연결된다. 전략의 수립단계에서 손자병법에서는 '선지(先知)', '묘산(廟算)', '군쟁(軍爭)'을 포함하는 '선승전략(先勝戰略)'의 중요성을 강조하였는데, 이는 현대 기업경영에서 '선지'는 3C분석 중 경쟁자분(competitor)과 벤치마킹으로, '묘산'은 SWOT분석과 4P's분석으로, '군쟁'은 포지셔닝전략과 시장선점전략으로 표현되고 있다. 전략의 실행단계에서 '기습전략(奇襲戰略)', '허실전략(虛實戰略)', '분합전략(分合戰略)'은 현대 기업경영에서 '기습전략'은 차별화전략과 집중화전략으로, '허실전략'은 정보관리와 합리적 포지셔닝으로, '분합전략'은 다각화전략, 집중화전략, 변화관리, 본원적 경쟁전략, 시너지효과 등으로 발현되고, 전략의 결실은 손자병법에서는 '전쟁의 승리', 현대 기업경영에서는 '경쟁우위'와 '이윤극대화'로 나타난다. 이처럼 손자병법의 전략은 표현과 방식에 있어서 약간의 차이가 있을 뿐 현대 기업의 경영전략과 궁극적으로 서로 상통하고 있어, 기원전 500년경에 쓴 병법서이지만 빠르게 변화하는 환경과 치열한 경쟁 속에 놓여 있는 현대의 기업들과 현대인들에게 경쟁의 원리와 승리의 비법을 깨닫는데 필요한 '큰 지혜'를 제공하고 있다는 것을 알 수 있다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.