• 제목/요약/키워드: 사전 지식

검색결과 1,074건 처리시간 0.037초

영한 기계 번역에서 미가공 텍스트 데이터를 이용한 대역어 선택 중의성 해소 (Target Word Selection Disambiguation using Untagged Text Data in English-Korean Machine Translation)

  • 김유섭;장정호
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.749-758
    • /
    • 2004
  • 본 논문에서는 미가공 말뭉치 데이터를 활용하여 영한 기계번역 시스템의 대역어 선택 시 발생하는 중의성을 해소하는 방법을 제안한다. 이를 위하여 은닉 의미 분석(Latent Semantic Analysis : LSA)과 확률적 은닉 의미 분석(Probabilistic LSA : PLSA)을 적용한다. 이 두 기법은 텍스트 문단과 같은 문맥 정보가 주어졌을 때, 이 문맥이 내포하고 있는 복잡한 의미 구조를 표현할 수 있다 본 논문에서는 이들을 사용하여 언어적인 의미 지식(Semantic Knowledge)을 구축하였으며 이 지식은 결국 영한 기계번역에서의 대역어 선택 시 발생하는 중의성을 해소하기 위하여 단어간 의미 유사도를 추정하는데 사용된다. 또한 대역어 선택을 위해서는 미리 사전에 저장된 문법 관계를 활용하여야 한다. 본 논문에서는 이러한 대역어 선택 시 발생하는 데이터 희소성 문제를 해소하기 위하여 k-최근점 학습 알고리즘을 사용한다. 그리고 위의 두 모델을 활용하여 k-최근점 학습에서 필요한 예제 간 거리를 추정하였다. 실험에서는, 두 기법에서의 은닉 의미 공간을 구성하기 위하여 TREC 데이터(AP news)론 활용하였고, 대역어 선택의 정확도를 평가하기 위하여 Wall Street Journal 말뭉치를 사용하였다. 그리고 은닉 의미 분석을 통하여 대역어 선택의 정확성이 디폴트 의미 선택과 비교하여 약 10% 향상되었으며 PLSA가 LSA보다 근소하게 더 좋은 성능을 보였다. 또한 은닉 공간에서의 축소된 벡터의 차원수와 k-최근점 학습에서의 k값이 대역어 선택의 정확도에 미치는 영향을 대역어 선택 정확도와의 상관관계를 계산함으로써 검증하였다.젝트의 성격에 맞도록 필요한 조정만을 통하여 품질보증 프로세스를 확립할 수 있다. 개발 된 패키지의 효율적인 활용이 내조직의 소프트웨어 품질보증 구축에 투입되는 공수 및 어려움을 줄일 것으로 기대된다.도가 증가할 때 구기자 열수 추출 농축액은 $1.6182{\sim}2.0543$, 혼합구기자 열수 추출 농축액은 $1.7057{\sim}2.1462{\times}10^7\;J/kg{\cdot}mol$로 증가하였다. 이와 같이 구기자 열수 추출 농축액과 혼합구기자 열수 추출 농축액의 리올리지적 특성에 큰 차이를 나타내지는 않았다. security simultaneously.% 첨가시 pH 5.0, 7.0 및 8.0에서 각각 대조구의 57, 413 및 315% 증진되었다. 거품의 열안정성은 15분 whipping시, pH 4.0(대조구, 30.2%) 및 5.0(대조구, 23.7%)에서 각각 $0{\sim}38.0$$0{\sim}57.0%$이었고 pH 7.0(대조구, 39.6%) 및 8.0(대조구, 43.6%)에서 각각 $0{\sim}59.4$$36.6{\sim}58.4%$이었으며 sodium alginate 첨가시가 가장 양호하였다. 전체적으로 보아 거품안정성이 높은 것은 열안정성도 높은 경향이며, 표면장력이 낮으면 거품형성능이 높아지고, 비점도가 높으면 거품안정성 및 열안정성이 높아지는 경향이 있었다.protocol.eractions between application agents that are developed using different

진화 교육 연구 경험 유무에 따른 생명과학 교사의 교수 실행 사례 연구 (Case Study of Teaching Practices of Biology Teachers with and without Research Experience in Evolution Education)

  • 고유선;차희영;임미리
    • 한국과학교육학회지
    • /
    • 제37권4호
    • /
    • pp.747-761
    • /
    • 2017
  • 이 연구는 생명 과학 교수 실행에 있어서 진화 교육 연구 경험이 있는 교사가 그렇지 않은 교사와 어떤 차이를 나타내는지 알아보기 위해 수행되었다. 연구를 위해 진화 교육에 대한 연구 경험이 있는 교사 두 명과 이에 대한 비교집단으로 진화 교육에 대한 연구 경험이 없는 교사 두 명, 총 네 명의 생명과학 교사들을 목적 표집하였다. 먼저, 사전면담을 통해 교사들의 배경지식을 수집하였으며, 생명과학 수업 중 진화 단원과 비진화 단원을 각각 2차시씩 선정하였다. 녹음된 수업은 전사하였으며, 교사들의 진화에 대한 견해 및 교수 실행에 반영된 진화 내용을 중심으로 분석하였다. 또한, 연구를 위한 기초자료로 과학 교수내용지식 설문지, 진화론의 개념 검사지, 진화론의 수용 검사지를 사용하여 자료수집 및 분석 하였다. 연구결과 교사들의 진화 개념에 대한 이해 수준은 진화의 중요성 인식과는 관련이 없는 것으로 나타났다. 다만, 교사 개인의 종교적인 신념이나, 진화의 중요성을 인식하는 것에 대한 필요 자체를 느끼지 못함이 진화의 중요성 인식에 부정적인 영향을 미쳤다. 이 때문에 진화교육 연구 미경험 교사들은 진화의 중요성을 인식할 수 있는 교사 재교육 기회도 거부하는 경향을 보였다. 또한 미경험 교사들은 교과서 및 교육과정에서 나타난 진화 개선점에 대해 피상적으로만 파악하고 있었다. 생명과학 교수 실행 내용을 분석한 결과 경험 교사들의 진화 주요 개념 활용 비율이 더 높게 나타났다. 그리고 경험 교사들만이 자신의 교수 실행에서 나타난 오개념을 스스로 인지하고 이러한 오개념이 나타나게 된 원인에 대해 설명을 했다. 이를 통해 진화 교육 연구 경험 교사가 진화 주요 개념들을 폭넓게 활용할 뿐만 아니라 진화 관련 오개념 방지에 더 실천적임을 확인하였다. 연구 결과는 생물 교육에서 진화의 중요성을 깨닫지 못한 교사들에게 좀 더 다양하고 많은 진화 관련 교사교육 프로그램을 제공할 필요성을 알려준다.

일반계 고등학교 과학과제 연구 수업의 주제 선정을 위한 실천 매뉴얼 개발 및 적용 (Development and Application of Practice Manual Focused on Science Topic Selection Stage in General High School)

  • 김애라;박다혜;박종석
    • 과학교육연구지
    • /
    • 제42권3호
    • /
    • pp.371-389
    • /
    • 2018
  • 본 연구는 주제 선정부터 결론 도출까지 학생 주도적으로 이루어지는 과학 탐구가 포함된 학생 연구 활동에서 학생과 교사들이 공통적으로 '주제 선정 단계'를 특히 어려워한다는 점에 주목하여 일반계 고등학교에서 '주제 선정 단계'를 중심으로 한 과학과제 연구 수업 실천 매뉴얼을 개발하고자 하였다. 선행연구 및 문헌들을 통해 이론적 기조가 되는 내용들을 추출하고, 추출된 내용이 실제 수업에서 구현될 수 있도록 실천적 지식에 근거하여 4단계 16차시 분량의 수업 매뉴얼을 개발하였다. 각 단계는 <오리엔테이션>, <소논문 리뷰 & 발표>, <다양한 정보원에서 과학 연구주제 찾기>, <최종 과학 연구주제 작성>으로 구성되어 있으며, 특히 3단계 '다양한 정보원에서 과학 연구주제 찾기'에서 영상, 신문기사, 과학잡지, 전통지식, 속담, 일상생활, 교과서 실험 속 연구주제 찾기의 세부 수업 활동을 통해 과학적 의문을 찾고 이를 연구주제로 발전시키도록 한다. 개발된 내용은 경상북도 G시 읍면지역의 일반계 S고등학교 2학년 자연반 학생들에게 적용하였다. 실험반은 개발된 수업 실천 매뉴얼에 따라, 대조반은 기존의 일반적인 과제 연구수업 단계에 따라 수업을 진행하고, 학생들이 작성한 최종 과학 연구주제 작성지, 과학적 문제발견 능력 검사, 과학에 대한 태도 검사, 수업 의견 조사지를 통해 적용된 수업의 결과를 비교 분석하였다. 그 결과 첫째, 실험반에서는 교과서 실험, 속담, 유튜브 영상, 신문 기사, 개인별 WHY NOTE 등 다양한 정보원을 통해 최종 연구주제를 선정했으며, 과학 연구 주제의 조건을 이해하고 연구 제목에 변인을 드러내 표현하였다. 그러나 대조반에서는 일부 학생들이 선정한 연구주제의 연구 범위가 구체적이지 못하거나 학생 수준에서 연구할 수 있는 범위인지를 전혀 고려하지 않고 작성했으며, 학생들에게 자율성을 최대한 많이 부여하다 보니 과제연구 활동의 의미를 제대로 이해하지 못하고 선행 연구물을 그대로 작성해서 제출하는 모둠이 많았다. 둘째, 과학적 문제발견 능력 검사 결과 대조반은14.84점에서 13.40점으로 1.44점 감소했으나(p>.05), 개발된 수업 실천 매뉴얼을 적용한 실험반의 경우 14점에서 25.42점으로 11.42점 증가(p<.05)하며, 하위 영역인 융통성, 정교성, 독창성 모두 점수가 상승함을 보였다. 셋째, 과학에 대한 태도 검사에서도 대조반의 경우 119.38점에서 116.96점으로 사전에 비해 사후 0.42점 감소(p>.05)하였으나, 실험반의 경우 119.80점에서 126.96점으로 10점 증가(p<.05)하는 결과를 보였다. 이와 같은 연구 결과를 토대로 본 연구에서 개발한 '주제 선정 단계' 중심 과제연구수업 실천 매뉴얼은 일반계 고등학교 교사들이 과학과제 연구 수업을 할 때 수업의 안내서 및 지침서로 활용할 수 있으며, 이를 통한 수업은 학생들의 과학적 문제 발견 능력을 향상시키고 과학에 대한 태도를 긍정적인 방향으로 변화시킬 수 있음을 확인하였다.

제철유적 조사연구법 시론 (Proposals on How to Research Iron Manufacture Relics)

  • 김권일
    • 헤리티지:역사와 과학
    • /
    • 제43권3호
    • /
    • pp.144-179
    • /
    • 2010
  • 본고는 1970년대 이래 제철유적에 대한 조사가 꾸준히 증가되었음에도 불구하고 그 조사방법에 대한 연구는 이에 미치지 못하는 상황을 인식하는 데서 비롯되었다. 제철유적은 1990년대에 들어오면서 전국적으로 조사가 급증하였으며, 특히 최근에는 생산유적의 중요성이 부각되면서 더욱 주목받고 있는 유적의 하나이다. 하지만 분묘유적이나 취락, 성곽유적 등에 비해 제철유적의 조사방법에 대한 소개와 연구는 크게 부족하다고 할 수 있다. 그 이유는 제철조업의 프로세스는 매우 복잡하고 다양할 뿐 아니라, 공정의 이해를 위해서는 금속공학적인 기초지식까지 학습해야 하는 어려움이 있기 때문이다. 즉 고고학 조사와 연구에 있어 제철과 관련된 유구 유물의 성격이 이러한 프로세스와 어떠한 상관관계를 가지는지 밝히기가 몹시 어렵다는 이유 때문이다. 이러한 문제를 해결하기 위해 철생산 및 철기제작의 공정과 철재, 철괴 등 관련유물의 금속학적 특징에 대한 이해를 바탕으로, 제철유적 발굴조사의 순서와 방법, 유물의 분류 및 정리방법에 대한 시론을 제시함으로써 정밀한 조사와 심도 있는 분석이 이루어질 수 있도록 하는 것이 본 연구의 목적이다. 본고에서는 제철유적을 조업공정에 따라 채광, 제련, 정련, 단야, 용해, 제강유적의 6가지 유형으로 분류한 후, 사전조사와 지표${\rightarrow}$시굴${\rightarrow}$발굴조사로 이어지는 각 단계별 조사방법에 대해 정리하였다. 또한 가장 대표적인 제철관련유물인 철재의 분류 및 정리에 있어 새로운 방법을 모색해 보았다. 더불어 유적의 성격파악에 필요한 자연과학분석 및 제철로 복원실험의 필요성에 대해서도 언급하였으며, 내용의 구성에서는 사례 제시와 도면 사진자료를 최대한 활용하였다. 본고에서는 다양한 조사연구방법의 응용과 개발에 대해 심도 있게 논의하지는 못하였지만, 유구 유물의 세밀한 관찰을 통해 공정에 따른 다양한 제철유적의 조사연구 방법론 개발이 매우 시급한 과제임을 알 수 있었다. 그리고 유적의 종합적인 성격규명을 위해서는 고고학적 지식뿐만 아니라 자연과학 분야가 다양하게 응용되어야 하며, 더불어 실험고고학의 측면에서도 지속적인 제철로의 복원실험이 필요함을 알 수 있었다.

고등학교 가정계열 선택과목 「식품안전과 건강」교육과정의 운영 효과 (Effectiveness of 「Food Safety and Health」Program as a Home Economics Elective Course in High School)

  • 박미정;최성연;이심열;김유경;정난희;김유경;김진아;이정규;고미선;유난숙
    • 한국가정과교육학회지
    • /
    • 제33권2호
    • /
    • pp.135-152
    • /
    • 2021
  • 본 연구는 고등학생 대상 「식품안전과 건강」의 교육과정 운영 효과를 알아보는데 목적이 있다. 이에 충북, 경기, 대전, 세종지역의 6개 고등학교에서 「식품안전과 건강」교육과정의 일부가 시범 운영되었고, 수업에 참여한 학생으로부터 수집된 1,199부를 분석하였으며 그 결과는 다음과 같다. 「식품안전과 건강」수업은 고등학생의 '식품안전과 건강' 지식 총점 및 각 영역별 점수 향상에 유의한 효과가 있었다. 사전검사에 비해 사후검사 정답률은 전체적으로 7.99%p 높였으며, 해당 영역을 상대적으로 많이 교육한 학교의 향상 점수가 높게 나타났다. 또한 「식품안전과 건강」수업은 고등학생의 식생활 행동을 긍정적으로 변화시켰고, 여러 가지 음식을 골고루 먹는 식습관을 가지게 하는 데 유의한 효과가 있었다. 「식품안전과 건강」수업에 참여했던 고등학생들은 수업에 대하여 매우 긍정적으로(4.27/5) 평가하였으며, 수업 내용이 흥미롭고, 이해하기 쉬웠으며, 실제 식생활에 도움이 된다고 답하였다. 개방형 질문에 대한 답을 분석한 결과, 수업에서 좋았던 점은 식품관련 지식 습득, 실생활에 도움이 되었다는 의견이 많았으며, 아쉬운 점으로 코로나로 인하여 수업이 온라인으로 진행되어 실습이나 모둠 활동을 못한 점 등을 꼽았다. 본 연구는 고교학점제에 대비하여 가정계열 선택과목 편성 확대 및 고등학생의 과목 선택권 확대에 의의가 있다.

자가혈당측정 기반의 개별 맞춤형 프로그램이 당뇨병 및 당뇨병 전단계 환자의 건강행태와 당화혈색소에 미치는 영향 (Effect of an Individually Tailored Program Based on Self-Measurement of Blood Glucose on Health Behavior and HbA1c in Diabetes and Pre-diabetes Patients)

  • 김윤경;김보라;유은숙;윤서영;정미정;최지혜;최재순;성현진;강영숙;이민숙;황태윤
    • 농촌의학ㆍ지역보건
    • /
    • 제47권2호
    • /
    • pp.67-77
    • /
    • 2022
  • 본 연구는 2021년 1월에서 10월까지 경주고당센터에서 당뇨병 환자 57명과 당뇨병 전단계 환자 14명을 대상으로 실시한 자가혈당측정 기반의 개별 맞춤형 프로그램의 효과를 확인하기 위하여 수행되었다. 자가혈당측정 기반의 개별 맞춤형 프로그램은 12주 동안 2주 간격으로 7차 교육이 실시되도록 구성되었으며 1차와 7차 교육을 제외한 대부분의 교육은 전화로 진행되었다. 교육내용은 자가혈당측정 및 활용, 올바른 약물복용법, 저혈당 예방과 대처법, 합병증예방과 관리, 당뇨식사관리, 식사일지작성, 식사유형분석 등을 포함하고, 교육시간은 대상자마다 상이하여 20분에서 1시간까지 소요되었다. 프로그램 동안 대상자들은 자가혈당 측정치를 '송아리당뇨' 앱에 기록하였고 담당간호사와 영양사는 기록된 혈당치를 근거로 개별 맞춤형 혈당관리방법을 교육하였다. 교육의 효과를 판정하기 위해 사전, 사후 설문평가 및 당화혈색소 검사가 실시되었다. 당뇨병 지식(20점 만점)은 14.77점에서 15.41점으로, 건강행태(40점 만점)는 25.50점에서 28.40점으로, 자가혈당 측정경험(6점 만점)은 2.70점에서 4.81점으로 증가하였고 모두 통계적으로 유의하였다. 당화혈색소는 1차 평가(n=67명)에서는 7.38%에서 6.73%로, 2차 평가(n=53명)에서는 7.27%에서 6.67%로 감소하였고, 체질량지수도 24.47kg/m2에서 24.01kg/m2로 감소하여 모두 통계적으로 유의하였다. 사후 당화혈색소는 혈당측정치활용도(r=-0.415) 및 사후 건강행태(r=-0.313)와 음의 상관관계가 있었고, 혈당측정치 활용도는 사후 건강행태(r=0.581) 및 사후 당뇨병 지식(r=0.493)과 양의 상관관계가 있었다. 결과적으로 본 프로그램은 당뇨병 환자와 당뇨병 전단계 환자의 혈당관리에 효과적이며, 사후 당화혈색소는 혈당측정치 활용도와 관련성이 있으며 혈당측정치 활용도는 사후 건강행태와 관련성이 있었다. 이러한 연구결과로 볼 때, 자가혈당측정 기반의 개별 맞춤형 프로그램은 대상자들의 혈당관리에 효과적으로 기여한 것으로 사료된다.

예비간호사를 위한 사례기반학습 및 코티칭 임상실습 교육모형 개발 (Development of case-based learning and co-teaching clinical practice education model for pre-service nurses)

  • 김현정;형희경;김현우;김세령
    • 기독교교육논총
    • /
    • 제72권
    • /
    • pp.245-271
    • /
    • 2022
  • 연구 목적 : 본 연구는 간호대학생을 대상으로 사례기반학습 및 코티칭을 적용한 간호 임상실습 교육모형을 개발하고, 개발된 모형의 타당성 확보를 목적으로 한다. 연구 내용 및 방법 : 간호 임상실습 교육모형의 타당성 검증을 위해 전주시 소재 J대학교 2021학년도 2학기'건강 반응과 간호 VI(지각·인지) 실습'과목에 적용하고 모형에 대한 교수자 반응평가를 실시하였고, 학습자 반응평가를 위해 임상 수행 자신감, 교수학습 모형에 대한 설문조사와 포커스 그룹 인터뷰를 진행하였다. 선행문헌 고찰과 사례 연구를 통해 사례기반학습 단계와 코티칭 요소를 도출한 후 전문가 검토를 받아 초기 모형을 구안하였고, 구안한 모형은 간호교육 전문가에게 내적 타당화를 검토받은 후 수정·보완하였다. 외적 타당화 검증을 위해 임상실습 교과에 모형을 적용한 후 실시한 학습자 반응평가 결과 임상 수행 자신감은 4.22점, 교수학습 모형 만족도는 4.68점으로 높게 나타났다. 포커스그룹 인터뷰 결과를 종합하면, 사전학습의 중요성과 실제 사례를 기반으로 선정한 사례를 학습하면서 전문용어, 전문지식 등을 습득함으로써 실습 현장에 대한 두려움이 없어지고 익숙함을 느꼈고, 다양한 사례를 학습하며 실습 현장에서 학습하였던 지식을 정리하는 시간을 통해 비판적 사고를 할 수 있었다고 하였다. 또 코티칭을 통하여 현장지도자와 지도교수가 함께 사례를 통해 이론과 실무적인 측면을 동시에 교수함으로써 실무와 더 가까워진 실습교육을 경험한 것으로 나타났다. 결론 및 제언 : 본 연구를 통하여 개발한 사례기반학습 및 코티칭을 적용한 간호 임상실습 교육모형은 이론과 실무 간의 차이를 줄여주고 간호 대학생의 임상수행 능력을 향상시킬 수 있는 효과적인 교수학습모형이 될 것으로 기대한다.

스마트폰 앱 마켓 선택에 영향을 미치는 요인에 관한 연구: 앱 마켓 플랫폼 사업자 관점으로 (Research on Factors Affecting Smartphone App Market Selection: App Market Platform Provider's Perspective)

  • 이호;김재성;김경규;이영인
    • 한국지식정보기술학회논문지
    • /
    • 제13권1호
    • /
    • pp.11-23
    • /
    • 2018
  • 본 연구에서는 스마트폰의 확산에 가장 주요한 요인이며 다양한 기능성 편의를 제공하는 앱을 구매하는 채널인 앱 마켓을 선택하는 요인을 합리적인 선택 이론 관점을 도입하여 실증적으로 밝혀내었다. 281건의 설문 결과 분석을 통해, 이익의 관점에서 사용편의성과 구조적 보장이 앱 마켓 선택에 유의미한 영향을 주는 것으로 검증 되었다. 반면, 고객신뢰, 정보 품질, 마켓 이미지는 앱마켓 선택에 유의미한 영향을 주지 못하는 것으로 파악되었다. 특히, 국내 앱마켓 플랫폼 제공자(KT, LG U+)의 경우, 해외 앱마켓 플랫폼사업자(구글)에 비해, 고객센터 운용, 피해보상 규정 등 구조적 보장 측면에서 우위에 있는 것으로 보인다. 하지만, 구글 앱 마켓의 경우는 모든 안드로이드 폰에 사전 설치되어 통신사 별로 타 앱마켓을 이용하기 위해 추가적으로 설치해야하는 불편함이 없어 국내 제공자보다 사용자 편의성에서 우위에 있다고 판단된다. 이는 국내 앱마켓 플랫폼사업자에게만 불리하게 작용하고 있어, 정책적 해결점 마련이 필요하다. 사업자비용의 관점에서는 금전적인 전환 비용과 비금전적인 전환 비용 모두 앱 마켓 선택에 유의미한 영향을 주는 것으로 나타났다. 특히, 비금전적인 전환 비용은 국내 앱마켓 플랫폼사업자에게 부정적인 영향을 주는 것으로 나타났다. 이는 국내 앱마켓의 서비스 기대 수준이 낮다고 인식되어 있고, 신규 사용자가 사용하기 위해 회원 가입 등 소요되는 시간적 비용요소가 크다고 인지되어 있다고 설명될 수 있다. 국내 앱 마켓 사업의 활성화를 위해 개선이 필요한 항목으로 보인다. 본 연구를 통해 기존 대부분의 연구들이 앱 선택 요인에만 집중되었다는 한계를 극복하고 앱 마켓 선택 요인을 밝혀내었다는데 본 연구의 의의가 있다고 볼 수 있겠다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.