통합 검색 | Korea Science

나노기술의 국내외 현황과 전망 (The Present Status and Outlook of Nano Technology)

김용태
- 한국마이크로전자및패키징학회:학술대회논문집
- /
- 한국마이크로전자및패키징학회 2001년도 추계 기술심포지움
- /
- pp.37-39
- /
- 2001
21세기의 벽두부터 국내외적으로 활발히 논의되고 있는 나노기술에 대한 정의를 생각해보는 것으로부터 우리가 나아갈 방향을 살펴보고자 한다. 나노기술이란, 원자 하나 하나 혹은 분자단위의 조작을 통해 1~100nm정도의 범위 안에서 근본적으로 새로운 물질이나 구조체를 만들어 내는 기술을 말한다. 즉 앞으로 우리는 경험해 보지 못한 새로운 현상에 대한 이해를 할 수 있어야 하고, 새로운 물질 자체를 다룰 수 있는 방법이 우리가 해야 할 구체적인 일이 될 것이란 말이 된다. 뿐만 아니라 나노기술은 종래의 정보.통신.전자 분야에서 주로 추구하던 마이크로화와 달리 재료, 기계, 전자, 의학, 약학, 에너지, 환경, 화학, 생물학, 농학, 정보, 보안기술 등 과학기술 분야 전반을 위시하여 사회분야가지 새로운 인식과 철학적인 이해가 필요하게 되었다. 21세기를 맞은 인류가 나아갈 방향을 나노세계에 대한 도전으로 보아야 하며, 과학기술의 새로운 틀을 제공할 것 임에 틀림 없다. 그러나, 이와 같은 나노기술의 출발점을 살펴보면 VLSI기술로 통칭할 수 있는 마이크로전자소자 기술이란 점이다. 국내의 VLSI기술은 메모리기술이라고 해도 과언이 아닐 것이다. 문제는 종래의 메모리기술은 대규모 투자와 집중적인 인력양성을 통해서 세계 최고 수준에 도달 할 수 있었다. 그러나 여기까지 오는 동안 사식 우리는 선진국의 뒷꽁무니를 혼신의 힘을 다해 뒤쫓아 온 결과라고 보아도 틀리지 않는다. 즉, 앞선자를 보고 뒤쫓는 사람은 갈방향과 목표가 분명하므로 최선을 다하면 따라 잡을 수 있다. 그런데 나노기술은 앞선 사람이 없다는 점이 큰 차이이다 따라서 뒷껑무니를 쫓아가는 습성을 가지고는 개척해 나갈 수 없다는 점을 깨닫지 않으면 안된다. 그런 점에서 이 시간 나노기술의 국내외 현황을 살펴보고 우리가 어떻게 할 것인가를 생각해 보는데 의미가 있을 것이다.하여 분석한 결과 기존의 제한된 RICH-DP는 실시간 서비스에 대한 처리율이 낮아지며 서비스 시간이 보장되지 못했다. 따라서 실시간 서비스에 대한 새로운 제안된 기법을 제안하고 성능 평가한 결과 기존의 RICH-DP보다 성능이 향상됨을 확인 할 수 있었다.(actual world)에서 가상 관성 세계(possible inertia would)로 변화시켜서, 완수동사의 종결점(ending point)을 현실세계에서 가상의 미래 세계로 움직이는 역할을 한다. 결과적으로, IMP는 완수동사의 닫힌 완료 관점을 현실세계에서는 열린 미완료 관점으로 변환시키되, 가상 관성 세계에서는 그대로 닫힌 관점으로 유지 시키는 효과를 가진다. 한국어와 영어의 관점 변환 구문의 차이는 각 언어의 지속부사구의 어휘 목록의 전제(presupposition)의 차이로 설명된다. 본 논문은 영어의 지속부사구는 논항의 하위간격This paper will describe the application based on this approach developed by the authors in the FLEX EXPRIT IV n$^{\circ}$EP29158 in the Work-package "Knowledge Extraction & Data mining"where the information captured from digital newspapers is extracted and reused in tourist information context.terpolation performance of CNN was relatively better than NN.콩과 자연 콩이 성분 분석에서 차이를 나타내지 않았다는 점, 네 번째. 쥐를 통한 다양섭취 실험에서 아무런 이상 반응이 없었다는 점등의 결과를 기준으로 알레르기에 대한 개별 검사 없이 안전한
PDF

영어 발음 교육

이영길
- 대한음성학회:학술대회논문집
- /
- 대한음성학회 1997년도 7월 학술대회지
- /
- pp.258-259
- /
- 1997
1. 외국어로서의 영어 교육에 있어서 발음 지도는 어느 정도의 영어 수준에 도달하기를 기다릴 필요없이 가능한 한 저학년에서부터 직접 지도되어야 한다. 즉 영어 교육은 영어 발음 교육부터 시작되는 것이 가장 바람직하다. 어느 정도의 수준 높은 문법 이론을 알고 있는 (대)학생들이라도 발음에 관한 한 많은 연습이 요구되는 경우가 흔히 있다. 바꿔 말하면 이러한 학생들은 그들이 갖고 있는 문법 지식만큼 발음에 대한 적극적인 구사력도 당연히 발휘할 수 있어야할 것이다. 영어 교육을 강조할 때 문장 구조와 어휘 교육이 중요시된다면 발음 또한 조기 교육 단계부터 영어 교육 프로그램의 필수불가결한 요소로 인식되어야 한다. 그렇다면 제일 처음 무엇을 어떻게 시작 해야할 것인가\ulcorner 흔히 음소(phoneme)라는 말의 최소 단위부터 시작하여 자음군(consonant cluster)과 같은 음 결합체를 가르친 다음 단어 강세(word stress)를 다루며, 마지막으로 문장 강세(sentence stress), 리듬(rhythm), 억양(intonation) 등을 포함함 이음말(connected speech)을 가르치는 순서가 될 수 있을 것이다. 그러나 이러한 방법이 이론상 논리적이긴 하지만 실제로 영어를 외국어로 배우는 우리 학생들에게는 얼마나 효과를 거둘 수 있는지 매우 의심스렵다. 오히려 가장 유익한 순서는 기본 억양 과 같은 적절한 표현과 함께 주어진 화맥 속에서의 의미 있는 문장 강세를 가르치고 그 다음에 그에 수반되는 중요한 소리의 발음을 지적해 주는 것이다. 예를 들면 Give it to him과 같은 구조를 교사가 구두로 제시할 때 단어 하나 하나를 강조한 나머지 너무 천천히 말하게 되면 전체 문장의 발음을 오히려 어렵게 만들어버린다. 중요한 것 은 기본 의사소통에 필요한 부분에 초점을 맞추는 일이다. 개별 단어에 부수되는 문제점은 '보충 지도'(remedial teaching)로 교정이 가능하다. 2. 우리의 초등학교 영어 교육의 현황을 고려할 때 비록 발음 지도가 쉬운 일은 아니지만 미래 지향적 결과를 기대할 때 우선 두 가지를 생각할 수 있다. 첫째로 현재의 교육대학교의 교사양성에 있어서 영어교육의 교과과정을 염두에 두지 않을 수 없다. 1981년도부터 교육대학교가 4년제가 명실공히 영어과로 운영되기는 수년밖에 되지 않는 실정이다. 현재의 교과과정도 현장에서 영어교육을 담당하기에는 불충분할 뿐만 아니라 영어발음에 관한 뚜렷한 과정이 없는 실정이다. 혼히 외국인 강사가 담당하는 이른바 영어회화 시간이 곧 발음 시간도 될 수 있다고 생각하기 쉬우나 이것은 전적으로 별개의 문제이다. 따라서 체계적인 발음 교육을 할 수 있는 교과과정이 되기를 바란다. 3. 앞에서 언급했듯이 4년제 이전에 졸업한 현직 교사들은 재학 중 영어 발음에 관한 지도를 받아본 적이 없다. 여기서 중요한 것은 이들 교사들에게 적절하고도 충분한 발음 교육을 시켜야 하는 연수 과정이다. 소리로 듣고 말해야 하는 초둥 영어 교육에 서 교사의 발음에 관한 지식은 그 중요성을 아무리 과대평가해도 지나치지 않을 것이다. 문제는 연수 내용이다. 적어도 현재까지 실시되어 온 초둥영어교육 담당자 연수 교과목 내용은 핵심을 찾기 힘들 정도로 교파목이 다양하고 산만하다. 따라서 예를 들면 영어발음 지도에 관한 과목도 마지못해 끼워 넣는 식의 과목 배정이다. 여기에 고작 할당된 시간은 많아야 4시간 정도이다. 대학에서 한 학기에도 부족한 영어 발음을 아 무런 배경 지식도 없는 초등 교사들에게 4시간 동안 무엇을 어떻게 가르칠 것인가\ulcorner
PDF

도시 화훼경관 유형화에 관한 연구 - 문헌 및 전문가 FGI를 중심으로 - (A Study on Urban Flower Landscape Type Classification - Focused on Literature and Expert FGI -)

윤덕규;김건우
- 한국조경학회지
- /
- 제48권5호
- /
- pp.42-58
- /
- 2020
본 연구는 도시 화훼경관의 유형화에 관한 연구로서 연구결과, 첫째, 문헌과 사례를 통하여 화훼경관의 개념이 정리되기 위해서는 개념의 핵심 어휘와 문장에 공간적 요소, 형태적 요소, 자연적 요소, 인공적 요소라는 4가지 요소가 포함되어야 함을 선행연구를 통해 발견하였으며, 이 네 가지 요소를 통섭하는 화훼경관 개념을 새롭게 재구성하여 제시하였다. 화훼경관 통합 이론의 기초자료가 될 것이다. 둘째, 화훼경관이 도시경관의 한 장르로 그리고 도시경관의 단위로 정의되고 전문영역으로서 체계 구축을 위해 도시경관이라는 커다란 범주 안에서 도시경관의 개념과 특성, 기능을 고찰하고, 그 안에서 화훼경관과의 위계화 범주를 새롭게 정리하여 화훼경관의 도시경관성을 제시하였다. 셋째, 유형화를 통한 수요자들의 합리적인 선택자료 제시를 위해 화훼분야는 물론, 도시계획, 도시생태 분야까지 확장하여 관련 이론을 고찰하였으며, 유형화 요소 41개를 추출하였고 군집화 과정을 통해 4개의 핵심 유형화 요소를 도출하였으며, 4개의 요소를 분류 준거로 전문가 FGI에서 의견과 검증의 과정을 거쳐 중분류 9개, 소분류 30개 유형을 도출하여 제시하였다. 향후 연구과제로는 유형 적용과정에서 모니터링을 통해 유효한 유형의 추가 설정과 2단계 분류 위계를 3단계 위계로 확장하여, 보다 세분화된 적용 유형의 개발과 정리를 한다면 유형의 체계를 보다 발전시키는 좋은 연구가 될 것으로 보인다.
https://doi.org/10.9715/KILA.2020.48.5.042 인용 PDF KSCI

불어의 "묵음 e (e muet)"에 관한 연구 (Some notes on the French "e muet")

이정원
- 대한음성학회지:말소리
- /
- 제31_32호
- /
- pp.173-193
- /
- 1996
불어의 "묵음 e(e muet)"에 대한 정의를 내리기는 매우 까다롭다. 불어에서 "e"가 "묵음 e(e muet)"로 불리우는 이유는 "e"가 흔히 탈락되기 때문이다. 현재 "e muet"는 다음 발화체에서 볼 수 있듯이 열린음절에서만 나타난다. "Je/le/re/de/man/de/ce/re/por/ta/ge/." [omitted](나는 그 리포트를 다시 요구한다. : 이 경우 실제 발화시 schwa 삭제 규칙이 적용된다.) 둘째, 접두사에 나타나는 "e muet"는 s의 중자음 앞에서 s가 유성음, [z]로 발음되는 것을 막기 위해 쓰인다. "ressembler[omitted](닮다); ressentir[omitted](느끼다)" 같은 경우, 셋째, 몇몇 낱말의 경우 고어의 철자가 약화되어 "e muet"로 발음이 되고 있다. "monsieur[$m{\partial}sj{\emptyset}$](미스터), faisan[$f{\partial}z{\tilde{a}}$](꿩), faisait[$f{\partial}z{\varepsilon}$]("하다"동사의 3인칭 단수 반과거형)"등. 또 과거 문법학자들은 이를 "여성형의 E"로 불렀는데, 이는 형태론적으로 낱말의 여성형을 남성형과 구분짓기 위해 사용되고 있기 때문이기도 하다. 예를 들어, "$aim{\acute{e}}-aim{\acute{e}}e$"(발음은 둘 다 [${\varepsilon}me$]로 동일하다 : 사랑받다)의 경우. 현대불어의 구어체어서 "e muet"는 어말자음을 발음하기 위해 쓰이고 있다. 예를 들어, "pote[pot](단짝)-pot[po](항아리)". 이러한 "e muet"는 발음상으로 지역적, 개인적 및 문맥적 상황에 따라 그 음색 자체가 매우 불안정하며 여러 가지 음가(열린 ${\ae}$ 또는 닫힌 ${\O}$)로 나타난다. 예를 들어 "seul[$s{\ae}l$](홀로), ceux[$s{\O}$](이것들)"에서와 같이 발음되며, 또한 원칙적으로 schwa, [${\partial}$]로 발음이 되는 "Je[$\Im\partial$]"와 "le[$l{\partial}$]"의 경우, Paris 지역에서는 "Je sais[${\Im}{\ae}{\;}s{\Im}$](나는 안다); Prends-le[$pr{\tilde{a}}{\;}l{\ae}$](그것을 집어라)"로 발음을 하는 한편, 프랑스 북부 지방세서는 동일한 발화체를 [${\ae}$]대신에 [${\o}$]로 발음한다. 실제로 언어학적 측면에서 고려되는 "e muet"는 schwa로 나타나는 "Je[$\Im\partial$]"와 "le[$l{\partial}$]"의 경우인데, 불어 음운론에서는 schwa에 의해 대립되는 낱말짝이 없기 때문에 schwa를 음소로 인정할 것인가에 대해 논란이 있다. 그러나 불어에서 schwark 음운론적 역할을 한다는 사실은 다음과 같은 예에서 찾아 볼 수 있다. 첫째, 발음상으로 동사의 변화형에서 "porte[$p{\jmath}rte$](들다: 현재형), porte[$p{\jmath}rte$](과거분사형), porta[$p{\jmath}rte$](단순과거형)"등이 대립되며, 이휘 "Porto[$p{\jmath}rte$](포르토)"와도 대립된다. 둘째, 어휘적 대립 "le haut[$l{\partial}o$](위)/l'eau[lo](물)"와 형태론적 대립 "le[$l{\partial}$](정관사, 남성단수)/les[le](정관사, 복수)"등에서 "묵음 e"는 분명히 음운론적 역할을 하고 있다. 본 논문에서는 이와 같이 음색이 복잡하게 나타나는 "e muet"의 문제를 리듬단위, 문맥적 분포 및 음절모형 측면, 즉 음성학 및 음운론적 측면에서 다양하게 분석하여 그 본질을 규명해 보고 "e muet"탈락현상을 TCG(Theorie de Charme et de Gouvernement) 측면에서 새롭게 해석해 보았다.
PDF

동적 윈도우를 갖는 조건부확률 모델을 이용한 한국어 문맥의존 철자오류 교정 규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules using Conditional Probability Model with Dynamic Window Sizes)

최현수;권혁철;윤애선
- 정보과학회 논문지
- /
- 제42권5호
- /
- pp.629-636
- /
- 2015
한국어 맞춤법 검사기가 교정하는 오류어의 유형은 크게 단순 철자오류와 문맥의존 철자오류로 구분할 수 있다. 이 중 문맥의존 철자오류는 어절(word)단위로 봤을 때는 올바르지만, 문맥을 고려하였을 때 오류가 되는 유형으로, 교정 난도가 매우 높다. 문맥의존 철자오류는 글을 쓰는 사람들도 자주 저지르는 오류이므로, 이를 잘 검색하여 정확하게 교정하는 것이 맞춤법 검사기의 사용자가 갖는 신뢰도에 큰 영향을 미친다. 높은 정확도가 매우 중요하므로, 문맥의존 철자오류의 교정 방법은 대부분 규칙에 기반한다. 반대 급부로 재현율이 매우 낮다는 단점을 갖는다. 문맥의존 철자오류의 교정에서 재현율을 높이기 위한 방법은 크게 언어지식을 이용하여 규칙을 일반화하는 방법과 통계 정보에 기반을 하여 공기 어휘의 제약 조건을 확장하는 방법으로 나뉠 수 있다. 기존 연구는 언어지식을 이용하여 규칙을 일반화하는 다양한 방식을 연구했으나, 최고 성능이 평균 정확도 95.19%, 평균 재현율 37.56%을 보였다. 본 논문에서는 통계정보에 기반한 규칙의 확장 방식을 제안한다. 동적 윈도우를 갖는 조건부확률 모델을 이용한 방법이며, 최고 성능은 평균 정확도 97.23%, 평균 재현율 50.50%을 보여주었다.
https://doi.org/10.5626/JOK.2015.42.5.629 인용 KSCI

문서분류를 위한 의미적 주제선정방법 (Semantic Topic Selection Method of Document for Classification)

고광섭;김판구;이창훈;황명권
- 한국정보통신학회논문지
- /
- 제11권1호
- /
- pp.163-172
- /
- 2007
웹은 전세계 규모의 네트워크로써 문자, 화상, 음성 등의 미디어 정보들을 페이지 단위로 관리되며, 링크를 이용하여 분산된 정보들을 연결하고 있다. 이러한 웹의 지속적인 발전으로 무수한 정보들을 축적하고 있으며, 그 중 텍스트로 구성된 문서들이 주를 이룬다. 사용자는 이렇게 많은 정보들 중에서 자신이 원하는 특정 정보를 찾기 위해 웹을 사용한다. 그래서 웹은 사용자 요구에 적합한 정보를 검색해 주기 위해 계속적인 시도와 많은 연구들로 발전되고 있다. 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등 기존의 방법들은 문서의 의미적인 주제나 특징을 정확하게 처리 할 수 없어 사용자는 재검색을 해야 하는 문제점을 갖는다. 특히, 국내 문서 분류를 위한 연구는 많이 이루어지지 않아 검색에 더욱 어렵다. 이러한 문제점을 보완하기 위해 본 논문에서는 국내문서의 효율적이고 의미적인 분류를 위해 출현 개념의 TF(Term Frequency)와 주변 개념들과의 관계된 정도(RV : Relation Value)를 추출한다. 그리고 추출된 키워드들을 국내 어휘 사전인 U-WIN에 매핑하여 문서의 주제를 선택하고 본문에서 제 시하는 분류방법에 의해 웹 문서를 분류한다. 이는 문서 내 개념들의 관계를 이용하여 문서의 주제를 선정하고 문서의 의미적인 분류를 가능하게 한다.
https://doi.org/10.6109/JKIICE.2007.11.1.163 인용 PDF KSCI

한국 전통연희에서의 재담의 양상과 그 의의 (Joke-Related Aspects and their Significance in Traditional Korean Funny Performing Arts)

손태도
- 고전문학과교육
- /
- 제32호
- /
- pp.29-61
- /
- 2016
'재담(才談)'은 우리 말 중에서 '가장 재미있고 재치가 있는 언어단위'다. 그러나 이에 대한 연구는 아직 시작 단계다. 재담이라고 하면 재담말, 재담이야기, 재담소리, 재담극 등이 모두 관계되지만, 그 대상을 분명히 한다면 '재담말'로 한정하는 것이 좋다. 재담 곧 재담말은 '재치있게 하는 재미있거나 우스운 말'이다. 이러한 재담은 전통연희에 많이 있는데, 전통연희의 공연 장소는 대부분 개방된 마당으로 이런 곳은 항상 놀이적인 것을 요구했고, 그러한 놀이적인 것이 대사에서는 재담들을 요구했기 때문이다. 전통연희에서의 재담은 대체로 다음과 같다. 1) 상황과 관련되는 재담: 주어진 상황에 적절한 말, 과장(誇張)의 말, 과소(誇小)의 말, 논점일탈의 말, 인과(因果)의 말 2) 진술과 관련되는 재담: 열거의 말, 부연(敷衍)의 말, 대조의 말, 거짓으로 잘 둘러대는 말, 부정할 수 없는 말, 짐짓 모른 체하는 말, 짐짓 틀리게 하는 말 3) 어휘와 관련되는 재담: 곁말, 이어동의어(異語同義語), 이어유의어(異語類義語), 일부러 순서를 바꾼 말, 잘못 한 말 4) 발음과 관련되는 재담: 동음이의어(同音異義語), 이어동음어(異語同音語)이 외에도 더 있을 것이나, 위의 것들이 대표적인 것들이 아닌가 한다. 재담은 '인간이 자연과 사회의 여러 문제들을 극복하고 제대로 즐길 때만 가질 수 있는 인간의 자유로우면서도 창조적인 정신의 한 결과물'로 어느 시대, 어느 곳에나 필요한 것이다. 전통연희에서의 재담들을 바탕으로 오늘날에도 보다 다양하고 차원 있는 재담들이 이뤄졌으면 한다. 또 재담은 항상 창의성이 요구되기에 오늘날에도 새로운 방식에 의한 새로운 재담들이 만들어졌으면 한다.

쌍형어에 대하여 (On Doublets)

이은경
- 비교문화연구
- /
- 제50권
- /
- pp.425-451
- /
- 2018
본고에서는 기존의 쌍형어 논의들의 쟁점들을 살펴보았다. 일반적으로 쌍형어는 공통의 어원에서 갈라져 나온 단어들의 쌍을 가리키지만 공시적으로 의미가 같고 형식의 유사성을 보이는 단어들의 쌍이나 문법 형태소들의 쌍을 가리키기도 한다. 본고는 전형적인 쌍형어는 공통의 어원을 가지는 단어들의 쌍이라고 보았다. 쌍형어는 의미와 형식의 유사성이나 차이에 따라 하위 유형화가 가능하다. 전형적인 쌍형어에서 가장 멀어진 것은 공통의 어원을 가지지는 않지만 의미가 같고 형식이 유사한 단어들의 쌍이라고 할 수 있다. 두 번째 쟁점은 쌍형어가 단어들의 쌍을 가리키는가 하는 점이다. 공통의 어원을 가지는 단어들의 쌍이 전형적인 쌍형어이나 조사나 어미의 경우에도 쌍형어를 인정한다면 조사 쌍형어나 어미 쌍형어의 존재가 가능할 것이다. 접미사의 경우에는 접미사 쌍형어의 인정이 가능할 수 있으나 접미사가 결합한 파생어가 쌍형어를 형성하므로 굳이 접미사 쌍형어를 인정할 필요는 없다고 보았다. 어미의 경우도 해당 어미가 결합한 활용형의 쌍형어를 인정할 수도 있으나 한국어의 어미가 통사단위로서의 성격이 강하다는 점을 고려하면 엄청나게 많은 활용형의 쌍형어를 인정하기보다는 해당 어미를 쌍형어라고 하는 쪽이 적절할 것이다. 마지막으로 어간 쌍형어나 어미 쌍형어 일부가 기저형 층위에서 일종의 이형태 관계를 이루는지에 관한 쟁점이 있을 수 있으나 본고에서는 하나의 어휘 항목 내에 속하는 경우에는 쌍형어에 속하지 않는 것으로 보았다. 이들은 일종의 복수 기저형에 해당한다고 할 수 있다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

안성만;정여진;이재준;양지헌
- 지능정보연구
- /
- 제23권2호
- /
- pp.71-88
- /
- 2017
언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.
https://doi.org/10.13088/jiis.2017.23.2.071 인용 PDF KSCI

검색결과 139건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)