• 제목/요약/키워드: 텍스트 범주화

검색결과 49건 처리시간 0.026초

해외 데이터베이스의 통제키워드에 기초한 국내 학술지 논문의 자동분류 성능 향상에 관한 실험적 연구 (An Experimental Study on the Performance Improvement of Automatic Classification for the Articles of Korean Journals Based on Controlled Keywords in International Database)

  • 김판준;이재윤
    • 한국문헌정보학회지
    • /
    • 제48권3호
    • /
    • pp.491-510
    • /
    • 2014
  • 학술지 논문의 효율적인 관리 및 검색을 위한 주요 요소인 키워드는 통제키워드와 비통제키워드로 구분할 수 있다. 그러나 현재 국내 데이터베이스에서 대부분의 학술지 논문에는 비통제키워드인 저자키워드만이 부여되어 있을 뿐, 망라적인 탐색을 돕는 통제키워드로서 디스크립터는 제공되지 않고 있다. 이 연구에서는 해외 데이터베이스의 학술지 논문에 부여된 통제키워드를 학습한 분류기를 사용하여, 국내 학술지 논문에 디스크립터를 자동 할당하는 실험을 수행하였다. 그 결과, 국외 데이터베이스의 디스크립터 학습을 통해 영문 초록이 있는 국내 학술지 논문에 통제키워드를 자동 할당할 수 있는 가능성을 확인하였다. 또한, 다양한 분류기 및 분류기 결합을 통하여 이러한 디스크립터 자동 할당의 성능 향상을 모색하였다.

자기주도학습을 위한 이러닝 콘텐츠 검색 지원 시스템 설계 (E-Learning Content Search Support System Design for Self-Directed Learning)

  • 용성중;김유두;문일영
    • 실천공학교육논문지
    • /
    • 제12권1호
    • /
    • pp.73-83
    • /
    • 2020
  • 최근 공교육, 사교육, 평생교육, 직업훈련교육 분야에서 지식전달 위주의 주입식 교육방식에서 학습자들이 능동적으로 지식에 대처할 수 있는 자기주도학습에 대해 중요성이 대두되고 있으며, 이는 사회변화에 따라 요구되는 인재상으로 스스로 자아개념, 자신감, 창의성을 발견하고 계발시키는 학습 방법으로 더욱 중요해지고 있다. 하지만 자기주도적 학습에 대한 개념 및 전략 등 다양한 이론적 지식들이 존재하고 있지만, 실제 자기주도학습 운영계획 또는 학습 분야에 따라 학습자가 원하는 학문 분야의 콘텐츠를 손쉽게 제공받는 시스템에 대해 부족한 상황이다. 따라서 본 논문에서는 학습자가 자기주도적 학습을 위한 다양한 학습 콘텐츠를 제공받기 위해 정보를 획득하고 의미를 정제하여 범주화 할 수 있는 텍스트 마이닝 기법을 활용하여 온라인상에서 학습자가 습득하려고 하는 학문 분야의 다양한 콘텐츠를 제공하는 시스템을 설계하고 활용하는 방안에 대한 연구를 수행하였다.

초한고사를 소재로 한 국문시가 장르의 실현 양상 (Aspects of Realization of the Korean Poetry Genre Based on Chohan-gosa)

  • 육민수
    • 동양고전연구
    • /
    • 제54호
    • /
    • pp.183-211
    • /
    • 2014
  • 이 글은 초한고사를 소재로 한 국문시가 장르 중에서 가사, 시조, 잡가를 대상으로 하여 그 실현 양상과 특성을 살펴보았다. 초한고사는 중세 지식인의 기초적 역사 문예 담론으로서, "서한연의" 등의 연의류, <초한전>, <항우전>과 같은 소설 및 수십 종의 목판본, <초한가>(잡가 단가) 및 <우미인가>(가사)와 수십 종의 이본들, 백여 편에 이르는 초한고사 소재 시조, 서거정의 <우미인사(虞美人辭)>, 신흠의 <홍문요(鴻門謠)>와 같은 한문학 작품 등 거의 모든 장르라고 해도 과언이 아닐 만큼 광범위한 범주에서 그 문예적 가치를 실현시켜 왔다. 그중 이 글에서는 가사, 시조, 잡가를 대상으로 고찰하였다. 우선 초한고사 소재 가사는 규방 문화권에서 주로 향유된 <우미인가>를 대상으로 삼아, 이 텍스트가 당대의 시대 담론인 여항-시정 문화권의 영향력과 실질적 향유 공간인 규방 문화권의 특성이 텍스트 안에 혼효됨으로써, 통속화된 역사와 규범적 이념의 교직(交織)이라는 특성을 지니고 있음을 파악하였다. 시조의 경우에는 초한고사 속 인물 중 항우가 가장 많이 시조화 하였기 때문에 항우가 등장하는 시조를 중심으로 고찰하였다. 항우는 천하장사(영웅)나 우미인과 이별하는 인물로 이미지화 한 경우가 많았는데 이는 시조 향유 공간의 연희적 특성에 기인(起因)하는 것으로 보았다. 마지막으로 잡가는 낯익은 역사 담론의 자극적 재편이라는 특성을 중심으로 실현되고 있음을 파악하였다. <초한가>가 선행 담론인 "서한연의"의 내용을 원천으로 삼았지만 그대로 변용하기만 한 것은 아니며 도시 대중의 흥미를 끌기 위해 비감(悲感)의 심화(深化)나 현실화, 유행하는 이미지의 활용과 같은, 정감을 자극할 수 있는 방향으로 텍스트가 짜였음을 논하였다.

세종 의존명사/대명사/수사 전자사전의 정보표상 구조 (The Representational Structure of Lexical Informations of Korean non-autonomous nouns in the Sejong Electronic Dictionary)

  • 방성원;호정은;김종인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.341-347
    • /
    • 2001
  • 세종전자사전이 궁극적으로 범용전자사전을 지향한다는 점에 비추어 볼 때, 텍스트 자동 분석과 생성, 정보 검색 및 자동 번역 등에 활용될 데이터베이스로서의 전자사전은 자연 언어 어휘의 내적 구조와 기능방식에 관한 정보들, 가령 음운 통사 의미 화용적 가치와 실현 조건 등에 관한 정보들을 체계적이고도 정교하게 담고 있어야만 한다. 의존명사, 대명사, 수사 범주에 속하는 언어 단위들은 단일 명사와 구별되는 어휘 통사적 속성들을 지니며, 사전의 기술 구조에는 그 정보 값들을 체계적으로 명시화할 수 있는 정보 항목과 표상 구조가 설정되어야 한다. 가령 의존명사처럼 통사 의미적 자율성을 지니지 않는 언어 요소의 경우, 어휘 관계 정보보다는 인접하는 여타 언어 단위들과의 호응관계나 결합제약 조건들이 더 중요한 정보일 수 있다. 본 사전이 체언사전의 하위사전으로 별도로 구축되는 것은 단일어 사전에서 그러한 정보들을 효과적으로 표상하기 어렵기 때문이다. 그러나 본 사전은 실제적으로는 체언사전에 통합되어 운영된다는 점에서 이중적 지위를 누린다고 하겠다.

  • PDF

메디컬 드라마의 크로노토프 (The Chronotope of Medical Drama)

  • 원용진;이준형;박서연;임초이
    • 대중서사연구
    • /
    • 제25권2호
    • /
    • pp.169-216
    • /
    • 2019
  • 본 연구는 서사물 장르와 사회 사이의 공진화(共進化)를 분석하기 위한 도구로 바흐친의 크로노토프(Chronotope) 개념을 제안한다. 바흐친은 크로노토프 개념을 통해 문학작품이 시간과 공간 축이 교차되는 토대 위에 있으며, 그러한 교차 위에 서 있는 문학작품이 언제나 사회적이고 역사적인 크로노토프와 대화하고 상호 침투하고 있다고 말한다. 따라서 문학작품, 또 그것에서 확장된 영화나 드라마 등 서사물 일반의 크로노토프를 찾아내고 분석하는 일은 서사물의 크로노토프와 사회의 크로노토프가 어떤 공명 과정을 통해 특정한 사회적 실재들을 만들어왔는가를 밝히는 일이다. 이러한 개념을 분석적으로 활용하기 위해 '크로노토프 드라마 분석 방법'을 제안하고 구체적으로 한국 메디컬 드라마 장르를 분석했다. 의료와 건강, 질병이라는 자연화된 범주들은 실제로 사회적으로 구성된 실재들이며, 이러한 사회적 구성 과정에 큰 영향을 미치는 대중서사물에 대한 분석은 중요하지만 과소하게 이루어진 작업이다. 분석 결과, 한국 메디컬 드라마의 크로노토프는 <종합병원> 이래로 등장한 '학교의 크로노토프'와 <하얀거탑> 이래로 등장한 '밀실의 크로노토프'를 변주하며 발달하고 있었다. 이때 장르적 크로노토프는 공간적으로는 확장되고 시간적으로는 응집되어가고 있었다. 다시 말해 장르 내 구조와 체계의 영향력은 커지고, 개별 주체들의 역량은 작아졌다. 이러한 크로노트프의 변화는 신자유주의적인 공간 팽창과 동시적 생산이라는 사회적 현실의 크로노토프와 공명하는 것으로 해석되었다. 한국 사회를 지배하고 있는 신자유주의적 흐름은 의료라는 범주를 포섭해 나갔으며 나아가 드라마 텍스트의 크로노토프에 영향을 미치고 있었다. 또한 메디컬 드라마 장르가 만들어내는 의료에 대한 대중적 이해는 다시 의료라는 사회적 실재를 구성하는 과정에 틈입했을 것으로 짐작할 수 있다.

초등학교 과학 교과서에 제시된 캐릭터 삽화의 역할 분석: 2009개정 과학과 4학년 교과서를 대상으로 (Analysis of the Characters' Role Presenting Elementary School Science Textbook: Targeting the 2009 Revised Science 4th-Grade Textbook)

  • 성승민;채희인;임희준
    • 한국과학교육학회지
    • /
    • 제36권1호
    • /
    • pp.167-175
    • /
    • 2016
  • 본 연구에서는 2009개정 과학 교과서에 새롭게 추가된 캐릭터의 역할 범주화, 역할 및 발문 분석을 통해 과학 교과서에 사용된 캐릭터의 기초 정보를 제공하고 추후 교과서 제작에 참고할 수 있는 시사점을 알아보고자 하였다. 연구대상은 2009개정 초등학교 과학과 교육과정에 따라 개발된 과학 교과서 중 4학년 교과서이다. 분석방법은 분석 대상 선정 및 분석틀 개발, 캐릭터 역할 분석, 발문 분석이다. 연구 결과, 캐릭터의 역할 유형은 자료제공, 동기유발, 탐구 활동 안내, 탐구결과 순으로 활용되고 있는 것으로 나타났다. 과학 교과서 속 캐릭터를 영역별로 분석한 결과 생명 영역이 자유탐구, 에너지, 물질, 지구 영역보다 많이 활용되는 것으로 나타났다. 발문 유형 분석 결과는 확산적, 예상적, 적용적, 재인적 발문 순으로 나타났고 회상적, 평가적 발문은 없었다. 본 연구 결과는 그림과 텍스트의 결합 형태로 제시되는 캐릭터의 역할을 범주화하고 그 역할을 규명하여 실제 교과서 속에 활용된 캐릭터를 분석하였다는 점에서 의의가 있으며, 이는 앞으로 초등 과학 교과서를 구성하는 과정에서 보다 체계적이고 유기적인 캐릭터 활용에 시사점을 줄 것이라 판단된다.

고객 리뷰를 통한 모바일 앱 서비스 포지셔닝 분석: 비대면 진료 앱을 중심으로 (Customer Voices in Telehealth: Constructing Positioning Maps from App Reviews)

  • 김민재;이홍주
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.69-90
    • /
    • 2023
  • 본 연구의 목적은 최근 확산되고 있는 국내 비대면 의료 서비스 애플리케이션의 서비스 속성과 소비자 반응을 정확히 평가하고 각 서비스간 차별성을 시각화하기 위한 방안을 모색하는 것이다. 이를 위해 국내에서 서비스 중인 주요 6개 비대면 진료 애플리케이션의 구글 플레이스토어 사용자 리뷰 데이터 총 2만 건을 수집하였다. 수집된 데이터에 대해 문장 단위로 분리한 후, BERTopic 모델링 기법을 적용하여 각 문장이 속한 서비스 속성에 대한 토픽을 도출하였다. 다음으로 미세조정된 KoBERT 모델을 통해 각 문장의 토픽에 대한 감성 점수를 예측하였다. 분석 결과, 사용자 리뷰로부터 애플리케이션 속성과 진료 속성 두 가지 범주 아래에서 각각 5개와 3개의 서비스 특성 토픽이 발견되었다. 애플리케이션 속성으로는 '예약 시스템', '사용 용이성', '재고 확인', '디자인', '안정성' 등이, 진료 속성으로는 '원격 의료적 속성', '편의성', '배송' 등이 도출되었다. 각 애플리케이션은 이러한 속성들에 대해 다른 수준의 감성 점수를 보였다. 주성분분석을 통해 속성별 감성 점수를 축약하여 2차원 공간 상의 포지셔닝 맵을 생성하였다. 결과적으로 본 연구는 비대면 진료 애플리케이션 사용자 리뷰 텍스트를 바탕으로 실증적 통계 방법과 텍스트 마이닝 기술을 접목하여 서비스 속성 도출, 감성 분석, 제품 포지셔닝 이라는 일련의 체계를 제시하고 있다. 이는 비대면 진료 애플리케이션의 서비스 품질과 소비자 반응을 객관적으로 진단할 수 있는 효과적인 방안이 될 것으로 기대된다.

남부루이지애나의 베트남 移民集團과 佛敎: 鎔鑛爐 속의 成分? 혹은 文化的 多樣性의 成分? (Vietnamese Immigrants and Buddhism in Southern Louisiana: Ingredients for 'Melting Pot' or for Cultural Diversity?)

  • 이영민
    • 대한지리학회지
    • /
    • 제31권4호
    • /
    • pp.685-698
    • /
    • 1996
  • 1975년 베트남 공산화 이후 본격적으로 이루어진 베트남인들의 미국 이민은 짧은 기간동안 대규모로 진행되어 1991년 현재, 약 850,000명에 이르고 있다. 그들의 다문화사회로의 인구이동과 문화적 적응의 문제는 그 동안 사회과학계의 쟁점으로 부상하여 적지 않은 연구들이 이루어 졌다. 그러나 대부분의 연구들은 베트남 이민집단을 단순히 미국 다문화사회의 여러 민족집단들 중 하나의 하위민족으로, 즉 주류집단의 관점에서 다루고 있다. 어떻게 하위민족으로서 미국사회에 편입되고 있는가?, 어떻게 새로운 장소에 정착하고 그 장소를 고유하게 창조해 나고 있는가? 등의 문제를 베트남인 자신의 입장에서 개진한 연구는 매우 적은 실정이다. 본 연구는 미국 루이지애나주 배톤루즈시 근교의 베트남 불교사원 신도들의 생활과 적응전략을, 즉 새로운 장소에서의 사회환경과 문화적 정체성 형성과정과의 관계를 민속지적 연구방법을 통하여 다루고 있다. 참여관찰과 인터뷰는 1992년 9월부터 11월 사이에 실시되었다. 남부루이지애나, 배톤루즈시, 그리고 불교사원, Chua Tu-Bi(慈悲寺)는 베트남 이민집단과 주류문화집단과의 상호교류의 장으로서 일종의 공간적 텍스트이다. 불교사원은 베트남인들의 내적 평화를 연마하는 종교적 목적을 달성키 위해 그들 자신들의 손으로 건조되었다. 현세의 모든 고통을 부의 추구와 같은 인간 자신의 욕망에 기인하는 것으로 간주하는 불교이념은 직관적 사고와 자기성찰을 통한 정신적 풍요를 추구한다. 이러한 불교의 가치는 프로테스탄트 이념에 바탕을 둔, 물질적 풍요를 위한 근로정신을 강조하는 미국적 가치와 어긋난다. 이러한 베트남 불교의 중교적 특징은 변화된 새로운 환경에서 재창조되어 오히려 그들의 적응전략으로서 기능한다. 사회, 경제적 차별을 극복하기 위해 그들은 경제적 부의 축적을 통한 계층상승만이 최선의 방법이라고 생각하고 있다. 불교사원은 그들이 불교이념을 연마하는 장소이기도 하지만, 동시에 현실세계에서 주류집단의 이념을 따르면서 겪게되는 정신적 피로를 위로 받는 장소이기도 하다. 불교의 정신적 풍요라는 가치가 주류사회의 가치와 전략적으로 혼합되어 변화된 현실에의 적응에 공헌을 하고 있는 것이다. 그러나 더욱 중요한 것은 불교를 통한 동족집단의 결속망이 이중노동시장이라는 미국사회의 불평등한 경제 구조를 극복할 수 있는 기반을 제공하고 있다는 점이다. 주류집단의 외부적 범주화에 의한 격리(segregation)를 그들은 내부적 범주화를 통한 응집(congregation)으로 승화시켜 계층상승의 도약대로 삼고 있다. 불교사원은 베트남 이민자들간의 상호 결속을 도모함으로써 그들의 정체성을 공고하게 해주는 역할을 하고 있다. 또한 불교사원은 주류집단이 자신들의 문화적 정체성을 인정하고 있고, 따라서 자신들도 미국사회에 통합되어 있다는 확신을 갖게 하는 일종의 가시적 상징이다. 그러나 다문화사회로의 국제인구이동을 통한 권력관계의 변화가 그들로 하여금 하위집단으로서 생존할 수 있는 전응전략을 창출해 내게 하였고, 그 과정에서 정체성의 변화는 필연적이라 하겠다. 민족정체성은 사회공간적 현상과 밀접히 연결되어 있는 가변적 현상인 것이다.

  • PDF

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

결혼이민여성의 지역사회적응 특성 (Trait of Local Community Adaptation of Migrant Women by Marriage)

  • 성향숙
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.307-316
    • /
    • 2011
  • 본 연구에서는 결혼이민여성의 지역사회 적응의 특성을 밝히고, 이를 토대로 결혼이민여성의 지역사회 적응 향상을 위한 실천적 함의를 도출하고자 하였다. 이를 위하여 2010. 4월부터 5개월간 8명의 참여자를 대상으로 면접을 실시하였다. 연구방법은 현상학적 연구 중 Colaizzi방법론을 채택하였는데, 심층면접을 통하여 녹취한 진술을 텍스트화 한 후, 유의미한 진술내용을 코딩하여, 주제(themes), 주제묶음(theme cluster)으로 범주화하였다. 분석결과, '내적역량의 강화', '문화적응', '제한적 수혜자 되기', '인적네트워크 없음', '미래를 낙관할 수 없음' '지역사회 안착을 염원함', '한국을 떠날 수 있음'으로 총 7개의 주제묶음과 17개의 주제, 47개의 의미를 도출하였다. 이러한 결과를 토대로 지역사회에서 결혼이민여성의 적응력 향상을 위한 사회복지실천의 함의를 제시하였다.