• 제목/요약/키워드: 존재의 언어

검색결과 711건 처리시간 0.025초

완전한 콜드 스타트 문제에서 교차 도메인 추천 시스템 (Cross-Domain Recommendation System in Complete Cold Start Problem)

  • 남규현;유재성;채경수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.514-518
    • /
    • 2019
  • 기존의 교차 도메인 추천은 일반적으로 서로 다른 도메인 데이터의 지식 결합이나 지식 공유를 바탕으로 진행된다. 이러한 방식들은 최소 한 개 이상의 도메인 데이터가 필요해서 모든 도메인의 피드백 데이터가 없는 실제 서비스 초기 상황에는 적합하지 않을 수 있다. 따라서 본 논문에서는 서비스 초반 모든 도메인의 피드백 데이터가 없고 콘텐츠 데이터만 존재하는 상황에서 교차 도메인 추천 시스템을 효과적으로 시작하기 위해 텍스트 임베딩, 클러스터링, 프로파일링 및 콘텐츠 기반 필터링을 활용한 추천 시스템 구성을 제안하고자 한다. 평가를 위해 여행지, 지역 축제, 공연을 포함하는 문화 관광 데이터와, 이에 대한 사용자 프로파일링 결과를 바탕으로 추천을 진행하였다. 그 결과, 콘텐츠 임베딩에 대한 유사도를 시각화하여 교차 도메인 아이템 간 유사성을 확인할 수 있었고, 사용자별 추천 결과를 통해 제안한 교차 도메인 추천 시스템이 유의미하게 동작함을 보였다.

  • PDF

Large Language Model을 통한 대화 데이터셋 자동 생성 및 검색 성능 향상 (Conversation Dataset Generation and Improve Search Performance via Large Language Model)

  • 최형준;홍범석;최원석;한영섭;전병기;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.295-300
    • /
    • 2023
  • 대화 데이터와 같은 데이터는 사람이 수작업으로 작성해야 하기 때문에 데이터셋 구축에 시간과 비용이 크게 발생한다. 현재 대두되고 있는 Large Language Model은 이러한 대화 생성에서 보다 자연스러운 대화 생성이 가능하다는 이점이 존재한다. 이번 연구에서는 LLM을 통해 사람이 만든 적은 양의 데이터셋을 Fine-tuning 하여 위키백과 문서로부터 데이터셋을 만들어내고, 이를 통해 문서 검색 모델의 성능을 향상시켰다. 그 결과 학습 데이터와 같은 문서집합에서 MRR 3.7%p, 위키백과 전체에서 MRR 4.5%p의 성능 향상을 확인했다.

  • PDF

Prefix-Tuning 기반 Open-Ended Knowledge Tracing 모델 연구 (Enhancing Open-Ended Knowledge Tracing with Prefix-Tuning)

  • 손수현;강명훈;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.672-676
    • /
    • 2023
  • 지식 추적 (knowledge tacing)은 주어진 학습자의 과거 문제 해결 기록을 기반으로 학습자의 지식 습득 정도를 파악하여 목표 문제에 대한 정답 여부를 예측하는 것을 목표로 한다. 이전 연구에서는 이진 분류 기반의 모델을 사용하여 정답 유무만 예측하였기 때문에 학습자의 답변에 존재하는 정보를 활용하지 못한다. 최근 연구에서는 이를 생성 태스크로 변환하여 컴퓨터과학 분야에서 프로그래밍 질문에 대한 지식 추정을 수행하는 open-ended knowledge tracing (OKT)이 제안되었다. 하지만 최적의 OKT 모델에 대한 연구는 진행되지 않았으며 따라서 본 논문에서는 시간에 따라 변화하는 학습자의 지식 상태에 따라 답변 생성을 조정하는 새로운 OKT 방법론을 제안한다. 실험을 본 논문에서 제안하는 방법론의 우수성과 효율성을 증명한다.

  • PDF

금융과 페르소나(persona): 금융의 정치 철학적 이해 (Finance and Persona: a Philosophical Understanding of Modern Finance)

  • 김종철
    • 사회경제평론
    • /
    • 제31권3호
    • /
    • pp.165-201
    • /
    • 2018
  • 프리드리히 니체와 앨프레드 화이트헤드에 따르면, 근대 서양의 존재론이 범한 치명적인 오류는 현실의 구조가 언어의 구조와 같다고 착각하는 데 있다. 언어는 주어-술어 구조를 띠고 있는데, 현실도 이 구조를 띠고 있다고 착각해서, 허구적인 언어적 주어를 현실적으로 존재하고 있는 주체로 잘못 설정하고 있다. 이 허구적인 주체 개념이 바로 인격 개념이다. 본 논문은 이러한 허구적인 인격 개념이 어떻게 자본주의 금융이 발전하는 데 토대를 이루는지 분석할 것이다. 본 논문의 분석하는 역사적 시기와 장소는 17세기 후반 영국이다. 이 시기에 영국에서 근대적 형태의 은행업이 시작됐으며 동시에 근대적 주체 개념인 "인격" 개념이 존 로크 등에 의해 철학적으로 발전한다. 동시에 유한책임 주식회사와 국가 또한 독립적인 추상적 인격성이 추상적인격체로 독립성을 획득한다. 이 추상적 인격 개념은 사회적 관계를 "배타적 소유"와 "채권-채무" 관계로 환원하고, 이 환원이 근대 금융의 존재론적 바탕을 이룬다. 배타적 재산권은 행사하지만 책임을 져야 할 때는 채권으로 변모해 그 책임을 회피하는 제도가 바로 근대 금융의 본질이다. 그리고 영원하고 독립적인 인격성을 지니게 된 근대적 집단을 채무자로 전락시킴으로 근대 금융의 채권자들은 자신들의 특권을 크게 강화한다.

포스트드라마 시대에 따른 배우의 몸 훈련의 방향성,'비우기(empty)' (The Direction of Physical Training for Actor in Post-Drama Era, "Empty")

  • 라경민
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권8호
    • /
    • pp.77-90
    • /
    • 2020
  • 오늘 날, 이른 바 '포스트드라마(post-drama)' 시대로의 전환은 연극의 중심으로 여겨졌던 텍스트(text)의 변화와 배우 역할의 확장을 가져왔다. 텍스트의 고정된 세계가 중심이 되는 전통적인 드라마 연극에서의 배우는 등장인물의 세계를 진실하게 표현해야 하는 의무를 부여받는다. 그러나 포스트드라마 시대로 접어든 이후, 배우는 더 이상 텍스트의 고정된 의미를 해석하여 '전달'하는 존재가 아니라 관객을 만나는 '지금, 여기'에 유효한 의미를 '생산'하는 존재로 탈바꿈한다. 즉, 통일성과 종합성을 지니는 완성된 작품을 생산하기 위한 것이 전통적인 배우, 'actor'의 역할이었다면 포스트드라마 시대의 배우는 스스로 내러티브의 주체가 되어 다양한 연극 언어를 창조할 수 있는 'performer'로서 역할이 확장된 것이다. 그럼에도 불구하고 여전히 근간을 이루고 있는 텍스트를 통한 언어 중심(verbal-centered) 연기교육은 새롭게 변화하고 있는 동시대의 연극성을 충족시키지 못하며 교육과 현장의 괴리를 발생시킨다. 따라서 연구자는 위와 같은 한계를 극복하기 위해 탈(脫)언어 중심 연기교육이 필요하다는 점을 주장하며 '비우기(empty)' 측면을 중심으로 배우의 몸 훈련에 대해 조명하고자 했다. 포스트드라마 시대의 배우의 몸은 텍스트에 종속되지 않는 독자적인 언어이다. 기호적 의미를 생산하는 것에 억압받지 않고 현상 그 자체로 인식되며 관객의 감각에 즉발적으로 지각되는 현존의 언어이다. 따라서 포스트드라마 시대의 몸 훈련은 '채우는 것' 보다는 '비우는 것'을 통해 개방성, 즉흥성을 습득해야 한다. 이에 연구자는 예지 그로토프스키(Jerzy Grotowski), 피터 브룩(Peter Brook), 자크 르콕(Jacuques Lecoq)을 중심으로 '비우기' 측면에서의 몸 훈련을 비교분석했다. 공통적으로는 현존을 위해 개방된 몸의 상태를 강조했으며, 그로토프스키는 '역동성'을 브룩은 '섬세함'을 르콕은 '즉흥성'을 강조하는 특징을 보였다. 위 같은 사례를 통해 포스트드라마 시대에 따른 몸 훈련의 방향성으로서 '비우기'가 의미하는 바에 대해 '기술을 반복, 습득하기 위함이 아닌 현존을 위해 비워진 상태', '오브제(object) 등 탈(脫)언어적 요소와 결합을 위해 준비된 상태' 등으로 파악하였다. 그리고 이는 텍스트의 대리 전달자가 아닌 내러티브의 주체적 자아로 거듭난 '퍼포머'를 지향하는 배우훈련임을 강조했다. 이에 포스트드라마 시대의 연기교육은 텍스트와 언어의 억압으로부터 해방되어야 한다는 점을 강조한다. 특히, 몸 훈련의 경우 배우의 고정된 상태를 만들어 내는 채우기에서 벗어나 다양한 연극언어와 결합할 수 있도록 개방되어 있는 '비우기'를 지향해야 함을 주장하며 본고는 마무리 된다.

The Ability of L2 LSTM Language Models to Learn the Filler-Gap Dependency

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권11호
    • /
    • pp.27-40
    • /
    • 2020
  • 본 논문은 장단기기억신경망(LSTM)이 영어를 배우면서 학습한 암묵적 통사 관계인 필러-갭 의존 관계를 조사하여 영어 문장 학습량과 한국인 영어 학습자(L2ers)의 문장 처리 패턴 간의 상관관계를 규명한다. 이를 위해, 먼저 장단기기억신경망 언어모델(LSTM LM)을 구축하였다. 이 모델은 L2ers가 영어 학습 과정에서 잠재적으로 배울 수 있는 L2 코퍼스의 영어 문장들로 심층학습을 하였다. 다음으로, 이 언어 모델을 이용하여 필러-갭 의존 관계 구조를 위반한 영어 문장을 대상으로 의문사 상호작용 효과(wh-licensing interaction effect) 즉, 정보 이론의 정보량인 놀라움(surprisal)의 정도를 계산하여 문장 처리 양상을 조사하였다. 또한 L2ers 언어모델과 상응하는 원어민 언어모델을 비교 분석함으로써, 두 언어모델이 문장 처리에서 필러-갭 의존 관계에 내재된 추상적 구문 구조를 추적할 수 있음을 보여주었을 뿐만 아니라, 또한 선형 혼합효과 회귀모델을 사용하여 본 논문의 중심 연구 주제인 의존 관계 처리에 있어서 원어민 언어모델과 L2ers 언어모델간 통계적으로 유의미한 차이가 존재함을 규명하였다.

응구기 와 시옹오의 문화이론과 번역의 의미 (Ngugi wa Thiong'o's Cultural Theory and Its Significance in Translation)

  • 이효석
    • 비교문화연구
    • /
    • 제46권
    • /
    • pp.411-434
    • /
    • 2017
  • 응구기는 최근 기쿠유어로 쓴 자신의 작품을 50여개 이상의 아프리카 지역어로 번역하는 작업에 관여하고 있다. 이는 로컬의 다양한 언어와 문화의 가치를 수호하기 위해 서구의 강한 언어와 문화에 맞서는 구체적인 행동이다. 한편 응구기는 자신의 작품을 영어로도 직접 번역하였는데, 이는 아프리카 문화의 폐쇄성을 막고 외부의 지평으로 열어두는 수평적 운동을 위한 것이다. 요컨대 주변부 언어 간의 대화도 중요하지만, 지배언어와 주변부 언어 간의 대화 역시 중요하다는 것을 강조하고 있는 것이다. 이때 번역이 이러한 역할을 수행하는 가교가 된다고 본다. 한편 사이먼 기칸디와 같은 학자는 응구기의 영어소설은 응구기 자신이 보존하려는 기쿠유어가 아니라 오히려 번역언어인 영어를 더욱 강화시켜 주는 것은 아닌지 의심한다. 강한 언어인 영어로의 번역본이 상대적으로 소수언어인 기쿠유 원본의 존재와 권위를 훼손하는 딜레마에 빠지게 된다는 것이다. 그러나 포스트식민 번역을 다루는 여러 학자들은 '두터운' 번역이 원본의 권위를 훼손하기 보다는 일종의 '새로운' 텍스트로서 문화적 대화와 소통의 메커니즘 속에서 작동한다고 주장한다. 또 응구기는 영어 번역본을 통해 아프리카 외부와 소통하고 아프리카 다양한 지역어로의 번역을 통해 내부와 소통하는 이중적인 전략을 구사한다. 응구기는 번역을 다양한 보편들의 대화와 연대, 나아가 보편적 보편을 탐색하는 가능성의 매체로 본다.

미디어콘텐츠 언어의 암묵적 의미 해석과 미디어 리터러시 교육의 연계 가능성 (Implicit Interpretation of Advertising Content Language and Possible Connection of Media Literacy Education)

  • 임지원
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권3호
    • /
    • pp.243-250
    • /
    • 2021
  • 본 연구는 의사소통의 관점에서 고도의 설득적 언어형식을 담은 광고콘텐츠의 암묵적 의미와 그 해석 과정을 의사소통 교육과 관련하여 논의하고 동시에 현대사회의 미디어 리터러시 교육을 위한 해석적 코드를 마련하는데 논의의 목적을 가진다. 성공적인 논의를 위해 필자는 특별한 목적을 구현하는 광고콘텐츠의 서사적 내용을 일반적인 대화행위로 가정하고, 내포된 암묵적 의미 표현에 대한 규칙성이 존재함을 새롭게 문제제기로 밝혔다. 또한 현 사회의 미디어 리터러시 교육이 올바르게 진행되기 위해선 선행연구의 의사소통의 원리로 암묵적 의미에 대한 언어적 해석을 지도할 수 없음을 밝혔다. 해결방안으로 사회 문화적 공유 지식과 인지가 필수적인 해석 코드임을 확인하였다. 확장된 논의를 위해 언어사용적인 면에서 특수한 목적을 지닌 광고미디어언어를 분석대상으로 하여 그 속에 나타난 암묵적 의미의 해석 과정을 검증하였다. 필자가 임의적으로 유형화시킨 암묵적 광고언어를 분석한 결과, 화자가 설득할 의도로 암묵화한 언어적 의미는 다양한 정보 및 인지효과에 의한 분석의 틀로 대부분 미디어 리터러시 교육으로 제공될 수 있음을 확인하였다. 즉 수용자들은 미디어 언어에 내재된 암묵적 의미를 해석해 나가는 과정 속에서 글자 그대로의 해석만을 수행하지 않아야 한다. 모국어 자료 및 자신의 배경지식, 사회문화적 관습, 일반적인 공통지식 등을 포함시켜 지도한다면 효율적인 미디어 리터러시 교육의 성과를 기대할 수 있을 것이다.

우리나라 아동의 지역별 말소리 발달 차이 (Regional differences in Korean children's development of speech production)

  • 신문자;하지완;김영태;김수진
    • 말소리와 음성과학
    • /
    • 제11권3호
    • /
    • pp.57-67
    • /
    • 2019
  • 본 연구의 목적은 우리나라 아동들의 말소리산출 발달에 지역적 차이가 존재하는지를 알아보고자 하는 것이다. 2세 후반부터 7세에 해당하는 전라, 서울경기, 경상, 충청 지역의 아동 619명이 본 연구에 참여하였고, 대상자들에게 우리말 조음음운평가2의 단어수준 검사를 진행하였다. 수집된 데이터에 대해 지역 및 연령에 따른 단어단위정확률(PWC), 평균음운길이(PMLU), 단어단위근접률(PWP), 전체 자음정확도(Total PCC), UTAP 자음정확도(UTAPPCC)를 비교 분석하였다. 연구결과 단어단위 지표인 PWC, PMLU, PWP에서는, 2세 후반의 경우 경상도 지역에서, 3세 초반의 경우 전라도와 충청도 지역에서 서울경기 지역보다 수행력이 유의하게 낮았다. 그러나 3세 후반부터는 어떤 단어단위 지표에서도 지역 간 차이가 관찰되지 않았다. 분절음 차원의 지표인 PCC에서는, 2세 후반의 경우 Total PCC에서 경상도와 충청도가, UTAP PCC에서 충청도가 서울경기 지역보다 수행력이 유의하게 떨어졌고, 3세 초반의 경우 두 지표 모두에서 전라도와 충청도가 서울경기보다 수행력이 유의하게 떨어졌다. 그러나 3세 후반부터는 Total PCC와 UTAP PCC 모두에서 지역 간 차이가 나타나지 않았다. 이러한 결과는 어린 연령의 경우 말소리산출 능력에 국내의 지역 간 차이가 존재하며, 그 차이가 특정 지역의 특성이라기보다는 서울과 지방의 차이로 설명될 수 있음을 시사한다.

XTM을 위한 다층적 시각화 방법 (A method of Multi-Layer Visualizations for XTM)

  • 박영조;박호병;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.529-531
    • /
    • 2004
  • 웹 상에는 많은 자원들과 정보들이 존재한다. XML은 이러한 자원들과 정보들을 구조화하기 위해서 개발되었다. XTM(XML Topic Maps)은 XML의 형태로 자원들과 정보들에 의미를 부여할 수 있는 언어이다. XTM은 Topic과 Association을 이용해서 자원들과 정보들이 가진 의미를 표현한다 XTM상에서 나타나는 Topic과 Association은 매우 거대하고 다양하기 때문에 모든 Topic과 Association을 한꺼번에 표현하기 어렵다 또한, 사용자가 수백만개의 Topic과 Association에서 원하는 Topic과 Association을 찾기 어렵다. 따라서 이러한 문제점을 해결하기 위해서 다양한 시각화 방법이 연구되었다. 현재 Topic Maps을 표현할 때 트리, 그래프, 맵 등 하나의 구조를 이용해서 표현한다. 하지만 추상화정도에 따라 시각화 방법은 장ㆍ단점을 지닌다. 본 논문에서는 웹 상의 자원, 정보들과 의미 사이에 여러 계층이 존재하는 다층적 시각화를 제안한다. 각 계층은 독립적인 표현구조로 나타내어 추상화정도에 따라 최적화된 구조를 사용한다. 사용자는 자신이 원하는 Topic과 Association을 점진적 접근을 통해서 원하는 Topic과 Association을 검색할 수 있다. 또한 Topic이 Association의 member처럼 사용되는 경우, 시각적으로 Topic이 표현되면 Topic은 연결된 Association과 직접적인 연결을 갖는다.

  • PDF