• 제목/요약/키워드: 텍스트분석

검색결과 2,629건 처리시간 0.034초

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

다이내믹 토픽 모델링의 의미적 시각화 방법론 (Semantic Visualization of Dynamic Topic Modeling)

  • 연진욱;부현경;김남규
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.131-154
    • /
    • 2022
  • 최근 방대한 양의 텍스트 데이터에 대한 분석을 통해 유용한 지식을 창출하는 시도가 꾸준히 증가하고 있으며, 특히 토픽 모델링(Topic Modeling)을 통해 다양한 분야의 여러 이슈를 발견하기 위한 연구가 활발히 이루어지고 있다. 초기의 토픽 모델링은 토픽의 발견 자체에 초점을 두었지만, 점차 시기의 변화에 따른 토픽의 변화를 고찰하는 방향으로 연구의 흐름이 진화하고 있다. 특히 토픽 자체의 내용, 즉 토픽을 구성하는 키워드의 변화를 수용한 다이내믹 토픽 모델링(Dynamic Topic Modeling)에 대한 관심이 높아지고 있지만, 다이내믹 토픽 모델링은 분석 결과의 직관적인 이해가 어렵고 키워드의 변화가 토픽의 의미에 미치는 영향을 나타내지 못한다는 한계를 갖는다. 본 논문에서는 이러한 한계를 극복하기 위해 다이내믹 토픽 모델링과 워드 임베딩(Word Embedding)을 활용하여 토픽의 변화 및 토픽 간 관계를 직관적으로 해석할 수 있는 방안을 제시한다. 구체적으로 본 연구에서는 다이내믹 토픽 모델링 결과로부터 각 시기별 토픽의 상위 키워드와 해당 키워드의 토픽 가중치를 도출하여 정규화하고, 사전 학습된 워드 임베딩 모델을 활용하여 각 토픽 키워드의 벡터를 추출한 후 각 토픽에 대해 키워드 벡터의 가중합을 산출하여 각 토픽의 의미를 벡터로 나타낸다. 또한 이렇게 도출된 각 토픽의 의미 벡터를 2차원 평면에 시각화하여 토픽의 변화 양상 및 토픽 간 관계를 표현하고 해석한다. 제안 방법론의 실무 적용 가능성을 평가하기 위해 DBpia에 2016년부터 2021년까지 공개된 논문 중 '인공지능' 관련 논문 1,847건에 대한 실험을 수행하였으며, 실험 결과 제안 방법론을 통해 다양한 토픽이 시간의 흐름에 따라 변화하는 양상을 직관적으로 파악할 수 있음을 확인하였다.

한국소설에 나타난 포스트휴머니즘의 상상력 -조하형의 『키메라의 아침』과 『조립식 보리수나무』를 중심으로 (The Imagination of Post-humanism Appeared in Korean Fictions -Focused on Cho Ha-hyung's Chimera's Morning and A Prefabricated Bodhi Tree)

  • 이소연
    • 대중서사연구
    • /
    • 제25권4호
    • /
    • pp.191-221
    • /
    • 2019
  • 본 연구는 최근 주요한 인문학적 테제로 등장하고 있는 포스트휴머니즘적 상상력이 한국문학, 특히 소설에 나타난 양상을 분석하는 것을 목표로 한다. 특히 본고에서는 2000년대 초반 활동했던 작가인 조하형의 두 소설 『키메라의 아침』(2004)과 『조립식 보리수나무』(2008) 두 편을 집중적인 분석의 대상으로 삼는다. '포스트휴머니즘(Post-humanism)'은 근대의 한계를 극복하고 새로운 세계관의 정립을 모색하기 위해 노력한 탈근대적 사유의 연장선상에서 파악할 수 있다. 특히 이 사상은 20세기 이후 급격히 발전한 과학 기술의 발달이 인간관 나아가서는 인간중심적인 문명 자체를 바꿔온 양상을 종합적으로 파악하는 데에 관심을 기울인다. 포스트휴머니즘 비평은 서사에 등장하는 인물 형상을 새롭게 바라보는 시선을 제공하는 한편, 과거에 쓰인 고전 작품 속에서 주목받지 못했던 주변 인물들, 비-인간, 사물들을 발굴해서 재조명하는 작업을 시도하고 있다. 이러한 사상적 흐름은 최근 기존의 인문학이 지배하던 인간에 대한 관념이 전면적으로 바뀌어 자연과학·기술적 관점이 담론장에 다양하게 적용되는 현실을 반영하는 것이다. 포스트휴머니즘의 질문들은 철학의 큰 범주인 존재론, 인식론, 경험론적인 분야를 아우르는 동시에 문학과 과학 그리고 사회과학 전체의 참여를 요청함으로써 학제적인 연구 과제를 발생시키고 있다. 혹독한 재난이 닥친 세계를 배경으로 『키메라의 아침』은 인간이 바이오테크놀로지에 의해 변형된 변종의 형태로, 『조립식 보리수나무』는 컴퓨터 시뮬레이션에 의해 제작된 인공지능(Artificial Intelligence)의 모습으로, 다시 태어나는 과정을 그린다. 조하형 소설에 나타난 포스트휴머니즘적 사상은 텍스트에 재현된 세계의 형상와 인간의 정체성을 종합적으로 재고하고, 인간과 비인간을 구분하는 경계선과 위계질서 등을 다시 탐구하는 반성적인 계기가 된다.

판소리 패트론으로서의 대원군과 박유전 <적벽가>의 변모 (Pansori Patronage of Daewongun and His Influences on Park Yujeon's Jeokbyeokga)

  • 유민형
    • 공연문화연구
    • /
    • 제38호
    • /
    • pp.143-191
    • /
    • 2019
  • 이 논문은 판소리의 발달 과정에 영향을 미친 역사적 요소 중 판소리의 '패트론'의 비중을 점검하고자 시도되었다. 문화예술의 향유계층인 동시에, 후원자로서 발달에 큰 영향을 미치는 존재인 패트론은, 서양 예술의 역사를 분석함에 있어서는 그 존재가 적극적으로 논의되어 왔다. 여러 장르의 예술에 있어서 패트론의 영향력은 언제나 중요하게 연구되었다. 판소리의 패트론은 좌상객으로 통칭되는 양반층이었는데, 판소리가 양반층 사이에 애호되면서 왕실 패트론도 생겨나게 된다. 흥선 대원군은 판소리 애호가로 유명했으며, 또한 판소리 명창의 패트론으로서 후원했다. 대원군은 통인청대사습을 통해 판소리를 후원함과 동시에, 판소리의 선발 과정에 개입함으로써 패트론으로서의 역할을 담당하게 된다. 그리고 운현궁을 중심으로 활동한 가객 안민영과 함께 판소리 명창으로 박유전을 후원하였다. 대원군이 아직 세도를 잡기 전 전주에서 머무를 때 전주의 토호였던 백진석에게 도움을 받았다. 대원군은 세도를 잡게 되면서 전주에 통인청대사습 운용에 관여 하였고, 백진석의 청을 들어서 전주에 판소리 감상용의 저택인 학인당(學忍堂)을 지을 수 있게 하였다. 대원군이 특히 후원했던 판소리 명창으로 박유전을 들 수 있다. 박유전은 대원군의 운현궁에서 좌상객들의 영향아래, 자신이 기존에 보유하고 있던 판소리의 텍스트와 음악을 변화시킨 것으로 보인다. 박유전은 순창출신의 명창으로 서편제의 비조로 불렸고, <심청가>와 <적벽가>로 이름을 날렸다. 그의 제자로는 이날치를 들 수 있고 초기 박유전의 소리는 이날치를 통하여 서편제로 전승되었다. 박유전이 한양으로 와서 운현궁에 머무르게 되면서 그가 이전에 가지고 있던 소리는 창곡과 사설에서 많은 변화를 가지게 된다. 그래서 박유전의 판소리는 이원성을 띠게 된다. 대원군은 박유전 판소리의 변화과정에서 크게 영향을 미친 인물이다. 박유전이 운현궁에서 다듬어 정제화한 판소리가 이른 바 강산제이다. 박유전이 한양으로 오기 전의 소리인 서편제와, 한양에서 다듬어 새롭게 완성한 강산제와는 완전히 구별될 수 있을 정도로 음악, 사설, 그리고 이념적 기반에서 차별화되어 있다. 그 변화의 모습을 동편제 및 서편제 <적벽가>와 강산제 <적벽가>의 비교분석을 통하여 살펴보았다. 강산제 <적벽가>는 사상적으로는 유교적인 이데올로기를 일관적으로 띠게 되며, 조조에 대한 야유와 비하의 수위가 동·서편제 적벽가에 비하여 훨씬 약화되어 있다. <삼국지연의>에서 장수들의 전투장면을 사설에 재인용하여 포함시킨 부분과, 한시의 적극적인 인용을 늘린 것 또한 양반좌상객의 취향에 부합하여 변화한 부분이다.

한탄강 세계지질공원 연천 지역의 자기-안내식 해설 매체를 통한 스스로 이해 가능 정도: 이독성과 교육과정 관련성을 중심으로 (Degree of Self-Understanding Through "Self-Guided Interpretation" in Yeoncheon, Hantan River UNESCO Geopark: Focusing on Readability and Curriculum Relevance)

  • 김민지;김찬종;유은정
    • 한국지구과학회지
    • /
    • 제44권6호
    • /
    • pp.655-674
    • /
    • 2023
  • 본 연구의 목적은 한탄강 세계지질공원 연천 지역의 "자기-안내식 해설" 매체가 방문객이 이해하기 쉽고 배경지식수준에 맞춰 작성되어 있는지 탐색하는 것이다. 이를 위해, 2022년 9월과 11월 2차례에 걸쳐 한탄강 세계지질공원을 현장 조사하고, 지질명소의 형성 시대와 지질 특성이 다양한 연천 지역을 분석 대상으로 선정하였다. 연천 지역에 존재하는 총 36개의 자기-안내식 해설 매체를 대상으로 지질명소별 해설 매체의 현황, 이독성 수준, 그래픽의 특성, 과학과 교육과정 반영 정도를 분석하였다. 연구 결과, 연천 지역 해설 매체 종류는 안내판이 가장 많고, 지질명소를 안내한 내용이 주를 이루었다. 해설 매체 텍스트의 분량은 12학년 과학 교과서보다 많고, 평균 어휘 등급은 11-12학년군 과학 교과서 수준과 유사하고, 복문의 비율이 높아 이독성이 다소 낮았다. 해설 매체에 포함된 그래픽의 종류는 사진이 가장 많고, 대부분 예시적 기능이며, 다중 구조 그래픽이 사용되어, 지질 형성 과정을 이해하는 데 도움을 주었다. 해설 매체에서 사용하는 과학 용어 중 86.3%가 2015 개정 교육과정의 "고체지구" 영역에 포함된 용어를 사용하였으며, 교육과정에 포함된 과학 용어는 4학년 수준의 용어가 가장 많았다. 선택 교육과정인 11학년 수준의 용어가 두 번째로 많고, 전체 과학 용어 중 13.7%는 교육과정에 포함되어 있지 않은 용어였다. 또한, 지질명소에 따라 해설 매체에 사용된 과학 용어 수준 차이가 나타났으며, 특히 안내판보다 홈페이지에 사용된 용어 수준이 일반적으로 높은 경향을 보였다. 본 연구 결과를 통해 연천 지역의 지질명소별 해설 매체에 따라 방문객 스스로 이해하는 데 어려움을 주는 요인을 구체적으로 파악할 수 있었다. 일반 관람객의 지질자원 교육을 활성화하고 지질학 분야의 발전을 기대할 수 있는 자기-안내식 해설 매체의 개선 방향에 대한 후속 연구를 제언하였다.

데크놀로지 미학으로서의 사진 (The Photography as Technological Aesthetics)

  • 진동선
    • 조형예술학연구
    • /
    • 제11권
    • /
    • pp.221-249
    • /
    • 2007
  • 오늘날 사진은 새로운 테크놀로지 형태인 디지털 이미지 프로세싱 앞에 심각한 정체성 위기와 존재론적 딜레마에 봉착했다. 사진은 그동안 우리에게 세상을 새롭게 바라보는 방법을 제공하고, 또 우리 스스로 주변을 돌아볼 수 있는 자각을 주었으며, 나아가 삶의 리얼리티의 본질을 재인식시키는데 크게 기여했다. 그런 사진의 기능이 오늘날 무력화되고 있다. 디지털 테크놀로지의 출현으로 사진은 더 이상 사실의 기록, 결백의 증거, 그리고 리얼리티의 거울로서 간주되지 않는다. 오히려 유희의 도구 혹은 우리가 사는 세계의 환영과 기쁨을 창조하는 수단으로 간주된다. 그러나, 디지털 테크놀로지의 출현은 이제 비로소 사진의 존재론적 당위성과 정체성의 문제를 냉정히 돌아보게 한다. 본 논고는 전자시뮬레이션 시대 새로운 이미지 생산의 첨병으로 등장한 디지털 이미지의 존재론적 측면을 규명하는데 있다. 이를 위해 인류의 첫 번째 프로그램 미학으로 말해지는 사진과 첨단테크놀로지 미학으로 말해지는 디지털 이미지와의 관계를 기계미학적 관점에서 살펴보려 한다. 특히 올드미디어(사진)와 뉴미디어(디지털) 사이에 갈등 구조를 자본주의 역사관과 물질적 관점에서 살펴보려 한다. 본 논고는 이를 위해 우선 사진의 정체성 위기와 존재론적 위협이 어디로부터 발현된 것인지를 살피고, 또 지금까지 생산된 매체 미학적 담론들이 어떤 비평적 쟁점 속에 놓였는지를 살피고자 한다. 특히 사진이 강점으로 여긴 존재론적 인덱스와 생성론적 텍스트에 주목하여 사진 재현의 기반인 사실적 기록, 명료한 증거, 그리고 기술적 정교성이 어떤 기계미학의 층위에 있는지를 디지털 이미지를 대척에 두고 분석하고자 한다. 그리하여 최근 일고 있는 사진의 죽음, 사진의 종말에 관한 담론들이 심각한 오류가 있음을 지적하고자 한다. 올드 테크놀로지로서 사진이 당면한 위기, 즉 현재 사진이 안고 있는 존재론적 위기(컴퓨터화 된 디지털 이미지 출현) 그리고 인식론적 위기(윤리, 지식, 가치관 등 급격한 문화 변동)는 매체미학의 본질상 당연한 위기임을 정당화하고자 한다. 본 논문은 이 같은 주장을 위하여 역사적으로 사진술이 어떤 생성과 소멸의 과정을 거쳤으며, 또 어떻게 지금의 디지털 이미지에 이르게 되었는지 테크놀로지 미학 안에서 자동생성주의로서 색인 이미지, 디지털 코드로서 수치 이미지의 생성, 기원, 본질 그리고 정체성을 규명하고자 한다. 특히 본 논고는 논지의 정당성을 위해 다양한 매체미학자들의 주의주장 및 이론적 쟁점을 분석하고자 한다. 또 분석틀을 통해서 테크놀로지 미학의 근간인 기계, 기술성을 바탕으로 한 사진의 생성적 측면과 문화 안에서 변형된 프로그램에 의해 창조되는 디지털 이미지의 변형적 측면의 본질을 파악하고자 한다. 이렇게 사진과 디지털 이미지의 양자의 비교를 통해서 테크놀로지 미학 안에서 올드 미디어(사진)와 뉴 미디어(디지털 이미지)의 자리바꿈은 정당한 것이라는 사실과, 이런 역설적인 구조야말로 기계, 기술을 바탕으로 삼는 테크놀로지 매체의 숙명성이라는 사실을 강조함으로써 논문의 정당성을 강화하고자 한다. 마지막으로 본 논고는 하나의 얼굴, 하나의 정체성으로 자리할 수 없다는 사실을 역사로서 확증하고, 또 사진에서 부동의 존재론과 인식론의 모습은 애초부터 불가능하다는 사실을 지적함으로써 오늘날 제기되고 있는 '사진의 죽음,' '사진의 종말'은 쟁점의 정당성에도 불구하고 매체미학의 역사를 간과하는 오도된 비평이라는 사실을 결론으로 도출하고자 한다.

  • PDF

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.

한국과 캐나다 대학생들의 콩가공식품에 대한 수응도 및 소비실태 비교 연구 (A Comparative Study on the Acceptability and the Consumption Attitude for Soy Foods between Korean and Canadian University Students)

  • 안태현
    • 한국작물학회지
    • /
    • 제51권5호
    • /
    • pp.466-476
    • /
    • 2006
  • 한국과 캐나다의 젊은 소비계층인 대학생들을 중심으로 콩에 대한 일반적 인지도, 콩가공식품에 대한 구매 및 소비행태, 수응도 등을 설문문항을 통하여 비교해 보았고, 콩가공식품의 소비시 지적되는 문제점을 알아보았다. 한국 대학생들이 캐나다 대학생들에 비해 콩식품에 대하여 더욱 긍정적인 생각과 올바른 지식을 가지고 있었고, 콩식품에 대한 정보를 얻는 방법으로는 한국 대학생들의 경우 주로 상업적 매체를 통하는 것으로 나타났던 반면, 캐나다 대학생들의 경우는 주로 가족이나 친구 등 인맥을 통하는 비율이 높게 나타났다. 소비행태에 있어서는, 한국의 경우 조사대상자 전체가 구매경험이 있는 것으로 조사되었으나 캐나다의 경우는 조사대상자의 55.4%만이 콩가공식품 구매경험이 있었으며, 친숙하게 느껴지는 콩가공식품, 구매경험이 있는 콩가공식품 그리고 구매빈도가 높은 콩가공식품 등에 대해서는 한국과 캐나다 모두 매우 유사한 경향을 보였는데 두유에 대한 인지도가 가장 높았으며 소비량도 많은 것으로 나타났고 다음으로 콩음료, 마가린 등의 순서로 나타났다. 본 연구결과, 콩가공식품을 포함한 콩식품은 단순한 동양의 전통식품만이 아니라 동서양의 식생활에 일반적인 식품으로 자리매김하고 있는 것으로 나타났다. 단지 콩 유입의 역사가 짧고 낙농업 위주의 식생활이 주를 이루고있는 캐나다에서는 콩식품에 대한 관심이 한국보다 적어 소비경험이 전혀 없는 대학생들이 많았고(44.6%)우유식품을 선호하는 학생들이 많았다. 반면, 한국의 경우는 다양한 콩 가공식품이 일반화되지 않아 두유나 콩음료 등 특정 콩가공식품에 대한 소비율만 높은 것으로 나타났다. 그러나 앞으로 캐나다의 콩가공식품의 소비는 더욱 늘어날 것으로 전망되며, 우리나라 또한 젊은 소비자들의 콩식품 소비 활성화를 위하여 다양한 기호와 욕구를 충족시킬 수 있는 제품개발이 지속적으로 이루어진다면 전통적인 콩식품 및 콩가공식품 소비는 더욱 늘어날 것으로 전망되어 진다.능력이 있었다. 그러므로 $(PPAR{\gamma})$의 활성에 있어 RXR heterodimer가 사람의 백혈병세포에 대한 조절 경로로서 존재하며, PTEN의 upregulation을 통해 백혈병을 조절하기 때문에 백혈병의 예방 및 치료 접근에 $(PPAR{\gamma})$와 RXR ligands가 중요한 역할을 할 것이다.제안 객체 모델에서는 객체의 상태에 따라 사용 가능한 행위가 결정되는 가상 환경을 위해 새로운 인터페이스로 컨텍스트 메뉴(context menu) 인터페이스와 동작 생성 모델을 제시한다. 정의하였다. 객체 모델에서 객체의 상태 정보와 행위 정보를 분석해 아바타가 할 수 있는 행위를 컨텍스트 메뉴로 제공하기 때문에 사용자는 가상 환경의 상태에 상관 없이 직관적으로 명령을 줄 수 있다. 또한 사용자는 기존의 2D 혹은 텍스트기반 스크립트 작성기법을 벗어나 사용자는 제안된 3D 인터페이스 기법을 통하여 실시간으로 아바타의 행위 스크립트를 작성 및 재생 할 수 있다. 본 논문에서 제시한 시스템은 기존의 아바타 중심적인 제어를 객체에 분산함으로써 효율적이고 직관적인 명령을 내릴 수 있고 또한 손쉬운 시나리오 생성을 가능하게 하였다. 본 연구에서는 제안 기법의 활용을 위해 프리젠테이션 도메인 환경의 시스템을 구축하고 아바타-객체 행위제어 및 스크립트 생성 기법을 적용하였다.S는 스크립트 언어를 사용하는 전문가 시스템[7]으로 선언적 룰(Declarative Rule)을 이용하여 지식을 표현 하고 추론을 수행하는 추론 엔진의 한 종류이다. JESS의 지식 표현 방식은 튜닝 원칙을 쉽게 표현하고 수용할 수 있는 구조를 가지고 있으며 작은 크기와 빠른 추론 성능을 가지기 때문에 실시간으로 처리 되는 어플리케이션 튜닝에 적합하다. 지식 기반 모률의 가장 큰 역할은 주어진 데이터베이스 시스템의 모델을 통하여 필요한 새로운 지식을 생성하고 저장하는 것이다.

재미작가 홍언의 몽유가사$\cdot$시조에 나타난 작가의식 (A Study on Korean-American Writer Hong-Eun($1880\~1951$) focusing on Mong-yu siga(Traditional Korean Poetry, gasa and sijo of strolling in the dream))

  • 박미영
    • 한국시조학회지:시조학논총
    • /
    • 제21집
    • /
    • pp.77-110
    • /
    • 2004
  • 문학작품은 선행 작품 혹은 동시대의 다른 작품들과의 상호관계 속에서 창작되고 있다. 당대의 문단활동을 통해서나 작가 자신의 소양 속에 내재되어 있는 선험적인 텍스트와의 끊임 없는 대화를 통해 작가의 의식에 적절한 반응양식이 선택하여 외부로 표현되는 것이 작품이라 할 수 있다. 어떤 양식 또한 시대적, 개인적 필요성에 의하여 이런 과정을 속에서 되풀이된다. 본 연구에서 대상으로 삼고 있는 홍언은 미국 초기 이민자이며 재미 한인신문 $\lceil$신한민보$\rfloor$의 발행에 오랜 기간 종사한 언론인이자 문인이다. 지면을 책임지고 있는 발행인으로서 자신의 작품을 비교적 자유롭게 발표할 수 있는 처지에 있었다. 그러나 국내문단과의 직접적인 교류나 활동은 없었고 미국 현지에서 함께 할 독자가 적은 가운데 시가만 400여 편을 발표할 정도로 활발하게 활동했다. 본 연구에서 홍언의 다양한 작품활동 가운데 1935년, 1947년 두 차례에 걸쳐 발표되는 몽유양식을 활용한 시가$\cdot$몽유가사$\cdot$몽유시조를 분석하고 그 의미를 고찰한다. 1935년과 1947년으로, 두 차례 $\lceil$신한민보$\rfloor$의 <사조>난에 몽유가사와 몽유시조를 싣는다. 홍언은 미국이라는 만리타국에 와 있지만 자신의 개인적인 것을 모두 포기할 만큼 조국의 독립을 갈망하였으며 항시 조국의 현실을 예의주시하고 있는 상황에서 창작된다. 첫 몽유시가는 1935년 4월 25일에 <이강산>을 필두로 1935년 5월 9일 부터 1935년 7월 4일까지 동회슈부라는 자신의 필명으로 <꿈에 고국에 가셔>라는 제목 하에 연작시가 8편을 차례로 연재하는 것이다. 이는 개화 가사의 형식을 선택하고 있으며 향수와 1900년 전후의 조선 상황에서 정체된 역사의식을 담고 있어 중세적 이념을 노정하고 있다. 두 번째 몽유시가는 1947년 9월 25일 발표한 <나라와 고향>을 서시로 1947년 10월 2일부터 1947년 11월 6일까지 6 편을 연재하는 <꿈속에 강산>이다. 여기서 선택한 시형은 시조이며 그 시상의 전개가 1차 시도와 비슷하여 1차 시도를 의식하여 창작되었다고 볼 수 있다. 내용은 분단된 조국현실을 직시하면서 미국과 러시아에 대해 적대적으로 인식한다. 그리고 외적 장애요인이 제거되었는 데도 고국에 가지 못하는 자신의 개인적 처지를 합리화하는 방어기제로서, 조국을 '살지 못할 곳'으로 인식하고 있다. 몽유양식은 꿈을 주요 모티브로 사용하면서 현실의 좌절된 욕망을 달성하고자 의도적으로 취하는 양식이다. 홍언은 이민 후 일제치하에서는 정치적인 이유로, 독립 후에는 개인의 경제적인 사정으로 고국방문을 하지 못했다. 고국방문이라는 간절한 소망을 달성하기 위하여 홍언은 몽유양식을 활용하였다. 이는 중세의 지식인들이 우언의 한 양식으로 즐겨 사용했던 전통 양식이자 개화기 지식인들이 검열을 피하기 위한 수단이며 다양한 글쓰기 방식의 일환으로 선택되어 문학사적 사명을 다했던 것과 같은 맥락에서 의의를 찾을 수 있다.

  • PDF