• 제목/요약/키워드: 어휘자원

검색결과 78건 처리시간 0.019초

감정 단어의 의미적 특성을 반영한 한국어 문서 감정분류 시스템 (A Korean Document Sentiment Classification System based on Semantic Properties of Sentiment Words)

  • 황재원;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.317-322
    • /
    • 2010
  • 본 논문은 감정단어(Sentiment Word)의 의미적 특성을 반영하여 한국어 문서 감정분류 시스템의 성능을 향상시킬 수 있는 방법을 제안한다. 감정단어는 감정을 가지는 단어를 의미하며, 감정단어들의 집합은 감정자질(Sentiment Feature)로써 감정분류를 위한 중요한 어휘 자원이다. 감정자질은 일반적으로 사용될 때와 특정 영역(Domain)에서 사용될 때에 그 감정 정도의 차이를 가진다. 감정자질이 일반적으로 사용될 때 그 감정 정도는 검색 엔진을 통해 얻을 수 있는 스니핏(Snippet)을 통해 추정할 수 있으며, 특정 영역에서 사용될 때의 감정 정도는 실험 말뭉치를 이용하여 추정할 수 있다. 이렇게 추정된 감정자질의 감정 정도 수치를 의미지향성이라고 하며, 문서내의 문장의 감정 강도를 추정하기 위해 이용된다. 문장의 감정 강도가 추정되면 문장 감정 강도를 감정자질의 가중치에 반영하게 된다. 본 논문은 지지 벡터 기계(Support Vector Machine)를 이용하여 일반적, 영역 의존적, 일반적/영역 의존적 의미지향성을 반영한 경우에 대해 성능을 평가한다. 평가 결과, 앞의 3가지 경우에 모두 성능 향상을 얻었으며 일반적/영역 의존적 의미지향성을 반영한 경우, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 3.1%의 성능 향상을 얻을 수 있었다.

소셜빅데이터를 이용한 온라인 소비자감성지수(e-CCSI) 개발 (Electronic-Composit Consumer Sentiment Index(CCSI) development by Social Bigdata Analysis)

  • 김유신;홍성관;강희주;정승렬
    • 인터넷정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.121-131
    • /
    • 2017
  • 인터넷, 소셜미디어, 모바일 등의 등장이후 소비자들은 개인의 의견을 온라인을 통해 적극적으로 표명하기 시작했고 이의 확산 또한 실시간으로 이루어지고 있다. 인터넷 기반의 다양한 커뮤니케이션 활동들을 통해 생산되는 텍스트는 인터넷을 사용하는 사용자들이 공유하고 공감하는 자원으로서 단순한 소통의 도구를 넘어 분석의 가치가 있는 새로운 정보의 창고가 되고 있다. 세계 각국의 정부와 기업은 인터넷과 소셜미디어를 통해 생산되는 소셜 빅데이터를 활용하여 사회/경제적 문제의 해결과 정부의 정책을 효과적으로 추진하는데 적극 활용하고 있다. 특히 경제와 관련해서는 경기현황에 대한 경제주체들의 움직임을 보다 빠르고 정확하게 분석하고 예측하여 이에 알맞은 정책을 적기에 실시할 수 있도록 다각적인 활동을 펼치고 있다. 본 연구에서는 소셜 미디어에 내재된 소비자의 직적접이고 즉시성 있는 의견을 경제적 측면에서 활용할 수 있는 온라인 소비자감성지수 모형을 제시하고 구현하였다. 이를 위해 한국은행의 소비자동향조사(CSI)와 소비자심리지수(CCSI)를 온라인으로 수행할 수 있는 어휘분류체계(온톨로지)와 감성사전을 구축하고 감성분석을 실시하여 생활형편, 경제상황, 소비와 수입 4가지 영역의 소셜감성지수를 도출하였다. 또한 이들을 결합한 온라인 소비자감성지수(e-CCSI)를 개발하고 소비자심리지수와 비교를 통해 유용성을 확인하였다.

감성 강도를 고려한 감성 분석 평가집합 구축 (Constructing an Evaluation Set for Korean Sentiment Analysis Systems Incorporating the Category and the Strength of Sentiment)

  • 김도연;오영;박혁로
    • 한국콘텐츠학회논문지
    • /
    • 제12권11호
    • /
    • pp.30-38
    • /
    • 2012
  • 감성 분석은 블로그와 트위터 같은 다양한 소셜 미디어에서 사용자들이 표현하는 감정의 종류를 분석하고 추출하는 연구이다. 현재 감성 분석 연구는 꾸준히 계속되고 있지만, 한국어의 감성 분석 평가 집합은 아직 없다. 본 논문에서는 감성 분석을 평가할 수 있는 평가집합을 구축한다. 평가집합에서는 사용자의 감성에 대한 극성뿐만 아니라 감성의 종류와 강도까지 고려한 평가집합을 구축하였다. 이를 위해 감성의 종류는 긍정에서 7가지의 범주와 부정에서 15가지의 범주를 나누고, 각 범주별로 1~3까지의 강도를 설정하였다. 또한 각 범주에 속하는 어휘에 대해서도 1~3까지의 강도를 설정하였다. 평가집합의 데이터는 다양한 소셜 미디어에서 3,270 문장을 추출하여 구축하였으며, 각 문장에 대해 5 명이 감성의 종류와 강도를 태깅하였다. 구축한 평가집합에서 5명의 일치도는 극성의 경우 93 %, 감성의 종류는 70 %, 강도는 58 % 로 나타났다. 이는 독일어와 스페인어의 평가 집합 보다 일치도가 높게 나타났다. 이 결과는 제안한 평가 집합이 신뢰할 만한 자원으로 다른 감성 분석 시스템의 평가데이터로 사용될 수 있음을 보여준다.

음악 저작의 전거형접근점 규칙 마련시 고려사항에 관한 연구 (A Study on the Considerations in Rules for Authorized Access points of Music Work)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제49권4호
    • /
    • pp.147-166
    • /
    • 2018
  • KCR4에서 음악 저작의 집중을 위한 전거형접근점 규칙 제정시 고려사항을 제안하고자 FRBR, LRM, ICP 2016, RDA, BIBFRAME에서 전거형접근점의 방향을 조사하고, RDA에서 음악 저작 및 표현성 속성과 전거형접근점 기술 규칙과 VIAF 사례를 분석하였다. 첫째, VIAF와 같은 에그리게이터형의 전거형접근점 적용 방식을 제시하고, 원표제를 우선표제로 삼되, 원표제가 이용자에게 적합하지 않은 경우 적합한 언어나 문자를 선택할 것을 제시하였다. 둘째, 음악 저작의 전거형접근점은 작곡가의 전거형접근점과 저작의 우선표제로 구성하되, 원작곡가의 책임이 크지 않은 경우는 개작자 등으로 전거형접근점을 구성한다. 또한, 국내 전통음악도 작곡자의 책임성을 중심으로 저작유형별 전거형접근점 구성에 대해 고려할 것을 제안하였다. 셋째, 저작 및 표현형 속성을 일관되게 기술할 수 있도록 작곡유형, 연주매체, 음조 등에서 통제어휘의 필요성을 제안하였다. 본 연구는 국내에서 음악저작의 저작 및 표현형 집중을 위한 전거형접근점 기술 규칙마련을 위한기초를 제시하였으며, 앞으로 음악 분야의 이용자 요구조사를 바탕으로 한 보다 구체적인 기술방안이 모색되어야 할 것이다.

LRM 노멘을 수용하기 위한 전거제어시 고려사항에 관한 연구 (A Study on Considerations in the Authority Control to Accommodate LRM Nomen)

  • 이미화
    • 한국도서관정보학회지
    • /
    • 제52권1호
    • /
    • pp.109-128
    • /
    • 2021
  • 본고에서는 LRM 노멘 개체를 수용하기 위한 전거제어시 고려사항을 모색하고자 문헌연구, RDA 규칙분석, 국내 목록 전문가 의견조사를 실시하였다. 그 결과 전거제어를 위해 노멘의 속성 요소, 목록기술, MARC 전거포맷 측면에서 고려사항을 제안하였다. 첫째, 노멘의 속성으로 LRM 노멘의 유형, 스킴, 이용대상자, 이용맥락, 참고정보원, 언어, 문자, 문자변환과 RDA에서 추가한 식별상태, 주기, 구분불가한 이름지시자의 기술을 가능한 상세히 기술해야 한다. 둘째, 노멘의 속성요소 및 관계요소를 기술하기 위해 목록규칙인 RDA에 제시된 대로 비구조화, 구조화, 식별자, IRI로 기술하며, 이중 구조화된 기술을 위해서는 어휘인코딩스킴(VES), 스트링인코딩스킴(SES)이 작성되어야 한다. 또한, 전거형접근점에 대한 구조 및 우선 이름/표제에 대한 목록 규칙도 마련되어야 한다. 셋째, LRM 노멘을 반영할 수 있도록 MARC 21 전거포맷을 마련하기 위해 Maxwell의 확장(안)을 바탕으로 추가 확장 방안을 제안하였다. (1) 노멘 마다 속성이 입력될 수 있도록 4XX, 5XX에 속성이 기술되어야 하며, 1XX, 5XX와 4XX에 기술될 노멘의 속성을 구분하였다. (2) 노멘 속성으로 유형, 언어, 문자, 문자변환, 이용맥락, 유효기간을 기술하기 위해서는 MARC 21내에 표시기호 및 식별기호가 추가되어야 한다. 이에 368, 381, 377의 식별기호 확장과 이용맥락과 유효기간을 기술하기 위한 표시기호를 추가할 것을 제안하였다. 본고에서 제안한 LRM 노멘을 위한 전거제어시 고려사항은 국내에서 LRM을 반영한 전거제어 방안을 마련하는 기반이 될 것이다.

신학적 미학을 적용한 가톨릭 피정시설 환경설계 - 순천 예수회 영성센터를 대상으로 - (An Environmental Design of the Catholic Retreat Center Adopting the Theoretical Aesthetics - In the Case of the Suncheon Jesuits Spiritual Center -)

  • 윤예화;김민;성종상
    • 한국조경학회지
    • /
    • 제51권6호
    • /
    • pp.12-32
    • /
    • 2023
  • 최근 내면의 치유를 위해 떠나는 종교여행객의 수요가 늘어나면서 불교의 '산사체험'이나 개신교의 '수련회', 가톨릭의 '피정'이 일종의 대안 휴가로 자리잡고 있다. 그러나 토착화가 이루어진 불교와 달리 범기독교계의 피정시설은 일반적인 휴양시설의 형태를 따르고 있으며, 후원에 의존함으로써 전체적인 틀을 구축하지 못한 채 조성하고 있다. 이에 본 연구에서는 피정의 방법인 '영신수련' 과정을 토대로 '신학적 미학'을 반영하여 '피정의 집'에 적합한 외부 환경을 설계하고자 하였다. 먼저 영신수련은 '내적 순례'라고 표현되는 만큼, 각 기도주제에서 체험하게 되는 이미지와 신학적 미학에 관해 고찰하였다. 다음으로 피정시설에 필요한 기능 및 공간 특성을 분석하고, 종교적 공간의 구성원리를 파악하였다. 또한 실제 대상지의 경관을 조사하고, 참여자들의 이용행태를 분석하여 일정에 따른 선호 공간을 도출하였다. 이를 종합하여 의식의 전환을 이끌어낼 수 있는 외부공간을 구상하고, 기도 메커니즘과 부합하는 물리적 환경 속에서 참여자의 체험 스펙트럼이 확장될 수 있도록 계획하였다. 본 연구는 경관자원의 잠재력이 많은 피정시설을 선정하여 신학적 미학을 구현하고자 하였다. 이를 통해 영신수련의 기도법인 '관상기도(觀相祈禱)' 시에 이미지를 효과적으로 불러일으키고 종교적 체험을 보조할 수 있는 시적((詩的) 경관의 가능성을 드러낼 수 있었다. 본 연구는 그동안 등한시된 종교시설의 다양한 외부공간 설계어휘를 도출해냈다는 점에서 의의를 갖는다.

음악저작 우선표제 기술 지침 개발시 고려사항에 관한 연구 (A Study on the Considerations in Developing Guidelines for Recording Preferred Title of Music Works)

  • 이미화
    • 한국문헌정보학회지
    • /
    • 제58권1호
    • /
    • pp.373-393
    • /
    • 2024
  • 본 연구는 음악저작의 우선표제 기술 지침 개발시 고려사항을 제안하고자 RDA 규칙을 분석하고, 여러 국가 도서관의 지침을 분석하였다. 우선, RDA 규칙을 분석하고, 규칙의 별법 및 선택사항별로 자체적인 지침을 개발한 8개 국가도서관에서 RDA 적용 지침을 조사하여 주요 고려대상 규칙을 살펴보았다. 이후 규칙별로 MLA, LC-PCC, DACH의 지침 내용을 분석하여 고려사항을 실질적으로 제시하였다. 첫째, 우선표제 선정과 관련하여 원어표제를 채택하도록 하되 원어표제가 국내 이용자에게 적합하지 않은 경우, 다른 언어의 우선표제를 사용하도록 할 필요가 있다. 둘째, 우선표제 기술과 관련하여 한 파트 저작, 둘 이상의 파트를 가진 저작, 한 저자의 전집, 특정 작곡유형명의 전집, 불완전한 합집, 여러 작곡가의 합집으로 나누어 살펴보았다. 셋째, 추가요소로 연주수단, 숫자표시, 음조, 기타 식별특성을 우선표제 기록시 고려사항으로 제시하였다. 넷째, 작곡유형명과 연주수단을 위한 통제어휘집을 지정하거나 제시할 필요가 있다. 본 연구는 RDA 음악저작의 우선표제 기술 지침 개발시 고려할 사항을 제시하였으므로 음악저작의 우선표제 관련 규칙 개발과 도서관에서 음악저작의 우선표제 기술 지침 작성에 기여할 수 있을 것이다.

한탄강 세계지질공원 연천 지역의 자기-안내식 해설 매체를 통한 스스로 이해 가능 정도: 이독성과 교육과정 관련성을 중심으로 (Degree of Self-Understanding Through "Self-Guided Interpretation" in Yeoncheon, Hantan River UNESCO Geopark: Focusing on Readability and Curriculum Relevance)

  • 김민지;김찬종;유은정
    • 한국지구과학회지
    • /
    • 제44권6호
    • /
    • pp.655-674
    • /
    • 2023
  • 본 연구의 목적은 한탄강 세계지질공원 연천 지역의 "자기-안내식 해설" 매체가 방문객이 이해하기 쉽고 배경지식수준에 맞춰 작성되어 있는지 탐색하는 것이다. 이를 위해, 2022년 9월과 11월 2차례에 걸쳐 한탄강 세계지질공원을 현장 조사하고, 지질명소의 형성 시대와 지질 특성이 다양한 연천 지역을 분석 대상으로 선정하였다. 연천 지역에 존재하는 총 36개의 자기-안내식 해설 매체를 대상으로 지질명소별 해설 매체의 현황, 이독성 수준, 그래픽의 특성, 과학과 교육과정 반영 정도를 분석하였다. 연구 결과, 연천 지역 해설 매체 종류는 안내판이 가장 많고, 지질명소를 안내한 내용이 주를 이루었다. 해설 매체 텍스트의 분량은 12학년 과학 교과서보다 많고, 평균 어휘 등급은 11-12학년군 과학 교과서 수준과 유사하고, 복문의 비율이 높아 이독성이 다소 낮았다. 해설 매체에 포함된 그래픽의 종류는 사진이 가장 많고, 대부분 예시적 기능이며, 다중 구조 그래픽이 사용되어, 지질 형성 과정을 이해하는 데 도움을 주었다. 해설 매체에서 사용하는 과학 용어 중 86.3%가 2015 개정 교육과정의 "고체지구" 영역에 포함된 용어를 사용하였으며, 교육과정에 포함된 과학 용어는 4학년 수준의 용어가 가장 많았다. 선택 교육과정인 11학년 수준의 용어가 두 번째로 많고, 전체 과학 용어 중 13.7%는 교육과정에 포함되어 있지 않은 용어였다. 또한, 지질명소에 따라 해설 매체에 사용된 과학 용어 수준 차이가 나타났으며, 특히 안내판보다 홈페이지에 사용된 용어 수준이 일반적으로 높은 경향을 보였다. 본 연구 결과를 통해 연천 지역의 지질명소별 해설 매체에 따라 방문객 스스로 이해하는 데 어려움을 주는 요인을 구체적으로 파악할 수 있었다. 일반 관람객의 지질자원 교육을 활성화하고 지질학 분야의 발전을 기대할 수 있는 자기-안내식 해설 매체의 개선 방향에 대한 후속 연구를 제언하였다.