• 제목/요약/키워드: word-form

검색결과 381건 처리시간 0.024초

비정형 텍스트 데이터 정제를 위한 불용어 코퍼스의 활용에 관한 연구 (A Study on the Use of Stopword Corpus for Cleansing Unstructured Text Data)

  • 이원조
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.891-897
    • /
    • 2022
  • 빅데이터 분석에서 원시 텍스트 데이터는 대부분 다양한 비정형 데이터 형태로 존재하기 때문에 휴리스틱 전처리 정제와 컴퓨터를 이용한 후처리 정제과정을 거쳐야 분석이 가능한 정형 데이터 형태가 된다. 따라서 본 연구에서는 텍스트 데이터 분석 기법의 하나인 R 프로그램의 워드클라우드를 적용하기 위해서 수집된 원시 데이터 전처리를 통해 불필요한 요소들을 정제하고 후처리 과정에서 불용어를 제거한다. 그리고 단어들의 출현 빈도수를 계산하고 출현빈도가 높은 단어들을 핵심 이슈들로 표현해 주는 워드클라우드 분석의 사례 연구를 하였다. 이번 연구는 R의워드클라우드 기법으로 기존의 불용어 처리 방법인 "내포된 불용어 소스코드" 방법의 문제점을 개선하기 위하여 "일반적인 불용어 코퍼스"와 "사용자 정의 불용어 코퍼스"의 활용 방안을 제안하고 사례 분석을 통해서 제안된 "비정형 데이터 정제과정 모델"의 장단점을 비교 검증하여 제시하고 "제안된 외부 코퍼스 정제기법"을 이용한 워드클라우드 시각화 분석의 실무적용에 대한 효용성을 제시한다.

Analysis of Descriptive Lectures Evaluation using Text Mining: Comparative analysis pre and post COVID-19

  • Lee, Sang-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.211-222
    • /
    • 2022
  • 본 연구는 코로나 이전과 코로나 이후의 강의평가를 비교 분석하여, 코로나 이후 시대에 대학수업에서 고려해야 되는 사항은 무엇인지를 도출하고자 하였다. 이를 위해 서울시 소재 A대학의 4개년도 자료를 이용하였고, 코로나 이전은 2018년~2019년까지, 코로나 이후는 2020년~2021년까지 자료를 이용하였다. 연구결과에 의하면, 교양의 경우에는 "과제"가 코로나 이전과 이후와 상관없이 빈도 및 연결중심성(DC)이 가장 가장 높은 단어로 나타났으나, 전공에서는 "이해"가 가장 중요한 단어로 나타났다. 에코 네트워크의 분석결과, "동영상" 및 "비대면수업"의 경우에는 어렵다고 느끼고 있으며, 교수와 학생간의 "상호작용"이 중요하다고 생각하고 있었다. 결론적으로 코로나 이후의 교양 수업에서는 과제에 대한 비중을 낮추고, 학생과의 상호작용을 높이는 것이 중요하며, 전공의 경우에는 비대면 수업보다는 대면수업으로 운영하고, 동영상도 어렵지 않게 내용을 구성하는 것이 필요하다는 것을 확인하였다.

베트남의 음악시, 까쭈: 형식, 구조, 내용 (Poem in Ca Trù: Type, Structure, Content)

  • 응웬 덕 머우
    • 수완나부미
    • /
    • 제2권1호
    • /
    • pp.95-110
    • /
    • 2010
  • 까쭈(Ca trù)란 베트남에 뿌리를 둔 민속음악의 한 종류이다. 까쭈에는 시가 아주 중요한 위치를 차지한다. 그렇기 때문에 많은 음악 연구자들은 까쭈는 '음악시'라고 말한다. 이러한 특징은 노랫말에서 분명하게 볼 수 있는데, 까쭈의 주된 가락이면서 독립된 시의 쟝르이기도 한 것이다. 베트남 민속음악 가락 중에서 까쭈는 유일하게 생겨난 것이어서 시라는 것이 '말하는 노래'인 것이다. 이러한 것은 베트남의 민속음악(극)이라고 할 수 있는 쩨오, 꽌호, 핫잠 등과 같은 곳에서는 유사한 현상을 찾아볼 수 없다. 또한 까쭈의 가락이 특정한 일부 가락에서 멈추지 않고, '말하는 노래'의 수량이 추천 개이며, 수 세기를 통해서 창작되어 왔다. 이 글은 까쭈 장르의 구조, 운과 가락, 내용 등에 대해서 연구하여 이 '말하는 노래'가 완전한 시라는 것을 증명하고자 하였다. 이를 통해 '말하는 노래'는 베트남 만의 고유한 것이며, 차후 신시운동에서 8행시를 만들어 내는 기반이 되었다고 볼 수 있다.

  • PDF

우리글 읽기에서 형태소정보의 미리보기 효과 (Morphological Parafoveal Preview Benefit Effects in Reading Korean)

  • 이상은;주혜리;고성룡
    • 인지과학
    • /
    • 제31권2호
    • /
    • pp.25-54
    • /
    • 2020
  • 이 연구의 목적은 안구운동 추적 기법을 통해 우리글을 읽을 때 중심와(fovea)의 주변에서 형태소 정보가 추출되는지를 알아보고자 한다. 다수 영어권 연구에서는 경계선 기법(Rayner, 1975)을 사용하여 중심와주변(parafovea)에서 형태소 정보가 추출되지 않는다고 보고하였다(Pollatsek, & Rayner, 2001; Rayner, Balota, & Pollatsek, 1986 등). 그러나 우리글인 한글은 영어와 같이 음소문자체계이면서 또한 모아쓰기를 하기를 때문에 한 자가 형태소가 될 수 있다. 또한 불규칙용언은 형태가 변하기 때문에 영어권의 결과와 다르게 글을 읽을 때 중심와주변에서 형태소 정보를 추출할 수도 있다. 실험은 경계선 기법으로 불규칙용언을 써서 미리 보기 네 조건-동일조건(예: 구워), 형태소 조건(예: 굽다), 시각유사조건(예: 굼다), 무관조건(예: 죨어)-으로 제시했다. 실험 결과는 단일고정시간에서 형태소조건은 동일조건보다는 반응시간이 길었지만 시각유사조건과 무관조건에서는 이득효과가 있었다. 첫고정시간과 주시시간에서 형태소조건이 시간유사조건과 무관조건과 차이가 없었지만 무관조건보다 더 이득효과가 있었다. 이는 우리글 읽기에서는 중심와주변에서 형태소 정보가 추출될 수 있음을 시사한다.

UNCITRAL 제2 실무작업반의 제34차 회의 동향 (Some Developments at the Thirty-Fourth Session of the UNCITRAL Working Group II(Arbitration and Conciliation))

  • 강병근
    • 한국중재학회지:중재연구
    • /
    • 제11권1호
    • /
    • pp.181-215
    • /
    • 2001
  • The thirty-fourth session of UNCITRAL Working Group on Arbitration was held in New York. Among the topics discussed at the session, many delegations agreed to reform the article 7 of the UNCITRAL Model Law on International Commercial Arbitration in light of the development of electronic commerce. As for the article 2(2) of the New York Convention, it was agreed to reflect the changes of the article 7 not in the form of a treaty amendment but in the form of an interpretative statement. The topic as to provisional measures has been found so difficult to reach an agreement that most of its texts submitted by the secretariat were left untouched for the lack of time. However, most provisions of the legislative texts on conciliation were dealt with by delegations. The next session is to be held in Vienna. While the Korean Arbitration Act of 1966 was fully amended in 1999, it seems interesting to look at the development in which the arbitration community of the world has already begun discussing the new dimension of the law and practice of international commercial arbitration. It may be considered early to start a new project of reforming the Korean Arbitration Act at this time when only three years passed after it was fully amended. It is, however, worthwhile to remember that some progressive efforts were aborted in amending the Arbitration Act of 1966. One of them is about the same issue on the insertion of some provisions on the enforcement of interim measures of protection to which the priority is given by the Working Group. It seems fair to say that it would not be dangerous to follow the developments and to adapt ourselves to such trends shown in the session. In Korea, the words “arbitration” and “conciliation” are misleadingly interchanged although these two words should be differentiated from each other in the sense of third-party binding decision. It is self-evident from the Korean Arbitration Act and judicial decisions that arbitral awards bind the disputing parties and are to be treated as final judgements by the competent courts. It is, however, not uncommon to find that the word “arbitration” is misinterpreted as having the same meaning of the word “conciliation”. One of the reasons for the confusion is that many legislations in Korea provide for conciliation as having the meaning of arbitration and vice versa. It may be probable that the proposed legislative texts on conciliation could be a kind of useful method to prevent such confusion from being uncontrollable. It is, therefore, necessary that the legislative texts should be introduced into Korea as a legislation on conciliation.

  • PDF

디자인 지식창출을 위한 검색시스템 구축

  • 임옥수;오민권;정인수;유의상
    • 디자인학연구
    • /
    • 제16권1호
    • /
    • pp.35-44
    • /
    • 2003
  • 오늘날은 유용한 정보의 확보 및 이용이 경쟁의 중요한 원천이었던 과거 정보화시대와는 달리 정보를 토대로 새로운 지식을 창출하여 현장에 적용하는 지식정보화(지식경영) 시대이다. 이 같은 지식정보화 시대에는 누구나 인터넷을 기반으로 하는 검색서비스를 이용하여 필요한 자료 및 정보를 손쉽게 얻을 수 있기 때문에 더 이상 단순한 정보의 획득이 개인, 기업, 국가의 경쟁력이 될 수 없게 되었다. 이러한 지식정보화라는 시대적 요구는 사회 각 분야에서 지식경영 시스템(Knowledge Management System) 등을 통해 급속도로 변화되고 있으며 여러 학문분야에서도 활발한 연구가 진행되고 있으나 디자인분야는 아직까지 일반적인 디자인 자료에 대한 단편(일차원)적인 검색서비스 수준에 머물러 있는 실정이다. 이에 본 연구에서는 가전제품, 생활용품, 의류제품, 식료품관련 회사들의 각 제품에 대한 CI/BI에 대해서 형태, 색상, 심미적 요소, 선호 이미지 언어, 만족도 등을 조사한 자료를 데이터베이스를 구축하고 이를 바탕으로 디자이너가 새로운 제품에 대한 CI/BI 작업을 수행하는데 있어 유용한 자료 및 정보를 얻을 수 있는 검색 시스템을 제안하였다. 특히, 제안된 시스템은 디자이너가 특정 BI/CI를 개발해야 하는 경우 기존 BI/CI에 대한 다양한 검색결과는 유용한 디자인 컨셉을 제공할 것이다. 또한 기존 디자인에 대한 디자인요소(형태, 색상, 심미적 요소, 선호 이미지 언어)들의 이차원 범주형자료 분석결과인 분할표(Cross Table)는 디자이너가 새로운 디자인지식을 창출하는데 기여할 것이다.

  • PDF

인공지능 동작 인식을 활용한 전산화인지훈련이 코로나-19 기간 동안 경도 인지장애 고령자의 인지 기능, 우울, 삶의 질에 미치는 영향: 예비 연구 (Effects of Computerized Cognitive Training Program Using Artificial Intelligence Motion Capture on Cognitive Function, Depression, and Quality of Life in Older Adults With Mild Cognitive Impairment During COVID-19: Pilot Study)

  • 박지현;이경아;이지연;박영욱;박지혁
    • 재활치료과학
    • /
    • 제12권2호
    • /
    • pp.85-98
    • /
    • 2023
  • 목적 : 본 연구의 목적은 경도인지장애 고령자에게 인공지능 동작 인식 기술을 활용한 전산화인지훈련 프로그램을 실시하여 인지 기능, 우울감, 삶의 질을 향상시키고자 한다. 연구방법 : 연구 참여자는 총 7명(실험군 = 4명, 대조군 = 3명)이며 코로나-19 발생 기간인 2021년 10월부터 12월까지 시행되었다. 프로그램은 직접 개발한 인공지능 동작 인식 기술을 활용한 전산화 프로그램 "MOOVE Brain"을 활용했으며 실험군은 한 달 동안 주 3회 30분씩 프로그램을 진행하였고 대조군에게는 중재를 제공하지 않았다. 치료의 전후 평가는 Korean version of the Mini-Mental State Examination-2, Korean version of the Consortium to Establish a Registry for Alzheimer's Disease Assessment Packet for Daily Life Evaluation, Korean version of the short form Geriatric Depression Scale (SGDS-K), 그리고 Geriatric Quality of Life Scale (GQOL)을 이용하였다. 결과 : 치료 전후로 실험군의 주의력 지표인 Stroop Color Test에서 평균 점수가 향상되었고(p = .068), 그룹 간 비교를 했을 때는 실험군의 실행 기능 평가 지표인 Stroop Color/Word Test 평균 점수가 향상되었다(p = .057). 그룹 간의 변화량을 비교했을 때는 실험군의 삶의 질 측정 도구인 GQOL (p = .057)과 우울증 지표인 SGDS-K (p = .057)의 평균 점수가 개선되었다. 하지만 각 영역들은 통계적으로 유의미하지 않았다. 결론 : 본 연구의 결과는 코로나-19로 인해 격리되어 있거나 의료 서비스를 받기 힘든 경도인지장애 고령자의 인지 및 심리 사회적 문제를 해결하는 데 활용될 수 있을 것으로 기대된다.

디지털 포렌식에서 텍스트 마이닝 기반 침입 흔적 로그 추천 (A Text Mining-based Intrusion Log Recommendation in Digital Forensics)

  • 고수정
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권6호
    • /
    • pp.279-290
    • /
    • 2013
  • 디지털 포렌식에서의 로그 데이터는 사용자의 과거 행적에 대한 추적을 목적으로 대용량의 형태로 저장된다는 특성을 가지고 있다. 이러한 대용량의 로그 데이터를 단서가 없이 수동으로 분석하는 절차는 조사관들에게는 어려운 일이다. 본 논문에서는 포렌식 분석을 하는 조사관들에게 믿을 만한 증거를 추천하기 위하여 대용량의 로그 집합으로부터 해킹 흔적을 추출하는 텍스트 마이닝 기술을 제안한다. 학습 단계에서는 훈련 로그 집합을 대상으로 전처리를 한 후, Apriori 알고리즘을 이용하여 침입 흔적 연관 단어를 추출하고, 신뢰도와 지지도를 병합하여 각 연관단어의 침입 흔적 확률을 계산한다. 또한, 침입 흔적 확률의 정확도를 높이기 위하여 스팸 메일의 여과에 사용된 Robinson의 신뢰도 계산 방법을 이용하여 확률에 가중치를 추가하며, 최종적으로 침입 흔적 연관 단어 지식 베이스를 구축한다. 테스트 단계에서는 연관 단어 지식 베이스를 기반으로 테스트 로그 집합에 대해 피셔(Fisher)의 역 카이제곱 분류 알고리즘을 적용하여 침입 흔적 로그일 확률과 정상 로그일 확률을 계산하고, 이를 병합하여 침입 흔적 로그를 추출한다. 추출된 로그를 조사관에게 침입 흔적이 있는 로그로서 추천한다. 제안한 방법은 비구조화된 대용량의 로그 데이터를 대상으로 데이터의 의미를 명확하게 분석할 수 있는 학습 방법을 사용함으로써 데이터의 모호성으로 인해 발생하는 정확도 저하 문제를 보완할 수 있으며, 피셔의 역 카이제곱 분류 알고리즘을 이용하여 추천함으로써 오분류율(false positive)을 감소시키고 수동으로 증거를 추출하는 번거로움을 줄일 수 있다는 장점을 갖는다.

트랜스미디어 환경에서의 감성마케팅을 위한 사용자 경험디자인에 대한 고찰 (Study on the User Experience Design for Emotional Marketing in an Transmedia Environment)

  • 허진
    • 한국콘텐츠학회논문지
    • /
    • 제12권9호
    • /
    • pp.194-201
    • /
    • 2012
  • 미디어의 확장은 인식의 확장과 맞닿아 있다. 문자의 발명은 시공간을 넘게 하였다. 기계는 육체의 기능 확장으로 이어졌으며, 전기는 공간과 시간으로 확장되었다. 컴퓨터는 두뇌의 확장이며, 인터넷은 관계의 확장으로 이어졌다. 지금 이 순간에도 미디어는 바이러스의 변종증식처럼 끊임없이 진보하고 있으며, 컨버전스나 하이브리드와 같은 융 복합 현상으로 이어진다. 이제 미디어는 인간 의식을 대신하고 있다. 트랜스미디어는, '횡단', '초월', '관통', 변화' 등을 뜻하는 'Trans'와 'Media'의 합성어로 현대사회 모든 미디어를 수용하는 '미디어를 초월한 미디어'를 뜻한다. 그러나 다른 융 복합 미디어와 달리 기술과 기술의 결합이 아닌 기술과 감성을 융합한다는 차별성을 가진다. 따라서 트랜스미디어는 스마트사회에서 중요시되는 디지털기술에 의한 인간의 '의식적 자각'과 인간 감성에 호소하는 '정서적 자각'을 동시에 충족시켜야하는 '사용자 경험'이라는 측면에서 중요한 의미를 가진 미디어로 인식되어져야 할 것이다. 본 논문에서는 먼저 트랜스미디어의 개념을 알아보고 의식적 사고를 유발하는 사용자경험디자인의 역할과 감성마케팅에 대하여 살펴보고자 한다. 이러한 고찰이 앞으로 개발자와 디자이너, 그리고 사용자와의 원활한 소통관계를 이루기 위한 개발단계에 있어 고려해야할 개념으로 이해되기를 기대한다.

사랑의 변주곡에 대한 기호학적 접근 (A Semiological Study of Kim Soo-Young′s ″A Variation of Love″)

  • 한명희
    • 인문언어
    • /
    • 제1권2호
    • /
    • pp.47-63
    • /
    • 2001
  • "A Variation of Love" is a characteristic Kim Soo-Young poem, in that it embodies the poet′s innovative use of language and proceeds speedily, like many of his other poems. Above all, the poem reveals the core of Kim′s poetical spirit, his speculation about love. The poem is difficult to understand because it broadly uses run-on lines and even run-on stanzas, a technique that many readers are unfamiliar with. The semiological approach of this paper will bring new light on the poem by restructuring the relationship between signs, that is, by taking apart the sign system of the original text and reconstructing its sentence structure. If we rearrange the poem from its original six stanzas and fifty-one lines to four stanzas and twenty-three lines, we will discover a close connection between stanzas 1 and 2, and between stanzas 3 and 4. Of the many keywords of the poem, we may establish the dominant word as "love," into which every poetic word converges and from which each word emanates. Another important keyword is "fatigue of the city" in stanza 4. Similarly negative aspects of the city may be found in the line "the same may be said of Bombay, of New York, of Seoul" in stanza 3, as well as in the words "desire" in combination with "the lamplights of Seoul like leftovers in the pig sty" in stanza 1. The persona of the poem tries to overcome the "fatigue of the city" by "love," but the way he realizes love is, somewhat peculiarly, through stillness and silence. The persona aligns "the stones of the peach and the apricot and the dried persimmon" with the his faith in love. He calls the stones "beautiful hardness" presumably because that hardness (the stillness and silence) may blossom into beauty. In the earlier stanzas, the persona′s quest for love results in an awareness that love is omnipresent, but the persona determines "not to shout it out loud." The reason for this determination is found in stanza 4. Those who experience the "fatigue of the city" will be able to realize it by themselves. This seemingly defeatist conclusion by no means suggest pessimism, for the persona holds the conviction that "there will come a day when [one] will rave for love." This conviction rescues the poem from the dismal mood suggested by the "fatigue of the city." At all events, it is important to note that the "fatigue of the city" should not be considered apart from "love." Yet, strangely enough, the poem embodies a severe critique of the city, and further investigation is necessary in order to clarify why this critique appears in the form of "love." But this will be the treated in another paper.

  • PDF