• 제목/요약/키워드: 단어빈도

검색결과 542건 처리시간 0.025초

한국어 소음속말인지에 나타나는 예측성 효과 (Predictability effects on speech perception in noise (SPIN) in Korean)

  • 이선영
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.129-157
    • /
    • 2016
  • 본 연구는 한국어의 소음속말인지(Speech perception in noise, SPIN)에 대하여 알아 보았다. 영어의 SPIN 테스트와 비슷한 형식을 채택하여 새로운 한국어 SPIN 테스트를 개발하였다. 예측성 효과와 소음효과, 이 둘의 상호작용에 대하여 알아봄으로써 기존의 영어에 기반을 둔 연구에서 발견한 것들을 재확인하고자 하였다. 새로운 한국어 SPIN 테스트를 사용하여 14명의 성인 한국인을 대상으로 한 실험 결과는 이전 연구들이 발견한 사항들을 다시 한 번 입증하였다. 첫째, 참여자들의 대체적인 SPIN 수행능력은 상대적으로 고소음 보다 저소음환경에서 더 나았다. 둘째, 문맥상 비교적 예측하기 쉬운 단어들이 예측하기 어려운 단어들보다 특히 고소음 환경에서 더 정확히 인지되었다. 이러한 결과는 청자들이 두 가지 종류의 정보, 즉 음성적 정보와 문맥적 정보를 말인지에 적극적으로 사용한다는 것을 의미하는 것으로 해석할 수 있다. 소음으로 인해서 말소리의 음성적인 특징이 약해졌을 때 청자들은 말소리를 처리하기 위해서 언어적 문맥정보를 적극적으로 이용하는 것이다. 본 연구에서 발견한 것들은 영어의 SPIN 테스트에 기반을 둔 기존 연구들에서 발견한 것과 일치한다. 게다가, 표적어의 빈도 효과에 대한 가능성을 발견하였는데, 이는 한국어의 이 분야에 대한 더 다양하고 활발한 연구가 있어야 함을 시사한다.

  • PDF

목록 분야 연구동향 및 지적구조 분석 (A Study on Analysis of Research Trends and Intellectual Structure of Cataloging Field)

  • 이지원
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.279-300
    • /
    • 2019
  • 본 연구는 동시출현단어 분석을 사용하여 2000년대와 2010년대 목록 분야 연구동향 및 지적구조 분석을 수행하고, 두 시기의 차이점을 비교하였다. 목록 분야는 독자적인 연구 영역을 확고히 구축하고 있었으며, 2000년대와 2010년대 연구동향 및 지적구조에 많은 차이점이 발견되었다. 첫째, 논문 수에 있어서는 2000년대에 비해 2010년대에는 연간 평균 4.2편이 감소하였으나, 저자키워드 수는 큰 차이는 나지 않았다. 연대별 키워드 출현빈도는 22.2%의 키워드만이 두 시기에 모두 3회 이상 나타났으며, 77.8%의 키워드들은 한 시기에만 3회 이상 나타났다. 둘째, 지적구조에 있어서 살펴보면, 2000년대에는 3단계 군집을 보여주어 2단계 군집으로 표현된 2010년대에 비해 보다 복잡한 형태의 네트워크를 형성하였다. 셋째, 각 군집의 특성 변화를 살펴본 결과, 일부 변화가 적은 연구주제들이 있기는 하지만, 많은 연구주제들이 더욱 활발히 진행되거나 세분되었으며, 감소하기도 하는 변화가 있었다. 이러한 연구의 결과는 목록 분야의 시대적 흐름과 함께 지적구조를 시각적으로 파악할 수 있게 하며, 미래의 모습을 예측하여 관련 교육과 연구를 준비할 수 있다는 점에서 의의가 있다.

디지털 텍스트의 음절을 이용한 운율 정보 시각화에 관한 연구 (A Study on Rhythm Information Visualization Using Syllable of Digital Text)

  • 박선희;이재중;박진완
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.120-126
    • /
    • 2009
  • 정보화 시대가 빠르게 성장하면서 디지털 텍스트의 양도 증가하고 있다. 이에 따라 수많은 디지털 텍스트를 파악하기 위한 시각화 사례가 증가하고 있다. 기존의 디지털 텍스트 시각화 디자인은 스태밍 알고리즘(stemming algorithm)의 도입과 단어 빈도수를 추출하여 주제어를 형상화하여 텍스트의 의미를 부각시키고 문장과 문장을 연결해주는 것에 치중하고 있다. 이에 디지털 텍스트의 정서적인 느낌을 시각화할 수 있는 운율을 표현하는 것에 있어서 미흡했던 부분이 사실이다. 운율을 보다 효과적으로 표현할 수 있는 음운단위로는 음절을 들 수 있다. 문장에서 음절은 단어나 구, 문장의 발음에 가장 기본적인 발음 단위가 된다. 이를 기본으로 강세, 성조, 운율 요소들의 길이 등이 음절에 기반을 두고 있다. 음절을 정의하는 것과 가장 밀접한 연관이 있는 공명도(sonority)는 발화할 때 폐의 공기 흐름과 운동 에너지(Kinetic energy)를 공명도로 명시되는 음향에너지(acoustic energy)로 표현한 것이다. 본 연구는 이러한 관점에서 디지털 텍스트의 속성인 음절을 기반으로 음운론적 정의와 특성을 살펴보고 운율을 다이어그램을 통해 시각화하기 위한 방법을 연구한다. 실험을 통해 디지털 텍스트를 발음기호로 변환한 후, 모든 언어속의 리듬에서 출발된 음절의 공명도를 사용하고 디지털 텍스트를 음절화하여 운율 정보를 이미지로 시각화한다. 운율 정보를 시각화함으로써 디지털 텍스트의 음절 정보를 알 수 있고, 디지털 텍스트의 정서를 다이어그램을 통해 체계적인 공식에 의하여 사용자의 이해를 돕도록 표현한다. 이에 해당 텍스트의 운율을 보다 쉽게 파악하도록 설계하여 디지털 정보 시각화를 구현하는데 그 목적을 두고 있다.

  • PDF

2006년 '화학의 해'의 언론매체 속 화학 이미지 분석 (The Analysis of Chemistry's Image in Daily newspaper on '2006, the Year of Chemstry')

  • 신선영;조미주;박종석
    • 과학교육연구지
    • /
    • 제32권1호
    • /
    • pp.47-60
    • /
    • 2008
  • 기초 과학 진흥과 과학의 대중화를 위한 노력의 일환으로 과학기술부는 2004년을 '과학문화의 해', 2005년을 '물리의 해', 2006년을 '화학의 해', 2007년을 '생물의 해' 그리고 2008년을 '지구의 해'로 정해 다양한 행사를 기획 시행하였고, 하고 있다. 2006년 '화학의 해'에는 화학을 소재로 한 각종 전시 행사 및 대회가 개최되었다. 과학연극 '산소'의 무료 전국순회공연이 있었고, 이동화학관은 2006년도뿐만 아니라 올해도 분주하게 전국투어를 하고 있다. 한국방송공사(KBS)에서는 '화학의 해'를 기념하여 특별기획 프로그램을 여러 차례 방영하였다. 이만큼 '화학의 해'에는 화학이 대중들에게 가까이 다가갔었다. 이 같은 환경 속에서 2006년 화학의 해에 대중매체 중 일간지에서는 화학이 어떻게 그려졌었는지, 그것은 대중들에게 어떻게 보여 졌는지 궁금하였다. 이에 국내 4대 일간지를 선정 '화학의 해'인 2006년에 보도된 화학 관련 기사를 여러 검색어를 이용 검색하여 기사에 나타난 화학의 이미지를 분석하였다. 검색어는 화학 관련 단어를 설문조사하여 빈도수가 가장 많은 5개의 단어 선정하였고, 이를 인터넷 신문사 검색 창에 입력하여 기사를 찾았다. 찾아진 기사는 연구자들이 읽어가면서 화학 관련된 것을 선별하였고, 선별된 기사들을 읽어 기사 속 화학의 이미지를 긍정과 부정 그리고 기사의 속성 등으로 분석하였다. 대중매체에 제시되는 화학의 이미지는 대중들에게 가장 쉽게 전달될 수 있는 경로이므로 대중매체에 나타나는 화학의 이미지는 음양으로 대중들에게 커다란 영향을 줄 수 있을 것이다.

  • PDF

언어기반 게임그래픽 디자인 발상의 창의적 인지에 관한 연구 (A Study on Creative Cognition of Language based concept Generation of Game Graphics)

  • 허윤정
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.171-179
    • /
    • 2011
  • 본 연구는 디자인발상 과정에서 구글의 연관 검색어를 언어 자극으로 제공했을 경우 디자인 결과에 어떠한 결과를 주는지 그리고 그러한 과정에서 창의적 인지 과정이 어떻게 사용되는 지를 분석하였다. 디자인 발상 과정에 구글의 연관 검색어를 자극제로 5단계에 걸쳐 제공하였다. 구글 검색어는 다수의 사용자의 참여와 공헌에 의해 새롭게 재창조된 지식과 정보를 제공하는 집단지성에 기반을 두고 있다. 실험을 위해 두 가지 과제를 연관 검색어들과 함께 제공하였다. 디자인 발상실험 후 연관검색어의 사용여부와 빈도수 그리고 핀케의 12가지 제네플로어 모델이라는 3가지 기준에 의해 분석하였다. 본 연구의 결과를 요약하면 다음과 같다. 여러 단계의 연관 검색어들을 사용했으나, 초기 연관 검색어와 연관성이 높은 상위 단계의 검색어가 하위 단계의 검색어보다 더 많이 사용되었다. 또한 상위 단계와 하위 단계의 검색어들을 함께 사용했을 때 더 창의적의 결과가 나타났다. 핀케의 제네플로어 모델의 12가지 인지 과정에 따라 실험결과물을 분석한 결과 창의적 결과물은 단순히 연관 검색어를 사용하기 보다는 여러 단어들을 연합하고 변형하였으며 또한 창의적인 결과에는 12가지 인지 과정 중 개념적 해석, 기능적 추론과 맥락적 전이와 같은 인지 과정이 사용되었다.

초·중등 AI 교육을 위한 데이터 리터러시 정의 및 구성 요소 연구 (A Study of the Definition and Components of Data Literacy for K-12 AI Education)

  • 김슬기;김태영
    • 정보교육학회논문지
    • /
    • 제25권5호
    • /
    • pp.691-704
    • /
    • 2021
  • AI 기술의 발달은 우리 삶의 큰 변화를 가져왔다. 생활에서부터 사회, 경제에 이르기까지 AI의 영향력이 커짐에 따라 AI와 데이터 교육에 대한 중요성이 함께 커지고 있다. 이에 OECD 교육 연구 보고서 및 다양한 국내 정보과 교육과정 연구에서 데이터와 데이터 리터러시를 다루고 필수 역량으로 제시하고 있다. 하지만 국내외 관련 연구를 살펴보면 데이터 리터러시에 대한 정의와 구성 요소의 내용과 범위가 연구자에 따라 다른 것을 알 수 있다. 이에 데이터 리터러시 관련 주요 연구의 정의와 구성 요소에 활용된 단어 빈도 분석과 함께 Word2Vec 딥러닝 자연어 처리 방법을 통해 단어의 관계와 의미 유사도를 분석하여 객관적이고 포괄적인 정의와 구성 요소를 제시하였다. 그리고 전문가 검토를 통해 수정 보완하여 데이터 리터러시를 '문제를 해결하기 위해 데이터를 수집하고 분석 및 활용하여 정보로 처리하는 지식 구성과 의사소통의 기초 능력'으로 정의하였으며, '지식, 기능, 가치와 태도'로 각각의 구성 요소를 범주화하였다. 본 연구를 통해 도출된 데이터 리터러시의 정의와 구성 요소가 AI 교육 체계화와 학생들의 미래 역량 관련 교육 연구에 좋은 기초 자료가 될 수 있기를 기대한다.

텍스트마이닝 기법을 활용한 국내외 장소성 관련 연구동향 분석 (Analyzing the Study Trends of 'Sense of Place' Using Text Mining Techniques)

  • 이인아;김혜진
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.189-209
    • /
    • 2019
  • 주경로 분석(Main Path Analysis, MPA)은 문헌의 인용정보를 기반으로 지식이 전달되는데 기여한 핵심 문헌을 추출하는 텍스트마이닝 기법 중 하나이다. 본 연구는 1990년부터 2018년까지 국내외에서 발행된 장소성 관련 논문의 인용정보와 초록을 토대로 주경로 분석과 단어동시출현빈도 연관어 네트워크 분석을 적용하여 연구동향을 파악하였다. 1990년부터 2018년까지 수집된 문헌을 5년씩 기간 구분하여 (마지막 기간은 3년) 각 기간 별로 국내외에서 장소성 관련 연구가 전반적으로 어떻게 진행되었는지 비교 분석하여 제시하였다. 주경로 분석 결과, 1990년부터 해외의 장소성 관련 연구는 개인 정체성, 공공 토지 관리, 환경 교육, 도시 개발 분야 순으로 진행되어 온 것으로 나타났다. 단어동시출현을 기반으로 한 연관어 네트워크를 통해서는 국내의 경우 도시 개발, 문화, 문학, 역사 등 다양한 차원에서 장소성이 논의되는 격변기를 겪는 것으로 해석할 수 있었다. 반면 국외에서는 건강, 정체성, 경관, 도시 개발 관련 논의가 90년대부터 꾸준히 이루어지고 있는 것으로 파악되었다. 본 연구는 장소성 연구동향을 기존의 특정 영역에 장소성 개념을 적용하여 분석하는 미시적 관점의 분석이 아닌 다양한 텍스트마이닝 기법을 적용하여 장소성을 주제로 삼고 있는 논문의 전반적인 흐름을 파악하는 통시적 접근의 방법을 제시하였다는 점에서 시사점을 지닌다.

신문기사에 나타난 장애인스포츠에 대한 인식 -의미연결망을 활용한 빅데이터 분석- (Perceptions of Disabled Sports in Newspapers Using Semantic Networks Analysis)

  • 한민규;김원경;윤지운
    • 재활복지
    • /
    • 제20권4호
    • /
    • pp.157-175
    • /
    • 2016
  • 본 연구의 목적은 텍스트 빅데이터 분석의 일종인 의미연결망을 활용하여 신문기사에서 나타나는 장애인스포츠에 대한 인식을 알아보는 것이 목적이다. 이 목적을 위하여 '장애인스포츠'를 검색어로 네이버 포탈을 이용하여 21개 언론사 745건의 기사를 수집하였으며 Krkwic 소프트웨어 프로그램을 사용하여 자료정제와 공출현 빈도를 산출하였다. 장애인스포츠에 대한 인식은 Netminer 4.0을 활용하여 연결중앙성, 매개중앙성, 위세중앙성을 지표로 분석하였다. 의미연결망 분석을 통하여 얻은 결과는 다음과 같다. 첫째, 신문기사에서 나타난 장애인스포츠를 규정하는 핵심단어는 감동, 도전, 축제, 꿈, 희망이다. 그리고 장애인스포츠의 인식을 나타내는 핵심단어는 장애유형에 따라 차이가 있다. 둘째, 장애인스포츠에 대한 인식을 장애유형별로 구분하여 분석한 결과 크게 경기력관련 인식과 감성관련 인식으로 구분할 수 있다. 구체적으로 지체장애 스포츠 대상의 경기력관련 인식은 패럴림픽, 로봇, 감동 등이며 감성관련 인식은 행복, 희망 등이다. 지적장애 스포츠 대상의 경기력관련 인식은 패럴림픽, 스페셜올림픽, 축제 등이고 감성관련 인식은 사랑, 감동 등이다. 시각장애 스포츠 대상의 경기력관련 인식은 메달, 달리기 등이며 감성관련 인식은 희망, 나눔 등이다. 결론적으로 신문기사에서 나타나는 장애인스포츠에 대한 인식은 패럴림픽, 스페셜올림픽 등의 장애인스포츠 경기대회는 장애인들의 도전과 꿈을 이룰 수 있는 축제의 장이며 경기를 통해 일반대중들에게 감동을 선사한다고 의미화 할 수 있다.

미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약 (Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV)

  • 이태석;선충녕;정영임;강승식
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.58-65
    • /
    • 2019
  • 문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.

기업 아카이브에 관한 연구 동향 분석: 토픽모델링 분석을 중심으로 (Analysis of the Research Trends on Business Archives: Focusing on the Topic Modeling Analysis)

  • 김효선
    • 한국기록관리학회지
    • /
    • 제21권3호
    • /
    • pp.163-186
    • /
    • 2021
  • 본 연구는 해외의 기업 아카이브에 관한 연구 동향을 분석한 후 이를 국내 관련 선행 연구와 비교하여 국내 기업 아카이브 연구의 발전방향을 제시하는 것을 목적으로 한다. 이를 위해 Web of Science, Scopus, LISA(ProQuest), LISS(EBSCOhost) 4개의 학술 DB를 활용하여 총 493편의 논문의 서지사항을 수집하였으며, 관련 논문의 발행 현황 및 주요 학술지, 연구 형태 및 연구자 정보 중심의 데이터 분석을 실시하였다. 또한 영문 초록 데이터를 전처리하여 고유 단어를 추출하고 핵심 단어의 빈도를 파악하였다. 다음으로 토픽모델링 분석을 통해 전체 문헌 집단에서 7개 토픽을 추출한 후 각 토픽별 논문의 발행 추이를 분석하고, 해당 토픽의 주제와 대표적인 논문을 살펴보았다. 이들 토픽의 주제명은 각각 '기업 기록의 접근과 활용', '기업 기록의 정보적/증거적 가치', '기업 아카이브의 중요성과 운영 전략', '기업 유산으로서의 기업 기록관리', '디지털 환경에서의 기업 기록관리', '기업 기록의 보존 및 처분', '기업 기록의 역사적 가치'로 부여하였다. 본 연구의 분석 결과와 국내 선행 연구를 바탕으로, 향후 국내 기업 아카이브 관련 연구의 발전과 확대를 위한 시사점을 제언하였다.