• 제목/요약/키워드: 어휘사용빈도

검색결과 104건 처리시간 0.024초

친환경 감성 어휘의 종류별 사용빈도 및 변화 양상 (Appearance Frequency of 'Eco-Friendly' Emotion and Sensibility Words and their Changes)

  • 나영주
    • 감성과학
    • /
    • 제14권2호
    • /
    • pp.207-220
    • /
    • 2011
  • 친환경 감성단어를 '환경/자연, 소재/섬유, 인간, 형용사/기타' 등의 4가지 영역으로 분류하고 각 단어에 대하여 그 출현시점, 빈도를 1999~2010년 상반기 간의 인터넷 섬유패션 신문 및 잡지를 중심으로 조사한 결과, 다음과 같은 결론을 얻었다. 가장 빈번히 출현한 단어는 '자연, 환경, 면, 천연섬유, 건강, 신선한, 맑은, 보존, 하모니, 옥수수섬유, 로하스' 등이었다. '친환경' 관련 감성단어의 출현시점을 살펴보면, 2000년도 이전부터 '에코, 형상기억소재, 오가닉, 스파' 등이 사용되어왔으며, 2000-1년도에 '자연환경, 친환경, 스트레치소재, 웰빙의, 대체가능한, 재생가능한' 등이 등장하였다. 2002-3년도에 '스마트소재, 친환경소재, 그린' 등이 사용되기 시작하였고, 2004-5년도에 '쿨비즈, 로하스, 자연염색' 등이 처음으로 사용되었다 2006-7년도에 '한방, 지속가능한, 웜비즈' 등이 사용되었고, 2008-9년도에 '그린슈머, 그린라이프, 태양에너지, 삼림욕' 등이 섬유패션 분야에서 처음 사용되었다. 친환경 감성단어의 출현 양상을 살펴보면, 친환경 감성단어의 출현은 과거 어느 때보다 2008-09년도에 가장 많이 등장하고 있었는데 2000년도 초반에는 비교적 많이 등장하였으나 이후 다소 주춤하였고 이는 근래에 들어 다시 출현빈도가 높아졌다. 영역별로 살펴보면 '환경/자연' 관련 친환경 감성 단어가 과거보다 최근에 두드러지게 빈번히 사용되고 있으며, 이에 비해 '인간' 관련 단어는 주춤하여 약간 감소세이거나 동일한 빈도를 나타내고 있다. 또 '형용사/기타' 관련 단어는 약간 증가세이거나 과거와 동일한 빈도를 나타내고 있었다. '소재/섬유' 관련 단어는 패션잡지에서는 최근에 그 빈도가 줄어드는 경향을 보이는 반면 인터넷 신문에서는 약간 증가하는 추세를 보였다.

  • PDF

텍스트 마이닝과 네트워크 이론을 활용한 권역별 국가하천 점용허가 키워드 분석 (Analysis of Keywords in national river occupancy permits by region using text mining and network theory)

  • 정성윤
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.185-197
    • /
    • 2023
  • 점용허가 정보를 기록하는 단순 용도로만 사용되고 있는 허가 대장에서 허가 내용에 내재한 점용 신청과 허가업무 수행에 유용한 정보를 추출하기 위해 텍스트 마이닝과 네트워크 이론을 활용하여 본 연구를 진행하였다. 텍스트 마이닝 기반으로 불용어 제거와 형태소 분석 등 정규화 과정을 비롯하여 서울·경기, 경상, 전라, 충청, 강원 등 5개 권역별로 어휘 출현 빈도와 토픽 모델링을 분석, 비교하였다. 네트워크 이론에 가정 많이 사용되는 단계, 근접, 매개 및 고유벡터 등 4종의 중심성 알고리즘을 적용하여 네트워크에서 중심적인 위치에 있거나 중간 매개체 역할을 하는 키워드를 살펴보았다. 이러한 어휘 출현 빈도, 토픽 모델링 및 네트워크 중심성을 종합적으로 분석하여 모든 권역에서 '설치' 키워드가 가장 영향력이 큰 것을 알 수 있었다. 이는 환경부의 허가관리청에서는 시설물을 건설하거나 공작물을 설치하는 허가가 많아서 나타난 결과라고 판단된다. 또한, 도로 시설, 치수 시설, 지하 매설 시설, 전력·통신 시설, 체육·공원 시설 등과 연관된 키워드가 토픽 모델링과 네트워크에서 중심적 위치에 있거나 중간 매개체의 역할을 하는 것을 알 수 있었다. 키워드 대부분은 출현 빈도와 분포 비율이 낮은 짚프의 원칙(Zipf' Law)의 통계분포 형태를 보이는 것으로 보였다.

공공보건시설 환경색채이미지 어휘 특성 (Characteristics of Environmental Color Image Vocabulary for Public Healthcare Facility)

  • 박혜경;오지영
    • 한국과학예술포럼
    • /
    • 제31권
    • /
    • pp.171-180
    • /
    • 2017
  • 본 연구는 최근 건강, 웰빙에 대한 관심이 증가함에 따라, 공공의 다수가 이용하는 공공보건시설이 국민건강 증진에 기여하는 색채환경 구축을 위한 색채이미지 특성을 분석하여 공공보건색채 계획 및 지표개발의 데이터로 활용하고자 하는 것을 목적으로 한다. 이를 위하여 기존 관련 선행연구 결과를 종합하였고, 공공보건시설을 유형별로 의료시설(종합병원), 보건시설(보건소), 준치유시설(요양시설)로 구분하였다. 총 18곳의 공공보건시설을 직접 방문하여 측색기로 환경색채를 측색하여 환경색채이미지를 분석하였고, 이에 대한 결과 및 선행연구 결과와 비교분석하여 색채이미지 특성 및 향후 보완할 점들을 도출하였다. 결과는 다음과 같다. 첫 번째, 공공보건시설의 환경색채이미지 어휘와 관련된 선행연구에서는 편안하고 밝은 긍정적인 이미지를 선호하는 것으로 나타났다. 두 번째, 공공보건시설의 환경색채를 직접 측색한 결과, 대부분 Y계열의 고명도, 저채도 색상을 사용하고 있는 것으로 나타났다. 세 번째, 공공보건시설의 환경색채이미지 어휘를 분석한 결과, '내츄럴한' 이미지가 가장 높은 빈도를 나타내었고, 그 외 '은은한', '점잖은' 등의 이미지가 나타나고 있는데, 공공보건시설의 색채이미지어휘간의 특성을 파악하기가 어려웠다. 본 연구는 색채과학과 환경디자인 분야의 융합연구로서, 디자인과 관련된 다학제적 연구 범위를 넓혔으며, 사용자 감성 중심의 환경계획에 도움이 될 것으로 사료된다.

한국어 중의적 형태소 표상양식과 처리 특성 : 실어증 환자를 중심으로 (The Processing and Representations of Ambiguos Morpheme in Korean Words : Centered in Aphasics.)

  • 정재범;편성범;김태훈;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.151-156
    • /
    • 2002
  • 중의적인 단어를 처리하는 방법에 대한 선행연구로, 첫째 문맥에 맞는 의미가 먼저 활성화된다는 가설과 둘째, 여러 뜻 중에 상대적인 빈도에 따라 많이 쓰이는 의미가 먼저 활성화되고, 그것이 문맥과 일치하지 않는다면, 다른 관련된 의미를 찾는다는 가설이 제기되었다. 마지막으로 문맥에 상관없이 모든 의미가 활성화 된 후 문맥을 고려하여 문맥에 적절한 의미를 선택한다는 가설이 있다. 본 연구에서는 '먹을', '감을' 등과 같이 2가지 의미의 품사가 다른 중의 어절과 '쥐어', '감어' 등과 같이 어절 문맥('어')이 주어진 어절의 의미 활성화가 어떻게 다른지를 조사하였다. 본 연구의 목적을 위해 점화어휘 판단 과제를 사용하였다. 실험 1의 결과는 SOA 150ms 조건에서 점화자극어절과 관련된 의미가 품사와 관련 없이 모두 활성화되었다. SOA 1000ms 조건에서는 상대적으로 많이 쓰이는 체언의 의미는 계속 활성화 되어 있는 반면, 용언의 의미 점화량은 감소하였다. 명칭성 실어증 환자인 SDK의 경우 SOA 150ms 조건에서는 일반인과 같은 형태소 처리특성을 보였으나 1000ms 조건에서는 달랐다. 다른 명칭성 실어증 환자인 BIS과 전반성 실어증 환자인 PSB는 SOA 150ms 조건과 1000ms 조건에서 일반인과 아주 다른 양상을 보였다. 이것은 실어증 환자의 타잎에 따라 형태소의 처리나 중의적인 의미 활성화가 일반인과는 다르다는 것을 보여준다. 실험 2에서는 어절 문맥이 있는 '먹어', '쥐어', '감어' 등과 같은 어절을 사용하였다. 실험 2의 결과는 SOA 150ms 조건일 때 어절문맥의 영향으로 용언의 의미만 촉진적 점화효과가 있었고, 체언의 의미는 활성화되지 않았다. 그러나 SOA 1000ms로 지연시켰을 때는 용언뿐만 아니라 체언의 의미도 촉진적 점화효과가 있었다. 실험 1과 2의 결과는 중의적인 한국어 어절의 경우에도 모든 의미가 활성화되나 어절 문맥이 존재할 때는 어절 문맥의 제약으로 어절 문맥에 맞는 한 가지 의미만 활성화된다는 것을 암시한다. 또한 이러한 결과는 한국어 어절이 분석된 형태가 아닌 어절 형태로 심성 어휘집에 저장되어 있다는 것을 암시한다. 실어증 환자의 경우 실험 1과 마찬가지로 환자의 수준이나 종류에 따라 다양한 반응을 보여주었다.

  • PDF

청각장애인을 위한 일기예보 수화방송 시스템 개발 (Development of Weather Forecast Sign Language Broadcasting System for the Hearing-Impaired)

  • 오주현;전성규;은준호;김민호;권혁철;김익태;김재현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.401-404
    • /
    • 2013
  • 청각장애인을 위한 지상파방송 서비스 중 자막방송은 100%에 가까운 편성 비율을 달성하고 있지만, 화면을 가리는 수화방송은 5% 수준의 편성에 그치고 있다. 본 연구에서는 자막방송을 수화로 번역하여 그래픽 수화방송을 생성함으로써 수화방송의 비율을 높이고자 한다. 수화 단어들의 빈도를 파악하고 중요 단어부터 모션 캡처하기 위해 과거 3년간 일기예보 스크립트를 분석하였다. 자막방송 문장을 형태소별로 분석한 다음 중요 품사 위주로 단어 단위로 번역하고, 기 구축된 한국어 어휘의미망을 이용하여 수화사전에 없는 유의어와 하위어를 대표어로 대체하였다. 기계번역 기술이 수화통역사의 수준을 따라잡을 수는 없지만 향후 수화방송도 선택적 서비스가 가능해지고 수화통역사의 수화방송이 모든 프로그램에 편성될 때까지 본 시스템이 보조적 시청 수단으로 사용 가능할 것이다.

  • PDF

"표준형 성인 암성 통증 평가도구" 개발을 위한 시각통증등급의 최고통증강도 어휘 및 심리.사회적 평가 항목의 선정 - 델파이 방법을 이용 - (The Selection of the Most Painful Word in the Visual Analogue Scale(VAS) for Pain and the Psychosocial Factors in Association with Pain Assessment in Korean Adult Cancer Patients - for the Development of Korean Cancer Pain Assessment Tool(K-CPAT) by Delphi Method -)

  • 김진서;천병철;최윤선;송찬희;염창환;이명아;이준영;윤소영;장세권;이영희;이경욱;이철;박진노
    • Journal of Hospice and Palliative Care
    • /
    • 제6권1호
    • /
    • pp.11-21
    • /
    • 2003
  • 배경 : 통증은 암환자에서 가장 흔하고 심각한 문제이지만 국내에는 아직 적절한 암성 통증 평가도구가 없는 상태이다. 이에 표준화된 성인용 암성 통증 평가도구를 개발하는 것이 필요하며, 통증 평가 도구 개발 시 연구되어야 할 내용으로 시각통증등급 중 가장 심한 통증에 대한 어휘를 단일화할 필요성과, 암환자 통증평가 시 암성 통증에 영향을 미칠 수 있는 심리사회적 항목을 수집, 선정 및 선별할 필요성을 인식하였다. 방법 : 2002년부터 2003년까지 암성 통증조절 분야에 전문가로 알려진 전문의 10명, 간호사 10명을 델파이 설문 대상자로 무작위 선정하여 델파이 방법을 통해 3차까지 설문을 실시하였다. 시각통증등급의 가장 심한 통증에 대한 어휘는 가장 높은 빈도로 응답된 어휘를 선택하기로 하였고 심리사회적 평가 항목의 선별은 전문가의 50%를 초과하는 인원이 '관련성이 높다'고 판정하면 선정하기로 하였다. 결과 : 시각 통증등급의 최고 통증강도 어휘 선정 결과는 '참을 수 없이 심한 통증'과 '상상할 수 없을 정도의 가장 심한 통증'이 각각 27.8%로 가장 높은 빈도를 보여 실무위원회와 통증 전문가의 자문결과 '상상할 수 없을 정도의 가장 심한 통증'이 선정되었다. 심리사회적 평가 항목은 문헌조사 결과 30개 항목이 수집되었으며, 정신과 전문의와 실무위원 회의를 통해 15가지로 선정하였으며, 델파이 대상자로 선정된 전문가의 50%를 초과하는 인원 수가 선택한 항목은 '환자의 정신과적 기왕력', '약물남용 및 의존성 유무', '환자의 불안, 우울 등 환자의 현재 감정', '자기조절 능력 소실 유무', '패배감이나 좌절감 유무', '건강 소실에 대한 환자의 적응 정도', '가족의 지지', '소외감 유무', '자신의 사회적 역할 소실에 대한 감정 상태', '스트레스 해소 대처 유형', '현재 처한 환자 자신의 영적 고뇌', '진통제 복용 순응도'등 12 가지 항목이었다. 결론 : "표준형 성인 암성 통증 평가"도구에 사용할 '시각통증등급'최고 통증강도 어휘에는 '상상할 수 없을 정도의 가장 심한 통증'을, 성인 암성 통증과 관련된 심리, 사회적 12가지 항목을 채택할 수 있었다.

  • PDF

미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약 (Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV)

  • 이태석;선충녕;정영임;강승식
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.58-65
    • /
    • 2019
  • 문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.

국내 다크웹 사용자들의 언어 사용 특성 분석 (Analyzing the Language Usage Characteristics of Korean Dark Web Users)

  • 이유진;임다연;이용재
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.397-402
    • /
    • 2022
  • 익명 네트워크 기술에 기반한 다크웹은 일반 표면웹보다 더 강화된 익명성을 제공한다. 최근 이 익명성을 악용하여 다수의 다크웹 사용자들이 다크웹 내에서 범죄 행위를 모의하는 행위가 꾸준히 발생하고 있다. 특히, 국내 다크웹 사용자들은 마약 유포를 위한 방법을 공유하거나 성착취물 유포 행위 등에 직간접적으로 가담하고 있다. 이와 같은 범죄 행위들은 수사 기관의 눈을 피해 현재까지도 계속해서 발생하고 있어 국내 다크웹 범죄 동향 파악의 필요성이 증대되고 있다. 그러나 다크웹 특성상 범죄 행위를 논의하는 게시글을 수집하기가 어렵고, 다크웹 내에서의 언어 사용 특성에 대한 이해 부족으로 그동안 다크웹 사용자들이 어떤 내용의 범죄를 모의하는지 파악하기가 어려웠다. 본 논문에서는 국내 사용자들이 활동하는 다크웹 포럼들을 중심으로 사용자들의 언어 사용 특성을 연구하고, 이를 통해 다크웹에서 다뤄지는 범죄 유형들을 분석한다. 이를 위해, 자연어처리 기반의 분석 방법론을 적용하여 다크웹에서 공유되는 게시글을 수집하고 다크웹 사용자들의 은어와 특정 범죄군에서 선호되는 언어 특성을 파악한다. 특히 현재 다크웹 내에서 사용자들 사이에 관측되는 어휘들에 대한 기술통계 분석과 유의어 관계 분석을 수행하였고, 실제 다크웹 내에서 사용자들이 어떠한 범죄에 관심이 많은지를 분석하였으며, 더 나아가 수사의 효율성을 증대시키기 위한 소셜미디어, URL 인용 빈도에 대한 연구를 진행하였다.

  • PDF

상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Mutual Information and Sense-Tagged Compound Noun Dictionary)

  • 허정;서희철;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1073-1089
    • /
    • 2006
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구는 상호정보량과 기 분석된 복합명사 의미사전에 기반한 동음이의어 의미 중의성 해소를 위한 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 기술들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료 부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 언어적인 특징을 반영하기 위해서 상호정보량을 가지는 어휘 쌍의 비율 가중치, 의미 별 비율 가중치와 뜻풀이의 길이 가중치를 사용하였다. 그리고, 복합명사를 구성하는 단일명사들은 서로의 의미를 제약한다는 것에 기반하여 고빈도 복합명사에 대해서 의미를 부착한 의미사전을 구축하였고, 이를 동음이의어 중의성 해소에 활용하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 200 여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 네 유형의 실험을 수행하였다. 실험 결과는 상호 정보량만을 이용하였을 때 65.06%의 정확률을 보였고, 가중치를 활용하였을 때 85.35%의 정확률을 보였다. 또한, 복합명사 의미분석 사전을 활용하였을 때는 88.82%의 정확률을 보였다.

CHILDES 코퍼스를 기반으로 한 아동의 영어 굴절형태소 발달 연구 (A Study on the Development of English Inflectional Morphemes Based on the CHILDES Corpus)

  • 민명숙;전종섭;이선영
    • 인지과학
    • /
    • 제24권3호
    • /
    • pp.203-235
    • /
    • 2013
  • 본 연구의 목적은 선행 연구에서 보고된 영어 모국어 아동의 굴절형태소 습득 과정을 대규모 언어습득 데이터베이스를 활용하여 검증하는 것이다. 이를 위해, 우리는 CHILDES(Child Language Data Exchange System) 데이터베이스에 등장하는 1-7세 영국 및 미국 아동 1,630명이 발화한 470만 어절 말뭉치를 대상으로 굴절형태소의 발달 과정을 분석하였다. 본 논문에서는 동사의 현재분사 -ing, 과거형 -(e)d, 형용사의 비교/최상급 -er/est 등의 형태소에 대해 어휘 유형(Type)과 사례(Token) 빈도, 전체 사례(Token)에 대한 유형(Type) 비율인 TTR(Type per Token Ratio), 어휘 다양성 척도인 Lexical Diversity(D) 값을 구하여 이를 국가 및 연령별로 비교, 분석하였다. 그 결과, 굴절형태소별로 연령과 D 값의 상관관계가 다르게 나타났다. 특히, 현재분사 -ing와 D 값 사이에는 주목할 만한 상관관계가 나타나지 않은 반면, 과거형 -(e)d의 경우 양의 상관관계 경향성이 보였고, 비교/최상급 -er/-est는 유의미한 상관관계를 보였다. 이는 현재진행형이 과거형보다 먼저 습득된다고 보고한 Brown(1973)의 견해를 지지한다. 다음으로, 과잉일반화에 따른 오류 표현이 2-3세 사이에 많이 나타나면서 U자형 발달 양상을 보였다. 과잉일반화도 현재분사보다 과거형에서 많이 나타났는데, 이것 또한 현재분사가 과거형보다 일찍 습득된다는 주장을 지지한다. 영국과 미국 아동의 연령별 굴절형태소 사용 양상을 비교한 결과, 미국 아동의 D 값이 영국 아동보다 높았다. 이는 미국 아동이 영국 아동보다 더 많은 어휘 유형에 대해 굴절형태소를 사용했음을 의미한다. 본 연구는 소수의 아동을 대상으로 수행된 선행 연구의 다양한 논점을 대규모 데이터베이스로 검증하고, CHILDES 코퍼스를 효율적으로 분석하는 연구 방법론을 제안했다는 점에서 의의가 있다.

  • PDF