• 제목/요약/키워드: 단어빈도

검색결과 542건 처리시간 0.031초

텍스트마이닝 기법을 통한 직업상담서비스산업의 직무 및 지식구조 분석 (Textmining-Based Analysis for Duty and Knowledge structure of Vocational Counseling Service Industry)

  • 육동인
    • 한국산학기술학회논문지
    • /
    • 제18권9호
    • /
    • pp.366-376
    • /
    • 2017
  • 본 논문은 빅데이터 분석방법인 텍스트마이닝 기법과 네트워크분석을 활용하여 직업상담서비스 산업의 직무와 지식구조를 분석하기 위한 것이다. 정부에서 추진하는 국가직무능력표준(NCS)에서 제시한 직업상담, 전직지원, 취업알선 세 분야의 능력단위요소를 조사 대상으로 하였다. 사용빈도수가 높았던 단어들에 대한 분석결과 이 세 분야는 각각의 독자적인 직무도 있었지만 내담자, 구직자 등을 대상으로 상담, 검사, 취업지원 등 중복된 직무가 많았다. 직업상담서비스 분야 종사자들에게 요구되는 지식은 직업상담사 자격시험에 포함되어 있는 직업심리학, 직업상담학, 노동시장론, 직업정보론, 법률 등 5가지 외에도 창업, 생애진로, 직업적응, 문화충돌 등 새로운 분야가 다수 포함되어 있었다. 또한 상담자들에게는 공감, 수용, 경청 등 감성적인 접근과 함께 객관적, 가치중립, 정확 등의 태도를 중시하는 등 가치중립적인 입장을 견지할 것을 제시했다. 본 논문은 직업상담서비스분야의 직무를 빅데이터 분석을 통해 객관적으로 분석한 첫 시도라는 점에서 의의가 있다. 또한 정부의 정책방향과 실제 산업 현장의 차이를 처음으로 구체적으로 확인했다는 점도 의미있다고 할 수 있다.

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템 (A System for Automatic Classification of Traditional Culture Texts)

  • 허윤아;이동엽;김규경;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.39-47
    • /
    • 2017
  • 한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.

제한된 한글 입력환경을 위한 음소기반 근사 문자열 검색 시스템 (A Phoneme-based Approximate String Searching System for Restricted Korean Character Input Environments)

  • 윤태진;조환규;정우근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.788-801
    • /
    • 2010
  • 모바일 기기가 발전함에 따라 입력 수단에 대한 연구는 중요한 이슈이다 키패드, 쿼티키패드, 터치, 음성인식 등 다양한 입력장치가 사용되고 있으나 아직 데스크톱 입력장치에 비해 편의성이 떨어져서 입력 시의 오타나 탈자 등의 오류가 포함되는 경우가 많다. 이러한 입력 오류는 문자 메시지 등 사람과의 의사소통에는 문제를 일으키지 않으나 사전, 주소록 등의 데이터베이스 검색에는 치명적인 오류로서 원하는 검색 결과를 얻지 못하게 된다. 특히 한글의 경우 자음과 모음의 조합을 통해 글자를 생성하는 특성상 1만자가 넘는 글자의 조합이 가능하여 영문에 비하여 오류의 빈도가 높다. 기존의 검색 시스템은 Suffix Tree등을 이용하여 입력 오류를 처리하지만 다양한 오류에 대응하기에는 한계가 있다. 본 논문에서는 오자, 탈자 등의 입력 오류를 허용하면서 빠른 검색이 가능한 근사 한글 단어 검색 시스템을 제안하고자 한다. 이 시스템은 기존의 알파벳에 적용된 근사 문자열 검색(Approximate String Searching)을 한글에 효과적으로 적용할 수 있는 여러 가지 알고리즘과 기법이 포함되어 있다. 그리고 제안된 시스템을 이용한 변형 욕설 필터링 시스템의 개발에 대해 이야기하고자 한다. 이 시스템은 유저의 각종 변형 욕설 입력에 대해 90% 이상의 필터링 성능을 보였다.

시각장애인을 위한 인공지능 관련 연구 동향 : 1993-2020년 국내·외 연구를 중심으로 (Research Trends on Related to Artificial Intelligence for the Visually Impaired : Focused on Domestic and Foreign Research in 1993-2020)

  • 배선영
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.688-701
    • /
    • 2020
  • 본 연구는 시각장애인 대상의 인공지능 관련 연구 동향을 살펴보기 위해 1993년부터 2020년 8월까지 국내·외 논문 총 68편을 선정하여 연도별 논문 게재 수, 연구방법, 연구주제, 키워드 분석 현황, 연구유형, 구현방법별 비교·분석하였다. 연구결과, 연구기간 내 논문 편수는 꾸준히 증가하는 것처럼 보였으나 국내 연구의 경우에는 2016년도 이후에 활발해진 것을 알 수 있었다. 연구방법으로는 국내·외 연구 모두 개발연구가 89.7%를 차지했고, 키워드는 국내 연구에서는 Visually impaired, Deep learning, Assistive device 순이였으며 국외 연구에서는 Visually impaired, Deep learning, Artificial intelligence 순으로 단어 빈도순에서 차이를 보였다. 연구유형은 국내·외 모두 설계, 개발, 구현이 대부분을 차지했으며 구현방법으로는 국내 연구의 구현방법으로는 System 13.2%, Solution 7.4%, App. 4.4% 순이였으며 국외 연구의 구현방법으로는 System 32.4%, App.13.2%, Device 7.4%로 다소 차이를 보였다. 구현방법의 적용 기술로는 국내 연구는 YOLO 2.7%, TTS 2.1%, Tensorflow 2.1% 순이였으며 국외 연구에서는 CNN 8.0%, TTS 5.3%, MS-COCO 4.3% 순으로 사용횟수가 높았다. 본 연구는 시각장애인 대상의 인공지능 관련 연구 동향을 비교·분석하여 국내·외 연구의 현주소를 바로 알고 앞으로 시각장애인을 위한 인공지능 연구의 방향을 제시하고자 하였다.

특허 등록 예측을 위한 특허 문서 분석 방법 (Analysis method of patent document to Forecast Patent Registration)

  • 구정민;박상성;신영근;정원교;장동식
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1458-1467
    • /
    • 2010
  • 최근 지식재산권의 모방과 권리 침해는 국가 산업발전의 저해요소로 인식되고 있다. 많은 연구자들은 이러한 저해요소로 인하여 발생하는 막대한 손실을 막기 위해 지식재산권의 보호와 효율적 관리에 관한 연구를 다양하게 진행 중이다. 특히, 특허 등록 예측은 지식재산권 보호와 권리 주장을 위해 매우 중요한 연구이다. 본 연구는 텍스트 마이닝 기법을 이용한 특허문서 분석을 통하여 특허 등록 및 거절 여부를 예측하는 방법을 제안한다. 먼저 거절된 특허문서들의 단어 빈도수를 이용하여 데이터베이스를 생성한다. 그리고 생성한 데이터베이스와 다른 특허문서들을 비교하여 각 문서와 데이터베이스와의 유사한 정도를 판단하는 유사치를 도출한다. 본 논문에서는 특허 거절 기준 값을 선정하기 위하여 분할 군집화 알고리즘인 k-means 사용하였다. 그 결과로 거절된 특허 문서와 유사한 특허 문서는 거절될 가능성이 높다는 결론을 얻을 수 있었다. 실험을 위한 데이터는 현재 미국에 출원되어 있는 블루투스 기술, 태양전지 기술 그리고 디스플레이에 관한 특허 문서를 이용하였다.

요양·재활병원 환자의 사회적 입원과 지역사회 복귀 어려움에 대한 작업치료사의 관점: 현상학적 연구 (Phenomenological Qualitative Research of Social Admission in Rehab hospitals: Occupational Therapists' Perspectives)

  • 김정헌;황나경;김종성;송영진;최민경;김형선;한가람
    • 재활치료과학
    • /
    • 제9권3호
    • /
    • pp.103-120
    • /
    • 2020
  • 목적 : 본 연구는 재활·요양병원 환자의 사회적 입원이 증가하고 있는 현상에 대해 작업치료사의 관점에서 분석하고자 하였다. 연구방법 : 작업치료사들의 관점을 확인하기 위하여 재활 서비스 평가 도구 RSAT를 기반으로 주관식 설문지를 구성하였고, 2019년 8월 전국 3년차 이상의 작업치료들에게 설문지를 배포 및 수거하였다. 설문지의 응답자료를 van Kaam의 현상학적 연구 방법을 통해 분석하였고, 유효 세부서술에 대해 Word cloud로 다빈도 단어를 분석하였다. 결과 : 배포한 설문지는 수도권, 충청권, 경상권에서 46명의 작업치료사들로부터 응답을 받았다. 설문지의 응답자료는 2개의 범주(categories)와 4개의 주제(theme), 13개의 하위주제(subtheme)로 분석되었다. 2개 범주는 '병원의 체계'와 '작업치료 임상의 내·외부적 요인'으로 나타났으며 '병원의 체계'에 따른 주제는 '다학제 팀 접근의 어려움'과 '퇴원계획 체계의 미흡'으로 나타났다. '작업치료 임상의 내·외부적 요인'에 따른 주제로는 '작업치료사의 어려움'과 '작업치료 실시의 어려움'으로 분석되었다. 결론 : 작업치료사들은 재활·요양병원 환자들의 지역사회 복귀가 어려운 가장 큰 원인이 합리적이지 못한 작업치료 관련 요양급여체계에 있다고 지적하였다. 퇴원 및 지역사회 적응을 위한 작업치료 서비스 체계의 미흡함 역시 환자들로 하여금 퇴원하지 못하고 결국 다시 병원으로의 입원을 하게 만드는 주요 원인의 하나로 인식하고 있었다. 향후 작업치료 처방 및 의료 급여 체계를 환자의 재활 목적에 맞도록 다면화할 필요가 있음을 제언한다.

도시매력도와 인구이동 (Perception of City Attractiveness and Internal Migration in Korea)

  • 김창석
    • 한국인구학
    • /
    • 제9권1호
    • /
    • pp.89-99
    • /
    • 1986
  • 이 연구는 우리나라에 있어서의 도시로의 인구이동과 도시매력도와의 관계를 <인지-행태>론적인 관점에서 설명하려데 그 목적이 있다. Julian Wolpert (1965)의 "장소효용접근방법"으로 체계화된 이 이론의 요지는 사람들이 이주대상지를 결정함에 있어서 그 대상지의 객과적인 매력도 보다는 자신들이 갖고 있는 정보를 토대로 주관적으로 판단한 이른바 "인지된 매력도"에 좌우된다는 점이다. 이 연구에서는 우리나라의 자료를 토대로 Wolpert의 가설을 검증하여 보았다. 인구이동의 관점에서 본 도시매력도의 구성요소를 (1) 소득수준, (2) 취업기회, (3) 교육기회, (4) 주거사정, (5) 도시시설의 질, (6) 이주시 도움을 받을 수 있는 친지의 유무, (7) 사회적 성장기회 등 7개 항목으로 분류하여 우리나라의 도시들을 객관적인 매력도와 주관적인 매력도로 계량화하였다. 객관적인 매력도는 기존의 통계자료를 지표화하여 측정하였고, 주관적인 매력도는 충청북도 주민들을 대상으로 1983년 현재 인구 10만 이상의 36개 도시에 대한 매력도 순위 설문조사를 통해 계량화하였다. 이들 매력도를 독립변수로 하고 충북으로부터 각 도시로 전출된 인구를 종속변수로 하여 통계적 분석을 한 결과 객관적인 매력도는 인구이동 현상을 55-58% 설명하였으나, 주관적인 매력도는 약 95%정도 설명하는 것으로 나타나 인구이동 의사결정이 주민들에게 인지된 주관적 매력도에 크게 의존하고 있음이 판명되었다. 따라서 학교교육이나 대중매체를 이용한 장기적인 <인포메이션 프로그램>을 개발하여 농촌생활이나 중소도시에서의 생활의 장점을 널리 계몽하여 도시의 주관적 매력도와 객관적 매력도간의 간격을 좁혀주는 정책도 매우 유용한 대도시 인구분석정책대안의 하나가 될수 있을 것이다.정책대안의 하나가 될수 있을 것이다.다. 고로 본고에서는 주사제의 처방설계및 제조(방법, 공정)에 관하여 개괄적으로 논하고자 한다.약화되어 저적면적빈도분포가 정상분포 단계에 도달되기 전에 바로 platykurtic분포로 되는 것이 아니고 leptokurtic 분포적 단계를 거친다고 본다때 시간의 경과를 따라 생성되어지는 Cyclodextrin의 함량의 변화를 추적하여 4시간전후에서 최고량이 되는 것을 볼 수 있으며 동시에 포위화합물을 형성시킬수 있을때는 그 생성률이 큰 영향을 이르킬수 있는 것을 지적할 수 있다.한 특성을 보여 식품제조, 식육연화 등 식품산업 분야에서의 활용가능성이 높을 것으로 보이며, 나아가 단백질이 갖는 식품학적 기능성을 높이는 데에도 사용할 수 있을 것으로 판단된다.를 한 후 저온 냉장차를 이용하여 유통한다면 관행 유통 구조보다 고품질의 포도를 유통시킬 수 있는 것으로 사료되며 앞으로는 완숙된 고 당도(12.0~15.0Bx)$^{\circ}$ 포도를 수확 한 즉시 예냉 처리하고 저온 유통한다면 보다 신선한 과일을 소비자에게 전달 할 수 있을 것이다.갈변물질이 생성되었다. 이와 같은 결과로 볼 때, BAAG의 처리는 BAAC의 경우보다 가격은 저렴하면서도 항균력은 우수한 천연 항균복합제재로써 농산물 식품원료에 적용하여 선도유지 기간을 연장할 수 있는 효과를 기대할 수 있었다. 과일 등의 포장제로서 이용할 가능성을 확인하였다.로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X^{0}$ elements)로 가정한다. 즉, [+wh] 의미의 겹의문사는

  • PDF

한국인과 중국인의 공동창업기업 성장의도에 대한 연구 (A Study on the Growth intention of Korean and Chinese Co-Founding Startup Companies)

  • 김아현;문준환;이재범
    • 벤처창업연구
    • /
    • 제15권3호
    • /
    • pp.145-158
    • /
    • 2020
  • 사회는 서로 다른 특성을 갖는 개인이 모여 구성되기 때문에 그 집합 또한 서로 다른 특징을 갖는다. 더욱이 글로벌화와 타 국가의 언어습득이 활성화되면서 다른 국가로 유학을 가는 빈도수가 증가하면서 새로운 교류가 증대되고 있다. 본 연구는 그 중 창업을 하고자하는 경우를 확인하고자 하였다. 탐색적 연구를 진행하기 위해서 한국인과 중국인이 구성된 공동창업기업을 대상으로 반 구조화된 인터뷰를 통하여 보다 심도 높은 내용을 확인하고자 하였다. 인터뷰 중에 지속적으로 반복하거나 강조한 단어 등을 주요 키워드로 삼았으며 추가적인 질문을 통해서 타 키워드들을 획득했으며, 결과적으로 국가가 상이한 경우의 공동창업에서 자기수용, 문화적 거리, 기업가정신, 지식이질성, 성장의도가 매우 큰 키워드임을 확인하였다. 분석결과를 토대로 자기수용, 문화적 거리, 기업가정신을 독립변수로 설정하고 성장의도를 종속변수로 하여 연구모형을 설정하였다. 다른 국적을 가진 경우의 공동창업의 경우 다른 지식을 가짐으로 인해 더 넓은 의사결정안을 확보할 수 있다는 장점이 있으나 이 차이가 너무 상이할 경우 오히려 단점이 될 수도 있기 때문에 지식이질성은 각 관계들에 있어서 역 U자의 조절효과를 나타내는 것으로 명제를 설정하였다.

텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석 (Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm)

  • 선현석;임창원;이영섭
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.603-613
    • /
    • 2017
  • 최근 들어 많은 사람들이 자신의 관심사를 SNS에 게시하거나 인터넷과 컴퓨터의 기술 발달로 디지털 형태의 문서저장이 가능하게 됨으로써 생성되는 텍스트 자료의 양이 폭발적으로 증가하게 되었다. 이에 따라 수많은 문서 자료로부터 가치 있는 정보를 창출하기 위한 기술의 요구 또한 증가하고 있다. 그러나 대부분 비정형 형태로 구성되어 있는 텍스트 기반의 자료는 기존의 통계 분석이나 데이터 마이닝 기법을 적용하기에 부적합하기 때문에 텍스트 마이닝 기법이 사용되고 있다. 본 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 기상연감 자료를 분석하였다. 먼저 전처리 과정을 통하여 용어사전을 구축하고, 용어-문서 행렬을 생성하였다. 그리고 이것을 사용하여 연도별 용어 빈도수를 계산하고, 자주 나타나는 단어들에 대하여 상대도수의 변화를 관찰하였다. 또한 회귀 분석 기법을 사용하여 증가추세와 감소추세를 보이는 용어들을 파악하였다. 이러한 분석으로 기상청 기상연감 문서에서의 트렌드를 파악하고, 이를 통해 이슈가 되었던 기상 관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무 현황의 트렌드를 파악하였다. 본 연구를 통해 기상업무 분석 및 효율화에 도움을 주고 기상정책에 반영할 수 있는 유용한 정보를 이끌어내고자 하였다.

토픽 모델링을 이용한 컴퓨팅 사고력 관련 연구 동향 분석 (Analysis on Trend of Study Related to Computational Thinking Using Topic Modeling)

  • 문성윤;송기상
    • 정보교육학회논문지
    • /
    • 제23권6호
    • /
    • pp.607-619
    • /
    • 2019
  • 2015개정 교육과정을 통해 소프트웨어 교육이 도입되면서 기존의 ICT 소양 및 응용 소프트웨어 활용 교육에서 벗어나 학습자의 컴퓨팅 사고력을 향상시키기 위한 다양한 연구 활동이 이루어져 왔다. 이와 같은 변화에 따라 본 연구에서는 소프트웨어 교육에서 강조되고 있는 컴퓨팅 사고력과 관련된 다양한 연구 활동에 대한 연구 동향을 살피는데 그 목적이 있다. 이를 위해 2014년 1월부터 2019년 9월까지 출판된 컴퓨팅 사고력과 관련된 190편의 논문을 대상으로 주제어를 추출하여 그 단어들을 대상으로 빈도분석, 워드 클라우드, 연결 중심성, 토픽 모델링분석을 실시하였다. 토픽 모델링 분석 결과 지금까지의 주된 연구에는 '컴퓨터 사고력 교육 프로그램', '컴퓨팅 사고력 예비교사 교육', '컴퓨팅 사고력 로봇 활용 교육', '컴퓨팅 사고력 평가', '컴퓨팅 사고력 교과 연계 교육'에 관한 연구들이 진행되고 있음을 확인할 수 있었다. 본 연구 방법을 통해 현재까지 주로 진행되고 있는 컴퓨팅 사고력 관련 연구 동향을 파악할 수 있었고, 이는 컴퓨팅 사고력 교육의 어떤 부분이 연구자들에게 더 중요하게 인식되고 있는지를 알 수 있게 해 준다.