• 제목/요약/키워드: Text network

검색결과 1,122건 처리시간 0.026초

자질 선택 기법을 이용한 한국어 화행 결정 (Decision of the Korean Speech Act using Feature Selection Method)

  • 김경선;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.278-284
    • /
    • 2003
  • 화행(speech act)이란 화자의 발화를 통해 나타나는 화자의 의도를 가르키며 자연어로 된 발화를 이해하고 이에 대한 응답을 생성하기 위해 중요한 요소이다. 본 논문에서는 한국어 화행 결정의 성능을 높이기 위해 두 단계 방법을 제안한다. 첫 번째 단계는 형태소 분석결과만을 이용하여 추출된 문장자질과 이전 화행을 이용하여 추출된 문맥자질 중 정보량이 높은 자질을 선택하는 단계이다. 이 단계에서는 형태소 분석 시스템을 사용하여 전체 자질을 구성하고 문서분류 분야의 자질 선택에서 높은 성능을 보인 카이제곱 통계량을 이용하여 효과적인 자질 선택한다. 두 번째 단계는 선택된 자질과 신경망을 이용하여 화행을 분석하는 단계이다. 본 논문에서 제시한 방법은 형태소 분석 결과만을 이용하여 자동적으로 화행을 결정할 수 있는 가능성을 제시하였으며 효과적인 자질 선택을 통해 자질의 수를 감소시키고 정보량이 높은 자질을 사용하여 속도와 성능을 향상 시켰다 본 논문은 제안된 시스템을 실제 영역에서 수집되어 전사된 10,285개의 발화와 17개의 화행으로 이루어진 대화 코퍼스에 대해 실험하였다. 본 논문은 이 코퍼스에서 8,349개 발화를 학습 코퍼스로 사용하여, 실험 코퍼스의 1,936개 발화에 대해 1,709개에 대해 정확한 화행을 제시하여, 88.3%의 정확도를 보였다. 이는 자질 선택을 하지 않았을 때 보다 약 8%가 증가된 결과이다.

소셜 빅데이터 분석을 통해 알아본 대중의 과학관에 대한 인식 및 사용 행태 (Public Perception and Usage Pattern of Science Museum by Social Media Big Data Analysis)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권6호
    • /
    • pp.1005-1014
    • /
    • 2017
  • 본 연구는 대중의 과학적 소양을 함양하기 위한 기관으로서의 과학관의 역할에 주목하고, 우리나라 과학관이 대중에게 어느 정도 영향을 미치고 있는지 알아보기 위하여 소셜 빅데이터 분석을 통해 대중의 과학관에 대한 인식과 사용 행태를 알아보고자 하였다. 이를 위해 네이버 블로그와 트위터에에서 '과학관'이 포함된 게시글들을 추출한 뒤 텍스트 네트워크 분석, 빈도 분석, 공기어 분석 및 의미 분석을 실시하고 영어권의 분석 결과와 비교해 보았다. 그 결과 블로그에서는 주로 어린 자녀를 둔 부모 층에서 과학관이 이슈가 되고 있었고, 트위터에서는 단체 관람을 하는 학생 층이 다수 드러났다. 따라서 우리나라 대중들은 과학관을 주로 아이의 체험을 위한 공간으로 활용하고 있었고, 이 경우 과학관의 프로그램과 전시에 대해서는 긍정적으로 인식하고 있었다. 한편 단체 관람하는 학생들은 다소 부정적 감정을 표출하고 있는 것으로 나타났다. 과학관과 대중과의 소통, 대중의 과학에 대한 참여 등 제 3세대적 과학관의 기능적 측면에서 외국의 사례와 비교해본 결과 우리나라 대중들은 과학관 관람 이후 관람한 과학적 내용에 대한 언급이 거의 없었고, 논쟁이나 심포지움 등 과학적 의사소통과 관련된 언급 역시 거의 없었다. 또한 해설사나 직원들도 외국과는 달리 전혀 회자되지 않고 있었다. 한편, 영어권 게시글의 동사 분석에서 '배우다', '참여하다', '듣다', '읽다', '묻다', '생각하다', '그리다' 등의 유의미한 활동과 관련된 동사들이 다수 나타난 것에 비해 우리나라 게시글에서는 '물어보다', '생각하다' 가 소수 나타나는 것에 그치고 있었다. 따라서 과학관은 과학관 관람객들이 관람을 마친 뒤에 그들의 기억에 남고 대중들 사이에서 회자될 만큼 영향력 있고 다양한 내용과 활동이 일어날 수 있도록 개선할 필요가 있겠다.

작성자 분석과 CNN을 적용한 소스 코드 작성자 식별 프레임워크 (The Identification Framework for source code author using Authorship Analysis and CNN)

  • 신건윤;김동욱;홍성삼;한명묵
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.33-41
    • /
    • 2018
  • 최근 인터넷 기술이 발전함에 따라 다양한 프로그램들이 만들어지고 있고 이에 따라 다양한 코드들이 많은 사람들을 통해 만들어진다. 이러한 측면을 이용하여 특정 작성자가 작성한 코드들 그대로 가져가 자신이 작성한 것처럼 보여주거나, 참고한 코드들에 대한 정확한 표기 없이 그대로 사용하여 이에 대한 보호가 점차 어려워지고 있다. 따라서 본 논문에서는 작성자 분석 이론과 합성곱 신경망 기반 자연어 처리 방법을 적용한 작성자 식별 프레임워크룰 제안한다. 작성자 분석 이론을 적용하여 소스 코드에서 작성자 식별에 적합한 특징들을 추출하고 이를 텍스트 마이닝에서 사용하고 있는 특징들과 결합하여 기계학습 기반의 작성자 식별을 수행한다. 그리고 합성곱 신경망 기반 자연어 처리 방법을 소스 코드에 적용하여 코드 작성자 분류를 수행한다. 본 논문에서는 작성자 분석이론과 합성곱 신경망을 적용한 작성자 식별 프레임워크를 통해 작성자를 식별하기 위해서는 작성자 식별만을 위한 특징들이 필요하다는 것과 합성곱 신경망 기반 자연어 처리 방법이 소스 코드등과 같은 특수한 체계를 갖추고 있는 언어에서도 적용이 가능하다. 실험 결과 작성자 분석 이론 기반 작성자 식별 정확도는 95.1%였으며 CNN을 적용한 결과 반복횟수가 90번 이상일 경우 98% 이상의 정확도를 보여줬다.

빅데이터를 통해 살펴본 유아 재난안전교육에 대한 사회적 인식 (Social Perception of Disaster Safety Education for Young Children through Big Data)

  • 강민정;유희정
    • 한국콘텐츠학회논문지
    • /
    • 제20권2호
    • /
    • pp.162-171
    • /
    • 2020
  • 본 연구는 Textom 빅데이터를 바탕으로 유아 재난안전교육에 대한 사회 전반의 인식을 살펴보고 유아 재난안전교육의 방향을 탐색하는데 목적이 있다. 이를 위해 2014년부터 2017년 까지 포털 웹사이트에서 '유아+재난+안전교육'을 키워드로 온라인 텍스터 데이터를 수집하고 분석하였다. 수집된 원자료는 1차와 2차 데이터 정제과정을 거쳤으며, 빈도분석 결과를 바탕으로 주요단어 50개를 선정하였으며, 선정된 키워드는 매트릭스 데이터로 변환하여 네트워크 분석을 실시하였다. 연구결과 첫째, 유아 재난안전교육과 함께 가장 높은 빈도로 등장한 키워드로는 '교육'이었으며, 그 다음으로 '체험', '유치원', '예방', '학교' 순으로 나타났다. 둘째, 중심성 분석 결과, 연결중심성, 근접중심성, 매개중심성이 가장 높은 키워드 역시 '교육', '체험', '예방' 순으로 나타났다. 또한 '예방', '생활', '대피' 키워드는 빈도순위보다 연결중심성에서 높은 순위가 나타나 단어들 간의 연결정도가 높다고 할 수 있다. 이러한 결과들은 유아의 재난안전능력을 증진시키기 위해서는 유아기에 '교육'이 필요하며, 교육기관에서 '예방'과 '체험'을 통한 교육이 이루어져야 함을 시사한다.

미 연준 통화정책방향 의결문의 시그널링 효과 분석 (An analysis of the signaling effect of FOMC statements)

  • 우신욱;장영재
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.321-334
    • /
    • 2020
  • 최근 미 연준이 정책금리 인하를 결정하면서 향후 통화정책 운용방향에 관해 관심이 고조되고 있다. 과거 금리동결 시점이나 동결기간 중, 그리고 인상이나 인하 시점이 다가왔을 때 통화정책 의결문의 표현을 살펴보면 단어 선택의 변화 등을 통해 시장과 꾸준하게 커뮤니케이션해 왔었다는 것을 알 수 있다. 하지만 이렇게 의결문의 표현을 문맥을 통해 분석하는 방법이 다소 주관적이고 정성적인 분석에 그칠 수 있다는 비판이 있다. 이런 점을 고려하여 Woo와 Chang (2016)에서는 데이터마이닝 기법 중 하나인 텍스트마이닝 방법을 통해 의결문 분석 과정을 보완할 수 있는 방법을 제안한 바 있다. 본 논문에서는 선행 연구 결과를 토대로 미 연준의 통화정책 의결문의 정책 시그널링 효과를 평가해 보았다. 의결문의 특성을 텍스트마이닝 관점에서 분석하고 의결문 간 표현의 변화를 포착하여 향후 정책 기조 변화를 예측하고자 하였다. 이를 위해 대표적인 데이터마이닝 기법인 의사결정나무모형과 신경망모형을 사용하였다. 분석 결과, 대체로 의결문 간 비유사성의 변화가 향후 정책 변화를 효과적으로 예측할 수 있는 것으로 평가되었으며, 그동안 미 연준이 의결문을 통해 체계적으로 정책 시그널링을 실시해 온 결과로 판단할 수 있다.

전기로 분진이 첨가된 유리의 중금속 안정화 특성 (Stabilization of Heavy Metals in Glasses Containing EAF Dust)

  • 은희태;강승구;김유택;이기강;김정환
    • 한국세라믹학회지
    • /
    • 제41권11호
    • /
    • pp.851-857
    • /
    • 2004
  • 전기로 제강분진(EAF dust)이 첨가된 규산염 유리, 붕규산염 유리 그리고 납규산염 유리 내의 중금속 안정화 특성을 독성용출 시험법(TCLP)으로 조사하였다. 또한 XRD와 FT-IR 방법을 통하여 EAF dust 첨가량에 따른 유리의 구조변화가 TCLP 결과에 미치는 영향을 고찰하였다. 모유리에 EAE dust를 30 wt%까지 첨가하여도 규산염 유리, 붕규산염 유리, 납규산염 유리 계열의 시편 모두 결정화가 발생되지 않고 비정질을 나타내었다. TCLP법에 의한 유리시편의 중금속 용출량은 EAF dust의 첨가량과 함께 증가되었다. 중금속 용출이 가장 적은 시편은 규산염 유리 계열이었으며 납규산염 유리 계열의 시편은 붕규산염 유리 계열에 비해 중금속 용출량이 상대적으로 적었다. 단, 납규산염 유리 계열 모유리 조성에 포함되어 있는 납의 영향으로 Pb용출은 납규산염 유리 계열시편에서 가장 많았다. Oxygen/network former ratio 값을 이용하여 같은 계열 시편 간의 화학적 내구성을 비교할 수 있었으나 다른 계열 시편 간에는 적절치 않았다. EAF dust가 첨가되면 규산염 유리 계열의 시편에서는 유리구조 내 Si-O-Si 대칭성이 감소되고 비가교 산소가 증가되어 유리의 구조를 약화시키고 화학적 내구성을 감소시켰다 붕규산염 유리 계열 시편에서 EAF dust가 첨가되면 tetraborate group이 diborate group으로 변화되고 2차원 층상구조인 pyre-와 ortho-borate도 형성되어 결국 구조약화를 가져왔다. 3가지 계열의 유리조성 중에서 EAF dust내의 중금속들을 안정화하는데 가장 적합한 것은 규산염 유리 계열의 시편으로 판단되었다.

원자력분야 학술정보 통합정보관리시스템 구현에 관한 연구 (A Research on the Implementation and Estimation of an Integrated System for Information Management in the Field of Nuclear Science and Engineering)

  • 천영춘
    • 정보관리연구
    • /
    • 제34권4호
    • /
    • pp.63-84
    • /
    • 2003
  • 본 연구는 정부의 원자력 분야 정보 인프라 구축사업의 지원으로 이루어진 연구로서 한국원자력연구소가 국가 원자력 정보센터로서의 기능을 적극 수행하기 위하여 원자력분야 학술정보통합정보관리시스템인 NUCLIS21(Nuclear Information System21)을 구축한 프로젝트이다. 본 시스템은 웹기반의 이용자 중심 단일 인터페이스를 제공하여 국가 원자력 분야 정보기반구축은 물론 기존 정보센터의 정보관리시스템을 개선하는데 목적이 있다. 또한 구축된 시스템은 원자력 분야 학술정보 통합정보관리시스템으로서 크게 두 가지로 먼저 경영정보시스템(MIS)과의 연계모듈과 6개의 하위시스템으로 즉, OPAC과 연동되는 통합검색 시스템, My Library 시스템, 정보수집 시스템, 편목 시스템, 정보제공 시스템, 연속간행물 시스템으로 구성된다. 그 특징은 경영정보시스템(MIS)과 연계하여 연구 프로젝트 등 연구관련 정보를 반입하여 관련 정보를 제공함으로써 이용자의 연구 주제별 맞춤정보, 상호작용, 후속 서비스 등이 가능하도록 구성하였다. 구축결과 시스템의 평가는 만족도를 조사하였는데 이용자 만족도는 정보제공의 충실성은 75.7% (200명), 신속성은 62.1% (164명), 편리성은 78.4% (207명)가 대부분 만족한다고 응답하여 전체적인 시스템 만족도는 비교적 높게 나타났다.

모던 웹 브라우저(Modern-Web-Browser) 기반 애플리케이션 성능분석을 위한 요소 연구 (Research for the Element to Analyze the Performance of Modern-Web-Browser Based Applications)

  • 박진태;김현국;문일영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.278-281
    • /
    • 2018
  • 초기의 웹 기술은 텍스트 위주의 정보를 브라우저를 통해 보여주는 것이었다. 하지만 웹 기술이 발전하면서 브라우저를 통해 대용량의 멀티미디어 데이터를 보여주는 것이 가능해졌다. 웹 기술이 센서 네트워크, 하드웨어 제어, 빅 데이터와 인공지능 서비스를 위한 데이터 수집 및 분석 등 다양한 분야에 적용되고 있다. 대표적으로 사물인터넷의 인터페이스에 웹 브라우저를 탑재해 HTTP 통신으로 센서를 제어하고, 정보를 사용자에게 제공하는 사물 웹 플랫폼에 대한 표준이 마련되었다. 또한, 최근에는 웹 어셈블리의 개발로 웹 브라우저에서 실행할 수 없었던 3D 객체, 가상/증강 현실 콘텐츠를 C계열의 네이티브 언어를 통해 실행 가능해졌다. 기존 웹 애플리케이션의 성능을 평가하는 요소는 퍼포먼스, 네트워크 리소스, 보안 등의 요소들이 있었다. 하지만 웹 애플리케이션이 적용되는 분야가 다양해진 만큼 이 요소들에 대한 재해석과 검토가 필요한 시점이다. 이에 본 논문에서는 웹 애플리케이션의 성능을 평가하는 요소들에 대한 분석을 진행하고자 한다. 각 요소들에 대한 분석과 주요점, 보완되어야 하는 사항 등을 검토하여, 웹 기반 애플리케이션 개발의 한 지표를 정립하고자 한다.

  • PDF

동적 설정 가능한 지그비 서비스 게이트웨이 구조 (ZigBee Service Gateway Enabling Dynamic Reconfiguration)

  • 김성훈;강정석;백승호;박재한;박홍성
    • 한국통신학회논문지
    • /
    • 제32권10B호
    • /
    • pp.644-654
    • /
    • 2007
  • 지그비(ZigBee)는 무선 통신 표준 기술로서 이를 이용한 많은 서비스 응용들이 개발되고 있다. 이러한 서비스 응용들은 인터넷과의 연결을 위한 서비스 게이트웨이를 필요로 한다. 이러한 지그비 서비스 게이트웨이를 효율적으로 활용하기 위해서는, 지그비 서비스 게이트웨이는 프로파일에 따른 다양한 응용 메시지 변환, 새로운 노드의 추가/삭제에 따른 지그비 서비스의 추가/삭제에 대한 처리, 지그비 네트워크로의 불필요한 메시지 전달 차단과 같은 기능을 제공해야 한다. 본 논문에서는 이러한 기능들을 제공하는 새로운 형태의 지그비 서비스 게이트웨이, ZiGate를 제안한다. 제안하는 ZiGate는 지그비 네트워크와 연동하여 메시지 변환 모듈을 재설정하거나 불필요한 패킷을 차단하는 제공한다. 더불어, ZiGate는 프로파일 기반의 지그비 응용 메시지를 SOAP과 같은 텍스트 형과 이진 형을 갖는 인터넷 서비스 메시지로 상호 변환할 수 있는 기능을 동시에 제공한다. ZiGate 를 실제 구현하여 테스트베드에 설치 및 평가를 통하여, 본 논문에서는 제안하는 ZiGate가 효율적임을 보인다.

미디어 아카이브 구축을 위한 등장인물, 사물 메타데이터 생성 시스템 구현 (Implementation of Character and Object Metadata Generation System for Media Archive Construction)

  • 조성만;이승주;이재현;박구만
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1076-1084
    • /
    • 2019
  • 본 논문에서는 딥러닝을 적용하여 미디어 내의 등장인물 및 사물을 인식, 메타데이터를 추출하고 이를 통해 아카이브를 구축하는 시스템을 개발하였다. 방송 분야에서 비디오, 오디오, 이미지, 텍스트 등의 멀티미디어 자료들을 디지털 컨텐츠로 전환하기 시작한지는 오래 되었지만, 아직 구축해야 할 자료들은 방대하게 남아있다. 따라서 딥러닝 기반의 메타데이터 생성 시스템을 구현하여 미디어 아카이브 구축에 소모되는 시간과 비용을 절약 할 수 있도록 하였다. 전체 시스템은 학습용 데이터 생성 모듈, 사물 인식 모듈, 등장인물 인식 모듈, API 서버의 네 가지 요소로 구성되어 있다. 미디어 내에서 등장인물 및 사물을 인식하여 메타데이터로 추출할 수 있도록 딥러닝 기술로 사물 인식 모듈, 얼굴 인식 모듈을 구현하였다. 딥러닝 신경망을 학습시키기 위한 데이터를 구축하기 용이하도록 학습용 데이터 생성 모듈을 별도로 설계하였으며 얼굴 인식, 사물 인식의 기능은 API 서버 형태로 구성하였다. 1500명의 인물, 80종의 사물 데이터를 사용하여 신경망을 학습시켰으며 등장인물 테스트 데이터에서 98%, 사물 데이터에서 42%의 정확도를 확인하였다.